Chapitre 17. Quelques modules d’intérêt en bioinformatique
- Par Patrick Fuchs
- et Pierre Poulain
Pages 146 à 174
Citer ce chapitre
- FUCHS, Patrick
- et POULAIN, Pierre,
- Fuchs, Patrick.
- et al.
- Fuchs, P.
- et Poulain, P.
Citer ce chapitre
- Fuchs, P.
- et Poulain, P.
- Fuchs, Patrick.
- et al.
- FUCHS, Patrick
- et POULAIN, Pierre,
Notes
Nous allons aborder dans ce chapitre quelques modules très importants en bioinformatique. Le premier NumPy permet notamment de manipuler des vecteurs et des matrices. Le module Biopython permet de travailler sur des données biologiques, comme des séquences (nucléiques et protéiques) ou des structures (fichiers PDB). Le module matplotlib permet de créer des graphiques depuis Python. Enfin, le module pandas est très performant pour l’analyse de données, et scipy étend les possibilités offertes par NumPy, notamment en proposant des algorithmes couramment utilisés en calcul scientifique.
Ces modules ne sont pas fournis avec la distribution Python de base (contrairement à tous les autres modules vus précédemment). Avec la distribution Miniconda que nous vous avons conseillé d’utiliser (consultez pour cela la documentation en ligne), vous pouvez rapidement les installer avec la commande :
Dans ce chapitre, nous vous montrerons quelques exemples d’utilisation de ces modules pour vous convaincre de leur pertinence.
Le module NumPy est incontournable en bioinformatique. Il permet d’effectuer des calculs sur des vecteurs ou des matrices, élément par élément, via un nouveau type d’objet appelé array.
On charge le module NumPy avec la commande :
On peut également définir un nom raccourci pour NumPy :Les objets de type array correspondent à des tableaux à une ou plusieurs dimensions et permettent d’effectuer du calcul vectoriel. La fonction array() convertit un objet séquentiel (comme une liste ou un tuple) en un objet de typ…
Date de mise en ligne : 01/06/2022
Ce chapitre est en accès conditionnel
Acheter cet ouvrage
22,99 €