Chapitre 16. Statistiques (ECG-1)
- Par Hervé Gras
- et Christian Leboeuf
Pages 313 à 334
Citer ce chapitre
- GRAS, Hervé
- et LEBOEUF, Christian,
- GRAS, Hervé,
- LEBOEUF, Christian
- et MERLIN, Xavier,
- Gras, Hervé.
- et al.
- Gras, H.
- et Leboeuf, C.
Citer ce chapitre
- Gras, H.
- et Leboeuf, C.
- Gras, Hervé.
- et al.
- GRAS, Hervé
- et LEBOEUF, Christian,
- GRAS, Hervé,
- LEBOEUF, Christian
- et MERLIN, Xavier,
Dans cette partie (et dans l’exercice 9), on utilisera le tableau suivant, indiquant le taux de croissance (en % et en euro constant), le taux de chomage (en %) et le taux d’inflation (en %) de 2010 à 2019 en France (source Insee) :
Pour manipuler des séries statistiques en langage Python, on peut utiliser le module pandas de Python.
Les données sont stockées, en général, dans un fichier au format csv. La première ligne du fichier contient le nom des colonnes, les données sont séparées par des virgules (le séparateur décimal est le point).
Le fichier csv dans un éditeur de texte doit ressembler à ceci :
Annee, Croissance, Chomage, Inflation
2010,0.0195,0.0928,1.5
2011,0.0219,0.092,2.1
2012,0.0031,0.098,2.0
2013,0.0058,0.103,0.9
2014,0.0096,0.1028,0.5
2015,0.0111,0.104,0.0
2016,0.011,0.1003,0.2
2017,0.0229,0.094,1.0
2018,0.0179,0.0903,1.8
2019,0.0151,0.0843,1.1
Dans le script ci-dessous, on importe les données stockées dans le fichier et ‘data.csv’, on affiche la forme (nombre de lignes, nombre de colonnes) et les premières lignes.La médiane, la moyenne, le nombre de valeurs de la table données sont par les commandes donnees.median(), donnees.mean(), donnees.count().
Si l’on veut une formation relative à une colonne particulière, on l’indique tout simplement ! Ainsi, pour avoir la croissance moyenne, on écrit donnees[‘Croissance’ ]. mean().
Une série statistique x = (x1,…,xn) est un élément de ℝ…
Date de mise en ligne : 24/06/2025
Ce chapitre est en accès conditionnel
Acheter cet ouvrage
26,99 €
Acheter ce chapitre
5,00 €