1 - introduction
Pandas est une bibliothèque Python open source sous licence BSD permettant de manipuler des structures de données hautes performances et faciles à utiliser ainsi que des outils d'analyse de données pour le langage de programmation Python. Python avec Pandas est utilisé dans un large éventail de domaines, y compris les domaines académiques et commerciaux, financiers, économique, les statistiques, l'analyse, etc... Dans ce cours, nous allons apprendre les différent principes et fonctionnalités de Python Pandas et comment les utiliser en pratique.
2 - Installation de Pandas
Pandas n'est pas fournit avec le package standard de Python, cependant elle s'installe très facilement en toute souplesse à l'aide de l'utilitaire pip:
2 - Création d'une série avec Pandas
Pandas Series est un tableau étiqueté unidimensionnel capable de contenir des données de tout type (entier, chaîne, flottant, objets python, etc.). Les étiquettes d'axe sont appelées collectivement index.
2.1 - Création d'une série vide
Un premier exemple de série pandas est la série vide:
Exemple
La sortie est : Série ([], dtype: float64)
2.2 - Création d'une série à partir d'un tableau
Afin de créer une série à partir d'un tableau, nous devons importer le module numpy et utiliser la méthode numpy.array().
Exemple
La sortie est:
0 P
1 y
2 t
3 h
4 o
5 n
dtype: object
2.3 - Création d'une série à partir d'un tableau avec index
Afin de créer une série à partir d'un tableau avec index, nous devons fournir à index le même nombre d'éléments que dans le tableau.
Exemple
La sortie est :
4 p
7 y
8 t
9 h
13 o
17 n
dtype: object
2.4 - Création d'une série à partir d'un Scalaire
Si les données sont une valeur scalaire, un index doit être fourni. La valeur sera répétée pour correspondre à la longueur de l'index
Exemple
La sortie est la suivante:
1 7
2 7
3 7
4 7
5 7
dtype: int64
2.5 - Création d'une série à partir d'un dictionnaire
Afin de créer une série à partir d'un dictionnaire, nous devons d'abord créer un dictionnaire après quoi nous pouvons créer une série. Les clés de dictionnaire sont utilisées pour construire un index.
Ce qui affiche:
Laptop 17
Ipad 15
Tablette 25
dtype: int64
4 - Accès aux données d'une série Pandas
On peut accéder aux données à partir d'un index facilement en spécifiant la position entre crochets.
Exemple
Ou encore :
Exemple: extraire l'élément avec son index
Ce qui affiche à la sortie:
b 1
dtype: int64
Exemple: extraire les données depuis un index début jusqu'à un index fin
La sortie est:
c 2
d 3
dtype: int64
Exemple: extraction des données à partir d'étiquette
Ce qui affiche:
3
d 3
dtype: int64
Ou encore
Exemple
Ce qui affiche:
a 0
e 4
d 3
dtype: int64
5 - Python DataFrame Pandas
5.1 - DataFrame à partir d'un dictionnaire
un dataframe Pandas est un type de donnée similaire à un dictionnaire où les clefs sont utilisés pour représenter les noms des colonnes et les valeurs sont représentés par des séries. Pour faire simple, nous allons traiter un exemple concret:
Nous souhaitons à titre d'exemple, représenter la table données suivante à l'aide d'un datafram:
Nous commençons par convertir la table des données en un dictionnaire:
Nous faisons ensuite l'instanciation sur la classe DataFrame:
Code final
Voici comment s'affichent les données:
5.2 - DataFrame à partir d'un tableau numpy
Reprenons l'exemple du paragraphe précédent. Les données du tableau peuvent être représentées par un tableau numpy:
Et on crée ensuite le dataframe en utilisant la liste des noms des colonnes:
Code final
On souhaite parfois afficher les données de certaines colonnes seulement:
Exemple: affichage des colonnes Nom et Age
La sortie est:
Younes Derfoufi
CRMEF OUJDA