La méthode DataFrame.concat() Pandas Python

Contenu du cours

Description de la méthode DataFrame.concat() Pandas
Syntaxe et usage de la méthode DataFrame.concat()
Exemples d'usages de la méthode DataFrame.concat()

1. Description de la méthode DataFrame.concat() Pandas

La méthode DataFrame.concat() de la bibliothèque Pandas est utilisée pour concaténer (c'est-à-dire fusionner) des DataFrames le long d'un axe spécifié. La méthode DataFrame.concat() est très utile pour fusionner des DataFrames de manière flexible et efficace, que ce soit pour combiner des données en série, en parallèle, ou pour gérer des index hiérarchiques. Elle est largement utilisée dans l'analyse de données avec Pandas.

2. Syntaxe et usage de la méthode DataFrame.concat()

La syntaxe de base de la méthode DataFrame.concat() est la suivante :

pandas.concat(objs, 
              axis=0, 
              join='outer', 
              ignore_index=False, keys=None, 
              levels=None, names=None, 
              verify_integrity=False, 
              sort=False, copy=True)

pandas.concat(objs,

axis=0,

join='outer',

ignore_index=False, keys=None,

levels=None, names=None,

verify_integrity=False,

sort=False, copy=True)

Principaux paramètres de cette méthode

objs : Il s'agit d'une séquence (liste, tuple, ou autre itérable) de DataFrames que vous souhaitez concaténer.
axis : Il spécifie l'axe le long duquel la concaténation doit avoir lieu. Par défaut, il est défini sur 0, ce qui signifie que la concaténation se fait par lignes (concaténation verticale). Si vous définissez axis=1, la concaténation se fait par colonnes (concaténation horizontale).
join : Il spécifie comment les index existants sont gérés lors de la concaténation. Les options courantes sont 'outer' (union des index) et 'inner' (intersection des index). Par défaut, il est défini sur 'outer'.
ignore_index : Si défini sur True, les index des DataFrames d'origine sont ignorés et un nouvel index est créé de manière séquentielle pour le DataFrame résultant. Par défaut, il est défini sur False.
keys : Permet de créer un index hiérarchique (MultiIndex) pour les DataFrames concaténés. Vous pouvez spécifier un itérable de niveaux (levels) et de noms (names) pour définir des niveaux d'index hiérarchiques.
verify_integrity : Si défini sur True, cette option vérifie si les index des DataFrames ont des doublons avant la concaténation. Par défaut, il est défini sur False.
sort : Si défini sur True, les données sont triées par rapport à l'axe spécifié avant la concaténation. Par défaut, il est défini sur False.
copy : Si défini sur True (par défaut), les données sont copiées dans le DataFrame résultant. Si défini sur False, aucune copie n'est effectuée, ce qui peut économiser de la mémoire mais nécessite une gestion prudente des objets source pour éviter des effets secondaires.

3. Exemples d'usages de la méthode DataFrame.concat()

Voici un exemple d'utilisation de la méthode DataFrame.concat() dans Pandas pour concaténer deux DataFrames le long de l'axe des lignes (concaténation verticale) :

import pandas as ps

# Création de deux DataFrames
df1 = ps.DataFrame({'A': ['A0', 'A1', 'A2'],
                    'B': ['B0', 'B1', 'B2']})

df2 = ps.DataFrame({'A': ['A3', 'A4', 'A5'],
                    'B': ['B3', 'B4', 'B5']})

# Concaténation verticale des DataFrames
result = ps.concat([df1, df2])

print(result)
"""
Résultat :

    A   B
0  A0  B0
1  A1  B1
2  A2  B2
0  A3  B3
1  A4  B4
2  A5  B5
"""

import pandas as ps

# Création de deux DataFrames

df1 = ps.DataFrame({'A': ['A0', 'A1', 'A2'],

'B': ['B0', 'B1', 'B2']})

df2 = ps.DataFrame({'A': ['A3', 'A4', 'A5'],

'B': ['B3', 'B4', 'B5']})

# Concaténation verticale des DataFrames

result = ps.concat([df1, df2])

print(result)

"""

Résultat :

A B

0 A0 B0

1 A1 B1

2 A2 B2

0 A3 B3

1 A4 B4

2 A5 B5

"""

Concaténation: Comme vous pouvez le voir, les deux DataFrames df1 et df2 ont été concaténés le long de l'axe des lignes pour former un seul DataFrame result.
Conservation des indices : Les index d'origine ont été conservés, ce qui a entraîné la duplication des index de 0 à 2 dans le DataFrame résultant.
ignore_index=True : Si vous souhaitez réinitialiser les index, vous pouvez utiliser le paramètre ignore_index=True

Exemple ( ignore_index=True )

result = ps.concat([df1, df2], ignore_index=True)
"""
Résultat avec ignore_index=True :
les index ont été réinitialisés pour être séquentiels.

    A   B
0  A0  B0
1  A1  B1
2  A2  B2
3  A3  B3
4  A4  B4
5  A5  B5 
"""

result = ps.concat([df1, df2], ignore_index=True)

"""

Résultat avec ignore_index=True :

les index ont été réinitialisés pour être séquentiels.

A B

0 A0 B0

1 A1 B1

2 A2 B2

3 A3 B3

4 A4 B4

5 A5 B5

"""

Younes Derfoufi
CRMEF OUJDA

Post Views: 507

Acheter sur Très Facile !

La méthode DataFrame.concat() Pandas Python

1. Description de la méthode DataFrame.concat() Pandas

2. Syntaxe et usage de la méthode DataFrame.concat()

Principaux paramètres de cette méthode

3. Exemples d'usages de la méthode DataFrame.concat()

Exemple ( ignore_index=True )

Les fondements pour apprendre le langage Python

Apprenez la programmation en langage Python

Learn Python Programming Language

Leave a Reply Cancel reply