La méthode DataFrame.concat() Pandas Python

1. Description de la méthode DataFrame.concat() Pandas

La méthode DataFrame.concat() de la bibliothèque Pandas est utilisée pour concaténer (c'est-à-dire fusionner) des DataFrames le long d'un axe spécifié. La méthode DataFrame.concat() est très utile pour fusionner des DataFrames de manière flexible et efficace, que ce soit pour combiner des données en série, en parallèle, ou pour gérer des index hiérarchiques. Elle est largement utilisée dans l'analyse de données avec Pandas.

2. Syntaxe et usage de la méthode DataFrame.concat()

La syntaxe de base de la méthode DataFrame.concat() est la suivante :

Principaux paramètres de cette méthode

  1. objs : Il s'agit d'une séquence (liste, tuple, ou autre itérable) de DataFrames que vous souhaitez concaténer.
  2. axis : Il spécifie l'axe le long duquel la concaténation doit avoir lieu. Par défaut, il est défini sur 0, ce qui signifie que la concaténation se fait par lignes (concaténation verticale). Si vous définissez axis=1, la concaténation se fait par colonnes (concaténation horizontale).
  3. join : Il spécifie comment les index existants sont gérés lors de la concaténation. Les options courantes sont 'outer' (union des index) et 'inner' (intersection des index). Par défaut, il est défini sur 'outer'.
  4. ignore_index : Si défini sur True, les index des DataFrames d'origine sont ignorés et un nouvel index est créé de manière séquentielle pour le DataFrame résultant. Par défaut, il est défini sur False.
  5. keys : Permet de créer un index hiérarchique (MultiIndex) pour les DataFrames concaténés. Vous pouvez spécifier un itérable de niveaux (levels) et de noms (names) pour définir des niveaux d'index hiérarchiques.
  6. verify_integrity : Si défini sur True, cette option vérifie si les index des DataFrames ont des doublons avant la concaténation. Par défaut, il est défini sur False.
  7. sort : Si défini sur True, les données sont triées par rapport à l'axe spécifié avant la concaténation. Par défaut, il est défini sur False.
  8. copy : Si défini sur True (par défaut), les données sont copiées dans le DataFrame résultant. Si défini sur False, aucune copie n'est effectuée, ce qui peut économiser de la mémoire mais nécessite une gestion prudente des objets source pour éviter des effets secondaires.




3. Exemples d'usages de la méthode DataFrame.concat()

Voici un exemple d'utilisation de la méthode DataFrame.concat() dans Pandas pour concaténer deux DataFrames le long de l'axe des lignes (concaténation verticale) :

  1. Concaténation: Comme vous pouvez le voir, les deux DataFrames df1 et df2 ont été concaténés le long de l'axe des lignes pour former un seul DataFrame result.
  2. Conservation des indices : Les index d'origine ont été conservés, ce qui a entraîné la duplication des index de 0 à 2 dans le DataFrame résultant.
  3. ignore_index=True : Si vous souhaitez réinitialiser les index, vous pouvez utiliser le paramètre ignore_index=True

Exemple ( ignore_index=True )

 

Younes Derfoufi
CRMEF OUJDA

Leave a Reply