Solution Exercice 101: traitement des données csv à l'aide d'un dataframe pandas

Exercice 101

  1. Importer le module Pandas et utiliser la fonction read_csv() pour lire un fichier CSV contenant des données sur les prix de l'immobilier dans une ville donnée. Assignez le résultat à une variable appelée "df".
  2. Affichez les premières 5 lignes de "df" à l'aide de la méthode head().
  3. Affichez les informations générales de "df" à l'aide de la méthode info().
  4. Utilisez la méthode describe() pour afficher les statistiques descriptives de toutes les colonnes numériques de "df".
  5. Utilisez la méthode groupby() pour regrouper les données en fonction de la colonne "zipcode" et utilisez la méthode mean() pour calculer la moyenne du prix de l'immobilier dans chaque code postal. Assignez le résultat à une variable appelée "zipcode_mean".
  6. Utilisez la méthode sort_values() pour trier les données de "zipcode_mean" en fonction de la colonne "price" en ordre décroissant.
  7. Utilisez la méthode iloc[] pour sélectionner les 10 premières lignes de "zipcode_mean" et assignez le résultat à une variable appelée "top_10_zipcodes".
  8. Utilisez la méthode plot() pour tracer un graphique de dispersion de "df" avec la colonne "price" en ordonnée et la colonne "sqft_living" en abscisse. Utilisez le paramètre "c" pour spécifier la couleur en fonction de la colonne "zipcode".

Notez que cet exercice suppose que le fichier CSV importé contient des colonnes nommées "zipcode", "price", "sqft_living" et d'autres colonnes similaires, et vous devrez adapter les instructions en conséquence en fonction des colonnes de votre fichier CSV.

Solution




 

Younes Derfoufi
CRMEF OUJDA

Leave a Reply