1. A propos de la bibliothèque openai Python
La bibliothèque d'OpenAI Python est un outil puissant qui permet aux développeurs d'intégrer les fonctionnalités des modèles d'IA avancés d'OpenAI, dont GPT-5, à leurs applications. Cette bibliothèque offre un accès facile aux fonctionnalités de pointe du traitement automatique du langage naturel (TALN), permettant la création de systèmes intelligents et interactifs. Dans ce tutoriel, nous allons explorer en détail la bibliothèque Python d'OpenAI, ses fonctionnalités, sa configuration et ses cas d'utilisation pratiques pour vous aider à démarrer.
2. La bibliothèque Python d'OpenAI et API
La bibliothèque Python d'OpenAI est une interface client permettant d'accéder à l'API d'OpenAI. Elle simplifie l'envoi de requêtes à l'API et le traitement des réponses, facilitant ainsi la création d'applications exploitant les puissants modèles de langage d'OpenAI. Que vous développiez des chatbots, des générateurs de contenu ou toute autre application basée sur l'IA, la bibliothèque Python d'OpenAI offre les outils nécessaires pour donner vie à vos idées.
3. Caractéristiques principales
- Facilité d'utilisation : La bibliothèque est conçue pour être simple et intuitive, avec une API bien documentée et des appels de fonctions simples.
- Polyvalence : Elle prend en charge un large éventail de cas d'utilisation, de la génération et de la synthèse de texte à la traduction et à la complétion de code.
- Évolutivité : La bibliothèque convient aussi bien aux petits projets qu'aux applications à grande échelle, gérant efficacement d'importants volumes de requêtes.
- Personnalisation : Les développeurs peuvent affiner les modèles pour mieux les adapter à des tâches ou des domaines spécifiques, améliorant ainsi la pertinence et la précision des résultats.
4. Installation & configuration
La bibliothèque openai Python s'installe rapidement en toute simplicité via l'utilitaire pip à l'aide de la commande cmd:
1 |
pip install --upgrade openai |
Puis vous devez exposez votre clé (recommandé) afin de créer une variable d’environnement qui sera disponible pour tous les programmes de votre système (ou pour la session courante selon la commande):
Linux/macOS
1 |
export OPENAI_API_KEY="votre_cle" |
Windows (PowerShell)
1 |
setx OPENAI_API_KEY "votre_cle" |
Et afin de pouvoir utiliser la bibliothèque openai en Python, vous devez l'importer et créer un client:
1 2 |
from openai import OpenAI client = OpenAI() # lit OPENAI_API_KEY dans l’environnement |
5. Premier appel : texte (Responses API)
La réponse de l'API (API Responses) unifie la génération. C’est l’interface conseillée à la place des anciens chat completions.
1 2 3 4 5 6 7 8 |
from openai import OpenAI client = OpenAI() resp = client.responses.create( model="gpt-5", # choisissez le modèle disponible sur votre compte input="Explique la différence entre liste et tuple en Python, en 3 points." ) print(resp.output_text) # propriété pratique exposée par le SDK |
6. Vision (analyser des images)
Avec un modèle multimodal, passez une image (URL/base64) en entrée pour obtenir une analyse:
1 2 3 4 5 6 7 8 9 10 11 |
resp = client.responses.create( model="gpt-5", # ou un modèle multimodal compatible input=[{ "role": "user", "content": [ {"type": "input_text", "text": "Décris le graphique et donne 2 idée."}, {"type": "input_image", "image_url": "url_de_votre_image"} ] }] ) print(resp.output_text) |
Exemple
Prenons l'exemple de l'image de la couverture du livre située à l'adresse suivante:
https://www.tresfacile.net/images/python/livres/python-tres-facile.png
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
from openai import OpenAI client = OpenAI() resp = client.responses.create( model="gpt-5", # ou un modèle multimodal compatible input=[{ "role": "user", "content": [ {"type": "input_text", "text": "Décris le graphique et donne 2 idée."}, {"type": "input_image", "image_url": "https://www.tresfacile.net/images/python/livres/python-tres-facile.png"} ] }] ) print(resp.output_text) """ output: Description du graphique: - Couverture de livre intitulé “Apprendre Python !” (auteur: Younes Derfoufi). - Palette noire, blanche et rouge avec le logo Python à droite. - Slogan: “Un guide complet et progressif”. - Bandeau: “Cours + 300 exercices résolus” et “Collection Très Facile !”. - Photo d’un serpent en bas, mention “2024” à la verticale, site “www.tresfacile.net”. Deux idées: 1) Ajouter un QR code vers des ressources en ligne (notebooks Jupyter, dépôt GitHub, extraits, corrections détaillées) avec un badge “Ressources gratuites”. 2) Insérer une “feuille de route” visuelle (icônes) des thèmes couverts sur la 4e de couv: Bases → Structures de données → Fonctions → POO → Fichiers/Regex → Web/API → Data (NumPy/Pandas) → Tests/Projets. """ |
7. Génération d'images
Avec la bibliothèque openai, vous pouvez générer facilement des images en utilisant la méthode generate() de l'objet cilent.image tout en indiquant les paramètres à utiliser au sein de la méthode generate():
- model : Choix du modèle qui sera utiliser par exemple gpt-image-1
- prompt : Vous mettez ici une description de l'image à générer
- size : Mettez ici les dimensions de l'image en pixels
Exemple
1 2 3 4 5 6 7 8 9 10 11 12 13 |
from openai import OpenAI client = OpenAI() img = client.images.generate( model="gpt-image-1", prompt="Affiche minimaliste d’un chat lisant un livre, style photo, fond clair, haute résolution.", size="1024x1024" ) # Sauvegarde import base64, pathlib b64 = img.data[0].b64_json pathlib.Path("affiche.png").write_bytes(base64.b64decode(b64)) |

8. Manipulation des médias Audio
8.1 Transcription (Speech-to-Text)
La bibliothèque Python openai vous donne la possibilité de transcription audio (convertir un fichier audio, une voix ...) en un texte, vous donnant ainsi la possibilité à créer une application qui transforme votre voix en un texte écrit... Et ce grâce au modèle: "gpt-4o-transcribe"
1 2 3 4 5 6 7 8 9 10 |
from openai import OpenAI client = OpenAI() audio_file = open("cours_fr.mp3", "rb") resp = client.audio.transcriptions.create( model="gpt-4o-transcribe", file=audio_file ) print(resp.text) |
Les modèles recommandés incluent gpt-4o-transcribe/gpt-4o-mini-transcribe.
8.2 Synthèse vocale (Text-to-Speech)
Et maintenant grâce au modèle "gpt-4o-mini-tts", vous aurez la possibilité de réaliser l'opération inverse (transformer un texte en une voix).
1 2 3 4 5 6 7 8 9 10 11 |
from openai import OpenAI client = OpenAI() speech = client.audio.speech.create( model="gpt-4o-mini-tts", voice="alloy", # ex. voix intégrée input="Bienvenue au cours de Python et Tkinter." ) with open("sortie.wav","wb") as f: f.write(speech.read()) |
9. Application : Mini chat en mode console
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
from openai import OpenAI client = OpenAI() print("Vous: ", end="", flush=True) while (q := input()) not in {"exit", "quit"}: with client.responses.stream(model="gpt-4o-mini", input=q) as stream: for ev in stream: if ev.type == "response.output_text.delta": print(ev.delta, end="", flush=True) print("\n---") print("Vous: ", end="", flush=True) """ Exemple: Vous: description du langage python en 5 lignes Resp : Python est un langage de programmation interprété et de haut niveau, reconnu pour sa simplicité et sa lisibilité. Il est multi-paradigme, prenant en charge la programmation procédurale, orientée objet et fonctionnelle. Grâce à sa vaste bibliothèque standard et à un écosystème riche de modules tiers, Python est particulièrement adapté pour le développement web, l'analyse de données, l'intelligence artificielle et l'automatisation. Sa syntaxe claire permet aux développeurs, débutants comme confirmés, de créer rapidement des applications robustes. Enfin, Python est multiplateforme, ce qui le rend compatible avec divers systèmes d'exploitation. --- """ |
Younes Derfoufi
CRMEF OUJDA