GPT-4 vs GPT-3.5 — capacités et cadre des coûts API

10 avr. 2023

Image de couverture de l’article

Alors que l’intelligence artificielle progresse, de plus en plus d’entreprises intègrent des chatbots à leur service client. Ces chatbots couvrent un large spectre de demandes, des questions simples aux sujets plus complexes. Le coût de mise en œuvre et de maintenance reste un facteur important. Dans cet article, on estime les coûts d’utilisation des modèles GPT-4 et GPT-3.5-turbo avec un plafond de 25 messages toutes les 3 heures sur un mois, en supposant des tailles de prompt moyennes comparables (50 à 200 jetons).

API OpenAI

L’API OpenAI sert à de nombreuses tâches de traitement du langage naturel (NLP), par exemple :

Traduction de texte d’une langue à une autre.
Génération de texte à partir d’un prompt (titres, résumés, articles).
Résumé de documents longs en versions plus courtes.
Chatbots pour le service client, assistants virtuels, etc.
Questions-réponses avec précision et fluidité (disponible sur les moteurs GPT-3).
Compréhension du sens du texte (feedback clients, sentiment, etc.).
Complétion de texte (formulaires, e-mails, etc.).
Classification (spam, sentiment, etc.).

Comparaison des modèles

GPT-4

GPT-4 apporte des capacités de raisonnement avancées et une culture générale plus large, avec une précision supérieure aux générations précédentes. Il se distingue notamment sur la créativité, les entrées visuelles et les contextes longs (plus de 25 000 mots de texte). Certaines de ces fonctionnalités étaient encore sur liste d’attente au moment de l’article.

Sur des benchmarks, GPT-4 se situe plus haut que ChatGPT sur des épreuves type barreau ou olympiade de biologie.

Les travaux sur sécurité et alignement incluent l’apprentissage avec retour humain, l’amélioration continue via l’usage réel et la recherche sur la sécurité assistée par GPT-4.

Plusieurs organisations ont collaboré avec OpenAI pour des produits sur GPT-4 (Duolingo, Be My Eyes, Stripe, Morgan Stanley, Khan Academy, gouvernement d’Islande, etc.).

Malgré ses capacités, GPT-4 conserve des limites connues : biais sociaux, hallucinations, prompts adverses. OpenAI s’engage à les traiter tout en poussant transparence et littératie IA. GPT-4 est disponible dans ChatGPT Plus et en API pour les développeurs.

GPT-3.5-turbo

C’est le moteur utilisé dans la démo ChatGPT sans ChatGPT Plus.

Rédiger un e-mail ou un texte
Écrire du code Python
Répondre à des questions sur un corpus de documents
Créer des agents conversationnels
Donner une interface langage naturel à un logiciel
Tutorat dans plusieurs matières
Traduire des langues
Simuler des personnages de jeu vidéo, etc.

Le choix entre GPT-4 et GPT-3.5-turbo dépend de la qualité, de la latence et du budget : GPT-4 est plus fort sur le raisonnement difficile et les longs contextes ; GPT-3.5-turbo reste le cheval de bataille pour beaucoup de scénarios chat et outillage. Pour modéliser les coûts, combinez jetons par tour, trafic et limites de débit — surtout si vous plafonnez les messages par utilisateur et par heure.