L’Express

GPT5 : la petite astuce derrière les grands progrès de l’IA de Sam Altman

GPT5 : la petite astuce derrière les grands progrès de l’IA de Sam Altman

« Parler à GPT-4, c’était comme discuter avec un étudiant. Avec GPT-5, c’est comme parler à un doctorant ». Les formules du patron d’OpenAI, Sam Altman, font toujours mouche. Ce jeudi 7 août à 19 heures, le monde avait les yeux rivés sur le lancement du très attendu GPT5. Modèle hybride, mémoire surpuissante, fiabilité accrue : les nouveautés dévoilées à San Francisco semblent bluffantes.

Le nouveau modèle de Sam Altman est meilleur que son prédécesseur en mathématique. Il semble écrire des textes bien plus originaux et rythmés. Ecrire 400 lignes de code lui prend quelques dizaines de secondes. Et il gère si bien les demandes en langage naturel que des personnes n’ayant aucune connaissance informatique peuvent sans mal lui faire créer de petites démos interactives pour, par exemple, faire comprendre à un enfant comment fonctionne l’effet Bernoulli. Ou créer pour un proche une application ludique pour apprendre une langue étrangère.

« On s’attend à ce que GPT5 pousse encore plus l’IA dans des tâches à forte valeur ajoutée comme la programmation, la finance et l’analyse juridique », résume Jacob Falkencrone, stratégiste en investissement international de Saxo Bank. Il est possible toutefois que GPT5 paraisse bien plus intelligent que son prédécesseur… sans l’être tant que cela. Pour comprendre ce paradoxe, il faut revenir à la philosophie de Sam Altman. Elle tient en un mot : « scaler ». Autrement dit, faire croître rapidement une variable pour provoquer des effets positifs en cascade.

Sam Altman ne jure que par le scaling

Facebook, Google, et consorts l’ont fait dès les années 2000 : en démultipliant à toute vitesse leur base d’utilisateurs, ils ont généré des effets de réseau massifs. Les revenus ont explosé bien plus vite que les coûts. Dans l’IA, ce que l’on appelle scaler est un peu différent et nettement plus risqué. Le pari, ici, c’est qu’en augmentant massivement la quantité de données et la puissance de calcul, l’intelligence artificielle progresse non linéairement, par bonds de géants.

Mais ce pari coûte infiniment plus cher que de recruter des utilisateurs. Les processeurs graphiques utilisés pour entraîner les IA valent entre 10 000 et 30 000 dollars pièce. Lorsque aux débuts d’OpenAI, Sam Altman a décidé de tenter le coup, la plupart des chercheurs en IA l’ont pris pour un fou.

Le coup de poker a cependant réussi. Aujourd’hui, quand Altman réclame des puces, les investisseurs sortent illico leurs chéquiers. En mai dernier encore, Oracle a promis d’acheter 400 000 processeurs Nvidia de dernière génération afin de les mettre à disposition d’OpenAI. Une emplette à 40 milliards de dollars.

Mais scaler suffira-t-il encore ?

« Tester GPT5 m’a fait peur », « Qu’avons-nous fait ? »… Comme à son habitude, le patron d’OpenAI avait très théâtralement teasé son modèle avant la présentation officielle. Et laissé entendre qu’il avait franchi un seuil d’intelligence décisif. Il faudra des mois pour en juger. Les modèles sont désormais si puissants que seuls des experts de leur discipline – mathématique, code, etc. – peuvent évaluer avec finesse les progrès réalisés.

Il est toutefois probable que GPT5 donne des réponses bien plus intelligentes que GPT 4o sans l’être lui-même beaucoup plus. Les progrès du scaling en phase d’entraînement semblent ralentir. D’autres mécanismes plus simples présentent cependant un beau potentiel.

L’architecture futée de GPT-5

Jusqu’à ce jour, ChatGPT reposait sur une multitude de modèles aux noms abscons. GPT-4o était la référence, l’option la plus polyvalente. D’autres étaient taillés pour des besoins plus spécifiques – programmation, rédaction, actions rapides, etc. La rupture la plus nette était venue d’o3 le modèle de « raisonnement ». Les entreprises de l’IA ont en effet découvert que le simple fait de laisser plus de temps à l’IA pour traiter une demande – la fameuse étape d’inférence – lui permet de produire des réponses plus intelligentes. L’IA va, en effet, mettre à profit ce délai pour décomposer notre requête en étapes détaillées afin de mieux la traiter. Et vérifier la cohérence des réponses entre ses diverses étapes.

« Même si GPT-5 ne faisait rien d’autre que de basculer automatiquement les utilisateurs entre o3 et 4o, cela bouleverserait leur perception de l’IA. Très peu de personnes, même parmi les utilisateurs payants, savent qu’ils devraient souvent passer à un modèle plus performant — et quand on leur montre o3 [NDLR : le modèle de raisonnement], ils sont impressionnés », pointait récemment avec humour Ethan Mollick, professeur de management de la prestigieuse Wharton School et auteur du passionnant best-seller américain « Co-Intelligence. Vivre et travailler avec l’IA » (First Editions).

Parfois, ChatGPT a même intérêt à faire appel à des outils primitifs. Il n’y a rien de plus absurde, par exemple, que d’utiliser une IA générative probabiliste pour réaliser une opération mathématique. Si elles se trompent désormais moins, c’est en réalité parce que les entreprises les laissent désormais déléguer ces demandes à des calculettes virtuelles. « Avec GPT-5, OpenAI fait sauter une friction majeure : le modèle choisira lui-même le bon sous‑modèle en fonction de la tâche », explique Hanan Ouazan, managing Partner chez Artefact.

Le docteur ChatGPT

Assembler cette myriade d’outils sous une même ombrelle et automatiser le choix du plus adapté en temps réel est en effet très ingénieux. Cela améliorera nettement les réponses produites – quand bien même le nouveau modèle n’apporterait pas de rupture majeure. On peut également espérer que cela réduise la consommation d’énergie de l’IA.

Reste à voir si les dépenses colossales d’OpenAI valent les gains obtenus. La valorisation de l’entreprise de Sam Altman n’a cessé d’enfler : une estimation la situe à 500 milliards de dollars, devant SpaceX. « Cela reflète l’ambition d’OpenAI de devenir la couche d’infrastructure qui sous-tend l’économie IA. Mais cela relève le niveau des attentes : les investisseurs veulent voir une monétisation rapide, des avantages concurrentiels clairs et défendables, et un modèle économique scalable dans une course chaque jour plus encombrée », pointe Jacob Falkencrone de Saxo Bank.

Le travail acharné d’OpenAI pour rendre l’interaction avec l’IA la plus simple possible est rusé. Aucun acteur n’y parvient pour le moment aussi bien. Et cette avance lui servira doublement. Elle attire, bien sûr, les utilisateurs. Mais surtout, cette fluidité leur donnera envie de confier une quantité nettement plus grande de renseignements personnels que les réseaux sociaux avant elle. Comment résister à l’envie de laisser GPT-5 analyser vos e-mails, vos calendriers, vos échanges passés, quand il vous crée en une seconde la parfaite to-do list ou la présentation qui vous ressemble vraiment ? GPT-5 peut également prendre en charge des vidéos désormais. « Il peut donc voir ce que vous voyez », explique OpenAI.

La santé est un autre marché qu’OpenAI investit avec énergie. « GPT-5 a été présenté comme un outil qui accompagne psychologiquement les patients de maladies – selon Sam Altman, c’est un usage répandu de ChatGPT. Le témoignage d’une femme atteinte de cancer qui nous a été donné à voir était évidemment poignant, mais le niveau d’intrusivité dans la pathologie des individus pose problème », observe Julien Pillot, économiste expert du numérique et enseignant chercheur à l’Inseec Business School. Le raffinage de données personnelles a encore de beaux jours devant lui. Et l’IA serra si agréable et pratique qu’il sera dur de ne pas lui confier les clefs de toute notre vie.



Source link : https://www.lexpress.fr/economie/high-tech/gpt5-la-petite-astuce-derriere-les-grands-progres-de-lia-de-sam-altman-QECO3JRYRZHUZMG2XZXDA65KHI/

Author : Anne Cagan

Publish date : 2025-08-07 19:04:00

Copyright for syndicated content belongs to the linked Source.

Tags : L’Express
Quitter la version mobile