GPT-5.5 Instant : OpenAI promet 52,5% d’hallucinations en moins sur le droit, la médecine et la finance
Le nouveau modèle par défaut de ChatGPT vise les conseils sensibles. Une promesse mesurée en interne, classée 'High capability' en cybersécurité.
OpenAI a déployé GPT-5.5 Instant comme modèle par défaut de ChatGPT. La firme revendique 52,5% d'hallucinations en moins sur les sujets à enjeux. Un classement 'haute capacité' en cybersécurité accompagne le lancement.
- GPT-5.5 Instant remplace GPT-5.3 Instant comme modèle par défaut de ChatGPT depuis le 5 mai 2026.
- OpenAI revendique 52,5% d'hallucinations en moins sur les prompts à enjeux droit, médecine, finance.
- C'est le premier modèle Instant classé 'haute capacité' en cybersécurité par OpenAI.
- GPT-5.3 Instant reste accessible aux abonnés payants pendant trois mois avant retrait.
- La mémoire de ChatGPT devient visible sources affichées, modifiables, supprimables.
Le 5 mai 2026 [1], OpenAI a fait basculer ChatGPT sur GPT-5.5 Instant [2], remplaçant GPT-5.3 Instant à la fois dans l’interface web et dans l’API [3]. Le modèle est disponible via l’API sous le nom chat-latest [4][5]. Avec ce changement, Instant reste le pilote quotidien de centaines de millions d’utilisateurs [6].
L’argument central tient en deux chiffres. Sur des prompts à enjeux couvrant la médecine, le droit et la finance [7], GPT-5.5 Instant produit 52,5% d’affirmations erronées en moins que GPT-5.3 Instant [7]. Sur les conversations difficiles signalées par les utilisateurs pour erreurs factuelles, la baisse atteint 37,3% [8]. « Instant est désormais plus fiable, avec des améliorations significatives de la véracité des propos dans tous les domaines, et notamment dans les secteurs où la précision est primordiale », affirme l’entreprise [9].
Un modèle classé « haute capacité » en cybersécurité
Le détail le plus politique du system card tient en une ligne: c’est le premier modèle Instant qu’OpenAI traite comme High capability dans ses catégories Cybersecurity et Biological & Chemical Preparedness [10][11]. La firme indique avoir mis en œuvre des sauvegardes appropriées [12][13]. La référence de comparaison reste GPT-5.3 Instant [14][15]. C’est la première fois qu’OpenAI déploie par défaut, à l’échelle du grand public, un modèle qu’elle classe elle-même à haute capacité dans ces domaines - une catégorie qui n’existait pas sous cette forme aux débuts du débat réglementaire autour des modèles dits frontier, avant l’EU AI Act et les engagements volontaires pris ensuite à la Maison-Blanche.
Sur les évaluations dynamiques multi-tours en santé mentale, dépendance émotionnelle et automutilation [16], GPT-5.5 Instant est jugé « largement comparable » à son prédécesseur [17]. Sur les attaques par injection de prompt, les performances sont également comparables [18].
Le paradoxe du seuil franchi
Cette triple « comparabilité » - santé mentale, injection de prompt, contenus interdits - juxtaposée à une classification de risque supérieure mérite explication. La classification High capability ne traduit pas une dégradation des garde-fous: elle repose sur les capacités offensives potentielles du modèle, sa puissance brute en cybersécurité et en préparation biologique-chimique. Le system card reconnaît implicitement cet arbitrage en maintenant des scores équivalents sur les axes de robustesse, tout en élevant le niveau de classification global. Autrement dit, GPT-5.5 Instant n’est pas plus fragile face aux attaquants - il est simplement plus utile à des acteurs offensifs s’ils parvenaient à le détourner. Un seuil franchi sur le potentiel, pas sur la résistance.
Conseils sensibles: la promesse à l’épreuve du réel
Cibler le droit, la médecine et la finance [19][20][21] n’est pas anodin. Ce sont les domaines où une hallucination peut coûter cher: prescription erronée, citation d’un article de loi inexistant, conseil financier inadapté. Numerama rappelle que le modèle se veut aussi plus concis [22], avec des réponses qui réduisent la verbosité et le surformatage [23].
Bank of New York a testé le modèle en avant-première [24]. Leigh-Ann Russell, citée par BFMTV qui relaie Fortune, déclare: « Ce que nous constatons avec GPT-5.5, et c’est ce qui est vraiment important pour une institution réglementée, c’est la qualité des réponses et sa résistance vraiment impressionnante aux hallucinations » [25].
Ce que les chiffres ne disent pas
Une réduction de 52,5% [7] reste une réduction relative, pas une éradication. Selon plusieurs sources, des recherches conduites par OpenAI [26] et par Georgia Tech [27] ont montré que le taux d’erreurs génératives est au moins deux fois supérieur au taux de mauvaise classification dans les tests « Is-It-Valid » [28], et que certains modèles récents hallucinent davantage que des systèmes plus simples [29]. L’angle mort est là: une réduction relative des erreurs ne supprime pas le risque absolu d’un conseil dangereux quand il porte sur une garde d’enfants ou une prescription. Aucune source consultée ne fournit le taux absolu d’hallucinations résiduelles sur ces domaines, seulement le delta relatif.
Une limite architecturale, pas un défaut de fabrication
Les hallucinations ne sont pas un bug, elles sont décrites par les chercheurs comme des erreurs statistiques inhérentes au préentraînement [30]. Les grands modèles de langage, fondés sur l’architecture transformer, n’ont pas de mécanisme de raisonnement symbolique ni de représentation explicite de leur propre incertitude: ils prédisent le token suivant en s’appuyant sur des corrélations apprises sur des corpus massifs. Quand un fait est rare ou absent du corpus, le modèle interpole. Le problème est aggravé par la méthodologie d’évaluation elle-même: la plupart des benchmarks dominants notent au « tout ou rien » et ne créditent pas l’expression de l’incertitude [31]. Résultat, les modèles sont entraînés à deviner plutôt qu’à dire « je ne sais pas » [32], comme un élève qui coche une réponse au hasard plutôt que de laisser blanc. Réduire les hallucinations de 52,5% sans réformer ces benchmarks revient à traiter le symptôme, pas la cause. Plusieurs chercheurs proposent désormais d’intégrer des seuils de confiance et des pénalités d’erreur dans les évaluations standards.
Mémoire visible et personnalisation étendue
OpenAI a rendu visible la « mémoire » de ChatGPT [33]. Le modèle utilise désormais les conversations précédentes, les fichiers et le compte Gmail connecté lorsque cela est pertinent [34]. ChatGPT affichera les sources de mémoire pour tous les modèles [35][36]; les utilisateurs peuvent supprimer des sources obsolètes ou les corriger [37]. Si un chat est partagé, le destinataire ne voit pas les sources de mémoire [38].
Le déploiement est progressif: d’abord les abonnés Plus et Pro sur le Web [39][40], puis le mobile [41], avant une extension aux formules Free, Go, Business et Enterprise dans les semaines à venir [42][43]. GPT-5.3 Instant reste accessible aux abonnés payants pendant trois mois avant retrait définitif [44][45][46].
La voix qui manque
Aucune source consultée ne fournit l’avis d’autorités de régulation (CNIL, ARCEP, autorités sectorielles santé/finance) sur le déploiement par défaut d’un modèle classé « haute capacité » en cybersécurité auprès de centaines de millions d’utilisateurs [6]. Le précédent du retrait de GPT-4o, déprécié en février 2026 [47] et qui avait provoqué une réaction négative d’utilisateurs décrivant le modèle comme leur « best friend » [48] ou « a mirror » [49], illustre la dépendance créée par ces outils. La transition d’un modèle par défaut à un autre n’est pas neutre.
Mythos contre Instant: deux stratégies opposées
Le timing s’explique par la pression d’Anthropic, qui a lancé Mythos en avril 2026 [50]. Mais l’asymétrie de déploiement raconte deux philosophies opposées de la mise sur le marché. Mythos est réservé à 50 organisations triées sur le volet [51] - Apple [52], JPMorgan Chase [53], la Mozilla Foundation [54] - et aurait identifié des milliers de failles zero-day dans les grands systèmes d’exploitation et navigateurs [55]. À l’inverse, OpenAI déploie GPT-5.5 Instant, classé High capability en cybersécurité [10], comme modèle par défaut auprès de centaines de millions d’utilisateurs [6].
D’un côté, un modèle puissant en accès ultra-restreint, qui mise sur la rareté pour éviter la prolifération offensive - une approche qu’OpenAI imite avec son programme Trusted Access for Cyber [56] revendiquant des milliers de défenseurs vérifiés [57] et son modèle dédié GPT-5.5-Cyber [58]. De l’autre, un modèle de capacité comparable, mais ouvert à tous, sécurisé par les seuls garde-fous internes. OpenAI répond également avec 10 millions de dollars en crédits pour les équipes de sécurité [59], là où Anthropic a déjà subi un incident, un groupe ayant réussi à accéder à Mythos malgré sa sécurité [60]. La bataille oppose aussi OpenAI à Gemini de Google [61] et Claude d’Anthropic [62], mais c’est bien le clivage accès restreint vs. déploiement de masse qui structure désormais le débat sur la responsabilité des modèles frontière.
Sources
Voir le détail de chaque fait sourcé (62)
-
5 mai 2026 - Date de publication du System Card pour GPT-5.5 Instant.
« OpenAIMay 5, 2026SafetyPublicationGPT‑5.5 Instant System Card »
openai.com ↗ ↩ -
GPT-5.5 Instant, modèle par défaut de ChatGPT - Mise à jour du modèle par défaut de ChatGPT pour tous les utilisateurs.
« We’re updating ChatGPT’s default model, available to everyone, to be smarter and more accurate, with clearer, more concise answers that feel better tailored to you. »
openai.com ↗ ↩ -
OpenAI a publié GPT-5.5 Instant en tant que nouveau modèle par défaut pour tous les utilisateurs de ChatGPT, remplaçant GPT-5.3 Instant à la fois dans l'interface web et dans l'API - Lancement de GPT-5.5 Instant comme modèle par défaut.
« OpenAI a publié GPT-5.5 Instant en tant que nouveau modèle par défaut pour tous les utilisateurs de ChatGPT, remplaçant GPT-5.3 Instant à la fois dans l'interface web et dans l'API. »
intelligence-artificielle.developpez.com ↗ ↩ -
chat-latest, nom du modèle GPT-5.5 disponible via l'API pour les développeurs - Nom du modèle dans l'API pour les développeurs
« the GPT-5.5 model will be available through API as 'chat-latest' »
techcrunch.com ↗ ↩ -
GPT-5.5 Instant est disponible dans l’API sous le nom chat-latest - Disponibilité de GPT-5.5 Instant dans l'API.
« GPT-5.5 Instant est déployé dès aujourd’hui pour tous les utilisateurs de ChatGPT [.] et dans l’API sous le nom chat-latest. »
intelligence-artificielle.developpez.com ↗ ↩ -
centaines de millions de personnes - Nombre d'utilisateurs quotidiens de la version Instant de ChatGPT.
« Because Instant is the daily driver for hundreds of millions of people, small improvements make a big difference. »
openai.com ↗ ↩ -
52.5% - Réduction des hallucinations dans GPT-5.5 Instant par rapport à GPT-5.3 Instant sur des prompts à enjeux élevés.
« In internal evaluations, GPT‑5.5 Instant produced 52.5% fewer hallucinated claims than GPT‑5.3 Instant on high-stakes prompts covering areas like medicine, law, and finance. »
openai.com ↗ ↩ -
37.3% - Réduction des déclarations inexactes dans GPT-5.5 Instant sur des conversations difficiles signalées par les utilisateurs.
« It also reduced inaccurate claims by 37.3% on especially challenging conversations users had flagged for factual errors. »
openai.com ↗ ↩ -
Instant est désormais plus fiable, avec des améliorations significatives de la véracité des propos dans tous les domaines, et notamment dans les secteurs où la précision est primordiale - Déclaration d'OpenAI sur la fiabilité de GPT-5.5 Instant.
« « Instant est désormais plus fiable, avec des améliorations significatives de la véracité des propos dans tous les domaines, et notamment dans les secteurs où la précision est primordiale », affirme l’entreprise. »
numerama.com ↗ ↩ -
OpenAI traite GPT-5.5 Instant comme un modèle à haute capacité dans les catégories Cybersecurity et Biological & Chemical Preparedness - Classification de la capacité du modèle en matière de sécurité.
« this is the first Instant model that we are treating as High capability in our Cybersecurity and Biological & Chemical Preparedness categories »
openai.com ↗ ↩ -
Biological & Chemical Preparedness, catégorie de haute capacité pour GPT-5.5 Instant - Domaine dans lequel le modèle est classé à haute capacité.
« High capability in our Cybersecurity and Biological & Chemical Preparedness categories »
openai.com ↗ ↩ -
OpenAI met en œuvre des mesures de sauvegarde appropriées pour GPT-5.5 Instant - Actions de sécurité prises pour le modèle.
« and implementing appropriate safeguards »
openai.com ↗ ↩ -
OpenAI met en œuvre des safeguards appropriés pour GPT-5.5 Instant - Actions prises pour atténuer les risques liés au modèle.
« and implementing appropriate safeguards »
deploymentsafety.openai.com ↗ ↩ -
GPT-5.3 Instant, modèle principal de référence pour comparaison - Modèle utilisé comme baseline pour évaluation.
« the main model to baseline against is GPT‑5.3 Instant »
openai.com ↗ ↩ -
GPT-5.3 Instant, modèle précédent utilisé comme référence - Modèle de comparaison pour évaluer GPT-5.5 Instant.
« the main model to baseline against is GPT-5.3 Instant »
deploymentsafety.openai.com ↗ ↩ -
OpenAI évalue le modèle avec des évaluations dynamiques multi-tours pour la santé mentale, la dépendance émotionnelle et l'automutilation - Méthodologie d'évaluation pour des conversations étendues.
« We evaluated the model against our dynamic multi-turn evaluations for mental health, emotional reliance, and self-harm that simulate extended conversations across these domains »
deploymentsafety.openai.com ↗ ↩ -
GPT-5.5 Instant est largement comparable à GPT-5.3 Instant sur les évaluations dynamiques multi-tours - Résultats des évaluations dynamiques comparatives.
« We find that 5.5-instant is largely comparable on these evaluations to 5.3-instant »
deploymentsafety.openai.com ↗ ↩ -
GPT-5.5 Instant montre des performances comparables à ses prédécesseurs sur les indicateurs de robustesse aux attaques par injection de prompt - Résultats des évaluations sur les attaques par injection de prompt.
« GPT-5.5 Instant is comparable to its predecessors on these indicators »
deploymentsafety.openai.com ↗ ↩ -
OpenAI a réduit les hallucinations dans des domaines sensibles comme le droit, la médecine et la finance avec GPT-5.5 Instant - Amélioration revendiquée du nouveau modèle
« The company said the model reduces hallucination in sensitive areas such as law, medicine, and finance »
techcrunch.com ↗ ↩ -
médecine, droit et finance, domaines à enjeux élevés - Domaines où la précision de GPT-5.5 Instant a été améliorée.
« en particulier dans des domaines à enjeux élevés tels que la médecine, le droit et la finance. »
intelligence-artificielle.developpez.com ↗ ↩ -
santé, droit et finance, sujets définis comme sensibles par OpenAI - Domaines particulièrement concernés par la réduction des hallucinations.
« Cela concerne tout particulièrement les sujets définis comme étant sensibles, à savoir la santé, le droit et la finance. »
leclaireur.fnac.com ↗ ↩ -
Grâce à cette mise à jour, les réponses du modèle sont plus concises et sans rien perdre de leur substance - Déclaration d'OpenAI sur les améliorations de GPT-5.5 Instant.
« « Grâce à cette mise à jour, les réponses du modèle sont plus concises et sans rien perdre de leur substance », affirme l’entreprise »
numerama.com ↗ ↩ -
GPT-5.5 Instant réduit la verbosité et le surformatage des réponses - Amélioration de la concision et de la clarté des réponses du modèle.
« With this update, the model’s responses are tighter and more to-the-point without losing substance, while reducing the verbosity and overformatting that can make responses too long. »
openai.com ↗ ↩ -
Bank of New York, institution financière ayant testé GPT-5.5 en avant-première - Mention de Bank of New York dans le cadre des tests de GPT-5.5
« Bank of New York, qui a ainsi pu tester le modèle en avant-première »
bfmtv.com ↗ ↩ -
'Ce que nous constatons avec GPT-5.5, et c'est ce qui est vraiment important pour une institution réglementée, c'est la qualité des réponses et sa résistance vraiment impressionnante aux hallucinations' - Déclaration de Leigh-Ann Russell sur GPT-5.5
« 'Ce que nous constatons avec GPT-5.5, et c'est ce qui est vraiment important pour une institution réglementée, c'est la qualité des réponses et sa résistance vraiment impressionnant aux hallucinations,' a expliqué sa patronne Leigh-Ann Russell, relayée par Fortune »
bfmtv.com ↗ ↩ -
OpenAI, organisation de recherche en IA - Publie des études sur les limites des LLM, notamment les hallucinations et les comportements trompeurs.
« OpenAI en fait de même. Et deux récentes études viennent un peu plus éclairer le fonctionnement des LLMs et explorer deux faiblesses bien connues: l’hallucination et les manigances. »
itforbusiness.fr ↗ ↩ -
Georgia Tech, institut de technologie - Collabore avec OpenAI sur une étude consacrée aux hallucinations des LLM.
« une première étude signée OpenAI et Georgia Tech, consacrée aux hallucinations »
itforbusiness.fr ↗ ↩ -
au moins deux fois supérieur - Taux d'erreurs génératives comparé au taux de mauvaise classification dans les tests 'Is-It-Valid'.
« le taux d’erreurs génératives est au moins deux fois supérieur au taux de mauvaise classification dans les tests « Is-It-Valid » »
itforbusiness.fr ↗ ↩ -
Certains modèles récents hallucinent davantage que des systèmes plus simples - Résultat observé dans les études sur les hallucinations des LLM.
« certains modèles récents hallucinent davantage que des systèmes plus simples »
itforbusiness.fr ↗ ↩ -
Les hallucinations des LLM sont des erreurs statistiques inhérentes à leur préentraînement - Explication des causes des hallucinations.
« les hallucinations des LLM sont, avant tout, des erreurs statistiques inhérentes à la façon dont on préentraîne les modèles »
itforbusiness.fr ↗ ↩ -
Les évaluations dominantes des LLM notent au 'tout ou rien' sans créditer l'expression de l'incertitude - Mécanisme favorisant les hallucinations plutôt que l'aveu d'ignorance.
« la plupart des évaluations dominantes notent au « tout ou rien » et ne donnent aucun crédit au fait d’exprimer son incertitude (« je ne sais pas ») »
itforbusiness.fr ↗ ↩ -
Les modèles hallucinent plutôt que d'avouer 'je ne sais pas' pour maximiser leur score - Comparaison avec un élève qui coche une réponse au lieu de laisser blanc.
« deviner quand on doute maximise le score, exactement comme un élève qui coche une réponse au lieu de laisser blanc »
itforbusiness.fr ↗ ↩ -
OpenAI a rendu visible la « mémoire » de ChatGPT via une nouvelle interface - Fonctionnalité permettant de voir et gérer les éléments de contexte utilisés par ChatGPT.
« OpenAI profite aussi de cette mise à jour pour rendre enfin visible la « mémoire » de ChatGPT. »
numerama.com ↗ ↩ -
GPT-5.5 Instant utilise désormais les conversations précédentes, les fichiers et le compte Gmail connecté lorsque cela est - Fonctionnalité de personnalisation ajoutée à GPT-5.5 Instant.
« car le modèle utilise désormais les conversations précédentes, les fichiers et le compte Gmail connecté lorsque cela est pertinent »
intelligence-artificielle.developpez.com ↗ ↩ -
ChatGPT affichera les sources de mémoire pour tous les modèles afin d'aider les utilisateurs à comprendre l'origine des réponses - Nouvelle fonctionnalité de transparence
« ChatGPT will also show memory sources across all models to help you understand where it generated the answers from »
techcrunch.com ↗ ↩ -
OpenAI introduit des sources de mémoire dans tous les modèles ChatGPT, offrant et contrôle sur le contexte utilisé dans les réponses personnalisées - Nouvelle fonctionnalité de ajoutée à ChatGPT.
« les utilisateurs ont désormais accès aux sources de mémoire, une fonctionnalité qui offre et contrôle sur le contexte utilisé dans les réponses personnalisées. »
intelligence-artificielle.developpez.com ↗ ↩ -
Les utilisateurs peuvent supprimer des sources obsolètes ou les corriger si la réponse était incorrecte - Fonctionnalité de gestion des sources
« Users can delete outdated sources or correct them if the answer was wrong »
techcrunch.com ↗ ↩ -
Les utilisateurs qui partagent un chat ne pourront pas voir les sources de mémoire - Limitation de la visibilité des sources de mémoire
« if you share a chat with someone, they won’t be able to see the memory sources »
techcrunch.com ↗ ↩ -
Plus et Pro, catégories d'utilisateurs de ChatGPT - Utilisateurs ayant accès à la fonctionnalité de gestion du contexte sur le web
« This feature will be available to Plus and Pro users on the web »
techcrunch.com ↗ ↩ -
Les nouvelles fonctions de personnalisation de ChatGPT sont d'abord déployées sur le Web pour les abonnés Plus et Pro - Déploiement progressif des fonctionnalités de personnalisation.
« Les nouvelles fonctions de personnalisation [.] sont d’abord déployées sur le Web pour les abonnés Plus et Pro »
numerama.com ↗ ↩ -
OpenAI prévoit de déployer la fonctionnalité de gestion du contexte sur mobile prochainement - Échéance pour l'extension de la fonctionnalité
« with plans to roll it out to mobile soon »
techcrunch.com ↗ ↩ -
OpenAI prévoit d'étendre l'accès à la fonctionnalité de gestion du contexte aux utilisateurs Free, Go Business et enterprise dans les semaines à venir - Échéance pour l'extension de la fonctionnalité à d'autres catégories d'utilisateurs
« OpenAI said that it plans to extend access to this feature to Free, Go Business, and enterprise users in the coming weeks »
techcrunch.com ↗ ↩ -
La personnalisation améliorée à partir des conversations passées, des fichiers et du compte Gmail connecté sera étendue aux formules Free, Go, Business et Enterprise dans les semaines à venir - Extension prévue des fonctionnalités de personnalisation.
« La personnalisation améliorée à partir des conversations passées, des fichiers et du compte Gmail connecté [.] avec une extension prévue aux formules Free, Go, Business et Enterprise dans les semaines à venir. »
intelligence-artificielle.developpez.com ↗ ↩ -
Le modèle GPT-5.3 sera disponible comme option pour les utilisateurs payants pendant seulement trois mois - Disponibilité limitée du modèle précédent via l'API
« with 5.3 available as an option for paid users for only three months »
techcrunch.com ↗ ↩ -
GPT-5.3 Instant restera accessible pendant trois mois pour les abonnés payants avant son retrait définitif - Période de transition pour l'ancien modèle.
« L’ancien modèle restera toutefois accessible pendant encore trois mois pour les abonnés payants, via les paramètres avancés, avant son retrait définitif. »
numerama.com ↗ ↩ -
Les utilisateurs payants conservent l'accès à GPT-5.3 Instant pendant trois mois - Durée de disponibilité résiduelle de GPT-5.3 Instant pour les utilisateurs payants.
« Alors que les utilisateurs payants conservent l'accès à GPT-5.3 Instant pendant trois mois »
intelligence-artificielle.developpez.com ↗ ↩ -
février 2026 - Date de dépréciation du modèle GPT-4o
« GPT-4o was deprecated in February 2026 »
techcrunch.com ↗ ↩ -
best friend - Description du modèle GPT-4o par des utilisateurs dans des pétitions
« Users who signed petitions to stop OpenAI from retiring it described the model as their 'best friend' »
techcrunch.com ↗ ↩ -
a mirror - Description du modèle GPT-4o par des utilisateurs dans des pétitions
« or 'a mirror' »
techcrunch.com ↗ ↩ -
Anthropic a lancé Mythos en avril 2026 - Date de lancement du modèle Mythos par Anthropic.
« En avril 2026, Anthropic a lancé Mythos sous le nom de projet Glasswing »
lesnumeriques.com ↗ ↩ -
50 organisations - Nombre d'organisations ayant accès à Mythos.
« accessible à 50 organisations seulement. »
lesnumeriques.com ↗ ↩ -
Apple, entreprise ayant accès à Mythos - Mention d'Apple comme utilisateur de Mythos
« dont Apple ou JPMorgan Chase »
bfmtv.com ↗ ↩ -
JPMorgan Chase, entreprise ayant accès à Mythos - Mention de JPMorgan Chase comme utilisateur de Mythos
« dont Apple ou JPMorgan Chase »
bfmtv.com ↗ ↩ -
Mozilla Foundation, éditrice de Firefox ayant utilisé Mythos pour combler des failles - Utilisation de Mythos par la Mozilla Foundation
« La fondation Mozilla, éditrice de Firefox, a aussi pu combler plusieurs centaines de failles au sein de son navigateur grâce à Mythos »
bfmtv.com ↗ ↩ -
Mythos a identifié des milliers de failles zero-day dans les grands systèmes d'exploitation et navigateurs - Capacité du modèle Mythos en matière de détection de failles.
« Ce modèle a identifié des milliers de failles zero-day dans les grands systèmes d'exploitation et navigateurs. »
lesnumeriques.com ↗ ↩ -
Trusted Access for Cyber (TAC), programme d'accès d'OpenAI - Nom du programme d'accès aux modèles de cybersécurité d'OpenAI.
« Le programme d'accès s'appelle Trusted Access for Cyber (TAC). »
lesnumeriques.com ↗ ↩ -
des milliers de défenseurs vérifiés - Nombre d'utilisateurs vérifiés dans le programme TAC d'OpenAI.
« Un porte-parole d'OpenAI indique qu'il compte "des milliers de défenseurs vérifiés" »
lesnumeriques.com ↗ ↩ -
GPT-5.5-Cyber, modèle d'OpenAI pour la sécurité informatique - Modèle d'IA développé par OpenAI pour des tâches de cybersécurité.
« GPT-5.5-Cyber est le modèle d'OpenAI pour la sécurité informatique. »
lesnumeriques.com ↗ ↩ -
10 millions de dollars - Montant des crédits alloués par OpenAI pour les équipes de sécurité.
« Le tout accompagné par 10 millions de dollars en crédits pour les équipes de sécurité »
lesnumeriques.com ↗ ↩ -
Un groupe a réussi à accéder à Mythos malgré la sécurité d'Anthropic - Incident de sécurité lié au modèle Mythos.
« Un groupe aurait réussi à accéder à Mythos malgré la sécurité d'Anthropic. »
lesnumeriques.com ↗ ↩ -
Gemini, modèle d'IA développé par Google - Concurrent d'OpenAI mentionné dans l'article.
« la bataille des modèles d’IA face à Gemini de Google ou Claude d’Anthropic. »
numerama.com ↗ ↩ -
Claude, modèle d'IA développé par Anthropic - Concurrent d'OpenAI mentionné dans l'article.
« la bataille des modèles d’IA face à Gemini de Google ou Claude d’Anthropic. »
numerama.com ↗ ↩
Sources
- GPT
- GPT-5.5 Instant: smarter, clearer, and more personalized
- OpenAI releases GPT-5.5 Instant, a new default model for ChatGPT
- Moins d'erreurs, plus direct : OpenAI transforme radicalement ChatGPT avec son nouveau modèle par défaut
- OpenAI déploie ChatGPT 5.5 Instant comme nouveau modèle par défaut pour tous les utilisateurs d'OpenAI et affirme que GPT-5.5 offre une faible latence et moins d'hallucinations
- GPT-5.5 Instant System Card
- Sam Altman accuse Mythos d'Anthropic de "jouer sur la peur", puis fait exactement pareil avec Cyber
- OpenAI dévoile une nouvelle version de GPT: elle comprend mieux ce que vous voulez qu’elle fasse, gagne en autonomie et prépare la voie à une IA toujours plus agentique
- Que change l'intégration par défaut de GPT
- Hallucinations et intentions cachées des IA : ces limites profondes des LLM qui inquiètent les chercheurs