Anthropic offre un test technique de deux heures à domicile, où Claude 4.5 a surpassé tous les humains

Anthropic présente Claude Opus 4.5, le modèle d’IA qui surpasse les humains en codage

Anthropic offre un test technique de deux heures à domicile, où Claude 4.5 a surpassé tous les humains

Lundi, Anthropic a dévoilé son dernier modèle d’intelligence artificielle, Claude Opus 4.5, affirmant qu’il a surpassé tous les candidats humains lors d’un test de codage. Cette avancée marque une étape significative pour la société dans le domaine des outils de codage basés sur l’IA.

Des performances impressionnantes lors du test

Le test à emporter de deux heures mis en place par Anthropic est conçu pour évaluer les capacités techniques et le jugement sous pression du temps. L’entreprise précise que si ce test ne couvre pas toutes les compétences nécessaires à un ingénieur, le fait qu’un modèle d’IA « surpasse les candidats forts sur des compétences techniques importantes » soulève des interrogations quant à l’avenir de l’ingénierie professionnelle.

Dans son communiqué, Anthropic a détaillé que la méthodologie employée a permis au modèle de résoudre plusieurs problèmes et de sélectionner la meilleure réponse parmi celles apportées. Toutefois, peu d’informations sont disponibles concernant la composition exacte du test technique réalisé. Une revue publiée sur Glassdoor avait mentionné que ce dernier comporte quatre niveaux, mais il n’est pas certain que Claude Opus 4.5 ait subi un examen similaire.

Une évolution rapide

La version 4.5 arrive seulement trois mois après sa prédécesseure et offre également des améliorations dans la génération de documents professionnels tels que les feuilles de calcul Excel et les présentations PowerPoint. La dominance croissante d’Anthropic dans le secteur est notable ; même Meta, dirigé par Mark Zuckerberg, utilise Claude pour alimenter son assistant interne Devmate.

Les méthodes de formation utilisées par Anthropic restent encore quelque peu mystérieuses. Eric Simons, PDG de Stackblitz, a suggéré qu’Anthropic aurait demandé à ses modèles d’écrire et lancer du code eux-mêmes avant que leurs résultats soient évalués par des humains ainsi que par différentes intelligences artificielles. Dianne Penn, responsable chez Anthropic, a confirmé que cette description était « généralement vraie ».

L’impact sur l’avenir du travail

Lors d’une conférence en octobre dernier, Dario Amodei, PDG d’Anthropic, a déclaré : « Claude AI écrivait déjà 90% du code pour la plupart des équipes », tout en précisant que cela ne signifie pas qu’il remplacerait complètement les ingénieurs logiciels.

Avec ces nouvelles avancées technologiques marquantes dans le secteur de l’intelligence artificielle et plus particulièrement dans le domaine du codage, Anthropique pourrait bien redéfinir non seulement le paysage technologique mais aussi celui des emplois associés à cette industrie clé.

Passionné de sport et grand fan de la NBA je m’intéresse autant aux grands événements internationaux qu’aux histoires humaines qui se jouent en coulisses. Curieux et amateur de voyages, j’aime transmettre l’énergie et les émotions qui font vibrer le monde du sport.