XAI a recruté des travailleurs temporaires pour propulser Grok sur un classement d'IA et surpasser Claude d'Anthropic en codage

Chapô Elon Musk a récemment annoncé que le modèle Grok 4, développé par sa société Xai, « fonctionne mieux que Cursor » dans l’outil de développement Fixing Code. Cette déclaration s’inscrit dans une stratégie visant à améliorer la position de Grok au sein des classements populaires d’intelligence artificielle, notamment face à son rival direct Anthropic.

Elon Musk affirme que Grok 4 fonctionne mieux que Cursor dans le codage.
XAI recrute des entrepreneurs pour améliorer Grok face à Claude d’Anthropic.
Le projet Hillclimb vise à faire de Grok le meilleur modèle de l'industrie.
Les classements influencent financements, partenariats et réputation dans l'IA.

XAI a recruté des travailleurs temporaires pour propulser Grok sur un classement d’IA et surpasser Claude d’Anthropic en codage

Une guerre des classements en IA

Les entreprises technologiques intensifient leur compétition pour créer les meilleurs outils de codage d’intelligence artificielle. La société XAI d’Elon Musk se concentre sur la nécessité de surpasser Claude 3.7, l’outil concurrent développé par Anthropic.

7 Extended, référence directe au modèle Claude d’Anthropic.

Le projet Hillclimb et ses défis

Les entrepreneurs engagés ont travaillé sur un projet intitulé « Hillclimb » qui était inclus dans le classement influent WebDev Arena, un espace où différents modèles d’IA sont mis à l’épreuve grâce aux votes des utilisateurs. L’objectif déclaré était clair : « Nous voulons faire du modèle en tâche le modèle n ° 1 » pour Lmarena, selon un entrepreneur ayant participé au projet.

Les nouvelles versions doivent non seulement optimiser le code généré pour répondre aux prompts utilisateur mais aussi rivaliser directement avec les performances du système concurrent de Claude.

Un enjeu crucial pour attirer financements et clients

Le paysage actuel montre qu’en l’absence de normes universelles acceptées, ces classements et scores deviennent des indicateurs essentiels pour naviguer dans l’industrie dynamique de l’IA. Atteindre les premières positions attire notamment financements, partenariats stratégiques, ainsi qu’une attention médiatique accrue.

Le modèle Claude d’Anthropic est régulièrement cité parmi les leaders du secteur, souvent classé au sommet devant des géants comme Google et OpenAI.

Réactions du marché

Benn Mann, cofondateur d’Anthropic, avait exprimé lors d’un podcast nommé « No Prieor » son étonnement face à la lenteur avec laquelle certaines entreprises essayaient encore de rattraper les capacités avancées en matière de codage offertes par Claude. Il a mentionné qu’il n’était pas rare que des concurrents déclarent des « Code Reds » en réaction à ces exigences croissantes sur le marché.

Mardi dernier, Lmarena a attribué un classement préliminaire à Grok 4 qui s’est installé en 12e place pour le développement Web ; donc derrière plusieurs modèles Anthropic classés respectivement premier, troisième et quatrième.

Dans la foulée du lancement réussi de Grok 4 le 9 juillet dernier, Elon Musk a exprimé sur X sa satisfaction concernant son nouveau modèle : il affirme qu’il « fonctionne mieux que Cursor », soulignant ainsi une progression significative vis-à-vis des outils assistés par IA existants.

L’évolution constante du secteur met clairement en lumière combien il est crucial pour chaque acteur du domaine non seulement innover constamment mais aussi obtenir reconnaissance et validation auprès du public globalement compétitif.

Suivez-nous sur Google News

xAI a recruté des travailleurs temporaires pour propulser Grok sur un classement d'IA et surpasser Claude d'Anthropic en codage.

Une guerre des classements en IA

Le projet Hillclimb et ses défis

Un enjeu crucial pour attirer financements et clients

Réactions du marché

Qu'est-ce que Grok ?

xAI a présenté ses excuses pour le discours 'horrifique' de Grok, attribuant la faute aux nouvelles directives du chatbot et aux publications d'utilisateurs extrémistes sur X.

Anthropic offre un test technique de deux heures à domicile, et Claude 4.5 a surpassé tous les humains

Comment choisir la meilleure banque en ligne en 2026 : les astuces dont personne ne parle

Diffusion de « Malcolm in the Middle : Life's Still Unfair » sur Hulu en 2026

OpenAI en alerte rouge : protéger le système, retarder les bénéfices

Découvrez où voir les meilleurs films de 2025, alors que les tendances Google 2023 sont révélées

Ice Spice et Tokischa dansent en République dominicaine pour le clip « Thootie »