xAI a recruté des travailleurs temporaires pour propulser Grok sur un classement d'IA et surpasser Claude d'Anthropic en codage.

Chapô Elon Musk a récemment annoncé que le modèle Grok 4, développé par sa société Xai, « fonctionne mieux que Cursor » dans l’outil de développement Fixing Code. Cette déclaration s’inscrit dans une stratégie visant à améliorer la position de Grok au sein des classements populaires d’intelligence artificielle, notamment face à son rival direct Anthropic.

  • Elon Musk affirme que Grok 4 fonctionne mieux que Cursor dans le codage.
  • XAI recrute des entrepreneurs pour améliorer Grok face à Claude d’Anthropic.
  • Le projet Hillclimb vise à faire de Grok le meilleur modèle de l'industrie.
  • Les classements influencent financements, partenariats et réputation dans l'IA.

XAI a recruté des travailleurs temporaires pour propulser Grok sur un classement d’IA et surpasser Claude d’Anthropic en codage

Une guerre des classements en IA

Les entreprises technologiques intensifient leur compétition pour créer les meilleurs outils de codage d’intelligence artificielle. La société XAI d’Elon Musk se concentre sur la nécessité de surpasser Claude 3.7, l’outil concurrent développé par Anthropic.

7 Extended, référence directe au modèle Claude d’Anthropic.

Le projet Hillclimb et ses défis

Les entrepreneurs engagés ont travaillé sur un projet intitulé « Hillclimb » qui était inclus dans le classement influent WebDev Arena, un espace où différents modèles d’IA sont mis à l’épreuve grâce aux votes des utilisateurs. L’objectif déclaré était clair : « Nous voulons faire du modèle en tâche le modèle n ° 1 » pour Lmarena, selon un entrepreneur ayant participé au projet.

Les nouvelles versions doivent non seulement optimiser le code généré pour répondre aux prompts utilisateur mais aussi rivaliser directement avec les performances du système concurrent de Claude.

Un enjeu crucial pour attirer financements et clients

Le paysage actuel montre qu’en l’absence de normes universelles acceptées, ces classements et scores deviennent des indicateurs essentiels pour naviguer dans l’industrie dynamique de l’IA. Atteindre les premières positions attire notamment financements, partenariats stratégiques, ainsi qu’une attention médiatique accrue.

Le modèle Claude d’Anthropic est régulièrement cité parmi les leaders du secteur, souvent classé au sommet devant des géants comme Google et OpenAI.

Réactions du marché

Benn Mann, cofondateur d’Anthropic, avait exprimé lors d’un podcast nommé « No Prieor » son étonnement face à la lenteur avec laquelle certaines entreprises essayaient encore de rattraper les capacités avancées en matière de codage offertes par Claude. Il a mentionné qu’il n’était pas rare que des concurrents déclarent des « Code Reds » en réaction à ces exigences croissantes sur le marché.

Mardi dernier, Lmarena a attribué un classement préliminaire à Grok 4 qui s’est installé en 12e place pour le développement Web ; donc derrière plusieurs modèles Anthropic classés respectivement premier, troisième et quatrième.

Dans la foulée du lancement réussi de Grok 4 le 9 juillet dernier, Elon Musk a exprimé sur X sa satisfaction concernant son nouveau modèle : il affirme qu’il « fonctionne mieux que Cursor », soulignant ainsi une progression significative vis-à-vis des outils assistés par IA existants.

L’évolution constante du secteur met clairement en lumière combien il est crucial pour chaque acteur du domaine non seulement innover constamment mais aussi obtenir reconnaissance et validation auprès du public globalement compétitif.

Passionné de sport et grand fan de la NBA je m’intéresse autant aux grands événements internationaux qu’aux histoires humaines qui se jouent en coulisses. Curieux et amateur de voyages, j’aime transmettre l’énergie et les émotions qui font vibrer le monde du sport.