J'ai dansé avec Project Astra, l'agent IA de Google. Voici ce qui s'est passé.

    • Google présente sa nouvelle technologie, Project Astra, lors de la conférence I/O
    • Des journalistes ont pu tester l'agent IA et expérimenter ses différents modes d'utilisation
    • A travers des activités telles que Pictionary et des récits, le projet Astra vise à développer une IA universelle capable de comprendre différentes formes de communication
    • Le directeur du projet explique son inspiration pour le développement d'une IA plus avancée que les chatbots actuels

Le projet Astra était la nouvelle technologie la furthermore awesome présentée par Google lors de sa conférence I/O mardi.
Après le discours d'ouverture, les journalistes ont été rassemblés dans une zone de démonstration du projet Astra. Il s’agit d’un hard work expérimental visant à réimaginer ce que pourront être les agents d’IA dans le futur.
“Nous avons toujours voulu créer un agent universel qui serait utile dans la vie de tous les jours”, a déclaré Demis Hassabis, directeur de Google DeepMind.
Une fois sur le lieu du check, Google a laissé quatre journalistes à la fois entrer dans de petites cabines de démonstration. Avant d'entrer, pendant que nous faisions la queue, deux membres de l'équipe du projet Astra de DeepMind nous ont expliqué remark utiliser la technologie.
Ils nous ont décrit quatre modes à essayer : Storyteller, Pictionary, Free-Sort et Alliteration.

Method forme libre

Nous avons essayé le manner Totally free-Variety. Max Cherney, un journaliste de Reuters, a brandi un téléphone Android fourni par Google et a pointé l'appareil picture vers moi.
“Décrivez ses vêtements”, dit Max.
Le modèle Gemini de Google a examiné la vidéo en direct du téléphone et a déclaré que je portais des vêtements décontractés. Une réponse précise et solide.
J'ai commencé à danser et Max m'a demandé : « Qu'est-ce qu'il fait maintenant ? Les Gémeaux ont répondu de manière incorrecte, en quelque sorte. Il disait que j'avais mis des lunettes de soleil. Ce qui était vrai, parce que je mettais des lunettes de soleil pour danser. Mais il n'a pas repéré la danse. Certes, je dansais mal, alors peut-être que le modèle d’IA passe à côté de ça.

Aucune cotation boursière

Ensuite, Max a demandé à Gemini de critiquer ma tenue vestimentaire, car or truck il voulait que Gemini fasse une analyse et partage son stage de vue.
Le modèle d'IA disait “Je ne peux pas fournir de cotations boursières pour le instant”. Nous nous sommes tous arrêtés alors que la magie de l’IA avait brusquement pris fin.

Une voiture et une histoire

Je suis ensuite passé à un grand écran tactile qui proposait les quatre modes à essayer. J'ai choisi Pictionary. J'ai dessiné une très mauvaise voiture et Gemini a dit “qui ressemble à une voiture”.
Je lui ai demandé de mettre le véhicule dans une histoire intéressante. “L'élégante voiture bleue a dévalé l'autoroute, un voyageur solitaire par une nuit au clair de lune”, a déclaré Gemini.

J'ai dansé avec Project Astra, l'agent IA de Google. Voici ce qui s'est passé.

J'ai fait conduire la voiture sur un marché et Gemini a dit que cela serait dangereux en réalité, mais que cela pourrait donner un bon rebondissement à l'intrigue.
“Est-ce que c'est ça?” » demanda Gémeaux.
J'ai dessiné une desk de fruits au marché. C'était encore pire que la voiture. Ensuite, j'ai dit que quelqu'un devrait voler des fruits dans l'histoire.
“Ah, un voleur de fruits ajoute une touche intéressante ! Est-ce qu'ils s'en sortent jusqu'à présent ?” Dit Gémeaux.
À ce stade, la démonstration s’est terminée et nous avons été conduits hors du stand.

Gregory Wayne et le capitaine Prepare dinner

Juste à l'extérieur, j'ai croisé Gregory Wayne, le chef du projet Astra. Il travaille chez DeepMind depuis environ une décennie et nous avons discuté des origines du projet Astra.
Il a dit qu'il était fasciné par la façon dont les humains communiquent en utilisant le langage. Pas seulement les mots écrits et parlés, mais toutes les autres formes de communication qui rendent l’interaction humaine si riche et satisfaisante.
Il a raconté l'histoire de l'arrivée du capitaine Cook à Terre de Feu et de sa rencontre avec les habitants. Ils ne parlaient pas la même langue, ils communiquaient donc par des actions, comme ramasser des bâtons et les jeter sur le côté, ce qui signifiait que Prepare dinner et son équipage étaient les bienvenus.
Wayne et ses collègues étaient fascinés par l'histoire motor vehicle elle montrait toutes les autres façons dont les humains peuvent communiquer entre eux au-delà de ce qu'on leur apprend à faire par écrit et en parlant à voix haute.

Au-delà des chatbots

Cela fait partie de ce qui a inspiré le projet Astra, a déclaré Wayne. Il s'agit d'aller au-delà de ce que font actuellement les chatbots, qui constant principalement à comprendre des mots écrits et parlés et à mener de simples discussions de va-et-vient, où l'ordinateur dit quelque selected, puis l'humain le fait, puis l'ordinateur à nouveau, et ainsi de suite.
L’un des principaux objectifs du projet Astra est d’amener les modèles d’IA à comprendre de nombreuses autres choses qui se passent autour de la interaction textuelle et vocale. Il peut s'agir de signaux manuels ou du contexte de ce qui se passe dans le monde au minute de la conversation.
À l’avenir, cela pourrait inclure quelque selected comme un modèle ou un agent d’IA repérant quelque selected en arrière-approach d’un flux vidéo et alertant l’humain dans la dialogue. Il peut s'agir d'un vélo qui approche ou d'une information à l'utilisateur lorsqu'un feu de circulation change de couleur.
Les selections sont infinies et incluent également un modèle d'IA comprenant, grâce à une sorte de lecture de la pièce, qu'il doit arrêter de parler et laisser l'humain dire quelque chose.

SuperEvilMegaCorp

J'ai parlé à Wayne du moment légèrement décevant où Gemini n'a pas critiqué mes vêtements et a plutôt dit qu'il ne pouvait pas fournir de cotations boursières pour le moment.
Il a immédiatement regardé mon T-shirt, qui portait un véritable symbol de startup indiquant « SuperEvilMegaCorp ». Wayne a émis l'hypothèse que Gemini avait vu le nom de la société et avait deviné que nous voulions connaître les informations financières de cette société.
SuperEvilMegaCorp est une startup de jeux de la Silicon Valley qui n'est pas cotée en bourse, il n'y a donc aucune data boursière en temps réel. Les Gémeaux ne le savaient pas. Mais peut-être qu'il est en train d'apprendre cela en ce minute.

[sharethis-inline-buttons]