L'intelligence artificielle est arrivée dans notre vie quotidienne – des moteurs de recherche aux voitures autonomes. Cela a à voir avec l'énorme puissance de calcul qui est devenue disponible ces dernières années. Mais les nouveaux résultats de la recherche sur l'IA montrent désormais que des réseaux de neurones as well as simples et as well as petits peuvent être utilisés pour résoudre certaines tâches encore mieux, moreover efficacement et de manière furthermore fiable que jamais.




Une équipe de recherche internationale de la TU Wien (Vienne), de l'IST Autriche et du MIT (États-Unis) a développé un nouveau système d'intelligence artificielle basé sur le cerveau de petits animaux, comme les vers filiformes. Ce nouveau système d'IA peut contrôler un véhicule avec seulement quelques neurones artificiels. L'équipe affirme que le système présente des avantages décisifs par rapport aux modèles d'apprentissage en profondeur précédents: il gère beaucoup mieux les entrées bruyantes et, en raison de sa simplicité, son method de fonctionnement peut être expliqué en détail. Il ne doit pas être considéré comme une « boîte noire » complexe, mais il peut être compris par les humains. Ce nouveau modèle d'apprentissage en profondeur a maintenant été publié dans la revue Nature Equipment Intelligence.

Moins de neurones, in addition d'intelligence

Apprendre de la nature

Semblables aux cerveaux vivants, les réseaux de neurones artificiels sont constitués de nombreuses cellules individuelles. Lorsqu'une cellule est energetic, elle envoie un signal aux autres cellules. Tous les signaux reçus par la cellule suivante sont combinés pour décider si cette cellule deviendra également lively. La manière dont une cellule influence l'activité de la suivante détermine le comportement du système – ces paramètres sont ajustés dans un processus d'apprentissage automatique jusqu'à ce que le réseau neuronal puisse résoudre une tâche spécifique.




« Depuis des années, nous étudions ce que nous pouvons apprendre de la character pour améliorer l'apprentissage en profondeur », déclare le professeur Radu Grosu, chef du groupe de recherche « Cyber-Actual physical Systems » à TU Wien. « Le nématode C. elegans, par exemple, vit sa vie avec un nombre étonnamment petit de neurones, et montre toujours des modèles de comportement intéressants. Cela est dû à la manière efficace et harmonieuse dont le système nerveux du nématode traite l'information. »

« La mother nature nous montre qu'il reste encore beaucoup à faire », déclare le professeur Daniela Rus, directeur du laboratoire d'informatique et d'intelligence artificielle du MIT (CSAIL). « Par conséquent, notre objectif était de réduire massivement la complexité et d'améliorer l'interprétabilité des modèles de réseaux neuronaux. »

« Inspirés par la character, nous avons développé de nouveaux modèles mathématiques de neurones et de synapses », déclare le professeur Thomas Henzinger, président de l'IST Autriche.

« Le traitement des signaux dans les cellules individuelles fit des principes mathématiques différents de ceux des modèles d'apprentissage en profondeur précédents », explique le Dr Ramin Hasani, postdoctoral associé à l'Institut de génie informatique, TU Wien et MIT CSAIL. « De in addition, nos réseaux sont très clairsemés – cela signifie que toutes les cellules ne sont pas connectées à toutes les autres cellules. Cela simplifie également le réseau. »

Maintien de voie autonome

Pour tester les nouvelles idées, l'équipe a choisi une tâche de check particulièrement importante: les voitures autonomes restant dans leur voie. Le réseau neuronal reçoit en entrée des images de caméra de la route et décide automatiquement de se diriger vers la droite ou vers la gauche.

« Aujourd'hui, des modèles d'apprentissage profond avec plusieurs hundreds of thousands de paramètres sont souvent utilisés pour apprendre des tâches complexes telles que la conduite autonome », explique Mathias Lechner, ancien élève de la TU Wien et doctorant à l'IST Autriche. « Cependant, notre nouvelle approche nous permet de réduire la taille des réseaux de deux ordres de grandeur. Nos systèmes n'utilisent que 75 000 paramètres entraînables. »

Alexander Amini, doctorant au MIT CSAIL explique que le nouveau système se compose de deux events: L'entrée de la caméra est d'abord traitée par un réseau neuronal dit convolutif, qui ne perçoit que les données visuelles pour extraire les caractéristiques structurelles des pixels entrants. Ce réseau décide quelles get-togethers de l'image de la caméra sont intéressantes et importantes, puis transmet les signaux à la partie cruciale du réseau – un « système de contrôle » qui dirige ensuite le véhicule.

Les deux sous-systèmes sont empilés ensemble et sont entraînés simultanément. De nombreuses heures de vidéos de circulation sur la conduite humaine dans la grande région de Boston ont été collectées et sont transmises au réseau, avec des informations sur la façon de diriger la voiture dans une circumstance donnée – jusqu'à ce que le système ait appris à connecter automatiquement les visuals avec les way de route et peut gérer indépendamment de nouvelles cases.

La partie contrôle du système (appelée politique de circuit neuronal, ou NCP), qui traduit les données du module de notion en une commande de pilotage, ne se compose que de 19 neurones. Mathias Lechner explique que les PCN sont jusqu'à 3 ordres de grandeur furthermore petits que ce qui aurait été doable avec les modèles de pointe précédents.

Causalité et interprétabilité

Le nouveau modèle d'apprentissage en profondeur a été testé sur un véritable véhicule autonome. « Notre modèle nous permet d'étudier ce sur quoi le réseau concentre son notice pendant la conduite. Nos réseaux se concentrent sur des functions très spécifiques de l'image de la caméra: le trottoir et l'horizon. Ce comportement est hautement souhaitable, et il est exceptional parmi les systèmes d'intelligence artificielle, « dit Ramin Hasani. « De plus, nous avons vu que le rôle de chaque cellule dans n'importe quelle décision de conduite peut être identifié. Nous pouvons comprendre la fonction des cellules individuelles et leur comportement. Atteindre ce degré d'interprétabilité est impossible pour les modèles d'apprentissage en profondeur in addition larges.

Robustesse

« Pour tester la robustesse des PCN par rapport aux modèles profonds précédents explique Mathias Lechner. « Alors que cela est devenu un problème insurmontable pour d'autres réseaux neuronaux profonds, nos PCN ont démontré une forte résistance aux artefacts d'entrée. Cet attribut est une conséquence directe du nouveau modèle neuronal et de l'architecture. »

« L'interprétabilité et la robustesse sont les deux avantages majeurs de notre nouveau modèle », déclare Ramin Hasani. « Mais il y a in addition: en utilisant nos nouvelles méthodes, nous pouvons également réduire le temps de formation et la possibilité de mettre en œuvre l'IA dans des systèmes relativement simples. Nos PCN permettent l'apprentissage par imitation dans un huge éventail d'applications possibles, du travail automatisé dans les entrepôts à la locomotion par robot. Les nouvelles découvertes ouvrent de nouvelles views importantes pour la communauté de l'IA: les principes du calcul dans les systèmes nerveux biologiques peuvent devenir une excellente ressource pour créer une IA interprétable de haute overall performance – comme option aux systèmes d'apprentissage automatique de la boîte noire que nous avons utilisés. loin. »

Dépôt de code: https://github.com/mlech26l/keras-ncp

Vidéo: https://ist.ac.at/ennew-deep-studying-products/