in

Un modèle multidimensionnel de la façon dont un animal apprend au fil du temps

Les physiciens ont développé un modèle dynamique du comportement animal qui peut expliquer certains mystères entourant l’apprentissage associatif remontant aux chiens de Pavlov. Les Actes de l’Académie nationale des sciences (PNAS) ont publié les résultats, basés sur des expériences sur un organisme de laboratoire commun, le ver rond C. elegans.

“Nous avons montré remark les associations apprises ne sont pas médiées uniquement par la drive d’une association, mais par de multiples voies presque indépendantes – au moins dans les vers”, explique Ilya Nemenman, professeur de physique et de biologie à Emory dont le laboratoire a dirigé les analyses théoriques. pour le papier. “Nous nous attendons à ce que des résultats similaires soient également valables pour les animaux plus gros, y compris peut-être chez les humains.”

“Notre modèle est dynamique et multidimensionnel”, ajoute William Ryu, professeur agrégé de physique au Centre Donnelly de l’Université de Toronto, dont le laboratoire a dirigé les travaux expérimentaux. “Cela explique pourquoi cet exemple d’apprentissage associatif n’est pas aussi easy que de previous un seul memento positif. Au lieu de cela, c’est une conversation keep on entre des associations positives et négatives qui se produisent en même temps.”

Le leading auteur de l’article est Ahmed Roman, qui a travaillé sur le projet en tant qu’étudiant diplômé d’Emory et est maintenant boursier postdoctoral au Broad Institute. Konstaintine Palanski, ancienne étudiante diplômée de l’Université de Toronto, est également auteur.

Il y a plus de 100 ans, Ivan Pavlov a découvert le “réflexe conditionné” chez les animaux grâce à ses expériences sur les chiens. Par exemple, après qu’un chien ait été entraîné à associer un son à l’arrivée ultérieure de nourriture, le chien commençait à saliver lorsqu’il entendait le son, avant même que la nourriture n’apparaisse.

Approximativement 70 ans as well as tard, les psychologues se sont appuyés sur les idées de Pavlov pour développer le modèle Rescorla-Wagner du conditionnement classique. Ce modèle mathématique décrit les associations conditionnées par leur power dépendante du temps. Cette force augmente lorsque le stimulus conditionné (dans le cas du chien de Pavlov, le son) peut être utilisé par l’animal pour diminuer la surprise à l’arrivée de la réponse inconditionnée (la nourriture).

Ces connaissances ont contribué à préparer le terrain pour les théories modernes de l’apprentissage par renforcement chez les animaux, qui à leur tour ont permis des algorithmes d’apprentissage par renforcement dans les systèmes d’intelligence artificielle. Mais de nombreux mystères demeurent, dont certains liés aux expériences originales de Pavlov.

Après que Pavlov ait entraîné des chiens à associer le son d’une cloche à de la nourriture, il les exposait ensuite à plusieurs reprises à la cloche sans nourriture. Lors des premiers essais sans nourriture, les chiens ont continué à saliver lorsque la cloche a sonné. Si les épreuves duraient assez longtemps, les chiens “désapprenaient” et cessaient de saliver en réponse à la cloche. L’association aurait été « éteinte ».

Pavlov a découvert, cependant, que s’il attendait un moment puis retestait les chiens, ils saliveraient à nouveau en réponse à la cloche, même s’il n’y avait pas de nourriture. Ni Pavlov ni les théories moreover récentes de l’apprentissage associatif n’ont pu expliquer avec précision ou modéliser mathématiquement cette récupération spontanée d’une association éteinte.

Les chercheurs ont exploré ces mystères à travers des expériences avec C. elegans. Le ver rond d’un millimètre ne compte qu’environ 1 000 cellules et 300 d’entre elles sont des neurones. Cette simplicité fournit aux scientifiques un système basic pour tester la façon dont l’animal apprend. Dans le même temps, les circuits neuronaux de C. elegans sont juste assez compliqués pour relier certaines des connaissances acquises grâce à l’étude de son comportement à des systèmes moreover complexes.

Des expériences antérieures ont établi que C. elegans peut être entraîné à préférer une température in addition froide ou moreover chaude en le conditionnant à une certaine température avec de la nourriture. Dans une expérience typique, les vers sont placés dans une boîte de Pétri avec un gradient de températures mais sans nourriture. Ceux entraînés à préférer une température additionally fraîche se déplaceront vers le côté le moreover froid du plat, tandis que les vers entraînés à préférer une température furthermore chaude iront vers le côté le furthermore chaud.

Mais que signifient exactement ces résultats ? Certains croient que les vers rampent vers une température particulière dans l’attente de nourriture. D’autres soutiennent que les vers s’habituent simplement à cette température, ils préfèrent donc y rester même sans récompense alimentaire.

L’énigme n’a pas pu être résolue en raison d’une limitation majeure de bon nombre de ces expériences – le temps qu’il faut à un ver pour traverser une boîte de Pétri de neuf centimètres à la recherche de la température préférée.

Nemenman et Ryu ont cherché à surmonter cette limitation. Ils voulaient développer un moyen pratique de mesurer avec précision la dynamique de l’apprentissage, ou comment l’apprentissage alter au fil du temps.

Le laboratoire de Ryu a utilisé un dispositif microfluidique pour réduire le modèle expérimental de boîtes de Pétri de neuf centimètres en gouttelettes de quatre millimètres. Les chercheurs ont pu rapidement mener des expériences sur des centaines de vers, chaque ver enfermé dans sa gouttelette individuelle.

“Nous avons pu observer en temps réel remark un ver se déplaçait sur un gradient linéaire de températures”, explique Ryu. “Au lieu d’attendre qu’il rampe pendant 30 minutes ou une heure, nous avons pu voir beaucoup furthermore rapidement quel côté de la goutte, le côté froid ou le côté chaud, que le ver préférait. Et nous avons également pu suivre l’évolution de ses préférences avec temps.”

Leurs expériences ont confirmé que si un ver est entraîné à associer des aliments à une température plus froide, il se déplacera vers le côté le as well as froid de la gouttelette. Au fil du temps, cependant, en l’absence de nourriture, cette préférence de mémoire diminue apparemment.

“Nous avons découvert que tout à coup, les vers voulaient passer in addition de temps du côté chaud de la gouttelette”, explique Ryu. “C’est surprenant, motor vehicle pourquoi les vers développeraient-ils une préférence différente et même éviteraient-ils la température qu’ils étaient venus associer à la nourriture?”

Finalement, le ver begin à faire des allers-retours entre les températures les as well as froides et les furthermore chaudes.

Les chercheurs ont émis l’hypothèse que le ver n’oublie pas simplement la mémoire favourable de la nourriture associée à des températures plus fraîches, mais commence plutôt à associer négativement le côté as well as frais à l’absence de nourriture. Cela l’incite à se diriger vers le côté le additionally chaud. Puis, au fur et à mesure que le temps passe, il begin à previous une association négative de pas de nourriture avec la température plus chaude, qui, combinée à l’association favourable résiduelle au froid, la fait migrer vers la température as well as fraîche.

“Le ver apprend toujours, tout le temps”, explique Ryu. “Il y a une interaction entre la commitment d’une affiliation beneficial et une affiliation négative qui la fait commencer à osciller entre le froid et le chaud.”

L’équipe de Nemenman a développé des équations théoriques pour décrire les interactions au fil du temps entre les deux variables indépendantes – l’association constructive, ou excitatrice, qui pousse un ver vers une température et l’association négative, ou inhibitrice, qui l’éloigne de cette température.

“Le côté vers lequel le ver gravite dépend du instant actual où vous prenez les mesures”, explique Nemenman. “C’est comme lorsque vous perdez vos clés, vous pouvez d’abord vérifier le bureau où vous les gardez habituellement. Si vous ne les voyez pas là tout de suite, vous courez dans différents endroits à leur recherche. Si vous ne les trouvez toujours pas, vous retournez au bureau d’origine en pensant que vous n’avez tout simplement pas regardé assez fort.”

Les chercheurs ont répété les expériences dans différentes situations. Ils ont entraîné les vers à différentes températures de départ et les ont affamés pendant différentes durées avant de tester leur préférence de température, et les comportements des vers ont été correctement prédits par les équations.

Ils ont également testé leur hypothèse en modifiant génétiquement les vers, supprimant la voie de signalisation analogue à l’insuline connue pour servir de voie d’association négative.

“Nous avons perturbé la biologie de manière spécifique et lorsque nous avons mené les expériences, le comportement du ver a changé comme prévu par notre modèle théorique”, explique Nemenman. “Cela nous donne furthermore de confiance que le modèle reflète la biologie sous-jacente de l’apprentissage, au moins chez C. elegans.”

Les chercheurs espèrent que d’autres testeront leur modèle dans des études sur des animaux plus grands à travers les espèces.

“Notre modèle fournit un modèle d’apprentissage quantitatif alternatif qui est multidimensionnel”, explique Ryu. “Cela explique des résultats difficiles, voire dans certains cas impossibles, à expliquer par d’autres théories du conditionnement classique.”