Alors que les chercheurs de l’Université de Virginie occidentale voient le potentiel du tout nouveau plugin officiel ChatGPT, appelé Code Interpreter, dans les contextes éducatifs, ils ont découvert des limites à son utilisation par les scientifiques qui travaillent avec des données biologiques en utilisant des méthodes informatiques pour prioriser le traitement ciblé du most cancers et des problems génétiques.
“Code Interpreter est une bonne selected et il est utile dans un cadre éducatif car or truck il rend le codage dans les domaines STEM moreover available aux étudiants”, a déclaré Gangqing “Michael” Hu, professeur adjoint au département de microbiologie, d’immunologie et de biologie cellulaire de la WVU. École de médecine et directeur du noyau de bioinformatique. “Cependant, il ne possède pas les fonctionnalités dont vous avez besoin pour la bioinformatique. Ce sont des problèmes tactics qui peuvent être surmontés. Les développements futurs de Code Interpreter sont susceptibles d’étendre son utilisation à de nombreux domaines tels que la bioinformatique, la finance et l’économie.”
Depuis sa sortie en décembre 2022, le populaire chatbot d’intelligence artificielle ChatGPT a attiré l’attention des entreprises, des enseignants et du grand general public. Cependant, il n’a pas tout à fait répondu aux besoins des personnes travaillant dans la recherche biomédicale, notamment en bioinformatique – le domaine où l’informatique rencontre la biologie – qui attendaient avec impatience le plugin Code Interpreter d’OpenAI, espérant qu’il comblerait les lacunes.
Hu et son équipe ont testé Code Interpreter sur diverses tâches pour évaluer ses fonctionnalités. Leurs conclusions, publiées dans Annals of Biomedical Engineering, montrent que le plugin élimine certaines barrières, mais pas toutes.
Par exemple, les personnes sans formation scientifique auront facilement accès au codage ou à la programmation informatique grâce à Code Interpreter. Hu a déclaré que c’était également rentable et suscitait la curiosité des étudiants pour explorer l’analyse des données et renforçait leur intérêt pour l’apprentissage. Il souligne cependant que les utilisateurs devront comprendre remark interpréter les données, reconnaître si les résultats sont exacts et savoir remark interagir avec le chatbot.
Les bioinformaticiens s’appuient sur un codage précis, des logiciels informatiques et un accès à Net pour stocker, analyser et interpréter des données biologiques telles que l’ADN et le génome humain, utilisées pour les progrès de la médecine moderne.
Malgré le besoin d’améliorations spécifiques à la bioinformatique, a déclaré Hu, Code Interpreter aide les utilisateurs à déterminer si une réponse est exacte ou s’il s’agit d’une réponse fictive présentée avec confiance, connue sous le nom d’hallucination.
“Les gens savent que ChatGPT peut faire beaucoup de choses impressionnantes, mais il n’est pas doué pour fournir une citation ou une référence pour étayer sa réponse. Si on lui pose des issues sur la source pour étayer l’affirmation d’une réponse, il peut commencer à inventer des références, “, a expliqué Hu. “Code Interpreter fournit une resolution pour minimiser les hallucinations. Pour les issues qui peuvent être résolues par le codage, le code lui-même sert de source ou de quotation. C’est un pas en avant significant.”
Lei Wang, chercheur postdoctoral au département de microbiologie, d’immunologie et de biologie cellulaire de la WVU, travaillait avec Hu Xijin Ge, de l’Université d’État du Dakota du Sud et Li Liu, de l’Université d’État de l’Arizona.
L’équipe a trouvé des résultats positifs dans la capacité de Code Interpreter à convertir des données en tableaux et graphiques.
Les suggestions de mises à niveau de Code Interpreter incluent l’accès à World wide web pour le téléchargement de données génomiques, l’installation de logiciels spécifiques à la bioinformatique, l’extension de la capacité de stockage et la prise en cost de langages de programmation supplémentaires. En outre, les chercheurs ont découvert qu’il était nécessaire que les programs de confidentialité et de sécurité soient conformes aux réglementations telles que HIPAA.
En testant l’analyse des données, ils ont découvert plusieurs limites. Le plugin ne prend en demand qu’un seul programme informatique, Python, et peu de ses progiciels sont dédiés à la bioinformatique. De moreover, il ne permet pas l’accès aux données Web et n’a pas la capacité de travailler avec des fichiers volumineux.
“Cela autorise approximativement 100 mégaoctets, mais les fichiers que nous traitons sont au niveau du gigaoctet”, a déclaré Hu. “De as well as, il ne prend pas en charge le traitement parallèle nécessaire pour les grands ensembles de données, ce qui entraîne un ralentissement des performances.”
Hu a déclaré que même s’il prévoyait davantage de mises à niveau pour Code Interpreter, il prévoyait d’aider les étudiants à en apprendre davantage sur les avantages du plugin actuel.
“Dans ma classe au printemps prochain, je prévois d’introduire ce plugin pour aider les étudiants à en apprendre davantage sur la visualisation des données”, a déclaré Hu. “L’IA est un domaine en évolution rapide. J’espère qu’à ce moment-là, OpenAI pourra surmonter certaines limits afin de pouvoir être utilisée pour un big éventail de codage bioinformatique.”
Moreover tôt cette année, Hu a mené une autre étude pour préparer les étudiants du secondaire et du collège à exploiter la puissance de ChatGPT en en apprenant davantage sur le codage. Le processus a utilisé Best – Optimisation des invites grâce au mentorat et à l’évaluation itératifs – pour améliorer la interaction avec un chatbot.
À long terme, Hu a déclaré qu’il continuerait à surveiller et à tester les nouveaux programmes et fonctionnalités de l’IA.
“Au fur et à mesure que de nouveaux produits se développent, je continuerai”, a déclaré Hu. “Il existe certainement de nombreuses autres utilisations innovantes à découvrir.”