PITTSBURGH – À une Ă©poque tendue oĂč une pandĂ©mie fait rage, les politiciens se disputent les votes et les manifestants exigent la justice raciale, un peu de politesse et de courtoisie font beaucoup. Aujourd’hui, des chercheurs de l’UniversitĂ© Carnegie Mellon ont dĂ©veloppĂ© une mĂ©thode automatisĂ©e pour rendre les communications additionally polies.

Additionally prĂ©cisĂ©ment, la mĂ©thode prend des directives ou des requĂȘtes non polies – celles qui utilisent un langage impoli ou neutre – et les restructure ou ajoute des mots pour les rendre moreover bienfaisantes. « Envoyez-moi les donnĂ©es », par exemple, pourrait devenir « Pourriez-vous s’il vous plaĂźt m’envoyer les donnĂ©es? »

La méthode rend automatiquement les demandes plus polies

Les chercheurs prĂ©senteront leur Ă©tude sur le transfert de politesse lors de la rĂ©union annuelle de l’Association for Computational Linguistics, qui se tiendra pratiquement Ă  partir du 5 juillet.

L’idĂ©e de transfĂ©rer un design and style ou un sentiment d’une communication Ă  une autre – transformer les dĂ©clarations nĂ©gatives en positif, par exemple – est quelque selected que les technologues du langage font depuis un selected temps. Shrimai Prabhumoye, un doctorat. Ă©tudiant au Language Technologies Institute (LTI) de la CMU, le transfert de politesse est depuis longtemps un objectif.

« C’est extrĂȘmement pertinent pour certaines purposes, par exemple si vous voulez rendre vos e-mails ou chatbot plus polis ou si vous Ă©crivez un web site », a-t-elle dĂ©clarĂ©. « Mais nous n’avons jamais pu trouver les bonnes donnĂ©es pour effectuer cette tĂąche. »

Elle et les Ă©tudiants de maĂźtrise LTI Aman Madaan, Amrith Setlur et Tanmay Parekh ont rĂ©solu ce problĂšme en gĂ©nĂ©rant un ensemble de donnĂ©es de 1,39 million de phrases Ă©tiquetĂ©es pour la politesse, qu’ils ont utilisĂ© pour leurs expĂ©riences.

La supply de ces phrases peut paraĂźtre surprenante. Ils provenaient d’e-mails Ă©changĂ©s par des employĂ©s d’Enron, une sociĂ©tĂ© d’Ă©nergie basĂ©e au Texas qui, jusqu’Ă  sa disparition en 2001, Ă©tait mieux connue pour la fraude et la corruption des entreprises que pour les subtilitĂ©s sociales. Mais un demi-million de courriels d’entreprise sont devenus publics Ă  la suite des poursuites judiciaires entourant le scandale de fraude d’Enron et ont ensuite Ă©tĂ© utilisĂ©s comme ensemble de donnĂ©es pour une variĂ©tĂ© de projets de recherche.

Mais mĂȘme avec un ensemble de donnĂ©es, les chercheurs ont Ă©tĂ© mis au dĂ©fi de simplement dĂ©finir la politesse.

« Il ne s’agit pas seulement d’utiliser des mots tels que » s’il vous plaĂźt « et » merci «  », a dĂ©clarĂ© Prabhumoye. Parfois, cela signifie rendre le langage un peu moins direct, de sorte qu’au lieu de dire «tu devrais faire X», la phrase devienne quelque chose comme «laissez-nous faire X».

Et la politesse varie d’une tradition Ă  l’autre. Il est courant que les autochtones nord-amĂ©ricains utilisent « s’il vous plaĂźt » dans les demandes adressĂ©es Ă  des amis proches, mais dans la tradition arabe, cela serait considĂ©rĂ© comme maladroit, sinon grossier. Pour leur Ă©tude, les chercheurs de la CMU ont limitĂ© leur travail aux locuteurs de l’anglais nord-amĂ©ricain dans un cadre formel.

L’ensemble de donnĂ©es de politesse a Ă©tĂ© analysĂ© pour dĂ©terminer la frĂ©quence et la distribution des mots dans les phrases polies et non polies. Ensuite, l’Ă©quipe a dĂ©veloppĂ© un pipeline « tag et gĂ©nĂ©rer » pour effectuer des transferts de politesse. Tout d’abord, les mots ou expressions impolis ou non polis sont Ă©tiquetĂ©s, puis un gĂ©nĂ©rateur de texte remplace chaque Ă©lĂ©ment Ă©tiquetĂ©. Le systĂšme veille Ă  ne pas modifier le sens de la phrase.

« Il ne s’agit pas seulement de nettoyer des jurons », a dĂ©clarĂ© Prabhumoye Ă  propos du processus. Initialement, le systĂšme avait tendance Ă  simplement ajouter des mots aux phrases, comme «s’il vous plaĂźt» ou «dĂ©solé». Si « S’il vous plaĂźt, aidez-moi » Ă©tait considĂ©rĂ© comme poli, le systĂšme considĂ©rait « S’il vous plaĂźt s’il vous plaĂźt, aidez-moi » encore additionally poli.

Mais au fil du temps, le systĂšme de notation est devenu additionally rĂ©aliste et les changements sont devenus moreover subtils. Les pronoms singuliers Ă  la premiĂšre personne, tels que moi, moi et le mien, ont Ă©tĂ© remplacĂ©s par des pronoms pluriels Ă  la premiĂšre personne, tels que nous, nous et notre. Et plutĂŽt que de placer « s’il vous plaĂźt » au dĂ©but de la phrase, le systĂšme a appris Ă  l’insĂ©rer dans la phrase: « Pourriez-vous s’il vous plaĂźt m’envoyer le fichier? »

Prabhumoye a dĂ©clarĂ© que les chercheurs ont publiĂ© leur ensemble de donnĂ©es Ă©tiquetĂ© pour une utilisation par d’autres chercheurs, dans l’espoir de les encourager Ă  poursuivre leurs Ă©tudes sur la politesse.

###

En moreover des Ă©tudiants, les co-auteurs de l’Ă©tude comprenaient plusieurs professeurs du LTI et du dĂ©partement d’apprentissage automatique – Barnabas Poczos, Graham Neubig, Yiming Yang, Ruslan Salakhutdinov et Alan Black. L’Air Pressure Research Laboratory, l’Office of Naval Investigate, la Countrywide Science Basis, Apple et NVIDIA ont soutenu cette recherche.