Dans le conflit juridique sur le scraping de données, Perplexity est pris au piège par Reddit

Reddit intente un procès contre Perplexity pour vol de données

  • Reddit poursuit Perplexity pour avoir utilisé ses données sans autorisation.
  • Reddit a créé un piège numérique pour prouver le vol de contenu par Perplexity.
  • Perplexity nie former ses modèles sur des contenus piratés et dénonce les accusations.
  • Ce conflit soulève des questions sur l'éthique et la transparence dans le secteur technologique.

Dans le conflit juridique sur le scraping de données, Perplexity est pris au piège par Reddit

Reddit a déposé, mercredi, une plainte devant le tribunal fédéral de Manhattan à l’encontre de la société d’intelligence artificielle Perplexity, ainsi que trois entreprises spécialisées dans le grattage de données. L’accusation porte sur l’illégalité des méthodes employées par ces entités pour obtenir et utiliser les données du réseau social. Le procès met également en lumière une manœuvre astucieuse mise en place par Reddit pour démontrer la récupération frauduleuse d’un contenu spécifique.

Les accusations portées par Reddit

Dans son procès, Reddit accuse Perplexity, évaluée à 20 milliards de dollars et concurrente directe d’OpenAI et Google, d’avoir enfreint ses droits en continuant à citer son contenu sans autorisation. Reddit prétend que cette augmentation soudaine des références aurait pu être interprétée comme un accord secret entre les deux sociétés pour accéder aux données.

« En vérité, il n’y a aucune licence entre Perplexity et Reddit », souligne la plainte. Celle-ci décrit un stratagème élaboré par Perplexity pour contourner les mesures technologiques qui protègent les informations du site.

La mise en place du piège

Pour prouver ses allégations, Reddit a mis en place un « piège » digital basé sur une publication test accessible uniquement via le moteur de recherche Google. Bien que ce dernier dispose d’un accord avec Reddit concernant son contenu, ce n’est pas le cas pour Perplexity.

Selon le procès : « C’était l’équivalent numérique d’une facture marquée ». L’objectif était de détecter si Perplexity accédait à cette donnée via Google sans permission. En moins de quelques heures après la création du piège, Reddit affirme avoir observé que le moteur de réponses de Perplexity avait ingéré ce même contenu diffusé dans sa publication test.

Réactions des parties impliquées

Interrogé sur ces accusations, Jesse Dwyer, porte-parole de Perplexity, a déclaré : « Nous ne tolérerons pas les menaces contre l’ouverture et l’intérêt public ». L’entreprise insiste également sur le fait qu’elle « ne forme pas de modèles d’IA sur le contenu ».

Parallèlement, Denas Grybauskas, directeur chez Oxylabs, s’est dit choqué par ces allégations et a promis une défense robuste devant la justice : « Oxylabs a toujours été et continuera d’être un pionnier. et elle n’hésitera pas à se défendre contre ces allégations ».

AWMProxy, identifiée dans la plainte comme un ancien botnet russe, n’a pas répondu aux sollicitations.

Une affaire révélatrice des pratiques industrielles

Les manœuvres citées dans ce litige rejoignent celles dénoncées auparavant par Cloudflare, lorsque sa direction avait comparé les comportements similaires adoptés par Perplexity à ceux « des hackers nord-coréens ». Dans cet esprit critique partagé récemment lors d’un article annonçant leur stratégie face au grattage malveillant sur Internet, Matthew Prince déclarait : « Il est temps de les nommer.».

Ce procès soulève donc des questions crucials autour des pratiques éthiques en matière d’utilisation des données numériques dans le secteur technologique où transparence et respect des droits sont davantage mis en avant.

Passionné de sport et grand fan de la NBA je m’intéresse autant aux grands événements internationaux qu’aux histoires humaines qui se jouent en coulisses. Curieux et amateur de voyages, j’aime transmettre l’énergie et les émotions qui font vibrer le monde du sport.