Le droit de fouille ou « data mining » : principe et limitations


Droit de la propriété intellectuelle

Le droit de fouille ou « data mining » est la faculté donnée notamment aux créateur d’outils d’intelligence artificielle, d’aller puiser dans les données de tiers, largement définies, accessibles sur Internet, afin d’améliorer les résultats générés par ces IA.

Ce droit résulte des articles 3 (fouille des textes et de données à des fins de recherche scientifique) et 4 (exception ou limitation pour la fouille de textes et de données) de la directive européenne n°2019/790  du 17 avril 2019 sur le droit d’auteur et les droits voisins dans le marché unique numérique. Ces droits ont été intégrés aux articles L122-5 et suivants du code de la propriété intellectuelle.

Nous nous intéresserons ici qu’au seul droit de fouille dit « général » visé à l’article 4 de la directive et au III. de l’article L122-5-3 du CPI.

Ce droit de fouille n’est pas sans créer des inquiétudes et des oppositions de la part des titulaires de droits de propriété intellectuelle, dont le monopole d’exploitation se trouve une nouvelle fois amputé.

Cependant, l’IA ne pouvant se développer sans la « matière » nécessaire à sa croissance, on voit mal comment le législateur pourrait à l’avenir reprendre ce qu’il a précédemment accordé. Il est clair qu’une politique protectionniste des intérêts exclusifs des titulaires de droits est inenvisageable eu égard aux enjeux technologiques, économiques et politiques induits par le développement des outils d’intelligence artificielle.

Le débat suscité par l’IA s’est excessivement focalisé sur le respect des droits d’auteur. Or, l’enjeu essentiel tient au fait que de nombreux résultats générés par l’IA concurrencent directement les créations ayant servi à leur élaboration.

Une présentation synthétique du droit de fouille conduit à s’interroger sur l’étendue exacte de ce droit et les objections qu’il appelle.

1- Qu’est-ce que la fouille ?

Comme le souligne le rapport du CSPLA, la définition de la fouille par la directive est fonctionnelle. Le résultat n’est pas juridiquement qualifié. Elle comprend, notamment, de l’extraction de données, mais ne s’y limite pas. Selon le rapport, l’immense majorité des fouilles implique des copies et reproductions des œuvres collectées.

Le droit de fouille peut porter sur toutes œuvres et « autres objets protégés ». L’expression peut surprendre. C’est que l’exception ne concerne pas exclusivement les œuvres protégées au titre du droit d’auteur. Elle porte également sur les droits voisins du droit d’auteur et sur les droits attachés aux bases de données.

Le droit de fouille fait échec aux droits de propriété intellectuelle suivants :

2- Œuvres et autres objets protégés pouvant être « fouillés »

Le droit de fouille ne peut s’exercer que sur des objets protégés licitement accessibles. Il faut comprendre l’expression comme visant l’ensemble des objets protégés librement et publiquement accessibles par internet. Si l’accès à des données n’est rendu possible qu’après ouverture d’un compte même gratuit, il est ici loisible à l’exploitant du site d’interdire contractuellement le droit de fouille. A défaut, il semble bien que le droit de fouille puisse s’exercer sur des données accessibles uniquement sur abonnement, gratuit ou payant, dès lors que celui qui l’exerce y a régulièrement souscrit et que le propriétaire des données ne s’y est pas opposé.

3- Limites au droit de fouille

3.1 Droits moraux

Au terme de l’article L121-1 du code de la propriété intellectuelle, « l’auteur jouit du droit au respect de son nom, de sa qualité et de son œuvre ».

Le droit de fouille ne fait pas exception à ces droits. En principe, toute reproduction d’une œuvre doit s’accompagner de la mention du nom de l’auteur. S’agissant ici d’une reproduction purement « technique », sans représentation publique de l’œuvre ainsi reproduite, l’atteinte au droit moral apparaît « théorique ».

Il n’en demeure pas moins qu’une « création » issue d’une IA emprunte, plus ou moins, à des œuvres préexistantes, la quantité d’œuvres « reprises » pour créer ce résultat étant juridiquement indifférente. Ainsi, le droit moral des auteurs pourrait s’opposer à l’exploitation des résultats générés par l’IA, sauf à ce que le nom des auteurs soit effectivement associé, d’une manière ou d’une autre, à ces résultats.

On peut supposer qu’il s’agit là d’une contrainte forte pour les acteurs de l’intelligence artificielle. En tout état de cause, les exigences de transparence qui se font jour pourraient trouver un solide allié juridique dans le droit moral.

3.2 Faculté d’opposition

La directive précise que le droit de fouille s’applique à condition que l’utilisation des œuvres et autres objets protégés n’ait pas été expressément réservée par leurs titulaires de droits de manière appropriée, notamment par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne.

Selon les considérants de cette directive, la réservation de ces droits ne devrait être jugée appropriée que si elle est effectuée au moyen de procédés lisibles par machine, y compris des métadonnées et les conditions générales d’utilisation d’un site internet ou d’un service. La réservation de droits aux fins de la fouille de textes et de données ne devrait pas affecter d’autres utilisations. Dans d’autres cas, il peut être approprié de réserver les droits par d’autres moyens, comme des accords contractuels ou une déclaration unilatérale. Les titulaires de droits devraient pouvoir appliquer des mesures destinées à garantir le respect de leurs droits réservés.

L’article R122-28 du code de la propriété intellectuelle rend la faculté d’opposition plus aisée à exercer. Il dispose en effet que « l’opposition … n’a pas à être motivée et peut être exprimée par tout moyen. Dans le cas de contenus mis à la disposition du public en ligne, cette opposition peut notamment être exprimée au moyen de procédés lisibles par machine, y compris des métadonnées, et par le recours à des conditions générales d’utilisation d’un site internet ou d’un service.

3.3 Absence d’atteinte à l’exploitation normale

Le droit de fouille ne peut s’appliquer que dans certains cas particuliers qui ne portent pas atteinte à l’exploitation normale de l’œuvre ou autre objet protégé ni ne causent un préjudice injustifié aux intérêts légitimes des titulaires de droits (considérant 6 directive).

Il s’agit là d’appliquer les exigences propres à toute limitation légale au monopole des auteurs.

Or, le droit de fouille n’est pas le droit pour le « fouilleur » de concurrencer indûment le « fouillé ».

L’essentiel du préjudice subi par les auteurs et leurs ayants droit ne réside pas tant dans la reproduction « technique » de leurs œuvres par les IA que dans l’exploitation des résultats qui en sont issus, parfois, directement concurrents des œuvres ayant servi à leur élaboration. Pourquoi acheter à un photographe une photographie d’illustration d’un site commercial lorsqu’une IA est en mesure de générer un cliché exploitable pour un coût réduit ?

Le droit de fouille, tel qu’il a été consacré par le législateur européen et français, autorise l’analyse de données pour en dégager des « informations » telles que les constantes, les tendances ou les corrélations. En synthèse et si tant est que nous sachions précisément ce qui se passe dans la « tête » d’une IA, cette dernière va extraire d’une œuvre tant les éléments qui l’apparentent aux autres du même genre que ceux qui l’en distinguent. Nul doute que ces derniers l’enrichiront davantage que les premiers. C’est donc bien la « substantifique moelle » de l’œuvre disséquée qui, dûment mémorisée, viendra ultérieurement nourrir les résultats fournis par l’IA.

La concurrence déloyale permet de sanctionner des manquements à une règle professionnelle ayant généré un transfert de clientèle – on songe ici à la déontologie journalistique et à la véracité de l’information divulguée -, la pratique de prix anormalement bas visant à déstabiliser des concurrents, et, principalement, le parasitisme défini comme le fait de copier, à titre lucratif et de façon injustifiée, une valeur économique d’autrui, fruit d’un savoir-faire, d’un travail intellectuel et d’investissements. Le parasitisme est d’autant plus fautif qu’il est le fait d’un concurrent du parasité.

A ce titre, la Cour d’appel de Paris a d’ores et déjà jugé en octobre 2019 qu’en s’appropriant les photographies d’un photographe professionnel pour les reproduire à des fins commerciales sur son site internet, une société spécialisée dans le marché de l’art a indument profité du travail et des investissements de ce photographe. Cette société a été condamnée pour parasitisme.

N’en-est-il pas de même lorsqu’une IA extrait la substance des photographies qu’elle analyse pour enrichir sa mémoire et générer des images similaires ? C’est bien tout ou partie de la valeur économique des photographies gracieusement disséquées qui profite ici à l’IA.

En conclusion :

Ainsi, le droit de fouille pourrait bien se voir malmené tant au titre du préjudice injustifié causé aux intérêts légitime du titulaire des droits, un tel préjudice étant de nature à invalider des exceptions légales aux droits d’auteur, que sur le terrain de l’interdiction des pratiques déloyales et parasitaires.

Pour conclure ces réflexions, on ajoutera que le droit de fouille ne vise que l’amont du processus mis en œuvre par l’IA mais non l’aval. Qui a lu ou compris qu’il autorisait le « fouilleur » à concurrencer le « fouillé » ?

  1. Conseil supérieur de la propriété littéraire et artistique