top of page
  • Bluesky--Streamline-Simple-Icons(1)
  • LinkedIn
  • Twitter
Rechercher

L’utilisation équitable et l’IA : plaidoyer pour une large exception de fouille de textes et de données

1re partie de la série de la CIPPIC pour la Semaine de l’utilisation équitable


En 2017, le gouvernement canadien a fait une priorité d’établir le Canada comme chef de file mondial en intelligence artificielle (IA), en élaborant une stratégie nationale soutenue par des investissements importants dans la recherche et la commercialisation de l’IA. Cette stratégie, la première du genre, visait à transformer le solide bilan du Canada en recherche sur l’IA en un moteur de l’économie canadienne en devenant un leader mondial en recherche, innovation et politique en matière d’IA.


La stratégie a favorisé le développement d’un solide pôle de recherche en IA au Canada. Toutefois, le succès initial de la stratégie canadienne en matière d’IA ne s’est pas traduit par le succès escompté de devenir un leader incontesté en IA. Au contraire, le Canada a pris du retard sur d’autres pays qui ont depuis adopté des stratégies agressives en matière d’IA. De plus, les efforts du gouvernement fédéral sont minés par l’état actuel du droit d’auteur canadien, qui favorise une incertitude réglementaire accrue à un moment où il existe une forte poussée mondiale pour davantage d’investissements et d’opportunités dans le secteur.


L’une des causes de l’incertitude juridique est la responsabilité en matière de droit d’auteur. La question de savoir si la fouille de données équivaut à une violation du droit d’auteur demeure ouverte au Canada. Les systèmes d’IA apprennent en analysant de grands ensembles de données qui contiennent des œuvres créées par des humains, telles que du texte, de l’audio ou des images. La dépendance à la disponibilité des données pour l’entraînement crée un risque de responsabilité pour violation du droit d’auteur pour les développeurs et les entreprises d’IA.


Des exceptions au droit d’auteur pour la fouille de données ont été établies dans d’autres pays pour répondre à cette incertitude. Des pays comme les États-Unis et Israël ont émis des directives étendant leurs dispositions d’usage loyal (fair use) pour inclure les activités de fouille de textes et de données. De même, des pays comme le Japon, l’Union européenne, le Royaume-Uni et Singapour ont créé des exceptions spécifiques pour répondre à cette incertitude. Par exemple, l’approche adoptée par l’UE à l’article 4 de sa directive sur le marché unique numérique exige que les États membres adoptent des exceptions de fouille de textes et de données permettant « les reproductions et extractions d’œuvres et autres objets protégés accessibles de manière licite aux fins de la fouille de textes et de données ». De même, l’approche adoptée par Singapour exempte spécifiquement la fouille de textes et de données dans sa Loi sur le droit d’auteur en exemptant les copies d’œuvres lorsqu’une « copie est faite aux fins de l’analyse informatique de données; ou de la préparation de l’œuvre ou de l’enregistrement pour l’analyse informatique de données ».


Sans une exception similaire au Canada, les développeurs pourraient hésiter à assumer ce risque de responsabilité pour violation du droit d’auteur. L’absence d’exceptions risque d’avoir un effet dissuasif sur l’innovation. L’incertitude réglementaire actuelle au Canada crée d’autres effets en cascade qui affectent l’adoption de l’IA. Premièrement, sans la disponibilité de données complètes, les algorithmes d’IA sont plus susceptibles de produire des résultats introduisant des biais et des problèmes de discrimination, car les données d’entraînement disponibles sont limitées. Deuxièmement, l’incertitude réglementaire canadienne crée des conditions favorables pour les grandes entreprises technologiques ayant accès à de plus grands ensembles de données ou celles qui peuvent se permettre d’assumer le risque de violation. Ces conditions ont un impact négatif sur la viabilité des petits concurrents et des jeunes pousses en IA.


Le cadre actuel de l’utilisation équitable offre une défense possible à une mesure d’application pour certaines utilisations d’œuvres protégées par des entreprises d’IA sans permission. Si l’on examine le régime actuel, l’approche canadienne de l’utilisation équitable est relativement étroite : l’utilisation en cause (1) doit être aux fins de l’un des buts admissibles énoncés à l’article 29 de la Loi sur le droit d’auteur – l’article inclut notamment des exceptions pour la recherche, l’étude privée et l’éducation; et (2) doit être équitable, ce qui est une détermination factuelle qui examine le but, le caractère, la nature, l’ampleur et l’effet de l’utilisation, ainsi que les solutions de rechange à celle-ci. Puisque la défense d’utilisation équitable est une défense à une mesure d’application, et non une règle refuge (safe harbour), personne ne sait avec certitude si une activité est exempte de risque de responsabilité jusqu’à ce qu’un tribunal en décide ainsi. Bien que le cadre de l’utilisation équitable puisse permettre une défense possible dans une mesure d’application, l’incertitude demeure car les tribunaux canadiens n’ont pas encore appliqué cette défense dans le contexte de l’entraînement de systèmes d’IA.


Pour remédier à cette incertitude, un cadre de droit d’auteur permettant la fouille de textes et de données à des fins commerciales est une étape importante. La création d’une exception de fouille de textes et de données créerait une défense de type règle refuge, établissant les conditions dans lesquelles on est libre de tout risque de violation et assurant plus de certitude. Plus tôt cette année, dans sa soumission pour la Consultation sur le droit d’auteur à l’ère de l’intelligence artificielle générative de 2024, la CIPPIC a recommandé que lorsque la fouille de textes et de données est appliquée à du matériel protégé pour bâtir un ensemble de données d’entraînement pour l’IA générative, il ne devrait y avoir aucune réclamation pour violation du droit d’auteur si les données d’entraînement ne sont pas reproduites dans l’algorithme génératif résultant. Cette approche est fondée sur l’objectif d’équilibre de la protection du droit d’auteur. Comme l’a observé la Cour suprême du Canada, une violation peut survenir lorsqu’une partie importante de l’œuvre est reproduite, l’évaluation étant de savoir si le défendeur a reproduit une partie importante de l’œuvre, ce qui inclut l’expression du talent et du jugement de l’auteur. L’apprentissage automatique ne reproduit pas une partie importante de l’œuvre – il utilise plutôt la fouille de textes et de données à des fins informatives. L’établissement d’une exception de fouille de textes et de données pour la recherche et les utilisations commerciales s’aligne donc sur l’approche plus large du Canada en matière de violation du droit d’auteur.


Cette opinion a été rédigée par Jordan Geist, candidat au J.D. de troisième année à l’Université d’Ottawa. Les opinions exprimées sont celles de l’auteur et ne reflètent pas nécessairement la position de politique de la CIPPIC.

 
 
bottom of page