Vol d’algorithme : un jeu d’enfant ?

Alors que les entreprises investissent dans la conception d’algorithmes d’intelligence artificielle ultra sophistiqués, de récentes recherches démontrent que la plupart s’avèrent faciles à reproduire. Si en théorie les données qu’ils contiennent sont accessibles, en pratique, la complexité de l’algorithme et le nombre d’API sur lequel il s’appuie forment une protection.

Le simple accès à une API permettrait de copier un algorithme avec une précision de l’ordre 99 %. D’après Thomas Ristenpart, co-auteur de l’étude sur le vol d’algorithme et professeur à Cornell Tech, dérober un algorithme serait donc à la portée de n’importe quel lycéen. Plus inquiétant encore, après avoir copié des algorithmes, les chercheurs sont parvenus à en extraire des données propriétaires dont ceux-ci se sont nourris. Conséquence, pour peu que l’algorithme ait été conçu pour traiter des données utilisateurs, cette mine d’informations peut tomber elle aussi entre les mains des hackers.

 

Toutefois à en juger par les dizaines de milliers de données nécessaires pour reconstruire le modèle opérationnel d’un algorithme inconnu, l’exercice semble moins évident que ne le présente Thomas Ristenpart. Le principe étant d’envoyer des milliers de requêtes standards à l’API à travers l’algorithme pour reconstituer son schéma de réponses. Plus celui-ci est complexe, plus il est difficile à reproduire. On peut estimer qu’un algorithme simple (du type oui/non) pourra être démonté en 41 requêtes, alors qu’un algorithme plus sophistiqué (comme ceux utilisés dans la reconnaissance dactylographique) en requerra en moyenne 108 200. Le recours à l’API étant payant, au-delà de 100 000 requêtes, l’exercice peut s’avérer coûteux, sans compter que les prestataires de services peuvent émettre des signalements.

 

Lire l’article (en anglais)

 

En complément :

Un article en français sur le même thème,

Et un autre sur le rôle des hébergeurs dans la sécurité des données.