Article: Les données personnelles et le Captcha de Google

Le captcha est un outil permettant de garantir que les formulaires WEB afin de valider sont complétés par un humain et non par un robot. Les premiers captcha imposaient aux utilisateurs de recopier une phrase ou d’effectuer un calcul mathématique. Au fur et à mesure du temps les robots se sont améliorés et les captcha ont du, à leur tour, se complexifier, à tel point qu’ils en devenaient  parfois illisibles, même pour des humains.

Google a alors réagi et mis en place Recaptcha, un outil permettant de confirmer un acte humain et volontaire par le biais d’une simple case à cocher. Cette case est parfois couplée à la sélection d’images correspondant au thème demandé (ex : sélectionner les images présentant une devanture de magasin ou une pizza) ou à la réécriture d’un texte à partir d’une image (notamment des panneaux de lieux et directions).

Ce que Google ne nous dit pas, c’est que la société a toujours utilisé ce dispositif pour récupérer des informations :

  • Lorsque l’utilisateur doit recopier une phrase à partir d’une image, cette image provient généralement d’une photo prise par les Google Cars. Cela permet ainsi à Google de traduire textuellement un panneau mais également d’améliorer son algorithme de déchiffrage des panneaux.
  • Lors de la différenciation d’images, là encore, les images proviennent des Google Cars et permettent à Google d’affiner son algorithme en distinguant un magasin d’une maison ou d’une usine.

Nouvelle étape franchie par Google la semaine dernière, en mars 2017, avec la sortie d’une nouvelle version de son plugin. Ce plugin pourra ainsi automatiquement détecter si un utilisateur est un humain ou non, et pré-cocher d’office la case s’il reconnait un humain. Pour réaliser cette détection, Google utilise différentes données comme l’user agent du navigateur, les cookies, les mouvements de la souris, les clics, etc.

Ces solutions sont intéressantes pour faciliter la navigation des utilisateurs et garantir la bonne identification des robots.

Toutefois peut-on encore se considérer à ce titre anonyme sur la toile ? Si les données transmises à Google sont toute anonymes (mouvement de la souris, texte, user agent …), Google dispose déjà d’un grand nombre d’informations identifiantes sur les personnes (ex : l’adresse IP et le cookie du compte utilisateur Google par exemple) et pourrait aisément recouper toute ces données et ainsi de réaliser un profil utilisateur (formulaires complétés, méthodes et ordre utilisés pour les compléter, etc.). Facile donc pour Google de vous tracer, on le suppose, à des fins commerciales.


Et le plus beau, c’est que c’est l’utilisateur du plugin, et donc le responsable du site web, qui en est responsable. En effet, dans sa politique d’utilisation (“User Content Policy”) Google précise que les sites internetsutilisant ses technologies doivent “mettre en œuvre tous les efforts commercialement raisonnables pour annoncer, de manière claire et obtenir le consentement pour, la collecte, le partage et l’utilisation des données”.

Si vous utilisez le plugin ReCaptcha vous devez donc informer vos visiteurs de la collecte des données réalisée tout comme vous devez déjà le faire en cas d’utilisation de Google Analytics. Cette information devra passer par des bandeaux cookies ainsi que par une politique d’utilisation des cookies, disponible sur votre site.


accueil Blog Actu-CIL