Article ━

LE SCRAPING : NOUVEL ELDORADO DES PLATEFORMES DE CONTENU

LE SCRAPING est particulièrement tentant. 

Qui n'a jamais rêvé de pouvoir avoir à disposition une quantité de données sans avoir à passer par la création de bases de données et son enrichissement naturel?

Tous ceux qui ont fait de l'acquisition le savent, un CTR (click trough rate / aka taux de conversion) de plus de 1% sur un shoot emailing est du rêve. 

Alors quand on peut avoir des milliers voire des millions de données en un moulinage de flux RSS c'est un peu la pomme dans l'Eden pour Eve. 

Cependant est ce que le scraping est conforme et éthique? Quelques points pour vous éclaircir

  1. il y a 2 scraping : le bon et le scraping malveillant  (la différence c'est que le bon scraping tu prends de la donnée.... je m'égare) 
  2. En soi créer un outil permettant de classer et extraire des donnéee n'a RIEN d'illégal
  3. Le problème est la qualité des données et ce que vous en faites.

OUI.

Encore une fois c'est l'action de l'internaute, le problème. autant analyser plusieurs offres de différents supports, aucun problème du moment que les données sont publiquement retrouvables et "à la vue de tous".

En revanche, extraire des données qui ne sont pas de bases là pour vous et donner par le site implique donc à "cracker" une base de données sans l'accord du propriétaire.

Par propriétaire j'entends par la 2 acteurs : 

  1. celui a qui appartient les données ( nous tous en somme)
  2. celui a qui appartient la base de données ( si on prend l'exemple de la creation de contenus, la facon dont les plateformes ont organisées leurs données et la gestions du traitement est protégé par la propriété intellectuelle)

Cette zone grise de sécurité à demi teinte est d'ailleurs une problématique que l'on retrouve dans les CGU (conditions générales d'utilisation) des plateformes 

voici d'ailleurs ce que disent celles du premier réseau de pro dans le monde aka Linkedin

  5.1. Sécurité

Nous surveillons les failles de sécurité et tentons de les empêcher. [...] Nous surveillons régulièrement nos systèmes afin de détecter d’éventuelles vulnérabilités et attaques. Néanmoins, cela ne nous permet pas de garantir la sécurité des informations que vous nous envoyez. Il n’y a aucune garantie que les données ne seront pas accessibles, divulguées, modifiées ou détruites par une violation de nos protections de gestion, techniques ou physiques  

Ce qui est interessant c'est qu'en matière de scraping le RGPD et la Loi Californienne concernant la protection de la vie privée des consommateurs sont plutôt d'accord à savoir : le consentement du consommateur en reste la clef de voute

En plus de cela c'est puni par la CNIL et le code pénal :  l'article 323-3 promet 150.000 euros d'amende et cinq de prison “le fait d'introduire frauduleusement des données dans un système de traitement automatisé, d'extraire, de détenir, de reproduire, de transmettre, de supprimer ou de modifier frauduleusement les données qu'il contient"

Si on résume : avoir un outil technique pour extraire des données : c'est bon, le faire sans consentement des acteurs c'est non.

MV