Aujourd’hui, nous avons eu le plaisir d’intervenir sur le plateau de La Tête au carré sur France Inter, pour parler de big data prédictif. Réécouter le podcast.
Qui sommes-nous ?
- David Bessis (@davidbessis), fondateur de tinyclues, une entreprise de marketing prédictif ;
- Gaël Varoquaux (@gaelvaroquaux), chercheur en apprentissage à l’Inria Saclay et l’un des responsables du projet scikit-learn, une bibliothèque géniale de machine learning en Python dont la documentation est claire et truffée d’exemples ;
- et moi (@jjvie), doctorant en 2e année à l’université Paris-Saclay sur les tests adaptatifs.
Trois points sur lesquels nous aimerions insister
-
Le big data est partout (pour de vrai ; votre portable qui enregistre votre déplacement1, votre passe Navigo qui enregistre vos déplacements2, la reconnaissance vocale, les codes anti-robots que vous remplissez qui améliorent les outils de reconnaissance de caractères). Autre exemple : EDF optimise l’alimentation d’énergie en prédisant la consommation des foyers.
-
Le big data vous rend service, par exemple lorsqu’on recherche un appartement sur Internet, on est bien content d’avoir des suggestions sur le côté en accord avec notre budget ; et lorsqu’on ne sait pas quoi voir dans l’immense masse de films, on est bien content d’avoir des recommandations.
-
David, Gaël et moi sommes d’accord dans l’ensemble3. Il est important d’analyser les données pour faire émerger de l’intelligence, il est important de protéger les utilisateurs en les informant de leur utilisation.
Quelques ressources supplémentaires
-
Une excellente lecture sur les méfaits du solutionnisme (penser qu’avec des algorithmes on peut sauver le monde ; je suis moi-même atteint) : Pour tout résoudre, cliquez ici4 d’Evgeny Morozov.
-
Ils ont épluché les conditions d’utilisation pour vous et évaluent les services qui recueillent des données : Terms of Service; Didn’t Read (on peut y apprendre par exemple que sur YouTube, les vidéos supprimées ne sont pas vraiment supprimées et ce site m’a permis de découvrir DuckDuckGo, un moteur de recherche sans pistage).
-
L’expérience menée par Facebook sur 689003 utilisateurs-cobayes en juin dernier. Certes, ils ont manipulé votre fil d’actualités pour savoir si des messages heureux ou malheureux pouvaient influer sur votre humeur, mais c’est ce qu’ils font en permanence (je veux dire, le fil d’actualités est toujours gouverné par un algorithme, l’expérience ne changeait rien). Avant, les conditions d’utilisation stipulaient que les utilisateurs consentaient à ce que leurs données fassent l’objet d’analyses, elles sont maintenant plus précises :
Nous menons des enquêtes et des études, testons des fonctionnalités en phase de développement et analysons les informations à notre disposition afin d’évaluer et améliorer nos produits et services, de mettre au point de nouveaux produits et de nouvelles fonctionnalités et de conduire des activités de vérification et de dépannage.
Pour toute question, n’hésitez pas à me contacter sur Twitter ou par mail : vie@jill-jenn.net