Update 2017-09-12-big_data_pour_les_nuls.md

This commit is contained in:
yaminasaheb 2017-09-03 20:03:05 +02:00 committed by GitHub
parent 63ea2db643
commit c2b23b8774

View file

@ -52,14 +52,14 @@ Soyez conscient des données que vous partagez (et avec qui) :
- Les moteurs de recherche (Google, Bing) gardent lhistorique des recherches et les associent à des utilisateurs (à travers leurs données de navigation ou simplement de leur connexion à leurs comptes utilisateur) : information précieuse pour déterminer vos centres dintérêt pour du marketing ou du profiling, ainsi que pour améliorer votre expérience client et fluidifier lutilisation de leurs services. Lorsque vous partagez vos photos, vous rendez accessible sans vous en douter un certain nombre dinformations :
-Pour apprendre à effectuer une tâche dintelligence artificielle, une machine a besoin dexemples. Dans le cas dalgorithmes de reconnaissance faciale, elle a besoin davoir plusieurs photos du visage dune même personne pour arriver à définir les caractéristiques qui lui permettront de lidentifier. Ainsi, lorsque vous taguez quelquun sur une photo dans un réseau social, vous êtes en fait en train de créer ces exemples (labelliser des données) et rendez possible pour lentreprise hébergeant ce contenu de faire tourner des algorithmes de reconnaissance faciale sur cette personne.
- Pour apprendre à effectuer une tâche dintelligence artificielle, une machine a besoin dexemples. Dans le cas dalgorithmes de reconnaissance faciale, elle a besoin davoir plusieurs photos du visage dune même personne pour arriver à définir les caractéristiques qui lui permettront de lidentifier. Ainsi, lorsque vous taguez quelquun sur une photo dans un réseau social, vous êtes en fait en train de créer ces exemples (labelliser des données) et rendez possible pour lentreprise hébergeant ce contenu de faire tourner des algorithmes de reconnaissance faciale sur cette personne.
-Extraire de linformation depuis des photos est facile : un réseau de neurones peut aisément reconnaître certains objets (au sens large de la vision par ordinateur) : présence de chats, chiens, humains, arbres, tables… car il existe des bases de données fournies avec des exemples de ce genre dobjets. Mais des informations moins triviales peuvent être déduites par des organismes disposants de bases dexemples plus fournies et spécifiques :
- Extraire de linformation depuis des photos est facile : un réseau de neurones peut aisément reconnaître certains objets (au sens large de la vision par ordinateur) : présence de chats, chiens, humains, arbres, tables… car il existe des bases de données fournies avec des exemples de ce genre dobjets. Mais des informations moins triviales peuvent être déduites par des organismes disposants de bases dexemples plus fournies et spécifiques :
-Détection de lieux (permet de traquer les déplacements).
 -Détection de marques (à travers les logos) ou de produits consommés (permet de connaître les habitudes de consommation).
 -Informations sur une personne genre, âge, ethnie… (permet de cibler pour un marketing personnalisé).
 -Changements dans la vie dune personne (mariage, grossesse, enfants, accident…).
- Détection de lieux (permet de traquer les déplacements).
 - Détection de marques (à travers les logos) ou de produits consommés (permet de connaître les habitudes de consommation).
 - Informations sur une personne genre, âge, ethnie… (permet de cibler pour un marketing personnalisé).
 - Changements dans la vie dune personne (mariage, grossesse, enfants, accident…).
Il est donc important de vérifier les droits daccès des photos ou des posts sur les réseaux sociaux et de choisir le genre de photos que lon souhaite partager.
@ -69,8 +69,8 @@ Il est donc important de vérifier les droits daccès des photos ou des posts
- Des informations sur vos relations peuvent être déduites par des réseaux sociaux. Les données Facebook pourraient servir par exemple à détecter lorsquun couple est en train de se former à partir du volume des échanges par messagerie ou des posts sur le mur de lautre. <https://www.facebook.com/notes/facebook-data-science/the-formation-of-love/10152064609253859>
- Une précaution très particulière doit être prise au sujet des données personnelles biométriques et de santé :
-Données biométriques (login à partir des empreintes digitales) : possible de hacker lidentité dune personne ; il est facile de changer de mot de passe mais pas de changer dempreinte digitale.
-Le partage de données médicales par Internet (ex. : résultats danalyses biologiques) doit saccompagner dune vigilance accrue au sujet de la sécurité des serveurs (données sensibles) risque de vol de données.
- Données biométriques (login à partir des empreintes digitales) : possible de hacker lidentité dune personne ; il est facile de changer de mot de passe mais pas de changer dempreinte digitale.
- Le partage de données médicales par Internet (ex. : résultats danalyses biologiques) doit saccompagner dune vigilance accrue au sujet de la sécurité des serveurs (données sensibles) risque de vol de données.