Data science

Les mots de la #data

 
Data scientist (n.): person who is better at statistics than any software engineer and better at software engineering than any statistician.
— Josh Wills
20160809_134024.jpg
 
 

#data

Ensemble des problématiques techniques qui tournent autour de la valorisation des données.


Algorithmes

« Façon de décrire dans ses moindres détails comment procéder pour faire quelque chose » propose Gérard Berry, du Collège de France. Donald Knuth en donne une définition plus formelle ici.
C'est une suite d'opérations logiques, d'instructions élémentaires permettant de résoudre un problème. La base de tout programme informatique ou des processus de traitements de données.


Intelligence artificielle

En reprenant la formulation de Marvin Minsky, l'intelligence artificielle forte est « la construction de programmes informatiques [réalisant] des tâches qui sont, pour l’instant, accomplies de façon plus satisfaisante par des êtres humains ».  Ces taches requièrent « des processus mentaux de haut niveau » et généraux comme, par exemple, « l’apprentissage perceptuel, l’organisation de la mémoire et le raisonnement critique » (Wikipedia).

L'intelligence artificielle se décompose schématiquement en deux catégories. D'un coté, l'IA forte, graal des sciences cognitives et l'IA faible.


IA forte

Le non-spécialiste se réfère à elle, habituellement, quand on parle d'IA. Un tel programme n'existe pas ; de plus, les experts ne sont pas tous certains qu'une telle performance soit un jour accessible.

Les incarnations typiques de l'IA forte dans la science-fiction sont H.A.L. 9000 dans 2001, l'Odyssée de l'espace. On peut aussi citer Ship dans la trilogie Pandora de Herber/Ransom, les nombreuses IA de la Culture de Iain M Banks ou encore les robots d'Asimov.


IA faible

L'IA faible est, elle, constituée d'algorithmes moins généraux, moins intelligents au sens classique du terme. Souvent très spécialisés, ils sont programmés pour accomplir des tâches précises. Ils sont totalement idiots en dehors de ce périmètre, souvent très limité. S'ils savent apprendre à reconnaître des chats sur des photos, ils seront incapables d'y reconnaître des lamas ou de conduire une voiture. S'ils peuvent avoir l'air intelligents, au sens classique, ils sont au mieux efficaces et rapides.

Pour le dire avec les mots de tous les jours, cette IA n'est qu'une cristallisation de l'intelligence injectée par les développeurs dans leurs programmes, exploitant des modèles de connaissance alimentés par de grosses bases de données.

 

Les programmes les plus proches de cette classe d'algorithmes sont, par exemple, AlphaGo (Google) ou Watson (IBM). Cette affirmation est toutefois très critiquable. 


Machine learning

Apprentissage automatique, en francais.

Les algorithmes de machine learning sont des programmes complexes qui s'appuient sur des concepts mathématiques souvent ardus. Ils permettent d'extraire de la connaissance à partir d’un ensemble de données ou de règles métiers, avec une aide humaine dans le cadre de l'apprentissage supervisé, ou sans être guidé dans le cas non supervisé.

Une troisième classe d'apprentissage existe : celle par renforcement. L'algorithme va apprendre en fonction des interactions positives ou négatives avec son environnement.
 


Artisan de la transformation numérique qui rend possible la transition vers le pilotage par la données des organisations. Véritable cheville ouvrière de tous les processus de valorisation de données, il est en charge de la traduction algorithmique des problématiques métiers. Ses compétences en programmation et analyse de données lui permet de traiter tous les types de datasets.

Difficiles à recruter, car rares, les data scientist sont généralement docteurs en sciences dures (mathématiques, physique, informatique, voire biologie) et culturellement plus proches des profils techniques que des profils opérationnels des entreprises.

Data scientist


Pilotage par la donnée, à mettre à toutes les sauces. 
Aide à la décision sur-vitaminée, rendue possible par une objectivation des process.

data-driven *


Expert auto-proclamé en intelligence artificielle, souvent très disert sur un futur dont nous ne savons rien. Passe souvent plus de temps sur les ondes ou en conférence qu'à acquérir une réelle compétence sur les domaines dont ils parlent. Plus proche de l'écrivain que du scientifique.

Techno-prophète


Tendance très 2016-17 à coller de l'intelligence artificielle sur tous les projets innovants - ou qui auraient pu innover.

Révélateur de la confiscation de l'innovation numérique par des sujets #data.

AI-washing


Technologie à la base de Bitcoin.

Type de base de données distribuée sans autorité centrale basée sur des concepts de cryptographie. Victime d'un engouement démesuré, blockchain est à la base de beaucoup de startups FinTech ou LegalTech. Cette technologie est complexe.

Blockchain


Il manque des entrées ?  Dites nous lesquelles !


 
I keep saying the sexy job in the next ten years will be statisticians. [...] So the complimentary scarce factor is the ability to understand that data and extract value from it.
— Hal Varian, chief economist (Google)
e1ebefc6c330e066c0d0b03f8eae2d12.jpg