Le problème avec le data scientist

Au début de ma carrière j’ai rencontré un directeur financier qui avait montré que le module de base d’un progiciel n’était pas rentable. Oui, mais que pouvait faire le progiciel sans son module de base ? 
Récemment nous avons vu apparaître un nouvel être : le data scientist. Eh bien, il est affecté du même mal que mon directeur financier. C’est un virtuose du chiffre, mais il n’en comprend pas le sens. Voilà un obstacle massif au développement de « big data ».

Le numérique prédit le colistier de Mme Clinton

Hier je lisais un article de The Atlantic disant que la page wikipedia de Tim Kaine avait été modifiée un grand nombre de fois. N’était-ce pas le signe qu’il allait être choisi par Mme Clinton comme vice-président ? Ce matin, je lisais que wikipedia avait vu juste.
Les visionnaires louent la puissance de Big Data et sa capacité infinie de prévision. Les dieux ont-ils enfin envoyé le signe attendu ?

Règles, intuition et smart data

Il y a quelques temps j’ai utilisé le logiciel MondoBrain pour analyser des données liées au naufrage du Titanic. MondoBrain est un logiciel de « smart data ». L’idée du big data est de décider à votre place. Il vous dit ce que vous devez faire. Il est tourné vers l’avenir. Le smart data, au contraire, analyse le passé. Il y cherche des règles. Typiquement : telle production a marché avec tels et tels réglages, sous-traitants… 
Il y a une autre différence, majeure, avec big data. C’est ce que montre le Titanic. Immédiatement, on voit que les riches s’en sont mieux tirés que les pauvres. Puis les femmes que les hommes. Puis, paradoxalement, que les hommes riches ont été dans la moyenne des morts. Du coup, je me suis demandé qui étaient les hommes pauvres qui avaient survécu, et les riches qui étaient morts. Pour les uns je trouve une population d’enfants accompagnés d’une personne. Pour les autres, des célibataires. J’en ai déduit une règle : ce qui a présidé à l’évacuation du Titanic a été un « esprit chevaleresque ». Je viens de découvrir récemment que cela a été explicitement le cas. C’était comme cela que la marine fonctionnait en ces temps là.
Autrement dit, les règles de MondoBrain ne sont pas une fin en soi. Elles doivent provoquer une intuition. Et cette intuition consiste à apercevoir, en quelque sorte, une règle ultime. Où plutôt, un système derrière des éléments apparemment incohérents.

Le changement comme big bang

Le changement est un big bang, dit ce blog. C’est à dire qu’il est imprévisible. Et qu’il donne un résultat imprévisible. C’est une nouvelle naissance, écrivait Hannah Arendt. Le monde est un système qui obéit à un principe. Le changement change le principe et le système. De la naissance, par exemple, on passe au mérite. 
Que peut-on faire dans ces conditions ? Repérer aussi vite que possible que les lois du système ont changé. Et s’adapter en fonction. 
Si ces prémices sont justes, je vois trois conséquences :
  • Notre esprit est victime du système, qui l’influence, Big Data pourrait être un moyen d’éviter les biais de pensée. 
  • Tant que l’on n’a pas repéré le changement, c’est le chaos. Peut-il se faire qu’un jour nous devenions incapables de percevoir ses règles ? 
  • Et si nous rendions le monde de plus en plus complexe, et donc de moins en moins compréhensible ?

Big Data = Big frustration

Il semble qu’il y ait une énorme attente déçuevis-à-vis du Big Data. Big Data = frustration.

1) Algorithmes impossibles à comprendre, masse de données, data scientists. Pour le moment, Big Data c’est une complexité qui ne donne rien d’utile.
2) La logique actuelle du marché est le test, pas l’engagement massif que prônent les vendeurs de solutions et les gourous du management. Et le test ne donne pas grand-chose. (Voir, par exemple, ici.)  
Or, ce que l’on attend de Big Data, c’est la résolution des problèmes critiques de l’entreprise. Le fait 1) qu’elle n’arrive pas à se transformer (performance) ; 2) pire, que ses processus clés, « ordinaires » ont de plus en plus de mal à fonctionner correctement. (Ce qui marchait ne marche plus.) Frustration x 2.
Que faudrait-il pour sauver Big Data ? « Turn data into insights » disent les Anglo-saxons. Il faudrait des algorithmes qui sortent des idées.

Big data fait peur

« seuls 15% des Français perçoivent le « Big Data » comme une source d’opportunité pour les consommateurs dont les besoins seront mieux connus, alors que 81% estiment qu’ils sera à l’origine de risques de « fichage » de ces mêmes consommateurs. » (Article.)
Faillite du marketing des grandes entreprises du numérique ? Idem pour l’Internet des objets qui susciterait la suspicion plus que l’intérêt. Contrairement aux innovations d’après guerre, celles que génère dorénavant Internet font peur.

Publicité intelligente

Il y a quelques semaines je cherchais une image de meuble anglais. Depuis je suis poursuivi par des publicités pour une marque de meubles anglais. Et cela, partout de Facebook (et il y a des tas d’endroits où Facebook affiche de la publicité) jusqu’au moindre site que je consulte. 
J’admire le talent des commerciaux qui sont parvenus à vendre une technologie qui ne marche pas, à des dirigeants qui se disent gestionnaires !

Smart data et big data

Un spécialiste du big data faisait la distinction suivante :
  • Big data = énorme volume de données / boîte noire / recherche en aveugle
  • Smart data = aide à la décision / produit des explications / correspond à des problèmes dont les volumes de données sont plus faibles que pour big data, mais peut venir en complément.
Le smart data ne permet pas uniquement de trouver des explications d’un phénomène (quels sont les facteurs qui provoquent une crise d’asthme chez telle personne ?), il y a aussi une dimension pragmatique d’aide à la décision (pour des raisons pratiques, je ne peux pas être totalement à l’idéal, par exemple cela me forcerait à déménager ou arrêter mes études, quel est le risque de s’écarter de l’idéal ?)

Big data : tremblez, Google arrive…

Curiosité. Je regarde ce que Google me dit des sources du trafic de mon blog. Première source : http://myhealthcare.com/blog/stop-forced-vaccinations/, un article américain qui refuse la vaccination obligatoire, et qui ne fait, bien entendu, aucune référence à mon blog. Deuxième source : un article du wikipedia anglais concernant « Jeovah ». 
Est-ce ainsi que Google nous démontre sa capacité exceptionnelle à analyser l’information ? Si c’est le cas, les assureurs peuvent dormir sur leurs deux oreilles… 

Amazon ou les effets pervers de Big Data ?

J’achète de moins en moins chez Amazon. Bizarre. Pourquoi ? En effet, c’était devenu une habitude. Cela a commencé à une époque où Amazon n’était qu’aux USA. Mes lectures correspondent à une recherche. Et Amazon m’a proposé des travaux que je n’aurais pas trouvés par moi-même. (Vous aviez entendu parler de Franck Knight, vous ?) Une fois le livre identifié, ce qui me faisait passer commande, c’était les commentaires. Pas ceux des clients, quoi qu’ils soient très bons aux USA, mais ceux des universitaires à qui les éditeurs américains demandent un avis. Et la quatrième de couv, généralement excellente. 
Il y a deux raisons pour lesquelles mon comportement d’achat a changé, je crois.
  1. J’ai redécouvert une librairie du quartier latin qui fait une sélection excellente de livres de sciences humaines. Ma R et D, c’est elle.
  2. Les recommandations d’Amazon ne fonctionnent plus. Peut-être leur ai-je fait perdre la boule en achetant pour d’autres que moi ? (Des cadeaux à des enfants ou a des amis ?) Mais, même quand il ne fait pas un hors sujet, Amazon tend à me proposer de l’ancien (à un moment : les livres que j’ai écrits !), alors que je cherche ce dont je n’ai pas idée ! Et si c’était un exemple des effets pervers de Big Data ? Amazon a maintenant tellement de données qu’il est incapable d’en déduire quoi que ce soit ? Il y a plus de bruit que de signal ?  

(Ce qui demeure inégalé chez Amazon, c’est que l’on y trouve des livres épuisés, ou peu vendus.)