Big Data : pour la petite histoire

Le magasine Forbes a publié en septembre dernier un article (en anglais) retraçant les grandes dates de l’avènement des Big Data. Gil Press, l’auteur du papier, fait remonter l’aventure à l’année 1944, lorsque le bibliothéquaire universitaire Fremont Rider fournit la première estimation de croissance de flux des bibliothèques universitaires nord-américaines qui doublent de taille tous les 16 ans, proposant des projections jusqu’en… 2040 !

Entre les années 60 et les années 80, vient l’éclosion de travaux théoriques sur les lois exponentielles de croissance de l’information scientifique, sur les recensement de flux d’information et sur les découvertes en ingénierie permettant la compression des données de stockage informatique (article de Ithiel de Sola Pool dans Science en 1983, abstract en anglais seul disponible sans abonnement).

En octobre 1997, il semble que l’on enregistre pour la première fois les termes Big Data, dans un article de Michael Cox et David Ellsworth, deux chercheurs de la NASA, pdf disponible en anglais, qui explique clairement que de telles masses de données nécessitent des méthodes d’analyse adaptées, et en particulier un recours à des techniques de visualisation spécifiques pour permettre de se les approprier.

En octobre 1999, une conférence de IEEE s’est déroulée entièrement sur le thème de la visualisation des données (Bryson et coll. extrait seul disponible, en anglais).

En novembre 2000, Francis Diebold, professeur d’économie de University of Pennsylvania a donné une conférence sur le recours aux Big Data par des modèles dynamiques de prévisions macroéconomiques (pdf en ligne, en anglais).

Il faut attendre février 2001 pour voir apparaître la fameuse définition des Big Data par les trois V (pour Volume, Vélocité, et Variété), par Doug Laney de Meta Group, pdf en ligne en anglais.

On saute rapidement ensuite à 2007 où sont publiées par Gantz J, Reinsel D et coll. (pdf, en anglais) des prévisions (jusqu’en 2010) des volumes générés par les Big Data, avec la notion que l’information produite double désormais tous les dix-huit mois. La même équipe publiera des mises-à-jour en 2010 et 2012 montrant que les prévisions ont été largement dépassées.

En septembre 2008, les Big Data acquièrent leurs lettres de noblesse, puisqu’elles font la Une d’un numéro spécial qui leur est dédié dans la revue britannique Nature (résumés seuls disponibles sans abonnement). L’emballement qui suit est à la mesure des trois V des Big Data, considérés par certains analystes comme “la plus grande innovation en informatique de la décennie” dans les domaines du commerce, de la science et de la société, par Bryant R et coll., décembre 2008.

En février 2010, c’est le monde des affaires qui s’empare du sujet, avec la Une d’un numéro spécial de la revue (britannique) The Economist, titrant “The data deluge.

Un an plus tard, en février 2011, la recherche dans les télécommunication, publie à son tour, dans la revue américaine Science, un article de Hilbert M et Lopez P retraçant l’inversion des modalités de stockage de données devenues en majorité digitales dès l’année 2002 (elles étaient analogiques jusque là). Puis le monde du conseil aux entreprises s’intéresse au sujet, avec la publication par Manyika J et coll. du  McKinsey Global Institute d’un article portant sur les Big Data : nouvelle frontière de l’innovation, la compétition et la productivité.

En mai 2012, les sciences humaines et sociales (deux sociologues chercheurs chez Microsoft, à Cambridge, Massachussets, USA, extrait d’article seul disponible, en anglais) se penchent à leur tour sur l’objet. Danah Boyd et Kate Crawford définissent les Big Data comme une interaction culturelle, technologique et scientifique. Ils évoquent l’un des mythes qui sous-tend l’usage et peut-être l’engouement pour les Big Data, notamment “la croyance répandue que les grandes bases de données offrent une forme d’intelligence et d’accès à la connaissance supérieure qui permet de générer des hypothèses auxquelles on n’aurait simplement pas pensé, avec une aura de vérité, d’objectivité et de précision“.

Aujourd’hui, la page de la recherche sur les Big Data dans le domaine de la santé publique et de la santé globale reste largement à écrire, mais nul ne doute que les Big Data auront un impact majeur sur ces aspects et que l’aventure a déjà commencé dans plusieurs domaines comme nous avons pu le voir au cours de billets précédents.

Centre Virchow Wellermé

URL: http://virchowvillerme.eu/
Via un article de Antoine Flahault, publié le 29 décembre 2013

©© a-brest, article sous licence creative common info