Des données brutes 2.0

L’administration Américaine a lancé data.gov : une plateforme d’accès aux données brutes de la santé, l’environnement, l’énergie, recherche, éducation. C’est très (trop?) ambitieux, voir utopique (mais il s’agit des USA) et d’ailleurs cet avis est partagé. Mais l’initiative est là et la plateforme déjà en ligne : il s’agit d’un projet hybride entre archives, recherche et accès. Ce projet, une récente discussion avec Got, croisée d’une journée avec les collègues du Centre de calcul de l’IN2P3-CNRS (qui héberge beaucoup de données issues des SHS), m’a conforté sur la notion et la nécessité de réservoirs de données brutes pour la recherche en SHS.

Ces réservoirs existent aujourd’hui dans les laboratoires de SHS, mais les données qu’ils contiennent sont souvent encore perçues comme des données « privés », réservées aux chercheurs locaux. Il est vrai qu’ils les ont collectées ou générées et ce travail n’est pas réellement reconnu dans le parcours d’un chercheur alors qu’il est fondamental. Ces données « pour la recherche » ont donc souvent tendance à « mourir » au fond de nos disques durs faut d’une infrastructure double : archivage des données (pour l’histoire), diffusion des données « brutes » et pas forcement éditorialisées dans une publication électronique académique mais mise à disposition de la communauté scientifique comportant un minimum d’appareil éditorial basé sur le Dublin Core Terms par exemple.  D’autant que souvent, ces données ont été collectées ou générées sur fonds publics (ne serait ce que le salaire du chercheur).

Bien sur, il faut pondérer ici le fait que certaines données sont sensibles de part leur nature et que la mise à disposition ou la diffusion est complexe et nécessite des barrières mobiles parfois très longues.

En france, il existe des initiatives intéressantes, encore trop peu soutenues financièrement, mais cela avance, cela se structure et des formations, pour les chercheurs et enseignants-chercheurs, voient le jour tel que l’université d’été de l’édition scientifique ouverte, qui aura lieu en septembre 2009, ou bien l’école thématique des centres nationaux de ressources numériques du CNRS dont le wiki est en ligne avec toutes les communications, les bibliographies numériques, en ligne, etc.

Alors, en ce mois de juillet, j’ai envie de dire : « ouvrez vos données à vos collègues et au monde » et j’espère aussi, soyons fou, un donnees.gouv.fr ?

Il est temps, dirons certains, que je parte en vacances.

Stéphane.

E-Recherche : outils en ligne pour les chercheurs

Développée pour les chercheurs, ReseachGATE est une plateforme web 2.0 offrant des services pour les chercheurs permettant principalement d’échanger, rechercher et diffuser de l’information scientifique et technique. La phrase clé est : ResearchGATE is for scientists built by scientists driven by the concept of Science 2.0. Cette plateforme est un peu un facebook pour scientifiques. Il est possible d’y déposer sa liste de publication (chargement au format EndNote uniquement et c’est un peu dommage), d’y créer des groupes de recherche et des colloques « virtuels ». La gestion du profil est calqué sur facebook, on peut se demander pourquoi, par exemple, ils demandent « Relationship Status » (marié, célibataire,…). Ce type de plateforme trouvera-t-elle un modèle économique de fonctionnement à long terme ? Serait-il judicieux que les institutions de recherche (CNRS, Universités, …) s’en dote ? Comment se fera l’appropriation de ce type de plateforme ? Ces questions, qui n’ont pas encore de réponse claire, seront au cœur des métiers d’accompagnement de la recherche dans les années qui viennent.

Bonne journée,

Stéphane.