sp.Blog

le blog de Stéphane Pouyllau

Étiquette : web 2.0

Des données brutes 2.0

L’administration Américaine a lancé data.gov : une plateforme d’accès aux données brutes de la santé, l’environnement, l’énergie, recherche, éducation. C’est très (trop?) ambitieux, voir utopique (mais il s’agit des USA) et d’ailleurs cet avis est partagé. Mais l’initiative est là et la plateforme déjà en ligne : il s’agit d’un projet hybride entre archives, recherche et accès. Ce projet, une récente discussion avec Got, croisée d’une journée avec les collègues du Centre de calcul de l’IN2P3-CNRS (qui héberge beaucoup de données issues des SHS), m’a conforté sur la notion et la nécessité de réservoirs de données brutes pour la recherche en SHS.

Ces réservoirs existent aujourd’hui dans les laboratoires de SHS, mais les données qu’ils contiennent sont souvent encore perçues comme des données « privés », réservées aux chercheurs locaux. Il est vrai qu’ils les ont collectées ou générées et ce travail n’est pas réellement reconnu dans le parcours d’un chercheur alors qu’il est fondamental. Ces données « pour la recherche » ont donc souvent tendance à « mourir » au fond de nos disques durs faut d’une infrastructure double : archivage des données (pour l’histoire), diffusion des données « brutes » et pas forcement éditorialisées dans une publication électronique académique mais mise à disposition de la communauté scientifique comportant un minimum d’appareil éditorial basé sur le Dublin Core Terms par exemple.  D’autant que souvent, ces données ont été collectées ou générées sur fonds publics (ne serait ce que le salaire du chercheur).

Bien sur, il faut pondérer ici le fait que certaines données sont sensibles de part leur nature et que la mise à disposition ou la diffusion est complexe et nécessite des barrières mobiles parfois très longues.

En france, il existe des initiatives intéressantes, encore trop peu soutenues financièrement, mais cela avance, cela se structure et des formations, pour les chercheurs et enseignants-chercheurs, voient le jour tel que l’université d’été de l’édition scientifique ouverte, qui aura lieu en septembre 2009, ou bien l’école thématique des centres nationaux de ressources numériques du CNRS dont le wiki est en ligne avec toutes les communications, les bibliographies numériques, en ligne, etc.

Alors, en ce mois de juillet, j’ai envie de dire : « ouvrez vos données à vos collègues et au monde » et j’espère aussi, soyons fou, un donnees.gouv.fr ?

Il est temps, dirons certains, que je parte en vacances.

Stéphane.

E-Recherche : outils en ligne pour les chercheurs

Développée pour les chercheurs, ReseachGATE est une plateforme web 2.0 offrant des services pour les chercheurs permettant principalement d’échanger, rechercher et diffuser de l’information scientifique et technique. La phrase clé est : ResearchGATE is for scientists built by scientists driven by the concept of Science 2.0. Cette plateforme est un peu un facebook pour scientifiques. Il est possible d’y déposer sa liste de publication (chargement au format EndNote uniquement et c’est un peu dommage), d’y créer des groupes de recherche et des colloques « virtuels ». La gestion du profil est calqué sur facebook, on peut se demander pourquoi, par exemple, ils demandent « Relationship Status » (marié, célibataire,…). Ce type de plateforme trouvera-t-elle un modèle économique de fonctionnement à long terme ? Serait-il judicieux que les institutions de recherche (CNRS, Universités, …) s’en dote ? Comment se fera l’appropriation de ce type de plateforme ? Ces questions, qui n’ont pas encore de réponse claire, seront au cœur des métiers d’accompagnement de la recherche dans les années qui viennent.

Bonne journée,

Stéphane.

scribd + youtube + flickr : la panoplie pour la diffusion de documents numériques ?

Bonsoir,

Si vous voulez diffuser des textes, des présentations, des posters, bref du « TEXT », vous avez la plateforme scribd. Ils utilisent FlashPaper 2 et une couche de web 2.0 ce qui en fait une plateforme dont les fonctionnalités sont proches de Flickr ou YouTube. Les lecteurs 2.0 de ce billet qui me connaissent l’auront compris : c’est super, mais attention à bien conserver ces sources dans son système OAIS au mieux (?), sinon dans son disque dur et/ou dans ses sauvegardes DVD. Mais revenons à notre affaire du jour :

j’ai fait un court extrait PDF (avec mon petit outil ICEberg et son module MonPDF) d’un texte de Christian OERSTED publié en 1820 : Experiments on the Effect of a Current of Electricity on the Magnetic Needle et que vous pouvez trouver sur le site @.Ampère et l’histoire de l’électricité. Depuis ICEberg, j’ai créé un fichier PDF textuel que je m’en vais déposer dans mon compte personnel sous scribd. Après chargement et conversion je me retrouve avec mon texte aux formats : Flash, Word, Texte (.txt), et même audio (.mp3). Comme nous marchons dans les pas du web 2.0 et des plateformes de publication de documents numériques, je peux mettre syndiquer le document via du XML (RSS) ou bien avec le système classique du « object » (non, ce n’est pas une capture d’écran, mais bien une fenêtre flash…) :

C’est tout simplement un texte en flash. Je dis « simplement » mais c’est presque classique aujourd’hui : vidéo, sons, animations, etc. Flash, ont le sait, avance à grands pas (vite une solution libre, mais je sais qu’à l’autre bout du monde, certains travaillent à une FlashPaper « libre », le rêve). Autre chose, un peu gadget – quoique – et pas bon en français, mais il est aussi possible de « faire » lire le texte par un synthétiseur vocal. Voici le résultat sur cet extrait :

Conclusion, avec toutes ces « sorties » (j’entends par « sorties » les possibilités de diversifier les supports de diffusion et de publication) nous allons pouvoir (et devoir!) nous concentrer sur la pérennisation des données numériques (non-encaptusées) dans des silos informatiques s’appuyant sur du logiciel libre. Dans mon exemple, j’ai bien une base de données qui contient le texte « pur » (elle pourrait être en XML…Oups) et j’en tire export afin de suivre l’évolution des supports (hier le PDF, demain le Flash). Un bémol à scribd cependant, le texte d’un PDF « ALTO » à la Google Books n’est pas conservé.

Bonne soirée,Stéphane.

flickrvision.com : une autre façon de voir les images ajoutées dans flickr en temps réel.

Bonjour,
Mon bloglines et SVM m’ont permis de découvrir un site très web 2.0 et plutôt sympa pour un jeudi férié : le Flickrvision (créé par David Troy). Le principe est très simple : les photos postées dans Flickr et qui sont géo-référencées par leurs auteurs apparaissent en temps réel sur une mappemonde fournie par Google Maps. Le voyage se fait par petits bons entre les pays. C’est très ludique je trouve. Il est ainsi possible de voir des naissances partout dans le monde : en effet, les papas postent la photo de leurs bébés et des mamans aux quatre coins de la planète…
Il serait bien d’avoir la possibilité de mettre un filtre ne faissant voir que certains postages dans Flickr (pays, villes, mots-clés).
Stéphane.

blogs sonores

Bonjour,

Les blogs audio se développent de plus en plus. Les archives sonores vont être de plus en plus importante. J’ai découvert ce matin le site TanaKan : il propose des sons, des cloches et de belles ambiances sonores.

Cela me fait penser que comme nous numérisons plein de documents (images, sons, cassettes, etc.) et que plein de documents ne sont plus que numériques ; il arrivera un jour ou les grands évèments français seront audibles au travers d’archives de familles : la seconde guerre mondiale par exemple. Il y a déjà des sons disponibles. Idée à creuser…

Stéphane.

le 2.0 dans les couches basses de nos languages

Bonjour,
Sur le site du W3C les recommendations 2.0 pour XSLT, Xpath, XML Query sont proposées. Le « 2.0 » arrive dans nos langages de transformation, il va falloir s’y mettre alors…
Stéphane.

Editer sur le web des sources pour la recherche.

Bonjour,
J’ai pris du retard dans la publication de mon blog. Je suis dans la création de silos de documents numériques (norme ISA(G) pour les catalogues, etc). Je vous conseille en tout cas de lire l’article d’un collègue de l’Ecole Nationale des Chartes sur l’édition électronique :

Gautier Poupeau, L’édition électronique change tout et rien. Dépasser les promesses de l’édition électronique, Le Médiéviste et l’ordinateur, 43, 2004, [En ligne] http://lemo.irht.cnrs.fr/43/43-03.htm et surtout de consulter le site sur METS : http://www.loc.gov/standards/mets/.

Fièrement propulsé par WordPress & Thème par Anders Norén