<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sp.Blog &#187; web of data</title>
	<atom:link href="http://blog.stephanepouyllau.org/tag/web-of-data/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.stephanepouyllau.org</link>
	<description>le blog de Stéphane Pouyllau</description>
	<lastBuildDate>Sat, 07 Jan 2012 18:07:33 +0000</lastBuildDate>
	<language>fr</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>ISIDORE : valorisons les données des sciences humaines et sociales</title>
		<link>http://blog.stephanepouyllau.org/466</link>
		<comments>http://blog.stephanepouyllau.org/466#comments</comments>
		<pubDate>Mon, 04 Apr 2011 08:50:41 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[en général]]></category>
		<category><![CDATA[isidore]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[rdfa]]></category>
		<category><![CDATA[web of data]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=466</guid>
		<description><![CDATA[Aujourd&#8217;hui, j&#8217;ai le plaisir de participer au lancement officiel d&#8217;ISIDORE, la plateforme de recherche dans les données numériques de la recherche en sciences humaines et sociales. Réalisée par le très grand équipement Adonis du CNRS, ISIDORE est une production collective qui a associé depuis plus de deux ans des acteurs publics et des acteurs privés [...]]]></description>
			<content:encoded><![CDATA[<p>Aujourd&#8217;hui, j&#8217;ai le plaisir de participer au lancement officiel d&#8217;<a href="http://www.rechercheisidore.fr">ISIDORE</a>, la plateforme de recherche dans les données numériques de la recherche en sciences humaines et sociales. Réalisée par le <a href="http://www.tge-adonis.fr">très grand équipement Adonis</a> du CNRS, ISIDORE est une production collective qui a associé depuis plus de deux ans des acteurs publics et des acteurs privés au sein d&#8217;un marché de réalisation. Public tout d&#8217;abord : ISIDORE est un projet qui est la matérialisation concrète du projet fondateur du TGE Adonis : donner accès à de l&#8217;information, ouvrir des données, rendre visible la production des chercheurs et les données qu&#8217;ils utilisent pour travailler. Au sein du TGE Adonis un grand nombre de collègues ont travaillé pour ce projet, ils ont défini le projet, l&#8217;ont argumenté, le réalise aujourd&#8217;hui : c&#8217;est un travail d&#8217;équipe, long, complexe, parfois périlleux car il faut faire acte de pédagogie et de pragmatisme technique. Je vous invite à consulter ISIDORE, à le critiquer pour le faire évoluer car un outil tel que celui-ci doit évoluer en permanence. Je veux simplement souligner le très grand professionnalisme des collègues, partenaires industriels, qui ont partagé avec moi l&#8217;ensemble de la conception/réalisation de ce projet depuis mon arrivée au TGE en avril 2009 : Yannick, Benoit, Ariane, Nadine, Jean-Luc, puis Richard et Jean-Luc, Sophie, Shadia, L&#8217;équipe de la maitrise d&#8217;œuvre avec un immense respect pour <a href="http://www.ccsd.cnrs.fr/equipe.html">Laurent</a> tout d&#8217;abord, puis Daniel, Loic, Philippe, enfin tous les collègues du CNRS qui ont participé, soutenu, critiqué, aidé. Coté prestataires, je souligne le très grand professionnalisme des équipes ont travaillé avec nous et bien sur merci à Bruno, Jean-Louis, Fabrice et <a href="http://www.lespetitescases.net">Gautier</a> sans qui ISIDORE ne serait pas ISIDORE. Merci à tous !!</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/466/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Accompagner la recherche</title>
		<link>http://blog.stephanepouyllau.org/447</link>
		<comments>http://blog.stephanepouyllau.org/447#comments</comments>
		<pubDate>Mon, 03 Jan 2011 11:31:17 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[archives ouvertes]]></category>
		<category><![CDATA[édition électronique]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[web of data]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=447</guid>
		<description><![CDATA[Bonne année 2011 à tous ! Le numérique change les métiers de l&#8217;information scientifique et technique et de la communication. Il y a quelques semaines, les ingénieurs, les assistants ingénieurs et les techniciens du CNRS travaillant dans le secteur des sciences humaines et sociales étaient réunis à Paris pour une journée d&#8217;étude dans laquelle j&#8217;ai [...]]]></description>
			<content:encoded><![CDATA[<p>Bonne année 2011 à tous !</p>
<p>Le numérique change les métiers de l&#8217;information scientifique et technique et de la communication. Il y a quelques semaines, les ingénieurs, les assistants ingénieurs et les techniciens du CNRS travaillant dans le secteur des sciences humaines et sociales étaient réunis à Paris pour <a href="http://www.cnrs.fr/inshs/recherche/bapf-2010.htm" target="_blank">une journée d&#8217;étude</a> dans laquelle j&#8217;ai eu le plaisir de présenter <a href="http://medihal.archives-ouvertes.fr" target="_blank">MédiHAL</a>. Je trouve cela très bien car il se créé ainsi une dynamique entre les personnes et les équipes. En discutant avec les collègues j&#8217;ai pu mesurer la nécessiter de passer rapidement <a href="http://www.lespetitescases.net/antilope-sur-le-Web-est-elle-un-document" target="_blank">d&#8217;un web de document</a> à un web des données scientifiques fondé sur les principes du web de donnée (dont le <a href="http://fr.wikipedia.org/wiki/Resource_Description_Framework">RDF</a>) et du linked data (la généralisation des <a href="http://fr.wikipedia.org/wiki/Uniform_Resource_Identifier">URI</a>). Ce qui m&#8217;a le plus frappé est le besoin, clairement exprimé maintenant, de mettre à disposition des données numériques en grande quantité tout en préservant le besoin de qualité de ces données.</p>
<p>Ce qui est également important, c&#8217;est la prise de conscience collective que maintenant il est possible de mettre en place des grands réservoirs de données, des bibliothèques de matériaux imprimés, manuscrits, photos, etc. et de le faire dans un cadre de travail standardisé, respectant des normes de description et s&#8217;interconnectant avec plusieurs outils d&#8217;éditions, de recherche, de traitement de l&#8217;information. La construction d&#8217;un web des données scientifiques, en SHS, est en marche et il s&#8217;intègre dans la construction du web de données général au sens du W3C. Ce web de données scientifiques n&#8217;est pas fermé sur lui-même, il est (et doit être) interopérable avec le reste du web de données. J&#8217;espère que le mouvement va s&#8217;accentuer, se développer.</p>
<p>Dans quelques années, les ingénieurs, assistants ingénieurs, techniciens du monde de la recherche scientifique et de l&#8217;enseignement supérieur, pourront construire des applications, des bases de données, des portails qui iront puiser de l&#8217;information directement dans le web. Ils iront interroger simultanément de multiples &laquo;&nbsp;triple stores&nbsp;&raquo; que sont ces grosses bases de données et réservoirs contenant de l&#8217;information interconnectée.</p>
<p>Lors de cette journée d&#8217;étude j&#8217;ai été aussi frappé de l&#8217;interaction entre les acteurs présentant des projets, plateformes, outils, méthodes : tous les projets sont interconnectés entre eux et à plusieurs niveaux ; les données aussi sont interopérables, entre elles, mais aussi vers l&#8217;extérieur, avec des données du monde entier.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/447/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Les données numériques des SHS entrent dans le web de données</title>
		<link>http://blog.stephanepouyllau.org/436</link>
		<comments>http://blog.stephanepouyllau.org/436#comments</comments>
		<pubDate>Thu, 09 Dec 2010 19:34:44 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[dublincore]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[isidore]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[métadonnées]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[sciences humaines et sociales]]></category>
		<category><![CDATA[sources historiques]]></category>
		<category><![CDATA[web of data]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=436</guid>
		<description><![CDATA[Avec l&#8217;ouverture d&#8217;isidore (réalisée par le très grand équipement Adonis du CNRS) les données numériques des sciences humaines et sociales entre dans le web de données et vont bientôt rejoindre le linking open data cloud diagram ou &#171;&#160;Lod&#160;&#187; maintenu par Richard Cyganiak (DERI, NUI Galway) and Anja Jentzsch (Freie Universität Berlin), en tous cas, je [...]]]></description>
			<content:encoded><![CDATA[<p>Avec l&#8217;ouverture d&#8217;<a title="isidore" href="http://www.rechercheisidore.fr" target="_blank">isidore</a> (réalisée par le <a href="http://www.tge-adonis.fr">très grand équipement Adonis</a> du CNRS) les données numériques des sciences humaines et sociales entre dans le web de données et vont bientôt rejoindre le <a title="lod" href="http://richard.cyganiak.de/2007/10/lod/" target="_blank"><em>linking open data cloud diagram</em></a> ou &laquo;&nbsp;Lod&nbsp;&raquo; maintenu par <a href="http://richard.cyganiak.de/#me">Richard Cyganiak</a> (<a href="http://www.deri.ie/">DERI, NUI Galway</a>) and <a href="http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/team/JentzschAnja.html">Anja Jentzsch</a> (<a href="http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/">Freie Universität Berlin</a>), en tous cas, je l&#8217;espère.</p>
<p>Isidore est une plateforme de recherche permettant la recherche d&#8217;information dans les données numériques des SHS, quelles soient sources pour faire de la recherche ou bien publications des résultats de la recherche. J&#8217;ai le plaisir de co-diriger ce projet avec <a href="http://panini.u-paris10.fr/jlm/" target="_blank">Jean-Luc Minel</a> dans le cadre de l&#8217;équipe du <a title="TGE Adonis" href="http://www.tge-adonis.fr" target="_blank">Adonis</a>, le très grand équipement du <a title="CNRS" href="http://www.cnrs.fr">Centre national de la recherche scientifique</a>.</p>
<p>Je profite de ce petit billet &laquo;&nbsp;auto-promotionnel&nbsp;&raquo; pour remercier Gautier Poupeau (alias <a href="http://www.lespetitescases.net">Got)</a> sans qui ce projet n&#8217;aurait pas pu être conçu et réalisé ainsi que toute l&#8217;équipe du centre pour la communication scientifique directe (<a title="CCSD" href="http://www.ccsd.cnrs.fr/spip.php?rubrique6" target="_blank">Laurent Capelli, Philippe  Correia, Loic Comparet, Yannick Barborini et Daniel Charnay</a>) qui participe à ce beau projet.</p>
<p>Isidore moissonne des métadonnées et des données selon les protocoles OAI-PMH, des signalements d&#8217;actualités via RSS et Atom, des données structurées selon RDFa et peut se connecter à des catalogues de bibliothèques SRU/SRW (z3950). Isidore enrichit ces données en les croisant, en les qualifiant avec des thésaurii, des référentiels, des listes d&#8217;auteurs et les ré-exposent selon les principes du linked data. Pour utiliser ces données, un site web a été créé : www.rechercheisidore.fr. Vous pouvez donc interroger les articles de <a href="http://revues.org" target="_blank">Revues.org</a>, <a href="http://cairn.info">Cairn</a>, <a href="http://www.persee.fr" target="_blank">Persée</a>, les ouvrages, textes, images de <a href="http://gallica.bnf.fr">Gallica</a>, <a href="http://halshs.archives-ouvertes.fr" target="_blank">HALSHS</a>, <a href="http://medihal.archives-ouvertes.fr" target="_blank">MédiHAL</a> avec un seul formulaire et avec des liens entre toutes ces données.</p>
<p>Dans isidore, les métadonnées sont transformées en RDF, ainsi les données des shs entrent dans le web de données.</p>
<p>Mais nous sommes en version béta, alors le travail continu.</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/436/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Construire le web de données pour les shs : comment utiliser RDFa ?</title>
		<link>http://blog.stephanepouyllau.org/401</link>
		<comments>http://blog.stephanepouyllau.org/401#comments</comments>
		<pubDate>Mon, 30 Aug 2010 07:11:54 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[archives]]></category>
		<category><![CDATA[métadonnées]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[rdfa]]></category>
		<category><![CDATA[web of data]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=401</guid>
		<description><![CDATA[Le web est l&#8217;un des vecteurs principaux de la diffusion des données de recherche en sciences humaines et sociales. Il permet de diffuser et d&#8217;éditer presque tous les matériaux utilisés par le chercheur et l&#8217;enseignant : de l&#8217;archive ou la bibliothèque à la publication électronique en passant par le séminaire, le colloque, la revues et le [...]]]></description>
			<content:encoded><![CDATA[<p>Le web est l&#8217;un des vecteurs principaux de la diffusion des données de recherche en sciences humaines et sociales. Il permet de diffuser et d&#8217;éditer presque tous les matériaux utilisés par le chercheur et l&#8217;enseignant : de l&#8217;archive ou la bibliothèque à la publication électronique en passant par le séminaire, le colloque, la revues et le livre. L&#8217;utilisation du web comme outil d&#8217;édition, de publication et de diffusion a permis de démultiplier les accès aux documents et à l&#8217;information. Mais depuis 20 ans, l&#8217;effort a plus porté sur la mise à disposition de documents numériques (ouvrages, articles, corpus) que sur la structuration de l&#8217;information contenue dans ces documents : il est vrai que l&#8217;essor des moteurs de recherche traditionnels depuis les années 90 (d&#8217;Altavista à Google) ont permis d&#8217;atteindre et de s&#8217;y « retrouver » dans ces milliards de documents qui sont sur le web aujourd&#8217;hui. En revanche, la publication électronique des contenus des bases de données – les données elles-même qui ont toujours leurs propres structurations, pose encore des questions et des difficultés qui font que le web, s&#8217;il est plein de documents et relativement vide de données et d&#8217;informations structurées. Ainsi, les outils d&#8217;exploitation des documents que nous utilisons aujourd&#8217;hui, tel les moteurs de recherche, fonctionnent sur des réservoirs de documents encore trop cloisonnés. Ainsi, construire une page web d&#8217;information sur l&#8217;historien Georges Duby nécessite toujours d&#8217;adresser plusieurs questions (requêtes) à plusieurs moteurs de recherche (généralistes et spécialisés) ou à plusieurs formulaires de bases de données et cela même si, depuis dix ans, les techniques de l&#8217;interopérabilité ont fait de très grand progrès. Ce web « cloisonné » ne permet pas aux machines de travailler et certaines parties du web deviennent invisibles aux moteurs de recherche et même parfois aux humains (qui s&#8217;est déjà retrouver devant un formulaire de bdd en ligne un peu froid ?). Bien sur, un homme peut le faire, à la main, mais s&#8217;il veut se faire aider de machine, pour gagner du temps ou mieux, traiter plus de données, cela devient assez complexe. Surtout pour un chercheur qui ne maitrise pas forcement le SQL et dont ce n&#8217;est pas le métier. Ainsi, les données numériques sont bien rangées dans de multiples bases de données ou silot, mais nous n&#8217;avons construit que de simples petits « judas » afin de les regarder et l&#8217;éditorialisation des données ne fait pas tout, pis, elle cache parfois, sous une couche « cosmétique » (cela dit souvent nécessaire), une faible structuration des données. La faible structuration des données freine très souvent les modes de  pérennisation de ces dernières donc la possibilité de leur ré-exploitation future. Il nous faut faire mieux.</p>
<p><strong>Comment dépasser cela ?</strong></p>
<p>Comment rendre plus accessible encore, non pas simplement les documents (au sens des fichiers) mais les informations contenues dans ces derniers sans appauvrir les formats de structuration de l&#8217;information. Comment se donner l&#8217;opportunité de construire des outils d&#8217;aide à la recherche permettant de construire &#8211; par exemple &#8211; la notice encyclopédique de George Duby, en présentant, non pas simplement la compilation du signalement de ses articles, ouvrages, conférences, mais aussi les thèmes qu&#8217;il a abordé au cours de sa carrière et en les reliant à des notions, des définitions, des illustrations, des ouvrages d&#8217;autres auteurs ? C&#8217;est tout l&#8217;enjeu de la construction du web de données, cette extension du web dont je parlais dans mon dernier billet. Il nous faut tout d&#8217;abord libérer les données après l&#8217;avoir fait avec les bases de données elles-même.</p>
<p><strong>Comment faire ?</strong></p>
<p>Tout d&#8217;abord un peu d&#8217;histoire. Dans les années 1995-2000, tous les acteurs de la recherche et de la culture ont massivement édité leurs bases de données sur le web, c&#8217;était l&#8217;enjeu du moment : tout le monde voulait mettre sa base en ligne, c&#8217;était un nouveau cycle dans la diffusion des documents (après le minitel, les connexions client/serveurs). Nous sommes entrés, depuis quelques années, dans un nouveau cycle dont la première phase (la première « marche » je préfère dire) a été l&#8217;interopérabilité des bases de données. En parallèle de cette phase, qui se poursuit, nous devons « ouvrir les données ». Quel curieuse expression ! Simplement, il s&#8217;agit d&#8217;exposer les données, dans toutes leurs complexités, en utilisant le cadre de la modélisation en RDF. Pour cela, il nous faut apprendre et développer des modèles de données, faire des choix de vocabulaires documentaires afin de décrire l&#8217;information contenue dans une page web, un billet de blog, un article, un inventaire de fonds d&#8217;archive, un corpus, un thésaurus ou encore une notice de bibliothèque. Pour ouvrir ces données il faut être capable de dire : « tiens ça, c&#8217;est le titre et ça là, c&#8217;est l&#8217;auteur et je te prouve que c&#8217;est bien l&#8217;auteur car je suis capable de le relier, par un principe ouvert, normalisé et connu de tous, à un référentiel (les auteurs du sudoc par exemple) et à une forme de vocabulaire (du mods, du dublin core simple, etc.) » : les documentalistes savent très bien faire cela. Ainsi, ouvrir ses données – participer à la construction du web de données &#8211; cela revient donc à structurer de l&#8217;information avec des règles communes, valables pour tout le monde du web et où donc l&#8217;implicite n&#8217;est pas le bienvenu. Ouvrir ses données au monde c&#8217;est donc vouloir diffuser les données et par uniquement les documents et surtout dire quel choix j&#8217;ai fais pour structurer l&#8217;information. Les documentalistes font (devraient) s&#8217;y régaler.</p>
<p>Avec <a href="http://www.lespetitescases.net/et-si-on-semantisait-un-peu-le-web" target="_blank">l&#8217;aide de Got</a>, je vais présenter un exemple simple. Il est possible d&#8217;exprimer selon RDF des données structurées dans une page web écrite en HTML : il s&#8217;agit de la syntaxe RDFa (pour <em>Resource Description Framework – in – attributes</em>). <a href="http://fr.wikipedia.org/wiki/RDFa" target="_blank">RDFa permet donc d&#8217;utiliser la mécanique du RDF tout en utilisant comme support les balises HTML</a>.</p>
<p>Je prends comme exemple, très simple, <a href="http://www.stephanepouyllau.org/webdedonnees/medihal/rdfa/" target="_blank">une photographie et sa notice</a> venant de <a href="http://medihal.archives-ouvertes.fr/" target="_blank">MédiHAL, l&#8217;archive ouverte de photographies scientifiques</a> que j&#8217;ai co-créé et qui est développée par le CCSD et le CN2SV. Au travers de cet exemple, je souhaite montrer qu&#8217;il ne s&#8217;agit pas que de techniques documentaires, ou que de questions informatiques, ou encore que de questions d&#8217;édition : non, il s&#8217;agit de tous cela en même temps. Ainsi, construire le web de données c&#8217;est avant tout réunir plusieurs compétences et métiers pour envisager toutes les aspects.</p>
<p>La consultation avec un simple navigateur web de la notice exemple ne révèle pas la présence d&#8217;une structuration de l&#8217;information selon les principes RDF et pourtant, si l&#8217;on regarde le code source, il y a une structuration, des vocabulaires RDF et des étiquettes structurant l&#8217;information. Ainsi, dans un premier temps, il faut dire que cette page contiendra du RDFa : j&#8217;ai modifié le doctype XHTML. Il est remplaçé par un doctype XHTML+RDFa :</p>
<p><code>&lt;!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"&gt;</code></p>
<p>Notez ensuite la présence de plusieurs vocabulaires documentaires qui vont nous permettre de structurer l&#8217;information :</p>
<pre><code>&lt;html xml:lang="fr" version="XHTML+RDFa 1.0"
        xmlns="http://www.w3.org/1999/xhtml"
        xmlns:foaf="http://xmlns.com/foaf/0.1/"
        xmlns:dc="http://purl.org/dc/elements/1.1/"
        xmlns:cc="http://creativecommons.org/ns#"
        xmlns:dcterms="http://purl.org/dc/terms/"
        xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
        xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"
        xmlns:xsd="http://www.w3.org/2001/XMLSchema#"&gt;</code></pre>
<p>Pourquoi ? Puisque nous allons structurer les données contenues dans cette page web, il nous faut dire « ça, c&#8217;est le titre » : <a href="http://www.lespetitescases.net/comprendre-rdf-en-moins-de-5-minutes" target="_blank">il s&#8217;agit de mettre une « étiquette » à une chaine de caractère du titre</a>. Il nous faut construire des triplets RDF qui, par l&#8217;utilisation de prédicats (verbe), relient l&#8217;étiquette (l&#8217;objet) à la chaine de caractère du titre (sujet). Puisque nous devons dire à quel vocabulaire nous faisons référence pour dire « c&#8217;est le titre », nous les déclarons en entête. Vous reconnaitrez sans doute « dc » pour le  dublin core simple (<em>dublin core elements set </em>ou dces), « dcterms » pour le dublin core terms, « cc » pour signaler la présence de données sous licence creative commons, « geo » pour la géolocalisation GPS, « foaf » pour décrire le document qui est ici une notice MédiHAL, etc. Ainsi je déclare là l&#8217;ensemble des vocabulaires documentaires que je vais utiliser ensuite et j&#8217;en donne la référence en ligne : <a href="http://purl.org/dc/elements/1.1/">http://purl.org/dc/elements/1.1/</a> pour le dublin core simple. Ces référentiels sont eux-même décrits et structurés en RDF : ils sont utilisés par tous et sont donc le point de référence, la norme.</p>
<p>Je trouve ensuite le début de ma notice, qui est matérialisée par une balise &lt;div&gt;  :</p>
<p><code>&lt;div typeof="foaf:Image" about="http://medihal.archives-ouvertes.fr/medihal-00501617"&gt;</code></p>
<p>Dans cette balise (fermante à la fin de ma notice), j&#8217;y mentionne que ce qui sera dans la balise &lt;div&gt; est une notice d&#8217;une image et que l&#8217;URL présente dans l&#8217;attribut « about » sera l&#8217;objet auquel se rapporte les informations que je vais structurer (donc ici, un conteneur, une notice, d&#8217;une image). Les informations décrites par la suite se rapportent à cette notice (rôle du &laquo;&nbsp;about&nbsp;&raquo;), ce conteneur, accessible à cette URL. Ma données est complexe, elle est composés d&#8217;une image (qui a plusieurs représentations : plusieurs vignettes, l&#8217;image déposée, etc.) et des métadonnées, voir des commentaires (publics, privés). Pour décrire ce conteneur, j&#8217;utilise <a href="http://xmlns.com/foaf/spec/#term_Image" target="_blank">le vocabulaire foa</a>f qui permet de décrire des ressources, des personnes ou des institutions et je vais utiliser l&#8217;élément foaf:Image. Pour la syntaxe, je vous invite à lire ce <a href="http://www.lespetitescases.net/rdfaiser-votre-blog-2" target="_blank">billet de Got</a> qui présente très en détail et très clairement la syntaxe des CURIEs (ou <em>Compact URIs</em>) dans le monde RDF.</p>
<p>Dans ce &lt;div&gt;, je vais pouvoir structurer l&#8217;information contenue dans la données en utilisant, dans cet exemple, la balise &lt;span&gt; ainsi que quelques attributs : « property » pour caractériser l&#8217;information avec un vocabulaire, « rel » pour relier de l&#8217;information directement au conteneur. Ainsi pour le titre de l&#8217;image, je vais utiliser le dublin core simple (dces), nous aurons :</p>
<p><code>&lt;span property="dc:title"&gt;Madagascar : Vallée de l'Onive aux environs de Tsinjoarivo&lt;/span&gt;</code></p>
<p>Pour l&#8217;image en jpg présentée dans la notice (qui est l&#8217;une des représentations possibles de l&#8217;image) :</p>
<p><code>&lt;span rel="foaf:thumbnail" about="http://medihal.archives-ouvertes.fr/medihal-00501617"&gt;<br />
&lt;img title="Madagascar..." id="thumb320" src="http://medihal.archives-ouvertes.fr/docs/00/50/16/17/archives/thumb320.jpg" border="0" /&gt;&lt;/span&gt;</code></p>
<p>Là, nous caractérisons que le contenu de &lt;img/&gt;, c&#8217;est à dire une image en 320 pixels, est l&#8217;une des versions de l&#8217;image de la notice représentée par «  http://medihal.archives-ouvertes.fr/medihal-00501617 » : il s&#8217;agit d&#8217;une vignette de l&#8217;image d&#8217;ou « foaf:thumbnail ». Dans ce cas, il possible d&#8217;implémenter les attributs rel et about dans la balise &lt;img&gt;. Je l&#8217;ai mis dans un &lt;span&gt; pour plus de clarté. Notez que j&#8217;ai répéré dans ce &lt;span&gt; l&#8217;attribut &laquo;&nbsp;about&nbsp;&raquo;, je n&#8217;y suis pas obligé, il est déjà signalé dans la balise &lt;span&gt; &laquo;&nbsp;mère&nbsp;&raquo;. Ce &lt;span&gt; structurant une version de l&#8217;image (une vignette de 320px de coté), j&#8217;ai préféré ré-indiquer ce &laquo;&nbsp;about&nbsp;&raquo; afin que vous compreniez bien que foaf:thumbnail (vignette) désigne une vignette de l&#8217;image déposée et dont l&#8217;URI est http://medihal.archives-ouvertes.fr/medihal-00501617.</p>
<p>Pour la légende, je vais utiliser le vocabulaire dublin core <em>terms</em>, le plus riche des dublin core avec l&#8217;étiquette dc:abstract (pour résumé) :</p>
<p><code>&lt;span property="dcterms:abstract"&gt;Paysage rural de collines à  proximité de Tsinjoarivo ; Au premier plan le bord de la terrasse de la vallée de l'Onive ; A l'arrière-plan, cultures en terrasse avec des rizières en escaliers, irriguées par un affluent du fleuve&lt;/span&gt;</code></p>
<p>Je pourrais aussi, plus simplement mais en introduisant un peu d&#8217;implicite, utiliser dces avec l&#8217;étiquette dc:description :</p>
<p><code>&lt;span property="dc:description"&gt;Paysage rural de collines à  proximité de Tsinjoarivo ; Au premier plan le bord de la terrasse de la vallée de l'Onive ; A l'arrière-plan, cultures en terrasse avec des rizières en escaliers, irriguées par un affluent du fleuve&lt;/span&gt;</code></p>
<p>Pour exprimer les mots clés, je vais utiliser une nouvelle fois le dces :</p>
<p><code>&lt;span property="dc:subject"&gt;&lt;a href="[lien vers mes mots-clés]"&gt;Madagascar&lt;/a&gt;&lt;/span&gt;</code></p>
<p>Il est possibilité là aussi d&#8217;être plus riche, en reliant mon mot-clés à un référentiel (thésaurus par exemple) en utilisant les vocabulaires sioc et skos pour exprimer des concepts et les liaisons.</p>
<p>Pour la géolocalisation de mon image, je vais utiliser le dublin core terms avec l&#8217;étiquette « spacial », qui va me permettre de relier mon conteneur (foaf:Image) à des valeurs de latitude et de longitude. Ainsi, j&#8217;exprime dans dcterms:spatial une latitude et une longitude issues d&#8217;un GPS ou d&#8217;une géolocalisation en spécifiant que je fais référence au vocabulaire WGS validé par le W3C (geo:lat et geo:long).</p>
<p><code>&lt;span rel="dcterms:spatial"&gt;<br />
&lt;span property="geo:lat" content="-19.644527589975"&gt;&lt;/span&gt;<br />
&lt;span property="geo:long" content="47.709846500067"&gt;&lt;/span&gt;<br />
&lt;/span&gt;</code></p>
<p>Je me limite ici à quelques éléments de cette image (en prenant du DC simple pour être pédagogique), il est possible d&#8217;aller plus loin dans la structuration (en utilisant du DC terms ou d&#8217;autres vocalulaires).</p>
<p><strong>Conclusion</strong></p>
<p>Le web de données est une méthode qui consiste à utiliser le web comme un espace ou les données sont structurées : c&#8217;est à dire que l&#8217;information d&#8217;un document (pdf, jpg, txt, etc.) est cartographiée, repérée, signalée et reliée à des vocabulaires, accessibles eux-même sur le web et dont la structuration est connue et explicitée. C&#8217;est un formidable enjeux pour les documentalistes, les bibliothèques et les ingénieurs et techniciens en <em>digital humanities</em> qui construisent des corpus scientifiques et les diffusent en ligne. Le RDFa est l&#8217;une des techniques, l&#8217;une des mécaniques possible et elle est relativement simple à comprendre car elle s&#8217;inscrit dans une évolution naturelle des choses : une sémantisation de la page web via le code HTML. Il s&#8217;agit d&#8217;une révolution mais qui s&#8217;appuie sur des éléments que tout les professionnels de l&#8217;IST peuvent maitriser. J&#8217;ai toujours pensé et dit que l&#8217;OAI-PMH était (est) la première marche vers le web de données, je pense qu&#8217;RDFa est la deuxième, du moins c&#8217;est un pont très simple pour mieux comprendre RDF et les techniques du web de données.</p>
<p>Stéphane.</p>
<p>Liens utiles pour aller plus loin :</p>
<ul>
<li>Exemple utilisé : <a href="http://www.stephanepouyllau.org/webdedonnees/medihal/rdfa/" target="_blank">http://www.stephanepouyllau.org/webdedonnees/medihal/rdfa/</a></li>
<li>Code source : <a href="http://www.stephanepouyllau.org/webdedonnees/medihal/rdfa/medihal-rdfa.txt" target="_blank">http://www.stephanepouyllau.org/webdedonnees/medihal/rdfa/medihal-rdfa.txt</a></li>
<li>Une <a href="http://www.w3.org/RDF/Validator/ARPServlet?PARSE=Parse+URI%3A+&amp;TRIPLES_AND_GRAPH=PRINT_TRIPLES&amp;FORMAT=PNG_EMBED&amp;URI=http://www.w3.org/2007/08/pyRdfa/extract%3Furi%3Dhttp%3A//www.stephanepouyllau.org/webdedonnees/medihal/rdfa/" target="_blank">vue sur le contenu RDFa</a> de cet exemple.</li>
<li>Comprendre RDF : <a href="http://www.lespetitescases.net/comprendre-rdf-en-moins-de-5-minutes" target="_blank">http://www.lespetitescases.net/comprendre-rdf-en-moins-de-5-minutes</a></li>
<li>Mettre du RDFa dans son blog : <a href="http://www.lespetitescases.net/rdfaiser-votre-blog-1-la-theorie" target="_blank">http://www.lespetitescases.net/rdfaiser-votre-blog-1-la-theorie</a> ; <a href="http://www.lespetitescases.net/rdfaiser-votre-blog-2-la-pratique" target="_blank">http://www.lespetitescases.net/rdfaiser-votre-blog-2-la-pratique</a> ; <a href="http://www.lespetitescases.net/rdfaiser-votre-blog-3-exploitation" target="_blank">http://www.lespetitescases.net/rdfaiser-votre-blog-3-exploitation</a></li>
<li>Vidéo de l&#8217;ADBS : <a href="http://www.adbs.fr/le-web-de-donnees-perspectives-pour-les-metiers-de-l-information-documentation-79361.htm" target="_blank">Le Web de données : perspectives pour les métiers de l&#8217;information documentation</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/401/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Construire le web de données pour les shs avec les digital humanities</title>
		<link>http://blog.stephanepouyllau.org/393</link>
		<comments>http://blog.stephanepouyllau.org/393#comments</comments>
		<pubDate>Fri, 25 Jun 2010 09:36:54 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[documentation]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[médihal]]></category>
		<category><![CDATA[shs]]></category>
		<category><![CDATA[web of data]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=393</guid>
		<description><![CDATA[Le web de données est une évolution du web actuel vers un web contenant des données structurées et si possible liées entre elles grâce à l&#8217;utilisation de standards documentaires et informatiques internationaux. Les informations contenues dans ces données sont également organisées, structurées, par l&#8217;utilisation de schémas (de structuration) dont le plus simple reste le dublin [...]]]></description>
			<content:encoded><![CDATA[<p>Le web de données est une évolution du web actuel vers un web contenant des données structurées et si possible liées entre elles grâce à l&#8217;utilisation de standards documentaires et informatiques internationaux. Les informations contenues dans ces données sont également organisées, structurées, par l&#8217;utilisation de schémas (de structuration) dont le plus simple reste le <em>dublin core element set</em> (dit « dublin core simple »). Mais le web de données permet justement de s&#8217;affranchir de la contrainte de l&#8217;utilisation universelle du DC et de marier plusieurs schémas. Ainsi, dans un futur proche, c&#8217;est le web lui-même qui deviendra (en fait, qui devient) une base de données mondiale, structurée et pérenne.</p>
<p><strong>Quel est la différence entre « diffuser sa base de données sur le web » et participer ou construire le web de données ?</strong></p>
<p>Tout d&#8217;abord participer à la construction du web de données veut dire que l&#8217;on diffuse des données et pas uniquement les métadonnées ou les notices. Cela veut dire que l&#8217;on « ouvre » les données au public. L&#8217;ensemble des données utilisées par les enseignants et les chercheurs sont concernées quelles soient conservées dans les archives ou bien qu&#8217;il s&#8217;agisse des données produites par les chercheurs eux-même (enquêtes, articles, ouvrages, photographies, plans, cartes, notes de terrains, …). Il y a bien évidement des questions de confidentialité de l&#8217;information mais il est classique aujourd&#8217;hui d&#8217;appliquer des barrières mobiles aménageant des périodes d&#8217;embargo temporels et/ou disciplinaires. Construire le web de données c&#8217;est affirmer que l&#8217;on va, tout de suite ou dans quelques temps, ouvrir ses données. S&#8217;il existe une période d&#8217;embargo, il faut dire quand elle se terminera. Par exemple dans MédiHAL, l&#8217;archive ouverte de photographies et d&#8217;images scientifiques lancée par le CNRS, il est possible de placer une image sous un embargo de 3 ans, ainsi l&#8217;image jpg ou tif sera accessible dans 3 ans, en attendant la notice est publique. Dans l&#8217;interface et dans les flux OAI-PMH de MédiHAL est indiqué la disponibilité de la données.</p>
<p><strong>Ouvrir ses données, pourquoi faire ?</strong></p>
<p>Principalement, pour avoir accès à une assiette de données plus large permettant de traiter plus d&#8217;information afin de valider plus profondément telles ou telles théories ou idées tout en étant capable d&#8217;étayer le propos de synthèse en donnant accès à toutes les sources (ou preuves). Depuis 1999, avec l&#8217;arrivée des méthodes et protocoles d&#8217;interopérabilité des données tel que l&#8217;OAI-PMH, une première marche vers le web de données a été franchie : des moteurs de recherche collectent des métadonnées dont la citabilité et l&#8217;accès sont pérennes (c&#8217;est à dire que les diffuseurs &#8211; institutions ou personnes &#8211; se donnent les moyens de maintenir et de garantir l&#8217;accès) donnant ainsi accès a des données en ligne (textes, images, inventaires de fonds d&#8217;archives, articles, ouvrages, etc.). La seconde marche est encore devant nous, nous devons apprendre à structurer systématiquement toutes les données qui sont utiles aux chercheurs pour travailler : ainsi nous devons les qualifier. Les chercheurs, aidés par les bibliothécaires et documentalistes qui sont en première ligne, doivent aider, par exemple, au développement de nouveau outils d&#8217;enrichissement des données.</p>
<p>Ouvrir ses données c&#8217;est aussi vouloir partager et échanger avec d&#8217;autres chercheurs, mais aussi avec la communauté des <em>digital humanties</em>. C&#8217;est d&#8217;autant plus important que certaines données, utilisées voir collectées par les chercheurs, sont publiques. Bien sur, la recherche est un monde de compétition où les données sont stratégiques, mais je me positionne ici dans le cas de données des SHS, peut-être moins stratégiques, surtout quand elles sont patrimoniales et dans le cadre de données ayant déjà été traitées, au moins partiellement. Pourquoi un doctorant ayant soutenu sa thèse, ne diffuserait-il pas, juste après sa thèse (et après l&#8217;avoir déposée elle aussi dans une archive ouverte tel que <a href="http://tel.archives-ouvertes.fr" target="_blank">TEL</a> par exemple) son corpus de sources ? Voir les données qu&#8217;il n&#8217;a pas eu le temps d&#8217;exploiter ?</p>
<p>Heureusement le mouvement est en marche : plusieurs projets, s&#8217;inscrivant dans le web de données, sont en cours de réalisation, quelques exemples issus de la communauté des <em>digital humanities</em> :</p>
<ul>
<li>La structuration des billets des blogs de la plateforme hypotheses.org en RDFa</li>
</ul>
<ul>
<li>La réalisation de plateforme ISIDORE du TGE ADONIS</li>
</ul>
<ul>
<li>L&#8217;expression en RDF des autorités auteurs du catalogue SUDOC de l&#8217;ABES</li>
</ul>
<ul>
<li>Le développement des projets d&#8217;édition électronique de sources historiques utilisant la TEI, qui permet de structurer les textes.</li>
</ul>
<p>La construction du web de données permettra-t-il de développer de nouveau axe de recherche ? sans doute, mais il apporte également une nouvelle façon de relier les chercheurs en eux de (re)-construire de nouvelles communautés.</p>
<p>Dans un prochain billet et pour illustrer cette notion du web de données par un cas concret, j&#8217;aborderai la structuration en RDFa des pages de consultation de la plateforme MédiHAL.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/393/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>De l&#8217;interopérabilité au web de données</title>
		<link>http://blog.stephanepouyllau.org/277</link>
		<comments>http://blog.stephanepouyllau.org/277#comments</comments>
		<pubDate>Sun, 20 Sep 2009 07:04:07 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[dublincore]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[web of data]]></category>
		<category><![CDATA[xml]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=277</guid>
		<description><![CDATA[J&#8217;ai eu la chance de participer à l&#8217;Université d&#8217;été de l&#8217;édition électronique (Marseille, 7-11 septembre 2009) où j&#8217;ai parlé d&#8217;interopérabilité et de circulation de l&#8217;information scientifique et technique. J&#8217;ai axé mon propos sur le fait que l&#8217;interopérabilité des données est peut-être la première marche vers la mise en place du web de données. Il est [...]]]></description>
			<content:encoded><![CDATA[<p>J&#8217;ai eu la chance de participer à <a href="http://www.digitalhumanities.cnrs.fr/wikis/edelec-shs/index.php/Accueil" target="_blank">l&#8217;Université d&#8217;été de l&#8217;édition électronique</a> (<a href="http://www.geonames.org/maps/bkm9642" target="_blank">Marseille</a>, 7-11 septembre 2009) où j&#8217;ai parlé <a href="http://www.digitalhumanities.cnrs.fr/wikis/edelec-shs/index.php/L%E2%80%99interop%C3%A9rabilit%C3%A9_:_gestion_et_circulation_de_l%27information_scientifique" target="_blank">d&#8217;interopérabilité et de circulation de l&#8217;information scientifique et technique</a>. J&#8217;ai axé mon propos sur le fait que l&#8217;interopérabilité des données est peut-être la première marche vers la mise en place du web de données. Il est probable que pour faire le web de données il nous faille passer d&#8217;abord par un web des données (comptons aussi un peu sur les institutions françaises pour cela) même si l&#8217;appropriation et l&#8217;utilisation de standards communs est de plus en plus naturel et que l&#8217;utilisation du <em>Dublin Core Element Set</em> ne fait plus réellement débat dans la communauté  scientifique. <span typeof="foaf:Person" xmlns:foaf="http://xmlns.com/foaf/0.1/" about="#me" rel="foaf:knows"><a property="foaf:name" rel="foaf:homepage" href="http://www.lespetitescases.net">Gautier Poupeau</a></span> a présenté dans un billet <a href="http://www.lespetitescases.net/du-web-semantique-au-web-de-donnees-1">une mise au point entre la notion de web sémantique</a> et celle de web de données qui résume assez bien ma vision des choses sur ce que le web de données pourrait être et pourquoi il est important que les professionnels de l&#8217;information scientifique et technique soient dans ce train là.</p>
<p>Le web de données c&#8217;est la réalisation d&#8217;une base de données mondiale ou les données sont-elles même sur le réseau (et pas juste leurs méta-données). En discutant avec des chercheurs, collectant des données et les stockant sur leurs petits disques dur dans leurs bureaux, j&#8217;ai envie de leur dire à la façon de Tim Berners Lee : &laquo;&nbsp;libérez vos données ! mettez-les sur le réseau ! vous faites des images ? renseignez bien vos champs de description IPTC-Core et mettez vos images sur le réseau !&nbsp;&raquo;. Bien sur, il y a 1.000.000 de raisons pour qu&#8217;ils ne le fasse pas : ils ont une recherche en cours que le voisin veut surement leur voler, ils pensent que seul l&#8217;article final leur permettra d&#8217;être (re)-connus, et peut-être, ce ne sont pas leurs photos. Les documentalistes, bibliothécaire, archivistes ont un rôle majeur dans la réalisation d&#8217;un web qui contiendra des données &laquo;&nbsp;brutes&nbsp;&raquo; (certains disent primaires, factuelles, de terrains, d&#8217;enquêtes, etc.). Je renvois au projet data.gov ou nous imaginons bien le travail d&#8217;IST qui peut s&#8217;y développer. Construire le web de données nécessite de structurer les données avant qu&#8217;elles n&#8217;existent parfois. Dans les Sciences humaines et sociales, il faut aider les chercheurs &#8211; dont le volet technique, normatif, informatique n&#8217;est pas le métier &#8211; a le faire. Il faut leur expliquer, ce que j&#8217;aurai sans doute pu mieux faire à Marseille, que l&#8217;augmentation de la masse des données brutes, maintenant accessible, permet aux chercheurs de travailler sur des corpus plus larges, mieux documentés.</p>
<p>L&#8217;interopérabilité des données c&#8217;est mettre en œuvre une politique scientifique et technique permettant :</p>
<ul>
<li>
<p style="margin-bottom: 0cm;">de rendre (plus) accessible ces 	propres données dans un maximum de langages documentaires partagés 	par le plus grand nombre ;</p>
</li>
<li>
<p style="margin-bottom: 0cm;">de garantir l&#8217;accessibilité de 	ces données dans temps : ceci pour la citabilité des données dont 	la privatisation, par le DOI par exemple, pourrait avoir des 	conséquences dramatiques. Je milite là pour une évolution des 	identifiants OAI ou autres vers de véritables identifiants pérennes 	et uniques, garantis par un organisme international type <a href="http://portal.unesco.org/ci/fr/ev.php-URL_ID=19486&amp;URL_DO=DO_TOPIC&amp;URL_SECTION=201.html" target="_blank">UNESCO</a> ;</p>
</li>
<li>de faire vivre des données numériques : ajout de 	classifications, de schémas de description (documentaires dans un 	premier temps), prise en charge de pérennité des données par le 	développement de formats pivots pour la préservation ;</li>
</ul>
<p>Ces trois items sont, pour moi, les trois piliers de l&#8217;interopérabilité des données dans une optique future du web de données. Aujourd&#8217;hui, il nous est difficile de sortir du <a href="http://www.lespetitescases.net/carcans-de-la-pensee-hierarchique-et-documentaire-1" target="_blank">carcan de la pensée documentaire comme dirait Got</a> car les méthodes, techniques et outils qui sont enseignés correspondent encore au monde d&#8217;avant le web et nous n&#8217;avons pas encore d&#8217;outils de masse pour le monde d&#8217;après le web, mais ils arrivent et il nous faut faire œuvre de pédagogie. En attendant, nous chérissons nos méta-données. Il nous faut nous interroger sur l&#8217;encapsulation des méta-données descriptives dans les données (étape n°2 sur le chemin du web de données ?), mais aussi comment signaler à nos machines que la description d&#8217;une image est là au milieu des bits de l&#8217;image.</p>
<p>L&#8217;interopérabilité des données entre machines, via des méta-données, est la première marche, le premier pas vers le web de données. Si plusieurs techniques existent, l&#8217;OAI-PMH couplé aux descriptions en Dublin Core, représente le plus souvant le volet technique, informatique de l&#8217;interopérabilité des données aux yeux des professionnels de l&#8217;IST. La mise à plat des méta-données, dans l&#8217;OAI-PMH, a un avantage : il met à plat réellement les méta-données et nous oblige à repenser le rapport entre données, méta-données et le fait que, avec l&#8217;OAI-PMH, ce qui en sort, c&#8217;est du XML et pas une page web en HTML. On utilise le web pour faire autre chose que du HTML et des &laquo;&nbsp;pages&nbsp;&raquo; ; tout en se gardant la possibilité d&#8217;en faire, le web muterait-il ?. Nous faisons des flux de méta-données dans un langage pour des machines (aujourd&#8217;hui c&#8217;est du XML, mais demain&#8230;) : le web n&#8217;est pas que le territoire du HTML, il devient dynamique, il est un flux. Avec l&#8217;OAI-PMH, ce qui sort, c&#8217;est du flux XML (fluxml, cela fait vieux médicament) et pas une page web, pourtant il y a dedans de l&#8217;information mais nous échangeons juste de l&#8217;information sur la données, il nous faut aller plus loin. L&#8217;interopérabilité des données c&#8217;est presque un web des données.</p>
<p>Le mouvement est-il en marche ? <a href="http://renatis.cnrs.fr/spip.php?rubrique60" target="_blank">Le réseau national des documentalistes du CNRS organise en octobre 2009 trois jours autour de l&#8217;OAI-PMH</a> et j&#8217;espère son évolution future OAI-ORE. En 2010 aura lieu une seconde école thématique, très pratique, sur les sources numériques et l&#8217;interopérabilité des données. Ces sessions de formation continue sont bien évidement le reflet de ce qui se passe dans les IUT et à l&#8217;Université. Il me semble que ces éléments en sont des signes favorables.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/277/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

