<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sp.Blog &#187; digital humanities</title>
	<atom:link href="http://blog.stephanepouyllau.org/tag/digital-humanities/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.stephanepouyllau.org</link>
	<description>le blog de Stéphane Pouyllau</description>
	<lastBuildDate>Sat, 07 Jan 2012 18:07:33 +0000</lastBuildDate>
	<language>fr</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Accompagner la recherche</title>
		<link>http://blog.stephanepouyllau.org/447</link>
		<comments>http://blog.stephanepouyllau.org/447#comments</comments>
		<pubDate>Mon, 03 Jan 2011 11:31:17 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[archives ouvertes]]></category>
		<category><![CDATA[édition électronique]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[web of data]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=447</guid>
		<description><![CDATA[Bonne année 2011 à tous ! Le numérique change les métiers de l&#8217;information scientifique et technique et de la communication. Il y a quelques semaines, les ingénieurs, les assistants ingénieurs et les techniciens du CNRS travaillant dans le secteur des sciences humaines et sociales étaient réunis à Paris pour une journée d&#8217;étude dans laquelle j&#8217;ai [...]]]></description>
			<content:encoded><![CDATA[<p>Bonne année 2011 à tous !</p>
<p>Le numérique change les métiers de l&#8217;information scientifique et technique et de la communication. Il y a quelques semaines, les ingénieurs, les assistants ingénieurs et les techniciens du CNRS travaillant dans le secteur des sciences humaines et sociales étaient réunis à Paris pour <a href="http://www.cnrs.fr/inshs/recherche/bapf-2010.htm" target="_blank">une journée d&#8217;étude</a> dans laquelle j&#8217;ai eu le plaisir de présenter <a href="http://medihal.archives-ouvertes.fr" target="_blank">MédiHAL</a>. Je trouve cela très bien car il se créé ainsi une dynamique entre les personnes et les équipes. En discutant avec les collègues j&#8217;ai pu mesurer la nécessiter de passer rapidement <a href="http://www.lespetitescases.net/antilope-sur-le-Web-est-elle-un-document" target="_blank">d&#8217;un web de document</a> à un web des données scientifiques fondé sur les principes du web de donnée (dont le <a href="http://fr.wikipedia.org/wiki/Resource_Description_Framework">RDF</a>) et du linked data (la généralisation des <a href="http://fr.wikipedia.org/wiki/Uniform_Resource_Identifier">URI</a>). Ce qui m&#8217;a le plus frappé est le besoin, clairement exprimé maintenant, de mettre à disposition des données numériques en grande quantité tout en préservant le besoin de qualité de ces données.</p>
<p>Ce qui est également important, c&#8217;est la prise de conscience collective que maintenant il est possible de mettre en place des grands réservoirs de données, des bibliothèques de matériaux imprimés, manuscrits, photos, etc. et de le faire dans un cadre de travail standardisé, respectant des normes de description et s&#8217;interconnectant avec plusieurs outils d&#8217;éditions, de recherche, de traitement de l&#8217;information. La construction d&#8217;un web des données scientifiques, en SHS, est en marche et il s&#8217;intègre dans la construction du web de données général au sens du W3C. Ce web de données scientifiques n&#8217;est pas fermé sur lui-même, il est (et doit être) interopérable avec le reste du web de données. J&#8217;espère que le mouvement va s&#8217;accentuer, se développer.</p>
<p>Dans quelques années, les ingénieurs, assistants ingénieurs, techniciens du monde de la recherche scientifique et de l&#8217;enseignement supérieur, pourront construire des applications, des bases de données, des portails qui iront puiser de l&#8217;information directement dans le web. Ils iront interroger simultanément de multiples &laquo;&nbsp;triple stores&nbsp;&raquo; que sont ces grosses bases de données et réservoirs contenant de l&#8217;information interconnectée.</p>
<p>Lors de cette journée d&#8217;étude j&#8217;ai été aussi frappé de l&#8217;interaction entre les acteurs présentant des projets, plateformes, outils, méthodes : tous les projets sont interconnectés entre eux et à plusieurs niveaux ; les données aussi sont interopérables, entre elles, mais aussi vers l&#8217;extérieur, avec des données du monde entier.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/447/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Les données numériques des SHS entrent dans le web de données</title>
		<link>http://blog.stephanepouyllau.org/436</link>
		<comments>http://blog.stephanepouyllau.org/436#comments</comments>
		<pubDate>Thu, 09 Dec 2010 19:34:44 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[dublincore]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[isidore]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[métadonnées]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[sciences humaines et sociales]]></category>
		<category><![CDATA[sources historiques]]></category>
		<category><![CDATA[web of data]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=436</guid>
		<description><![CDATA[Avec l&#8217;ouverture d&#8217;isidore (réalisée par le très grand équipement Adonis du CNRS) les données numériques des sciences humaines et sociales entre dans le web de données et vont bientôt rejoindre le linking open data cloud diagram ou &#171;&#160;Lod&#160;&#187; maintenu par Richard Cyganiak (DERI, NUI Galway) and Anja Jentzsch (Freie Universität Berlin), en tous cas, je [...]]]></description>
			<content:encoded><![CDATA[<p>Avec l&#8217;ouverture d&#8217;<a title="isidore" href="http://www.rechercheisidore.fr" target="_blank">isidore</a> (réalisée par le <a href="http://www.tge-adonis.fr">très grand équipement Adonis</a> du CNRS) les données numériques des sciences humaines et sociales entre dans le web de données et vont bientôt rejoindre le <a title="lod" href="http://richard.cyganiak.de/2007/10/lod/" target="_blank"><em>linking open data cloud diagram</em></a> ou &laquo;&nbsp;Lod&nbsp;&raquo; maintenu par <a href="http://richard.cyganiak.de/#me">Richard Cyganiak</a> (<a href="http://www.deri.ie/">DERI, NUI Galway</a>) and <a href="http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/team/JentzschAnja.html">Anja Jentzsch</a> (<a href="http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/">Freie Universität Berlin</a>), en tous cas, je l&#8217;espère.</p>
<p>Isidore est une plateforme de recherche permettant la recherche d&#8217;information dans les données numériques des SHS, quelles soient sources pour faire de la recherche ou bien publications des résultats de la recherche. J&#8217;ai le plaisir de co-diriger ce projet avec <a href="http://panini.u-paris10.fr/jlm/" target="_blank">Jean-Luc Minel</a> dans le cadre de l&#8217;équipe du <a title="TGE Adonis" href="http://www.tge-adonis.fr" target="_blank">Adonis</a>, le très grand équipement du <a title="CNRS" href="http://www.cnrs.fr">Centre national de la recherche scientifique</a>.</p>
<p>Je profite de ce petit billet &laquo;&nbsp;auto-promotionnel&nbsp;&raquo; pour remercier Gautier Poupeau (alias <a href="http://www.lespetitescases.net">Got)</a> sans qui ce projet n&#8217;aurait pas pu être conçu et réalisé ainsi que toute l&#8217;équipe du centre pour la communication scientifique directe (<a title="CCSD" href="http://www.ccsd.cnrs.fr/spip.php?rubrique6" target="_blank">Laurent Capelli, Philippe  Correia, Loic Comparet, Yannick Barborini et Daniel Charnay</a>) qui participe à ce beau projet.</p>
<p>Isidore moissonne des métadonnées et des données selon les protocoles OAI-PMH, des signalements d&#8217;actualités via RSS et Atom, des données structurées selon RDFa et peut se connecter à des catalogues de bibliothèques SRU/SRW (z3950). Isidore enrichit ces données en les croisant, en les qualifiant avec des thésaurii, des référentiels, des listes d&#8217;auteurs et les ré-exposent selon les principes du linked data. Pour utiliser ces données, un site web a été créé : www.rechercheisidore.fr. Vous pouvez donc interroger les articles de <a href="http://revues.org" target="_blank">Revues.org</a>, <a href="http://cairn.info">Cairn</a>, <a href="http://www.persee.fr" target="_blank">Persée</a>, les ouvrages, textes, images de <a href="http://gallica.bnf.fr">Gallica</a>, <a href="http://halshs.archives-ouvertes.fr" target="_blank">HALSHS</a>, <a href="http://medihal.archives-ouvertes.fr" target="_blank">MédiHAL</a> avec un seul formulaire et avec des liens entre toutes ces données.</p>
<p>Dans isidore, les métadonnées sont transformées en RDF, ainsi les données des shs entrent dans le web de données.</p>
<p>Mais nous sommes en version béta, alors le travail continu.</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/436/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Construire le web de données pour les shs : comment utiliser RDFa ?</title>
		<link>http://blog.stephanepouyllau.org/401</link>
		<comments>http://blog.stephanepouyllau.org/401#comments</comments>
		<pubDate>Mon, 30 Aug 2010 07:11:54 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[archives]]></category>
		<category><![CDATA[métadonnées]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[rdfa]]></category>
		<category><![CDATA[web of data]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=401</guid>
		<description><![CDATA[Le web est l&#8217;un des vecteurs principaux de la diffusion des données de recherche en sciences humaines et sociales. Il permet de diffuser et d&#8217;éditer presque tous les matériaux utilisés par le chercheur et l&#8217;enseignant : de l&#8217;archive ou la bibliothèque à la publication électronique en passant par le séminaire, le colloque, la revues et le [...]]]></description>
			<content:encoded><![CDATA[<p>Le web est l&#8217;un des vecteurs principaux de la diffusion des données de recherche en sciences humaines et sociales. Il permet de diffuser et d&#8217;éditer presque tous les matériaux utilisés par le chercheur et l&#8217;enseignant : de l&#8217;archive ou la bibliothèque à la publication électronique en passant par le séminaire, le colloque, la revues et le livre. L&#8217;utilisation du web comme outil d&#8217;édition, de publication et de diffusion a permis de démultiplier les accès aux documents et à l&#8217;information. Mais depuis 20 ans, l&#8217;effort a plus porté sur la mise à disposition de documents numériques (ouvrages, articles, corpus) que sur la structuration de l&#8217;information contenue dans ces documents : il est vrai que l&#8217;essor des moteurs de recherche traditionnels depuis les années 90 (d&#8217;Altavista à Google) ont permis d&#8217;atteindre et de s&#8217;y « retrouver » dans ces milliards de documents qui sont sur le web aujourd&#8217;hui. En revanche, la publication électronique des contenus des bases de données – les données elles-même qui ont toujours leurs propres structurations, pose encore des questions et des difficultés qui font que le web, s&#8217;il est plein de documents et relativement vide de données et d&#8217;informations structurées. Ainsi, les outils d&#8217;exploitation des documents que nous utilisons aujourd&#8217;hui, tel les moteurs de recherche, fonctionnent sur des réservoirs de documents encore trop cloisonnés. Ainsi, construire une page web d&#8217;information sur l&#8217;historien Georges Duby nécessite toujours d&#8217;adresser plusieurs questions (requêtes) à plusieurs moteurs de recherche (généralistes et spécialisés) ou à plusieurs formulaires de bases de données et cela même si, depuis dix ans, les techniques de l&#8217;interopérabilité ont fait de très grand progrès. Ce web « cloisonné » ne permet pas aux machines de travailler et certaines parties du web deviennent invisibles aux moteurs de recherche et même parfois aux humains (qui s&#8217;est déjà retrouver devant un formulaire de bdd en ligne un peu froid ?). Bien sur, un homme peut le faire, à la main, mais s&#8217;il veut se faire aider de machine, pour gagner du temps ou mieux, traiter plus de données, cela devient assez complexe. Surtout pour un chercheur qui ne maitrise pas forcement le SQL et dont ce n&#8217;est pas le métier. Ainsi, les données numériques sont bien rangées dans de multiples bases de données ou silot, mais nous n&#8217;avons construit que de simples petits « judas » afin de les regarder et l&#8217;éditorialisation des données ne fait pas tout, pis, elle cache parfois, sous une couche « cosmétique » (cela dit souvent nécessaire), une faible structuration des données. La faible structuration des données freine très souvent les modes de  pérennisation de ces dernières donc la possibilité de leur ré-exploitation future. Il nous faut faire mieux.</p>
<p><strong>Comment dépasser cela ?</strong></p>
<p>Comment rendre plus accessible encore, non pas simplement les documents (au sens des fichiers) mais les informations contenues dans ces derniers sans appauvrir les formats de structuration de l&#8217;information. Comment se donner l&#8217;opportunité de construire des outils d&#8217;aide à la recherche permettant de construire &#8211; par exemple &#8211; la notice encyclopédique de George Duby, en présentant, non pas simplement la compilation du signalement de ses articles, ouvrages, conférences, mais aussi les thèmes qu&#8217;il a abordé au cours de sa carrière et en les reliant à des notions, des définitions, des illustrations, des ouvrages d&#8217;autres auteurs ? C&#8217;est tout l&#8217;enjeu de la construction du web de données, cette extension du web dont je parlais dans mon dernier billet. Il nous faut tout d&#8217;abord libérer les données après l&#8217;avoir fait avec les bases de données elles-même.</p>
<p><strong>Comment faire ?</strong></p>
<p>Tout d&#8217;abord un peu d&#8217;histoire. Dans les années 1995-2000, tous les acteurs de la recherche et de la culture ont massivement édité leurs bases de données sur le web, c&#8217;était l&#8217;enjeu du moment : tout le monde voulait mettre sa base en ligne, c&#8217;était un nouveau cycle dans la diffusion des documents (après le minitel, les connexions client/serveurs). Nous sommes entrés, depuis quelques années, dans un nouveau cycle dont la première phase (la première « marche » je préfère dire) a été l&#8217;interopérabilité des bases de données. En parallèle de cette phase, qui se poursuit, nous devons « ouvrir les données ». Quel curieuse expression ! Simplement, il s&#8217;agit d&#8217;exposer les données, dans toutes leurs complexités, en utilisant le cadre de la modélisation en RDF. Pour cela, il nous faut apprendre et développer des modèles de données, faire des choix de vocabulaires documentaires afin de décrire l&#8217;information contenue dans une page web, un billet de blog, un article, un inventaire de fonds d&#8217;archive, un corpus, un thésaurus ou encore une notice de bibliothèque. Pour ouvrir ces données il faut être capable de dire : « tiens ça, c&#8217;est le titre et ça là, c&#8217;est l&#8217;auteur et je te prouve que c&#8217;est bien l&#8217;auteur car je suis capable de le relier, par un principe ouvert, normalisé et connu de tous, à un référentiel (les auteurs du sudoc par exemple) et à une forme de vocabulaire (du mods, du dublin core simple, etc.) » : les documentalistes savent très bien faire cela. Ainsi, ouvrir ses données – participer à la construction du web de données &#8211; cela revient donc à structurer de l&#8217;information avec des règles communes, valables pour tout le monde du web et où donc l&#8217;implicite n&#8217;est pas le bienvenu. Ouvrir ses données au monde c&#8217;est donc vouloir diffuser les données et par uniquement les documents et surtout dire quel choix j&#8217;ai fais pour structurer l&#8217;information. Les documentalistes font (devraient) s&#8217;y régaler.</p>
<p>Avec <a href="http://www.lespetitescases.net/et-si-on-semantisait-un-peu-le-web" target="_blank">l&#8217;aide de Got</a>, je vais présenter un exemple simple. Il est possible d&#8217;exprimer selon RDF des données structurées dans une page web écrite en HTML : il s&#8217;agit de la syntaxe RDFa (pour <em>Resource Description Framework – in – attributes</em>). <a href="http://fr.wikipedia.org/wiki/RDFa" target="_blank">RDFa permet donc d&#8217;utiliser la mécanique du RDF tout en utilisant comme support les balises HTML</a>.</p>
<p>Je prends comme exemple, très simple, <a href="http://www.stephanepouyllau.org/webdedonnees/medihal/rdfa/" target="_blank">une photographie et sa notice</a> venant de <a href="http://medihal.archives-ouvertes.fr/" target="_blank">MédiHAL, l&#8217;archive ouverte de photographies scientifiques</a> que j&#8217;ai co-créé et qui est développée par le CCSD et le CN2SV. Au travers de cet exemple, je souhaite montrer qu&#8217;il ne s&#8217;agit pas que de techniques documentaires, ou que de questions informatiques, ou encore que de questions d&#8217;édition : non, il s&#8217;agit de tous cela en même temps. Ainsi, construire le web de données c&#8217;est avant tout réunir plusieurs compétences et métiers pour envisager toutes les aspects.</p>
<p>La consultation avec un simple navigateur web de la notice exemple ne révèle pas la présence d&#8217;une structuration de l&#8217;information selon les principes RDF et pourtant, si l&#8217;on regarde le code source, il y a une structuration, des vocabulaires RDF et des étiquettes structurant l&#8217;information. Ainsi, dans un premier temps, il faut dire que cette page contiendra du RDFa : j&#8217;ai modifié le doctype XHTML. Il est remplaçé par un doctype XHTML+RDFa :</p>
<p><code>&lt;!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"&gt;</code></p>
<p>Notez ensuite la présence de plusieurs vocabulaires documentaires qui vont nous permettre de structurer l&#8217;information :</p>
<pre><code>&lt;html xml:lang="fr" version="XHTML+RDFa 1.0"
        xmlns="http://www.w3.org/1999/xhtml"
        xmlns:foaf="http://xmlns.com/foaf/0.1/"
        xmlns:dc="http://purl.org/dc/elements/1.1/"
        xmlns:cc="http://creativecommons.org/ns#"
        xmlns:dcterms="http://purl.org/dc/terms/"
        xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
        xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"
        xmlns:xsd="http://www.w3.org/2001/XMLSchema#"&gt;</code></pre>
<p>Pourquoi ? Puisque nous allons structurer les données contenues dans cette page web, il nous faut dire « ça, c&#8217;est le titre » : <a href="http://www.lespetitescases.net/comprendre-rdf-en-moins-de-5-minutes" target="_blank">il s&#8217;agit de mettre une « étiquette » à une chaine de caractère du titre</a>. Il nous faut construire des triplets RDF qui, par l&#8217;utilisation de prédicats (verbe), relient l&#8217;étiquette (l&#8217;objet) à la chaine de caractère du titre (sujet). Puisque nous devons dire à quel vocabulaire nous faisons référence pour dire « c&#8217;est le titre », nous les déclarons en entête. Vous reconnaitrez sans doute « dc » pour le  dublin core simple (<em>dublin core elements set </em>ou dces), « dcterms » pour le dublin core terms, « cc » pour signaler la présence de données sous licence creative commons, « geo » pour la géolocalisation GPS, « foaf » pour décrire le document qui est ici une notice MédiHAL, etc. Ainsi je déclare là l&#8217;ensemble des vocabulaires documentaires que je vais utiliser ensuite et j&#8217;en donne la référence en ligne : <a href="http://purl.org/dc/elements/1.1/">http://purl.org/dc/elements/1.1/</a> pour le dublin core simple. Ces référentiels sont eux-même décrits et structurés en RDF : ils sont utilisés par tous et sont donc le point de référence, la norme.</p>
<p>Je trouve ensuite le début de ma notice, qui est matérialisée par une balise &lt;div&gt;  :</p>
<p><code>&lt;div typeof="foaf:Image" about="http://medihal.archives-ouvertes.fr/medihal-00501617"&gt;</code></p>
<p>Dans cette balise (fermante à la fin de ma notice), j&#8217;y mentionne que ce qui sera dans la balise &lt;div&gt; est une notice d&#8217;une image et que l&#8217;URL présente dans l&#8217;attribut « about » sera l&#8217;objet auquel se rapporte les informations que je vais structurer (donc ici, un conteneur, une notice, d&#8217;une image). Les informations décrites par la suite se rapportent à cette notice (rôle du &laquo;&nbsp;about&nbsp;&raquo;), ce conteneur, accessible à cette URL. Ma données est complexe, elle est composés d&#8217;une image (qui a plusieurs représentations : plusieurs vignettes, l&#8217;image déposée, etc.) et des métadonnées, voir des commentaires (publics, privés). Pour décrire ce conteneur, j&#8217;utilise <a href="http://xmlns.com/foaf/spec/#term_Image" target="_blank">le vocabulaire foa</a>f qui permet de décrire des ressources, des personnes ou des institutions et je vais utiliser l&#8217;élément foaf:Image. Pour la syntaxe, je vous invite à lire ce <a href="http://www.lespetitescases.net/rdfaiser-votre-blog-2" target="_blank">billet de Got</a> qui présente très en détail et très clairement la syntaxe des CURIEs (ou <em>Compact URIs</em>) dans le monde RDF.</p>
<p>Dans ce &lt;div&gt;, je vais pouvoir structurer l&#8217;information contenue dans la données en utilisant, dans cet exemple, la balise &lt;span&gt; ainsi que quelques attributs : « property » pour caractériser l&#8217;information avec un vocabulaire, « rel » pour relier de l&#8217;information directement au conteneur. Ainsi pour le titre de l&#8217;image, je vais utiliser le dublin core simple (dces), nous aurons :</p>
<p><code>&lt;span property="dc:title"&gt;Madagascar : Vallée de l'Onive aux environs de Tsinjoarivo&lt;/span&gt;</code></p>
<p>Pour l&#8217;image en jpg présentée dans la notice (qui est l&#8217;une des représentations possibles de l&#8217;image) :</p>
<p><code>&lt;span rel="foaf:thumbnail" about="http://medihal.archives-ouvertes.fr/medihal-00501617"&gt;<br />
&lt;img title="Madagascar..." id="thumb320" src="http://medihal.archives-ouvertes.fr/docs/00/50/16/17/archives/thumb320.jpg" border="0" /&gt;&lt;/span&gt;</code></p>
<p>Là, nous caractérisons que le contenu de &lt;img/&gt;, c&#8217;est à dire une image en 320 pixels, est l&#8217;une des versions de l&#8217;image de la notice représentée par «  http://medihal.archives-ouvertes.fr/medihal-00501617 » : il s&#8217;agit d&#8217;une vignette de l&#8217;image d&#8217;ou « foaf:thumbnail ». Dans ce cas, il possible d&#8217;implémenter les attributs rel et about dans la balise &lt;img&gt;. Je l&#8217;ai mis dans un &lt;span&gt; pour plus de clarté. Notez que j&#8217;ai répéré dans ce &lt;span&gt; l&#8217;attribut &laquo;&nbsp;about&nbsp;&raquo;, je n&#8217;y suis pas obligé, il est déjà signalé dans la balise &lt;span&gt; &laquo;&nbsp;mère&nbsp;&raquo;. Ce &lt;span&gt; structurant une version de l&#8217;image (une vignette de 320px de coté), j&#8217;ai préféré ré-indiquer ce &laquo;&nbsp;about&nbsp;&raquo; afin que vous compreniez bien que foaf:thumbnail (vignette) désigne une vignette de l&#8217;image déposée et dont l&#8217;URI est http://medihal.archives-ouvertes.fr/medihal-00501617.</p>
<p>Pour la légende, je vais utiliser le vocabulaire dublin core <em>terms</em>, le plus riche des dublin core avec l&#8217;étiquette dc:abstract (pour résumé) :</p>
<p><code>&lt;span property="dcterms:abstract"&gt;Paysage rural de collines à  proximité de Tsinjoarivo ; Au premier plan le bord de la terrasse de la vallée de l'Onive ; A l'arrière-plan, cultures en terrasse avec des rizières en escaliers, irriguées par un affluent du fleuve&lt;/span&gt;</code></p>
<p>Je pourrais aussi, plus simplement mais en introduisant un peu d&#8217;implicite, utiliser dces avec l&#8217;étiquette dc:description :</p>
<p><code>&lt;span property="dc:description"&gt;Paysage rural de collines à  proximité de Tsinjoarivo ; Au premier plan le bord de la terrasse de la vallée de l'Onive ; A l'arrière-plan, cultures en terrasse avec des rizières en escaliers, irriguées par un affluent du fleuve&lt;/span&gt;</code></p>
<p>Pour exprimer les mots clés, je vais utiliser une nouvelle fois le dces :</p>
<p><code>&lt;span property="dc:subject"&gt;&lt;a href="[lien vers mes mots-clés]"&gt;Madagascar&lt;/a&gt;&lt;/span&gt;</code></p>
<p>Il est possibilité là aussi d&#8217;être plus riche, en reliant mon mot-clés à un référentiel (thésaurus par exemple) en utilisant les vocabulaires sioc et skos pour exprimer des concepts et les liaisons.</p>
<p>Pour la géolocalisation de mon image, je vais utiliser le dublin core terms avec l&#8217;étiquette « spacial », qui va me permettre de relier mon conteneur (foaf:Image) à des valeurs de latitude et de longitude. Ainsi, j&#8217;exprime dans dcterms:spatial une latitude et une longitude issues d&#8217;un GPS ou d&#8217;une géolocalisation en spécifiant que je fais référence au vocabulaire WGS validé par le W3C (geo:lat et geo:long).</p>
<p><code>&lt;span rel="dcterms:spatial"&gt;<br />
&lt;span property="geo:lat" content="-19.644527589975"&gt;&lt;/span&gt;<br />
&lt;span property="geo:long" content="47.709846500067"&gt;&lt;/span&gt;<br />
&lt;/span&gt;</code></p>
<p>Je me limite ici à quelques éléments de cette image (en prenant du DC simple pour être pédagogique), il est possible d&#8217;aller plus loin dans la structuration (en utilisant du DC terms ou d&#8217;autres vocalulaires).</p>
<p><strong>Conclusion</strong></p>
<p>Le web de données est une méthode qui consiste à utiliser le web comme un espace ou les données sont structurées : c&#8217;est à dire que l&#8217;information d&#8217;un document (pdf, jpg, txt, etc.) est cartographiée, repérée, signalée et reliée à des vocabulaires, accessibles eux-même sur le web et dont la structuration est connue et explicitée. C&#8217;est un formidable enjeux pour les documentalistes, les bibliothèques et les ingénieurs et techniciens en <em>digital humanities</em> qui construisent des corpus scientifiques et les diffusent en ligne. Le RDFa est l&#8217;une des techniques, l&#8217;une des mécaniques possible et elle est relativement simple à comprendre car elle s&#8217;inscrit dans une évolution naturelle des choses : une sémantisation de la page web via le code HTML. Il s&#8217;agit d&#8217;une révolution mais qui s&#8217;appuie sur des éléments que tout les professionnels de l&#8217;IST peuvent maitriser. J&#8217;ai toujours pensé et dit que l&#8217;OAI-PMH était (est) la première marche vers le web de données, je pense qu&#8217;RDFa est la deuxième, du moins c&#8217;est un pont très simple pour mieux comprendre RDF et les techniques du web de données.</p>
<p>Stéphane.</p>
<p>Liens utiles pour aller plus loin :</p>
<ul>
<li>Exemple utilisé : <a href="http://www.stephanepouyllau.org/webdedonnees/medihal/rdfa/" target="_blank">http://www.stephanepouyllau.org/webdedonnees/medihal/rdfa/</a></li>
<li>Code source : <a href="http://www.stephanepouyllau.org/webdedonnees/medihal/rdfa/medihal-rdfa.txt" target="_blank">http://www.stephanepouyllau.org/webdedonnees/medihal/rdfa/medihal-rdfa.txt</a></li>
<li>Une <a href="http://www.w3.org/RDF/Validator/ARPServlet?PARSE=Parse+URI%3A+&amp;TRIPLES_AND_GRAPH=PRINT_TRIPLES&amp;FORMAT=PNG_EMBED&amp;URI=http://www.w3.org/2007/08/pyRdfa/extract%3Furi%3Dhttp%3A//www.stephanepouyllau.org/webdedonnees/medihal/rdfa/" target="_blank">vue sur le contenu RDFa</a> de cet exemple.</li>
<li>Comprendre RDF : <a href="http://www.lespetitescases.net/comprendre-rdf-en-moins-de-5-minutes" target="_blank">http://www.lespetitescases.net/comprendre-rdf-en-moins-de-5-minutes</a></li>
<li>Mettre du RDFa dans son blog : <a href="http://www.lespetitescases.net/rdfaiser-votre-blog-1-la-theorie" target="_blank">http://www.lespetitescases.net/rdfaiser-votre-blog-1-la-theorie</a> ; <a href="http://www.lespetitescases.net/rdfaiser-votre-blog-2-la-pratique" target="_blank">http://www.lespetitescases.net/rdfaiser-votre-blog-2-la-pratique</a> ; <a href="http://www.lespetitescases.net/rdfaiser-votre-blog-3-exploitation" target="_blank">http://www.lespetitescases.net/rdfaiser-votre-blog-3-exploitation</a></li>
<li>Vidéo de l&#8217;ADBS : <a href="http://www.adbs.fr/le-web-de-donnees-perspectives-pour-les-metiers-de-l-information-documentation-79361.htm" target="_blank">Le Web de données : perspectives pour les métiers de l&#8217;information documentation</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/401/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>La communauté française des digital humanities</title>
		<link>http://blog.stephanepouyllau.org/373</link>
		<comments>http://blog.stephanepouyllau.org/373#comments</comments>
		<pubDate>Sun, 23 May 2010 08:38:33 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[archives]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[pérennisation]]></category>
		<category><![CDATA[recherche]]></category>
		<category><![CDATA[science]]></category>
		<category><![CDATA[sources historiques]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=373</guid>
		<description><![CDATA[Après deux jours d&#8217;ateliers, démos, débats, discussions le THATCamp Paris 2010, la non-conférence sur les digital humanities, lance le Manifeste des digital humanities. Ce texte, fondateur de la communauté des digital humanities en France est très important. Il a permis tout d&#8217;abord de répondre à la question posée dans le THATCamp : &#171;&#160;voulons-nous travailler ensemble [...]]]></description>
			<content:encoded><![CDATA[<div><a href="http://www.flickr.com/photos/revuesorg/4624412716/" title="THATCamp Paris 2010, sur la Baleine blanche by Revues.org, on Flickr - Crédits : Elodie Picard / CC"><img src="http://farm4.static.flickr.com/3363/4624412716_9bed9d13eb.jpg" width="200" alt="THATCamp Paris 2010, sur la Baleine blanche - Crédits : Elodie Picard / CC" /></a></div>
<p>Après deux jours d&#8217;ateliers, démos, débats, discussions le <a href="http://tcp.hypotheses.org" target="_blank">THATCamp Paris 2010</a>, la non-conférence sur les <em>digital humanities</em>, lance <a href="http://tcp.hypotheses.org/318">le Manifeste des <em>digital humanities</em></a>. Ce texte, fondateur de la communauté des <em>digital humanities</em> en France est très important. Il a permis tout d&#8217;abord de répondre à la question posée dans le THATCamp : &laquo;&nbsp;voulons-nous travailler ensemble ?&nbsp;&raquo;. La réponse est largement positive à mon sens.</p>
<p>Ce besoin de travailler ensemble est partagé par tous, et nous avons vu qu&#8217;il dépasse bien évidement les cadres institutionnels actuels. C&#8217;est une vision personnelle, mais ces derniers me semblent peu adaptés au développement d&#8217;une communauté qui a conscience que les actions locales se font mieux si elle s&#8217;appuient sur des structures nationales mutualisées (ex. grilles de calcul, infrastructures d&#8217;hébergement de données, services d&#8217;archivage de données numériques). J&#8217;invite tous les lecteurs de ce blog, qui soient ou qui se sentent acteurs des <em>digital humanities</em> à signer ce Manifeste qui pose les bases claires d&#8217;une communauté se donnant des objectifs précis.</p>
<p>Je pense en particulier aux documentalistes qui sont dans les laboratoires de recherche des sciences humaines et sociales, et dont certains étaient au THATCamp Paris 2010, mais que je trouve toujours trop absents de ces moments de réflexion sur l&#8217;évolution des métiers, méthodes, etc. Les documentalistes font un travail de production sur le terrain très important. Au delà des centres de documentation et des bibliothèques de recherche, certains coordonnent réellement des projets de recherche sur le plan documentaire et donc sont pleinement dans les problématiques dont nous avons discutées lors de ces deux jours. </p>
<p>Par exemple, le point 14 du Manifeste propose de construire, de façon itérative, des cyberinfrastructures correspondant à des besoins réels. Voici un chalenge difficile, pris entre les intérêts des économies locales de la recherche proches des chercheurs (Universités, Maisons des sciences de l&#8217;homme par exemple) et ceux &laquo;&nbsp;inter-nationaux&nbsp;&raquo;, européens par exemple, pourtant nécessaires mais complexe à comprendre tant il est difficile pour un chercheur de s&#8217;y projeter.<br />
Un exemple a été pris par <a target="_blank" href="http://www.lespetitescases.net/une-communaute-des-digital-humanities-est-nee">Got</a> sur les questions de l&#8217;archivage des données numériques (la mémoire du XXIe siècle). Il faut accepter de faire confiance à une autre institution, à une autre personne, pour archiver ses propres données, issues d&#8217;une collecte qui a pu prendre, parfois, toute une vie. &laquo;&nbsp;Accepter de faire confiance&nbsp;&raquo; c&#8217;est avant tout reconnaitre que l&#8217;on est pas compétent pour traiter tel ou tel sujets, ou techniques, ou méthode. Cela ne veut pas dire que l&#8217;on va perdre &laquo;&nbsp;la main&nbsp;&raquo; sur les données (<a href="https://federation.renater.fr/" target="_blank">les mécanismes de contrôle d&#8217;accès existent</a> et <a href="http://www.openidfrance.fr/" target="_blank">sont fiables</a>). Cela ne veut pas dire non plus qu&#8217;il ne faut pas tenter de comprendre (loin de moi l&#8217;idée de saucissonner les métiers et les taches), mais c&#8217;est reconnaitre qu&#8217;à un moment, il faut accepter de faire 10 à 15% d&#8217;un travail pour lequel l&#8217;on ne sera pas reconnu, qui ne comptera pas dans son évaluation personnelle, afin de transmettre à un autre de l&#8217;information afin qu&#8217;il l&#8217;archive, la traite, l&#8217;édite, la valorise, la distribue, etc. et vous la repasse parfois pour en faire autre chose. C&#8217;est l&#8217;un des enjeux majeur du Manifeste selon moi. Les cyberinfrastructures seront ce que nous en ferons, pour cela il faut accepter de faire 10 à 15% du chemin vers le collègue (l&#8217;ingénieur ou le chercheur) qui a une ou plusieurs compétences et donc qui a un <strong>Métier</strong>. C&#8217;est aussi considérer que ce qu&#8217;il fait est égal à ce l&#8217;on fait. Publier un article dans une revue de rang A est égal à concevoir un logiciel permettant de calculer des résultats à partir de données : la seconde tache permettant de faire la première, la première est dépendante de la seconde et la seconde sans la première dans pas de finalité réelle (exception faite pour les questions d&#8217;archivages).</p>
<p>Pour moi, il s&#8217;agit là d&#8217;une formidable aventure que la communauté des <em>digital humanities</em>, rassemblée autour du Manifeste, doit mener.</p>
<div>Crédits photos : Elodie Picard/CLEO-Revues.org &#8211; Licence Creative Commons : Attribution-NonCommercial-NoDerivs 2.0 Generic</div>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/373/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>THATCamp Paris 2010 : la communauté des digital humanities de France s&#8217;organise</title>
		<link>http://blog.stephanepouyllau.org/362</link>
		<comments>http://blog.stephanepouyllau.org/362#comments</comments>
		<pubDate>Wed, 19 May 2010 06:54:46 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[e-rudition]]></category>
		<category><![CDATA[interopérabilité]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=362</guid>
		<description><![CDATA[La première non-conférence française sur les sciences humaines et sociales numériques (digital humanities) se tient depuis hier matin et se poursuit aujourd&#8217;hui à Paris, sur une péniche entre la BNF et le ministère des finances Bercy : David contre des Goliats ? Non, pas réellement, cette communauté est très ouverte : c&#8217;est le THATCamp Paris [...]]]></description>
			<content:encoded><![CDATA[<p>La <a href="http://tcp.hypotheses.org/152">première non-conférence française sur les sciences humaines et sociales numériques</a> (<em>digital humanities</em>) se tient depuis hier matin et se poursuit aujourd&#8217;hui à Paris, sur une <a href="http://tcp.hypotheses.org/253">péniche entre la BNF et le ministère des finances Bercy</a> : David contre des Goliats ? Non, pas réellement, cette communauté est très ouverte : c&#8217;est le <a href="http://tcp.hypotheses.org/">THATCamp Paris 2010</a>. Cette non-conférence regroupe des ingénieurs, des enseignants-chercheurs, des techniciens, des chercheurs, des prestataires de services venant du privé, des doctorants, des post-doc, des artistes qui ont envie et besoin de travailler ensemble pour concevoir des nouvelles méthodes de travail, de nouveaux outils hybrides (hyper mashup-é), de mélanger des métiers, construire des cyber-infrastructures itératives afin de donner du liant et du sens numérique aux projets de recherche en sciences humaines et sociales. Ces projets ont pour la plupart un volet numérique (ne serait-ce que la bibliographie mise en commun entre les chercheurs d&#8217;un projet) et de plus en plus de projet doivent diffuser à la fois les sources et résultats de leurs recherches. Donc, il y avait beaucoup de monde hier sur cette péniche et l&#8217;ambiance était très studieuse, sérieuse mais aussi très chaleureuse. J&#8217;ai eu le plaisir d&#8217;animer un atelier sur les fonds iconographiques numériques qui, j&#8217;espère, a été intense pour les participants (que je remercie au passage). Le compte-rendu de cette atelier sera diffusé en ligne, sur <a href="http://www.digitalhumanities.cnrs.fr/wikis/tcp" target="_blank">le wiki du THATCamp Paris 2010</a> et les grandes lignes serviront, sans doute, à construire le <a href="http://www.digitalhumanities.cnrs.fr/wikis/tcp/index.php?title=Manifeste" target="_blank">Manifeste</a> qui sortira, entre autres choses, de cette non-conférence. A quand la prochaine édition ?</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/362/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Diffusion et édition de bases de données (1)</title>
		<link>http://blog.stephanepouyllau.org/230</link>
		<comments>http://blog.stephanepouyllau.org/230#comments</comments>
		<pubDate>Wed, 29 Jul 2009 09:40:43 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[bdd]]></category>
		<category><![CDATA[gestion de projet]]></category>
		<category><![CDATA[informatisation]]></category>
		<category><![CDATA[pérennisation]]></category>
		<category><![CDATA[recherche]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=230</guid>
		<description><![CDATA[Bonjour, La construction des savoirs passe par l&#8217;échange, la discussion, la critique et le partage. A l&#8217;heure ou l&#8217;on utilise la compétition entre les acteurs du monde des sciences pour démanteler les structures recherche, de plus en plus de données : primaires, secondaires ou/et tertiaires sont diffusées ou éditées en ligne sur le web. Dans [...]]]></description>
			<content:encoded><![CDATA[<p>Bonjour,</p>
<p>La construction des savoirs passe par l&#8217;échange, la discussion, la critique et le partage. A l&#8217;heure ou l&#8217;on utilise la compétition entre les acteurs du monde des sciences pour démanteler les structures recherche, de plus en plus de données : primaires, secondaires ou/et tertiaires sont diffusées ou éditées en ligne sur le web. <a href="../digital-humanities-en-france-le-temps-des-pionniers" target="_blank">Dans un précédent billet</a> je tentais, assez maladroitement, de dresser une mini chronologie des digital humanities &laquo;&nbsp;à la française&nbsp;&raquo; comme dirait Lou Burnard et ce depuis l&#8217;arrivée du vecteur web. Ce découpage n&#8217;est pas si simple car les acteurs des SHS ne sont pas tous dans une case bien précise. L&#8217;appropriation des méthodes et des bonnes pratiques de l&#8217;édition électronique sur support web est très inégale et la notion même &laquo;&nbsp;d&#8217;édition électronique&nbsp;&raquo; fait débat : beaucoup de chercheurs dissocient même l&#8217;action &laquo;&nbsp;d&#8217;éditer&nbsp;&raquo; du monde du web : un peu comme si le web ne méritait pas d&#8217;avoir ses éditeurs et l&#8217;idée même de qualité dans l&#8217;édition électronique semble parfois impossible à imaginer chez certains. Il faut donc faire œuvre de pédagogie et reprendre nos bâtons d&#8217;évangélisateurs pour diffuser les bonnes pratiques de ce domaine, savant mélange de ce qui se fait ailleurs et de ce que nous savons faire de façon collective.</p>
<p>Lors d&#8217;une journée d&#8217;information organisée par le Centre national de la recherche scientifique (CNRS) à Ivry-sur-Seine, Thierry Buquet, webmaster de l&#8217;Institut de recherche et d&#8217;histoire des textes (l&#8217;IRHT est un laboratoire du CNRS), réalisa un état de l&#8217;art de l&#8217;édition électronique dans les SHS en 2009 : il indiquait alors le fait que certains &laquo;&nbsp;chercheurs éditent des bases de données&nbsp;&raquo;. Dans le trop petit monde des humanités numériques, tout le monde comprend presque instantanément ce que cela veut dire et implique et surtout le fait que l&#8217;action d&#8217;éditer une BDD revient à fabriquer une &laquo;&nbsp;vue&nbsp;&raquo;, un &laquo;&nbsp;regard&nbsp;&raquo; sur des méta-données ou des données, à un instant &laquo;&nbsp;T&nbsp;&raquo; : ce sont ces vues qui sont éditées. Les données ont pu être collectées il y a très longtemps, ou bien hier, et elles vont continuer à évoluer dans le temps. Il faudra les pérenniser, les archiver un jour&#8230; Ainsi <strong>la BDD est un réservoir dont l&#8217;une des vocations est de donner accès à de l&#8217;information au travers de méta-données (notices bibliographiques par exemple) ou directement de &laquo;&nbsp;données brutes&nbsp;&raquo; (des données spatiales, des données historiques, etc.)</strong> soit à un moment &laquo;&nbsp;T&nbsp;&raquo; via une édition électronique statique (PDF, etc.), soit via un accès &laquo;&nbsp;en flux&nbsp;&raquo; via une interface web de recherche par exemple ou via un flux d&#8217;information de type syndication (RSS, Atom, etc.), nous pouvons parler là d&#8217;édition dynamique des données. Dans ce dernier cas, les informations sont rendues accessibles juste après validation par le chercheurs ou du moins celui qui a l&#8217;autorité de valider des informations, mais le contenu de la BDD est vivant : de nouvelles données arrivent, certaines sont corrigées, d&#8217;autres supprimées (ce qui pose un problème pour les futurs historiens des sciences), etc. Il s&#8217;agit de bien faire la différence entre le fait de stocker de méta-données et des données et de mettre en place des moyens d&#8217;éditions de ces éléments. Éditer une BDD consiste donc à créer des vues, des regards, souvent multiples sur ensemble contenu dans un système d&#8217;information ou simplement dans un gestionnaire de bases de données.</p>
<p>Cependant, le flux n&#8217;est qu&#8217;une répétition de &laquo;&nbsp;vues à l&#8217;instant T&nbsp;&raquo; dont le cycle peut-être très court : quelques minutes, secondes, etc. Cette notion de diffusion des &laquo;&nbsp;informations en cours de traitement&nbsp;&raquo; (<em>data in progress</em>) est assez nouvelle pour les chercheurs des sciences humaines et sociales et elle peut être perçue de façon contradictoire par certains d&#8217;entre eux, plus habitués à communiquer seulement les résultats de la recherche qu&#8217;une combinaison de résultats étayés par les sources. Concevoir la BDD en SHS comme <strong>un réservoir évolutif</strong> de méta-données ou de données et en éditer des vues à l&#8217;instant &laquo;&nbsp;T&nbsp;&raquo;, permet d&#8217;associer à un article les information sources ayant été utilisées dans celui-ci. Cela permet aussi de diffuser plus largement des données vers d&#8217;autres collègues, etc.</p>
<p>Mais il y a un revers à la médaille : l&#8217;abandon de BDD après la publication finale d&#8217;une recherche (c&#8217;est le cas dans les projets ANR qui sont plus court que les grands programmes des années 70-90). Avec le numérique et l&#8217;obsolescence des formats, logiciels, etc. cela provoque (provoquera) une perte de données. Il faut donc réfléchir en amont à la pérennisation/archivage et aux valorisations futures des BDD construites sur le modèle réservoir/vues. Une piste pour anticiper ces questions : application de certaines méthodes de travail très simples :</p>
<ul>
<li>études, rapport d&#8217;étonnement, veille</li>
<li>gestion de projets (scénarii pour atteindre l&nbsp;&raquo;objectif final, planning, budget)</li>
<li>étapes de travail (objectifs à atteindre)</li>
<li>validation intermédiaire (audits 	internes)</li>
<li>évaluation des risques</li>
</ul>
<p>associée à :</p>
<ul>
<li>l&#8217;utilisation de standards internationaux normalisés pour l&#8217;encodage des données</li>
<li>l&#8217;utilisation de formats &laquo;&nbsp;ouverts&nbsp;&raquo; 	(dont les algorithmes sont ouverts, libres, et bien documentés, 	etc.)</li>
<li>la réalisation d&#8217;un effort pour intégrer des outils structures mutualisées.</li>
</ul>
<p>permet assez facilement de construire et de diffuser des BDD dans le domaine des SHS. Cette réflexion et cette mise en œuvre de solutions, dans les équipes de recherche SHS, c&#8217;est le métier <a href="http://www.digitalhumanities.cnrs.fr/" target="_blank">des ingénieurs, assistants ingénieurs en humanités numériques</a>, mais c&#8217;est aussi celui des <a href="http://renatis.cnrs.fr/" target="_blank">documentalistes et e-documentalistes</a>, des bibliothécaires, des informaticiens.</p>
<p>Comprendre cette notion de réservoir d&#8217;information prenant la forme de méta-données ou de données (<em>data in progress</em>) et la possibilité de créer des vues multiples &#8211; qui elles peuvent être éditées et liées à un ouvrage numérique ou un article &#8211; est un point fondamental dans le déroulement d&#8217;un programme de recherche. L&#8217;édition d&#8217;une BDD ne peut se limiter à la mise en place d&#8217;un formulaire de recherche, à l&#8217;élaboration d&#8217;une maquette graphique pour en visualiser les résultats et en faire la promotion ; il faut concevoir les BDD comme des réservoirs capables de diffuser des flux de méta-données ou de données ayant de multiples formes, mais utilisant des formats connus, standards, et donnant accès à de l&#8217;information évolutive et validée par versions progressives. Cela nous amènerait-il plus facilement <a href="http://www.lespetitescases.net/carcans-de-la-pensee-hierarchique-et-documentaire-1" target="_blank">vers le web de données ?</a></p>
<p>Bien sur toutes les BDD n&#8217;ont pas cette vocation, certaines sont uniquement personnelles : le temps d&#8217;un article ou d&#8217;un ouvrage, mais force est de constater que le nombre de BDD personnelles (sous FileMaker Pro par exemple), qui ont tendance à évoluer vers une BDD &laquo;&nbsp;pour le web&nbsp;&raquo;, est en progression constante depuis quelques années. C&#8217;est bien pour la construction des collectives des savoirs et cela fait avancer l&#8217;idée de l&#8217;importance de la pérennisation des données : mais attention à ne pas déraper dans sens inverse.</p>
<p>Les BDD ne sont pas des livres, mais de nos jours, elles permettent d&#8217;en faire. Les BDD ne sont pas des livres et donc elles ne se posent pas, comme un livre, sur l&#8217;étagère d&#8217;une bibliothèque.</p>
<p>Dans la partie 2, je présenterai la notion d&#8217;interopérabilité entre les BDD, que <a href="http://www.digitalhumanities.cnrs.fr/wikis/edelec-shs/index.php/Accueil" target="_blank">je détaillerai lors de l&#8217;université d&#8217;été du <a href="http://cleo.cnrs.fr" target="_blank">Centre pour l&#8217;édition scientifique ouverte</a> (CLEO)</a>.</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/230/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Des données brutes 2.0</title>
		<link>http://blog.stephanepouyllau.org/242</link>
		<comments>http://blog.stephanepouyllau.org/242#comments</comments>
		<pubDate>Wed, 15 Jul 2009 17:57:17 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[archives numériques]]></category>
		<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[dublincore]]></category>
		<category><![CDATA[e-rudition]]></category>
		<category><![CDATA[métadonnées]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[web 2.0]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=242</guid>
		<description><![CDATA[L&#8217;administration Américaine a lancé data.gov : une plateforme d&#8217;accès aux données brutes de la santé, l&#8217;environnement, l&#8217;énergie, recherche, éducation. C&#8217;est très (trop?) ambitieux, voir utopique (mais il s&#8217;agit des USA) et d&#8217;ailleurs cet avis est partagé. Mais l&#8217;initiative est là et la plateforme déjà en ligne : il s&#8217;agit d&#8217;un projet hybride entre archives, recherche [...]]]></description>
			<content:encoded><![CDATA[<p>L&#8217;administration Américaine a lancé<a href="http://data.gov" target="_blank"> data.gov</a> : une plateforme d&#8217;accès aux données brutes de la santé, l&#8217;environnement, l&#8217;énergie, recherche, éducation. C&#8217;est très (trop?) ambitieux, voir utopique (mais il s&#8217;agit des USA) et <a href="http://www.christian-faure.net/2009/05/16/ladministration-obama-met-sa-strategie-it-au-coeur-de-sa-nouvelle-politique/" target="_blank">d&#8217;ailleurs cet avis est partagé</a>. Mais l&#8217;initiative est là et la plateforme déjà en ligne : il s&#8217;agit d&#8217;un projet hybride entre archives, recherche et accès. Ce projet, une récente discussion avec <a href="http://www.lespetitescases.net" target="_blank">Got</a>, croisée d&#8217;une journée avec les collègues du Centre de calcul de l&#8217;IN2P3-CNRS (qui héberge beaucoup de données issues des SHS), m&#8217;a conforté sur la notion et la nécessité de réservoirs de données brutes pour la recherche en SHS.</p>
<p>Ces réservoirs existent aujourd&#8217;hui dans les laboratoires de SHS, mais les données qu&#8217;ils contiennent sont souvent encore perçues comme des données &laquo;&nbsp;privés&nbsp;&raquo;, réservées aux chercheurs locaux. Il est vrai qu&#8217;ils les ont collectées ou générées et ce travail n&#8217;est pas réellement reconnu dans le parcours d&#8217;un chercheur alors qu&#8217;il est fondamental. Ces données &laquo;&nbsp;pour la recherche&nbsp;&raquo; ont donc souvent tendance à &laquo;&nbsp;mourir&nbsp;&raquo; au fond de nos disques durs faut d&#8217;une infrastructure double : archivage des données (pour l&#8217;histoire), diffusion des données &laquo;&nbsp;brutes&nbsp;&raquo; et pas forcement éditorialisées dans une publication électronique académique mais mise à disposition de la communauté scientifique comportant un minimum d&#8217;appareil éditorial basé sur le Dublin Core Terms par exemple.  D&#8217;autant que souvent, ces données ont été collectées ou générées sur fonds publics (ne serait ce que le salaire du chercheur).</p>
<p>Bien sur, il faut pondérer ici le fait que certaines données sont sensibles de part leur nature et que la mise à disposition ou la diffusion est complexe et nécessite des barrières mobiles parfois très longues.</p>
<p>En france, il existe des initiatives intéressantes, encore trop peu soutenues financièrement, mais cela avance, cela se structure et des formations, pour les chercheurs et enseignants-chercheurs, voient le jour tel que <a title="Wiki de l'université d'été de l'édition électronique ouverte" href="http://www.digitalhumanities.cnrs.fr/wikis/edelec-shs/index.php/Accueil" target="_blank">l&#8217;université d&#8217;été de l&#8217;édition scientifique ouverte</a>, qui aura lieu en septembre 2009, ou bien<a href="http://www.digitalhumanities.cnrs.fr/wikis/ecole-sources-num/index.php/Accueil" target="_blank"> l&#8217;école thématique des centres nationaux de ressources numériques du CNRS dont le wiki est en ligne</a> avec toutes les communications, les bibliographies numériques, en ligne, etc.</p>
<p>Alors, en ce mois de juillet, j&#8217;ai envie de dire : &laquo;&nbsp;ouvrez vos données à vos collègues et au monde&nbsp;&raquo; et j&#8217;espère aussi, soyons fou, un donnees.gouv.fr ?</p>
<p>Il est temps, dirons certains, que je parte en vacances.</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/242/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Avoir le temps</title>
		<link>http://blog.stephanepouyllau.org/233</link>
		<comments>http://blog.stephanepouyllau.org/233#comments</comments>
		<pubDate>Sat, 25 Apr 2009 08:12:46 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[cn2sv]]></category>
		<category><![CDATA[e-rudition]]></category>
		<category><![CDATA[histoire]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=233</guid>
		<description><![CDATA[Bonjour, Le sp.Blog est-il mort ? Mon silence actuel est proportionnel au temps que je passe à faire mon vrai métier d&#8217;ingénieur d&#8217;études qui ressemble parfois, et de plus en plus, à un chemin de croix, doublé d&#8217;un slalom géant avec des tireurs d&#8217;élites postés dans les sapins. Accompagner la recherche est un métier passionnant, surtout quand [...]]]></description>
			<content:encoded><![CDATA[<p><a title="Gare de Lyon de stephane.pouyllau, sur Flickr" href="http://www.flickr.com/photos/stephanepouyllau/3299075143/"></a>Bonjour,</p>
<p><img class="alignleft" title="Gare de Lyon" src="http://farm4.static.flickr.com/3418/3299075143_666f9152e4_m.jpg" alt="" width="159" height="240" />Le sp.Blog est-il mort ? Mon silence actuel est proportionnel au temps que je passe à faire mon vrai métier d&#8217;ingénieur d&#8217;études qui ressemble parfois, et de plus en plus, à un chemin de croix, doublé d&#8217;un slalom géant avec des tireurs d&#8217;élites postés dans les sapins. Accompagner la recherche est un métier passionnant, surtout quand vous travaillez dans la structuration d&#8217;un domaine tel que le mien et nouveau en France, les <em>digital humanities</em>. L&#8217;apport du numérique dans la recherche en SHS change une chose principale : le rapport au temps.  Il est dur de résister aux sirènes de la communication scientifique <span style="text-decoration: line-through;">directe</span> immédiate, aux projets de recherche &laquo;&nbsp;flash&nbsp;&raquo;, etc. Donc, maintenir un projet structurant long, faire de l&#8217;appropriation de modèles, de techniques et d&#8217;outils, suivre des dizaines de projets quand l&#8217;équipe de recherche n&#8217;existe plus, bichonner un site ou un serveur web orphelin de ces pères fondateurs, etc. n&#8217;est pas choses très évidente. Bref, ce que le numérique change c&#8217;est le temps.</p>
<p>Vous l&#8217;aurez compris, j&#8217;ai donc moins de temps.</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/233/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>digital humanities in Orleans</title>
		<link>http://blog.stephanepouyllau.org/221</link>
		<comments>http://blog.stephanepouyllau.org/221#comments</comments>
		<pubDate>Fri, 06 Feb 2009 05:51:33 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[cn2sv]]></category>
		<category><![CDATA[e-rudition]]></category>
		<category><![CDATA[pérennisation]]></category>
		<category><![CDATA[recherche]]></category>
		<category><![CDATA[science]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=221</guid>
		<description><![CDATA[Bonjour, Tout en préparant un billet (depuis noël, aie aie aie) sur un outil d&#8217;encapsulage des méta-données dans une image avec les possibilités offertes par le format XML couplé à du Dublin Core, j&#8217;ai eu l&#8217;honneur d&#8217;intervenir dans le séminaire de recherche sur l&#8217;édition électronique et les digital humanities nouvellement créé par Richard Walter à [...]]]></description>
			<content:encoded><![CDATA[<p>Bonjour,</p>
<p>Tout en préparant un billet (depuis noël, aie aie aie) sur un outil d&#8217;encapsulage des méta-données dans une image avec les possibilités offertes par le format XML couplé à du Dublin Core, j&#8217;ai eu l&#8217;honneur d&#8217;intervenir <a href="http://www.ecole-erudition.org/publication-electronique" target="_blank">dans le séminaire de recherche sur l&#8217;édition électronique et les <em>digital humanities</em> nouvellement créé par Richard Walter</a> à l&#8217;<a lang="fr" href="http://www.irht.cnrs.fr/" target="_blank">Institut de Recherche et d&#8217;Histoire des Textes</a> du CNRS (Orléans). J&#8217;ai partagé la première séance de ce séminaire avec Michel Jacobson (DAF ; CNRS), responsable du <a href="http://crdo.risc.cnrs.fr/exist/crdo/" target="_blank">Centre de Ressources pour la Description de l&#8217;Oral</a> (Paris), un centre de ressources numériques du CNRS au même titre que celui que j&#8217;anime sur <a href="http://www.cn2sv.cnrs.fr" target="_blank">les données iconographiques</a>. Un compte-rendu de ce séminaire a été écrit par <a href="http://amontour.wordpress.com/2009/01/28/lire-dans-50-ans/" target="_blank">Constance Krebs dans son blog amontour.net</a>. Les <em>digital humanities</em> &laquo;&nbsp;à la française&nbsp;&raquo; comme dirait <a href="http://www.arts-humanities.net/blog/louburnard/digital_community_building_à_la_française" target="_blank">lou burnard</a> avancent encore un peu, se structurent, réfléchissent et je pense <a href="http://www.tge-adonis.fr" target="_blank">dans le bon sens</a>.<br />
A bientôt pour parler XMP, Dublin Core et Perl.</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/221/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

