<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sp.Blog &#187; interopérabilité</title>
	<atom:link href="http://blog.stephanepouyllau.org/tag/interoperabilite/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.stephanepouyllau.org</link>
	<description>le blog de Stéphane Pouyllau</description>
	<lastBuildDate>Sat, 07 Jan 2012 18:07:33 +0000</lastBuildDate>
	<language>fr</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Les corpus au pays des modules</title>
		<link>http://blog.stephanepouyllau.org/520</link>
		<comments>http://blog.stephanepouyllau.org/520#comments</comments>
		<pubDate>Thu, 22 Dec 2011 18:48:18 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[content management system]]></category>
		<category><![CDATA[ICEberg]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[métadonnées]]></category>
		<category><![CDATA[OAI-PMH]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=520</guid>
		<description><![CDATA[Dans un billet récent, Alexandre Moatti, faisait quelques remarques sur la bibliothèque numérique de l&#8217;Institut. Dans son texte, il fait référence à ICEberg, un logiciel que j&#8217;ai créé en 2002-2003 afin de proposer un outil de mise en ligne de corpus numériques. ICEberg a évolué avec le temps et il a été ré-écrit 3 fois [...]]]></description>
			<content:encoded><![CDATA[<p>Dans un <a href="http://bibnum.over-blog.com/article-bibliotheque-numerique-de-l-institut-de-france-92053375.html">billet récent</a>, <a href="http://fr.wikipedia.org/wiki/Alexandre_Moatti">Alexandre Moatti</a>, faisait quelques remarques sur la bibliothèque numérique de l&#8217;Institut. Dans son texte, il fait référence à ICEberg, un logiciel que j&#8217;ai créé en 2002-2003 afin de proposer un outil de mise en ligne de corpus numériques. <a href="http://blog.stephanepouyllau.org/54">ICEberg</a> a évolué avec le temps et il a été ré-écrit 3 fois depuis 2002.<br />
C&#8217;est normal, les outils en ligne (les applications web) sont très vite obsolètes : les briques permettant de les construire (PHP, Python, Jquery, etc.) évoluent en permanence et contraignent donc les développeurs et webmasters à faire régulièrement des nouvelles moutures de leurs programmes. Depuis la généralisation des systèmes de gestion de contenu (CMS) de 2eme et 3eme génération se sont ajoutées aux couches basses (PHP, MySQL, version d&#8217;Apache ou d&#8217;IIS) une kyrielle de modules qui ont la fâcheuse tendance à ne plus être compatibles avec le noyau du CMS après parfois quelques semaines seulement.<br />
Dans certains cas, des modules importants ont été incorporés dans le noyau ; mais pour beaucoup de fonctionnalités, le recours à de nouveaux modules répondant à des besoins toujours nouveaux (OAI-PMH, &laquo;&nbsp;<a href="http://zotero.org">zotero</a> inside&nbsp;&raquo;, galeries d&#8217;images, etc.) est devenu un automatisme pour les webmasters : &laquo;&nbsp;oh, il doit y avoir un module qui fait cela&nbsp;&raquo;. Dans certains cas, le nombre de modules est déjà très important alors que l&#8217;outil lui-même vient tout juste de passer en version 1.0. Si la qualité des modules et leur nombre peuvent être des signes de la vitalité d&#8217;un projet, il faut cependant faire attention à bien anticiper la maintenance sur le moyen terme (je dis bien moyen terme, tant le long terme n&#8217;est pas compatible avec l&#8217;obsolescence des outils web je pense).<br />
Confier de façon exclusive à un module en version béta par exemple, l&#8217;interopérabilité OAI-PMH des métadonnées de son corpus, veut dire que l&#8217;on prend un risque à moyen terme, si le module n&#8217;est plus maintenu pour x. raison(s). Je ne dis pas qu&#8217;il ne faut pas l&#8217;utiliser, mais il faut avoir conscience du risque et donc avoir des solutions de remplacement. Il faut faire de la veille. Pour illustrer cela, l&#8217;animation et la veille faite par l&#8217;équipe d&#8217;<a href="http://www.openedition.org">Open Edition</a> sur les modules de <a href="http://hypotheses.org">la plate-forme hypotheses.org</a> est exemplaire : les modules demandés par les blogueurs sont testés, évalués puis le cas échéants proposés dans les blogs. Cependant, à moyen terme, cela n&#8217;enlève pas l&#8217;obsolescence technique des modules, mais permet d&#8217;anticiper l&#8217;évolution. La veille est donc l&#8217;indispensable compagnon des administrateurs de sites et bibliothèques.</p>
<p>Mais au delà, je me pose la question de la limite des CMS dans le contexte de la recherche par projets (c&#8217;est à dire avec des ruptures de charges). Les bibliothèques scientifiques, universitaires et de recherche devraient développer des structures de conservation des corpus numériques incluant, outre l&#8217;archivage pérenne des données, la conservation de la structuration intellectuelle du corpus (structuration des bases de données, manuels de saisie, publications associé aux données, schéma de métadonnées, etc.). Encore une fois, c&#8217;est par l&#8217;association des métiers et le passage de responsabilité entre les acteurs du domaine que la pérennité deviendra réelle.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/520/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Interopérabilité autour de l&#8217;édition électronique de la correspondance d&#8217;Eugène Delacroix</title>
		<link>http://blog.stephanepouyllau.org/496</link>
		<comments>http://blog.stephanepouyllau.org/496#comments</comments>
		<pubDate>Sun, 23 Oct 2011 17:09:21 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[correspondance]]></category>
		<category><![CDATA[Eugène Delacroix]]></category>
		<category><![CDATA[flux]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[OAI-PMH]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=496</guid>
		<description><![CDATA[Le Centre André Chastel (Université de Paris-Sorbonne, Paris IV, CNRS, Ministère de la Culture et de la Communication) propose une édition électronique de la correspondance d&#8217;Eugène Delacroix (1798-1863). Accessible sur le site www.correspondance-delacroix.fr, le site est très clair et fonctionnel : il y a un moteur de recherche, un index des noms de personnes, des [...]]]></description>
			<content:encoded><![CDATA[<p>Le Centre André Chastel (Université de Paris-Sorbonne, Paris IV, CNRS, Ministère de la Culture et de la Communication) propose une édition électronique de la correspondance d&#8217;<span property="foaf:person" about="http://dbpedia.org/resource/Eug%C3%A8ne_Delacroix">Eugène Delacroix</span> (1798-1863). Accessible sur le site <a title="correspondance d'E. Delacroix" href="http://www.correspondance-delacroix.fr" target="_blank">www.correspondance-delacroix.fr</a>, le site est très clair et fonctionnel : il y a un moteur de recherche, un index des noms de personnes, des liens offrent la possibilité de naviguer dans le corpus. La visualisation des lettres est aussi très intéressante : fac-similés (flash, mais visualisation de l&#8217;image jpg sous ipad par exemple), transcriptions, notices biographiques, annotations, etc. Le projet semble très bien mené et rentre dans le mouvement des éditions électroniques de correspondances (littéraires, <a href="http://www.correspondances.cnrs.fr" target="_blank">scientifiques</a>, etc.). Ce projet a été financé par l&#8217;Agence nationale de la recherche en 2006 (appel Corpus).</p>
<p>On peut cependant regretter d&#8217;avoir à faire à un site &laquo;&nbsp;clos&nbsp;&raquo;.</p>
<p>Je m&#8217;explique : les éditeurs ont conçu un site très riche et bien pensé, mais ils n&#8217;ont pas mis en place de politique de flux de diffusion (RSS, Atom) permettant par exemple de suivre, depuis un outil de veille, les mises à jour des annotations afin de suivre les débats des spécialistes. C&#8217;est dommage car le site se veut vivant : &laquo;&nbsp;<em>&#8230;grâce à la mise en ligne,</em> [les transcriptions et annotations]<em> seront toujours susceptibles de modifications et d’ajouts</em>&nbsp;&raquo; est-il précisé dans <a title="le projet" href="http://www.correspondance-delacroix.fr/contributions/le-projet/" target="_blank">la présentation du projet</a>. Quel est le système de transcriptions qui a été utilisé ? <a href="http://www.tei-c.org">Text Encoding Initiative</a> ? Nous ne le savons pas : c&#8217;est dommage car cela aurait marqué un peu la préoccupation des éditeurs en matière d&#8217;archivage des transcriptions (même si TEI n&#8217;est pas parfait, c&#8217;est déjà au moins du XML). Autre manque : alors qu&#8217;un effort a été visiblement fait pour rendre citable les url des lettres (indépendance des liens vis à vis du système de publication), il n&#8217;est pas fait état d&#8217;un hypothétique entrepôt OAI-PMH permettant de moissonner les métadonnées des lettres de Delacroix afin de les diffuser dans les portail tel OAIster, Gallica ou ISIDORE, comme c&#8217;est le cas pour <a href="http://www.rechercheisidore.fr/search/?source=10670.3/yj9pj7" target="_blank">les correspondances d&#8217;André-Marie Ampère</a> ou encore <a href="http://gallica.bnf.fr/Search?ArianeWireIndex=index&amp;p=1&amp;lang=FR&amp;q=buffon" target="_blank">Buffon</a>. Est-ce une volonté des éditeurs ? un oubli par manque d&#8217;information (OAI-PMH reste tout de même assez mal connu) ? Je ne sais pas. Mais, je pense qu&#8217;il est toujours dommage de ne pas disséminer les contenus d&#8217;une édition électronique d&#8217;une œuvre scientifique, littéraire ou artistique vers des portails thématiques ou disciplinaires afin de communiquer plus largement les sources de la recherche et de les rapprocher d&#8217;autres ressources. Globalement, le corpus est certes utilisable mais est-il réutilisable ? Je l&#8217;espère. En tout cas, il me tarde de voir signaler les échanges épistolaires d&#8217;Eugène Delacroix dans <a href="http://rechercheisidore.fr" target="_blank">ISIDORE</a> (qui contient déjà <a href="http://www.rechercheisidore.fr/search?q=eug%C3%A8ne+delacroix">256 ressources sur ce dernier</a>).</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/496/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Accompagner la recherche</title>
		<link>http://blog.stephanepouyllau.org/447</link>
		<comments>http://blog.stephanepouyllau.org/447#comments</comments>
		<pubDate>Mon, 03 Jan 2011 11:31:17 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[archives ouvertes]]></category>
		<category><![CDATA[édition électronique]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[web of data]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=447</guid>
		<description><![CDATA[Bonne année 2011 à tous ! Le numérique change les métiers de l&#8217;information scientifique et technique et de la communication. Il y a quelques semaines, les ingénieurs, les assistants ingénieurs et les techniciens du CNRS travaillant dans le secteur des sciences humaines et sociales étaient réunis à Paris pour une journée d&#8217;étude dans laquelle j&#8217;ai [...]]]></description>
			<content:encoded><![CDATA[<p>Bonne année 2011 à tous !</p>
<p>Le numérique change les métiers de l&#8217;information scientifique et technique et de la communication. Il y a quelques semaines, les ingénieurs, les assistants ingénieurs et les techniciens du CNRS travaillant dans le secteur des sciences humaines et sociales étaient réunis à Paris pour <a href="http://www.cnrs.fr/inshs/recherche/bapf-2010.htm" target="_blank">une journée d&#8217;étude</a> dans laquelle j&#8217;ai eu le plaisir de présenter <a href="http://medihal.archives-ouvertes.fr" target="_blank">MédiHAL</a>. Je trouve cela très bien car il se créé ainsi une dynamique entre les personnes et les équipes. En discutant avec les collègues j&#8217;ai pu mesurer la nécessiter de passer rapidement <a href="http://www.lespetitescases.net/antilope-sur-le-Web-est-elle-un-document" target="_blank">d&#8217;un web de document</a> à un web des données scientifiques fondé sur les principes du web de donnée (dont le <a href="http://fr.wikipedia.org/wiki/Resource_Description_Framework">RDF</a>) et du linked data (la généralisation des <a href="http://fr.wikipedia.org/wiki/Uniform_Resource_Identifier">URI</a>). Ce qui m&#8217;a le plus frappé est le besoin, clairement exprimé maintenant, de mettre à disposition des données numériques en grande quantité tout en préservant le besoin de qualité de ces données.</p>
<p>Ce qui est également important, c&#8217;est la prise de conscience collective que maintenant il est possible de mettre en place des grands réservoirs de données, des bibliothèques de matériaux imprimés, manuscrits, photos, etc. et de le faire dans un cadre de travail standardisé, respectant des normes de description et s&#8217;interconnectant avec plusieurs outils d&#8217;éditions, de recherche, de traitement de l&#8217;information. La construction d&#8217;un web des données scientifiques, en SHS, est en marche et il s&#8217;intègre dans la construction du web de données général au sens du W3C. Ce web de données scientifiques n&#8217;est pas fermé sur lui-même, il est (et doit être) interopérable avec le reste du web de données. J&#8217;espère que le mouvement va s&#8217;accentuer, se développer.</p>
<p>Dans quelques années, les ingénieurs, assistants ingénieurs, techniciens du monde de la recherche scientifique et de l&#8217;enseignement supérieur, pourront construire des applications, des bases de données, des portails qui iront puiser de l&#8217;information directement dans le web. Ils iront interroger simultanément de multiples &laquo;&nbsp;triple stores&nbsp;&raquo; que sont ces grosses bases de données et réservoirs contenant de l&#8217;information interconnectée.</p>
<p>Lors de cette journée d&#8217;étude j&#8217;ai été aussi frappé de l&#8217;interaction entre les acteurs présentant des projets, plateformes, outils, méthodes : tous les projets sont interconnectés entre eux et à plusieurs niveaux ; les données aussi sont interopérables, entre elles, mais aussi vers l&#8217;extérieur, avec des données du monde entier.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/447/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Les données numériques des SHS entrent dans le web de données</title>
		<link>http://blog.stephanepouyllau.org/436</link>
		<comments>http://blog.stephanepouyllau.org/436#comments</comments>
		<pubDate>Thu, 09 Dec 2010 19:34:44 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[dublincore]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[isidore]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[métadonnées]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[sciences humaines et sociales]]></category>
		<category><![CDATA[sources historiques]]></category>
		<category><![CDATA[web of data]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=436</guid>
		<description><![CDATA[Avec l&#8217;ouverture d&#8217;isidore (réalisée par le très grand équipement Adonis du CNRS) les données numériques des sciences humaines et sociales entre dans le web de données et vont bientôt rejoindre le linking open data cloud diagram ou &#171;&#160;Lod&#160;&#187; maintenu par Richard Cyganiak (DERI, NUI Galway) and Anja Jentzsch (Freie Universität Berlin), en tous cas, je [...]]]></description>
			<content:encoded><![CDATA[<p>Avec l&#8217;ouverture d&#8217;<a title="isidore" href="http://www.rechercheisidore.fr" target="_blank">isidore</a> (réalisée par le <a href="http://www.tge-adonis.fr">très grand équipement Adonis</a> du CNRS) les données numériques des sciences humaines et sociales entre dans le web de données et vont bientôt rejoindre le <a title="lod" href="http://richard.cyganiak.de/2007/10/lod/" target="_blank"><em>linking open data cloud diagram</em></a> ou &laquo;&nbsp;Lod&nbsp;&raquo; maintenu par <a href="http://richard.cyganiak.de/#me">Richard Cyganiak</a> (<a href="http://www.deri.ie/">DERI, NUI Galway</a>) and <a href="http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/team/JentzschAnja.html">Anja Jentzsch</a> (<a href="http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/">Freie Universität Berlin</a>), en tous cas, je l&#8217;espère.</p>
<p>Isidore est une plateforme de recherche permettant la recherche d&#8217;information dans les données numériques des SHS, quelles soient sources pour faire de la recherche ou bien publications des résultats de la recherche. J&#8217;ai le plaisir de co-diriger ce projet avec <a href="http://panini.u-paris10.fr/jlm/" target="_blank">Jean-Luc Minel</a> dans le cadre de l&#8217;équipe du <a title="TGE Adonis" href="http://www.tge-adonis.fr" target="_blank">Adonis</a>, le très grand équipement du <a title="CNRS" href="http://www.cnrs.fr">Centre national de la recherche scientifique</a>.</p>
<p>Je profite de ce petit billet &laquo;&nbsp;auto-promotionnel&nbsp;&raquo; pour remercier Gautier Poupeau (alias <a href="http://www.lespetitescases.net">Got)</a> sans qui ce projet n&#8217;aurait pas pu être conçu et réalisé ainsi que toute l&#8217;équipe du centre pour la communication scientifique directe (<a title="CCSD" href="http://www.ccsd.cnrs.fr/spip.php?rubrique6" target="_blank">Laurent Capelli, Philippe  Correia, Loic Comparet, Yannick Barborini et Daniel Charnay</a>) qui participe à ce beau projet.</p>
<p>Isidore moissonne des métadonnées et des données selon les protocoles OAI-PMH, des signalements d&#8217;actualités via RSS et Atom, des données structurées selon RDFa et peut se connecter à des catalogues de bibliothèques SRU/SRW (z3950). Isidore enrichit ces données en les croisant, en les qualifiant avec des thésaurii, des référentiels, des listes d&#8217;auteurs et les ré-exposent selon les principes du linked data. Pour utiliser ces données, un site web a été créé : www.rechercheisidore.fr. Vous pouvez donc interroger les articles de <a href="http://revues.org" target="_blank">Revues.org</a>, <a href="http://cairn.info">Cairn</a>, <a href="http://www.persee.fr" target="_blank">Persée</a>, les ouvrages, textes, images de <a href="http://gallica.bnf.fr">Gallica</a>, <a href="http://halshs.archives-ouvertes.fr" target="_blank">HALSHS</a>, <a href="http://medihal.archives-ouvertes.fr" target="_blank">MédiHAL</a> avec un seul formulaire et avec des liens entre toutes ces données.</p>
<p>Dans isidore, les métadonnées sont transformées en RDF, ainsi les données des shs entrent dans le web de données.</p>
<p>Mais nous sommes en version béta, alors le travail continu.</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/436/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>La communauté française des digital humanities</title>
		<link>http://blog.stephanepouyllau.org/373</link>
		<comments>http://blog.stephanepouyllau.org/373#comments</comments>
		<pubDate>Sun, 23 May 2010 08:38:33 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[archives]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[pérennisation]]></category>
		<category><![CDATA[recherche]]></category>
		<category><![CDATA[science]]></category>
		<category><![CDATA[sources historiques]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=373</guid>
		<description><![CDATA[Après deux jours d&#8217;ateliers, démos, débats, discussions le THATCamp Paris 2010, la non-conférence sur les digital humanities, lance le Manifeste des digital humanities. Ce texte, fondateur de la communauté des digital humanities en France est très important. Il a permis tout d&#8217;abord de répondre à la question posée dans le THATCamp : &#171;&#160;voulons-nous travailler ensemble [...]]]></description>
			<content:encoded><![CDATA[<div><a href="http://www.flickr.com/photos/revuesorg/4624412716/" title="THATCamp Paris 2010, sur la Baleine blanche by Revues.org, on Flickr - Crédits : Elodie Picard / CC"><img src="http://farm4.static.flickr.com/3363/4624412716_9bed9d13eb.jpg" width="200" alt="THATCamp Paris 2010, sur la Baleine blanche - Crédits : Elodie Picard / CC" /></a></div>
<p>Après deux jours d&#8217;ateliers, démos, débats, discussions le <a href="http://tcp.hypotheses.org" target="_blank">THATCamp Paris 2010</a>, la non-conférence sur les <em>digital humanities</em>, lance <a href="http://tcp.hypotheses.org/318">le Manifeste des <em>digital humanities</em></a>. Ce texte, fondateur de la communauté des <em>digital humanities</em> en France est très important. Il a permis tout d&#8217;abord de répondre à la question posée dans le THATCamp : &laquo;&nbsp;voulons-nous travailler ensemble ?&nbsp;&raquo;. La réponse est largement positive à mon sens.</p>
<p>Ce besoin de travailler ensemble est partagé par tous, et nous avons vu qu&#8217;il dépasse bien évidement les cadres institutionnels actuels. C&#8217;est une vision personnelle, mais ces derniers me semblent peu adaptés au développement d&#8217;une communauté qui a conscience que les actions locales se font mieux si elle s&#8217;appuient sur des structures nationales mutualisées (ex. grilles de calcul, infrastructures d&#8217;hébergement de données, services d&#8217;archivage de données numériques). J&#8217;invite tous les lecteurs de ce blog, qui soient ou qui se sentent acteurs des <em>digital humanities</em> à signer ce Manifeste qui pose les bases claires d&#8217;une communauté se donnant des objectifs précis.</p>
<p>Je pense en particulier aux documentalistes qui sont dans les laboratoires de recherche des sciences humaines et sociales, et dont certains étaient au THATCamp Paris 2010, mais que je trouve toujours trop absents de ces moments de réflexion sur l&#8217;évolution des métiers, méthodes, etc. Les documentalistes font un travail de production sur le terrain très important. Au delà des centres de documentation et des bibliothèques de recherche, certains coordonnent réellement des projets de recherche sur le plan documentaire et donc sont pleinement dans les problématiques dont nous avons discutées lors de ces deux jours. </p>
<p>Par exemple, le point 14 du Manifeste propose de construire, de façon itérative, des cyberinfrastructures correspondant à des besoins réels. Voici un chalenge difficile, pris entre les intérêts des économies locales de la recherche proches des chercheurs (Universités, Maisons des sciences de l&#8217;homme par exemple) et ceux &laquo;&nbsp;inter-nationaux&nbsp;&raquo;, européens par exemple, pourtant nécessaires mais complexe à comprendre tant il est difficile pour un chercheur de s&#8217;y projeter.<br />
Un exemple a été pris par <a target="_blank" href="http://www.lespetitescases.net/une-communaute-des-digital-humanities-est-nee">Got</a> sur les questions de l&#8217;archivage des données numériques (la mémoire du XXIe siècle). Il faut accepter de faire confiance à une autre institution, à une autre personne, pour archiver ses propres données, issues d&#8217;une collecte qui a pu prendre, parfois, toute une vie. &laquo;&nbsp;Accepter de faire confiance&nbsp;&raquo; c&#8217;est avant tout reconnaitre que l&#8217;on est pas compétent pour traiter tel ou tel sujets, ou techniques, ou méthode. Cela ne veut pas dire que l&#8217;on va perdre &laquo;&nbsp;la main&nbsp;&raquo; sur les données (<a href="https://federation.renater.fr/" target="_blank">les mécanismes de contrôle d&#8217;accès existent</a> et <a href="http://www.openidfrance.fr/" target="_blank">sont fiables</a>). Cela ne veut pas dire non plus qu&#8217;il ne faut pas tenter de comprendre (loin de moi l&#8217;idée de saucissonner les métiers et les taches), mais c&#8217;est reconnaitre qu&#8217;à un moment, il faut accepter de faire 10 à 15% d&#8217;un travail pour lequel l&#8217;on ne sera pas reconnu, qui ne comptera pas dans son évaluation personnelle, afin de transmettre à un autre de l&#8217;information afin qu&#8217;il l&#8217;archive, la traite, l&#8217;édite, la valorise, la distribue, etc. et vous la repasse parfois pour en faire autre chose. C&#8217;est l&#8217;un des enjeux majeur du Manifeste selon moi. Les cyberinfrastructures seront ce que nous en ferons, pour cela il faut accepter de faire 10 à 15% du chemin vers le collègue (l&#8217;ingénieur ou le chercheur) qui a une ou plusieurs compétences et donc qui a un <strong>Métier</strong>. C&#8217;est aussi considérer que ce qu&#8217;il fait est égal à ce l&#8217;on fait. Publier un article dans une revue de rang A est égal à concevoir un logiciel permettant de calculer des résultats à partir de données : la seconde tache permettant de faire la première, la première est dépendante de la seconde et la seconde sans la première dans pas de finalité réelle (exception faite pour les questions d&#8217;archivages).</p>
<p>Pour moi, il s&#8217;agit là d&#8217;une formidable aventure que la communauté des <em>digital humanities</em>, rassemblée autour du Manifeste, doit mener.</p>
<div>Crédits photos : Elodie Picard/CLEO-Revues.org &#8211; Licence Creative Commons : Attribution-NonCommercial-NoDerivs 2.0 Generic</div>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/373/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>THATCamp Paris 2010 : la communauté des digital humanities de France s&#8217;organise</title>
		<link>http://blog.stephanepouyllau.org/362</link>
		<comments>http://blog.stephanepouyllau.org/362#comments</comments>
		<pubDate>Wed, 19 May 2010 06:54:46 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[e-rudition]]></category>
		<category><![CDATA[interopérabilité]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=362</guid>
		<description><![CDATA[La première non-conférence française sur les sciences humaines et sociales numériques (digital humanities) se tient depuis hier matin et se poursuit aujourd&#8217;hui à Paris, sur une péniche entre la BNF et le ministère des finances Bercy : David contre des Goliats ? Non, pas réellement, cette communauté est très ouverte : c&#8217;est le THATCamp Paris [...]]]></description>
			<content:encoded><![CDATA[<p>La <a href="http://tcp.hypotheses.org/152">première non-conférence française sur les sciences humaines et sociales numériques</a> (<em>digital humanities</em>) se tient depuis hier matin et se poursuit aujourd&#8217;hui à Paris, sur une <a href="http://tcp.hypotheses.org/253">péniche entre la BNF et le ministère des finances Bercy</a> : David contre des Goliats ? Non, pas réellement, cette communauté est très ouverte : c&#8217;est le <a href="http://tcp.hypotheses.org/">THATCamp Paris 2010</a>. Cette non-conférence regroupe des ingénieurs, des enseignants-chercheurs, des techniciens, des chercheurs, des prestataires de services venant du privé, des doctorants, des post-doc, des artistes qui ont envie et besoin de travailler ensemble pour concevoir des nouvelles méthodes de travail, de nouveaux outils hybrides (hyper mashup-é), de mélanger des métiers, construire des cyber-infrastructures itératives afin de donner du liant et du sens numérique aux projets de recherche en sciences humaines et sociales. Ces projets ont pour la plupart un volet numérique (ne serait-ce que la bibliographie mise en commun entre les chercheurs d&#8217;un projet) et de plus en plus de projet doivent diffuser à la fois les sources et résultats de leurs recherches. Donc, il y avait beaucoup de monde hier sur cette péniche et l&#8217;ambiance était très studieuse, sérieuse mais aussi très chaleureuse. J&#8217;ai eu le plaisir d&#8217;animer un atelier sur les fonds iconographiques numériques qui, j&#8217;espère, a été intense pour les participants (que je remercie au passage). Le compte-rendu de cette atelier sera diffusé en ligne, sur <a href="http://www.digitalhumanities.cnrs.fr/wikis/tcp" target="_blank">le wiki du THATCamp Paris 2010</a> et les grandes lignes serviront, sans doute, à construire le <a href="http://www.digitalhumanities.cnrs.fr/wikis/tcp/index.php?title=Manifeste" target="_blank">Manifeste</a> qui sortira, entre autres choses, de cette non-conférence. A quand la prochaine édition ?</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/362/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Interopérabilité : faire des choix, échanger, gérer le temps</title>
		<link>http://blog.stephanepouyllau.org/320</link>
		<comments>http://blog.stephanepouyllau.org/320#comments</comments>
		<pubDate>Tue, 12 Jan 2010 16:27:17 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[structuration]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=320</guid>
		<description><![CDATA[Interopérabilité : faire des choix L&#8217;inconvénient du Dublin Core simple (DC Elements Set) est qu&#8217;il nivelle &#171;&#160;vers le bas&#160;&#187; la richesse de nos bases de données : tous les professionnels de l&#8217;information scientifique le savent. Mais cependant, l&#8217;exposition de métadonnées en DC simple permet un exercice très intéressant lorsque l&#8217;on construit une base de données [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Interopérabilité : faire des choix</strong></p>
<p>L&#8217;inconvénient du Dublin Core simple (<em>DC Elements Set</em>) est qu&#8217;il nivelle &laquo;&nbsp;vers le bas&nbsp;&raquo; la richesse de nos bases de données : tous les professionnels de l&#8217;information scientifique le savent. Mais cependant, l&#8217;exposition de métadonnées en DC simple permet un exercice très intéressant lorsque l&#8217;on construit une base de données que l&#8217;on souhaite interopérable (via OAI-PMH principalement) : Qu&#8217;est-ce qui est important de diffuser, de mes données, puisque je n&#8217;ai que 15 champs pour le faire avec le DC simple ?</p>
<p>Je ne me m&#8217;empêcher d&#8217;oser faire le parallèle avec une technique utilisée lors que l&#8217;on étudie les textes du Moyen-Âge et qui est enseigné à l&#8217;Université : L&#8217;analyse. Je me souviens de mes TP de 2eme année de DEUG d&#8217;histoire du Moyen-Âge à Bordeaux, ou la chargée de cours nous disait : &laquo;&nbsp;faites comme si vous alliez perdre le texte et donc rédigez un texte, plus court, plus simple, qui en trace les grandes lignes du contenu&nbsp;&raquo;. Donc, je dois projeter de l&#8217;information venant d&#8217;une base de données vers du DC simple, j&#8217;ai toujours l&#8217;impression de faire une analyse. Comment donner envie au lecteur de cliquez pour aller voir le texte complet, la collection d&#8217;images, etc. ? Dans le monde informatique, ce travail là est souvent nommé &laquo;&nbsp;mapping&nbsp;&raquo; et l&#8217;on entend donc « faire un mapping ». Il s&#8217;agit de faire des choix, exemple :</p>
<p>Si dans ma base de données j&#8217;ai deux champs pour décrire un auteur – un pour le prénom et un pour le nom &#8211; je vais par exemple les regrouper dans un seul champs DC simple (du type dc:creator) sous une forme qui sera un choix, ex. : dc.creator:Pierre MARTIN ou bien, autre choix : dc.creator:MARTIN P. ; dans tous les cas, je fais un choix qu&#8217;il faudra que j&#8217;assume (ce choix peut être collectif ou s&#8217;appuyer sur des règles de présentation normalisées, qui, suivant ma communauté m&#8217;y aidera fortement). Mais j&#8217;insiste sur ce fait : je fais un choix.</p>
<p><strong>Interopérabilité : échanger (suis-je seul ?)</strong></p>
<p>Souvent, dans les projets de recherche, le temps consacré à la modélisation de la base de données fait la part belle à la structuration riche de l&#8217;information à traiter : c&#8217;est normal. Mais parfois je pense qu&#8217;il est intéressant de travailler aussi et de façon importante, sur un modèle de diffusion et/ou d&#8217;interopérabilité utilisant le DC simple. Cela permet de faire des choix différents et surtout cela entraine un temps « de respiration documentaire » dans la conception qui permet de se poser une autre question : suis-je seul à faire ce type de base de données ? J&#8217;encourage tous les chercheurs que je croise à prendre le temps pour se poser cette question lors qu&#8217;ils sont en phase de démarrage d&#8217;un projet (et de trouver surement des collègues qui ont déjà travaillé sur ces questions de modélisation). J&#8217;aime bien cette idée car elle donne aussi du sens à l&#8217;interopérabilité des métadonnées. J&#8217;encourage aussi les chercheurs qui font des bases de données de publier systématiquement les choix qu&#8217;ils ont fait en matière d&#8217;interopérabilité et de les dater. Cela permet de voir les versions successives du travail. L&#8217;interopérabilité sert à cela aussi : à ne pas être seul.</p>
<p><strong>Interopérabilité : le temps</strong></p>
<p>Faire des choix en matière d&#8217;édition électronique de bases de données, c&#8217;est accepter le principe qu&#8217;une base peut être diffusée via plusieurs vecteurs ayant une granularité différente et évolutive dans le temps. Il est possible, après être passé par la case « DC simple », de vouloir d&#8217;autres types de structuration des métadonnées, par exemple du MODS, ou du MIX pour les métadonnées techniques d&#8217;une images (ou de l&#8217;IPTC-Core pour les métadonnées descriptives) ou plus naturellement du DC Terms. DC Terms élargi le DC simple en lui adossant d&#8217;autres champs possibles, il est plus riche. Pour faire cela, il faudra faire d&#8217;autres mapping, d&#8217;autres « analyses » et donc assumer d&#8217;autres choix. Cette évolutive possible, dans la façon de diffuser des métadonnées et donc les données numériques qui y sont attachées, donne une nouvelle responsabilité aux producteurs/éditeur de base de donnée qui sont souvent les chercheurs : ces objets ne sont pas figés une fois publiés, il faut les entretenir : refaire des choix, étendre les jeux de structuration, etc. L&#8217;interopérabilité c&#8217;est aussi la gestion du temps vis à vis de son corpus de donnée.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/320/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>De l&#8217;interopérabilité au web de données</title>
		<link>http://blog.stephanepouyllau.org/277</link>
		<comments>http://blog.stephanepouyllau.org/277#comments</comments>
		<pubDate>Sun, 20 Sep 2009 07:04:07 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[dublincore]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[web of data]]></category>
		<category><![CDATA[xml]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=277</guid>
		<description><![CDATA[J&#8217;ai eu la chance de participer à l&#8217;Université d&#8217;été de l&#8217;édition électronique (Marseille, 7-11 septembre 2009) où j&#8217;ai parlé d&#8217;interopérabilité et de circulation de l&#8217;information scientifique et technique. J&#8217;ai axé mon propos sur le fait que l&#8217;interopérabilité des données est peut-être la première marche vers la mise en place du web de données. Il est [...]]]></description>
			<content:encoded><![CDATA[<p>J&#8217;ai eu la chance de participer à <a href="http://www.digitalhumanities.cnrs.fr/wikis/edelec-shs/index.php/Accueil" target="_blank">l&#8217;Université d&#8217;été de l&#8217;édition électronique</a> (<a href="http://www.geonames.org/maps/bkm9642" target="_blank">Marseille</a>, 7-11 septembre 2009) où j&#8217;ai parlé <a href="http://www.digitalhumanities.cnrs.fr/wikis/edelec-shs/index.php/L%E2%80%99interop%C3%A9rabilit%C3%A9_:_gestion_et_circulation_de_l%27information_scientifique" target="_blank">d&#8217;interopérabilité et de circulation de l&#8217;information scientifique et technique</a>. J&#8217;ai axé mon propos sur le fait que l&#8217;interopérabilité des données est peut-être la première marche vers la mise en place du web de données. Il est probable que pour faire le web de données il nous faille passer d&#8217;abord par un web des données (comptons aussi un peu sur les institutions françaises pour cela) même si l&#8217;appropriation et l&#8217;utilisation de standards communs est de plus en plus naturel et que l&#8217;utilisation du <em>Dublin Core Element Set</em> ne fait plus réellement débat dans la communauté  scientifique. <span typeof="foaf:Person" xmlns:foaf="http://xmlns.com/foaf/0.1/" about="#me" rel="foaf:knows"><a property="foaf:name" rel="foaf:homepage" href="http://www.lespetitescases.net">Gautier Poupeau</a></span> a présenté dans un billet <a href="http://www.lespetitescases.net/du-web-semantique-au-web-de-donnees-1">une mise au point entre la notion de web sémantique</a> et celle de web de données qui résume assez bien ma vision des choses sur ce que le web de données pourrait être et pourquoi il est important que les professionnels de l&#8217;information scientifique et technique soient dans ce train là.</p>
<p>Le web de données c&#8217;est la réalisation d&#8217;une base de données mondiale ou les données sont-elles même sur le réseau (et pas juste leurs méta-données). En discutant avec des chercheurs, collectant des données et les stockant sur leurs petits disques dur dans leurs bureaux, j&#8217;ai envie de leur dire à la façon de Tim Berners Lee : &laquo;&nbsp;libérez vos données ! mettez-les sur le réseau ! vous faites des images ? renseignez bien vos champs de description IPTC-Core et mettez vos images sur le réseau !&nbsp;&raquo;. Bien sur, il y a 1.000.000 de raisons pour qu&#8217;ils ne le fasse pas : ils ont une recherche en cours que le voisin veut surement leur voler, ils pensent que seul l&#8217;article final leur permettra d&#8217;être (re)-connus, et peut-être, ce ne sont pas leurs photos. Les documentalistes, bibliothécaire, archivistes ont un rôle majeur dans la réalisation d&#8217;un web qui contiendra des données &laquo;&nbsp;brutes&nbsp;&raquo; (certains disent primaires, factuelles, de terrains, d&#8217;enquêtes, etc.). Je renvois au projet data.gov ou nous imaginons bien le travail d&#8217;IST qui peut s&#8217;y développer. Construire le web de données nécessite de structurer les données avant qu&#8217;elles n&#8217;existent parfois. Dans les Sciences humaines et sociales, il faut aider les chercheurs &#8211; dont le volet technique, normatif, informatique n&#8217;est pas le métier &#8211; a le faire. Il faut leur expliquer, ce que j&#8217;aurai sans doute pu mieux faire à Marseille, que l&#8217;augmentation de la masse des données brutes, maintenant accessible, permet aux chercheurs de travailler sur des corpus plus larges, mieux documentés.</p>
<p>L&#8217;interopérabilité des données c&#8217;est mettre en œuvre une politique scientifique et technique permettant :</p>
<ul>
<li>
<p style="margin-bottom: 0cm;">de rendre (plus) accessible ces 	propres données dans un maximum de langages documentaires partagés 	par le plus grand nombre ;</p>
</li>
<li>
<p style="margin-bottom: 0cm;">de garantir l&#8217;accessibilité de 	ces données dans temps : ceci pour la citabilité des données dont 	la privatisation, par le DOI par exemple, pourrait avoir des 	conséquences dramatiques. Je milite là pour une évolution des 	identifiants OAI ou autres vers de véritables identifiants pérennes 	et uniques, garantis par un organisme international type <a href="http://portal.unesco.org/ci/fr/ev.php-URL_ID=19486&amp;URL_DO=DO_TOPIC&amp;URL_SECTION=201.html" target="_blank">UNESCO</a> ;</p>
</li>
<li>de faire vivre des données numériques : ajout de 	classifications, de schémas de description (documentaires dans un 	premier temps), prise en charge de pérennité des données par le 	développement de formats pivots pour la préservation ;</li>
</ul>
<p>Ces trois items sont, pour moi, les trois piliers de l&#8217;interopérabilité des données dans une optique future du web de données. Aujourd&#8217;hui, il nous est difficile de sortir du <a href="http://www.lespetitescases.net/carcans-de-la-pensee-hierarchique-et-documentaire-1" target="_blank">carcan de la pensée documentaire comme dirait Got</a> car les méthodes, techniques et outils qui sont enseignés correspondent encore au monde d&#8217;avant le web et nous n&#8217;avons pas encore d&#8217;outils de masse pour le monde d&#8217;après le web, mais ils arrivent et il nous faut faire œuvre de pédagogie. En attendant, nous chérissons nos méta-données. Il nous faut nous interroger sur l&#8217;encapsulation des méta-données descriptives dans les données (étape n°2 sur le chemin du web de données ?), mais aussi comment signaler à nos machines que la description d&#8217;une image est là au milieu des bits de l&#8217;image.</p>
<p>L&#8217;interopérabilité des données entre machines, via des méta-données, est la première marche, le premier pas vers le web de données. Si plusieurs techniques existent, l&#8217;OAI-PMH couplé aux descriptions en Dublin Core, représente le plus souvant le volet technique, informatique de l&#8217;interopérabilité des données aux yeux des professionnels de l&#8217;IST. La mise à plat des méta-données, dans l&#8217;OAI-PMH, a un avantage : il met à plat réellement les méta-données et nous oblige à repenser le rapport entre données, méta-données et le fait que, avec l&#8217;OAI-PMH, ce qui en sort, c&#8217;est du XML et pas une page web en HTML. On utilise le web pour faire autre chose que du HTML et des &laquo;&nbsp;pages&nbsp;&raquo; ; tout en se gardant la possibilité d&#8217;en faire, le web muterait-il ?. Nous faisons des flux de méta-données dans un langage pour des machines (aujourd&#8217;hui c&#8217;est du XML, mais demain&#8230;) : le web n&#8217;est pas que le territoire du HTML, il devient dynamique, il est un flux. Avec l&#8217;OAI-PMH, ce qui sort, c&#8217;est du flux XML (fluxml, cela fait vieux médicament) et pas une page web, pourtant il y a dedans de l&#8217;information mais nous échangeons juste de l&#8217;information sur la données, il nous faut aller plus loin. L&#8217;interopérabilité des données c&#8217;est presque un web des données.</p>
<p>Le mouvement est-il en marche ? <a href="http://renatis.cnrs.fr/spip.php?rubrique60" target="_blank">Le réseau national des documentalistes du CNRS organise en octobre 2009 trois jours autour de l&#8217;OAI-PMH</a> et j&#8217;espère son évolution future OAI-ORE. En 2010 aura lieu une seconde école thématique, très pratique, sur les sources numériques et l&#8217;interopérabilité des données. Ces sessions de formation continue sont bien évidement le reflet de ce qui se passe dans les IUT et à l&#8217;Université. Il me semble que ces éléments en sont des signes favorables.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/277/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

