<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Sp.Blog &#187; dublincore</title>
	<atom:link href="http://blog.stephanepouyllau.org/tag/dublincore/feed" rel="self" type="application/rss+xml" />
	<link>http://blog.stephanepouyllau.org</link>
	<description>le blog de Stéphane Pouyllau</description>
	<lastBuildDate>Sat, 07 Jan 2012 18:07:33 +0000</lastBuildDate>
	<language>fr</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Bielefeld Academic Search Engine</title>
		<link>http://blog.stephanepouyllau.org/488</link>
		<comments>http://blog.stephanepouyllau.org/488#comments</comments>
		<pubDate>Sun, 03 Jul 2011 08:47:55 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[en général]]></category>
		<category><![CDATA[dublincore]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[RDF]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=488</guid>
		<description><![CDATA[Le portail BASE (Bielefeld Academic Search Engine) est un aggrégateur OAI-PMH moissonnant 1890 entrepôts OAI dans le monde (au 2 juillet 2011) et donnant accès à 28.911.265 notices. Utilisant Solr et le système d&#8217;opac VuFind, BASE est accessible via un site web très clair, rapide et fonctionnel. Sans proposer, comme dans ISIDORE, un enrichissement des [...]]]></description>
			<content:encoded><![CDATA[<p>Le portail <a href="http://www.base-search.net">BASE</a> (Bielefeld Academic Search Engine) est un aggrégateur OAI-PMH moissonnant 1890 entrepôts OAI dans le monde (au 2 juillet 2011) et donnant accès à 28.911.265 notices. Utilisant Solr et le système d&#8217;opac <a href="http://vufind.org/">VuFind</a>, BASE est accessible via un site web très clair, rapide et fonctionnel. Sans proposer, comme dans <a href="http://rechercheisidore.fr">ISIDORE</a>, un enrichissement des métadonnées à l&#8217;aide de référentiels, ni l&#8217;indexation du texte intégral des données jointes aux notices OAI, BASE est un outil très performant qui fait partie des fournisseurs de services. &laquo;&nbsp;Fournisseurs de services&nbsp;&raquo;&#8230; cette expression, un peu obscure je trouve, désigne le plus souvent les portails documentaires moissonnant des métadonnées selon le protocole OAI-PMH. Après <a title="OAISter" href="http://www.oclc.org/oaister/" target="_blank">OAIster</a> (aujourd&#8217;hui dissout dans l&#8217;offre d&#8217;OCLC), <a title="SC" href="http://en.scientificcommons.org/" target="_blank">Scientificcommons.org</a>, BASE a ses adeptes. En tous cas, ce projet conforte certains choix que nous avons fait dans ISIDORE : la mise en place d&#8217;un annuaire des entrepôts moissonnés (&laquo;&nbsp;<em>A <a href="http://base.ub.uni-bielefeld.de/en/about_sources_date_dn.php?menu=2">data resources inventory</a> provides transparency in the searches</em>&laquo;&nbsp;, voir dans &laquo;&nbsp;<a href="http://base.ub.uni-bielefeld.de/en/index.php" target="_blank">About BASE</a>&laquo;&nbsp;) ou encore la notion de web profond ou invisible &laquo;&nbsp;<em>Discloses web resources of the &laquo;&nbsp;Deep Web&nbsp;&raquo;, which are ignored               by commercial search engines or get lost in the vast quantity of hits.</em>&laquo;&nbsp;. Bien sur, la notion de facettes, mais calculées uniquement sur les contenus des métadonnées moissonnées : <em>&laquo;&nbsp;Refine your search result&nbsp;&raquo; options               (authors, subject headings, year, resources and language)</em>.</p>
<p>Limité à OAI-PMH, et donc à des métadonnées proposées sous la forme d&#8217;atomes sans relief, ce type de portail, comme ISIDORE d&#8217;ailleurs, devra évoluer car il est toujours un peu frustrant de ne pas naviguer dans des données en &laquo;&nbsp;relief&nbsp;&raquo;. ISIDORE, avec son<em> SPARQL end point</em> RDF contenant plus de 40 millions de triplets RDF, va déjà un peu plus loin, mais il nous faut imaginer des nouveaux systèmes de navigation et de signalement pour ces informations structurées en RDF.</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/488/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Les données numériques des SHS entrent dans le web de données</title>
		<link>http://blog.stephanepouyllau.org/436</link>
		<comments>http://blog.stephanepouyllau.org/436#comments</comments>
		<pubDate>Thu, 09 Dec 2010 19:34:44 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[web sémantique]]></category>
		<category><![CDATA[dublincore]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[isidore]]></category>
		<category><![CDATA[linked data]]></category>
		<category><![CDATA[métadonnées]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[sciences humaines et sociales]]></category>
		<category><![CDATA[sources historiques]]></category>
		<category><![CDATA[web of data]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=436</guid>
		<description><![CDATA[Avec l&#8217;ouverture d&#8217;isidore (réalisée par le très grand équipement Adonis du CNRS) les données numériques des sciences humaines et sociales entre dans le web de données et vont bientôt rejoindre le linking open data cloud diagram ou &#171;&#160;Lod&#160;&#187; maintenu par Richard Cyganiak (DERI, NUI Galway) and Anja Jentzsch (Freie Universität Berlin), en tous cas, je [...]]]></description>
			<content:encoded><![CDATA[<p>Avec l&#8217;ouverture d&#8217;<a title="isidore" href="http://www.rechercheisidore.fr" target="_blank">isidore</a> (réalisée par le <a href="http://www.tge-adonis.fr">très grand équipement Adonis</a> du CNRS) les données numériques des sciences humaines et sociales entre dans le web de données et vont bientôt rejoindre le <a title="lod" href="http://richard.cyganiak.de/2007/10/lod/" target="_blank"><em>linking open data cloud diagram</em></a> ou &laquo;&nbsp;Lod&nbsp;&raquo; maintenu par <a href="http://richard.cyganiak.de/#me">Richard Cyganiak</a> (<a href="http://www.deri.ie/">DERI, NUI Galway</a>) and <a href="http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/team/JentzschAnja.html">Anja Jentzsch</a> (<a href="http://www.wiwiss.fu-berlin.de/en/institute/pwo/bizer/">Freie Universität Berlin</a>), en tous cas, je l&#8217;espère.</p>
<p>Isidore est une plateforme de recherche permettant la recherche d&#8217;information dans les données numériques des SHS, quelles soient sources pour faire de la recherche ou bien publications des résultats de la recherche. J&#8217;ai le plaisir de co-diriger ce projet avec <a href="http://panini.u-paris10.fr/jlm/" target="_blank">Jean-Luc Minel</a> dans le cadre de l&#8217;équipe du <a title="TGE Adonis" href="http://www.tge-adonis.fr" target="_blank">Adonis</a>, le très grand équipement du <a title="CNRS" href="http://www.cnrs.fr">Centre national de la recherche scientifique</a>.</p>
<p>Je profite de ce petit billet &laquo;&nbsp;auto-promotionnel&nbsp;&raquo; pour remercier Gautier Poupeau (alias <a href="http://www.lespetitescases.net">Got)</a> sans qui ce projet n&#8217;aurait pas pu être conçu et réalisé ainsi que toute l&#8217;équipe du centre pour la communication scientifique directe (<a title="CCSD" href="http://www.ccsd.cnrs.fr/spip.php?rubrique6" target="_blank">Laurent Capelli, Philippe  Correia, Loic Comparet, Yannick Barborini et Daniel Charnay</a>) qui participe à ce beau projet.</p>
<p>Isidore moissonne des métadonnées et des données selon les protocoles OAI-PMH, des signalements d&#8217;actualités via RSS et Atom, des données structurées selon RDFa et peut se connecter à des catalogues de bibliothèques SRU/SRW (z3950). Isidore enrichit ces données en les croisant, en les qualifiant avec des thésaurii, des référentiels, des listes d&#8217;auteurs et les ré-exposent selon les principes du linked data. Pour utiliser ces données, un site web a été créé : www.rechercheisidore.fr. Vous pouvez donc interroger les articles de <a href="http://revues.org" target="_blank">Revues.org</a>, <a href="http://cairn.info">Cairn</a>, <a href="http://www.persee.fr" target="_blank">Persée</a>, les ouvrages, textes, images de <a href="http://gallica.bnf.fr">Gallica</a>, <a href="http://halshs.archives-ouvertes.fr" target="_blank">HALSHS</a>, <a href="http://medihal.archives-ouvertes.fr" target="_blank">MédiHAL</a> avec un seul formulaire et avec des liens entre toutes ces données.</p>
<p>Dans isidore, les métadonnées sont transformées en RDF, ainsi les données des shs entrent dans le web de données.</p>
<p>Mais nous sommes en version béta, alors le travail continu.</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/436/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>De l&#8217;interopérabilité au web de données</title>
		<link>http://blog.stephanepouyllau.org/277</link>
		<comments>http://blog.stephanepouyllau.org/277#comments</comments>
		<pubDate>Sun, 20 Sep 2009 07:04:07 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[dublincore]]></category>
		<category><![CDATA[interopérabilité]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[RDF]]></category>
		<category><![CDATA[web of data]]></category>
		<category><![CDATA[xml]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=277</guid>
		<description><![CDATA[J&#8217;ai eu la chance de participer à l&#8217;Université d&#8217;été de l&#8217;édition électronique (Marseille, 7-11 septembre 2009) où j&#8217;ai parlé d&#8217;interopérabilité et de circulation de l&#8217;information scientifique et technique. J&#8217;ai axé mon propos sur le fait que l&#8217;interopérabilité des données est peut-être la première marche vers la mise en place du web de données. Il est [...]]]></description>
			<content:encoded><![CDATA[<p>J&#8217;ai eu la chance de participer à <a href="http://www.digitalhumanities.cnrs.fr/wikis/edelec-shs/index.php/Accueil" target="_blank">l&#8217;Université d&#8217;été de l&#8217;édition électronique</a> (<a href="http://www.geonames.org/maps/bkm9642" target="_blank">Marseille</a>, 7-11 septembre 2009) où j&#8217;ai parlé <a href="http://www.digitalhumanities.cnrs.fr/wikis/edelec-shs/index.php/L%E2%80%99interop%C3%A9rabilit%C3%A9_:_gestion_et_circulation_de_l%27information_scientifique" target="_blank">d&#8217;interopérabilité et de circulation de l&#8217;information scientifique et technique</a>. J&#8217;ai axé mon propos sur le fait que l&#8217;interopérabilité des données est peut-être la première marche vers la mise en place du web de données. Il est probable que pour faire le web de données il nous faille passer d&#8217;abord par un web des données (comptons aussi un peu sur les institutions françaises pour cela) même si l&#8217;appropriation et l&#8217;utilisation de standards communs est de plus en plus naturel et que l&#8217;utilisation du <em>Dublin Core Element Set</em> ne fait plus réellement débat dans la communauté  scientifique. <span typeof="foaf:Person" xmlns:foaf="http://xmlns.com/foaf/0.1/" about="#me" rel="foaf:knows"><a property="foaf:name" rel="foaf:homepage" href="http://www.lespetitescases.net">Gautier Poupeau</a></span> a présenté dans un billet <a href="http://www.lespetitescases.net/du-web-semantique-au-web-de-donnees-1">une mise au point entre la notion de web sémantique</a> et celle de web de données qui résume assez bien ma vision des choses sur ce que le web de données pourrait être et pourquoi il est important que les professionnels de l&#8217;information scientifique et technique soient dans ce train là.</p>
<p>Le web de données c&#8217;est la réalisation d&#8217;une base de données mondiale ou les données sont-elles même sur le réseau (et pas juste leurs méta-données). En discutant avec des chercheurs, collectant des données et les stockant sur leurs petits disques dur dans leurs bureaux, j&#8217;ai envie de leur dire à la façon de Tim Berners Lee : &laquo;&nbsp;libérez vos données ! mettez-les sur le réseau ! vous faites des images ? renseignez bien vos champs de description IPTC-Core et mettez vos images sur le réseau !&nbsp;&raquo;. Bien sur, il y a 1.000.000 de raisons pour qu&#8217;ils ne le fasse pas : ils ont une recherche en cours que le voisin veut surement leur voler, ils pensent que seul l&#8217;article final leur permettra d&#8217;être (re)-connus, et peut-être, ce ne sont pas leurs photos. Les documentalistes, bibliothécaire, archivistes ont un rôle majeur dans la réalisation d&#8217;un web qui contiendra des données &laquo;&nbsp;brutes&nbsp;&raquo; (certains disent primaires, factuelles, de terrains, d&#8217;enquêtes, etc.). Je renvois au projet data.gov ou nous imaginons bien le travail d&#8217;IST qui peut s&#8217;y développer. Construire le web de données nécessite de structurer les données avant qu&#8217;elles n&#8217;existent parfois. Dans les Sciences humaines et sociales, il faut aider les chercheurs &#8211; dont le volet technique, normatif, informatique n&#8217;est pas le métier &#8211; a le faire. Il faut leur expliquer, ce que j&#8217;aurai sans doute pu mieux faire à Marseille, que l&#8217;augmentation de la masse des données brutes, maintenant accessible, permet aux chercheurs de travailler sur des corpus plus larges, mieux documentés.</p>
<p>L&#8217;interopérabilité des données c&#8217;est mettre en œuvre une politique scientifique et technique permettant :</p>
<ul>
<li>
<p style="margin-bottom: 0cm;">de rendre (plus) accessible ces 	propres données dans un maximum de langages documentaires partagés 	par le plus grand nombre ;</p>
</li>
<li>
<p style="margin-bottom: 0cm;">de garantir l&#8217;accessibilité de 	ces données dans temps : ceci pour la citabilité des données dont 	la privatisation, par le DOI par exemple, pourrait avoir des 	conséquences dramatiques. Je milite là pour une évolution des 	identifiants OAI ou autres vers de véritables identifiants pérennes 	et uniques, garantis par un organisme international type <a href="http://portal.unesco.org/ci/fr/ev.php-URL_ID=19486&amp;URL_DO=DO_TOPIC&amp;URL_SECTION=201.html" target="_blank">UNESCO</a> ;</p>
</li>
<li>de faire vivre des données numériques : ajout de 	classifications, de schémas de description (documentaires dans un 	premier temps), prise en charge de pérennité des données par le 	développement de formats pivots pour la préservation ;</li>
</ul>
<p>Ces trois items sont, pour moi, les trois piliers de l&#8217;interopérabilité des données dans une optique future du web de données. Aujourd&#8217;hui, il nous est difficile de sortir du <a href="http://www.lespetitescases.net/carcans-de-la-pensee-hierarchique-et-documentaire-1" target="_blank">carcan de la pensée documentaire comme dirait Got</a> car les méthodes, techniques et outils qui sont enseignés correspondent encore au monde d&#8217;avant le web et nous n&#8217;avons pas encore d&#8217;outils de masse pour le monde d&#8217;après le web, mais ils arrivent et il nous faut faire œuvre de pédagogie. En attendant, nous chérissons nos méta-données. Il nous faut nous interroger sur l&#8217;encapsulation des méta-données descriptives dans les données (étape n°2 sur le chemin du web de données ?), mais aussi comment signaler à nos machines que la description d&#8217;une image est là au milieu des bits de l&#8217;image.</p>
<p>L&#8217;interopérabilité des données entre machines, via des méta-données, est la première marche, le premier pas vers le web de données. Si plusieurs techniques existent, l&#8217;OAI-PMH couplé aux descriptions en Dublin Core, représente le plus souvant le volet technique, informatique de l&#8217;interopérabilité des données aux yeux des professionnels de l&#8217;IST. La mise à plat des méta-données, dans l&#8217;OAI-PMH, a un avantage : il met à plat réellement les méta-données et nous oblige à repenser le rapport entre données, méta-données et le fait que, avec l&#8217;OAI-PMH, ce qui en sort, c&#8217;est du XML et pas une page web en HTML. On utilise le web pour faire autre chose que du HTML et des &laquo;&nbsp;pages&nbsp;&raquo; ; tout en se gardant la possibilité d&#8217;en faire, le web muterait-il ?. Nous faisons des flux de méta-données dans un langage pour des machines (aujourd&#8217;hui c&#8217;est du XML, mais demain&#8230;) : le web n&#8217;est pas que le territoire du HTML, il devient dynamique, il est un flux. Avec l&#8217;OAI-PMH, ce qui sort, c&#8217;est du flux XML (fluxml, cela fait vieux médicament) et pas une page web, pourtant il y a dedans de l&#8217;information mais nous échangeons juste de l&#8217;information sur la données, il nous faut aller plus loin. L&#8217;interopérabilité des données c&#8217;est presque un web des données.</p>
<p>Le mouvement est-il en marche ? <a href="http://renatis.cnrs.fr/spip.php?rubrique60" target="_blank">Le réseau national des documentalistes du CNRS organise en octobre 2009 trois jours autour de l&#8217;OAI-PMH</a> et j&#8217;espère son évolution future OAI-ORE. En 2010 aura lieu une seconde école thématique, très pratique, sur les sources numériques et l&#8217;interopérabilité des données. Ces sessions de formation continue sont bien évidement le reflet de ce qui se passe dans les IUT et à l&#8217;Université. Il me semble que ces éléments en sont des signes favorables.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/277/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Des données brutes 2.0</title>
		<link>http://blog.stephanepouyllau.org/242</link>
		<comments>http://blog.stephanepouyllau.org/242#comments</comments>
		<pubDate>Wed, 15 Jul 2009 17:57:17 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[archives numériques]]></category>
		<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[dublincore]]></category>
		<category><![CDATA[e-rudition]]></category>
		<category><![CDATA[métadonnées]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[web 2.0]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=242</guid>
		<description><![CDATA[L&#8217;administration Américaine a lancé data.gov : une plateforme d&#8217;accès aux données brutes de la santé, l&#8217;environnement, l&#8217;énergie, recherche, éducation. C&#8217;est très (trop?) ambitieux, voir utopique (mais il s&#8217;agit des USA) et d&#8217;ailleurs cet avis est partagé. Mais l&#8217;initiative est là et la plateforme déjà en ligne : il s&#8217;agit d&#8217;un projet hybride entre archives, recherche [...]]]></description>
			<content:encoded><![CDATA[<p>L&#8217;administration Américaine a lancé<a href="http://data.gov" target="_blank"> data.gov</a> : une plateforme d&#8217;accès aux données brutes de la santé, l&#8217;environnement, l&#8217;énergie, recherche, éducation. C&#8217;est très (trop?) ambitieux, voir utopique (mais il s&#8217;agit des USA) et <a href="http://www.christian-faure.net/2009/05/16/ladministration-obama-met-sa-strategie-it-au-coeur-de-sa-nouvelle-politique/" target="_blank">d&#8217;ailleurs cet avis est partagé</a>. Mais l&#8217;initiative est là et la plateforme déjà en ligne : il s&#8217;agit d&#8217;un projet hybride entre archives, recherche et accès. Ce projet, une récente discussion avec <a href="http://www.lespetitescases.net" target="_blank">Got</a>, croisée d&#8217;une journée avec les collègues du Centre de calcul de l&#8217;IN2P3-CNRS (qui héberge beaucoup de données issues des SHS), m&#8217;a conforté sur la notion et la nécessité de réservoirs de données brutes pour la recherche en SHS.</p>
<p>Ces réservoirs existent aujourd&#8217;hui dans les laboratoires de SHS, mais les données qu&#8217;ils contiennent sont souvent encore perçues comme des données &laquo;&nbsp;privés&nbsp;&raquo;, réservées aux chercheurs locaux. Il est vrai qu&#8217;ils les ont collectées ou générées et ce travail n&#8217;est pas réellement reconnu dans le parcours d&#8217;un chercheur alors qu&#8217;il est fondamental. Ces données &laquo;&nbsp;pour la recherche&nbsp;&raquo; ont donc souvent tendance à &laquo;&nbsp;mourir&nbsp;&raquo; au fond de nos disques durs faut d&#8217;une infrastructure double : archivage des données (pour l&#8217;histoire), diffusion des données &laquo;&nbsp;brutes&nbsp;&raquo; et pas forcement éditorialisées dans une publication électronique académique mais mise à disposition de la communauté scientifique comportant un minimum d&#8217;appareil éditorial basé sur le Dublin Core Terms par exemple.  D&#8217;autant que souvent, ces données ont été collectées ou générées sur fonds publics (ne serait ce que le salaire du chercheur).</p>
<p>Bien sur, il faut pondérer ici le fait que certaines données sont sensibles de part leur nature et que la mise à disposition ou la diffusion est complexe et nécessite des barrières mobiles parfois très longues.</p>
<p>En france, il existe des initiatives intéressantes, encore trop peu soutenues financièrement, mais cela avance, cela se structure et des formations, pour les chercheurs et enseignants-chercheurs, voient le jour tel que <a title="Wiki de l'université d'été de l'édition électronique ouverte" href="http://www.digitalhumanities.cnrs.fr/wikis/edelec-shs/index.php/Accueil" target="_blank">l&#8217;université d&#8217;été de l&#8217;édition scientifique ouverte</a>, qui aura lieu en septembre 2009, ou bien<a href="http://www.digitalhumanities.cnrs.fr/wikis/ecole-sources-num/index.php/Accueil" target="_blank"> l&#8217;école thématique des centres nationaux de ressources numériques du CNRS dont le wiki est en ligne</a> avec toutes les communications, les bibliographies numériques, en ligne, etc.</p>
<p>Alors, en ce mois de juillet, j&#8217;ai envie de dire : &laquo;&nbsp;ouvrez vos données à vos collègues et au monde&nbsp;&raquo; et j&#8217;espère aussi, soyons fou, un donnees.gouv.fr ?</p>
<p>Il est temps, dirons certains, que je parte en vacances.</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/242/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Dublin Core 2008 à Berlin</title>
		<link>http://blog.stephanepouyllau.org/158</link>
		<comments>http://blog.stephanepouyllau.org/158#comments</comments>
		<pubDate>Sat, 04 Oct 2008 06:14:59 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[dublincore]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=158</guid>
		<description><![CDATA[Le DC2008, organisé par le Competence Centre for Interoperable Metadata (KIM), le Max Planck Digital Library (MPDL), la Göttingen State and University Library (SUB), la German National Library (DNB), Humboldt Universität zu Berlin (HU Berlin) et le Dublin Core Metadata Initiative avec le concours de Wikimedia Deutschland, a permis de faire un panorama complet des [...]]]></description>
			<content:encoded><![CDATA[<p>Le DC2008, organisé par le <a href="http://www.kim-forum.org/" target="_blank">Competence Centre for Interoperable Metadata (KIM)</a>, le <a href="http://www.mpdl.mpg.de/" target="_blank">Max Planck Digital Library (MPDL)</a>, la <a href="http://www.sub.uni-goettingen.de/index-e.html" target="_blank">Göttingen State and University Library (SUB)</a>, la <a href="http://www.d-nb.de/" target="_blank">German National Library (DNB)</a>, <a href="http://www.hu-berlin.de/" target="_blank">Humboldt Universität zu Berlin (HU Berlin)</a> et le <a href="http://www.dublincore.org/" target="_blank">Dublin Core Metadata Initiative</a> avec le concours de <a href="http://www.wikimedia.de/" target="_blank">Wikimedia Deutschland</a>, a permis de faire un panorama complet des utilisations possibles des deux jeux principaux de méta-données Dublin Core (simple et qualifié). Plusieurs projets, issus principalement des communautés scientifiques, de celles des musées et du monde des bibliothèques (nationales ou universitaires) ont été présentés sous la forme de séances plénières, de workshops et de posters.</p>
<p style="margin-bottom: 0cm;">Après première journée dédiée à des d&#8217;ateliers d&#8217;introduction allant de l&#8217;histoire du DC, à la présentation de la mise en pratique du DC, les sessions plénières des mardi, mercredi, et jeudi ont permis de voir que le DC est aujourd&#8217;hui au coeur des outils d&#8217;inter-opérabilités développés par les producteurs de données que sont les grandes bibliothèques et le monde universitaire principalement. A plusieurs reprise, le DC a été mentionné comme étant le ciment permettant de mettre en oeuvre les échanges de méta-données, la communication de ces dernières et ceci à très grande échelle : pour des réservoirs ayant plusieurs centaines de milliers d&#8217;enregistrements. Le DC qualifié semble de plus en plus concurrencer le MARC par exemple : il est presque devenu natif dans les applications de gestion des bibliothèques.</p>
<p style="margin-bottom: 0cm;">Le DC est également au centre des problématiques du web sémantique. Plusieurs présentations sur ce sujet (principalement venant des USA) ont eu lieu et ont démontré que le web sémantique doit, pour ce développer, s&#8217;appuyer sur des technologies et méthode tel que le RDF associé au DC. Dans la construction des outils – et méthodes – du web sémantique le DC occupe une place importante car il agit comme un point de référence, une brique fondamentale de ce très grand chantier. Cependant, peu d&#8217;applications fonctionnelles ont été présentées et certains projets sont encore très expérimentaux.</p>
<p style="margin-bottom: 0cm;">On peut noter une forte progression de l&#8217;utilisation du DC dans les applications du web social et dans les applications web professionnelles. Le DC est de plus en plus couplé aux systèmes utilisant le RDF, le RDFa et dans sa sous-branche : le FOAF, etc.. Un doute subsiste cependant quant au retour sur investissement et sur la qualité en matière d&#8217;indexation collaborative grand public de corpus iconographique (ex. du <span style="font-style: normal;">SFMOM</span><span style="font-style: normal;"><span>A : </span></span><cite><a href="http://www.sfmoma.org/"><span style="font-style: normal;"><span>www.sfmoma.org</span></span></a></cite><span style="font-style: normal;"><span>). </span></span></p>
<p style="margin-bottom: 0cm; font-style: normal;">Le développement du DC dans les années qui viennent suivra l&#8217;évolution des méta-langages que sont le RDF et toutes ces déclinaisons. Le vecteur OAI-PMH est aussi fortement mentionné par les utilisateur du DC.</p>
<p style="margin-bottom: 0cm; font-style: normal;">Le DC s&#8217;impose dans les grands catalogues internationaux et dans les protocoles d&#8217;échanges entre bibliothèques et besoins universitaires ou de recherche.</p>
<p style="margin-bottom: 0cm; font-style: normal;">
<p style="margin-bottom: 0cm; font-style: normal;">Stéphane.</p>
<p style="margin-bottom: 0cm; font-style: normal;">
<p style="margin-bottom: 0cm; font-style: normal;">PS : A noter le peu de présence des Français, surtout venant des grandes bibliothèques, aucune bibliothèque universitaire représentée, les acteurs classiques de l&#8217;IST n&#8217;y était pas non plus, heureusement l&#8217;ABES était là et bien sur le CNRS et le TGE ADONIS que je représentais indirectement.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/158/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Le point sur le DC</title>
		<link>http://blog.stephanepouyllau.org/148</link>
		<comments>http://blog.stephanepouyllau.org/148#comments</comments>
		<pubDate>Tue, 23 Sep 2008 06:35:28 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[en général]]></category>
		<category><![CDATA[dublincore]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/?p=148</guid>
		<description><![CDATA[Bonjour, En direct de Berlin (où il pleut) ou va s&#8217;ouvrir dans quelques minutes le DC2008 : la conférence internationnale sur le Dublin Core et sur les applications qui utilisent ce format de métadonnées. Le programme est dense tant le sujet est vaste, mais pour une fois, pas besoin de courir à l&#8217;autre bout de [...]]]></description>
			<content:encoded><![CDATA[<p>Bonjour,</p>
<p>En direct de Berlin (où il pleut) ou va s&#8217;ouvrir dans quelques minutes le DC2008 : la conférence internationnale sur le Dublin Core et sur les applications qui utilisent ce format de métadonnées. <a href="http://www.dc2008.de">Le programme est dense tant le sujet est vaste</a>, mais pour une fois, pas besoin de courir à l&#8217;autre bout de la planète pour assister à cette conférence qui se réunie depuis la création du Dublin Core.</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/148/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Omeka : un outil du CHNM pour créer des expositions virtuelles</title>
		<link>http://blog.stephanepouyllau.org/101</link>
		<comments>http://blog.stephanepouyllau.org/101#comments</comments>
		<pubDate>Wed, 26 Dec 2007 13:28:43 +0000</pubDate>
		<dc:creator>Stéphane POUYLLAU</dc:creator>
				<category><![CDATA[archives numériques]]></category>
		<category><![CDATA[dublincore]]></category>

		<guid isPermaLink="false">http://blog.stephanepouyllau.org/omeka-un-outil-du-chnm-pour-creer-des-expositions-virtuelles</guid>
		<description><![CDATA[Bonjour, Annoncé il y a quelques semaines sur le site du CHNM (Center for History and New Media, qui réalise déjà l&#8217;outil Zotero), la plateforme Omeka permet la mise en ligne de collection de documents visuels et de créer des expositions virtuelles. Encore en version &#171;&#160;béta&#160;&#187;, je n&#8217;ai pas pu &#8211; encore &#8211; pu tester, [...]]]></description>
			<content:encoded><![CDATA[<p>Bonjour,</p>
<p>Annoncé il y a quelques semaines sur le site du CHNM (Center for History and New Media, qui réalise déjà l&#8217;outil Zotero), la plateforme Omeka permet la mise en ligne de collection de documents visuels et de créer des expositions virtuelles. Encore en version &laquo;&nbsp;béta&nbsp;&raquo;, je n&#8217;ai pas pu &#8211; encore &#8211; pu tester, cette nouvelle application reposant sur LAMP + ImageMagik mais dont le site présente les caractéristiques principales, voir <a href="http://omeka.org" target="_blank">omeka.org</a>. Omeka s&#8217;inscrit dans une lignée d&#8217;outils déjà existants dont le plus connu en Europe est <a href="http://www.pinakes.org" title="Pinakes" target="_blank">Pinakes</a> (dont la version 3 est aujourd&#8217;hui <em>open source</em>) mais qui s&#8217;adresse cependant davantage aux musées et à des collections bien documentées. Omeka apporte avec lui quelques standards : tel que l&#8217;utilisation des métadonnées Dublin Core dans ces différents niveaux (items, collections,etc). Pour le moment un projet est équipé avec Omeka : le projet <a href="http://hurricanearchive.org" title="hurricanearchive.org" target="_blank">hurricanearchive.org</a>. Ce projet permet la collecte de photographies et de données visuelles sur les dégâts engendrés par les cyclones Rita et Katrina.</p>
<p>Joyeuses fêtes,</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/101/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Décrire un objet numérique ou numérisé : utilisation du Dublin Core</title>
		<link>http://blog.stephanepouyllau.org/47</link>
		<comments>http://blog.stephanepouyllau.org/47#comments</comments>
		<pubDate>Fri, 26 Oct 2007 06:22:02 +0000</pubDate>
		<dc:creator>pouyllau</dc:creator>
				<category><![CDATA[digital humanities]]></category>
		<category><![CDATA[dublincore]]></category>
		<category><![CDATA[OAI-PMH]]></category>
		<category><![CDATA[xml]]></category>

		<guid isPermaLink="false">http://www.stephanepouyllau.org/wp/?p=47</guid>
		<description><![CDATA[Bonjour, La semaine passée un chercheur me demande : &#171;&#160;J&#8217;entends parler de métadonnées en Dublin Core, qu&#8217;est-ce ?&#160;&#187;. Après explication, je me suis aperçu que faire l&#8217;association entre les champs d&#8217;une base de donnée &#8211; décrivant des objets numériques ou numérisés &#8211; et la notion de métadonnées XML n&#8217;était pas forcement naturelle. Plus qu&#8217;une différence [...]]]></description>
			<content:encoded><![CDATA[<p>Bonjour,<br />
La semaine passée un chercheur me demande : &laquo;&nbsp;J&#8217;entends parler de métadonnées en Dublin Core, qu&#8217;est-ce ?&nbsp;&raquo;. Après explication, je me suis aperçu que faire l&#8217;association entre les champs d&#8217;une base de donnée &#8211; décrivant des objets numériques ou numérisés &#8211; et la notion de métadonnées XML n&#8217;était pas forcement naturelle. Plus qu&#8217;une différence de vocabulaire, il s&#8217;agit d&#8217;un terrain inconnu avec son lot de mystères et de rumeurs inquiétantes. La notion de champs de description, dans une base de données comportant une ou plusieurs tables, est assez connue aujourd&#8217;hui ; mais l&#8217;interaction entre ces champs et des métadonnées est assez nouvelle pour le grand public. L&#8217;information stockée dans un champ d&#8217;une table de données (par exemple le nom de l&#8217;auteur du document, ou sa date) peut être utilisée de différente façon. C&#8217;est là l&#8217;une des clés de la compréhension des métadonnées. Cette information peut être affichée directement sur un site web via l&#8217;intermédiaire d&#8217;un programme informatique (écrit en PHP ou Perl par exemple). Mais elle peut également servir à renseigner la valeur d&#8217;une balise HTML (dans une entête de fichier HTML), ou la valeur d&#8217;une balise XML (dans un fichier XML servant à échanger ou préserver donc de l&#8217;information de façon indépendante via à vis des logiciels courants).</p>
<p>Prenons l&#8217;exemple de deux équipes de recherche qui souhaitent échanger des informations. Chacune des équipes a créé une base de données qui a, pour des raisons historiques et pratiques, des champs différents : c&#8217;est à dire que les modélisations sont différentes car les besoins ont été listés sans concertation au départ. L&#8217;un des moyens pour échanger des informations entre ces deux bases de données est d&#8217;avoir un format commun aux deux équipes : par exemple s&#8217;échanger des fichiers textes (ou XML) en ayant structuré l&#8217;information de telle façon que les deux équipes seront capables de ranger ces informations dans les bonnes &laquo;&nbsp;cases&nbsp;&raquo; (champs) de leurs bases de données respectives.<br />
Il existe pour cela des normes de structuration de l&#8217;information (l&#8217;on dit aussi grammaire ou syntaxe). L&#8217;une des plus utile dans le monde de la recherche est la norme <em>Dublin Core</em> (ou DC). Le DC est une norme simple de description bibliographique créée pour les documents numériques. Le DC définit un ensemble d&#8217;éléments (l&#8217;on dira métadonnées ou &laquo;&nbsp;données de données&nbsp;&raquo;) qui sont au nombre de 15 pour le DC dit &laquo;&nbsp;non qualifié&nbsp;&raquo; (norme ISO 15836 de février 2003) :</p>
<ul>
<li>-le titre,</li>
<li>-le créateur,</li>
<li>-l&#8217;éditeur,</li>
<li>-le sujet,</li>
<li>-la description (sorte de résumé, qui peut se rapprocher de &laquo;&nbsp;l&#8217;Analyse&nbsp;&raquo; pour les médiévistes),</li>
<li>-la source,</li>
<li>-la langue,</li>
<li>-la relation (relation ou lien avec une autre ressource DC),</li>
<li>-la couverture (l&#8217;aspect spatio-temporelle de la ressource : géographies, chronologie),</li>
<li>-la date,</li>
<li>-le type (images, sons, textes),</li>
<li>-le format (le format de la ressource : txt ; wmv ; pdf ; ogg ; php ; mov ; rtf ; ops ; etc),</li>
<li>-l&#8217;identificateur (DOI ; URL ; id OAI-PMH),</li>
<li>-le contributeur (personne physique ou moral ayant participée à l&#8217;élaboration de la ressource),</li>
<li>-les droits.</li>
</ul>
<p>Ainsi, il est facilement possible de configurer une base de données MySQL, PostgreSQL, MS-Access ou même OpenOffice suivant ces &laquo;&nbsp;champs&nbsp;&raquo; et de créer un format de sortie XML reprennant les 15 élements DC. C&#8217;est le coeur, par exemple, des enregistrements dans un entrepôt <a href="http://www.openarchives.org/" hreflang="en">OAI-PMH</a> :</p>
<pre>&lt;record&gt;
   &lt;header&gt;
    &lt;identifier&gt;oai:www.crhst.cnrs.fr:hstl-000101&lt;/identifier&gt;
    &lt;datestamp&gt;2007-01-15T15:04:36Z&lt;/datestamp&gt;
    &lt;setSpec&gt;manuscript&lt;/setSpec&gt;
   &lt;/header&gt;
   &lt;metadata&gt;
     &lt;oai_dc:dc
       xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/"
       xmlns:dc="http://purl.org/dc/elements/1.1/"
       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
       xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/
       http://www.openarchives.org/OAI/2.0/oai_dc.xsd"&gt;
      &lt;dc:title&gt;Autobiographie d'Ampère.&lt;/dc:title&gt;
      &lt;dc:creator&gt;André-Marie AMPERE&lt;/dc:creator&gt;
      &lt;dc:subject&gt;history&lt;/dc:subject&gt;
      &lt;dc:description&gt;Cahier manuscrit de 16 feuillets dont les 8 premiers feuillets sont autographes...&lt;/dc:description&gt;
      &lt;dc:publisher&gt;Christine BLONDEL&lt;/dc:publisher&gt;
      &lt;dc:contributor&gt;CNRS, CRHST&lt;/dc:contributor&gt;
      &lt;dc:contributor&gt;HSTL : Delphine USAL&lt;/dc:contributor&gt;
      &lt;dc:date&gt;1824-00-00&lt;/dc:date&gt;
      &lt;dc:type&gt;studies materials&lt;/dc:type&gt;
      &lt;dc:type&gt;text&lt;/dc:type&gt;
      &lt;dc:format&gt;xhtml from databases&lt;/dc:format&gt;
      &lt;dc:identifier&gt;http://www.ampere.cnrs.fr/ice/ice_book_detail-fr-text-ampere-ampere_text-8-3.html&lt;/dc:identifier&gt;
      &lt;dc:source&gt;http://www.ampere.cnrs.fr/ice/ice_book_detail-fr-text-ampere-ampere_text-8-3.html&lt;/dc:source&gt;
      &lt;dc:language&gt;french&lt;/dc:language&gt;
      &lt;dc:coverage&gt;ampère&lt;/dc:coverage&gt;
      &lt;dc:coverage&gt;autobiographie&lt;/dc:coverage&gt;
      &lt;dc:coverage&gt;electricity&lt;/dc:coverage&gt;
      &lt;dc:coverage&gt;AMPERE&lt;/dc:coverage&gt;
      &lt;dc:coverage&gt;XIXe&lt;/dc:coverage&gt;
      &lt;dc:coverage&gt;France&lt;/dc:coverage&gt;
      &lt;dc:rights&gt;public domain&lt;/dc:rights&gt;
     &lt;/oai_dc:dc&gt;
   &lt;/metadata&gt;
  &lt;/record&gt;</pre>
<p>Nous voyons bien dans ce cas, que les balises XML utilisant le DC sont au coeur de la notice (dc:title par exemple). La notice XML, écrite en DC, est encapsulée dans d&#8217;autres balise XML propres à l&#8217;OAI-PMH. Cette notice XML DC est en fait générée par un script PHP (que nous pouvons nommer <em>application</em> ou <em>programme</em>) à partir d&#8217;une base de données MySQL.</p>
<p>Bonne journée,</p>
<p>Stéphane.</p>
]]></content:encoded>
			<wfw:commentRss>http://blog.stephanepouyllau.org/47/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

