Problème lors d'un moissonnage

  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:e2b87fb8dc155d5edaa70177dc93c4ce' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n </head>\n <body bgcolor=\"#ffffff\" text=\"#000000\">\n C\'est &agrave; dire ?<br>\n Je suis aussi admin sur le domaine, &ccedil;a devrait le faire, non ?<br>\n <br>\n <br>\n </div>', created = 1507749027, expire = 1507835427, headers = '', serialized = 0 WHERE cid = '4:e2b87fb8dc155d5edaa70177dc93c4ce' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:e2b87fb8dc155d5edaa70177dc93c4ce' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n </head>\n <body bgcolor=\"#ffffff\" text=\"#000000\">\n C\'est &agrave; dire ?<br>\n Je suis aussi admin sur le domaine, &ccedil;a devrait le faire, non ?<br>\n <br>\n <br>\n </div>', created = 1507749027, expire = 1507835427, headers = '', serialized = 0 WHERE cid = '4:e2b87fb8dc155d5edaa70177dc93c4ce' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:cc94ae6c279b46a42667d4fc72d24d48' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <title></title>\n </head>\n <body bgcolor=\"#ffffff\" text=\"#000000\">\n Bonjour,<br>\n <br>\n Merci pour les tests. En effet, d&eacute;sormais, je peux moissonner l\'IRD\n ! Je ne comprends pas bien cette diff&eacute;rence de r&eacute;sultat, &agrave; moins\n d\'une erreur au niveau du d&eacute;p&ocirc;t lors de nos pr&eacute;c&eacute;dentes tentatives.\n La feuille de style xsl n\'est donc pas en cause.<br>\n <br>\n Pour ce qui est de revues.org, si je comprends bien, je ne peux pas\n moissonner tant que le d&eacute;p&ocirc;t pr&eacute;sente cette arborescence ?<br>\n <br>\n Bien cordialement<br>\n <br>\n St&eacute;phane Loret<br>\n MSH - Tours<br>\n Crevilles.org<br>\n <br>\n <br>\n <br>\n Le 27/01/11 15:02, Yohan Colmant a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <font size=\"-1\"><font face=\"Verdana\">Bonjour,<br>\n <br>\n Je viens bien de moissonner l\'IRD en oai_dc.<br>\n J\'ai s&eacute;lectionn&eacute; le set \"Documentation\" sans probl&egrave;me. J\'ai\n moissonn&eacute; 94 fiches et je n\'ai pas eu de soucis avec la XSL.\n Pouvez-vous nous envoyer des logs si &ccedil;a ne fonctionne pas chez\n vous ?<br>\n <br>\n Pour le site Revues.org je pense savoir o&ugrave; est le soucis.<br>\n Si je vais ici <a moz-do-not-send=\"true\"\n class=\"moz-txt-link-freetext\"\n href=\"http://oai.revues.org/?verb=ListSets\">http://oai.revues.org/?verb=ListSets</a>\n j\'ai la liste de tous les sets propos&eacute;s.<br>\n <br>\n Ils sont tous de la forme setSpec = oai:revues.org:XXXXXX<br>\n Si on regarde les sp&eacute;cifications du protocole OAI-PMH, il me\n semble que l\'utilisation des \":\" est claire. Cf. <a\n moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\"\n href=\"http://www.openarchives.org/OAI/openarchivesprotocol.html#Set\">http://www.openarchives.org/OAI/openarchivesprotocol.html#Set</a><br>\n <br>\n Le probl&egrave;me ici est donc qu\'ils utilisent une arborescence de\n sets avec des setSpec oai:revues.org:XXXXX sans avoir de\n setSpec \"oai\" et \"oai:revues.org\".<br>\n oai:revues.org:journal indique que l\'on moissonne le set\n \"journal\" qui est enfant de \"revues.org\" lui-m&ecirc;me enfant de\n \"oai\". Le soucis est que \"oai\" et \"revues.org\" n\'existent pas.<br>\n <br>\n On devrait donc avoir les sets :<br>\n oai<br>\n oai:revues.org<br>\n oai:revues.org:journal<br>\n </font></font>oai:revues.org:recherchestravaux<br>\n oai:revues.org:recherchestravaux:58<br>\n etc.<br>\n <br>\n ou plus simplement car les niveaux oai et oai:revues.org sont\n inutiles &agrave; mon sens :<br>\n <br>\n <font size=\"-1\"><font face=\"Verdana\">journal<br>\n </font></font>recherchestravaux<br>\n recherchestravaux:58<br>\n etc.<br>\n <font size=\"-1\"><font face=\"Verdana\"><br>\n Cordialement,<br>\n <br>\n </font></font>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\"> <font face=\"Verdana\"><small> Yohan\n COLMANT<br>\n Direction des Syst&egrave;mes d\'Information<br>\n UVHC - Universit&eacute; de Valenciennes et du Hainaut Cambr&eacute;sis<br>\n Coordinateur Technique du projet ORI-OAI </small> </font>\n </div>\n </div>\n <br>\n Le 20/01/2011 14:22, <a moz-do-not-send=\"true\"\n class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a>\n a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Author_1\"><blockquote>\n <pre wrap=\"\">Bonjour,\n\nJe viens de proc&eacute;der &agrave; une moisson sur l\'archive de l\'IRD, &agrave; cette adresse <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.documentation.ird.fr/fdi/oai.php\">http://www.documentation.ird.fr/fdi/oai.php</a> \nLe probl&egrave;me est que cette base url pr&eacute;sente une feuille de style xslt qui fait planter la moisson. Voici l\'erreur retourn&eacute;e dans catalina.out\n\n[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.\n\nJ\'ai v&eacute;rifi&eacute; les diff&eacute;rentes bases url que nous devons moissonner. Toutes celles qui pr&eacute;sentent une feuille de style posent le m&ecirc;me probl&egrave;me. Un autre exemple avec cette adresse : <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://oai.revues.org/\">http://oai.revues.org/</a> qui, si elle ne pr&eacute;sente pas de feuille xslt &agrave; la base, d&egrave;s qu\'une requ&ecirc;te (Identify, etc...) est envoy&eacute;e une feuille de style est bien pr&eacute;sente qui, elle, fait planter la recherche de la liste des sets.\n\nJe me posais donc la question de savoir si je pouvais \"squizzer\" cette feuille &agrave; partir du harvester qui n\'a pas grand int&eacute;r&ecirc;t sur le plan d\'une moisson.\n\nBien &agrave; vous\n\nSt&eacute;phane LORET\nMSH - Tours\nCr&eacute;villes.org\n\n\n\n\n\n\n\n</pre>\n </blockquote></div>\n </blockquote></div></div>\n <br>\n </body>\n</html>\n</div>', created = 1507749027, expire = 1507835427, headers = '', serialized = 0 WHERE cid = '4:cc94ae6c279b46a42667d4fc72d24d48' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:3395dc9c0472798045a848c5fcc0b651' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=UTF-8\" http-equiv=\"Content-Type\">\n </head>\n <body text=\"#000000\" bgcolor=\"#ffffff\">\n <font size=\"-1\"><font face=\"Verdana\">Je me demande du coup si on\n comprend bien ce qui est décrit dans la norme OAI-PMH sur la\n notion de hiérarchie et l\'utilisation des \":\".<br>\n Vous avez pu lire le paragraphe en question ? Qu\'en pensez-vous\n ? Tout regard extérieur est le bienvenu sur la question.<br>\n <br>\n Merci<br>\n </font></font>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\">\n <font face=\"Verdana\"><small>\n Yohan COLMANT<br>\n Direction des Systèmes d\'Information<br>\n UVHC - Université de Valenciennes et du Hainaut Cambrésis<br>\n Coordinateur Technique du projet ORI-OAI\n </small>\n </font>\n </div>\n </div>\n <br>\n Le 28/01/2011 13:48, <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a écrit :\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <pre wrap=\"\">Bonjour,\n\nLe même problème se pose avec le dépôt OAI-PMH de Persée (<a class=\"moz-txt-link-freetext\" href=\"http://oai.persee.fr/c/ext/prescript/oai\">http://oai.persee.fr/c/ext/prescript/oai</a>). Une erreur est retournée au niveau de la liste des sets dans ori-harvester.log : \n\n28 janv. 2011 13:35:50,165 [ WARN] catalina-exec-4 org.orioai.harvesting.domain.logic.OAIStore getSetInfosWithResumptionToken - can\'t find listset info for <a class=\"moz-txt-link-freetext\" href=\"http://oai.persee.fr/c/ext/prescript/oaihttp://www.openarchives.org/OAI/2.0/\">http://oai.persee.fr/c/ext/prescript/oaihttp://www.openarchives.org/OAI/2.0/</a> <a class=\"moz-txt-link-freetext\" href=\"http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd\">http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd</a> <a class=\"moz-txt-link-freetext\" href=\"http://purl.org/dc/elements/1.1/\">http://purl.org/dc/elements/1.1/</a> <a class=\"moz-txt-link-freetext\" href=\"http://dublincore.org/schemas/xmls/qdc/2003/04/02/dc.xsd\">http://dublincore.org/schemas/xmls/qdc/2003/04/02/dc.xsd</a> <a class=\"moz-txt-link-freetext\" href=\"http://purl.org/dc/terms/\">http://purl.org/dc/terms/</a> <a class=\"moz-txt-link-freetext\" href=\"http://dublincore.org/schemas/xmls/qdc/2003/04/02/dcterms.xsd\">http://dublincore.org/schemas\n/xmls/qdc/2003/04/02/dcterms.xsd</a>\n\nLe module ne trouve donc pas la liste des sets. L\'arborescence est du même tonneau que celle du dépôt de Revues.org. Le souci est que nous arrivons à moissonner les sets (revues.org et persée) à partir d\'autres moteurs (PKP, le plugin Harvester d\'Omeka).\n\nJ\'ai envoyé un message explicitant le problème aux responsables techniques de ces dépôts. Je suis en attente de leur réponse.\n\nBien à vous\n\nStéphane Loret\nMSH - Tours\nCrevilles.org\n\n\n\n----- Mail Original -----\nDe: <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a>\nÀ: <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a>\nEnvoyé: Vendredi 28 Janvier 2011 10h42:26 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne\nObjet: Re: [ori-oai-utilisateurs] Problème lors d\'un moissonnage\n\nOui, nous les connaissons bien. Je fais remonter.\n\nBien cordialement\n\nStéphane Loret\nMSH -Tours\nCrevilles.org\n\n----- Mail Original -----\nDe: \"Yohan Colmant\" <a class=\"moz-txt-link-rfc2396E\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\">&lt;<span id=\"919301b5c518c9ff00d1a59ebc883be5\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'919301b5c518c9ff00d1a59ebc883be5\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\'+\'\">\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>&gt;</a>\nÀ: <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a>\nEnvoyé: Vendredi 28 Janvier 2011 10h36:18 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne\nObjet: Re: [ori-oai-utilisateurs] Problème lors d\'un moissonnage\n\nEn effet concernant revues.org \nSi vous êtes en contact avec eux, c\'est peut-être un problème que vous pouvez leur remonter ? \n\nCdt \n\n\nYohan COLMANT \nDirection des Systèmes d\'Information \nUVHC - Université de Valenciennes et du Hainaut Cambrésis \nCoordinateur Technique du projet ORI-OAI \nLe 28/01/2011 09:30, Stéphane Loret a écrit : \n\nBonjour, \n\nMerci pour les tests. En effet, désormais, je peux moissonner l\'IRD ! Je ne comprends pas bien cette différence de résultat, à moins d\'une erreur au niveau du dépôt lors de nos précédentes tentatives. La feuille de style xsl n\'est donc pas en cause. \n\nPour ce qui est de revues.org, si je comprends bien, je ne peux pas moissonner tant que le dépôt présente cette arborescence ? \n\nBien cordialement \n\nStéphane Loret \nMSH - Tours \nCrevilles.org \n\n\n\nLe 27/01/11 15:02, Yohan Colmant a écrit : \n\nBonjour, \n\nJe viens bien de moissonner l\'IRD en oai_dc. \nJ\'ai sélectionné le set \"Documentation\" sans problème. J\'ai moissonné 94 fiches et je n\'ai pas eu de soucis avec la XSL. Pouvez-vous nous envoyer des logs si ça ne fonctionne pas chez vous ? \n\nPour le site Revues.org je pense savoir où est le soucis. \nSi je vais ici <a class=\"moz-txt-link-freetext\" href=\"http://oai.revues.org/?verb=ListSets\">http://oai.revues.org/?verb=ListSets</a> j\'ai la liste de tous les sets proposés. \n\nIls sont tous de la forme setSpec = oai:revues.org:XXXXXX \nSi on regarde les spécifications du protocole OAI-PMH, il me semble que l\'utilisation des \":\" est claire. Cf. <a class=\"moz-txt-link-freetext\" href=\"http://www.openarchives.org/OAI/openarchivesprotocol.html#Set\">http://www.openarchives.org/OAI/openarchivesprotocol.html#Set</a> \n\nLe problème ici est donc qu\'ils utilisent une arborescence de sets avec des setSpec oai:revues.org:XXXXX sans avoir de setSpec \"oai\" et \"oai:revues.org\". \noai:revues.org:journal indique que l\'on moissonne le set \"journal\" qui est enfant de \"revues.org\" lui-même enfant de \"oai\". Le soucis est que \"oai\" et \"revues.org\" n\'existent pas. \n\nOn devrait donc avoir les sets : \noai \noai:revues.org \noai:revues.org:journal \noai:revues.org:recherchestravaux \noai:revues.org:recherchestravaux:58 \netc. \n\nou plus simplement car les niveaux oai et oai:revues.org sont inutiles à mon sens : \n\njournal \nrecherchestravaux \nrecherchestravaux:58 \netc. \n\nCordialement, \n\n\n\nYohan COLMANT \nDirection des Systèmes d\'Information \nUVHC - Université de Valenciennes et du Hainaut Cambrésis \nCoordinateur Technique du projet ORI-OAI \nLe 20/01/2011 14:22, <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a écrit : \n\nBonjour,\n\nJe viens de procéder à une moisson sur l\'archive de l\'IRD, à cette adresse <a class=\"moz-txt-link-freetext\" href=\"http://www.documentation.ird.fr/fdi/oai.php\">http://www.documentation.ird.fr/fdi/oai.php</a> Le problème est que cette base url présente une feuille de style xslt qui fait planter la moisson. Voici l\'erreur retournée dans catalina.out\n\n[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.\n\nJ\'ai vérifié les différentes bases url que nous devons moissonner. Toutes celles qui présentent une feuille de style posent le même problème. Un autre exemple avec cette adresse : <a class=\"moz-txt-link-freetext\" href=\"http://oai.revues.org/\">http://oai.revues.org/</a> qui, si elle ne présente pas de feuille xslt à la base, dès qu\'une requête (Identify, etc...) est envoyée une feuille de style est bien présente qui, elle, fait planter la recherche de la liste des sets.\n\nJe me posais donc la question de savoir si je pouvais \"squizzer\" cette feuille à partir du harvester qui n\'a pas grand intérêt sur le plan d\'une moisson.\n\nBien à vous\n\nStéphane LORET\nMSH - Tours\nCrévilles.org \n\n\n</pre>\n </blockquote></div></div>\n </body>\n</html>\n</div>', created = 1507749028, expire = 1507835428, headers = '', serialized = 0 WHERE cid = '4:3395dc9c0472798045a848c5fcc0b651' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:70fcdf346d6bc52eadc5b33bd2cd3418' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour,</p>\n<p>Le même problème se pose avec le dépôt OAI-PMH de Persée (<a href=\"http://oai.persee.fr/c/ext/prescript/oai\" title=\"http://oai.persee.fr/c/ext/prescript/oai\">http://oai.persee.fr/c/ext/prescript/oai</a>). Une erreur est retournée au niveau de la liste des sets dans ori-harvester.log : </p>\n<p>28 janv. 2011 13:35:50,165 [ WARN] catalina-exec-4 org.orioai.harvesting.domain.logic.OAIStore getSetInfosWithResumptionToken - can\'t find listset info for <a href=\"http://oai.persee.fr/c/ext/prescript/oaihttp://www.openarchives.org/OAI/2.0/\" title=\"http://oai.persee.fr/c/ext/prescript/oaihttp://www.openarchives.org/OAI/2.0/\">http://oai.persee.fr/c/ext/prescript/oaihttp://www.openarchives.org/OAI/...</a> <a href=\"http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd\" title=\"http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd\">http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd</a> <a href=\"http://purl.org/dc/elements/1.1/\" title=\"http://purl.org/dc/elements/1.1/\">http://purl.org/dc/elements/1.1/</a> <a href=\"http://dublincore.org/schemas/xmls/qdc/2003/04/02/dc.xsd\" title=\"http://dublincore.org/schemas/xmls/qdc/2003/04/02/dc.xsd\">http://dublincore.org/schemas/xmls/qdc/2003/04/02/dc.xsd</a> <a href=\"http://purl.org/dc/terms/\" title=\"http://purl.org/dc/terms/\">http://purl.org/dc/terms/</a> <a href=\"http://dublincore.org/schemas/xmls/qdc/2003/04/02/dcterms.xsd\" title=\"http://dublincore.org/schemas/xmls/qdc/2003/04/02/dcterms.xsd\">http://dublincore.org/schemas/xmls/qdc/2003/04/02/dcterms.xsd</a></p>\n<p>Le module ne trouve donc pas la liste des sets. L\'arborescence est du même tonneau que celle du dépôt de Revues.org. Le souci est que nous arrivons à moissonner les sets (revues.org et persée) à partir d\'autres moteurs (PKP, le plugin Harvester d\'Omeka).</p>\n<p>J\'ai envoyé un message explicitant le problème aux responsables techniques de ces dépôts. Je suis en attente de leur réponse.</p>\n<p>Bien à vous</p>\n<p>Stéphane Loret<br />\nMSH - Tours<br />\nCrevilles.org</p>\n<p>----- Mail Original -----<br />\nDe: <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a><br />\nÀ: <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a><br />\nEnvoyé: Vendredi 28 Janvier 2011 10h42:26 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne<br />\nObjet: Re: [ori-oai-utilisateurs] Problème lors d\'un moissonnage</p>\n<p>Oui, nous les connaissons bien. Je fais remonter.</p>\n<p>Bien cordialement</p>\n<p>Stéphane Loret<br />\nMSH -Tours<br />\nCrevilles.org</p>\n<p>----- Mail Original -----<br />\nDe: \"Yohan Colmant\" <<span id=\"a3d5e92c57484df32761ceb295829e87\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'a3d5e92c57484df32761ceb295829e87\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\'+\'\">\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>><br />\nÀ: <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a><br />\nEnvoyé: Vendredi 28 Janvier 2011 10h36:18 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne<br />\nObjet: Re: [ori-oai-utilisateurs] Problème lors d\'un moissonnage</p>\n<p>En effet concernant revues.org<br />\nSi vous êtes en contact avec eux, c\'est peut-être un problème que vous pouvez leur remonter ? </p>\n<p>Cdt </p>\n<p>Yohan COLMANT<br />\nDirection des Systèmes d\'Information<br />\nUVHC - Université de Valenciennes et du Hainaut Cambrésis<br />\nCoordinateur Technique du projet ORI-OAI<br />\nLe 28/01/2011 09:30, Stéphane Loret a écrit : </p>\n<p>Bonjour, </p>\n<p>Merci pour les tests. En effet, désormais, je peux moissonner l\'IRD ! Je ne comprends pas bien cette différence de résultat, à moins d\'une erreur au niveau du dépôt lors de nos précédentes tentatives. La feuille de style xsl n\'est donc pas en cause. </p>\n<p>Pour ce qui est de revues.org, si je comprends bien, je ne peux pas moissonner tant que le dépôt présente cette arborescence ? </p>\n<p>Bien cordialement </p>\n<p>Stéphane Loret<br />\nMSH - Tours<br />\nCrevilles.org </p>\n<p>Le 27/01/11 15:02, Yohan Colmant a écrit : </p>\n<p>Bonjour, </p>\n<p>Je viens bien de moissonner l\'IRD en oai_dc.<br />\nJ\'ai sélectionné le set \"Documentation\" sans problème. J\'ai moissonné 94 fiches et je n\'ai pas eu de soucis avec la XSL. Pouvez-vous nous envoyer des logs si ça ne fonctionne pas chez vous ? </p>\n<p>Pour le site Revues.org je pense savoir où est le soucis.<br />\nSi je vais ici <a href=\"http://oai.revues.org/?verb=ListSets\" title=\"http://oai.revues.org/?verb=ListSets\">http://oai.revues.org/?verb=ListSets</a> j\'ai la liste de tous les sets proposés. </p>\n<p>Ils sont tous de la forme setSpec = oai:revues.org:XXXXXX<br />\nSi on regarde les spécifications du protocole OAI-PMH, il me semble que l\'utilisation des \":\" est claire. Cf. <a href=\"http://www.openarchives.org/OAI/openarchivesprotocol.html#Set\" title=\"http://www.openarchives.org/OAI/openarchivesprotocol.html#Set\">http://www.openarchives.org/OAI/openarchivesprotocol.html#Set</a> </p>\n<p>Le problème ici est donc qu\'ils utilisent une arborescence de sets avec des setSpec oai:revues.org:XXXXX sans avoir de setSpec \"oai\" et \"oai:revues.org\".<br />\noai:revues.org:journal indique que l\'on moissonne le set \"journal\" qui est enfant de \"revues.org\" lui-même enfant de \"oai\". Le soucis est que \"oai\" et \"revues.org\" n\'existent pas. </p>\n<p>On devrait donc avoir les sets :<br />\noai<br />\noai:revues.org<br />\noai:revues.org:journal<br />\noai:revues.org:recherchestravaux<br />\noai:revues.org:recherchestravaux:58<br />\netc. </p>\n<p>ou plus simplement car les niveaux oai et oai:revues.org sont inutiles à mon sens : </p>\n<p>journal<br />\nrecherchestravaux<br />\nrecherchestravaux:58<br />\netc. </p>\n<p>Cordialement, </p>\n<p>Yohan COLMANT<br />\nDirection des Systèmes d\'Information<br />\nUVHC - Université de Valenciennes et du Hainaut Cambrésis<br />\nCoordinateur Technique du projet ORI-OAI<br />\nLe 20/01/2011 14:22, <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a écrit : </p>\n<p>Bonjour,</p>\n<p>Je viens de procéder à une moisson sur l\'archive de l\'IRD, à cette adresse <a href=\"http://www.documentation.ird.fr/fdi/oai.php\" title=\"http://www.documentation.ird.fr/fdi/oai.php\">http://www.documentation.ird.fr/fdi/oai.php</a> Le problème est que cette base url présente une feuille de style xslt qui fait planter la moisson. Voici l\'erreur retournée dans catalina.out</p>\n<p>[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.</p>\n<p>J\'ai vérifié les différentes bases url que nous devons moissonner. Toutes celles qui présentent une feuille de style posent le même problème. Un autre exemple avec cette adresse : <a href=\"http://oai.revues.org/\" title=\"http://oai.revues.org/\">http://oai.revues.org/</a> qui, si elle ne présente pas de feuille xslt à la base, dès qu\'une requête (Identify, etc...) est envoyée une feuille de style est bien présente qui, elle, fait planter la recherche de la liste des sets.</p>\n<p>Je me posais donc la question de savoir si je pouvais \"squizzer\" cette feuille à partir du harvester qui n\'a pas grand intérêt sur le plan d\'une moisson.</p>\n<p>Bien à vous</p>\n<p>Stéphane LORET<br />\nMSH - Tours<br />\nCrévilles.org </p>\n</div>\n', created = 1507749028, expire = 1507835428, headers = '', serialized = 0 WHERE cid = '4:70fcdf346d6bc52eadc5b33bd2cd3418' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:9ec3a27ee3091ecba8ffdaeed62bf95a' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Oui, nous les connaissons bien. Je fais remonter.</p>\n<p>Bien cordialement</p>\n<p>Stéphane Loret<br />\nMSH -Tours<br />\nCrevilles.org</p>\n<p>----- Mail Original -----<br />\nDe: \"Yohan Colmant\" <<span id=\"e390b2fbe7141abbf400b0017fdabd65\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'e390b2fbe7141abbf400b0017fdabd65\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\'+\'\">\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>><br />\nÀ: <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a><br />\nEnvoyé: Vendredi 28 Janvier 2011 10h36:18 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne<br />\nObjet: Re: [ori-oai-utilisateurs] Problème lors d\'un moissonnage</p>\n<p>En effet concernant revues.org<br />\nSi vous êtes en contact avec eux, c\'est peut-être un problème que vous pouvez leur remonter ? </p>\n<p>Cdt </p>\n<p>Yohan COLMANT<br />\nDirection des Systèmes d\'Information<br />\nUVHC - Université de Valenciennes et du Hainaut Cambrésis<br />\nCoordinateur Technique du projet ORI-OAI<br />\nLe 28/01/2011 09:30, Stéphane Loret a écrit : </p>\n<p>Bonjour, </p>\n<p>Merci pour les tests. En effet, désormais, je peux moissonner l\'IRD ! Je ne comprends pas bien cette différence de résultat, à moins d\'une erreur au niveau du dépôt lors de nos précédentes tentatives. La feuille de style xsl n\'est donc pas en cause. </p>\n<p>Pour ce qui est de revues.org, si je comprends bien, je ne peux pas moissonner tant que le dépôt présente cette arborescence ? </p>\n<p>Bien cordialement </p>\n<p>Stéphane Loret<br />\nMSH - Tours<br />\nCrevilles.org </p>\n<p>Le 27/01/11 15:02, Yohan Colmant a écrit : </p>\n<p>Bonjour, </p>\n<p>Je viens bien de moissonner l\'IRD en oai_dc.<br />\nJ\'ai sélectionné le set \"Documentation\" sans problème. J\'ai moissonné 94 fiches et je n\'ai pas eu de soucis avec la XSL. Pouvez-vous nous envoyer des logs si ça ne fonctionne pas chez vous ? </p>\n<p>Pour le site Revues.org je pense savoir où est le soucis.<br />\nSi je vais ici <a href=\"http://oai.revues.org/?verb=ListSets\" title=\"http://oai.revues.org/?verb=ListSets\">http://oai.revues.org/?verb=ListSets</a> j\'ai la liste de tous les sets proposés. </p>\n<p>Ils sont tous de la forme setSpec = oai:revues.org:XXXXXX<br />\nSi on regarde les spécifications du protocole OAI-PMH, il me semble que l\'utilisation des \":\" est claire. Cf. <a href=\"http://www.openarchives.org/OAI/openarchivesprotocol.html#Set\" title=\"http://www.openarchives.org/OAI/openarchivesprotocol.html#Set\">http://www.openarchives.org/OAI/openarchivesprotocol.html#Set</a> </p>\n<p>Le problème ici est donc qu\'ils utilisent une arborescence de sets avec des setSpec oai:revues.org:XXXXX sans avoir de setSpec \"oai\" et \"oai:revues.org\".<br />\noai:revues.org:journal indique que l\'on moissonne le set \"journal\" qui est enfant de \"revues.org\" lui-même enfant de \"oai\". Le soucis est que \"oai\" et \"revues.org\" n\'existent pas. </p>\n<p>On devrait donc avoir les sets :<br />\noai<br />\noai:revues.org<br />\noai:revues.org:journal<br />\noai:revues.org:recherchestravaux<br />\noai:revues.org:recherchestravaux:58<br />\netc. </p>\n<p>ou plus simplement car les niveaux oai et oai:revues.org sont inutiles à mon sens : </p>\n<p>journal<br />\nrecherchestravaux<br />\nrecherchestravaux:58<br />\netc. </p>\n<p>Cordialement, </p>\n<p>Yohan COLMANT<br />\nDirection des Systèmes d\'Information<br />\nUVHC - Université de Valenciennes et du Hainaut Cambrésis<br />\nCoordinateur Technique du projet ORI-OAI<br />\nLe 20/01/2011 14:22, <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a écrit : </p>\n<p>Bonjour,</p>\n<p>Je viens de procéder à une moisson sur l\'archive de l\'IRD, à cette adresse <a href=\"http://www.documentation.ird.fr/fdi/oai.php\" title=\"http://www.documentation.ird.fr/fdi/oai.php\">http://www.documentation.ird.fr/fdi/oai.php</a> Le problème est que cette base url présente une feuille de style xslt qui fait planter la moisson. Voici l\'erreur retournée dans catalina.out</p>\n<p>[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.</p>\n<p>J\'ai vérifié les différentes bases url que nous devons moissonner. Toutes celles qui présentent une feuille de style posent le même problème. Un autre exemple avec cette adresse : <a href=\"http://oai.revues.org/\" title=\"http://oai.revues.org/\">http://oai.revues.org/</a> qui, si elle ne présente pas de feuille xslt à la base, dès qu\'une requête (Identify, etc...) est envoyée une feuille de style est bien présente qui, elle, fait planter la recherche de la liste des sets.</p>\n<p>Je me posais donc la question de savoir si je pouvais \"squizzer\" cette feuille à partir du harvester qui n\'a pas grand intérêt sur le plan d\'une moisson.</p>\n<p>Bien à vous</p>\n<p>Stéphane LORET<br />\nMSH - Tours<br />\nCrévilles.org </p>\n</div>\n', created = 1507749028, expire = 1507835428, headers = '', serialized = 0 WHERE cid = '4:9ec3a27ee3091ecba8ffdaeed62bf95a' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:7c499edbca7c36054ef5e9716d8275f3' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n </head>\n <body text=\"#000000\" bgcolor=\"#ffffff\">\n <font size=\"-1\"><font face=\"Verdana\">En effet concernant revues.org<br>\n Si vous &ecirc;tes en contact avec eux, c\'est peut-&ecirc;tre un probl&egrave;me\n que vous pouvez leur remonter ?<br>\n <br>\n Cdt<br>\n </font></font>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\">\n <font face=\"Verdana\"><small>\n Yohan COLMANT<br>\n Direction des Syst&egrave;mes d\'Information<br>\n UVHC - Universit&eacute; de Valenciennes et du Hainaut Cambr&eacute;sis<br>\n Coordinateur Technique du projet ORI-OAI\n </small>\n </font>\n </div>\n </div>\n <br>\n Le 28/01/2011 09:30, St&eacute;phane Loret a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <title></title>\n Bonjour,<br>\n <br>\n Merci pour les tests. En effet, d&eacute;sormais, je peux moissonner\n l\'IRD ! Je ne comprends pas bien cette diff&eacute;rence de r&eacute;sultat, &agrave;\n moins d\'une erreur au niveau du d&eacute;p&ocirc;t lors de nos pr&eacute;c&eacute;dentes\n tentatives. La feuille de style xsl n\'est donc pas en cause.<br>\n <br>\n Pour ce qui est de revues.org, si je comprends bien, je ne peux\n pas moissonner tant que le d&eacute;p&ocirc;t pr&eacute;sente cette arborescence ?<br>\n <br>\n Bien cordialement<br>\n <br>\n St&eacute;phane Loret<br>\n MSH - Tours<br>\n Crevilles.org<br>\n <br>\n <br>\n <br>\n Le 27/01/11 15:02, Yohan Colmant a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Author_1\"><blockquote>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <font size=\"-1\"><font face=\"Verdana\">Bonjour,<br>\n <br>\n Je viens bien de moissonner l\'IRD en oai_dc.<br>\n J\'ai s&eacute;lectionn&eacute; le set \"Documentation\" sans probl&egrave;me. J\'ai\n moissonn&eacute; 94 fiches et je n\'ai pas eu de soucis avec la XSL.\n Pouvez-vous nous envoyer des logs si &ccedil;a ne fonctionne pas\n chez vous ?<br>\n <br>\n Pour le site Revues.org je pense savoir o&ugrave; est le soucis.<br>\n Si je vais ici <a moz-do-not-send=\"true\"\n class=\"moz-txt-link-freetext\"\n href=\"http://oai.revues.org/?verb=ListSets\">http://oai.revues.org/?verb=ListSets</a>\n j\'ai la liste de tous les sets propos&eacute;s.<br>\n <br>\n Ils sont tous de la forme setSpec = oai:revues.org:XXXXXX<br>\n Si on regarde les sp&eacute;cifications du protocole OAI-PMH, il me\n semble que l\'utilisation des \":\" est claire. Cf. <a\n moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\"\n href=\"http://www.openarchives.org/OAI/openarchivesprotocol.html#Set\">http://www.openarchives.org/OAI/openarchivesprotocol.html#Set</a><br>\n <br>\n Le probl&egrave;me ici est donc qu\'ils utilisent une arborescence\n de sets avec des setSpec oai:revues.org:XXXXX sans avoir de\n setSpec \"oai\" et \"oai:revues.org\".<br>\n oai:revues.org:journal indique que l\'on moissonne le set\n \"journal\" qui est enfant de \"revues.org\" lui-m&ecirc;me enfant de\n \"oai\". Le soucis est que \"oai\" et \"revues.org\" n\'existent\n pas.<br>\n <br>\n On devrait donc avoir les sets :<br>\n oai<br>\n oai:revues.org<br>\n oai:revues.org:journal<br>\n </font></font>oai:revues.org:recherchestravaux<br>\n oai:revues.org:recherchestravaux:58<br>\n etc.<br>\n <br>\n ou plus simplement car les niveaux oai et oai:revues.org sont\n inutiles &agrave; mon sens :<br>\n <br>\n <font size=\"-1\"><font face=\"Verdana\">journal<br>\n </font></font>recherchestravaux<br>\n recherchestravaux:58<br>\n etc.<br>\n <font size=\"-1\"><font face=\"Verdana\"><br>\n Cordialement,<br>\n <br>\n </font></font>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\"> <font face=\"Verdana\"><small>\n Yohan COLMANT<br>\n Direction des Syst&egrave;mes d\'Information<br>\n UVHC - Universit&eacute; de Valenciennes et du Hainaut\n Cambr&eacute;sis<br>\n Coordinateur Technique du projet ORI-OAI </small> </font>\n </div>\n </div>\n <br>\n Le 20/01/2011 14:22, <a moz-do-not-send=\"true\"\n class=\"moz-txt-link-abbreviated\"\n href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Author_2\"><blockquote>\n <pre wrap=\"\">Bonjour,\n\nJe viens de proc&eacute;der &agrave; une moisson sur l\'archive de l\'IRD, &agrave; cette adresse <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.documentation.ird.fr/fdi/oai.php\">http://www.documentation.ird.fr/fdi/oai.php</a> \nLe probl&egrave;me est que cette base url pr&eacute;sente une feuille de style xslt qui fait planter la moisson. Voici l\'erreur retourn&eacute;e dans catalina.out\n\n[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.\n\nJ\'ai v&eacute;rifi&eacute; les diff&eacute;rentes bases url que nous devons moissonner. Toutes celles qui pr&eacute;sentent une feuille de style posent le m&ecirc;me probl&egrave;me. Un autre exemple avec cette adresse : <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://oai.revues.org/\">http://oai.revues.org/</a> qui, si elle ne pr&eacute;sente pas de feuille xslt &agrave; la base, d&egrave;s qu\'une requ&ecirc;te (Identify, etc...) est envoy&eacute;e une feuille de style est bien pr&eacute;sente qui, elle, fait planter la recherche de la liste des sets.\n\nJe me posais donc la question de savoir si je pouvais \"squizzer\" cette feuille &agrave; partir du harvester qui n\'a pas grand int&eacute;r&ecirc;t sur le plan d\'une moisson.\n\nBien &agrave; vous\n\nSt&eacute;phane LORET\nMSH - Tours\nCr&eacute;villes.org\n\n\n\n\n\n\n\n</pre>\n </blockquote></div>\n </blockquote></div>\n <br>\n </blockquote></div></div>\n </body>\n</html>\n</div>', created = 1507749028, expire = 1507835428, headers = '', serialized = 0 WHERE cid = '4:7c499edbca7c36054ef5e9716d8275f3' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:b8fadf8d23cbaf9f7494f1bb8c5b331b' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=UTF-8\" http-equiv=\"Content-Type\">\n </head>\n <body text=\"#000000\" bgcolor=\"#ffffff\">\n <font size=\"-1\"><font face=\"Verdana\">Bonjour,<br>\n <br>\n Je viens bien de moissonner l\'IRD en oai_dc.<br>\n J\'ai sélectionné le set \"Documentation\" sans problème. J\'ai\n moissonné 94 fiches et je n\'ai pas eu de soucis avec la XSL.\n Pouvez-vous nous envoyer des logs si ça ne fonctionne pas chez\n vous ?<br>\n <br>\n Pour le site Revues.org je pense savoir où est le soucis.<br>\n Si je vais ici <a class=\"moz-txt-link-freetext\" href=\"http://oai.revues.org/?verb=ListSets\">http://oai.revues.org/?verb=ListSets</a> j\'ai la\n liste de tous les sets proposés.<br>\n <br>\n Ils sont tous de la forme setSpec = oai:revues.org:XXXXXX<br>\n Si on regarde les spécifications du protocole OAI-PMH, il me\n semble que l\'utilisation des \":\" est claire. Cf.\n <a class=\"moz-txt-link-freetext\" href=\"http://www.openarchives.org/OAI/openarchivesprotocol.html#Set\">http://www.openarchives.org/OAI/openarchivesprotocol.html#Set</a><br>\n <br>\n Le problème ici est donc qu\'ils utilisent une arborescence de\n sets avec des setSpec oai:revues.org:XXXXX sans avoir de setSpec\n \"oai\" et \"oai:revues.org\".<br>\n oai:revues.org:journal indique que l\'on moissonne le set\n \"journal\" qui est enfant de \"revues.org\" lui-même enfant de\n \"oai\". Le soucis est que \"oai\" et \"revues.org\" n\'existent pas.<br>\n <br>\n On devrait donc avoir les sets :<br>\n oai<br>\n oai:revues.org<br>\n oai:revues.org:journal<br>\n </font></font>oai:revues.org:recherchestravaux<br>\n oai:revues.org:recherchestravaux:58<br>\n etc.<br>\n <br>\n ou plus simplement car les niveaux oai et oai:revues.org sont\n inutiles à mon sens :<br>\n <br>\n <font size=\"-1\"><font face=\"Verdana\">journal<br>\n </font></font>recherchestravaux<br>\n recherchestravaux:58<br>\n etc.<br>\n <font size=\"-1\"><font face=\"Verdana\"><br>\n Cordialement,<br>\n <br>\n </font></font>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\">\n <font face=\"Verdana\"><small>\n Yohan COLMANT<br>\n Direction des Systèmes d\'Information<br>\n UVHC - Université de Valenciennes et du Hainaut Cambrésis<br>\n Coordinateur Technique du projet ORI-OAI\n </small>\n </font>\n </div>\n </div>\n <br>\n Le 20/01/2011 14:22, <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a écrit :\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <pre wrap=\"\">Bonjour,\n\nJe viens de procéder à une moisson sur l\'archive de l\'IRD, à cette adresse <a class=\"moz-txt-link-freetext\" href=\"http://www.documentation.ird.fr/fdi/oai.php\">http://www.documentation.ird.fr/fdi/oai.php</a> \nLe problème est que cette base url présente une feuille de style xslt qui fait planter la moisson. Voici l\'erreur retournée dans catalina.out\n\n[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.\n\nJ\'ai vérifié les différentes bases url que nous devons moissonner. Toutes celles qui présentent une feuille de style posent le même problème. Un autre exemple avec cette adresse : <a class=\"moz-txt-link-freetext\" href=\"http://oai.revues.org/\">http://oai.revues.org/</a> qui, si elle ne présente pas de feuille xslt à la base, dès qu\'une requête (Identify, etc...) est envoyée une feuille de style est bien présente qui, elle, fait planter la recherche de la liste des sets.\n\nJe me posais donc la question de savoir si je pouvais \"squizzer\" cette feuille à partir du harvester qui n\'a pas grand intérêt sur le plan d\'une moisson.\n\nBien à vous\n\nStéphane LORET\nMSH - Tours\nCrévilles.org\n\n\n\n\n\n\n\n</pre>\n </blockquote></div></div>\n </body>\n</html>\n</div>', created = 1507749029, expire = 1507835429, headers = '', serialized = 0 WHERE cid = '4:b8fadf8d23cbaf9f7494f1bb8c5b331b' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:5323f2f3c6f502e377e93d1d1ab3e9c4' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour,</p>\n<p>Je viens de procéder à une moisson sur l\'archive de l\'IRD, à cette adresse <a href=\"http://www.documentation.ird.fr/fdi/oai.php\" title=\"http://www.documentation.ird.fr/fdi/oai.php\">http://www.documentation.ird.fr/fdi/oai.php</a><br />\nLe problème est que cette base url présente une feuille de style xslt qui fait planter la moisson. Voici l\'erreur retournée dans catalina.out</p>\n<p>[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.</p>\n<p>J\'ai vérifié les différentes bases url que nous devons moissonner. Toutes celles qui présentent une feuille de style posent le même problème. Un autre exemple avec cette adresse : <a href=\"http://oai.revues.org/\" title=\"http://oai.revues.org/\">http://oai.revues.org/</a> qui, si elle ne présente pas de feuille xslt à la base, dès qu\'une requête (Identify, etc...) est envoyée une feuille de style est bien présente qui, elle, fait planter la recherche de la liste des sets.</p>\n<p>Je me posais donc la question de savoir si je pouvais \"squizzer\" cette feuille à partir du harvester qui n\'a pas grand intérêt sur le plan d\'une moisson.</p>\n<p>Bien à vous</p>\n<p>Stéphane LORET<br />\nMSH - Tours<br />\nCrévilles.org</p>\n</div>\n', created = 1507749029, expire = 1507835429, headers = '', serialized = 0 WHERE cid = '4:5323f2f3c6f502e377e93d1d1ab3e9c4' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
7 messages / 0 nouveaux
Dernière contribution
stephaneloret
Problème lors d'un moissonnage
Bonjour,

Merci pour les tests. En effet, désormais, je peux moissonner l'IRD ! Je ne comprends pas bien cette différence de résultat, à moins d'une erreur au niveau du dépôt lors de nos précédentes tentatives. La feuille de style xsl n'est donc pas en cause.

Pour ce qui est de revues.org, si je comprends bien, je ne peux pas moissonner tant que le dépôt présente cette arborescence ?

Bien cordialement

Stéphane Loret
MSH - Tours
Crevilles.org



Le 27/01/11 15:02, Yohan Colmant a écrit :
Bonjour,

Je viens bien de moissonner l'IRD en oai_dc.
J'ai sélectionné le set "Documentation" sans problème. J'ai moissonné 94 fiches et je n'ai pas eu de soucis avec la XSL. Pouvez-vous nous envoyer des logs si ça ne fonctionne pas chez vous ?

Pour le site Revues.org je pense savoir où est le soucis.
Si je vais ici http://oai.revues.org/?verb=ListSets j'ai la liste de tous les sets proposés.

Ils sont tous de la forme setSpec = oai:revues.org:XXXXXX
Si on regarde les spécifications du protocole OAI-PMH, il me semble que l'utilisation des ":" est claire. Cf. http://www.openarchives.org/OAI/openarchivesprotocol.html#Set

Le problème ici est donc qu'ils utilisent une arborescence de sets avec des setSpec oai:revues.org:XXXXX sans avoir de setSpec "oai" et "oai:revues.org".
oai:revues.org:journal indique que l'on moissonne le set "journal" qui est enfant de "revues.org" lui-même enfant de "oai". Le soucis est que "oai" et "revues.org" n'existent pas.

On devrait donc avoir les sets :
oai
oai:revues.org
oai:revues.org:journal
oai:revues.org:recherchestravaux
oai:revues.org:recherchestravaux:58
etc.

ou plus simplement car les niveaux oai et oai:revues.org sont inutiles à mon sens :

journal
recherchestravaux
recherchestravaux:58
etc.

Cordialement,

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI

Le 20/01/2011 14:22, sdjloret@free.fr a écrit :
Bonjour,

Je viens de procéder à une moisson sur l'archive de l'IRD, à cette adresse http://www.documentation.ird.fr/fdi/oai.php 
Le problème est que cette base url présente une feuille de style xslt qui fait planter la moisson. Voici l'erreur retournée dans catalina.out

[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.

J'ai vérifié les différentes bases url que nous devons moissonner. Toutes celles qui présentent une feuille de style posent le même problème. Un autre exemple avec cette adresse : http://oai.revues.org/ qui, si elle ne présente pas de feuille xslt à la base, dès qu'une requête (Identify, etc...) est envoyée une feuille de style est bien présente qui, elle, fait planter la recherche de la liste des sets.

Je me posais donc la question de savoir si je pouvais "squizzer" cette feuille à partir du harvester qui n'a pas grand intérêt sur le plan d'une moisson.

Bien à vous

Stéphane LORET
MSH - Tours
Crévilles.org








Yohan Colmant
Je me demande du coup si on comprend bien ce qui est décrit dans la norme OAI-PMH sur la notion de hiérarchie et l'utilisation des ":".
Vous avez pu lire le paragraphe en question ? Qu'en pensez-vous ? Tout regard extérieur est le bienvenu sur la question.

Merci
Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI

Le 28/01/2011 13:48, sdjloret@free.fr a écrit :
Bonjour,

Le même problème se pose avec le dépôt OAI-PMH de Persée (http://oai.persee.fr/c/ext/prescript/oai). Une erreur est retournée au niveau de la liste des sets dans ori-harvester.log : 

28 janv. 2011 13:35:50,165 [ WARN] catalina-exec-4 org.orioai.harvesting.domain.logic.OAIStore getSetInfosWithResumptionToken - can't find listset info for http://oai.persee.fr/c/ext/prescript/oaihttp://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd http://purl.org/dc/elements/1.1/ http://dublincore.org/schemas/xmls/qdc/2003/04/02/dc.xsd http://purl.org/dc/terms/ http://dublincore.org/schemas
/xmls/qdc/2003/04/02/dcterms.xsd

Le module ne trouve donc pas la liste des sets. L'arborescence est du même tonneau que celle du dépôt de Revues.org. Le souci est que nous arrivons à moissonner les sets (revues.org et persée) à partir d'autres moteurs (PKP, le plugin Harvester d'Omeka).

J'ai envoyé un message explicitant le problème aux responsables techniques de ces dépôts. Je suis en attente de leur réponse.

Bien à vous

Stéphane Loret
MSH - Tours
Crevilles.org



----- Mail Original -----
De: sdjloret@free.fr
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Vendredi 28 Janvier 2011 10h42:26 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème lors d'un moissonnage

Oui, nous les connaissons bien. Je fais remonter.

Bien cordialement

Stéphane Loret
MSH -Tours
Crevilles.org

----- Mail Original -----
De: "Yohan Colmant" <
            >
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Vendredi 28 Janvier 2011 10h36:18 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème lors d'un moissonnage

En effet concernant revues.org 
Si vous êtes en contact avec eux, c'est peut-être un problème que vous pouvez leur remonter ? 

Cdt 


Yohan COLMANT 
Direction des Systèmes d'Information 
UVHC - Université de Valenciennes et du Hainaut Cambrésis 
Coordinateur Technique du projet ORI-OAI 
Le 28/01/2011 09:30, Stéphane Loret a écrit : 

Bonjour, 

Merci pour les tests. En effet, désormais, je peux moissonner l'IRD ! Je ne comprends pas bien cette différence de résultat, à moins d'une erreur au niveau du dépôt lors de nos précédentes tentatives. La feuille de style xsl n'est donc pas en cause. 

Pour ce qui est de revues.org, si je comprends bien, je ne peux pas moissonner tant que le dépôt présente cette arborescence ? 

Bien cordialement 

Stéphane Loret 
MSH - Tours 
Crevilles.org 



Le 27/01/11 15:02, Yohan Colmant a écrit : 

Bonjour, 

Je viens bien de moissonner l'IRD en oai_dc. 
J'ai sélectionné le set "Documentation" sans problème. J'ai moissonné 94 fiches et je n'ai pas eu de soucis avec la XSL. Pouvez-vous nous envoyer des logs si ça ne fonctionne pas chez vous ? 

Pour le site Revues.org je pense savoir où est le soucis. 
Si je vais ici http://oai.revues.org/?verb=ListSets j'ai la liste de tous les sets proposés. 

Ils sont tous de la forme setSpec = oai:revues.org:XXXXXX 
Si on regarde les spécifications du protocole OAI-PMH, il me semble que l'utilisation des ":" est claire. Cf. http://www.openarchives.org/OAI/openarchivesprotocol.html#Set 

Le problème ici est donc qu'ils utilisent une arborescence de sets avec des setSpec oai:revues.org:XXXXX sans avoir de setSpec "oai" et "oai:revues.org". 
oai:revues.org:journal indique que l'on moissonne le set "journal" qui est enfant de "revues.org" lui-même enfant de "oai". Le soucis est que "oai" et "revues.org" n'existent pas. 

On devrait donc avoir les sets : 
oai 
oai:revues.org 
oai:revues.org:journal 
oai:revues.org:recherchestravaux 
oai:revues.org:recherchestravaux:58 
etc. 

ou plus simplement car les niveaux oai et oai:revues.org sont inutiles à mon sens : 

journal 
recherchestravaux 
recherchestravaux:58 
etc. 

Cordialement, 



Yohan COLMANT 
Direction des Systèmes d'Information 
UVHC - Université de Valenciennes et du Hainaut Cambrésis 
Coordinateur Technique du projet ORI-OAI 
Le 20/01/2011 14:22, sdjloret@free.fr a écrit : 

Bonjour,

Je viens de procéder à une moisson sur l'archive de l'IRD, à cette adresse http://www.documentation.ird.fr/fdi/oai.php Le problème est que cette base url présente une feuille de style xslt qui fait planter la moisson. Voici l'erreur retournée dans catalina.out

[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.

J'ai vérifié les différentes bases url que nous devons moissonner. Toutes celles qui présentent une feuille de style posent le même problème. Un autre exemple avec cette adresse : http://oai.revues.org/ qui, si elle ne présente pas de feuille xslt à la base, dès qu'une requête (Identify, etc...) est envoyée une feuille de style est bien présente qui, elle, fait planter la recherche de la liste des sets.

Je me posais donc la question de savoir si je pouvais "squizzer" cette feuille à partir du harvester qui n'a pas grand intérêt sur le plan d'une moisson.

Bien à vous

Stéphane LORET
MSH - Tours
Crévilles.org 


stephaneloret
Bonjour,

Le même problème se pose avec le dépôt OAI-PMH de Persée (http://oai.persee.fr/c/ext/prescript/oai). Une erreur est retournée au niveau de la liste des sets dans ori-harvester.log :

28 janv. 2011 13:35:50,165 [ WARN] catalina-exec-4 org.orioai.harvesting.domain.logic.OAIStore getSetInfosWithResumptionToken - can't find listset info for http://oai.persee.fr/c/ext/prescript/oaihttp://www.openarchives.org/OAI/... http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd http://purl.org/dc/elements/1.1/ http://dublincore.org/schemas/xmls/qdc/2003/04/02/dc.xsd http://purl.org/dc/terms/ http://dublincore.org/schemas/xmls/qdc/2003/04/02/dcterms.xsd

Le module ne trouve donc pas la liste des sets. L'arborescence est du même tonneau que celle du dépôt de Revues.org. Le souci est que nous arrivons à moissonner les sets (revues.org et persée) à partir d'autres moteurs (PKP, le plugin Harvester d'Omeka).

J'ai envoyé un message explicitant le problème aux responsables techniques de ces dépôts. Je suis en attente de leur réponse.

Bien à vous

Stéphane Loret
MSH - Tours
Crevilles.org

----- Mail Original -----
De: sdjloret@free.fr
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Vendredi 28 Janvier 2011 10h42:26 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème lors d'un moissonnage

Oui, nous les connaissons bien. Je fais remonter.

Bien cordialement

Stéphane Loret
MSH -Tours
Crevilles.org

----- Mail Original -----
De: "Yohan Colmant" < >
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Vendredi 28 Janvier 2011 10h36:18 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème lors d'un moissonnage

En effet concernant revues.org
Si vous êtes en contact avec eux, c'est peut-être un problème que vous pouvez leur remonter ?

Cdt

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI
Le 28/01/2011 09:30, Stéphane Loret a écrit :

Bonjour,

Merci pour les tests. En effet, désormais, je peux moissonner l'IRD ! Je ne comprends pas bien cette différence de résultat, à moins d'une erreur au niveau du dépôt lors de nos précédentes tentatives. La feuille de style xsl n'est donc pas en cause.

Pour ce qui est de revues.org, si je comprends bien, je ne peux pas moissonner tant que le dépôt présente cette arborescence ?

Bien cordialement

Stéphane Loret
MSH - Tours
Crevilles.org

Le 27/01/11 15:02, Yohan Colmant a écrit :

Bonjour,

Je viens bien de moissonner l'IRD en oai_dc.
J'ai sélectionné le set "Documentation" sans problème. J'ai moissonné 94 fiches et je n'ai pas eu de soucis avec la XSL. Pouvez-vous nous envoyer des logs si ça ne fonctionne pas chez vous ?

Pour le site Revues.org je pense savoir où est le soucis.
Si je vais ici http://oai.revues.org/?verb=ListSets j'ai la liste de tous les sets proposés.

Ils sont tous de la forme setSpec = oai:revues.org:XXXXXX
Si on regarde les spécifications du protocole OAI-PMH, il me semble que l'utilisation des ":" est claire. Cf. http://www.openarchives.org/OAI/openarchivesprotocol.html#Set

Le problème ici est donc qu'ils utilisent une arborescence de sets avec des setSpec oai:revues.org:XXXXX sans avoir de setSpec "oai" et "oai:revues.org".
oai:revues.org:journal indique que l'on moissonne le set "journal" qui est enfant de "revues.org" lui-même enfant de "oai". Le soucis est que "oai" et "revues.org" n'existent pas.

On devrait donc avoir les sets :
oai
oai:revues.org
oai:revues.org:journal
oai:revues.org:recherchestravaux
oai:revues.org:recherchestravaux:58
etc.

ou plus simplement car les niveaux oai et oai:revues.org sont inutiles à mon sens :

journal
recherchestravaux
recherchestravaux:58
etc.

Cordialement,

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI
Le 20/01/2011 14:22, sdjloret@free.fr a écrit :

Bonjour,

Je viens de procéder à une moisson sur l'archive de l'IRD, à cette adresse http://www.documentation.ird.fr/fdi/oai.php Le problème est que cette base url présente une feuille de style xslt qui fait planter la moisson. Voici l'erreur retournée dans catalina.out

[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.

J'ai vérifié les différentes bases url que nous devons moissonner. Toutes celles qui présentent une feuille de style posent le même problème. Un autre exemple avec cette adresse : http://oai.revues.org/ qui, si elle ne présente pas de feuille xslt à la base, dès qu'une requête (Identify, etc...) est envoyée une feuille de style est bien présente qui, elle, fait planter la recherche de la liste des sets.

Je me posais donc la question de savoir si je pouvais "squizzer" cette feuille à partir du harvester qui n'a pas grand intérêt sur le plan d'une moisson.

Bien à vous

Stéphane LORET
MSH - Tours
Crévilles.org

stephaneloret
Oui, nous les connaissons bien. Je fais remonter.

Bien cordialement

Stéphane Loret
MSH -Tours
Crevilles.org

----- Mail Original -----
De: "Yohan Colmant" < >
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Vendredi 28 Janvier 2011 10h36:18 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème lors d'un moissonnage

En effet concernant revues.org
Si vous êtes en contact avec eux, c'est peut-être un problème que vous pouvez leur remonter ?

Cdt

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI
Le 28/01/2011 09:30, Stéphane Loret a écrit :

Bonjour,

Merci pour les tests. En effet, désormais, je peux moissonner l'IRD ! Je ne comprends pas bien cette différence de résultat, à moins d'une erreur au niveau du dépôt lors de nos précédentes tentatives. La feuille de style xsl n'est donc pas en cause.

Pour ce qui est de revues.org, si je comprends bien, je ne peux pas moissonner tant que le dépôt présente cette arborescence ?

Bien cordialement

Stéphane Loret
MSH - Tours
Crevilles.org

Le 27/01/11 15:02, Yohan Colmant a écrit :

Bonjour,

Je viens bien de moissonner l'IRD en oai_dc.
J'ai sélectionné le set "Documentation" sans problème. J'ai moissonné 94 fiches et je n'ai pas eu de soucis avec la XSL. Pouvez-vous nous envoyer des logs si ça ne fonctionne pas chez vous ?

Pour le site Revues.org je pense savoir où est le soucis.
Si je vais ici http://oai.revues.org/?verb=ListSets j'ai la liste de tous les sets proposés.

Ils sont tous de la forme setSpec = oai:revues.org:XXXXXX
Si on regarde les spécifications du protocole OAI-PMH, il me semble que l'utilisation des ":" est claire. Cf. http://www.openarchives.org/OAI/openarchivesprotocol.html#Set

Le problème ici est donc qu'ils utilisent une arborescence de sets avec des setSpec oai:revues.org:XXXXX sans avoir de setSpec "oai" et "oai:revues.org".
oai:revues.org:journal indique que l'on moissonne le set "journal" qui est enfant de "revues.org" lui-même enfant de "oai". Le soucis est que "oai" et "revues.org" n'existent pas.

On devrait donc avoir les sets :
oai
oai:revues.org
oai:revues.org:journal
oai:revues.org:recherchestravaux
oai:revues.org:recherchestravaux:58
etc.

ou plus simplement car les niveaux oai et oai:revues.org sont inutiles à mon sens :

journal
recherchestravaux
recherchestravaux:58
etc.

Cordialement,

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI
Le 20/01/2011 14:22, sdjloret@free.fr a écrit :

Bonjour,

Je viens de procéder à une moisson sur l'archive de l'IRD, à cette adresse http://www.documentation.ird.fr/fdi/oai.php Le problème est que cette base url présente une feuille de style xslt qui fait planter la moisson. Voici l'erreur retournée dans catalina.out

[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.

J'ai vérifié les différentes bases url que nous devons moissonner. Toutes celles qui présentent une feuille de style posent le même problème. Un autre exemple avec cette adresse : http://oai.revues.org/ qui, si elle ne présente pas de feuille xslt à la base, dès qu'une requête (Identify, etc...) est envoyée une feuille de style est bien présente qui, elle, fait planter la recherche de la liste des sets.

Je me posais donc la question de savoir si je pouvais "squizzer" cette feuille à partir du harvester qui n'a pas grand intérêt sur le plan d'une moisson.

Bien à vous

Stéphane LORET
MSH - Tours
Crévilles.org

Yohan Colmant
En effet concernant revues.org
Si vous êtes en contact avec eux, c'est peut-être un problème que vous pouvez leur remonter ?

Cdt
Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI

Le 28/01/2011 09:30, Stéphane Loret a écrit :
Bonjour,

Merci pour les tests. En effet, désormais, je peux moissonner l'IRD ! Je ne comprends pas bien cette différence de résultat, à moins d'une erreur au niveau du dépôt lors de nos précédentes tentatives. La feuille de style xsl n'est donc pas en cause.

Pour ce qui est de revues.org, si je comprends bien, je ne peux pas moissonner tant que le dépôt présente cette arborescence ?

Bien cordialement

Stéphane Loret
MSH - Tours
Crevilles.org



Le 27/01/11 15:02, Yohan Colmant a écrit :
Bonjour,

Je viens bien de moissonner l'IRD en oai_dc.
J'ai sélectionné le set "Documentation" sans problème. J'ai moissonné 94 fiches et je n'ai pas eu de soucis avec la XSL. Pouvez-vous nous envoyer des logs si ça ne fonctionne pas chez vous ?

Pour le site Revues.org je pense savoir où est le soucis.
Si je vais ici http://oai.revues.org/?verb=ListSets j'ai la liste de tous les sets proposés.

Ils sont tous de la forme setSpec = oai:revues.org:XXXXXX
Si on regarde les spécifications du protocole OAI-PMH, il me semble que l'utilisation des ":" est claire. Cf. http://www.openarchives.org/OAI/openarchivesprotocol.html#Set

Le problème ici est donc qu'ils utilisent une arborescence de sets avec des setSpec oai:revues.org:XXXXX sans avoir de setSpec "oai" et "oai:revues.org".
oai:revues.org:journal indique que l'on moissonne le set "journal" qui est enfant de "revues.org" lui-même enfant de "oai". Le soucis est que "oai" et "revues.org" n'existent pas.

On devrait donc avoir les sets :
oai
oai:revues.org
oai:revues.org:journal
oai:revues.org:recherchestravaux
oai:revues.org:recherchestravaux:58
etc.

ou plus simplement car les niveaux oai et oai:revues.org sont inutiles à mon sens :

journal
recherchestravaux
recherchestravaux:58
etc.

Cordialement,

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI

Le 20/01/2011 14:22, sdjloret@free.fr a écrit :
Bonjour,

Je viens de procéder à une moisson sur l'archive de l'IRD, à cette adresse http://www.documentation.ird.fr/fdi/oai.php 
Le problème est que cette base url présente une feuille de style xslt qui fait planter la moisson. Voici l'erreur retournée dans catalina.out

[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.

J'ai vérifié les différentes bases url que nous devons moissonner. Toutes celles qui présentent une feuille de style posent le même problème. Un autre exemple avec cette adresse : http://oai.revues.org/ qui, si elle ne présente pas de feuille xslt à la base, dès qu'une requête (Identify, etc...) est envoyée une feuille de style est bien présente qui, elle, fait planter la recherche de la liste des sets.

Je me posais donc la question de savoir si je pouvais "squizzer" cette feuille à partir du harvester qui n'a pas grand intérêt sur le plan d'une moisson.

Bien à vous

Stéphane LORET
MSH - Tours
Crévilles.org








Yohan Colmant
Bonjour,

Je viens bien de moissonner l'IRD en oai_dc.
J'ai sélectionné le set "Documentation" sans problème. J'ai moissonné 94 fiches et je n'ai pas eu de soucis avec la XSL. Pouvez-vous nous envoyer des logs si ça ne fonctionne pas chez vous ?

Pour le site Revues.org je pense savoir où est le soucis.
Si je vais ici http://oai.revues.org/?verb=ListSets j'ai la liste de tous les sets proposés.

Ils sont tous de la forme setSpec = oai:revues.org:XXXXXX
Si on regarde les spécifications du protocole OAI-PMH, il me semble que l'utilisation des ":" est claire. Cf. http://www.openarchives.org/OAI/openarchivesprotocol.html#Set

Le problème ici est donc qu'ils utilisent une arborescence de sets avec des setSpec oai:revues.org:XXXXX sans avoir de setSpec "oai" et "oai:revues.org".
oai:revues.org:journal indique que l'on moissonne le set "journal" qui est enfant de "revues.org" lui-même enfant de "oai". Le soucis est que "oai" et "revues.org" n'existent pas.

On devrait donc avoir les sets :
oai
oai:revues.org
oai:revues.org:journal
oai:revues.org:recherchestravaux
oai:revues.org:recherchestravaux:58
etc.

ou plus simplement car les niveaux oai et oai:revues.org sont inutiles à mon sens :

journal
recherchestravaux
recherchestravaux:58
etc.

Cordialement,

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI

Le 20/01/2011 14:22, sdjloret@free.fr a écrit :
Bonjour,

Je viens de procéder à une moisson sur l'archive de l'IRD, à cette adresse http://www.documentation.ird.fr/fdi/oai.php 
Le problème est que cette base url présente une feuille de style xslt qui fait planter la moisson. Voici l'erreur retournée dans catalina.out

[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.

J'ai vérifié les différentes bases url que nous devons moissonner. Toutes celles qui présentent une feuille de style posent le même problème. Un autre exemple avec cette adresse : http://oai.revues.org/ qui, si elle ne présente pas de feuille xslt à la base, dès qu'une requête (Identify, etc...) est envoyée une feuille de style est bien présente qui, elle, fait planter la recherche de la liste des sets.

Je me posais donc la question de savoir si je pouvais "squizzer" cette feuille à partir du harvester qui n'a pas grand intérêt sur le plan d'une moisson.

Bien à vous

Stéphane LORET
MSH - Tours
Crévilles.org







stephaneloret
Bonjour,

Je viens de procéder à une moisson sur l'archive de l'IRD, à cette adresse http://www.documentation.ird.fr/fdi/oai.php
Le problème est que cette base url présente une feuille de style xslt qui fait planter la moisson. Voici l'erreur retournée dans catalina.out

[Fatal Error] :399:2475: An invalid XML character (Unicode: 0xc) was found in the element content of the document.

J'ai vérifié les différentes bases url que nous devons moissonner. Toutes celles qui présentent une feuille de style posent le même problème. Un autre exemple avec cette adresse : http://oai.revues.org/ qui, si elle ne présente pas de feuille xslt à la base, dès qu'une requête (Identify, etc...) est envoyée une feuille de style est bien présente qui, elle, fait planter la recherche de la liste des sets.

Je me posais donc la question de savoir si je pouvais "squizzer" cette feuille à partir du harvester qui n'a pas grand intérêt sur le plan d'une moisson.

Bien à vous

Stéphane LORET
MSH - Tours
Crévilles.org

Options d'affichage des commentaires

Sélectionnez la méthode d'affichage des commentaires que vous préférez, puis cliquez sur « Enregistrer les paramètres » pour activer vos changements.
Sujet clos