{Disarmed} {Disarmed} {Disarmed} Quelques problèmes

  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '1:3f82ea4aac5780c532282e00835beaf5' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '1:3f82ea4aac5780c532282e00835beaf5' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:73f6c69a4a5df69ddf7a0c3d4ffeff77' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n </head>\n <body text=\"#000000\" bgcolor=\"#ffffff\">\n <font size=\"-1\"><font face=\"Verdana\">Bonjour,<br>\n idem<br>\n </font></font>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\">\n <font face=\"Verdana\"><small>\n Yohan COLMANT<br>\n Direction des Syst&egrave;mes d\'Information<br>\n UVHC - Universit&eacute; de Valenciennes et du Hainaut Cambr&eacute;sis<br>\n Coordinateur Technique du projet ORI-OAI\n </small>\n </font>\n </div>\n </div>\n <br>\n Le 05/01/2011 16:23, St&eacute;phane Loret a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n Bonjour Yohan, bonjour &agrave; tous,<br>\n <br>\n Je vous souhaite &agrave; tous une tr&egrave;s agr&eacute;able ann&eacute;e 2011.<br>\n Je r&eacute;ponds directement dans le message. Encore merci pour votre\n aide, nous ne sommes pas au bout de nos peines.<br>\n <br>\n Bien &agrave; vous<br>\n <br>\n St&eacute;phane LORET<br>\n MSH - Tours<br>\n Cr&eacute;villes.org<br>\n <br>\n <br>\n PS : Puis-je vous contacter directement pour, entre autres,\n discuter sur les possibilit&eacute;s de formation ?<br>\n </blockquote></div></div>\n oui on en parlera en m&ecirc;me temps que les questions OAI-PMH<br>\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote> <br>\n Le 03/01/11 11:53, Yohan Colmant a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Author_1\"><blockquote>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <title></title>\n <font size=\"-1\"><font face=\"Verdana\">Bonjour,<br>\n <br>\n D&eacute;sol&eacute; pour le d&eacute;lai, mais j\'&eacute;tais en cong&eacute;s.<br>\n </font></font>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\"> <font face=\"Verdana\"><small><br>\n </small> </font> </div>\n </div>\n <br>\n Le 21/12/2010 16:18, St&eacute;phane Loret a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Author_2\"><blockquote>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <title></title>\n Bonjour Yohan,<br>\n <br>\n Merci pour votre r&eacute;ponse. J\'essaie de vous apporter le maximum\n d\'information ci-apr&egrave;s :<br>\n <br>\n <br>\n &gt;&gt; Pour &ecirc;tre s&ucirc;r, est-ce bien la derni&egrave;re version que\n vous utilisez ?<br>\n <br>\n - Version d\'ORI-OAI install&eacute;e&nbsp; : Dans le d&eacute;tail, on a &ccedil;&agrave; :<br>\n &nbsp;&nbsp;&nbsp; - module Harvester : 1.6.2<br>\n &nbsp;&nbsp;&nbsp; - module Md-Editor : 1.6.3<br>\n &nbsp;&nbsp;&nbsp; - module Indexing : 1.6.1<br>\n &nbsp;&nbsp;&nbsp; - Version esup-ecm : 1.1.2 avec nuxeo DM 5.2, mais le\n jboss.dir dans build.properties du module ori-oai-nuxeo\n indique une version 5.3.1 de nuxeo DM.<br>\n &nbsp;&nbsp;&nbsp; - module repository : 1.6.2<br>\n &nbsp;&nbsp;&nbsp; - module vocabulary : 1.6.2<br>\n &nbsp;&nbsp;&nbsp; - module workflow : 1.6.3<br>\n &nbsp;&nbsp;&nbsp; - module search : 1.6.2<br>\n </blockquote></div>\n Merci<br>\n <div class=\"emailFilter_Author_2\"><blockquote> <br>\n &gt;&gt; L&agrave; je pense que vous &ecirc;tes tomb&eacute;s sur un cas\n malheureux o&ugrave; vous pointiez vers un entrep&ocirc;t OAI qui n\'en\n &eacute;tait pas un.<br>\n Il va falloir que nous regardions de notre c&ocirc;t&eacute; pour ne plus\n que &ccedil;a se passe mieux dans les prochaines versions.<br>\n Pouvez-vous nous donner l\'URL que vous avez entr&eacute;e et qui\n faisait planter ?<br>\n <br>\n Oui, en effet, apr&egrave;s v&eacute;rification, la base url du d&eacute;p&ocirc;t\n pointait une redirection sur une page html. La base url qui a\n fait planter le module : <a moz-do-not-send=\"true\"\n class=\"moz-txt-link-freetext\"\n href=\"http://ir.ub.rug.nl/dspace-oai/request?verb=Identify\">http://ir.ub.rug.nl/dspace-oai/request?verb=Identify</a><br>\n </blockquote></div>\n Merci pour l\'info, c\'est not&eacute; de notre c&ocirc;t&eacute; !<br>\n <div class=\"emailFilter_Author_2\"><blockquote> <br>\n &gt;&gt; Ce que vous voulez faire, si je comprends bien, c\'est\n bien de supprimer certaines fiches provenant d\'une moisson, et\n qu\'elles ne soient plus jamais remises dans l\'index ?<br>\n A l\'heure actuelle, sans moissonner des sets sp&eacute;cifiques o&ugrave;\n ces fiches ne sont pas pr&eacute;sentes, ce n\'est pas possible. En\n revanche, c\'est une t&acirc;che qui a d&eacute;j&agrave; &eacute;t&eacute; identifi&eacute;e et qui\n sera r&eacute;alis&eacute;e dans la version 2 de ORI-OAI.<br>\n <br>\n Oui, c\'est tout &agrave; fait cela, voire m&ecirc;me l\'ensemble d\'un d&eacute;p&ocirc;t.\n Je prends l\'exemple de Canal-u : nous avons fait des tests sur\n le d&eacute;p&ocirc;t, mais nous souhaiterions maintenant retirer tout ce\n qui &agrave; trait &agrave; Canal-U, idem pour Revues.org, ne prendre en\n compte que les collections<br>\n </blockquote></div>\n Mais si vous souhaitez supprimer toutes les fiches provenant\n d\'une moisson, il vous suffit de supprimer la r&eacute;colte c&ocirc;t&eacute;\n moissonneur. Ceci supprimera alors les fiches dans l\'index.<br>\n </blockquote></div>\n <br>\n Oui, c\'est ce que nous avons fait, mais les fiches sont toujours\n bien pr&eacute;sentes dans l\'indexing et dans le module search. Et en\n supprimant l\'index et en r&eacute;indexant &agrave; la suite, on retrouve encore\n toutes les fiches pr&eacute;c&eacute;demment supprim&eacute;es alors que les moissons\n (d&eacute;finition, r&eacute;coltes) sont bien supprim&eacute;es.<br>\n </blockquote></div></div>\n Si vous avez bien supprim&eacute; la r&eacute;colte avant la suppression de la\n d&eacute;finition, les fiches ont du &ecirc;tre supprim&eacute;es de l\'indexing. Vous\n pouvez le voir en consultant l\'IHM de l\'indexing.<br>\n Il faut bien supprimer la r&eacute;colte avant la d&eacute;finition car il y a un\n petit soucis dans la version actuelle : si vous supprimez la\n d&eacute;finition sans supprimer explicitement la r&eacute;colte dans l\'onglet\n \"R&eacute;colte\", les fiches restent dans la base du harvester et donc\n aussi dans l\'indexing. En effet, la suppression de la d&eacute;finition ne\n semble pas bien supprimer les fiches r&eacute;colt&eacute;es. Ca sera corrig&eacute;.<br>\n Je vous propose de faire un init de la base du harvester et de\n l\'indexing pour repartir sur une base vierge. Par la suite, pensez &agrave;\n prendre ces pr&eacute;cautions et supprimer la r&eacute;colte avant la d&eacute;finition.<br>\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote> <br>\n <br>\n <div class=\"emailFilter_Author_1\"><blockquote>\n <div class=\"emailFilter_Author_2\"><blockquote> <br>\n &gt;&gt; L&agrave; je ne comprends pas bien votre demande.<br>\n Voulez-vous modifier des fiches que vous avez moissonn&eacute;es et\n les exposer ensuite en OAI ?<br>\n Voulez-vous exposer une partie des fiches moissonn&eacute;es sans les\n modifi&eacute;es ?<br>\n Ou une partie des fiches que vous produisez ?<br>\n Dans ce cas, comment vous identifiez lesquelles exposer et\n lesquelles ne pas exposer ? Il y a un m&eacute;canisme pour &ccedil;a qui\n repose sur les m&eacute;tadonn&eacute;es. Par exemple, que les fiches qui\n contiennent tel mot dans le titre.<br>\n <br>\n Cette demande est un peu particuli&egrave;re, je le con&ccedil;ois bien.\n Parmi les questions que vous me posez, celle qui est en\n rapport direct avec notre souhait est la premi&egrave;re : modifier\n des fiches moissonn&eacute;es pour les exposer ensuite en OAI. La\n couche oai actuellement en place pour le site crevilles.org\n porte sur la totalit&eacute; du site. Nous souhaitons pouvoir, &agrave; la\n fin de la journ&eacute;e de veille ou le lendemain, ramener ce\n contenu au niveau du module Harvester et choisir, voire\n modifier, ce qui sera expos&eacute; en OAI. Il est difficile, &agrave;\n l\'heure actuelle, de pr&eacute;ciser globalement si telle ou telle\n section du site (en gros ce qui deviendra par la suite des\n sets au niveau de la couche), doit ou ne doit pas &ecirc;tre expos&eacute;.\n Par exemple : nous ne souhaitons pas que l\'actualit&eacute; des\n &eacute;tudes urbaines dans cr&eacute;villes soit expos&eacute;e, mais il est\n possible qu\'un item dans cette cat&eacute;gorie de contenu d&eacute;roge &agrave;\n la r&egrave;gle. Je ne sais donc pas si c\'est faisable dans l\'&eacute;tat\n actuel des choses ni si cela correspond ou non aux bonnes\n pratiques. Mais, dans un premier temps, et &agrave; la mesure des\n possibilit&eacute;s offertes, en tous les cas, nous pourrions\n proc&eacute;der de cette mani&egrave;re.<br>\n </blockquote></div>\n Peut-on se contacter directement sur ce point hors liste ? J\'ai\n du mal &agrave; voir clairement ce que vous souhaitez et je pr&eacute;f&egrave;re en\n discuter directement avec vous pour &eacute;voquer les diff&eacute;rentes\n possibilit&eacute;s<br>\n <div class=\"emailFilter_Author_2\"><blockquote> <br>\n </blockquote></div>\n </blockquote></div>\n <br>\n Oui, je vous contacte cette semaine. Avez-vous des disponibilit&eacute;s\n ?<br>\n </blockquote></div></div>\n vendredi 9h ? j\'ai une contrainte &agrave; 10h donc je ne pourrai pas\n d&eacute;border<br>\n vous m\'appelez ?<br>\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote> <br>\n <div class=\"emailFilter_Author_1\"><blockquote>\n <div class=\"emailFilter_Author_2\"><blockquote> <br>\n &gt;&gt; Vous &ecirc;tes sur un ESUP-ECM ou alors un Nuxeo que vous\n avez install&eacute; en dehors de ORI-OAI ?<br>\n Si c\'est bien ESUP-ECM, je ne comprends pas &agrave; quel endroit\n vous avez saisi la description dont vous parlez ? Le titre\n quant &agrave; lui est bien rempli dans la fiche de m&eacute;tadonn&eacute;es du\n module md-editor par exemple ?<br>\n <br>\n Pour les droits d\'acc&egrave;s, il faudrait voir un peu plus en\n d&eacute;tail comment fonctionne Nuxeo / ESUP-ECM.<br>\n En effet, les documents doivent &ecirc;tre publi&eacute;s dans des\n sections. Ce sont les droits sur les sections qui d&eacute;finissent\n les droits d\'acc&egrave;s aux documents y &eacute;tant publi&eacute;s.<br>\n <br>\n En gros, vous devez cr&eacute;er une section \"Documents publics\",\n d&eacute;finir un droit d\'acc&egrave;s en lecture &agrave; l\'utilisateur \"invite\"\n et publier les documents dans cette section.<br>\n Vous voyez ?<br>\n <br>\n <br>\n Nous sommes sur un ESUP-ECM. Quand un cr&eacute;ateur charge un\n document, il y a deux champs, titre et description. Une fois\n que le document est archiv&eacute;, le lien pr&eacute;sent dans l\'onglet\n r&eacute;f&eacute;rencement permet d\'ouvrir un formulaire dc_easy pour que\n nous puissions ensuite reverser ce document dans les\n ressources locales. QUand le formulaire md-editor s\'ouvre, on\n retrouve bien le titre, le type de document (pdf, etc...),\n mais dans la partie description (dc.description), celle qui\n &eacute;tait pr&eacute;cis&eacute;e au niveau d\'esup_ecm n\'appara&icirc;t pas. Cette\n absence n\'est pas syst&eacute;matique car nous avons fait des essais\n avec des documents de diff&eacute;rents formats, diff&eacute;rentes tailles\n pour que nous puissions affin&eacute;s nos r&eacute;glages et la partie\n description dans le formulaire md-editor est parfois remplie,\n parfois non. Elle l\'est pour des documents de type vid&eacute;o par\n exemple, mais elle ne l\'est pas pour des pdfs. Et m&ecirc;me sur les\n pdfs, c\'est variable. Dans les proportions, on dira que cette\n partie est incompl&egrave;te dans 80% des cas sur le peu de tests que\n nous avons faits (une dizaine de documents pour l\'instant).<br>\n </blockquote></div>\n Ce qui me semble &eacute;trange, c\'est que vous avez la description qui\n est parfois r&eacute;cup&eacute;r&eacute;e : en effet, par d&eacute;faut, la configuration\n permettant de faire ceci n\'existe pas.<br>\n <br>\n Vous pouvez tenter ceci et me dire si &ccedil;a marche &agrave; 100%\n maintenant svp ?<br>\n <br>\n Dans les sources qui ont &eacute;t&eacute; charg&eacute;es du module ori-oai-nuxeo,\n allez dans\n src/main/resources/OSGI-INF/orioainuxeo2xml-contrib.xml<br>\n Et ajoutez la ligne en rouge dans le bloc suivant :<br>\n <br>\n &nbsp; &lt;extension\n target=\"org.orioai.esupecm.nuxeo2xml.service.OriOaiNuxeo2XmlService\"<br>\n &nbsp;&nbsp;&nbsp; point=\"nuxeoToxml\"&gt;<br>\n <br>\n &nbsp;&nbsp;&nbsp; &lt;configuration&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;metadataSchemaNamespace&gt;<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-freetext\"\n href=\"http://www.openarchives.org/OAI/2.0/oai_dc/\">http://www.openarchives.org/OAI/2.0/oai_dc/</a>&lt;/metadataSchemaNamespace&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;ns prefix=\"dc\" namespace=<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-rfc2396E\"\n href=\"http://purl.org/dc/elements/1.1/\"><font color=\"red\"><b>MailScanner\n soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude\n de la part de \"purl.org\" </b></font> <font color=\"red\"><b>MailScanner\n\n has detected a possible fraud attempt from \"purl.org\"\n claiming to be</b></font>\n \"http://purl.org/dc/elements/1.1/\"</a>/&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;ns prefix=\"oaidc\" namespace=<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-rfc2396E\"\n href=\"http://www.openarchives.org/OAI/2.0/oai_dc/\"><font\n color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre\n une tentative de fraude de la part de\n \"www.openarchives.org\" </b></font> <font color=\"red\"><b>MailScanner\n has detected a possible fraud attempt from\n \"www.openarchives.org\" claiming to be</b></font>\n \"http://www.openarchives.org/OAI/2.0/oai_dc/\"</a>/&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;metadata nuxeoXpath=\"NUXEO_URL\"\n workflowXpath=\"/oaidc:dc/dc:identifier\"/&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;metadata nuxeoXpath=\"/document/schema/nx_dc:title\"\n workflowXpath=\"/oaidc:dc/dc:title\"/&gt;<br>\n <font color=\"#ff0000\">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;metadata\n nuxeoXpath=\"/document/schema/nx_dc:description\"\n workflowXpath=\"/oaidc:dc/dc:description\"/&gt;</font><br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;metadata\n nuxeoXpath=\"substring(/document/schema/nx_dc:created, 0, 11)\"\n workflowXpath=\"/oaidc:dc/dc:date\"/&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;metadata nuxeoXpath=\"/document/nx_<a\n moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\"\n href=\"file:schema/nx_file:content/nx_file:mime-type\">file:schema/nx_file:content/nx_file:mime-type</a>\"\n workflowXpath=\"/oaidc:dc/dc:format\"/&gt;<br>\n &nbsp;&nbsp;&nbsp; &lt;/configuration&gt;<br>\n <br>\n &nbsp; &lt;/extension&gt;<br>\n <br>\n Ca donne quoi ?<br>\n </blockquote></div>\n <br>\n J\'ai fait les modifications sur le fichier&nbsp; :<br>\n &lt;!-- dublin core --&gt;<br>\n &nbsp; &lt;extension\n target=\"org.orioai.esupecm.nuxeo2xml.service.OriOaiNuxeo2XmlService\"<br>\n &nbsp;&nbsp;&nbsp; point=\"nuxeoToxml\"&gt;<br>\n <br>\n &nbsp;&nbsp;&nbsp; &lt;configuration&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;\n &lt;metadataSchemaNamespace&gt;<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-freetext\"\n href=\"http://www.openarchives.org/OAI/2.0/oai_dc/\">http://www.openarchives.org/OAI/2.0/oai_dc/</a>&lt;/metadataSchemaNamespace&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;ns prefix=\"dc\" namespace=MailScanner has detected a\n possible fraud attempt from \"purl.org\" claiming to be <a\n moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\"\n href=\"http://purl.org/dc/elements/1.1/\"><font color=\"red\"><b>MailScanner\n soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de\n la part de \"purl.org\" </b></font> <font color=\"red\"><b>MailScanner\n has detected a possible fraud attempt from \"purl.org\"\n claiming to be</b></font> \"http://purl.org/dc/elements/1.1/\"</a>/&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;ns prefix=\"oaidc\" namespace=MailScanner has detected a\n possible fraud attempt from \"<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-abbreviated\"\n href=\"http://www.openarchives.org\">www.openarchives.org</a>\"\n claiming to be <a moz-do-not-send=\"true\"\n class=\"moz-txt-link-rfc2396E\"\n href=\"http://www.openarchives.org/OAI/2.0/oai_dc/\"><font\n color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre\n une tentative de fraude de la part de \"www.openarchives.org\"\n </b></font> <font color=\"red\"><b>MailScanner has detected a\n possible fraud attempt from \"www.openarchives.org\" claiming\n to be</b></font>\n \"http://www.openarchives.org/OAI/2.0/oai_dc/\"</a>/&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;metadata nuxeoXpath=\"NUXEO_URL\"\n workflowXpath=\"/oaidc:dc/dc:identifier\"/&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;metadata nuxeoXpath=\"/document/schema/nx_dc:title\"\n workflowXpath=\"/oaidc:dc/dc:title\"/&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;metadata nuxeoXpath=\"/document/schema/nx_dc:description\"\n workflowXpath=\"/oai:dc/dc:description\"/&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;metadata\n nuxeoXpath=\"substring(/document/schema/nx_dc:created, 0, 11)\"\n workflowXpath=\"/oaidc:dc/dc:date\"/&gt;<br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &lt;metadata nuxeoXpath=\"/document/nx_<a\n moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\"\n href=\"file:schema/nx_file:content/nx_file:mime-type\">file:schema/nx_file:content/nx_file:mime-type</a>\"\n workflowXpath=\"/oaidc:dc/dc:format\"/&gt;<br>\n &nbsp;&nbsp;&nbsp; &lt;/configuration&gt;<br>\n <br>\n &nbsp; &lt;/extension&gt;<br>\n <br>\n Mais l&agrave;, j\'ai un probl&egrave;me dans le passage de nuxeo au workflow :\n quand je demande la publication du document, je choisis la section\n mais le formulaire pour l\'&eacute;dition dans le workflow ne s\'ouvre\n pas...&nbsp; </blockquote></div></div>\n vous dites que &ccedil;a ne s\'ouvre pas ? Mais vous voyez bien l\'erreur.<br>\n Si je comprends bien, la pop-up pour saisir les m&eacute;tadonn&eacute;es s\'ouvre\n mais il y a cette erreur dans la page ?<br>\n Quelle est l\'URL de la pop-up lorsqu\'elle s\'ouvre ?<br>\n <br>\n Est-ce depuis que je vous ai fait changer la config que &ccedil;a plante\n comme &ccedil;a ?<br>\n Si oui, pouvez-vous essayer de vous connecter dans le module\n workflow avec le m&ecirc;me compte que l\'utilisateur pour qui &ccedil;a a plant&eacute;\n dans Nuxeo. Est-ce que dans les fiches en cours d\'&eacute;dition dans le\n workflow, vous voyez la fiche correspondant au r&eacute;f&eacute;rencement que\n vous avez essay&eacute; de lancer depuis Nuxeo ? Si oui, dans le lien\n \"Voir\", vous pouvez t&eacute;l&eacute;charger la version courante de la fiche de\n m&eacute;tadonn&eacute;es, vous pouvez me l\'envoyer ? Il faudrait voir si le\n md-editor plante &agrave; cause du champ description qui se serait mal\n rempli.<br>\n <br>\n Pour rappel, ce n\'est pas au moment o&ugrave; on choisit la section que le\n formulaire de saisie des m&eacute;tadonn&eacute;es s\'ouvre, mais c\'est bien quand\n vous allez dans l\'onglet \"R&eacute;f&eacute;rencement\" et que vous choisissez la\n version &agrave; r&eacute;f&eacute;rencer et que vous cliquez sur \"R&eacute;f&eacute;rencer en tant que\n ....\". C\'est bien ce que vous avez fait ?<br>\n <br>\n Pouvez-vous nous dire si le module md-editor fonctionne bien en\n standalone ? Pour &ccedil;a, allez sur <a class=\"moz-txt-link-freetext\" href=\"http://...../ori-oai-md-editor\"><font color=\"red\"><b>MailScanner has detected a possible fraud attempt from \".....\" claiming to be</b></font> http://...../ori-oai-md-editor</a><br>\n Vous avez acc&egrave;s &agrave; tous les formulaires en &eacute;dition sans connexion au\n workflow ou nuxeo ni &agrave; aucune base de donn&eacute;es. Les fiches saisies\n ici peuvent &ecirc;tre enregistr&eacute;es directement sur votre poste. Les\n formulaires fonctionnent-ils ?<br>\n Si non, avez-vous la m&ecirc;me erreur ?<br>\n <br>\n Enfin, avez vous essay&eacute; de vous connecter depuis le module workflow\n en essayant de lancer un r&eacute;f&eacute;rencement ? Ceci &eacute;vite de passer par\n Nuxeo. C\'est pour essayer de cerner o&ugrave; se passe le probl&egrave;me.<br>\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>Je suis\n donc all&eacute; voir s\'il n\'y avait pas un probl&egrave;me au niveau du module\n editor. Et j\'ai bien une erreur de ce type : <br>\n <br>\n <div class=\"hd\">Unable to retrieve XForms engine state. Please\n reload the current page. Note that you will lose any unsaved\n changes. Static state key: 7D0E2D1E-3D2F-82DC-1D3B-A9C495F7DF46,\n dynamic state key: AAE91060-1271-F3E8-9DDE-D1304BE34259</div>\n <div class=\"bd\">\n <p> You may want to try one of the following: </p>\n <ul>\n <li><a moz-do-not-send=\"true\" id=\"yui-gen3\"\n class=\"xforms-error-panel-close\">Close this dialog</a> and\n continue to use this page. </li>\n <li><a moz-do-not-send=\"true\" id=\"yui-gen4\"\n class=\"xforms-error-panel-reload\">Reload this page</a>.\n Note that you will lose any unsaved changes. </li>\n <li>\n <p> If the above does not work, try reloading the page\n yourself. Note that you will lose any unsaved changes: </p>\n <ul>\n <li> With Firefox and Safari: hold down the <code>shift</code>\n key and click the Reload button in your browser toolbar.\n </li>\n <li> With Internet Explorer: hold down the <code>control</code>\n key and click the Reload button in your browser toolbar.\n </li>\n </ul>\n </li>\n <li>Return <a moz-do-not-send=\"true\"\n href=\"http://orioai.crevilles.org:8090/ori-oai-md-editor/\">home</a>.\n </li>\n </ul>\n <div class=\"xforms-error-panel-details-hidden\n xforms-disabled-subsequent\">\n <p> <a moz-do-not-send=\"true\" id=\"yui-gen1\"\n class=\"xforms-error-panel-show-details\"> <img\n src=\"cid:<span id=\"919301b5c518c9ff00d1a59ebc883be5\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'919301b5c518c9ff00d1a59ebc883be5\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#112;&#97;&#114;&#116;&#49;&#46;&#48;&#55;&#48;&#55;&#48;&#48;&#48;&#57;&#46;&#48;&#53;&#48;&#49;&#48;&#49;&#48;&#53;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\'+\'\">\'+\'&#112;&#97;&#114;&#116;&#49;&#46;&#48;&#55;&#48;&#55;&#48;&#48;&#48;&#57;&#46;&#48;&#53;&#48;&#49;&#48;&#49;&#48;&#53;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>\"\n alt=\"Show Details\"> <span>Show details</span> </a> </p>\n </div>\n <div class=\"xforms-error-panel-details-shown\">\n <p> <a moz-do-not-send=\"true\" id=\"yui-gen2\"\n class=\"xforms-error-panel-hide-details\"> <img\n src=\"cid:<span id=\"a3d5e92c57484df32761ceb295829e87\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'a3d5e92c57484df32761ceb295829e87\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#112;&#97;&#114;&#116;&#50;&#46;&#48;&#56;&#48;&#55;&#48;&#56;&#48;&#52;&#46;&#48;&#48;&#48;&#52;&#48;&#57;&#48;&#53;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\'+\'\">\'+\'&#112;&#97;&#114;&#116;&#50;&#46;&#48;&#56;&#48;&#55;&#48;&#56;&#48;&#52;&#46;&#48;&#48;&#48;&#52;&#48;&#57;&#48;&#53;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>\"\n alt=\"Hide Details\"> <span>Hide details</span> </a> </p>\n <div class=\"xforms-error-panel-details\">\n <div class=\"orbeon-error-panel-body\">\n <p class=\"orbeon-error-panel-message\">Unable to retrieve\n XForms engine state. Please reload the current page.\n Note that you will lose any unsaved changes. Static\n state key: 7D0E2D1E-3D2F-82DC-1D3B-A9C495F7DF46, dynamic\n state key: AAE91060-1271-F3E8-9DDE-D1304BE34259 </p>\n </div>\n </div>\n </div>\n </div>\n Le rechargement de la page n\'arrange rien. L&agrave;, j\'avoue que je\n s&egrave;che un peu....<br>\n <br>\n <br>\n <div class=\"emailFilter_Author_1\"><blockquote>\n <div class=\"emailFilter_Author_2\"><blockquote> <br>\n Pour ce qui est des droits, j\'ai repris la documentation nuxeo\n et d\'esup-ecm pour avancer plus avant dans la configuration.\n Je pense pouvoir r&eacute;gler le probl&egrave;me.<br>\n <br>\n <br>\n &gt;&gt; L&agrave; je laisse un coll&egrave;gue plus comp&eacute;tent que moi sur\n ce module r&eacute;pondre.<br>\n Pour info, est-ce que l\'erreur est al&eacute;atoire ou elle se\n pr&eacute;sente toujours pour les m&ecirc;mes fiches ? En gros, est-ce que\n lorsque l\'erreur se produit, elle se produit toujours sur la\n fiche ?<br>\n Si oui, pouvez-vous nous envoyer une fiche d\'exemple ?<br>\n Sur quel &eacute;diteur &ccedil;a se passe ? Le dublin core ?<br>\n <br>\n L\'erreur &eacute;tait al&eacute;atoire sur l\'&eacute;diteur dublin core. Je dis\n \"&eacute;tait\" car le red&eacute;marrage de l\'application suite &agrave; une\n modification d\'un fichier de configuration au niveau de\n l\'&eacute;diteur a r&eacute;solu le probl&egrave;me. Je n\'ai plus de fiche exemple\n &agrave; vous montrer, mais l\'&eacute;diteur apparaissait avec seulement les\n labels sans les fields.<br>\n </blockquote></div>\n Donc tout est bon l&agrave; ?<br>\n Pour info, la version 1.6.4 du md-editor est sortie, vous pouvez\n basculer dessus si vous voulez.<br>\n <div class=\"emailFilter_Author_2\"><blockquote> <br>\n </blockquote></div>\n </blockquote></div>\n <br>\n Oui, tout est rentr&eacute; dans l\'ordre.<br>\n <br>\n <div class=\"emailFilter_Author_1\"><blockquote>\n <div class=\"emailFilter_Author_2\"><blockquote>\n &gt;&gt; Si j\'interpr&egrave;te bien ce que vous dites, les fiches\n sont toujours bien dans l\'index, mais c\'est dans le workflow\n qu\'elles sembles disparues ? Elles apparaissent toujours bien\n dans le module search ? Avant de proposer une explication,\n pouvez-vous vous placer dans les sources du module workflow et\n lancer la commande suivante : ant local-reindexall Est-ce que\n vous revoyez vos fiches dans l\'interface du workflow ?<br>\n <br>\n <br>\n Oui, merci ! Toutes les fiches sont revenues.<br>\n <br>\n Encore merci pour votre aide.<br>\n <br>\n </blockquote></div>\n <font face=\"Verdana\"><small>Yohan COLMANT<br>\n Direction des Syst&egrave;mes d\'Information<br>\n UVHC - Universit&eacute; de Valenciennes et du Hainaut Cambr&eacute;sis<br>\n Coordinateur Technique du projet ORI-OAI </small></font>\n <div class=\"emailFilter_Author_2\"><blockquote>\n Bien cordialement<br>\n <br>\n St&eacute;phane Loret<br>\n MSH - Tours<br>\n Cr&eacute;villes.org<br>\n <br>\n <br>\n Le 20/12/10 14:55, Yohan Colmant a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Author_3\"><blockquote>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <font size=\"-1\"><font face=\"Verdana\">Bonjour St&eacute;phane,<br>\n <br>\n Je r&eacute;ponds dans votre mail.<br>\n </font></font><br>\n Le 18/12/2010 19:40, St&eacute;phane Loret a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Author_4\"><blockquote>Bonjour,\n\n\n\n\n <br>\n <br>\n Je suis totalement \"newbie\" dans la configuration et\n l\'usage de l\'application ORI-OAI et tout nouveau aussi sur\n cette liste que je suis pourtant depuis plus d\'un an d&eacute;j&agrave;.\n Je tiens d\'abord &agrave; m\'excuser de la longueur du message, de\n ses approximations, voire du caract&egrave;re peut-&ecirc;tre b&eacute;nin de\n certaines erreurs ou de certaines questions mais, tout\n &eacute;tant relatif, le c&ocirc;t&eacute; newbie ressort ici puissamment tout\n cela participe de la prise en main de l\'application\n ORI-OAI. <br>\n <br>\n Avant de vous exposer ces quelques probl&egrave;mes tels\n qu\'indiqu&eacute;s dans le sujet de ce message, je souhaite vous\n pr&eacute;senter un peu le projet et le contexte technique dans\n lequel il s\'inscrit. Au sein de la MSH de Tours, le projet\n cr&eacute;villes.org vise &agrave; recenser la plupart des ressources\n &eacute;lectroniques couvrant la th&eacute;matique des &eacute;tudes urbaines\n et &agrave; permettre aux utilisateurs du site crevilles.org de\n pouvoir rechercher sur l\'ensemble des ressources index&eacute;es\n qu\'elles soient locales ou provenant de d&eacute;p&ocirc;ts d\'archives\n sp&eacute;cifiquement s&eacute;lectionn&eacute;s. Pour ce faire, nous avons\n choisis de mettre en place l\'application ORI-OAI avec\n l\'ensemble de ses modules, esup-ecm compris. Ce choix\n s\'est port&eacute; sur cette application car sa modularit&eacute;\n permettait de d&eacute;velopper un projet de portage du module\n search vers une application CMS en php/mysql (en cours de\n d&eacute;veloppement). Le mod&egrave;le serait celui de l\'Institut de la\n Montagne. Pour ce qui est de l\'installation de ORI-OAI\n dans le d&eacute;tail, &ccedil;&agrave; donne &ccedil;&agrave; : <br>\n <br>\n - Sur un serveur physique Dell R710 avec 6To d\'espace de\n stockage, 16 Go de RAM tourne un ESXI en version 4.1 dans\n lequel, pour l\'instant, nous avons : <br>\n <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - Une machine virtuelle sous debian 5 lenny d&eacute;di&eacute;e\n &agrave; l\'application ORI-OAI en version 1.6.1 et l\'ensemble de\n ses modules. Cette machine pr&eacute;sente les caract&eacute;ristiques\n suivantes : <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - 3Go de RAM et un espace de 200 Go\n environ pour le tout (syst&egrave;me et stockage) <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - tous les modules tournent dans un seul\n tomcat en version 6.0.24. Le lancement et le red&eacute;marrage\n du tomcat est g&eacute;r&eacute; par le daemon jsvc. <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - esup-ecm tourne dans un jboss. <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - Le d&eacute;ploiement des modules s\'est op&eacute;r&eacute;\n via les sources de chaque module <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - L\'authentification s\'effectue via un\n annuaire LDAP (OpenDS) propre &agrave; cr&eacute;villes.org sous format\n SUPPANN. Pour l\'instant, aucun r&ocirc;le n\'est r&eacute;ellement\n d&eacute;fini. Les 5 membres de l\'&eacute;quipe sont &agrave; la fois\n mod&eacute;rateur et cr&eacute;ateur de chaque notice, dans l\'attente\n d\'un passage en production et une red&eacute;finition des roles,\n si le besoin s\'en fait sentir. <br>\n <br>\n L\'installation des modules d\'ORI-OAI est fonctionnelle\n depuis pratiquement 15 jours maintenant et nous sommes en\n phase de test et de configuration pour que les modules\n r&eacute;pondent &agrave; nos besoins, principalement : le harvesting\n qui repr&eacute;sente 90% actuellement des ressources que nous\n souhaitons proposer &agrave; nos utilisateurs et le d&eacute;p&ocirc;t, via\n esup-ecm et le module ori-oai-nuxeo (nuxeo DM en version\n 5.2) qui nous permet d\'indexer les documents locaux\n (textes, images, sons et vid&eacute;os). Nous utilisons\n essentiellement le formulaire dc_easy pour indexer de la\n ressource documentaire [simple]. <br>\n </blockquote></div>\n Pour &ecirc;tre s&ucirc;r, est-ce bien la derni&egrave;re version que vous\n utilisez ?<br>\n <div class=\"emailFilter_Author_4\"><blockquote>\n <br>\n <br>\n Ce que nous avons fait et les probl&egrave;mes que nous\n rencontrons : <br>\n <br>\n HARVESTER <br>\n <br>\n &nbsp;&nbsp;&nbsp; - La premi&egrave;re &eacute;tape a &eacute;t&eacute; de tester le module\n Harvester en long, en large et en travers. Nous avons\n lanc&eacute; des moissons manuellement et via le module de\n programmation sur des d&eacute;p&ocirc;ts d\'archives tels que Cairn,\n Revues.org, etc. La premi&egrave;re programmation s\'est d&eacute;roul&eacute;e\n avec quelques soucis : la base url d\'un d&eacute;p&ocirc;t pointait une\n redirection sur une page html. L\'erreur est relev&eacute;e dans\n les logs mais cela a provoqu&eacute; le down du module harvester\n pour toutes les autres programmations de moissonnage qui\n suivaient (erreur de type : <br>\n <br>\n 17 d&eacute;c. 2010 06:07:16,217 [ WARN] catalina-exec-136\n org.orioai.harvesting.dao.HarvestConfigDAO getLastReport -\n can\'t find last report for harvest Cairn - Histoire\n Urbaine. <br>\n etc... <br>\n <br>\n Pire, il a fallu red&eacute;marr&eacute; le tomcat pour reprendre la\n main sur le module et relancer les moissons manuellement.\n Le tomcat ne stoppait pas, bizarrement, nous avons deux\n daemon jsvc qui tournent comme s\'il y avait deux instances\n d\'un m&ecirc;me tomcat alors qu\'il n\'en existe qu\'un seul. Un\n kill des daemon nous a permis de reprendre la main et de\n relancer le tout. La question est alors de savoir s\'il est\n normal que le module se plante quand, lors d\'une tentative\n de moisson, il rencontre un probl&egrave;me du genre d&eacute;crit plus\n haut. Y a-t-il une configuration sp&eacute;cifique sur un degr&eacute;\n d\'erreur qui permettrait de passer outre, de reporter sans\n compromettre la programmation de moisson ni l\'activit&eacute;\n m&ecirc;me du module harvester ? <br>\n </blockquote></div>\n L&agrave; je pense que vous &ecirc;tes tomb&eacute;s sur un cas malheureux o&ugrave;\n vous pointiez vers un entrep&ocirc;t OAI qui n\'en &eacute;tait pas un.<br>\n Il va falloir que nous regardions de notre c&ocirc;t&eacute; pour ne plus\n que &ccedil;a se passe mieux dans les prochaines versions.<br>\n Pouvez-vous nous donner l\'URL que vous avez entr&eacute;e et qui\n faisait planter ?<br>\n <div class=\"emailFilter_Author_4\"><blockquote>\n <br>\n &nbsp;- Toujours sur le plan Harvesting. Nous avions lanc&eacute; des\n tests sur des d&eacute;p&ocirc;ts sans pour autant prendre le soin de\n s&eacute;lectionner des sets. On souhaiterait supprimer la\n totalit&eacute; des fiches moissonn&eacute;es sans qu\'une r&eacute;indexation\n ne puisse les ramener, bref, les supprimer d&eacute;finitivement\n de l\'index, du workflow et de l\'harvester. Nous avons\n essay&eacute; via le module indexing -&gt; suppression manuelle\n des fiches -&gt; suppression de toutes les fiches d\'un\n entrep&ocirc;t. La suppression se lance, mais elle reste fig&eacute;e.\n Aucune fiche n\'a ensuite &eacute;t&eacute; supprim&eacute;e et on les retrouve\n toutes dans l\'index. La m&eacute;thode visant &agrave; supprimer le\n dossier index puis de relancer l\'indexation via le\n workflow et le module harvester ne r&eacute;soud pas le probl&egrave;me.\n En gros, comment faire pour supprimer d&eacute;finitivement les\n fiches de ces d&eacute;p&ocirc;ts ? <br>\n </blockquote></div>\n Ce que vous voulez faire, si je comprends bien, c\'est bien\n de supprimer certaines fiches provenant d\'une moisson, et\n qu\'elles ne soient plus jamais remises dans l\'index ?<br>\n A l\'heure actuelle, sans moissonner des sets sp&eacute;cifiques o&ugrave;\n ces fiches ne sont pas pr&eacute;sentes, ce n\'est pas possible.<br>\n <br>\n En revanche, c\'est une t&acirc;che qui a d&eacute;j&agrave; &eacute;t&eacute; identifi&eacute;e et\n qui sera r&eacute;alis&eacute;e dans la version 2 de ORI-OAI.<br>\n <div class=\"emailFilter_Author_4\"><blockquote>\n <br>\n <br>\n - Pour cette partie, il s\'agit d\'une demande. J\'ai lu dans\n les messages de la liste qu\'une personne souhaitait\n remonter une fiche issue d\'une moisson dans le workflow\n afin d\'obtenir des informations sur les m&eacute;tadonn&eacute;es d\'un\n champ. Dans le cas qui est le n&ocirc;tre, nous aurions besoin\n de pouvoir r&eacute;-indexer tout ou partie de la couche oai\n issue des publications de notre site web crevilles.org et\n de s&eacute;lectionner ce qui peut &ecirc;tre publier au niveau du\n module de repository. Est-il possible de le faire et, si\n tel est le cas, comment proc&eacute;der ? <br>\n </blockquote></div>\n L&agrave; je ne comprends pas bien votre demande.<br>\n Voulez-vous modifier des fiches que vous avez moissonn&eacute;es et\n les exposer ensuite en OAI ?<br>\n Voulez-vous exposer une partie des fiches moissonn&eacute;es sans\n les modifi&eacute;es ?<br>\n Ou une partie des fiches que vous produisez ?<br>\n Dans ce cas, comment vous identifiez lesquelles exposer et\n lesquelles ne pas exposer ? Il y a un m&eacute;canisme pour &ccedil;a qui\n repose sur les m&eacute;tadonn&eacute;es. Par exemple, que les fiches qui\n contiennent tel mot dans le titre.<br>\n <br>\n Vous pouvez expliquer plus en d&eacute;tail svp ?<br>\n <div class=\"emailFilter_Author_4\"><blockquote>\n <br>\n NUXEO - WORKFLOW <br>\n <br>\n - Nous stockons donc nos documents via nuxeo esup-ecm. Le\n probl&egrave;me est qu\'apr&egrave;s archivage du document, le formulaire\n md-editor qui s\'ouvre ne r&eacute;cup&egrave;re pas la description\n remplie dans une premier temps au niveau de nuxeo, alors\n que tous les autres champs reprennent bien l\'ensemble des\n donn&eacute;es. Une fois que le formulaire est valid&eacute;, que le\n document est publi&eacute; au niveau du workflow et index&eacute; via le\n module indexing, le lien g&eacute;n&eacute;r&eacute; par nuxeo pointe un\n document qui est inaccessible pour les utilisateurs qui\n n\'ont pas les droits d\'acc&egrave;s au module nuxeo. Comment\n faire pour que le lien g&eacute;n&eacute;r&eacute; permette l\'acc&egrave;s au document\n plein texte &agrave; l\'utilisateur lambda, notamment quand ce\n dernier utilise le module search sur les documents locaux\n ? <br>\n </blockquote></div>\n Vous &ecirc;tes sur un ESUP-ECM ou alors un Nuxeo que vous avez\n install&eacute; en dehors de ORI-OAI ?<br>\n Si c\'est bien ESUP-ECM, je ne comprends pas &agrave; quel endroit\n vous avez saisi la description dont vous parlez ? Le titre\n quant &agrave; lui est bien rempli dans la fiche de m&eacute;tadonn&eacute;es du\n module md-editor par exemple ?<br>\n <br>\n Pour les droits d\'acc&egrave;s, il faudrait voir un peu plus en\n d&eacute;tail comment fonctionne Nuxeo / ESUP-ECM.<br>\n En effet, les documents doivent &ecirc;tre publi&eacute;s dans des\n sections. Ce sont les droits sur les sections qui\n d&eacute;finissent les droits d\'acc&egrave;s aux documents y &eacute;tant\n publi&eacute;s.<br>\n <br>\n En gros, vous devez cr&eacute;er une section \"Documents publics\",\n d&eacute;finir un droit d\'acc&egrave;s en lecture &agrave; l\'utilisateur \"invite\"\n et publier les documents dans cette section.<br>\n Vous voyez ?<br>\n <div class=\"emailFilter_Author_4\"><blockquote>\n <br>\n - D\'autre part, au niveau du workflow, nous avons parfois\n des erreurs lors du chargement du formulaire : les labels\n sont bien pr&eacute;sents mais les champs ont disparu. L\'erreur\n suivante est g&eacute;n&eacute;r&eacute;e : <br>\n <br>\n 2010-12-18 17:05:48,894 ERROR XFormsServer&nbsp;\n -&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; xforms-submit-error - setting\n throwable {throwable:\n \"org.orbeon.oxf.xforms.submission.XFormsSubmissionException:&nbsp;\n (processing submission response): xforms:submission for\n submission id: fr-get-document-submission, error code\n received when submitting instance: 500 <br>\n null, line -1, column -1: xforms:submission for submission\n id: fr-get-document-submission, error code received when\n submitting instance: 500 <br>\n &nbsp;&nbsp;&nbsp; at\norg.orbeon.oxf.xforms.submission.XFormsModelSubmission.getReplacer(XFormsModelSubmission.java:599)<br>\n &nbsp;&nbsp;&nbsp; at\norg.orbeon.oxf.xforms.submission.RegularSubmission$1.call(RegularSubmission.java:97)<br>\n </blockquote></div>\n L&agrave; je laisse un coll&egrave;gue plus comp&eacute;tent que moi sur ce\n module r&eacute;pondre.<br>\n Pour info, est-ce que l\'erreur est al&eacute;atoire ou elle se\n pr&eacute;sente toujours pour les m&ecirc;mes fiches ? En gros, est-ce\n que lorsque l\'erreur se produit, elle se produit toujours\n sur la fiche ?<br>\n Si oui, pouvez-vous nous envoyer une fiche d\'exemple ?<br>\n Sur quel &eacute;diteur &ccedil;a se passe ? Le dublin core ?<br>\n <div class=\"emailFilter_Author_4\"><blockquote>&nbsp;&nbsp;&nbsp;\n\n\n <br>\n <br>\n - Enfin, derni&egrave;re erreur qui nous pr&eacute;occupe : nous avions\n index&eacute; une dizaine de documents et tout se passait &agrave; peu\n pr&egrave;s bien (except&eacute; les probl&egrave;mes de formulaire). Les\n documents &eacute;taient publi&eacute;s et ils &eacute;taient pr&eacute;sents dans le\n module search et le module indexing. Sans comprendre\n comment, la liste des resssources en traitement ou\n trait&eacute;es a disparu et aucun lien n\'est pr&eacute;sent dans cette\n partie du workflow. Le probl&egrave;me est que nous n\'avons pas\n d\'erreur, du moins pas en rapport avec ce module. Est-il\n possible que ce probl&egrave;me soit en lien avec les probl&egrave;mes\n que l\'on rencontre avec le formulaire et Orbeon ? Comment\n faire pour retrouver les liens et nous permettre de g&eacute;rer\n les documents publi&eacute;s ? <br>\n </blockquote></div>\n Si j\'interpr&egrave;te bien ce que vous dites, les fiches sont\n toujours bien dans l\'index, mais c\'est dans le workflow\n qu\'elles sembles disparues ? Elles apparaissent toujours\n bien dans le module search ?<br>\n <br>\n Avant de proposer une explication, pouvez-vous vous placer\n dans les sources du module workflow et lancer la commande\n suivante :<br>\n ant local-reindexall<br>\n <br>\n Est-ce que vous revoyez vos fiches dans l\'interface du\n workflow ?<br>\n <div class=\"emailFilter_Author_4\"><blockquote>\n <br>\n Bien cordialement et avec toutes mes excuses pour la\n longueur du message. <br>\n <br>\n </blockquote></div>\n Merci.<br>\n Bonnes f&ecirc;tes &eacute;galement,<br>\n <br>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\"> <font face=\"Verdana\"><small>\n Yohan COLMANT<br>\n Direction des Syst&egrave;mes d\'Information<br>\n UVHC - Universit&eacute; de Valenciennes et du Hainaut\n Cambr&eacute;sis<br>\n Coordinateur Technique du projet ORI-OAI </small> </font>\n </div>\n </div>\n <div class=\"emailFilter_Author_4\"><blockquote>Je\n\n vous souhaite d\'agr&eacute;ables f&ecirc;tes. <br>\n <br>\n St&eacute;phane LORET <br>\n MSH - TOURS <br>\n Cr&eacute;villes.org <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n </blockquote></div>\n </blockquote></div>\n <br>\n </blockquote></div>\n </blockquote></div>\n <br>\n </blockquote></div></div>\n </body>\n</html>\n</div>', created = 1507746239, expire = 1507832639, headers = '', serialized = 0 WHERE cid = '4:73f6c69a4a5df69ddf7a0c3d4ffeff77' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:47dfc6d17d60e1a69c91eb2644db40f4' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <title></title>\n </head>\n <body bgcolor=\"#ffffff\" text=\"#000000\">\n Bonjour Yohan,<br>\n <br>\n Merci pour votre r&eacute;ponse. J\'essaie de vous apporter le maximum\n d\'information ci-apr&egrave;s :<br>\n <br>\n <br>\n &gt;&gt; Pour &ecirc;tre s&ucirc;r, est-ce bien la derni&egrave;re version que vous\n utilisez ?<br>\n <br>\n - Version d\'ORI-OAI install&eacute;e&nbsp; : Dans le d&eacute;tail, on a &ccedil;&agrave; :<br>\n &nbsp;&nbsp;&nbsp; - module Harvester : 1.6.2<br>\n &nbsp;&nbsp;&nbsp; - module Md-Editor : 1.6.3<br>\n &nbsp;&nbsp;&nbsp; - module Indexing : 1.6.1<br>\n &nbsp;&nbsp;&nbsp; - Version esup-ecm : 1.1.2 avec nuxeo DM 5.2, mais le jboss.dir\n dans build.properties du module ori-oai-nuxeo indique une version\n 5.3.1 de nuxeo DM.<br>\n &nbsp;&nbsp;&nbsp; - module repository : 1.6.2<br>\n &nbsp;&nbsp;&nbsp; - module vocabulary : 1.6.2<br>\n &nbsp;&nbsp;&nbsp; - module workflow : 1.6.3<br>\n &nbsp;&nbsp;&nbsp; - module search : 1.6.2<br>\n <br>\n &gt;&gt; L&agrave; je pense que vous &ecirc;tes tomb&eacute;s sur un cas malheureux o&ugrave;\n vous pointiez vers un entrep&ocirc;t OAI qui n\'en &eacute;tait pas un.<br>\n Il va falloir que nous regardions de notre c&ocirc;t&eacute; pour ne plus que &ccedil;a\n se passe mieux dans les prochaines versions.<br>\n Pouvez-vous nous donner l\'URL que vous avez entr&eacute;e et qui faisait\n planter ?<br>\n <br>\n Oui, en effet, apr&egrave;s v&eacute;rification, la base url du d&eacute;p&ocirc;t pointait une\n redirection sur une page html. La base url qui a fait planter le\n module : <a class=\"moz-txt-link-freetext\" href=\"http://ir.ub.rug.nl/dspace-oai/request?verb=Identify\">http://ir.ub.rug.nl/dspace-oai/request?verb=Identify</a><br>\n <br>\n &gt;&gt; Ce que vous voulez faire, si je comprends bien, c\'est bien\n de supprimer certaines fiches provenant d\'une moisson, et qu\'elles\n ne soient plus jamais remises dans l\'index ?<br>\n A l\'heure actuelle, sans moissonner des sets sp&eacute;cifiques o&ugrave; ces\n fiches ne sont pas pr&eacute;sentes, ce n\'est pas possible. En revanche,\n c\'est une t&acirc;che qui a d&eacute;j&agrave; &eacute;t&eacute; identifi&eacute;e et qui sera r&eacute;alis&eacute;e dans\n la version 2 de ORI-OAI.<br>\n <br>\n Oui, c\'est tout &agrave; fait cela, voire m&ecirc;me l\'ensemble d\'un d&eacute;p&ocirc;t. Je\n prends l\'exemple de Canal-u : nous avons fait des tests sur le\n d&eacute;p&ocirc;t, mais nous souhaiterions maintenant retirer tout ce qui &agrave;\n trait &agrave; Canal-U, idem pour Revues.org, ne prendre en compte que les\n collections<br>\n <br>\n &gt;&gt; L&agrave; je ne comprends pas bien votre demande.<br>\n Voulez-vous modifier des fiches que vous avez moissonn&eacute;es et les\n exposer ensuite en OAI ?<br>\n Voulez-vous exposer une partie des fiches moissonn&eacute;es sans les\n modifi&eacute;es ?<br>\n Ou une partie des fiches que vous produisez ?<br>\n Dans ce cas, comment vous identifiez lesquelles exposer et\n lesquelles ne pas exposer ? Il y a un m&eacute;canisme pour &ccedil;a qui repose\n sur les m&eacute;tadonn&eacute;es. Par exemple, que les fiches qui contiennent tel\n mot dans le titre.<br>\n <br>\n Cette demande est un peu particuli&egrave;re, je le con&ccedil;ois bien. Parmi les\n questions que vous me posez, celle qui est en rapport direct avec\n notre souhait est la premi&egrave;re : modifier des fiches moissonn&eacute;es pour\n les exposer ensuite en OAI. La couche oai actuellement en place pour\n le site crevilles.org porte sur la totalit&eacute; du site. Nous souhaitons\n pouvoir, &agrave; la fin de la journ&eacute;e de veille ou le lendemain, ramener\n ce contenu au niveau du module Harvester et choisir, voire modifier,\n ce qui sera expos&eacute; en OAI. Il est difficile, &agrave; l\'heure actuelle, de\n pr&eacute;ciser globalement si telle ou telle section du site (en gros ce\n qui deviendra par la suite des sets au niveau de la couche), doit ou\n ne doit pas &ecirc;tre expos&eacute;. Par exemple : nous ne souhaitons pas que\n l\'actualit&eacute; des &eacute;tudes urbaines dans cr&eacute;villes soit expos&eacute;e, mais il\n est possible qu\'un item dans cette cat&eacute;gorie de contenu d&eacute;roge &agrave; la\n r&egrave;gle. Je ne sais donc pas si c\'est faisable dans l\'&eacute;tat actuel des\n choses ni si cela correspond ou non aux bonnes pratiques. Mais, dans\n un premier temps, et &agrave; la mesure des possibilit&eacute;s offertes, en tous\n les cas, nous pourrions proc&eacute;der de cette mani&egrave;re.<br>\n <br>\n <br>\n &gt;&gt; Vous &ecirc;tes sur un ESUP-ECM ou alors un Nuxeo que vous avez\n install&eacute; en dehors de ORI-OAI ?<br>\n Si c\'est bien ESUP-ECM, je ne comprends pas &agrave; quel endroit vous avez\n saisi la description dont vous parlez ? Le titre quant &agrave; lui est\n bien rempli dans la fiche de m&eacute;tadonn&eacute;es du module md-editor par\n exemple ?<br>\n <br>\n Pour les droits d\'acc&egrave;s, il faudrait voir un peu plus en d&eacute;tail\n comment fonctionne Nuxeo / ESUP-ECM.<br>\n En effet, les documents doivent &ecirc;tre publi&eacute;s dans des sections. Ce\n sont les droits sur les sections qui d&eacute;finissent les droits d\'acc&egrave;s\n aux documents y &eacute;tant publi&eacute;s.<br>\n <br>\n En gros, vous devez cr&eacute;er une section \"Documents publics\", d&eacute;finir\n un droit d\'acc&egrave;s en lecture &agrave; l\'utilisateur \"invite\" et publier les\n documents dans cette section.<br>\n Vous voyez ?<br>\n <br>\n <br>\n Nous sommes sur un ESUP-ECM. Quand un cr&eacute;ateur charge un document,\n il y a deux champs, titre et description. Une fois que le document\n est archiv&eacute;, le lien pr&eacute;sent dans l\'onglet r&eacute;f&eacute;rencement permet\n d\'ouvrir un formulaire dc_easy pour que nous puissions ensuite\n reverser ce document dans les ressources locales. QUand le\n formulaire md-editor s\'ouvre, on retrouve bien le titre, le type de\n document (pdf, etc...), mais dans la partie description\n (dc.description), celle qui &eacute;tait pr&eacute;cis&eacute;e au niveau d\'esup_ecm\n n\'appara&icirc;t pas. Cette absence n\'est pas syst&eacute;matique car nous avons\n fait des essais avec des documents de diff&eacute;rents formats,\n diff&eacute;rentes tailles pour que nous puissions affin&eacute;s nos r&eacute;glages et\n la partie description dans le formulaire md-editor est parfois\n remplie, parfois non. Elle l\'est pour des documents de type vid&eacute;o\n par exemple, mais elle ne l\'est pas pour des pdfs. Et m&ecirc;me sur les\n pdfs, c\'est variable. Dans les proportions, on dira que cette partie\n est incompl&egrave;te dans 80% des cas sur le peu de tests que nous avons\n faits (une dizaine de documents pour l\'instant).<br>\n <br>\n Pour ce qui est des droits, j\'ai repris la documentation nuxeo et\n d\'esup-ecm pour avancer plus avant dans la configuration. Je pense\n pouvoir r&eacute;gler le probl&egrave;me.<br>\n <br>\n <br>\n &gt;&gt; L&agrave; je laisse un coll&egrave;gue plus comp&eacute;tent que moi sur ce\n module r&eacute;pondre.<br>\n Pour info, est-ce que l\'erreur est al&eacute;atoire ou elle se pr&eacute;sente\n toujours pour les m&ecirc;mes fiches ? En gros, est-ce que lorsque\n l\'erreur se produit, elle se produit toujours sur la fiche ?<br>\n Si oui, pouvez-vous nous envoyer une fiche d\'exemple ?<br>\n Sur quel &eacute;diteur &ccedil;a se passe ? Le dublin core ?<br>\n <br>\n L\'erreur &eacute;tait al&eacute;atoire sur l\'&eacute;diteur dublin core. Je dis \"&eacute;tait\"\n car le red&eacute;marrage de l\'application suite &agrave; une modification d\'un\n fichier de configuration au niveau de l\'&eacute;diteur a r&eacute;solu le\n probl&egrave;me. Je n\'ai plus de fiche exemple &agrave; vous montrer, mais\n l\'&eacute;diteur apparaissait avec seulement les labels sans les fields.<br>\n <br>\n &gt;&gt; Si j\'interpr&egrave;te bien ce que vous dites, les fiches sont\n toujours bien dans l\'index, mais c\'est dans le workflow qu\'elles\n sembles disparues ? Elles apparaissent toujours bien dans le module\n search ? Avant de proposer une explication, pouvez-vous vous placer\n dans les sources du module workflow et lancer la commande suivante :\n ant local-reindexall Est-ce que vous revoyez vos fiches dans\n l\'interface du workflow ?<br>\n <br>\n <br>\n Oui, merci ! Toutes les fiches sont revenues.<br>\n <br>\n Encore merci pour votre aide.<br>\n <br>\n Bien cordialement<br>\n <br>\n St&eacute;phane Loret<br>\n MSH - Tours<br>\n Cr&eacute;villes.org<br>\n <br>\n <br>\n Le 20/12/10 14:55, Yohan Colmant a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <font size=\"-1\"><font face=\"Verdana\">Bonjour St&eacute;phane,<br>\n <br>\n Je r&eacute;ponds dans votre mail.<br>\n </font></font><br>\n Le 18/12/2010 19:40, St&eacute;phane Loret a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Author_1\"><blockquote>Bonjour,\n\n <br>\n <br>\n Je suis totalement \"newbie\" dans la configuration et l\'usage de\n l\'application ORI-OAI et tout nouveau aussi sur cette liste que\n je suis pourtant depuis plus d\'un an d&eacute;j&agrave;. Je tiens d\'abord &agrave;\n m\'excuser de la longueur du message, de ses approximations,\n voire du caract&egrave;re peut-&ecirc;tre b&eacute;nin de certaines erreurs ou de\n certaines questions mais, tout &eacute;tant relatif, le c&ocirc;t&eacute; newbie\n ressort ici puissamment tout cela participe de la prise en main\n de l\'application ORI-OAI. <br>\n <br>\n Avant de vous exposer ces quelques probl&egrave;mes tels qu\'indiqu&eacute;s\n dans le sujet de ce message, je souhaite vous pr&eacute;senter un peu\n le projet et le contexte technique dans lequel il s\'inscrit. Au\n sein de la MSH de Tours, le projet cr&eacute;villes.org vise &agrave; recenser\n la plupart des ressources &eacute;lectroniques couvrant la th&eacute;matique\n des &eacute;tudes urbaines et &agrave; permettre aux utilisateurs du site\n crevilles.org de pouvoir rechercher sur l\'ensemble des\n ressources index&eacute;es qu\'elles soient locales ou provenant de\n d&eacute;p&ocirc;ts d\'archives sp&eacute;cifiquement s&eacute;lectionn&eacute;s. Pour ce faire,\n nous avons choisis de mettre en place l\'application ORI-OAI avec\n l\'ensemble de ses modules, esup-ecm compris. Ce choix s\'est\n port&eacute; sur cette application car sa modularit&eacute; permettait de\n d&eacute;velopper un projet de portage du module search vers une\n application CMS en php/mysql (en cours de d&eacute;veloppement). Le\n mod&egrave;le serait celui de l\'Institut de la Montagne. Pour ce qui\n est de l\'installation de ORI-OAI dans le d&eacute;tail, &ccedil;&agrave; donne &ccedil;&agrave; : <br>\n <br>\n - Sur un serveur physique Dell R710 avec 6To d\'espace de\n stockage, 16 Go de RAM tourne un ESXI en version 4.1 dans\n lequel, pour l\'instant, nous avons : <br>\n <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - Une machine virtuelle sous debian 5 lenny d&eacute;di&eacute;e &agrave;\n l\'application ORI-OAI en version 1.6.1 et l\'ensemble de ses\n modules. Cette machine pr&eacute;sente les caract&eacute;ristiques suivantes :\n <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - 3Go de RAM et un espace de 200 Go environ pour\n le tout (syst&egrave;me et stockage) <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - tous les modules tournent dans un seul tomcat\n en version 6.0.24. Le lancement et le red&eacute;marrage du tomcat est\n g&eacute;r&eacute; par le daemon jsvc. <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - esup-ecm tourne dans un jboss. <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - Le d&eacute;ploiement des modules s\'est op&eacute;r&eacute; via les\n sources de chaque module <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - L\'authentification s\'effectue via un annuaire\n LDAP (OpenDS) propre &agrave; cr&eacute;villes.org sous format SUPPANN. Pour\n l\'instant, aucun r&ocirc;le n\'est r&eacute;ellement d&eacute;fini. Les 5 membres de\n l\'&eacute;quipe sont &agrave; la fois mod&eacute;rateur et cr&eacute;ateur de chaque notice,\n dans l\'attente d\'un passage en production et une red&eacute;finition\n des roles, si le besoin s\'en fait sentir. <br>\n <br>\n L\'installation des modules d\'ORI-OAI est fonctionnelle depuis\n pratiquement 15 jours maintenant et nous sommes en phase de test\n et de configuration pour que les modules r&eacute;pondent &agrave; nos\n besoins, principalement : le harvesting qui repr&eacute;sente 90%\n actuellement des ressources que nous souhaitons proposer &agrave; nos\n utilisateurs et le d&eacute;p&ocirc;t, via esup-ecm et le module\n ori-oai-nuxeo (nuxeo DM en version 5.2) qui nous permet\n d\'indexer les documents locaux (textes, images, sons et vid&eacute;os).\n Nous utilisons essentiellement le formulaire dc_easy pour\n indexer de la ressource documentaire [simple]. <br>\n </blockquote></div>\n Pour &ecirc;tre s&ucirc;r, est-ce bien la derni&egrave;re version que vous utilisez ?<br>\n <div class=\"emailFilter_Author_1\"><blockquote> <br>\n <br>\n Ce que nous avons fait et les probl&egrave;mes que nous rencontrons : <br>\n <br>\n HARVESTER <br>\n <br>\n &nbsp;&nbsp;&nbsp; - La premi&egrave;re &eacute;tape a &eacute;t&eacute; de tester le module Harvester en\n long, en large et en travers. Nous avons lanc&eacute; des moissons\n manuellement et via le module de programmation sur des d&eacute;p&ocirc;ts\n d\'archives tels que Cairn, Revues.org, etc. La premi&egrave;re\n programmation s\'est d&eacute;roul&eacute;e avec quelques soucis : la base url\n d\'un d&eacute;p&ocirc;t pointait une redirection sur une page html. L\'erreur\n est relev&eacute;e dans les logs mais cela a provoqu&eacute; le down du module\n harvester pour toutes les autres programmations de moissonnage\n qui suivaient (erreur de type : <br>\n <br>\n 17 d&eacute;c. 2010 06:07:16,217 [ WARN] catalina-exec-136\n org.orioai.harvesting.dao.HarvestConfigDAO getLastReport - can\'t\n find last report for harvest Cairn - Histoire Urbaine. <br>\n etc... <br>\n <br>\n Pire, il a fallu red&eacute;marr&eacute; le tomcat pour reprendre la main sur\n le module et relancer les moissons manuellement. Le tomcat ne\n stoppait pas, bizarrement, nous avons deux daemon jsvc qui\n tournent comme s\'il y avait deux instances d\'un m&ecirc;me tomcat\n alors qu\'il n\'en existe qu\'un seul. Un kill des daemon nous a\n permis de reprendre la main et de relancer le tout. La question\n est alors de savoir s\'il est normal que le module se plante\n quand, lors d\'une tentative de moisson, il rencontre un probl&egrave;me\n du genre d&eacute;crit plus haut. Y a-t-il une configuration sp&eacute;cifique\n sur un degr&eacute; d\'erreur qui permettrait de passer outre, de\n reporter sans compromettre la programmation de moisson ni\n l\'activit&eacute; m&ecirc;me du module harvester ? <br>\n </blockquote></div>\n L&agrave; je pense que vous &ecirc;tes tomb&eacute;s sur un cas malheureux o&ugrave; vous\n pointiez vers un entrep&ocirc;t OAI qui n\'en &eacute;tait pas un.<br>\n Il va falloir que nous regardions de notre c&ocirc;t&eacute; pour ne plus que\n &ccedil;a se passe mieux dans les prochaines versions.<br>\n Pouvez-vous nous donner l\'URL que vous avez entr&eacute;e et qui faisait\n planter ?<br>\n <div class=\"emailFilter_Author_1\"><blockquote> <br>\n &nbsp;- Toujours sur le plan Harvesting. Nous avions lanc&eacute; des tests\n sur des d&eacute;p&ocirc;ts sans pour autant prendre le soin de s&eacute;lectionner\n des sets. On souhaiterait supprimer la totalit&eacute; des fiches\n moissonn&eacute;es sans qu\'une r&eacute;indexation ne puisse les ramener,\n bref, les supprimer d&eacute;finitivement de l\'index, du workflow et de\n l\'harvester. Nous avons essay&eacute; via le module indexing -&gt;\n suppression manuelle des fiches -&gt; suppression de toutes les\n fiches d\'un entrep&ocirc;t. La suppression se lance, mais elle reste\n fig&eacute;e. Aucune fiche n\'a ensuite &eacute;t&eacute; supprim&eacute;e et on les retrouve\n toutes dans l\'index. La m&eacute;thode visant &agrave; supprimer le dossier\n index puis de relancer l\'indexation via le workflow et le module\n harvester ne r&eacute;soud pas le probl&egrave;me. En gros, comment faire pour\n supprimer d&eacute;finitivement les fiches de ces d&eacute;p&ocirc;ts ? <br>\n </blockquote></div>\n Ce que vous voulez faire, si je comprends bien, c\'est bien de\n supprimer certaines fiches provenant d\'une moisson, et qu\'elles ne\n soient plus jamais remises dans l\'index ?<br>\n A l\'heure actuelle, sans moissonner des sets sp&eacute;cifiques o&ugrave; ces\n fiches ne sont pas pr&eacute;sentes, ce n\'est pas possible.<br>\n <br>\n En revanche, c\'est une t&acirc;che qui a d&eacute;j&agrave; &eacute;t&eacute; identifi&eacute;e et qui sera\n r&eacute;alis&eacute;e dans la version 2 de ORI-OAI.<br>\n <div class=\"emailFilter_Author_1\"><blockquote> <br>\n <br>\n - Pour cette partie, il s\'agit d\'une demande. J\'ai lu dans les\n messages de la liste qu\'une personne souhaitait remonter une\n fiche issue d\'une moisson dans le workflow afin d\'obtenir des\n informations sur les m&eacute;tadonn&eacute;es d\'un champ. Dans le cas qui est\n le n&ocirc;tre, nous aurions besoin de pouvoir r&eacute;-indexer tout ou\n partie de la couche oai issue des publications de notre site web\n crevilles.org et de s&eacute;lectionner ce qui peut &ecirc;tre publier au\n niveau du module de repository. Est-il possible de le faire et,\n si tel est le cas, comment proc&eacute;der ? <br>\n </blockquote></div>\n L&agrave; je ne comprends pas bien votre demande.<br>\n Voulez-vous modifier des fiches que vous avez moissonn&eacute;es et les\n exposer ensuite en OAI ?<br>\n Voulez-vous exposer une partie des fiches moissonn&eacute;es sans les\n modifi&eacute;es ?<br>\n Ou une partie des fiches que vous produisez ?<br>\n Dans ce cas, comment vous identifiez lesquelles exposer et\n lesquelles ne pas exposer ? Il y a un m&eacute;canisme pour &ccedil;a qui repose\n sur les m&eacute;tadonn&eacute;es. Par exemple, que les fiches qui contiennent\n tel mot dans le titre.<br>\n <br>\n Vous pouvez expliquer plus en d&eacute;tail svp ?<br>\n <div class=\"emailFilter_Author_1\"><blockquote> <br>\n NUXEO - WORKFLOW <br>\n <br>\n - Nous stockons donc nos documents via nuxeo esup-ecm. Le\n probl&egrave;me est qu\'apr&egrave;s archivage du document, le formulaire\n md-editor qui s\'ouvre ne r&eacute;cup&egrave;re pas la description remplie\n dans une premier temps au niveau de nuxeo, alors que tous les\n autres champs reprennent bien l\'ensemble des donn&eacute;es. Une fois\n que le formulaire est valid&eacute;, que le document est publi&eacute; au\n niveau du workflow et index&eacute; via le module indexing, le lien\n g&eacute;n&eacute;r&eacute; par nuxeo pointe un document qui est inaccessible pour\n les utilisateurs qui n\'ont pas les droits d\'acc&egrave;s au module\n nuxeo. Comment faire pour que le lien g&eacute;n&eacute;r&eacute; permette l\'acc&egrave;s au\n document plein texte &agrave; l\'utilisateur lambda, notamment quand ce\n dernier utilise le module search sur les documents locaux ? <br>\n </blockquote></div>\n Vous &ecirc;tes sur un ESUP-ECM ou alors un Nuxeo que vous avez install&eacute;\n en dehors de ORI-OAI ?<br>\n Si c\'est bien ESUP-ECM, je ne comprends pas &agrave; quel endroit vous\n avez saisi la description dont vous parlez ? Le titre quant &agrave; lui\n est bien rempli dans la fiche de m&eacute;tadonn&eacute;es du module md-editor\n par exemple ?<br>\n <br>\n Pour les droits d\'acc&egrave;s, il faudrait voir un peu plus en d&eacute;tail\n comment fonctionne Nuxeo / ESUP-ECM.<br>\n En effet, les documents doivent &ecirc;tre publi&eacute;s dans des sections. Ce\n sont les droits sur les sections qui d&eacute;finissent les droits\n d\'acc&egrave;s aux documents y &eacute;tant publi&eacute;s.<br>\n <br>\n En gros, vous devez cr&eacute;er une section \"Documents publics\", d&eacute;finir\n un droit d\'acc&egrave;s en lecture &agrave; l\'utilisateur \"invite\" et publier\n les documents dans cette section.<br>\n Vous voyez ?<br>\n <div class=\"emailFilter_Author_1\"><blockquote> <br>\n - D\'autre part, au niveau du workflow, nous avons parfois des\n erreurs lors du chargement du formulaire : les labels sont bien\n pr&eacute;sents mais les champs ont disparu. L\'erreur suivante est\n g&eacute;n&eacute;r&eacute;e : <br>\n <br>\n 2010-12-18 17:05:48,894 ERROR XFormsServer&nbsp;\n -&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; xforms-submit-error - setting throwable\n {throwable:\n \"org.orbeon.oxf.xforms.submission.XFormsSubmissionException:&nbsp;\n (processing submission response): xforms:submission for\n submission id: fr-get-document-submission, error code received\n when submitting instance: 500 <br>\n null, line -1, column -1: xforms:submission for submission id:\n fr-get-document-submission, error code received when submitting\n instance: 500 <br>\n &nbsp;&nbsp;&nbsp; at\norg.orbeon.oxf.xforms.submission.XFormsModelSubmission.getReplacer(XFormsModelSubmission.java:599)<br>\n &nbsp;&nbsp;&nbsp; at\norg.orbeon.oxf.xforms.submission.RegularSubmission$1.call(RegularSubmission.java:97)<br>\n </blockquote></div>\n L&agrave; je laisse un coll&egrave;gue plus comp&eacute;tent que moi sur ce module\n r&eacute;pondre.<br>\n Pour info, est-ce que l\'erreur est al&eacute;atoire ou elle se pr&eacute;sente\n toujours pour les m&ecirc;mes fiches ? En gros, est-ce que lorsque\n l\'erreur se produit, elle se produit toujours sur la fiche ?<br>\n Si oui, pouvez-vous nous envoyer une fiche d\'exemple ?<br>\n Sur quel &eacute;diteur &ccedil;a se passe ? Le dublin core ?<br>\n <div class=\"emailFilter_Author_1\"><blockquote>&nbsp;&nbsp;&nbsp; <br>\n <br>\n - Enfin, derni&egrave;re erreur qui nous pr&eacute;occupe : nous avions index&eacute;\n une dizaine de documents et tout se passait &agrave; peu pr&egrave;s bien\n (except&eacute; les probl&egrave;mes de formulaire). Les documents &eacute;taient\n publi&eacute;s et ils &eacute;taient pr&eacute;sents dans le module search et le\n module indexing. Sans comprendre comment, la liste des\n resssources en traitement ou trait&eacute;es a disparu et aucun lien\n n\'est pr&eacute;sent dans cette partie du workflow. Le probl&egrave;me est que\n nous n\'avons pas d\'erreur, du moins pas en rapport avec ce\n module. Est-il possible que ce probl&egrave;me soit en lien avec les\n probl&egrave;mes que l\'on rencontre avec le formulaire et Orbeon ?\n Comment faire pour retrouver les liens et nous permettre de\n g&eacute;rer les documents publi&eacute;s ? <br>\n </blockquote></div>\n Si j\'interpr&egrave;te bien ce que vous dites, les fiches sont toujours\n bien dans l\'index, mais c\'est dans le workflow qu\'elles sembles\n disparues ? Elles apparaissent toujours bien dans le module search\n ?<br>\n <br>\n Avant de proposer une explication, pouvez-vous vous placer dans\n les sources du module workflow et lancer la commande suivante :<br>\n ant local-reindexall<br>\n <br>\n Est-ce que vous revoyez vos fiches dans l\'interface du workflow ?<br>\n <div class=\"emailFilter_Author_1\"><blockquote> <br>\n Bien cordialement et avec toutes mes excuses pour la longueur du\n message. <br>\n <br>\n </blockquote></div>\n Merci.<br>\n Bonnes f&ecirc;tes &eacute;galement,<br>\n <br>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\"> <font face=\"Verdana\"><small> Yohan\n COLMANT<br>\n Direction des Syst&egrave;mes d\'Information<br>\n UVHC - Universit&eacute; de Valenciennes et du Hainaut Cambr&eacute;sis<br>\n Coordinateur Technique du projet ORI-OAI </small> </font>\n </div>\n </div>\n <div class=\"emailFilter_Author_1\"><blockquote>Je\n vous souhaite d\'agr&eacute;ables f&ecirc;tes. <br>\n <br>\n St&eacute;phane LORET <br>\n MSH - TOURS <br>\n Cr&eacute;villes.org <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n </blockquote></div>\n </blockquote></div></div>\n <br>\n </body>\n</html>\n</div>', created = 1507746240, expire = 1507832640, headers = '', serialized = 0 WHERE cid = '4:47dfc6d17d60e1a69c91eb2644db40f4' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:7fe03a6cb058b38a208fc2d5522ed35f' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n </head>\n <body text=\"#000000\" bgcolor=\"#ffffff\">\n <font size=\"-1\"><font face=\"Verdana\">Bonjour St&eacute;phane,<br>\n <br>\n Je r&eacute;ponds dans votre mail.<br>\n </font></font><br>\n Le 18/12/2010 19:40, St&eacute;phane Loret a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>Bonjour,\n <br>\n <br>\n Je suis totalement \"newbie\" dans la configuration et l\'usage de\n l\'application ORI-OAI et tout nouveau aussi sur cette liste que je\n suis pourtant depuis plus d\'un an d&eacute;j&agrave;. Je tiens d\'abord &agrave;\n m\'excuser de la longueur du message, de ses approximations, voire\n du caract&egrave;re peut-&ecirc;tre b&eacute;nin de certaines erreurs ou de certaines\n questions mais, tout &eacute;tant relatif, le c&ocirc;t&eacute; newbie ressort ici\n puissamment tout cela participe de la prise en main de\n l\'application ORI-OAI.\n <br>\n <br>\n Avant de vous exposer ces quelques probl&egrave;mes tels qu\'indiqu&eacute;s dans\n le sujet de ce message, je souhaite vous pr&eacute;senter un peu le\n projet et le contexte technique dans lequel il s\'inscrit. Au sein\n de la MSH de Tours, le projet cr&eacute;villes.org vise &agrave; recenser la\n plupart des ressources &eacute;lectroniques couvrant la th&eacute;matique des\n &eacute;tudes urbaines et &agrave; permettre aux utilisateurs du site\n crevilles.org de pouvoir rechercher sur l\'ensemble des ressources\n index&eacute;es qu\'elles soient locales ou provenant de d&eacute;p&ocirc;ts d\'archives\n sp&eacute;cifiquement s&eacute;lectionn&eacute;s. Pour ce faire, nous avons choisis de\n mettre en place l\'application ORI-OAI avec l\'ensemble de ses\n modules, esup-ecm compris. Ce choix s\'est port&eacute; sur cette\n application car sa modularit&eacute; permettait de d&eacute;velopper un projet\n de portage du module search vers une application CMS en php/mysql\n (en cours de d&eacute;veloppement). Le mod&egrave;le serait celui de l\'Institut\n de la Montagne. Pour ce qui est de l\'installation de ORI-OAI dans\n le d&eacute;tail, &ccedil;&agrave; donne &ccedil;&agrave; :\n <br>\n <br>\n - Sur un serveur physique Dell R710 avec 6To d\'espace de stockage,\n 16 Go de RAM tourne un ESXI en version 4.1 dans lequel, pour\n l\'instant, nous avons :\n <br>\n <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - Une machine virtuelle sous debian 5 lenny d&eacute;di&eacute;e &agrave;\n l\'application ORI-OAI en version 1.6.1 et l\'ensemble de ses\n modules. Cette machine pr&eacute;sente les caract&eacute;ristiques suivantes :\n <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - 3Go de RAM et un espace de 200 Go environ pour\n le tout (syst&egrave;me et stockage)\n <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - tous les modules tournent dans un seul tomcat en\n version 6.0.24. Le lancement et le red&eacute;marrage du tomcat est g&eacute;r&eacute;\n par le daemon jsvc.\n <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - esup-ecm tourne dans un jboss.\n <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - Le d&eacute;ploiement des modules s\'est op&eacute;r&eacute; via les\n sources de chaque module\n <br>\n &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; - L\'authentification s\'effectue via un annuaire\n LDAP (OpenDS) propre &agrave; cr&eacute;villes.org sous format SUPPANN. Pour\n l\'instant, aucun r&ocirc;le n\'est r&eacute;ellement d&eacute;fini. Les 5 membres de\n l\'&eacute;quipe sont &agrave; la fois mod&eacute;rateur et cr&eacute;ateur de chaque notice,\n dans l\'attente d\'un passage en production et une red&eacute;finition des\n roles, si le besoin s\'en fait sentir.\n <br>\n <br>\n L\'installation des modules d\'ORI-OAI est fonctionnelle depuis\n pratiquement 15 jours maintenant et nous sommes en phase de test\n et de configuration pour que les modules r&eacute;pondent &agrave; nos besoins,\n principalement : le harvesting qui repr&eacute;sente 90% actuellement des\n ressources que nous souhaitons proposer &agrave; nos utilisateurs et le\n d&eacute;p&ocirc;t, via esup-ecm et le module ori-oai-nuxeo (nuxeo DM en\n version 5.2) qui nous permet d\'indexer les documents locaux\n (textes, images, sons et vid&eacute;os). Nous utilisons essentiellement\n le formulaire dc_easy pour indexer de la ressource documentaire\n [simple].\n <br>\n </blockquote></div></div>\n Pour &ecirc;tre s&ucirc;r, est-ce bien la derni&egrave;re version que vous utilisez ?<br>\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <br>\n <br>\n Ce que nous avons fait et les probl&egrave;mes que nous rencontrons :\n <br>\n <br>\n HARVESTER\n <br>\n <br>\n &nbsp;&nbsp;&nbsp; - La premi&egrave;re &eacute;tape a &eacute;t&eacute; de tester le module Harvester en\n long, en large et en travers. Nous avons lanc&eacute; des moissons\n manuellement et via le module de programmation sur des d&eacute;p&ocirc;ts\n d\'archives tels que Cairn, Revues.org, etc. La premi&egrave;re\n programmation s\'est d&eacute;roul&eacute;e avec quelques soucis : la base url\n d\'un d&eacute;p&ocirc;t pointait une redirection sur une page html. L\'erreur\n est relev&eacute;e dans les logs mais cela a provoqu&eacute; le down du module\n harvester pour toutes les autres programmations de moissonnage qui\n suivaient (erreur de type :\n <br>\n <br>\n 17 d&eacute;c. 2010 06:07:16,217 [ WARN] catalina-exec-136\n org.orioai.harvesting.dao.HarvestConfigDAO getLastReport - can\'t\n find last report for harvest Cairn - Histoire Urbaine.\n <br>\n etc...\n <br>\n <br>\n Pire, il a fallu red&eacute;marr&eacute; le tomcat pour reprendre la main sur le\n module et relancer les moissons manuellement. Le tomcat ne\n stoppait pas, bizarrement, nous avons deux daemon jsvc qui\n tournent comme s\'il y avait deux instances d\'un m&ecirc;me tomcat alors\n qu\'il n\'en existe qu\'un seul. Un kill des daemon nous a permis de\n reprendre la main et de relancer le tout. La question est alors de\n savoir s\'il est normal que le module se plante quand, lors d\'une\n tentative de moisson, il rencontre un probl&egrave;me du genre d&eacute;crit\n plus haut. Y a-t-il une configuration sp&eacute;cifique sur un degr&eacute;\n d\'erreur qui permettrait de passer outre, de reporter sans\n compromettre la programmation de moisson ni l\'activit&eacute; m&ecirc;me du\n module harvester ?\n <br>\n </blockquote></div></div>\n L&agrave; je pense que vous &ecirc;tes tomb&eacute;s sur un cas malheureux o&ugrave; vous\n pointiez vers un entrep&ocirc;t OAI qui n\'en &eacute;tait pas un.<br>\n Il va falloir que nous regardions de notre c&ocirc;t&eacute; pour ne plus que &ccedil;a\n se passe mieux dans les prochaines versions.<br>\n Pouvez-vous nous donner l\'URL que vous avez entr&eacute;e et qui faisait\n planter ?<br>\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <br>\n &nbsp;- Toujours sur le plan Harvesting. Nous avions lanc&eacute; des tests\n sur des d&eacute;p&ocirc;ts sans pour autant prendre le soin de s&eacute;lectionner\n des sets. On souhaiterait supprimer la totalit&eacute; des fiches\n moissonn&eacute;es sans qu\'une r&eacute;indexation ne puisse les ramener, bref,\n les supprimer d&eacute;finitivement de l\'index, du workflow et de\n l\'harvester. Nous avons essay&eacute; via le module indexing -&gt;\n suppression manuelle des fiches -&gt; suppression de toutes les\n fiches d\'un entrep&ocirc;t. La suppression se lance, mais elle reste\n fig&eacute;e. Aucune fiche n\'a ensuite &eacute;t&eacute; supprim&eacute;e et on les retrouve\n toutes dans l\'index. La m&eacute;thode visant &agrave; supprimer le dossier\n index puis de relancer l\'indexation via le workflow et le module\n harvester ne r&eacute;soud pas le probl&egrave;me. En gros, comment faire pour\n supprimer d&eacute;finitivement les fiches de ces d&eacute;p&ocirc;ts ?\n <br>\n </blockquote></div></div>\n Ce que vous voulez faire, si je comprends bien, c\'est bien de\n supprimer certaines fiches provenant d\'une moisson, et qu\'elles ne\n soient plus jamais remises dans l\'index ?<br>\n A l\'heure actuelle, sans moissonner des sets sp&eacute;cifiques o&ugrave; ces\n fiches ne sont pas pr&eacute;sentes, ce n\'est pas possible.<br>\n <br>\n En revanche, c\'est une t&acirc;che qui a d&eacute;j&agrave; &eacute;t&eacute; identifi&eacute;e et qui sera\n r&eacute;alis&eacute;e dans la version 2 de ORI-OAI.<br>\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <br>\n <br>\n - Pour cette partie, il s\'agit d\'une demande. J\'ai lu dans les\n messages de la liste qu\'une personne souhaitait remonter une fiche\n issue d\'une moisson dans le workflow afin d\'obtenir des\n informations sur les m&eacute;tadonn&eacute;es d\'un champ. Dans le cas qui est\n le n&ocirc;tre, nous aurions besoin de pouvoir r&eacute;-indexer tout ou partie\n de la couche oai issue des publications de notre site web\n crevilles.org et de s&eacute;lectionner ce qui peut &ecirc;tre publier au\n niveau du module de repository. Est-il possible de le faire et, si\n tel est le cas, comment proc&eacute;der ?\n <br>\n </blockquote></div></div>\n L&agrave; je ne comprends pas bien votre demande.<br>\n Voulez-vous modifier des fiches que vous avez moissonn&eacute;es et les\n exposer ensuite en OAI ?<br>\n Voulez-vous exposer une partie des fiches moissonn&eacute;es sans les\n modifi&eacute;es ?<br>\n Ou une partie des fiches que vous produisez ?<br>\n Dans ce cas, comment vous identifiez lesquelles exposer et\n lesquelles ne pas exposer ? Il y a un m&eacute;canisme pour &ccedil;a qui repose\n sur les m&eacute;tadonn&eacute;es. Par exemple, que les fiches qui contiennent tel\n mot dans le titre.<br>\n <br>\n Vous pouvez expliquer plus en d&eacute;tail svp ?<br>\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <br>\n NUXEO - WORKFLOW\n <br>\n <br>\n - Nous stockons donc nos documents via nuxeo esup-ecm. Le probl&egrave;me\n est qu\'apr&egrave;s archivage du document, le formulaire md-editor qui\n s\'ouvre ne r&eacute;cup&egrave;re pas la description remplie dans une premier\n temps au niveau de nuxeo, alors que tous les autres champs\n reprennent bien l\'ensemble des donn&eacute;es. Une fois que le formulaire\n est valid&eacute;, que le document est publi&eacute; au niveau du workflow et\n index&eacute; via le module indexing, le lien g&eacute;n&eacute;r&eacute; par nuxeo pointe un\n document qui est inaccessible pour les utilisateurs qui n\'ont pas\n les droits d\'acc&egrave;s au module nuxeo. Comment faire pour que le lien\n g&eacute;n&eacute;r&eacute; permette l\'acc&egrave;s au document plein texte &agrave; l\'utilisateur\n lambda, notamment quand ce dernier utilise le module search sur\n les documents locaux ?\n <br>\n </blockquote></div></div>\n Vous &ecirc;tes sur un ESUP-ECM ou alors un Nuxeo que vous avez install&eacute;\n en dehors de ORI-OAI ?<br>\n Si c\'est bien ESUP-ECM, je ne comprends pas &agrave; quel endroit vous avez\n saisi la description dont vous parlez ? Le titre quant &agrave; lui est\n bien rempli dans la fiche de m&eacute;tadonn&eacute;es du module md-editor par\n exemple ?<br>\n <br>\n Pour les droits d\'acc&egrave;s, il faudrait voir un peu plus en d&eacute;tail\n comment fonctionne Nuxeo / ESUP-ECM.<br>\n En effet, les documents doivent &ecirc;tre publi&eacute;s dans des sections. Ce\n sont les droits sur les sections qui d&eacute;finissent les droits d\'acc&egrave;s\n aux documents y &eacute;tant publi&eacute;s.<br>\n <br>\n En gros, vous devez cr&eacute;er une section \"Documents publics\", d&eacute;finir\n un droit d\'acc&egrave;s en lecture &agrave; l\'utilisateur \"invite\" et publier les\n documents dans cette section.<br>\n Vous voyez ?<br>\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <br>\n - D\'autre part, au niveau du workflow, nous avons parfois des\n erreurs lors du chargement du formulaire : les labels sont bien\n pr&eacute;sents mais les champs ont disparu. L\'erreur suivante est\n g&eacute;n&eacute;r&eacute;e :\n <br>\n <br>\n 2010-12-18 17:05:48,894 ERROR XFormsServer&nbsp;\n -&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; xforms-submit-error - setting throwable\n {throwable:\n \"org.orbeon.oxf.xforms.submission.XFormsSubmissionException:&nbsp;\n (processing submission response): xforms:submission for submission\n id: fr-get-document-submission, error code received when\n submitting instance: 500\n <br>\n null, line -1, column -1: xforms:submission for submission id:\n fr-get-document-submission, error code received when submitting\n instance: 500\n <br>\n &nbsp;&nbsp;&nbsp; at\norg.orbeon.oxf.xforms.submission.XFormsModelSubmission.getReplacer(XFormsModelSubmission.java:599)<br>\n &nbsp;&nbsp;&nbsp; at\norg.orbeon.oxf.xforms.submission.RegularSubmission$1.call(RegularSubmission.java:97)<br>\n </blockquote></div></div>\n L&agrave; je laisse un coll&egrave;gue plus comp&eacute;tent que moi sur ce module\n r&eacute;pondre.<br>\n Pour info, est-ce que l\'erreur est al&eacute;atoire ou elle se pr&eacute;sente\n toujours pour les m&ecirc;mes fiches ? En gros, est-ce que lorsque\n l\'erreur se produit, elle se produit toujours sur la fiche ?<br>\n Si oui, pouvez-vous nous envoyer une fiche d\'exemple ?<br>\n Sur quel &eacute;diteur &ccedil;a se passe ? Le dublin core ?<br>\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>&nbsp;&nbsp;&nbsp; <br>\n <br>\n - Enfin, derni&egrave;re erreur qui nous pr&eacute;occupe : nous avions index&eacute;\n une dizaine de documents et tout se passait &agrave; peu pr&egrave;s bien\n (except&eacute; les probl&egrave;mes de formulaire). Les documents &eacute;taient\n publi&eacute;s et ils &eacute;taient pr&eacute;sents dans le module search et le module\n indexing. Sans comprendre comment, la liste des resssources en\n traitement ou trait&eacute;es a disparu et aucun lien n\'est pr&eacute;sent dans\n cette partie du workflow. Le probl&egrave;me est que nous n\'avons pas\n d\'erreur, du moins pas en rapport avec ce module. Est-il possible\n que ce probl&egrave;me soit en lien avec les probl&egrave;mes que l\'on rencontre\n avec le formulaire et Orbeon ? Comment faire pour retrouver les\n liens et nous permettre de g&eacute;rer les documents publi&eacute;s ?\n <br>\n </blockquote></div></div>\n Si j\'interpr&egrave;te bien ce que vous dites, les fiches sont toujours\n bien dans l\'index, mais c\'est dans le workflow qu\'elles sembles\n disparues ? Elles apparaissent toujours bien dans le module search ?<br>\n <br>\n Avant de proposer une explication, pouvez-vous vous placer dans les\n sources du module workflow et lancer la commande suivante :<br>\n ant local-reindexall<br>\n <br>\n Est-ce que vous revoyez vos fiches dans l\'interface du workflow ?<br>\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <br>\n Bien cordialement et avec toutes mes excuses pour la longueur du\n message.\n <br>\n <br>\n </blockquote></div></div>\n Merci.<br>\n Bonnes f&ecirc;tes &eacute;galement,<br>\n <br>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\">\n <font face=\"Verdana\"><small>\n Yohan COLMANT<br>\n Direction des Syst&egrave;mes d\'Information<br>\n UVHC - Universit&eacute; de Valenciennes et du Hainaut Cambr&eacute;sis<br>\n Coordinateur Technique du projet ORI-OAI\n </small>\n </font>\n </div>\n </div>\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>Je vous\n souhaite d\'agr&eacute;ables f&ecirc;tes.\n <br>\n <br>\n St&eacute;phane LORET\n <br>\n MSH - TOURS\n <br>\n Cr&eacute;villes.org\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n </blockquote></div></div>\n </body>\n</html>\n</div>', created = 1507746240, expire = 1507832640, headers = '', serialized = 0 WHERE cid = '4:7fe03a6cb058b38a208fc2d5522ed35f' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
3 messages / 0 nouveaux
Dernière contribution
Yohan Colmant
{Disarmed} {Disarmed} {Disarmed} Quelques problèmes
Bonjour,
idem
Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI

Le 05/01/2011 16:23, Stéphane Loret a écrit :
Bonjour Yohan, bonjour à tous,

Je vous souhaite à tous une très agréable année 2011.
Je réponds directement dans le message. Encore merci pour votre aide, nous ne sommes pas au bout de nos peines.

Bien à vous

Stéphane LORET
MSH - Tours
Crévilles.org


PS : Puis-je vous contacter directement pour, entre autres, discuter sur les possibilités de formation ?
oui on en parlera en même temps que les questions OAI-PMH

Le 03/01/11 11:53, Yohan Colmant a écrit :
Bonjour,

Désolé pour le délai, mais j'étais en congés.


Le 21/12/2010 16:18, Stéphane Loret a écrit :
Bonjour Yohan,

Merci pour votre réponse. J'essaie de vous apporter le maximum d'information ci-après :


>> Pour être sûr, est-ce bien la dernière version que vous utilisez ?

- Version d'ORI-OAI installée  : Dans le détail, on a çà :
    - module Harvester : 1.6.2
    - module Md-Editor : 1.6.3
    - module Indexing : 1.6.1
    - Version esup-ecm : 1.1.2 avec nuxeo DM 5.2, mais le jboss.dir dans build.properties du module ori-oai-nuxeo indique une version 5.3.1 de nuxeo DM.
    - module repository : 1.6.2
    - module vocabulary : 1.6.2
    - module workflow : 1.6.3
    - module search : 1.6.2
Merci

>> Là je pense que vous êtes tombés sur un cas malheureux où vous pointiez vers un entrepôt OAI qui n'en était pas un.
Il va falloir que nous regardions de notre côté pour ne plus que ça se passe mieux dans les prochaines versions.
Pouvez-vous nous donner l'URL que vous avez entrée et qui faisait planter ?

Oui, en effet, après vérification, la base url du dépôt pointait une redirection sur une page html. La base url qui a fait planter le module : http://ir.ub.rug.nl/dspace-oai/request?verb=Identify
Merci pour l'info, c'est noté de notre côté !

>> Ce que vous voulez faire, si je comprends bien, c'est bien de supprimer certaines fiches provenant d'une moisson, et qu'elles ne soient plus jamais remises dans l'index ?
A l'heure actuelle, sans moissonner des sets spécifiques où ces fiches ne sont pas présentes, ce n'est pas possible. En revanche, c'est une tâche qui a déjà été identifiée et qui sera réalisée dans la version 2 de ORI-OAI.

Oui, c'est tout à fait cela, voire même l'ensemble d'un dépôt. Je prends l'exemple de Canal-u : nous avons fait des tests sur le dépôt, mais nous souhaiterions maintenant retirer tout ce qui à trait à Canal-U, idem pour Revues.org, ne prendre en compte que les collections
Mais si vous souhaitez supprimer toutes les fiches provenant d'une moisson, il vous suffit de supprimer la récolte côté moissonneur. Ceci supprimera alors les fiches dans l'index.

Oui, c'est ce que nous avons fait, mais les fiches sont toujours bien présentes dans l'indexing et dans le module search. Et en supprimant l'index et en réindexant à la suite, on retrouve encore toutes les fiches précédemment supprimées alors que les moissons (définition, récoltes) sont bien supprimées.
Si vous avez bien supprimé la récolte avant la suppression de la définition, les fiches ont du être supprimées de l'indexing. Vous pouvez le voir en consultant l'IHM de l'indexing.
Il faut bien supprimer la récolte avant la définition car il y a un petit soucis dans la version actuelle : si vous supprimez la définition sans supprimer explicitement la récolte dans l'onglet "Récolte", les fiches restent dans la base du harvester et donc aussi dans l'indexing. En effet, la suppression de la définition ne semble pas bien supprimer les fiches récoltées. Ca sera corrigé.
Je vous propose de faire un init de la base du harvester et de l'indexing pour repartir sur une base vierge. Par la suite, pensez à prendre ces précautions et supprimer la récolte avant la définition.



>> Là je ne comprends pas bien votre demande.
Voulez-vous modifier des fiches que vous avez moissonnées et les exposer ensuite en OAI ?
Voulez-vous exposer une partie des fiches moissonnées sans les modifiées ?
Ou une partie des fiches que vous produisez ?
Dans ce cas, comment vous identifiez lesquelles exposer et lesquelles ne pas exposer ? Il y a un mécanisme pour ça qui repose sur les métadonnées. Par exemple, que les fiches qui contiennent tel mot dans le titre.

Cette demande est un peu particulière, je le conçois bien. Parmi les questions que vous me posez, celle qui est en rapport direct avec notre souhait est la première : modifier des fiches moissonnées pour les exposer ensuite en OAI. La couche oai actuellement en place pour le site crevilles.org porte sur la totalité du site. Nous souhaitons pouvoir, à la fin de la journée de veille ou le lendemain, ramener ce contenu au niveau du module Harvester et choisir, voire modifier, ce qui sera exposé en OAI. Il est difficile, à l'heure actuelle, de préciser globalement si telle ou telle section du site (en gros ce qui deviendra par la suite des sets au niveau de la couche), doit ou ne doit pas être exposé. Par exemple : nous ne souhaitons pas que l'actualité des études urbaines dans crévilles soit exposée, mais il est possible qu'un item dans cette catégorie de contenu déroge à la règle. Je ne sais donc pas si c'est faisable dans l'état actuel des choses ni si cela correspond ou non aux bonnes pratiques. Mais, dans un premier temps, et à la mesure des possibilités offertes, en tous les cas, nous pourrions procéder de cette manière.
Peut-on se contacter directement sur ce point hors liste ? J'ai du mal à voir clairement ce que vous souhaitez et je préfère en discuter directement avec vous pour évoquer les différentes possibilités


Oui, je vous contacte cette semaine. Avez-vous des disponibilités ?
vendredi 9h ? j'ai une contrainte à 10h donc je ne pourrai pas déborder
vous m'appelez ?


>> Vous êtes sur un ESUP-ECM ou alors un Nuxeo que vous avez installé en dehors de ORI-OAI ?
Si c'est bien ESUP-ECM, je ne comprends pas à quel endroit vous avez saisi la description dont vous parlez ? Le titre quant à lui est bien rempli dans la fiche de métadonnées du module md-editor par exemple ?

Pour les droits d'accès, il faudrait voir un peu plus en détail comment fonctionne Nuxeo / ESUP-ECM.
En effet, les documents doivent être publiés dans des sections. Ce sont les droits sur les sections qui définissent les droits d'accès aux documents y étant publiés.

En gros, vous devez créer une section "Documents publics", définir un droit d'accès en lecture à l'utilisateur "invite" et publier les documents dans cette section.
Vous voyez ?


Nous sommes sur un ESUP-ECM. Quand un créateur charge un document, il y a deux champs, titre et description. Une fois que le document est archivé, le lien présent dans l'onglet référencement permet d'ouvrir un formulaire dc_easy pour que nous puissions ensuite reverser ce document dans les ressources locales. QUand le formulaire md-editor s'ouvre, on retrouve bien le titre, le type de document (pdf, etc...), mais dans la partie description (dc.description), celle qui était précisée au niveau d'esup_ecm n'apparaît pas. Cette absence n'est pas systématique car nous avons fait des essais avec des documents de différents formats, différentes tailles pour que nous puissions affinés nos réglages et la partie description dans le formulaire md-editor est parfois remplie, parfois non. Elle l'est pour des documents de type vidéo par exemple, mais elle ne l'est pas pour des pdfs. Et même sur les pdfs, c'est variable. Dans les proportions, on dira que cette partie est incomplète dans 80% des cas sur le peu de tests que nous avons faits (une dizaine de documents pour l'instant).
Ce qui me semble étrange, c'est que vous avez la description qui est parfois récupérée : en effet, par défaut, la configuration permettant de faire ceci n'existe pas.

Vous pouvez tenter ceci et me dire si ça marche à 100% maintenant svp ?

Dans les sources qui ont été chargées du module ori-oai-nuxeo, allez dans src/main/resources/OSGI-INF/orioainuxeo2xml-contrib.xml
Et ajoutez la ligne en rouge dans le bloc suivant :

  <extension target="org.orioai.esupecm.nuxeo2xml.service.OriOaiNuxeo2XmlService"
    point="nuxeoToxml">

    <configuration>
      <metadataSchemaNamespace>http://www.openarchives.org/OAI/2.0/oai_dc/</metadataSchemaNamespace>
     
      <ns prefix="dc" namespace=MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "purl.org" MailScanner has detected a possible fraud attempt from "purl.org" claiming to be "http://purl.org/dc/elements/1.1/"/>
      <ns prefix="oaidc" namespace=MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.openarchives.org" MailScanner has detected a possible fraud attempt from "www.openarchives.org" claiming to be "http://www.openarchives.org/OAI/2.0/oai_dc/"/>
     
      <metadata nuxeoXpath="NUXEO_URL" workflowXpath="/oaidc:dc/dc:identifier"/>
      <metadata nuxeoXpath="/document/schema/nx_dc:title" workflowXpath="/oaidc:dc/dc:title"/>
      <metadata nuxeoXpath="/document/schema/nx_dc:description" workflowXpath="/oaidc:dc/dc:description"/>
      <metadata nuxeoXpath="substring(/document/schema/nx_dc:created, 0, 11)" workflowXpath="/oaidc:dc/dc:date"/>
      <metadata nuxeoXpath="/document/nx_file:schema/nx_file:content/nx_file:mime-type" workflowXpath="/oaidc:dc/dc:format"/>
    </configuration>

  </extension>

Ca donne quoi ?

J'ai fait les modifications sur le fichier  :
<!-- dublin core -->
  <extension target="org.orioai.esupecm.nuxeo2xml.service.OriOaiNuxeo2XmlService"
    point="nuxeoToxml">

    <configuration>
      <metadataSchemaNamespace>http://www.openarchives.org/OAI/2.0/oai_dc/</metadataSchemaNamespace>
     
      <ns prefix="dc" namespace=MailScanner has detected a possible fraud attempt from "purl.org" claiming to be MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "purl.org" MailScanner has detected a possible fraud attempt from "purl.org" claiming to be "http://purl.org/dc/elements/1.1/"/>
      <ns prefix="oaidc" namespace=MailScanner has detected a possible fraud attempt from "www.openarchives.org" claiming to be MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.openarchives.org" MailScanner has detected a possible fraud attempt from "www.openarchives.org" claiming to be "http://www.openarchives.org/OAI/2.0/oai_dc/"/>
     
      <metadata nuxeoXpath="NUXEO_URL" workflowXpath="/oaidc:dc/dc:identifier"/>
      <metadata nuxeoXpath="/document/schema/nx_dc:title" workflowXpath="/oaidc:dc/dc:title"/>
      <metadata nuxeoXpath="/document/schema/nx_dc:description" workflowXpath="/oai:dc/dc:description"/>
      <metadata nuxeoXpath="substring(/document/schema/nx_dc:created, 0, 11)" workflowXpath="/oaidc:dc/dc:date"/>
      <metadata nuxeoXpath="/document/nx_file:schema/nx_file:content/nx_file:mime-type" workflowXpath="/oaidc:dc/dc:format"/>
    </configuration>

  </extension>

Mais là, j'ai un problème dans le passage de nuxeo au workflow : quand je demande la publication du document, je choisis la section mais le formulaire pour l'édition dans le workflow ne s'ouvre pas... 
vous dites que ça ne s'ouvre pas ? Mais vous voyez bien l'erreur.
Si je comprends bien, la pop-up pour saisir les métadonnées s'ouvre mais il y a cette erreur dans la page ?
Quelle est l'URL de la pop-up lorsqu'elle s'ouvre ?

Est-ce depuis que je vous ai fait changer la config que ça plante comme ça ?
Si oui, pouvez-vous essayer de vous connecter dans le module workflow avec le même compte que l'utilisateur pour qui ça a planté dans Nuxeo. Est-ce que dans les fiches en cours d'édition dans le workflow, vous voyez la fiche correspondant au référencement que vous avez essayé de lancer depuis Nuxeo ? Si oui, dans le lien "Voir", vous pouvez télécharger la version courante de la fiche de métadonnées, vous pouvez me l'envoyer ? Il faudrait voir si le md-editor plante à cause du champ description qui se serait mal rempli.

Pour rappel, ce n'est pas au moment où on choisit la section que le formulaire de saisie des métadonnées s'ouvre, mais c'est bien quand vous allez dans l'onglet "Référencement" et que vous choisissez la version à référencer et que vous cliquez sur "Référencer en tant que ....". C'est bien ce que vous avez fait ?

Pouvez-vous nous dire si le module md-editor fonctionne bien en standalone ? Pour ça, allez sur MailScanner has detected a possible fraud attempt from "....." claiming to be http://...../ori-oai-md-editor
Vous avez accès à tous les formulaires en édition sans connexion au workflow ou nuxeo ni à aucune base de données. Les fiches saisies ici peuvent être enregistrées directement sur votre poste. Les formulaires fonctionnent-ils ?
Si non, avez-vous la même erreur ?

Enfin, avez vous essayé de vous connecter depuis le module workflow en essayant de lancer un référencement ? Ceci évite de passer par Nuxeo. C'est pour essayer de cerner où se passe le problème.
Je suis donc allé voir s'il n'y avait pas un problème au niveau du module editor. Et j'ai bien une erreur de ce type :

Unable to retrieve XForms engine state. Please reload the current page. Note that you will lose any unsaved changes. Static state key: 7D0E2D1E-3D2F-82DC-1D3B-A9C495F7DF46, dynamic state key: AAE91060-1271-F3E8-9DDE-D1304BE34259

You may want to try one of the following:

  • Close this dialog and continue to use this page.
  • Reload this page. Note that you will lose any unsaved changes.
  • If the above does not work, try reloading the page yourself. Note that you will lose any unsaved changes:

    • With Firefox and Safari: hold down the shift key and click the Reload button in your browser toolbar.
    • With Internet Explorer: hold down the control key and click the Reload button in your browser toolbar.
  • Return home.
Le rechargement de la page n'arrange rien. Là, j'avoue que je sèche un peu....



Pour ce qui est des droits, j'ai repris la documentation nuxeo et d'esup-ecm pour avancer plus avant dans la configuration. Je pense pouvoir régler le problème.


>> Là je laisse un collègue plus compétent que moi sur ce module répondre.
Pour info, est-ce que l'erreur est aléatoire ou elle se présente toujours pour les mêmes fiches ? En gros, est-ce que lorsque l'erreur se produit, elle se produit toujours sur la fiche ?
Si oui, pouvez-vous nous envoyer une fiche d'exemple ?
Sur quel éditeur ça se passe ? Le dublin core ?

L'erreur était aléatoire sur l'éditeur dublin core. Je dis "était" car le redémarrage de l'application suite à une modification d'un fichier de configuration au niveau de l'éditeur a résolu le problème. Je n'ai plus de fiche exemple à vous montrer, mais l'éditeur apparaissait avec seulement les labels sans les fields.
Donc tout est bon là ?
Pour info, la version 1.6.4 du md-editor est sortie, vous pouvez basculer dessus si vous voulez.


Oui, tout est rentré dans l'ordre.

>> Si j'interprète bien ce que vous dites, les fiches sont toujours bien dans l'index, mais c'est dans le workflow qu'elles sembles disparues ? Elles apparaissent toujours bien dans le module search ? Avant de proposer une explication, pouvez-vous vous placer dans les sources du module workflow et lancer la commande suivante : ant local-reindexall Est-ce que vous revoyez vos fiches dans l'interface du workflow ?


Oui, merci ! Toutes les fiches sont revenues.

Encore merci pour votre aide.

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI
Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org


Le 20/12/10 14:55, Yohan Colmant a écrit :
Bonjour Stéphane,

Je réponds dans votre mail.

Le 18/12/2010 19:40, Stéphane Loret a écrit :
Bonjour,

Je suis totalement "newbie" dans la configuration et l'usage de l'application ORI-OAI et tout nouveau aussi sur cette liste que je suis pourtant depuis plus d'un an déjà. Je tiens d'abord à m'excuser de la longueur du message, de ses approximations, voire du caractère peut-être bénin de certaines erreurs ou de certaines questions mais, tout étant relatif, le côté newbie ressort ici puissamment tout cela participe de la prise en main de l'application ORI-OAI.

Avant de vous exposer ces quelques problèmes tels qu'indiqués dans le sujet de ce message, je souhaite vous présenter un peu le projet et le contexte technique dans lequel il s'inscrit. Au sein de la MSH de Tours, le projet crévilles.org vise à recenser la plupart des ressources électroniques couvrant la thématique des études urbaines et à permettre aux utilisateurs du site crevilles.org de pouvoir rechercher sur l'ensemble des ressources indexées qu'elles soient locales ou provenant de dépôts d'archives spécifiquement sélectionnés. Pour ce faire, nous avons choisis de mettre en place l'application ORI-OAI avec l'ensemble de ses modules, esup-ecm compris. Ce choix s'est porté sur cette application car sa modularité permettait de développer un projet de portage du module search vers une application CMS en php/mysql (en cours de développement). Le modèle serait celui de l'Institut de la Montagne. Pour ce qui est de l'installation de ORI-OAI dans le détail, çà donne çà :

- Sur un serveur physique Dell R710 avec 6To d'espace de stockage, 16 Go de RAM tourne un ESXI en version 4.1 dans lequel, pour l'instant, nous avons :

        - Une machine virtuelle sous debian 5 lenny dédiée à l'application ORI-OAI en version 1.6.1 et l'ensemble de ses modules. Cette machine présente les caractéristiques suivantes :
                - 3Go de RAM et un espace de 200 Go environ pour le tout (système et stockage)
                - tous les modules tournent dans un seul tomcat en version 6.0.24. Le lancement et le redémarrage du tomcat est géré par le daemon jsvc.
                - esup-ecm tourne dans un jboss.
                - Le déploiement des modules s'est opéré via les sources de chaque module
                - L'authentification s'effectue via un annuaire LDAP (OpenDS) propre à crévilles.org sous format SUPPANN. Pour l'instant, aucun rôle n'est réellement défini. Les 5 membres de l'équipe sont à la fois modérateur et créateur de chaque notice, dans l'attente d'un passage en production et une redéfinition des roles, si le besoin s'en fait sentir.

L'installation des modules d'ORI-OAI est fonctionnelle depuis pratiquement 15 jours maintenant et nous sommes en phase de test et de configuration pour que les modules répondent à nos besoins, principalement : le harvesting qui représente 90% actuellement des ressources que nous souhaitons proposer à nos utilisateurs et le dépôt, via esup-ecm et le module ori-oai-nuxeo (nuxeo DM en version 5.2) qui nous permet d'indexer les documents locaux (textes, images, sons et vidéos). Nous utilisons essentiellement le formulaire dc_easy pour indexer de la ressource documentaire [simple].
Pour être sûr, est-ce bien la dernière version que vous utilisez ?


Ce que nous avons fait et les problèmes que nous rencontrons :

HARVESTER

    - La première étape a été de tester le module Harvester en long, en large et en travers. Nous avons lancé des moissons manuellement et via le module de programmation sur des dépôts d'archives tels que Cairn, Revues.org, etc. La première programmation s'est déroulée avec quelques soucis : la base url d'un dépôt pointait une redirection sur une page html. L'erreur est relevée dans les logs mais cela a provoqué le down du module harvester pour toutes les autres programmations de moissonnage qui suivaient (erreur de type :

17 déc. 2010 06:07:16,217 [ WARN] catalina-exec-136 org.orioai.harvesting.dao.HarvestConfigDAO getLastReport - can't find last report for harvest Cairn - Histoire Urbaine.
etc...

Pire, il a fallu redémarré le tomcat pour reprendre la main sur le module et relancer les moissons manuellement. Le tomcat ne stoppait pas, bizarrement, nous avons deux daemon jsvc qui tournent comme s'il y avait deux instances d'un même tomcat alors qu'il n'en existe qu'un seul. Un kill des daemon nous a permis de reprendre la main et de relancer le tout. La question est alors de savoir s'il est normal que le module se plante quand, lors d'une tentative de moisson, il rencontre un problème du genre décrit plus haut. Y a-t-il une configuration spécifique sur un degré d'erreur qui permettrait de passer outre, de reporter sans compromettre la programmation de moisson ni l'activité même du module harvester ?
Là je pense que vous êtes tombés sur un cas malheureux où vous pointiez vers un entrepôt OAI qui n'en était pas un.
Il va falloir que nous regardions de notre côté pour ne plus que ça se passe mieux dans les prochaines versions.
Pouvez-vous nous donner l'URL que vous avez entrée et qui faisait planter ?

 - Toujours sur le plan Harvesting. Nous avions lancé des tests sur des dépôts sans pour autant prendre le soin de sélectionner des sets. On souhaiterait supprimer la totalité des fiches moissonnées sans qu'une réindexation ne puisse les ramener, bref, les supprimer définitivement de l'index, du workflow et de l'harvester. Nous avons essayé via le module indexing -> suppression manuelle des fiches -> suppression de toutes les fiches d'un entrepôt. La suppression se lance, mais elle reste figée. Aucune fiche n'a ensuite été supprimée et on les retrouve toutes dans l'index. La méthode visant à supprimer le dossier index puis de relancer l'indexation via le workflow et le module harvester ne résoud pas le problème. En gros, comment faire pour supprimer définitivement les fiches de ces dépôts ?
Ce que vous voulez faire, si je comprends bien, c'est bien de supprimer certaines fiches provenant d'une moisson, et qu'elles ne soient plus jamais remises dans l'index ?
A l'heure actuelle, sans moissonner des sets spécifiques où ces fiches ne sont pas présentes, ce n'est pas possible.

En revanche, c'est une tâche qui a déjà été identifiée et qui sera réalisée dans la version 2 de ORI-OAI.


- Pour cette partie, il s'agit d'une demande. J'ai lu dans les messages de la liste qu'une personne souhaitait remonter une fiche issue d'une moisson dans le workflow afin d'obtenir des informations sur les métadonnées d'un champ. Dans le cas qui est le nôtre, nous aurions besoin de pouvoir ré-indexer tout ou partie de la couche oai issue des publications de notre site web crevilles.org et de sélectionner ce qui peut être publier au niveau du module de repository. Est-il possible de le faire et, si tel est le cas, comment procéder ?
Là je ne comprends pas bien votre demande.
Voulez-vous modifier des fiches que vous avez moissonnées et les exposer ensuite en OAI ?
Voulez-vous exposer une partie des fiches moissonnées sans les modifiées ?
Ou une partie des fiches que vous produisez ?
Dans ce cas, comment vous identifiez lesquelles exposer et lesquelles ne pas exposer ? Il y a un mécanisme pour ça qui repose sur les métadonnées. Par exemple, que les fiches qui contiennent tel mot dans le titre.

Vous pouvez expliquer plus en détail svp ?

NUXEO - WORKFLOW

- Nous stockons donc nos documents via nuxeo esup-ecm. Le problème est qu'après archivage du document, le formulaire md-editor qui s'ouvre ne récupère pas la description remplie dans une premier temps au niveau de nuxeo, alors que tous les autres champs reprennent bien l'ensemble des données. Une fois que le formulaire est validé, que le document est publié au niveau du workflow et indexé via le module indexing, le lien généré par nuxeo pointe un document qui est inaccessible pour les utilisateurs qui n'ont pas les droits d'accès au module nuxeo. Comment faire pour que le lien généré permette l'accès au document plein texte à l'utilisateur lambda, notamment quand ce dernier utilise le module search sur les documents locaux ?
Vous êtes sur un ESUP-ECM ou alors un Nuxeo que vous avez installé en dehors de ORI-OAI ?
Si c'est bien ESUP-ECM, je ne comprends pas à quel endroit vous avez saisi la description dont vous parlez ? Le titre quant à lui est bien rempli dans la fiche de métadonnées du module md-editor par exemple ?

Pour les droits d'accès, il faudrait voir un peu plus en détail comment fonctionne Nuxeo / ESUP-ECM.
En effet, les documents doivent être publiés dans des sections. Ce sont les droits sur les sections qui définissent les droits d'accès aux documents y étant publiés.

En gros, vous devez créer une section "Documents publics", définir un droit d'accès en lecture à l'utilisateur "invite" et publier les documents dans cette section.
Vous voyez ?

- D'autre part, au niveau du workflow, nous avons parfois des erreurs lors du chargement du formulaire : les labels sont bien présents mais les champs ont disparu. L'erreur suivante est générée :

2010-12-18 17:05:48,894 ERROR XFormsServer  -                       xforms-submit-error - setting throwable {throwable: "org.orbeon.oxf.xforms.submission.XFormsSubmissionException:  (processing submission response): xforms:submission for submission id: fr-get-document-submission, error code received when submitting instance: 500
null, line -1, column -1: xforms:submission for submission id: fr-get-document-submission, error code received when submitting instance: 500
    at org.orbeon.oxf.xforms.submission.XFormsModelSubmission.getReplacer(XFormsModelSubmission.java:599)
    at org.orbeon.oxf.xforms.submission.RegularSubmission$1.call(RegularSubmission.java:97)
Là je laisse un collègue plus compétent que moi sur ce module répondre.
Pour info, est-ce que l'erreur est aléatoire ou elle se présente toujours pour les mêmes fiches ? En gros, est-ce que lorsque l'erreur se produit, elle se produit toujours sur la fiche ?
Si oui, pouvez-vous nous envoyer une fiche d'exemple ?
Sur quel éditeur ça se passe ? Le dublin core ?
   

- Enfin, dernière erreur qui nous préoccupe : nous avions indexé une dizaine de documents et tout se passait à peu près bien (excepté les problèmes de formulaire). Les documents étaient publiés et ils étaient présents dans le module search et le module indexing. Sans comprendre comment, la liste des resssources en traitement ou traitées a disparu et aucun lien n'est présent dans cette partie du workflow. Le problème est que nous n'avons pas d'erreur, du moins pas en rapport avec ce module. Est-il possible que ce problème soit en lien avec les problèmes que l'on rencontre avec le formulaire et Orbeon ? Comment faire pour retrouver les liens et nous permettre de gérer les documents publiés ?
Si j'interprète bien ce que vous dites, les fiches sont toujours bien dans l'index, mais c'est dans le workflow qu'elles sembles disparues ? Elles apparaissent toujours bien dans le module search ?

Avant de proposer une explication, pouvez-vous vous placer dans les sources du module workflow et lancer la commande suivante :
ant local-reindexall

Est-ce que vous revoyez vos fiches dans l'interface du workflow ?

Bien cordialement et avec toutes mes excuses pour la longueur du message.

Merci.
Bonnes fêtes également,

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI
Je vous souhaite d'agréables fêtes.

Stéphane LORET
MSH - TOURS
Crévilles.org







stephaneloret
Bonjour Yohan,

Merci pour votre réponse. J'essaie de vous apporter le maximum d'information ci-après :


>> Pour être sûr, est-ce bien la dernière version que vous utilisez ?

- Version d'ORI-OAI installée  : Dans le détail, on a çà :
    - module Harvester : 1.6.2
    - module Md-Editor : 1.6.3
    - module Indexing : 1.6.1
    - Version esup-ecm : 1.1.2 avec nuxeo DM 5.2, mais le jboss.dir dans build.properties du module ori-oai-nuxeo indique une version 5.3.1 de nuxeo DM.
    - module repository : 1.6.2
    - module vocabulary : 1.6.2
    - module workflow : 1.6.3
    - module search : 1.6.2

>> Là je pense que vous êtes tombés sur un cas malheureux où vous pointiez vers un entrepôt OAI qui n'en était pas un.
Il va falloir que nous regardions de notre côté pour ne plus que ça se passe mieux dans les prochaines versions.
Pouvez-vous nous donner l'URL que vous avez entrée et qui faisait planter ?

Oui, en effet, après vérification, la base url du dépôt pointait une redirection sur une page html. La base url qui a fait planter le module : http://ir.ub.rug.nl/dspace-oai/request?verb=Identify

>> Ce que vous voulez faire, si je comprends bien, c'est bien de supprimer certaines fiches provenant d'une moisson, et qu'elles ne soient plus jamais remises dans l'index ?
A l'heure actuelle, sans moissonner des sets spécifiques où ces fiches ne sont pas présentes, ce n'est pas possible. En revanche, c'est une tâche qui a déjà été identifiée et qui sera réalisée dans la version 2 de ORI-OAI.

Oui, c'est tout à fait cela, voire même l'ensemble d'un dépôt. Je prends l'exemple de Canal-u : nous avons fait des tests sur le dépôt, mais nous souhaiterions maintenant retirer tout ce qui à trait à Canal-U, idem pour Revues.org, ne prendre en compte que les collections

>> Là je ne comprends pas bien votre demande.
Voulez-vous modifier des fiches que vous avez moissonnées et les exposer ensuite en OAI ?
Voulez-vous exposer une partie des fiches moissonnées sans les modifiées ?
Ou une partie des fiches que vous produisez ?
Dans ce cas, comment vous identifiez lesquelles exposer et lesquelles ne pas exposer ? Il y a un mécanisme pour ça qui repose sur les métadonnées. Par exemple, que les fiches qui contiennent tel mot dans le titre.

Cette demande est un peu particulière, je le conçois bien. Parmi les questions que vous me posez, celle qui est en rapport direct avec notre souhait est la première : modifier des fiches moissonnées pour les exposer ensuite en OAI. La couche oai actuellement en place pour le site crevilles.org porte sur la totalité du site. Nous souhaitons pouvoir, à la fin de la journée de veille ou le lendemain, ramener ce contenu au niveau du module Harvester et choisir, voire modifier, ce qui sera exposé en OAI. Il est difficile, à l'heure actuelle, de préciser globalement si telle ou telle section du site (en gros ce qui deviendra par la suite des sets au niveau de la couche), doit ou ne doit pas être exposé. Par exemple : nous ne souhaitons pas que l'actualité des études urbaines dans crévilles soit exposée, mais il est possible qu'un item dans cette catégorie de contenu déroge à la règle. Je ne sais donc pas si c'est faisable dans l'état actuel des choses ni si cela correspond ou non aux bonnes pratiques. Mais, dans un premier temps, et à la mesure des possibilités offertes, en tous les cas, nous pourrions procéder de cette manière.


>> Vous êtes sur un ESUP-ECM ou alors un Nuxeo que vous avez installé en dehors de ORI-OAI ?
Si c'est bien ESUP-ECM, je ne comprends pas à quel endroit vous avez saisi la description dont vous parlez ? Le titre quant à lui est bien rempli dans la fiche de métadonnées du module md-editor par exemple ?

Pour les droits d'accès, il faudrait voir un peu plus en détail comment fonctionne Nuxeo / ESUP-ECM.
En effet, les documents doivent être publiés dans des sections. Ce sont les droits sur les sections qui définissent les droits d'accès aux documents y étant publiés.

En gros, vous devez créer une section "Documents publics", définir un droit d'accès en lecture à l'utilisateur "invite" et publier les documents dans cette section.
Vous voyez ?


Nous sommes sur un ESUP-ECM. Quand un créateur charge un document, il y a deux champs, titre et description. Une fois que le document est archivé, le lien présent dans l'onglet référencement permet d'ouvrir un formulaire dc_easy pour que nous puissions ensuite reverser ce document dans les ressources locales. QUand le formulaire md-editor s'ouvre, on retrouve bien le titre, le type de document (pdf, etc...), mais dans la partie description (dc.description), celle qui était précisée au niveau d'esup_ecm n'apparaît pas. Cette absence n'est pas systématique car nous avons fait des essais avec des documents de différents formats, différentes tailles pour que nous puissions affinés nos réglages et la partie description dans le formulaire md-editor est parfois remplie, parfois non. Elle l'est pour des documents de type vidéo par exemple, mais elle ne l'est pas pour des pdfs. Et même sur les pdfs, c'est variable. Dans les proportions, on dira que cette partie est incomplète dans 80% des cas sur le peu de tests que nous avons faits (une dizaine de documents pour l'instant).

Pour ce qui est des droits, j'ai repris la documentation nuxeo et d'esup-ecm pour avancer plus avant dans la configuration. Je pense pouvoir régler le problème.


>> Là je laisse un collègue plus compétent que moi sur ce module répondre.
Pour info, est-ce que l'erreur est aléatoire ou elle se présente toujours pour les mêmes fiches ? En gros, est-ce que lorsque l'erreur se produit, elle se produit toujours sur la fiche ?
Si oui, pouvez-vous nous envoyer une fiche d'exemple ?
Sur quel éditeur ça se passe ? Le dublin core ?

L'erreur était aléatoire sur l'éditeur dublin core. Je dis "était" car le redémarrage de l'application suite à une modification d'un fichier de configuration au niveau de l'éditeur a résolu le problème. Je n'ai plus de fiche exemple à vous montrer, mais l'éditeur apparaissait avec seulement les labels sans les fields.

>> Si j'interprète bien ce que vous dites, les fiches sont toujours bien dans l'index, mais c'est dans le workflow qu'elles sembles disparues ? Elles apparaissent toujours bien dans le module search ? Avant de proposer une explication, pouvez-vous vous placer dans les sources du module workflow et lancer la commande suivante : ant local-reindexall Est-ce que vous revoyez vos fiches dans l'interface du workflow ?


Oui, merci ! Toutes les fiches sont revenues.

Encore merci pour votre aide.

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org


Le 20/12/10 14:55, Yohan Colmant a écrit :
Bonjour Stéphane,

Je réponds dans votre mail.

Le 18/12/2010 19:40, Stéphane Loret a écrit :
Bonjour,

Je suis totalement "newbie" dans la configuration et l'usage de l'application ORI-OAI et tout nouveau aussi sur cette liste que je suis pourtant depuis plus d'un an déjà. Je tiens d'abord à m'excuser de la longueur du message, de ses approximations, voire du caractère peut-être bénin de certaines erreurs ou de certaines questions mais, tout étant relatif, le côté newbie ressort ici puissamment tout cela participe de la prise en main de l'application ORI-OAI.

Avant de vous exposer ces quelques problèmes tels qu'indiqués dans le sujet de ce message, je souhaite vous présenter un peu le projet et le contexte technique dans lequel il s'inscrit. Au sein de la MSH de Tours, le projet crévilles.org vise à recenser la plupart des ressources électroniques couvrant la thématique des études urbaines et à permettre aux utilisateurs du site crevilles.org de pouvoir rechercher sur l'ensemble des ressources indexées qu'elles soient locales ou provenant de dépôts d'archives spécifiquement sélectionnés. Pour ce faire, nous avons choisis de mettre en place l'application ORI-OAI avec l'ensemble de ses modules, esup-ecm compris. Ce choix s'est porté sur cette application car sa modularité permettait de développer un projet de portage du module search vers une application CMS en php/mysql (en cours de développement). Le modèle serait celui de l'Institut de la Montagne. Pour ce qui est de l'installation de ORI-OAI dans le détail, çà donne çà :

- Sur un serveur physique Dell R710 avec 6To d'espace de stockage, 16 Go de RAM tourne un ESXI en version 4.1 dans lequel, pour l'instant, nous avons :

        - Une machine virtuelle sous debian 5 lenny dédiée à l'application ORI-OAI en version 1.6.1 et l'ensemble de ses modules. Cette machine présente les caractéristiques suivantes :
                - 3Go de RAM et un espace de 200 Go environ pour le tout (système et stockage)
                - tous les modules tournent dans un seul tomcat en version 6.0.24. Le lancement et le redémarrage du tomcat est géré par le daemon jsvc.
                - esup-ecm tourne dans un jboss.
                - Le déploiement des modules s'est opéré via les sources de chaque module
                - L'authentification s'effectue via un annuaire LDAP (OpenDS) propre à crévilles.org sous format SUPPANN. Pour l'instant, aucun rôle n'est réellement défini. Les 5 membres de l'équipe sont à la fois modérateur et créateur de chaque notice, dans l'attente d'un passage en production et une redéfinition des roles, si le besoin s'en fait sentir.

L'installation des modules d'ORI-OAI est fonctionnelle depuis pratiquement 15 jours maintenant et nous sommes en phase de test et de configuration pour que les modules répondent à nos besoins, principalement : le harvesting qui représente 90% actuellement des ressources que nous souhaitons proposer à nos utilisateurs et le dépôt, via esup-ecm et le module ori-oai-nuxeo (nuxeo DM en version 5.2) qui nous permet d'indexer les documents locaux (textes, images, sons et vidéos). Nous utilisons essentiellement le formulaire dc_easy pour indexer de la ressource documentaire [simple].
Pour être sûr, est-ce bien la dernière version que vous utilisez ?


Ce que nous avons fait et les problèmes que nous rencontrons :

HARVESTER

    - La première étape a été de tester le module Harvester en long, en large et en travers. Nous avons lancé des moissons manuellement et via le module de programmation sur des dépôts d'archives tels que Cairn, Revues.org, etc. La première programmation s'est déroulée avec quelques soucis : la base url d'un dépôt pointait une redirection sur une page html. L'erreur est relevée dans les logs mais cela a provoqué le down du module harvester pour toutes les autres programmations de moissonnage qui suivaient (erreur de type :

17 déc. 2010 06:07:16,217 [ WARN] catalina-exec-136 org.orioai.harvesting.dao.HarvestConfigDAO getLastReport - can't find last report for harvest Cairn - Histoire Urbaine.
etc...

Pire, il a fallu redémarré le tomcat pour reprendre la main sur le module et relancer les moissons manuellement. Le tomcat ne stoppait pas, bizarrement, nous avons deux daemon jsvc qui tournent comme s'il y avait deux instances d'un même tomcat alors qu'il n'en existe qu'un seul. Un kill des daemon nous a permis de reprendre la main et de relancer le tout. La question est alors de savoir s'il est normal que le module se plante quand, lors d'une tentative de moisson, il rencontre un problème du genre décrit plus haut. Y a-t-il une configuration spécifique sur un degré d'erreur qui permettrait de passer outre, de reporter sans compromettre la programmation de moisson ni l'activité même du module harvester ?
Là je pense que vous êtes tombés sur un cas malheureux où vous pointiez vers un entrepôt OAI qui n'en était pas un.
Il va falloir que nous regardions de notre côté pour ne plus que ça se passe mieux dans les prochaines versions.
Pouvez-vous nous donner l'URL que vous avez entrée et qui faisait planter ?

 - Toujours sur le plan Harvesting. Nous avions lancé des tests sur des dépôts sans pour autant prendre le soin de sélectionner des sets. On souhaiterait supprimer la totalité des fiches moissonnées sans qu'une réindexation ne puisse les ramener, bref, les supprimer définitivement de l'index, du workflow et de l'harvester. Nous avons essayé via le module indexing -> suppression manuelle des fiches -> suppression de toutes les fiches d'un entrepôt. La suppression se lance, mais elle reste figée. Aucune fiche n'a ensuite été supprimée et on les retrouve toutes dans l'index. La méthode visant à supprimer le dossier index puis de relancer l'indexation via le workflow et le module harvester ne résoud pas le problème. En gros, comment faire pour supprimer définitivement les fiches de ces dépôts ?
Ce que vous voulez faire, si je comprends bien, c'est bien de supprimer certaines fiches provenant d'une moisson, et qu'elles ne soient plus jamais remises dans l'index ?
A l'heure actuelle, sans moissonner des sets spécifiques où ces fiches ne sont pas présentes, ce n'est pas possible.

En revanche, c'est une tâche qui a déjà été identifiée et qui sera réalisée dans la version 2 de ORI-OAI.


- Pour cette partie, il s'agit d'une demande. J'ai lu dans les messages de la liste qu'une personne souhaitait remonter une fiche issue d'une moisson dans le workflow afin d'obtenir des informations sur les métadonnées d'un champ. Dans le cas qui est le nôtre, nous aurions besoin de pouvoir ré-indexer tout ou partie de la couche oai issue des publications de notre site web crevilles.org et de sélectionner ce qui peut être publier au niveau du module de repository. Est-il possible de le faire et, si tel est le cas, comment procéder ?
Là je ne comprends pas bien votre demande.
Voulez-vous modifier des fiches que vous avez moissonnées et les exposer ensuite en OAI ?
Voulez-vous exposer une partie des fiches moissonnées sans les modifiées ?
Ou une partie des fiches que vous produisez ?
Dans ce cas, comment vous identifiez lesquelles exposer et lesquelles ne pas exposer ? Il y a un mécanisme pour ça qui repose sur les métadonnées. Par exemple, que les fiches qui contiennent tel mot dans le titre.

Vous pouvez expliquer plus en détail svp ?

NUXEO - WORKFLOW

- Nous stockons donc nos documents via nuxeo esup-ecm. Le problème est qu'après archivage du document, le formulaire md-editor qui s'ouvre ne récupère pas la description remplie dans une premier temps au niveau de nuxeo, alors que tous les autres champs reprennent bien l'ensemble des données. Une fois que le formulaire est validé, que le document est publié au niveau du workflow et indexé via le module indexing, le lien généré par nuxeo pointe un document qui est inaccessible pour les utilisateurs qui n'ont pas les droits d'accès au module nuxeo. Comment faire pour que le lien généré permette l'accès au document plein texte à l'utilisateur lambda, notamment quand ce dernier utilise le module search sur les documents locaux ?
Vous êtes sur un ESUP-ECM ou alors un Nuxeo que vous avez installé en dehors de ORI-OAI ?
Si c'est bien ESUP-ECM, je ne comprends pas à quel endroit vous avez saisi la description dont vous parlez ? Le titre quant à lui est bien rempli dans la fiche de métadonnées du module md-editor par exemple ?

Pour les droits d'accès, il faudrait voir un peu plus en détail comment fonctionne Nuxeo / ESUP-ECM.
En effet, les documents doivent être publiés dans des sections. Ce sont les droits sur les sections qui définissent les droits d'accès aux documents y étant publiés.

En gros, vous devez créer une section "Documents publics", définir un droit d'accès en lecture à l'utilisateur "invite" et publier les documents dans cette section.
Vous voyez ?

- D'autre part, au niveau du workflow, nous avons parfois des erreurs lors du chargement du formulaire : les labels sont bien présents mais les champs ont disparu. L'erreur suivante est générée :

2010-12-18 17:05:48,894 ERROR XFormsServer  -                       xforms-submit-error - setting throwable {throwable: "org.orbeon.oxf.xforms.submission.XFormsSubmissionException:  (processing submission response): xforms:submission for submission id: fr-get-document-submission, error code received when submitting instance: 500
null, line -1, column -1: xforms:submission for submission id: fr-get-document-submission, error code received when submitting instance: 500
    at org.orbeon.oxf.xforms.submission.XFormsModelSubmission.getReplacer(XFormsModelSubmission.java:599)
    at org.orbeon.oxf.xforms.submission.RegularSubmission$1.call(RegularSubmission.java:97)
Là je laisse un collègue plus compétent que moi sur ce module répondre.
Pour info, est-ce que l'erreur est aléatoire ou elle se présente toujours pour les mêmes fiches ? En gros, est-ce que lorsque l'erreur se produit, elle se produit toujours sur la fiche ?
Si oui, pouvez-vous nous envoyer une fiche d'exemple ?
Sur quel éditeur ça se passe ? Le dublin core ?
   

- Enfin, dernière erreur qui nous préoccupe : nous avions indexé une dizaine de documents et tout se passait à peu près bien (excepté les problèmes de formulaire). Les documents étaient publiés et ils étaient présents dans le module search et le module indexing. Sans comprendre comment, la liste des resssources en traitement ou traitées a disparu et aucun lien n'est présent dans cette partie du workflow. Le problème est que nous n'avons pas d'erreur, du moins pas en rapport avec ce module. Est-il possible que ce problème soit en lien avec les problèmes que l'on rencontre avec le formulaire et Orbeon ? Comment faire pour retrouver les liens et nous permettre de gérer les documents publiés ?
Si j'interprète bien ce que vous dites, les fiches sont toujours bien dans l'index, mais c'est dans le workflow qu'elles sembles disparues ? Elles apparaissent toujours bien dans le module search ?

Avant de proposer une explication, pouvez-vous vous placer dans les sources du module workflow et lancer la commande suivante :
ant local-reindexall

Est-ce que vous revoyez vos fiches dans l'interface du workflow ?

Bien cordialement et avec toutes mes excuses pour la longueur du message.

Merci.
Bonnes fêtes également,

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI
Je vous souhaite d'agréables fêtes.

Stéphane LORET
MSH - TOURS
Crévilles.org






Yohan Colmant
Bonjour Stéphane,

Je réponds dans votre mail.

Le 18/12/2010 19:40, Stéphane Loret a écrit :
Bonjour,

Je suis totalement "newbie" dans la configuration et l'usage de l'application ORI-OAI et tout nouveau aussi sur cette liste que je suis pourtant depuis plus d'un an déjà. Je tiens d'abord à m'excuser de la longueur du message, de ses approximations, voire du caractère peut-être bénin de certaines erreurs ou de certaines questions mais, tout étant relatif, le côté newbie ressort ici puissamment tout cela participe de la prise en main de l'application ORI-OAI.

Avant de vous exposer ces quelques problèmes tels qu'indiqués dans le sujet de ce message, je souhaite vous présenter un peu le projet et le contexte technique dans lequel il s'inscrit. Au sein de la MSH de Tours, le projet crévilles.org vise à recenser la plupart des ressources électroniques couvrant la thématique des études urbaines et à permettre aux utilisateurs du site crevilles.org de pouvoir rechercher sur l'ensemble des ressources indexées qu'elles soient locales ou provenant de dépôts d'archives spécifiquement sélectionnés. Pour ce faire, nous avons choisis de mettre en place l'application ORI-OAI avec l'ensemble de ses modules, esup-ecm compris. Ce choix s'est porté sur cette application car sa modularité permettait de développer un projet de portage du module search vers une application CMS en php/mysql (en cours de développement). Le modèle serait celui de l'Institut de la Montagne. Pour ce qui est de l'installation de ORI-OAI dans le détail, çà donne çà :

- Sur un serveur physique Dell R710 avec 6To d'espace de stockage, 16 Go de RAM tourne un ESXI en version 4.1 dans lequel, pour l'instant, nous avons :

        - Une machine virtuelle sous debian 5 lenny dédiée à l'application ORI-OAI en version 1.6.1 et l'ensemble de ses modules. Cette machine présente les caractéristiques suivantes :
                - 3Go de RAM et un espace de 200 Go environ pour le tout (système et stockage)
                - tous les modules tournent dans un seul tomcat en version 6.0.24. Le lancement et le redémarrage du tomcat est géré par le daemon jsvc.
                - esup-ecm tourne dans un jboss.
                - Le déploiement des modules s'est opéré via les sources de chaque module
                - L'authentification s'effectue via un annuaire LDAP (OpenDS) propre à crévilles.org sous format SUPPANN. Pour l'instant, aucun rôle n'est réellement défini. Les 5 membres de l'équipe sont à la fois modérateur et créateur de chaque notice, dans l'attente d'un passage en production et une redéfinition des roles, si le besoin s'en fait sentir.

L'installation des modules d'ORI-OAI est fonctionnelle depuis pratiquement 15 jours maintenant et nous sommes en phase de test et de configuration pour que les modules répondent à nos besoins, principalement : le harvesting qui représente 90% actuellement des ressources que nous souhaitons proposer à nos utilisateurs et le dépôt, via esup-ecm et le module ori-oai-nuxeo (nuxeo DM en version 5.2) qui nous permet d'indexer les documents locaux (textes, images, sons et vidéos). Nous utilisons essentiellement le formulaire dc_easy pour indexer de la ressource documentaire [simple].
Pour être sûr, est-ce bien la dernière version que vous utilisez ?


Ce que nous avons fait et les problèmes que nous rencontrons :

HARVESTER

    - La première étape a été de tester le module Harvester en long, en large et en travers. Nous avons lancé des moissons manuellement et via le module de programmation sur des dépôts d'archives tels que Cairn, Revues.org, etc. La première programmation s'est déroulée avec quelques soucis : la base url d'un dépôt pointait une redirection sur une page html. L'erreur est relevée dans les logs mais cela a provoqué le down du module harvester pour toutes les autres programmations de moissonnage qui suivaient (erreur de type :

17 déc. 2010 06:07:16,217 [ WARN] catalina-exec-136 org.orioai.harvesting.dao.HarvestConfigDAO getLastReport - can't find last report for harvest Cairn - Histoire Urbaine.
etc...

Pire, il a fallu redémarré le tomcat pour reprendre la main sur le module et relancer les moissons manuellement. Le tomcat ne stoppait pas, bizarrement, nous avons deux daemon jsvc qui tournent comme s'il y avait deux instances d'un même tomcat alors qu'il n'en existe qu'un seul. Un kill des daemon nous a permis de reprendre la main et de relancer le tout. La question est alors de savoir s'il est normal que le module se plante quand, lors d'une tentative de moisson, il rencontre un problème du genre décrit plus haut. Y a-t-il une configuration spécifique sur un degré d'erreur qui permettrait de passer outre, de reporter sans compromettre la programmation de moisson ni l'activité même du module harvester ?
Là je pense que vous êtes tombés sur un cas malheureux où vous pointiez vers un entrepôt OAI qui n'en était pas un.
Il va falloir que nous regardions de notre côté pour ne plus que ça se passe mieux dans les prochaines versions.
Pouvez-vous nous donner l'URL que vous avez entrée et qui faisait planter ?

 - Toujours sur le plan Harvesting. Nous avions lancé des tests sur des dépôts sans pour autant prendre le soin de sélectionner des sets. On souhaiterait supprimer la totalité des fiches moissonnées sans qu'une réindexation ne puisse les ramener, bref, les supprimer définitivement de l'index, du workflow et de l'harvester. Nous avons essayé via le module indexing -> suppression manuelle des fiches -> suppression de toutes les fiches d'un entrepôt. La suppression se lance, mais elle reste figée. Aucune fiche n'a ensuite été supprimée et on les retrouve toutes dans l'index. La méthode visant à supprimer le dossier index puis de relancer l'indexation via le workflow et le module harvester ne résoud pas le problème. En gros, comment faire pour supprimer définitivement les fiches de ces dépôts ?
Ce que vous voulez faire, si je comprends bien, c'est bien de supprimer certaines fiches provenant d'une moisson, et qu'elles ne soient plus jamais remises dans l'index ?
A l'heure actuelle, sans moissonner des sets spécifiques où ces fiches ne sont pas présentes, ce n'est pas possible.

En revanche, c'est une tâche qui a déjà été identifiée et qui sera réalisée dans la version 2 de ORI-OAI.


- Pour cette partie, il s'agit d'une demande. J'ai lu dans les messages de la liste qu'une personne souhaitait remonter une fiche issue d'une moisson dans le workflow afin d'obtenir des informations sur les métadonnées d'un champ. Dans le cas qui est le nôtre, nous aurions besoin de pouvoir ré-indexer tout ou partie de la couche oai issue des publications de notre site web crevilles.org et de sélectionner ce qui peut être publier au niveau du module de repository. Est-il possible de le faire et, si tel est le cas, comment procéder ?
Là je ne comprends pas bien votre demande.
Voulez-vous modifier des fiches que vous avez moissonnées et les exposer ensuite en OAI ?
Voulez-vous exposer une partie des fiches moissonnées sans les modifiées ?
Ou une partie des fiches que vous produisez ?
Dans ce cas, comment vous identifiez lesquelles exposer et lesquelles ne pas exposer ? Il y a un mécanisme pour ça qui repose sur les métadonnées. Par exemple, que les fiches qui contiennent tel mot dans le titre.

Vous pouvez expliquer plus en détail svp ?

NUXEO - WORKFLOW

- Nous stockons donc nos documents via nuxeo esup-ecm. Le problème est qu'après archivage du document, le formulaire md-editor qui s'ouvre ne récupère pas la description remplie dans une premier temps au niveau de nuxeo, alors que tous les autres champs reprennent bien l'ensemble des données. Une fois que le formulaire est validé, que le document est publié au niveau du workflow et indexé via le module indexing, le lien généré par nuxeo pointe un document qui est inaccessible pour les utilisateurs qui n'ont pas les droits d'accès au module nuxeo. Comment faire pour que le lien généré permette l'accès au document plein texte à l'utilisateur lambda, notamment quand ce dernier utilise le module search sur les documents locaux ?
Vous êtes sur un ESUP-ECM ou alors un Nuxeo que vous avez installé en dehors de ORI-OAI ?
Si c'est bien ESUP-ECM, je ne comprends pas à quel endroit vous avez saisi la description dont vous parlez ? Le titre quant à lui est bien rempli dans la fiche de métadonnées du module md-editor par exemple ?

Pour les droits d'accès, il faudrait voir un peu plus en détail comment fonctionne Nuxeo / ESUP-ECM.
En effet, les documents doivent être publiés dans des sections. Ce sont les droits sur les sections qui définissent les droits d'accès aux documents y étant publiés.

En gros, vous devez créer une section "Documents publics", définir un droit d'accès en lecture à l'utilisateur "invite" et publier les documents dans cette section.
Vous voyez ?

- D'autre part, au niveau du workflow, nous avons parfois des erreurs lors du chargement du formulaire : les labels sont bien présents mais les champs ont disparu. L'erreur suivante est générée :

2010-12-18 17:05:48,894 ERROR XFormsServer  -                       xforms-submit-error - setting throwable {throwable: "org.orbeon.oxf.xforms.submission.XFormsSubmissionException:  (processing submission response): xforms:submission for submission id: fr-get-document-submission, error code received when submitting instance: 500
null, line -1, column -1: xforms:submission for submission id: fr-get-document-submission, error code received when submitting instance: 500
    at org.orbeon.oxf.xforms.submission.XFormsModelSubmission.getReplacer(XFormsModelSubmission.java:599)
    at org.orbeon.oxf.xforms.submission.RegularSubmission$1.call(RegularSubmission.java:97)
Là je laisse un collègue plus compétent que moi sur ce module répondre.
Pour info, est-ce que l'erreur est aléatoire ou elle se présente toujours pour les mêmes fiches ? En gros, est-ce que lorsque l'erreur se produit, elle se produit toujours sur la fiche ?
Si oui, pouvez-vous nous envoyer une fiche d'exemple ?
Sur quel éditeur ça se passe ? Le dublin core ?
   

- Enfin, dernière erreur qui nous préoccupe : nous avions indexé une dizaine de documents et tout se passait à peu près bien (excepté les problèmes de formulaire). Les documents étaient publiés et ils étaient présents dans le module search et le module indexing. Sans comprendre comment, la liste des resssources en traitement ou traitées a disparu et aucun lien n'est présent dans cette partie du workflow. Le problème est que nous n'avons pas d'erreur, du moins pas en rapport avec ce module. Est-il possible que ce problème soit en lien avec les problèmes que l'on rencontre avec le formulaire et Orbeon ? Comment faire pour retrouver les liens et nous permettre de gérer les documents publiés ?
Si j'interprète bien ce que vous dites, les fiches sont toujours bien dans l'index, mais c'est dans le workflow qu'elles sembles disparues ? Elles apparaissent toujours bien dans le module search ?

Avant de proposer une explication, pouvez-vous vous placer dans les sources du module workflow et lancer la commande suivante :
ant local-reindexall

Est-ce que vous revoyez vos fiches dans l'interface du workflow ?

Bien cordialement et avec toutes mes excuses pour la longueur du message.

Merci.
Bonnes fêtes également,

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI
Je vous souhaite d'agréables fêtes.

Stéphane LORET
MSH - TOURS
Crévilles.org





Options d'affichage des commentaires

Sélectionnez la méthode d'affichage des commentaires que vous préférez, puis cliquez sur « Enregistrer les paramètres » pour activer vos changements.
Sujet clos