{Disarmed} Problème de suppression de moisson

  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:d11c2ac4e9b557536234c7cfa98c9ea0' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <title></title>\n </head>\n <body text=\"#000000\" bgcolor=\"#ffffff\">\n <font size=\"-1\"><font face=\"Verdana\">Bonjour,<br>\n </div>', created = 1507746252, expire = 1507832652, headers = '', serialized = 0 WHERE cid = '4:d11c2ac4e9b557536234c7cfa98c9ea0' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:d11c2ac4e9b557536234c7cfa98c9ea0' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <title></title>\n </head>\n <body text=\"#000000\" bgcolor=\"#ffffff\">\n <font size=\"-1\"><font face=\"Verdana\">Bonjour,<br>\n </div>', created = 1507746252, expire = 1507832652, headers = '', serialized = 0 WHERE cid = '4:d11c2ac4e9b557536234c7cfa98c9ea0' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:dc24d232a59e7d59960c766113ba335b' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <title></title>\n </head>\n <body bgcolor=\"#ffffff\" text=\"#000000\">\n Bonjour Yohan,<br>\n <br>\n Je n\'ai malheureusement plus les logs du module indexing. Mais j\'ai\n suivi la proc&eacute;dure telle que vous la d&eacute;crivez pour retrouver un\n index \"propre\". Ce que je sais d&eacute;sormais, c\'est que l\'index est\n bloqu&eacute; quand le job de gestion de liens et de crawling est lanc&eacute;,\n lequel, dans sa configuration initiale, effectuait une indexation\n plein texte qui, d\'une part, &eacute;tait extr&ecirc;mement longue et, d\'autre\n part, renvoyait une tonne d\'erreur sur les documents eux-m&ecirc;mes. J\'ai\n donc r&eacute;duit la t&acirc;che &agrave; la seule gestion de liens que je voudrais\n programmer afin que celle-ci ne se lance pas tous les jours mais une\n &agrave; deux fois par semaine (je pense que, dans notre cas, c\'est\n suffisant et on verra ensuite &agrave; l\'usage). Depuis que j\'ai modifi&eacute;\n cette configuration, tout se passe bien au niveau de l\'indexing et\n du harvester, en tous les cas, je n\'ai pas l\'impression qu\'ils\n continuent &agrave; se marcher sur les pieds.<br>\n <br>\n Bien cordialement<br>\n <br>\n St&eacute;phane Loret<br>\n MSH - Tours<br>\n Cr&eacute;villes.org<br>\n <br>\n <br>\n Le 21/01/11 09:23, Yohan Colmant a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <font size=\"-1\"><font face=\"Verdana\">Bonjour,<br>\n <br>\n Effectivement, on dirait que l\'erreur se passe du c&ocirc;t&eacute; de\n l\'indexing.<br>\n Est-ce que vous avez des logs en erreur dans ce module au\n moment o&ugrave; vous tentez de supprimer la r&eacute;colte ?<br>\n <br>\n Je me demande si votre pr&eacute;c&eacute;dent test n\'a pas corrompu\n l\'index. En effet, ce n\'est pas forc&eacute;ment un cas d\'utilisation\n que nous avions pr&eacute;vu : vous avez tent&eacute; de supprimer des\n fiches en cours de mise &agrave; jour (le crawling fait une mise &agrave;\n jour de la fiche dans l\'index).<br>\n Nous avons not&eacute; ce point comme important &agrave; r&eacute;gler dans les\n t&acirc;ches de d&eacute;veloppement de la V2 pour ne plus que &ccedil;a se\n produise dans cette nouvelle version.<br>\n <br>\n Pour voir si le soucis vient de l&agrave;, vous pouvez :<br>\n 1) r&eacute;initialiser l\'index depuis l\'IHM de l\'indexing<br>\n 2) relancer la r&eacute;indexation depuis l\'IHM du harvester<br>\n 3) tenter de supprimer une r&eacute;colte<br>\n <br>\n * 1) et 2) permettent de repartir sur un index propre et non\n corrompu si le probl&egrave;me venait de l&agrave;.<br>\n <br>\n Cordialement,<br>\n <br>\n </font></font>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\"> <font face=\"Verdana\"><small> Yohan\n COLMANT<br>\n Direction des Syst&egrave;mes d\'Information<br>\n UVHC - Universit&eacute; de Valenciennes et du Hainaut Cambr&eacute;sis<br>\n Coordinateur Technique du projet ORI-OAI </small> </font>\n </div>\n </div>\n <br>\n Le 17/01/2011 18:15, <a moz-do-not-send=\"true\"\n class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a>\n a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Author_1\"><blockquote>\n <pre wrap=\"\">Bonjour,\n\nJ\'ai relanc&eacute; les deux tomcat (l\'un pour harvester, l\'autre pour les autres modules). Tout se passe bien. J\'ai relanc&eacute; la moisson sur la couche qui nous int&eacute;resse, l&agrave; aussi, &ccedil;&agrave; passe, le processus arrive &agrave; son terme. Mais quand je veux supprimer la moisson, j\'ai encore cette erreur : \n\n17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3842 index entry\n17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3842 index entry\n17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3843 index entry\n17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3843 index entry\n17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3846 index entry\n17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3846 index entry\n17 janv. 2011 18:02:13,883 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3844 index entry\n17 janv. 2011 18:02:13,884 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3844 index entry\n\n\nAlors que le gestionnaire de liens et le crawler sont &agrave; l\'arr&ecirc;t apr&egrave;s que le module ait bien index&eacute; les quelques notices rapatri&eacute;es de la pr&eacute;c&eacute;dente moisson. L\'erreur montre bien qu\'il y a un souci au niveau de la suppression des items. Je ne vois pas o&ugrave; &ccedil;&agrave; cloche.\n\nBien cordialement\n\nSt&eacute;phane Loret\nMSH - Tours\nCr&eacute;villes.org\n\n\n\n----- Mail Original -----\nDe: <a moz-do-not-send=\"true\" class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a>\n&Agrave;: <a moz-do-not-send=\"true\" class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a>\nEnvoy&eacute;: Lundi 17 Janvier 2011 17h36:15 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne\nObjet: Re: [ori-oai-utilisateurs] Probl&egrave;me de suppression de moisson\n\nMerci pour la r&eacute;ponse.\n\nJ\'ai retent&eacute; la suppression et j\'ai le m&ecirc;me r&eacute;sultat. Donc je pense aussi que cela provient du module indexing. Mon autre souci est donc au niveau de la gestion des liens et du crawler : celui-ci est en fonctionnement depuis pas mal de temps et reste \"plant&eacute;\" &agrave; 1%. Nous avons, &agrave; l\'heure actuelle 2300 notices provenant de deux sources de moissons. Dans le log du module ori-oai-indexing, j\'ai &ccedil;&agrave; : \n\n INFO janv./16 23:22:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n INFO janv./17 00:05:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n INFO janv./17 00:41:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n INFO janv./17 01:13:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n INFO janv./17 01:50:40 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n\nSi je comprends bien le message, les taches d\'optimisation de l\'index se lancent bien et ce depuis le 14 janvier o&ugrave; nous avions du relancer l\'application. Mais je ne vois pas pourquoi il s\'est arr&ecirc;t&eacute; &agrave; 1:50 ce jour, bien que, dans catalina.out, je remarque qu\'&agrave; cette date et &agrave; cette heure pr&eacute;cise j\'ai &ccedil;&agrave; :\n\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 34 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 34 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\n WARN [pool-2-thread-2] - Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.\n INFO [pool-2-thread-2] - URI problem with current link \'<a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://halshs.archives-ouvertes.fr/halshs-00146195/en/\">http://halshs.archives-ouvertes.fr/halshs-00146195/en/</a>\' and new link \'\', \'YMUX50:VQ30YQKY0ZZQ5J6ZU7L1M3U4LQ45KR3\', \'\'\norg.apache.commons.httpclient.URIException: incorrect scheme\n at org.apache.commons.httpclient.URI.parseUriReference(URI.java:1952)\n at org.apache.commons.httpclient.URI.&lt;init&gt;(URI.java:167)\n at org.apache.commons.httpclient.URI.&lt;init&gt;(URI.java:455)\n at com.torunski.crawler.util.LinksUtil.getURI(Unknown Source)\n at com.torunski.crawler.util.LinksUtil.retrieveLinks(Unknown Source)\n at com.torunski.crawler.util.LinksUtil$1.retrieveLinks(Unknown Source)\n at com.torunski.crawler.parser.httpclient.SimpleHttpClientParser.parse(Unknown Source)\n at com.torunski.crawler.Crawler.start(Unknown Source)\n at com.torunski.crawler.Crawler.start(Unknown Source)\n at org.orioai.indexing.crawler.CrawlingThread.run(Unknown Source)\n at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)\n at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)\n at java.lang.Thread.run(Thread.java:662)\n\nSi je comprends bien l&agrave; aussi, le crawler a rencontr&eacute; des probl&egrave;mes au moment o&ugrave; il attaquait les notices rapatri&eacute;es du d&eacute;p&ocirc;t de Hal-Shs &agrave; cause d\'une url qui pose probl&egrave;me. La suite du log est du m&ecirc;me tonneau.\n\nEnfin, le log se termine par &ccedil;&agrave; :\n\n271423676 janv./17 14:47:05 INFO cache.OriNameMatchCachingInterceptor run[261] - synchronized put in cache : .public abstract java.lang.String org.orioai.ws.vocabulary.IVocabularyService.getVocabulary(java.lang.String).search_formats\nRetrieving document at \'null\'.\n\nMa question est la suivante : o&ugrave; peut-on modifier le lancement automatique de la gestion des liens et du crawler ? Peut-on envisager de le lancer qu\'une seule fois dans la nuit apr&egrave;s une derni&egrave;re moisson sur une couche que l\'on souhaite moissonner tous les jours ?\n\nBien &agrave; vous\n\nSt&eacute;phane Loret\nMSH - Tours\nCr&eacute;villes.org\n\n\n\n----- Mail Original -----\nDe: \"Francois Jannin\" <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\">&lt;<span id=\"919301b5c518c9ff00d1a59ebc883be5\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'919301b5c518c9ff00d1a59ebc883be5\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\'+\'\">\'+\'&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>&gt;</a>\n&Agrave;: <a moz-do-not-send=\"true\" class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a>\nEnvoy&eacute;: Lundi 17 Janvier 2011 16h52:29 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne\nObjet: Re: [ori-oai-utilisateurs] Probl&egrave;me de suppression de moisson\n\nBonjour, \n\nD\'apr&egrave;s les logs l\'invocation des webservices de l\'indexing ne fonctionne pas, cela vient peut-&ecirc;tre en effet du fait que le crawler verouille l\'indexe &agrave; ce moment-l&agrave; : &agrave; verifier toutefois dans les logs de l\'indexing. \nDans ce cas l&agrave;, il faudrait vous arranger pour ne pas moissonner pendant le cron du crawling. \n\nCordialement, \nFran&ccedil;ois Jannin \n\nLe 17/01/2011 15:40, <a moz-do-not-send=\"true\" class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a &eacute;crit : \n\nBonjour,\n\nJe tente de supprimer une moisson &agrave; partir de l\'interface en cliquant sur l\'icone poubelle de l\'onglet r&eacute;coltes &agrave; la hauteur du d&eacute;p&ocirc;t que je souhaite supprimer. Une fois cliqu&eacute;, rien ne se passe et j\'ai une erreur dans ori-harvester.log\n\n17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry\n17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry\n17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry\n17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry\n17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry\n17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry\n17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry\n\nLa r&eacute;colte est encore l&agrave;. Je suis all&eacute; dans le module indexing et le crawler &eacute;tait en fonctionnement, est-ce que l\'erreur peut provenir de cela ?\n\nBien cordialement\n\nSt&eacute;phane Loret\nMSH - Tours\nCr&eacute;villes.org \n\n\n</pre>\n </blockquote></div>\n </blockquote></div></div>\n <br>\n </body>\n</html>\n</div>', created = 1507746252, expire = 1507832652, headers = '', serialized = 0 WHERE cid = '4:dc24d232a59e7d59960c766113ba335b' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:64fb02c022f5f3d4d75d397950fd5521' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <title></title>\n </head>\n <body bgcolor=\"#ffffff\" text=\"#000000\">\n Bonjour Yohan,<br>\n <br>\n Je n\'ai malheureusement plus les logs du module indexing. Mais j\'ai\n suivi la proc&eacute;dure telle que vous la d&eacute;crivez pour retrouver un\n index \"propre\". Ce que je sais d&eacute;sormais, c\'est que l\'index est\n bloqu&eacute; quand le job de gestion de liens et de crawling est lanc&eacute;,\n lequel, dans sa configuration initiale, effectuait une indexation\n plein texte qui, d\'une part, &eacute;tait extr&ecirc;mement longue et, d\'autre\n part, renvoyait une tonne d\'erreur sur les documents eux-m&ecirc;mes. J\'ai\n donc r&eacute;duit la t&acirc;che &agrave; la seule gestion de liens que je voudrais\n programmer afin que celle-ci ne se lance pas tous les jours mais une\n &agrave; deux fois par semaine (je pense que, dans notre cas, c\'est\n suffisant et on verra ensuite &agrave; l\'usage). Depuis que j\'ai modifi&eacute;\n cette configuration, tout se passe bien au niveau de l\'indexing et\n du harvester, en tous les cas, je n\'ai pas l\'impression qu\'ils\n continuent &agrave; se marcher sur les pieds.<br>\n <br>\n Je profite de ce message pour r&eacute;it&eacute;rer ma demande d\'un entretien\n t&eacute;l&eacute;phonique portant sur les points que j\'avais abord&eacute; lors de mon\n pr&eacute;c&eacute;dent message personnel. Votre disponibilit&eacute; sera ma priorit&eacute;.<br>\n <br>\n Bien cordialement<br>\n <br>\n St&eacute;phane Loret<br>\n MSH - Tours<br>\n Cr&eacute;villes.org<br>\n <br>\n <br>\n Le 21/01/11 09:23, Yohan Colmant a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <meta content=\"text/html; charset=ISO-8859-1\"\n http-equiv=\"Content-Type\">\n <font size=\"-1\"><font face=\"Verdana\">Bonjour,<br>\n <br>\n Effectivement, on dirait que l\'erreur se passe du c&ocirc;t&eacute; de\n l\'indexing.<br>\n Est-ce que vous avez des logs en erreur dans ce module au\n moment o&ugrave; vous tentez de supprimer la r&eacute;colte ?<br>\n <br>\n Je me demande si votre pr&eacute;c&eacute;dent test n\'a pas corrompu\n l\'index. En effet, ce n\'est pas forc&eacute;ment un cas d\'utilisation\n que nous avions pr&eacute;vu : vous avez tent&eacute; de supprimer des\n fiches en cours de mise &agrave; jour (le crawling fait une mise &agrave;\n jour de la fiche dans l\'index).<br>\n Nous avons not&eacute; ce point comme important &agrave; r&eacute;gler dans les\n t&acirc;ches de d&eacute;veloppement de la V2 pour ne plus que &ccedil;a se\n produise dans cette nouvelle version.<br>\n <br>\n Pour voir si le soucis vient de l&agrave;, vous pouvez :<br>\n 1) r&eacute;initialiser l\'index depuis l\'IHM de l\'indexing<br>\n 2) relancer la r&eacute;indexation depuis l\'IHM du harvester<br>\n 3) tenter de supprimer une r&eacute;colte<br>\n <br>\n * 1) et 2) permettent de repartir sur un index propre et non\n corrompu si le probl&egrave;me venait de l&agrave;.<br>\n <br>\n Cordialement,<br>\n <br>\n </font></font>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\"> <font face=\"Verdana\"><small> Yohan\n COLMANT<br>\n Direction des Syst&egrave;mes d\'Information<br>\n UVHC - Universit&eacute; de Valenciennes et du Hainaut Cambr&eacute;sis<br>\n Coordinateur Technique du projet ORI-OAI </small> </font>\n </div>\n </div>\n <br>\n Le 17/01/2011 18:15, <a moz-do-not-send=\"true\"\n class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a>\n a &eacute;crit&nbsp;:\n <div class=\"emailFilter_Author_1\"><blockquote>\n <pre wrap=\"\">Bonjour,\n\nJ\'ai relanc&eacute; les deux tomcat (l\'un pour harvester, l\'autre pour les autres modules). Tout se passe bien. J\'ai relanc&eacute; la moisson sur la couche qui nous int&eacute;resse, l&agrave; aussi, &ccedil;&agrave; passe, le processus arrive &agrave; son terme. Mais quand je veux supprimer la moisson, j\'ai encore cette erreur : \n\n17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3842 index entry\n17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3842 index entry\n17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3843 index entry\n17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3843 index entry\n17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3846 index entry\n17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3846 index entry\n17 janv. 2011 18:02:13,883 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3844 index entry\n17 janv. 2011 18:02:13,884 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3844 index entry\n\n\nAlors que le gestionnaire de liens et le crawler sont &agrave; l\'arr&ecirc;t apr&egrave;s que le module ait bien index&eacute; les quelques notices rapatri&eacute;es de la pr&eacute;c&eacute;dente moisson. L\'erreur montre bien qu\'il y a un souci au niveau de la suppression des items. Je ne vois pas o&ugrave; &ccedil;&agrave; cloche.\n\nBien cordialement\n\nSt&eacute;phane Loret\nMSH - Tours\nCr&eacute;villes.org\n\n\n\n----- Mail Original -----\nDe: <a moz-do-not-send=\"true\" class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a>\n&Agrave;: <a moz-do-not-send=\"true\" class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a>\nEnvoy&eacute;: Lundi 17 Janvier 2011 17h36:15 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne\nObjet: Re: [ori-oai-utilisateurs] Probl&egrave;me de suppression de moisson\n\nMerci pour la r&eacute;ponse.\n\nJ\'ai retent&eacute; la suppression et j\'ai le m&ecirc;me r&eacute;sultat. Donc je pense aussi que cela provient du module indexing. Mon autre souci est donc au niveau de la gestion des liens et du crawler : celui-ci est en fonctionnement depuis pas mal de temps et reste \"plant&eacute;\" &agrave; 1%. Nous avons, &agrave; l\'heure actuelle 2300 notices provenant de deux sources de moissons. Dans le log du module ori-oai-indexing, j\'ai &ccedil;&agrave; : \n\n INFO janv./16 23:22:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n INFO janv./17 00:05:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n INFO janv./17 00:41:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n INFO janv./17 01:13:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n INFO janv./17 01:50:40 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n\nSi je comprends bien le message, les taches d\'optimisation de l\'index se lancent bien et ce depuis le 14 janvier o&ugrave; nous avions du relancer l\'application. Mais je ne vois pas pourquoi il s\'est arr&ecirc;t&eacute; &agrave; 1:50 ce jour, bien que, dans catalina.out, je remarque qu\'&agrave; cette date et &agrave; cette heure pr&eacute;cise j\'ai &ccedil;&agrave; :\n\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 34 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 34 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\n WARN [pool-2-thread-2] - Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.\n INFO [pool-2-thread-2] - URI problem with current link \'<a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\" href=\"http://halshs.archives-ouvertes.fr/halshs-00146195/en/\">http://halshs.archives-ouvertes.fr/halshs-00146195/en/</a>\' and new link \'\', \'YMUX50:VQ30YQKY0ZZQ5J6ZU7L1M3U4LQ45KR3\', \'\'\norg.apache.commons.httpclient.URIException: incorrect scheme\n at org.apache.commons.httpclient.URI.parseUriReference(URI.java:1952)\n at org.apache.commons.httpclient.URI.&lt;init&gt;(URI.java:167)\n at org.apache.commons.httpclient.URI.&lt;init&gt;(URI.java:455)\n at com.torunski.crawler.util.LinksUtil.getURI(Unknown Source)\n at com.torunski.crawler.util.LinksUtil.retrieveLinks(Unknown Source)\n at com.torunski.crawler.util.LinksUtil$1.retrieveLinks(Unknown Source)\n at com.torunski.crawler.parser.httpclient.SimpleHttpClientParser.parse(Unknown Source)\n at com.torunski.crawler.Crawler.start(Unknown Source)\n at com.torunski.crawler.Crawler.start(Unknown Source)\n at org.orioai.indexing.crawler.CrawlingThread.run(Unknown Source)\n at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)\n at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)\n at java.lang.Thread.run(Thread.java:662)\n\nSi je comprends bien l&agrave; aussi, le crawler a rencontr&eacute; des probl&egrave;mes au moment o&ugrave; il attaquait les notices rapatri&eacute;es du d&eacute;p&ocirc;t de Hal-Shs &agrave; cause d\'une url qui pose probl&egrave;me. La suite du log est du m&ecirc;me tonneau.\n\nEnfin, le log se termine par &ccedil;&agrave; :\n\n271423676 janv./17 14:47:05 INFO cache.OriNameMatchCachingInterceptor run[261] - synchronized put in cache : .public abstract java.lang.String org.orioai.ws.vocabulary.IVocabularyService.getVocabulary(java.lang.String).search_formats\nRetrieving document at \'null\'.\n\nMa question est la suivante : o&ugrave; peut-on modifier le lancement automatique de la gestion des liens et du crawler ? Peut-on envisager de le lancer qu\'une seule fois dans la nuit apr&egrave;s une derni&egrave;re moisson sur une couche que l\'on souhaite moissonner tous les jours ?\n\nBien &agrave; vous\n\nSt&eacute;phane Loret\nMSH - Tours\nCr&eacute;villes.org\n\n\n\n----- Mail Original -----\nDe: \"Francois Jannin\" <a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\">&lt;<span id=\"a3d5e92c57484df32761ceb295829e87\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'a3d5e92c57484df32761ceb295829e87\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\'+\'\">\'+\'&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>&gt;</a>\n&Agrave;: <a moz-do-not-send=\"true\" class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a>\nEnvoy&eacute;: Lundi 17 Janvier 2011 16h52:29 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne\nObjet: Re: [ori-oai-utilisateurs] Probl&egrave;me de suppression de moisson\n\nBonjour, \n\nD\'apr&egrave;s les logs l\'invocation des webservices de l\'indexing ne fonctionne pas, cela vient peut-&ecirc;tre en effet du fait que le crawler verouille l\'indexe &agrave; ce moment-l&agrave; : &agrave; verifier toutefois dans les logs de l\'indexing. \nDans ce cas l&agrave;, il faudrait vous arranger pour ne pas moissonner pendant le cron du crawling. \n\nCordialement, \nFran&ccedil;ois Jannin \n\nLe 17/01/2011 15:40, <a moz-do-not-send=\"true\" class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a &eacute;crit : \n\nBonjour,\n\nJe tente de supprimer une moisson &agrave; partir de l\'interface en cliquant sur l\'icone poubelle de l\'onglet r&eacute;coltes &agrave; la hauteur du d&eacute;p&ocirc;t que je souhaite supprimer. Une fois cliqu&eacute;, rien ne se passe et j\'ai une erreur dans ori-harvester.log\n\n17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry\n17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry\n17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry\n17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry\n17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry\n17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry\n17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry\n\nLa r&eacute;colte est encore l&agrave;. Je suis all&eacute; dans le module indexing et le crawler &eacute;tait en fonctionnement, est-ce que l\'erreur peut provenir de cela ?\n\nBien cordialement\n\nSt&eacute;phane Loret\nMSH - Tours\nCr&eacute;villes.org \n\n\n</pre>\n </blockquote></div>\n </blockquote></div></div>\n <br>\n </body>\n</html>\n</div>', created = 1507746254, expire = 1507832654, headers = '', serialized = 0 WHERE cid = '4:64fb02c022f5f3d4d75d397950fd5521' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:a49e2826cb1be05cb4867efef8df3c25' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=UTF-8\" http-equiv=\"Content-Type\">\n </head>\n <body text=\"#000000\" bgcolor=\"#ffffff\">\n <font size=\"-1\"><font face=\"Verdana\">Bonjour,<br>\n <br>\n Effectivement, on dirait que l\'erreur se passe du côté de\n l\'indexing.<br>\n Est-ce que vous avez des logs en erreur dans ce module au moment\n où vous tentez de supprimer la récolte ?<br>\n <br>\n Je me demande si votre précédent test n\'a pas corrompu l\'index.\n En effet, ce n\'est pas forcément un cas d\'utilisation que nous\n avions prévu : vous avez tenté de supprimer des fiches en cours\n de mise à jour (le crawling fait une mise à jour de la fiche\n dans l\'index).<br>\n Nous avons noté ce point comme important à régler dans les\n tâches de développement de la V2 pour ne plus que ça se produise\n dans cette nouvelle version.<br>\n <br>\n Pour voir si le soucis vient de là, vous pouvez :<br>\n 1) réinitialiser l\'index depuis l\'IHM de l\'indexing<br>\n 2) relancer la réindexation depuis l\'IHM du harvester<br>\n 3) tenter de supprimer une récolte<br>\n <br>\n * 1) et 2) permettent de repartir sur un index propre et non\n corrompu si le problème venait de là.<br>\n <br>\n Cordialement,<br>\n <br>\n </font></font>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\">\n <font face=\"Verdana\"><small>\n Yohan COLMANT<br>\n Direction des Systèmes d\'Information<br>\n UVHC - Université de Valenciennes et du Hainaut Cambrésis<br>\n Coordinateur Technique du projet ORI-OAI\n </small>\n </font>\n </div>\n </div>\n <br>\n Le 17/01/2011 18:15, <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a écrit :\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <pre wrap=\"\">Bonjour,\n\nJ\'ai relancé les deux tomcat (l\'un pour harvester, l\'autre pour les autres modules). Tout se passe bien. J\'ai relancé la moisson sur la couche qui nous intéresse, là aussi, çà passe, le processus arrive à son terme. Mais quand je veux supprimer la moisson, j\'ai encore cette erreur : \n\n17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3842 index entry\n17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3842 index entry\n17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3843 index entry\n17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3843 index entry\n17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3846 index entry\n17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3846 index entry\n17 janv. 2011 18:02:13,883 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3844 index entry\n17 janv. 2011 18:02:13,884 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3844 index entry\n\n\nAlors que le gestionnaire de liens et le crawler sont à l\'arrêt après que le module ait bien indexé les quelques notices rapatriées de la précédente moisson. L\'erreur montre bien qu\'il y a un souci au niveau de la suppression des items. Je ne vois pas où çà cloche.\n\nBien cordialement\n\nStéphane Loret\nMSH - Tours\nCrévilles.org\n\n\n\n----- Mail Original -----\nDe: <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a>\nÀ: <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a>\nEnvoyé: Lundi 17 Janvier 2011 17h36:15 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne\nObjet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson\n\nMerci pour la réponse.\n\nJ\'ai retenté la suppression et j\'ai le même résultat. Donc je pense aussi que cela provient du module indexing. Mon autre souci est donc au niveau de la gestion des liens et du crawler : celui-ci est en fonctionnement depuis pas mal de temps et reste \"planté\" à 1%. Nous avons, à l\'heure actuelle 2300 notices provenant de deux sources de moissons. Dans le log du module ori-oai-indexing, j\'ai çà : \n\n INFO janv./16 23:22:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n INFO janv./17 00:05:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n INFO janv./17 00:41:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n INFO janv./17 01:13:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n INFO janv./17 01:50:40 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread\n\nSi je comprends bien le message, les taches d\'optimisation de l\'index se lancent bien et ce depuis le 14 janvier où nous avions du relancer l\'application. Mais je ne vois pas pourquoi il s\'est arrêté à 1:50 ce jour, bien que, dans catalina.out, je remarque qu\'à cette date et à cette heure précise j\'ai çà :\n\nERROR [pool-2-thread-2] - Error on line 29 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 34 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 34 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 29 of document <a class=\"moz-txt-link-freetext\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"><font color=\"red\"><b>MailScanner soup&ccedil;onne le lien suivant d\'&ecirc;tre une tentative de fraude de la part de \"www.w3.org\" </b></font> \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\"</a>.: Unexpected end of file from server\n WARN [pool-2-thread-2] - Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.\n INFO [pool-2-thread-2] - URI problem with current link \'<a class=\"moz-txt-link-freetext\" href=\"http://halshs.archives-ouvertes.fr/halshs-00146195/en/\">http://halshs.archives-ouvertes.fr/halshs-00146195/en/</a>\' and new link \'\', \'YMUX50:VQ30YQKY0ZZQ5J6ZU7L1M3U4LQ45KR3\', \'\'\norg.apache.commons.httpclient.URIException: incorrect scheme\n at org.apache.commons.httpclient.URI.parseUriReference(URI.java:1952)\n at org.apache.commons.httpclient.URI.&lt;init&gt;(URI.java:167)\n at org.apache.commons.httpclient.URI.&lt;init&gt;(URI.java:455)\n at com.torunski.crawler.util.LinksUtil.getURI(Unknown Source)\n at com.torunski.crawler.util.LinksUtil.retrieveLinks(Unknown Source)\n at com.torunski.crawler.util.LinksUtil$1.retrieveLinks(Unknown Source)\n at com.torunski.crawler.parser.httpclient.SimpleHttpClientParser.parse(Unknown Source)\n at com.torunski.crawler.Crawler.start(Unknown Source)\n at com.torunski.crawler.Crawler.start(Unknown Source)\n at org.orioai.indexing.crawler.CrawlingThread.run(Unknown Source)\n at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)\n at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)\n at java.lang.Thread.run(Thread.java:662)\n\nSi je comprends bien là aussi, le crawler a rencontré des problèmes au moment où il attaquait les notices rapatriées du dépôt de Hal-Shs à cause d\'une url qui pose problème. La suite du log est du même tonneau.\n\nEnfin, le log se termine par çà :\n\n271423676 janv./17 14:47:05 INFO cache.OriNameMatchCachingInterceptor run[261] - synchronized put in cache : .public abstract java.lang.String org.orioai.ws.vocabulary.IVocabularyService.getVocabulary(java.lang.String).search_formats\nRetrieving document at \'null\'.\n\nMa question est la suivante : où peut-on modifier le lancement automatique de la gestion des liens et du crawler ? Peut-on envisager de le lancer qu\'une seule fois dans la nuit après une dernière moisson sur une couche que l\'on souhaite moissonner tous les jours ?\n\nBien à vous\n\nStéphane Loret\nMSH - Tours\nCrévilles.org\n\n\n\n----- Mail Original -----\nDe: \"Francois Jannin\" <a class=\"moz-txt-link-rfc2396E\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\">&lt;<span id=\"e390b2fbe7141abbf400b0017fdabd65\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'e390b2fbe7141abbf400b0017fdabd65\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\'+\'\">\'+\'&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>&gt;</a>\nÀ: <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a>\nEnvoyé: Lundi 17 Janvier 2011 16h52:29 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne\nObjet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson\n\nBonjour, \n\nD\'après les logs l\'invocation des webservices de l\'indexing ne fonctionne pas, cela vient peut-être en effet du fait que le crawler verouille l\'indexe à ce moment-là : à verifier toutefois dans les logs de l\'indexing. \nDans ce cas là, il faudrait vous arranger pour ne pas moissonner pendant le cron du crawling. \n\nCordialement, \nFrançois Jannin \n\nLe 17/01/2011 15:40, <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a écrit : \n\nBonjour,\n\nJe tente de supprimer une moisson à partir de l\'interface en cliquant sur l\'icone poubelle de l\'onglet récoltes à la hauteur du dépôt que je souhaite supprimer. Une fois cliqué, rien ne se passe et j\'ai une erreur dans ori-harvester.log\n\n17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry\n17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry\n17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry\n17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry\n17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry\n17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry\n17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry\n\nLa récolte est encore là. Je suis allé dans le module indexing et le crawler était en fonctionnement, est-ce que l\'erreur peut provenir de cela ?\n\nBien cordialement\n\nStéphane Loret\nMSH - Tours\nCrévilles.org \n\n\n</pre>\n </blockquote></div></div>\n </body>\n</html>\n</div>', created = 1507746254, expire = 1507832654, headers = '', serialized = 0 WHERE cid = '4:a49e2826cb1be05cb4867efef8df3c25' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:7aa368669f2397ec58c9c85060d405cb' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour,</p>\n<p>J\'ai relancé les deux tomcat (l\'un pour harvester, l\'autre pour les autres modules). Tout se passe bien. J\'ai relancé la moisson sur la couche qui nous intéresse, là aussi, çà passe, le processus arrive à son terme. Mais quand je veux supprimer la moisson, j\'ai encore cette erreur : </p>\n<p>17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3842 index entry<br />\n17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3842 index entry<br />\n17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3843 index entry<br />\n17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3843 index entry<br />\n17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3846 index entry<br />\n17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3846 index entry<br />\n17 janv. 2011 18:02:13,883 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3844 index entry<br />\n17 janv. 2011 18:02:13,884 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3844 index entry</p>\n<p>Alors que le gestionnaire de liens et le crawler sont à l\'arrêt après que le module ait bien indexé les quelques notices rapatriées de la précédente moisson. L\'erreur montre bien qu\'il y a un souci au niveau de la suppression des items. Je ne vois pas où çà cloche.</p>\n<p>Bien cordialement</p>\n<p>Stéphane Loret<br />\nMSH - Tours<br />\nCrévilles.org</p>\n<p>----- Mail Original -----<br />\nDe: <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a><br />\nÀ: <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a><br />\nEnvoyé: Lundi 17 Janvier 2011 17h36:15 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne<br />\nObjet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson</p>\n<p>Merci pour la réponse.</p>\n<p>J\'ai retenté la suppression et j\'ai le même résultat. Donc je pense aussi que cela provient du module indexing. Mon autre souci est donc au niveau de la gestion des liens et du crawler : celui-ci est en fonctionnement depuis pas mal de temps et reste \"planté\" à 1%. Nous avons, à l\'heure actuelle 2300 notices provenant de deux sources de moissons. Dans le log du module ori-oai-indexing, j\'ai çà : </p>\n<p> INFO janv./16 23:22:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread<br />\n INFO janv./17 00:05:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread<br />\n INFO janv./17 00:41:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread<br />\n INFO janv./17 01:13:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread<br />\n INFO janv./17 01:50:40 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread</p>\n<p>Si je comprends bien le message, les taches d\'optimisation de l\'index se lancent bien et ce depuis le 14 janvier où nous avions du relancer l\'application. Mais je ne vois pas pourquoi il s\'est arrêté à 1:50 ce jour, bien que, dans catalina.out, je remarque qu\'à cette date et à cette heure précise j\'ai çà :</p>\n<p>ERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 34 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 34 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\n WARN [pool-2-thread-2] - Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.<br />\n INFO [pool-2-thread-2] - URI problem with current link \'http://halshs.archives-ouvertes.fr/halshs-00146195/en/\' and new link \'\', \'YMUX50:VQ30YQKY0ZZQ5J6ZU7L1M3U4LQ45KR3\', \'\'<br />\norg.apache.commons.httpclient.URIException: incorrect scheme<br />\n at org.apache.commons.httpclient.URI.parseUriReference(URI.java:1952)<br />\n at org.apache.commons.httpclient.URI.<init>(URI.java:167)<br />\n at org.apache.commons.httpclient.URI.<init>(URI.java:455)<br />\n at com.torunski.crawler.util.LinksUtil.getURI(Unknown Source)<br />\n at com.torunski.crawler.util.LinksUtil.retrieveLinks(Unknown Source)<br />\n at com.torunski.crawler.util.LinksUtil$1.retrieveLinks(Unknown Source)<br />\n at com.torunski.crawler.parser.httpclient.SimpleHttpClientParser.parse(Unknown Source)<br />\n at com.torunski.crawler.Crawler.start(Unknown Source)<br />\n at com.torunski.crawler.Crawler.start(Unknown Source)<br />\n at org.orioai.indexing.crawler.CrawlingThread.run(Unknown Source)<br />\n at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)<br />\n at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)<br />\n at java.lang.Thread.run(Thread.java:662)</p>\n<p>Si je comprends bien là aussi, le crawler a rencontré des problèmes au moment où il attaquait les notices rapatriées du dépôt de Hal-Shs à cause d\'une url qui pose problème. La suite du log est du même tonneau.</p>\n<p>Enfin, le log se termine par çà :</p>\n<p>271423676 janv./17 14:47:05 INFO cache.OriNameMatchCachingInterceptor run[261] - synchronized put in cache : .public abstract java.lang.String org.orioai.ws.vocabulary.IVocabularyService.getVocabulary(java.lang.String).search_formats<br />\nRetrieving document at \'null\'.</p>\n<p>Ma question est la suivante : où peut-on modifier le lancement automatique de la gestion des liens et du crawler ? Peut-on envisager de le lancer qu\'une seule fois dans la nuit après une dernière moisson sur une couche que l\'on souhaite moissonner tous les jours ?</p>\n<p>Bien à vous</p>\n<p>Stéphane Loret<br />\nMSH - Tours<br />\nCrévilles.org</p>\n<p>----- Mail Original -----<br />\nDe: \"Francois Jannin\" <<span id=\"9100882bc513913dc72d7ce5de21ceb0\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'9100882bc513913dc72d7ce5de21ceb0\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\'+\'\">\'+\'&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>><br />\nÀ: <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a><br />\nEnvoyé: Lundi 17 Janvier 2011 16h52:29 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne<br />\nObjet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson</p>\n<p>Bonjour, </p>\n<p>D\'après les logs l\'invocation des webservices de l\'indexing ne fonctionne pas, cela vient peut-être en effet du fait que le crawler verouille l\'indexe à ce moment-là : à verifier toutefois dans les logs de l\'indexing.<br />\nDans ce cas là, il faudrait vous arranger pour ne pas moissonner pendant le cron du crawling. </p>\n<p>Cordialement,<br />\nFrançois Jannin </p>\n<p>Le 17/01/2011 15:40, <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a écrit : </p>\n<p>Bonjour,</p>\n<p>Je tente de supprimer une moisson à partir de l\'interface en cliquant sur l\'icone poubelle de l\'onglet récoltes à la hauteur du dépôt que je souhaite supprimer. Une fois cliqué, rien ne se passe et j\'ai une erreur dans ori-harvester.log</p>\n<p>17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry<br />\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry<br />\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry<br />\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry<br />\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry<br />\n17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry<br />\n17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry<br />\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry<br />\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry<br />\n17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry<br />\n17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry<br />\n17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry<br />\n17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry</p>\n<p>La récolte est encore là. Je suis allé dans le module indexing et le crawler était en fonctionnement, est-ce que l\'erreur peut provenir de cela ?</p>\n<p>Bien cordialement</p>\n<p>Stéphane Loret<br />\nMSH - Tours<br />\nCrévilles.org </p>\n<p>-- </p>\n<p>François Jannin<br />\nDSI - Développement et déploiement d\'applications<br />\nTél : +33 (0)5 34 32 30 51 </p>\n<p>INP Toulouse<br />\n6 allée Emile Monso - BP 34038<br />\n31029 Toulouse cedex 4<br />\n<a href=\"http://www.inp-toulouse.fr\" title=\"http://www.inp-toulouse.fr\">http://www.inp-toulouse.fr</a> </p>\n<p>Avant d’imprimer ce courriel, demandez-vous si ceci est nécessaire. </p>\n</div>\n', created = 1507746254, expire = 1507832654, headers = '', serialized = 0 WHERE cid = '4:7aa368669f2397ec58c9c85060d405cb' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:445f979db4763da1bd013edffb3d5654' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Merci pour la réponse.</p>\n<p>J\'ai retenté la suppression et j\'ai le même résultat. Donc je pense aussi que cela provient du module indexing. Mon autre souci est donc au niveau de la gestion des liens et du crawler : celui-ci est en fonctionnement depuis pas mal de temps et reste \"planté\" à 1%. Nous avons, à l\'heure actuelle 2300 notices provenant de deux sources de moissons. Dans le log du module ori-oai-indexing, j\'ai çà : </p>\n<p> INFO janv./16 23:22:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread<br />\n INFO janv./17 00:05:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread<br />\n INFO janv./17 00:41:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread<br />\n INFO janv./17 01:13:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread<br />\n INFO janv./17 01:50:40 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l\'index via le thread</p>\n<p>Si je comprends bien le message, les taches d\'optimisation de l\'index se lancent bien et ce depuis le 14 janvier où nous avions du relancer l\'application. Mais je ne vois pas pourquoi il s\'est arrêté à 1:50 ce jour, bien que, dans catalina.out, je remarque qu\'à cette date et à cette heure précise j\'ai çà :</p>\n<p>ERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 34 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 34 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 29 of document <a href=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\" title=\"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:\">http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd:</a> External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\nERROR [pool-2-thread-2] - Error on line 2: External entity not found: \"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\".: Unexpected end of file from server<br />\n WARN [pool-2-thread-2] - Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.<br />\n INFO [pool-2-thread-2] - URI problem with current link \'http://halshs.archives-ouvertes.fr/halshs-00146195/en/\' and new link \'\', \'YMUX50:VQ30YQKY0ZZQ5J6ZU7L1M3U4LQ45KR3\', \'\'<br />\norg.apache.commons.httpclient.URIException: incorrect scheme<br />\n at org.apache.commons.httpclient.URI.parseUriReference(URI.java:1952)<br />\n at org.apache.commons.httpclient.URI.<init>(URI.java:167)<br />\n at org.apache.commons.httpclient.URI.<init>(URI.java:455)<br />\n at com.torunski.crawler.util.LinksUtil.getURI(Unknown Source)<br />\n at com.torunski.crawler.util.LinksUtil.retrieveLinks(Unknown Source)<br />\n at com.torunski.crawler.util.LinksUtil$1.retrieveLinks(Unknown Source)<br />\n at com.torunski.crawler.parser.httpclient.SimpleHttpClientParser.parse(Unknown Source)<br />\n at com.torunski.crawler.Crawler.start(Unknown Source)<br />\n at com.torunski.crawler.Crawler.start(Unknown Source)<br />\n at org.orioai.indexing.crawler.CrawlingThread.run(Unknown Source)<br />\n at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)<br />\n at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)<br />\n at java.lang.Thread.run(Thread.java:662)</p>\n<p>Si je comprends bien là aussi, le crawler a rencontré des problèmes au moment où il attaquait les notices rapatriées du dépôt de Hal-Shs à cause d\'une url qui pose problème. La suite du log est du même tonneau.</p>\n<p>Enfin, le log se termine par çà :</p>\n<p>271423676 janv./17 14:47:05 INFO cache.OriNameMatchCachingInterceptor run[261] - synchronized put in cache : .public abstract java.lang.String org.orioai.ws.vocabulary.IVocabularyService.getVocabulary(java.lang.String).search_formats<br />\nRetrieving document at \'null\'.</p>\n<p>Ma question est la suivante : où peut-on modifier le lancement automatique de la gestion des liens et du crawler ? Peut-on envisager de le lancer qu\'une seule fois dans la nuit après une dernière moisson sur une couche que l\'on souhaite moissonner tous les jours ?</p>\n<p>Bien à vous</p>\n<p>Stéphane Loret<br />\nMSH - Tours<br />\nCrévilles.org</p>\n<p>----- Mail Original -----<br />\nDe: \"Francois Jannin\" <<span id=\"4a8d885f9defe78bd82caa80c3dc4374\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'4a8d885f9defe78bd82caa80c3dc4374\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\'+\'\">\'+\'&#102;&#114;&#97;&#110;&#99;&#111;&#105;&#115;&#46;&#106;&#97;&#110;&#110;&#105;&#110;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>><br />\nÀ: <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a><br />\nEnvoyé: Lundi 17 Janvier 2011 16h52:29 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne<br />\nObjet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson</p>\n<p>Bonjour, </p>\n<p>D\'après les logs l\'invocation des webservices de l\'indexing ne fonctionne pas, cela vient peut-être en effet du fait que le crawler verouille l\'indexe à ce moment-là : à verifier toutefois dans les logs de l\'indexing.<br />\nDans ce cas là, il faudrait vous arranger pour ne pas moissonner pendant le cron du crawling. </p>\n<p>Cordialement,<br />\nFrançois Jannin </p>\n<p>Le 17/01/2011 15:40, <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a écrit : </p>\n<p>Bonjour,</p>\n<p>Je tente de supprimer une moisson à partir de l\'interface en cliquant sur l\'icone poubelle de l\'onglet récoltes à la hauteur du dépôt que je souhaite supprimer. Une fois cliqué, rien ne se passe et j\'ai une erreur dans ori-harvester.log</p>\n<p>17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry<br />\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry<br />\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry<br />\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry<br />\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry<br />\n17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry<br />\n17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry<br />\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry<br />\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry<br />\n17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry<br />\n17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry<br />\n17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry<br />\n17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry</p>\n<p>La récolte est encore là. Je suis allé dans le module indexing et le crawler était en fonctionnement, est-ce que l\'erreur peut provenir de cela ?</p>\n<p>Bien cordialement</p>\n<p>Stéphane Loret<br />\nMSH - Tours<br />\nCrévilles.org </p>\n<p>-- </p>\n<p>François Jannin<br />\nDSI - Développement et déploiement d\'applications<br />\nTél : +33 (0)5 34 32 30 51 </p>\n<p>INP Toulouse<br />\n6 allée Emile Monso - BP 34038<br />\n31029 Toulouse cedex 4<br />\n<a href=\"http://www.inp-toulouse.fr\" title=\"http://www.inp-toulouse.fr\">http://www.inp-toulouse.fr</a> </p>\n<p>Avant d’imprimer ce courriel, demandez-vous si ceci est nécessaire. </p>\n</div>\n', created = 1507746254, expire = 1507832654, headers = '', serialized = 0 WHERE cid = '4:445f979db4763da1bd013edffb3d5654' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:f45523894c106b2e174c71c59f96924f' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n <head>\n <meta content=\"text/html; charset=UTF-8\" http-equiv=\"Content-Type\">\n </head>\n <body text=\"#000000\" bgcolor=\"#ffffff\">\n Bonjour,<br>\n <br>\n D\'après les logs l\'invocation des webservices de l\'indexing ne\n fonctionne pas, cela vient peut-être en effet du fait que le crawler\n verouille l\'indexe à ce moment-là : à verifier toutefois dans les\n logs de l\'indexing.<br>\n Dans ce cas là, il faudrait vous arranger pour ne pas moissonner\n pendant le cron du crawling.<br>\n <br>\n Cordialement,<br>\n François Jannin<br>\n <br>\n Le 17/01/2011 15:40, <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;\">&#115;&#100;&#106;&#108;&#111;&#114;&#101;&#116;&#64;&#102;&#114;&#101;&#101;&#46;&#102;&#114;</a> a écrit :\n <div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <pre wrap=\"\">Bonjour,\n\nJe tente de supprimer une moisson à partir de l\'interface en cliquant sur l\'icone poubelle de l\'onglet récoltes à la hauteur du dépôt que je souhaite supprimer. Une fois cliqué, rien ne se passe et j\'ai une erreur dans ori-harvester.log\n\n17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry\n17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry\n17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry\n17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry\n17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry\n17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry\n17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry\n\nLa récolte est encore là. Je suis allé dans le module indexing et le crawler était en fonctionnement, est-ce que l\'erreur peut provenir de cela ?\n\nBien cordialement\n\nStéphane Loret\nMSH - Tours\nCrévilles.org\n</pre>\n </blockquote></div></div>\n <br>\n <br>\n <div class=\"moz-signature\">-- <br>\n <style type=\"text/css\">\n a:link, a:visited {color: #666666; text-decoration: underline;}\n a:hover, a:active {color: #666666; text-decoration: none;}\n </style>\n <table width=\"597\" border=\"0\" cellpadding=\"0\" cellspacing=\"0\">\n </table>\n <table width=\"597\" border=\"0\" cellpadding=\"0\" cellspacing=\"0\">\n <tbody>\n <tr>\n <td valign=\"middle\" width=\"150\" align=\"center\"><a\n href=\"http://www.inp-toulouse.fr\"><img\n src=\"cid:<span id=\"da04bb7ea205b8ade3f68b47c686d450\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'da04bb7ea205b8ade3f68b47c686d450\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#112;&#97;&#114;&#116;&#49;&#46;&#48;&#50;&#48;&#56;&#48;&#57;&#48;&#55;&#46;&#48;&#48;&#48;&#52;&#48;&#55;&#48;&#48;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\'+\'\">\'+\'&#112;&#97;&#114;&#116;&#49;&#46;&#48;&#50;&#48;&#56;&#48;&#57;&#48;&#55;&#46;&#48;&#48;&#48;&#52;&#48;&#55;&#48;&#48;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>\" alt=\"\"\n height=\"46\" width=\"60\" border=\"0\"></a></td>\n <td valign=\"bottom\">\n <div style=\"font-size: 11px; font-family: Arial;\"><font\n color=\"#666666\"><b>François Jannin</b><br>\n DSI - Développement et déploiement d\'applications<br>\n Tél : +33 (0)5 34 32 30 51<br>\n </font></div>\n </td>\n </tr>\n </tbody>\n </table>\n <table width=\"597\" border=\"0\" cellpadding=\"0\" cellspacing=\"0\">\n <tbody>\n <tr>\n <td valign=\"top\">\n <div style=\"text-align: left; font-size: 9px; font-family:\n Arial;\"><font color=\"#666666\"><img alt=\"\"\n src=\"cid:<span id=\"7a25ae0ffe829bf1f42927476b85cba2\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'7a25ae0ffe829bf1f42927476b85cba2\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#112;&#97;&#114;&#116;&#50;&#46;&#48;&#55;&#48;&#49;&#48;&#49;&#48;&#53;&#46;&#48;&#55;&#48;&#55;&#48;&#55;&#48;&#50;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\'+\'\">\'+\'&#112;&#97;&#114;&#116;&#50;&#46;&#48;&#55;&#48;&#49;&#48;&#49;&#48;&#53;&#46;&#48;&#55;&#48;&#55;&#48;&#55;&#48;&#50;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>\"\n height=\"58\" width=\"597\"></font></div>\n </td>\n </tr>\n </tbody>\n </table>\n <table width=\"597\" border=\"0\" cellpadding=\"0\" cellspacing=\"0\">\n <tbody>\n <tr>\n <td valign=\"top\">\n <div style=\"text-align: right; font-size: 9px;\n font-family: Arial;\"><font color=\"#666666\">INP Toulouse<br>\n 6 allée Emile Monso - BP 34038<br>\n 31029 Toulouse cedex 4<br>\n <a href=\"http://www.inp-toulouse.fr\">http://www.inp-toulouse.fr</a><br>\n </font></div>\n </td>\n </tr>\n </tbody>\n </table>\n <table>\n <div style=\"font-size: 9px; font-family: Arial;\" align=\"left\"><img\n src=\"cid:<span id=\"47b43f56b013ea834d235005b15cad25\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'47b43f56b013ea834d235005b15cad25\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#112;&#97;&#114;&#116;&#51;&#46;&#48;&#57;&#48;&#52;&#48;&#53;&#48;&#53;&#46;&#48;&#56;&#48;&#54;&#48;&#52;&#48;&#49;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\'+\'\">\'+\'&#112;&#97;&#114;&#116;&#51;&#46;&#48;&#57;&#48;&#52;&#48;&#53;&#48;&#53;&#46;&#48;&#56;&#48;&#54;&#48;&#52;&#48;&#49;&#64;&#101;&#110;&#115;&#101;&#101;&#105;&#104;&#116;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>\" height=\"16\"\n width=\"16\"><font color=\"#cccccc\"> Avant d’imprimer ce\n courriel, demandez-vous si ceci est nécessaire.</font><br>\n </div>\n </table>\n </div>\n </body>\n</html>\n</div>', created = 1507746254, expire = 1507832654, headers = '', serialized = 0 WHERE cid = '4:f45523894c106b2e174c71c59f96924f' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:6a545d6c04cdc926c26c390eeda73a4d' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour,</p>\n<p>Je tente de supprimer une moisson à partir de l\'interface en cliquant sur l\'icone poubelle de l\'onglet récoltes à la hauteur du dépôt que je souhaite supprimer. Une fois cliqué, rien ne se passe et j\'ai une erreur dans ori-harvester.log</p>\n<p>17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry<br />\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry<br />\n17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry<br />\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry<br />\n17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry<br />\n17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry<br />\n17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry<br />\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry<br />\n17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry<br />\n17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry<br />\n17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry<br />\n17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry<br />\n17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry</p>\n<p>La récolte est encore là. Je suis allé dans le module indexing et le crawler était en fonctionnement, est-ce que l\'erreur peut provenir de cela ?</p>\n<p>Bien cordialement</p>\n<p>Stéphane Loret<br />\nMSH - Tours<br />\nCrévilles.org</p>\n</div>\n', created = 1507746254, expire = 1507832654, headers = '', serialized = 0 WHERE cid = '4:6a545d6c04cdc926c26c390eeda73a4d' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
7 messages / 0 nouveaux
Dernière contribution
stephaneloret
{Disarmed} Problème de suppression de moisson
Bonjour Yohan,

Je n'ai malheureusement plus les logs du module indexing. Mais j'ai suivi la procédure telle que vous la décrivez pour retrouver un index "propre". Ce que je sais désormais, c'est que l'index est bloqué quand le job de gestion de liens et de crawling est lancé, lequel, dans sa configuration initiale, effectuait une indexation plein texte qui, d'une part, était extrêmement longue et, d'autre part, renvoyait une tonne d'erreur sur les documents eux-mêmes. J'ai donc réduit la tâche à la seule gestion de liens que je voudrais programmer afin que celle-ci ne se lance pas tous les jours mais une à deux fois par semaine (je pense que, dans notre cas, c'est suffisant et on verra ensuite à l'usage). Depuis que j'ai modifié cette configuration, tout se passe bien au niveau de l'indexing et du harvester, en tous les cas, je n'ai pas l'impression qu'ils continuent à se marcher sur les pieds.

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org


Le 21/01/11 09:23, Yohan Colmant a écrit :
Bonjour,

Effectivement, on dirait que l'erreur se passe du côté de l'indexing.
Est-ce que vous avez des logs en erreur dans ce module au moment où vous tentez de supprimer la récolte ?

Je me demande si votre précédent test n'a pas corrompu l'index. En effet, ce n'est pas forcément un cas d'utilisation que nous avions prévu : vous avez tenté de supprimer des fiches en cours de mise à jour (le crawling fait une mise à jour de la fiche dans l'index).
Nous avons noté ce point comme important à régler dans les tâches de développement de la V2 pour ne plus que ça se produise dans cette nouvelle version.

Pour voir si le soucis vient de là, vous pouvez :
1) réinitialiser l'index depuis l'IHM de l'indexing
2) relancer la réindexation depuis l'IHM du harvester
3) tenter de supprimer une récolte

* 1) et 2) permettent de repartir sur un index propre et non corrompu si le problème venait de là.

Cordialement,

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI

Le 17/01/2011 18:15, sdjloret@free.fr a écrit :
Bonjour,

J'ai relancé les deux tomcat (l'un pour harvester, l'autre pour les autres modules). Tout se passe bien. J'ai relancé la moisson sur la couche qui nous intéresse, là aussi, çà passe, le processus arrive à son terme. Mais quand je veux supprimer la moisson, j'ai encore cette erreur : 

17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3842 index entry
17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3842 index entry
17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3843 index entry
17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3843 index entry
17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3846 index entry
17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3846 index entry
17 janv. 2011 18:02:13,883 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3844 index entry
17 janv. 2011 18:02:13,884 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3844 index entry


Alors que le gestionnaire de liens et le crawler sont à l'arrêt après que le module ait bien indexé les quelques notices rapatriées de la précédente moisson. L'erreur montre bien qu'il y a un souci au niveau de la suppression des items. Je ne vois pas où çà cloche.

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org



----- Mail Original -----
De: sdjloret@free.fr
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Lundi 17 Janvier 2011 17h36:15 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson

Merci pour la réponse.

J'ai retenté la suppression et j'ai le même résultat. Donc je pense aussi que cela provient du module indexing. Mon autre souci est donc au niveau de la gestion des liens et du crawler : celui-ci est en fonctionnement depuis pas mal de temps et reste "planté" à 1%. Nous avons, à l'heure actuelle 2300 notices provenant de deux sources de moissons. Dans le log du module ori-oai-indexing, j'ai çà : 

 INFO janv./16 23:22:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
 INFO janv./17 00:05:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
 INFO janv./17 00:41:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
 INFO janv./17 01:13:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
 INFO janv./17 01:50:40 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread

Si je comprends bien le message, les taches d'optimisation de l'index se lancent bien et ce depuis le 14 janvier où nous avions du relancer l'application. Mais je ne vois pas pourquoi il s'est arrêté à 1:50 ce jour, bien que, dans catalina.out, je remarque qu'à cette date et à cette heure précise j'ai çà :

ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 34 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 34 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
 WARN [pool-2-thread-2] - Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.
 INFO [pool-2-thread-2] - URI problem with current link 'http://halshs.archives-ouvertes.fr/halshs-00146195/en/' and new link '', 'YMUX50:VQ30YQKY0ZZQ5J6ZU7L1M3U4LQ45KR3', ''
org.apache.commons.httpclient.URIException: incorrect scheme
	at org.apache.commons.httpclient.URI.parseUriReference(URI.java:1952)
	at org.apache.commons.httpclient.URI.<init>(URI.java:167)
	at org.apache.commons.httpclient.URI.<init>(URI.java:455)
	at com.torunski.crawler.util.LinksUtil.getURI(Unknown Source)
	at com.torunski.crawler.util.LinksUtil.retrieveLinks(Unknown Source)
	at com.torunski.crawler.util.LinksUtil$1.retrieveLinks(Unknown Source)
	at com.torunski.crawler.parser.httpclient.SimpleHttpClientParser.parse(Unknown Source)
	at com.torunski.crawler.Crawler.start(Unknown Source)
	at com.torunski.crawler.Crawler.start(Unknown Source)
	at org.orioai.indexing.crawler.CrawlingThread.run(Unknown Source)
	at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)
	at java.lang.Thread.run(Thread.java:662)

Si je comprends bien là aussi, le crawler a rencontré des problèmes au moment où il attaquait les notices rapatriées du dépôt de Hal-Shs à cause d'une url qui pose problème. La suite du log est du même tonneau.

Enfin, le log se termine par çà :

271423676 janv./17 14:47:05 INFO  cache.OriNameMatchCachingInterceptor run[261]  - synchronized put in cache : .public abstract java.lang.String org.orioai.ws.vocabulary.IVocabularyService.getVocabulary(java.lang.String).search_formats
Retrieving document at 'null'.

Ma question est la suivante : où peut-on modifier le lancement automatique de la gestion des liens et du crawler ? Peut-on envisager de le lancer qu'une seule fois dans la nuit après une dernière moisson sur une couche que l'on souhaite moissonner tous les jours ?

Bien à vous

Stéphane Loret
MSH - Tours
Crévilles.org



----- Mail Original -----
De: "Francois Jannin" <
            >
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Lundi 17 Janvier 2011 16h52:29 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson

Bonjour, 

D'après les logs l'invocation des webservices de l'indexing ne fonctionne pas, cela vient peut-être en effet du fait que le crawler verouille l'indexe à ce moment-là : à verifier toutefois dans les logs de l'indexing. 
Dans ce cas là, il faudrait vous arranger pour ne pas moissonner pendant le cron du crawling. 

Cordialement, 
François Jannin 

Le 17/01/2011 15:40, sdjloret@free.fr a écrit : 

Bonjour,

Je tente de supprimer une moisson à partir de l'interface en cliquant sur l'icone poubelle de l'onglet récoltes à la hauteur du dépôt que je souhaite supprimer. Une fois cliqué, rien ne se passe et j'ai une erreur dans ori-harvester.log

17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry
17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry

La récolte est encore là. Je suis allé dans le module indexing et le crawler était en fonctionnement, est-ce que l'erreur peut provenir de cela ?

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org 



stephaneloret
Bonjour Yohan,

Je n'ai malheureusement plus les logs du module indexing. Mais j'ai suivi la procédure telle que vous la décrivez pour retrouver un index "propre". Ce que je sais désormais, c'est que l'index est bloqué quand le job de gestion de liens et de crawling est lancé, lequel, dans sa configuration initiale, effectuait une indexation plein texte qui, d'une part, était extrêmement longue et, d'autre part, renvoyait une tonne d'erreur sur les documents eux-mêmes. J'ai donc réduit la tâche à la seule gestion de liens que je voudrais programmer afin que celle-ci ne se lance pas tous les jours mais une à deux fois par semaine (je pense que, dans notre cas, c'est suffisant et on verra ensuite à l'usage). Depuis que j'ai modifié cette configuration, tout se passe bien au niveau de l'indexing et du harvester, en tous les cas, je n'ai pas l'impression qu'ils continuent à se marcher sur les pieds.

Je profite de ce message pour réitérer ma demande d'un entretien téléphonique portant sur les points que j'avais abordé lors de mon précédent message personnel. Votre disponibilité sera ma priorité.

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org


Le 21/01/11 09:23, Yohan Colmant a écrit :
Bonjour,

Effectivement, on dirait que l'erreur se passe du côté de l'indexing.
Est-ce que vous avez des logs en erreur dans ce module au moment où vous tentez de supprimer la récolte ?

Je me demande si votre précédent test n'a pas corrompu l'index. En effet, ce n'est pas forcément un cas d'utilisation que nous avions prévu : vous avez tenté de supprimer des fiches en cours de mise à jour (le crawling fait une mise à jour de la fiche dans l'index).
Nous avons noté ce point comme important à régler dans les tâches de développement de la V2 pour ne plus que ça se produise dans cette nouvelle version.

Pour voir si le soucis vient de là, vous pouvez :
1) réinitialiser l'index depuis l'IHM de l'indexing
2) relancer la réindexation depuis l'IHM du harvester
3) tenter de supprimer une récolte

* 1) et 2) permettent de repartir sur un index propre et non corrompu si le problème venait de là.

Cordialement,

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI

Le 17/01/2011 18:15, sdjloret@free.fr a écrit :
Bonjour,

J'ai relancé les deux tomcat (l'un pour harvester, l'autre pour les autres modules). Tout se passe bien. J'ai relancé la moisson sur la couche qui nous intéresse, là aussi, çà passe, le processus arrive à son terme. Mais quand je veux supprimer la moisson, j'ai encore cette erreur : 

17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3842 index entry
17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3842 index entry
17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3843 index entry
17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3843 index entry
17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3846 index entry
17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3846 index entry
17 janv. 2011 18:02:13,883 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3844 index entry
17 janv. 2011 18:02:13,884 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3844 index entry


Alors que le gestionnaire de liens et le crawler sont à l'arrêt après que le module ait bien indexé les quelques notices rapatriées de la précédente moisson. L'erreur montre bien qu'il y a un souci au niveau de la suppression des items. Je ne vois pas où çà cloche.

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org



----- Mail Original -----
De: sdjloret@free.fr
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Lundi 17 Janvier 2011 17h36:15 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson

Merci pour la réponse.

J'ai retenté la suppression et j'ai le même résultat. Donc je pense aussi que cela provient du module indexing. Mon autre souci est donc au niveau de la gestion des liens et du crawler : celui-ci est en fonctionnement depuis pas mal de temps et reste "planté" à 1%. Nous avons, à l'heure actuelle 2300 notices provenant de deux sources de moissons. Dans le log du module ori-oai-indexing, j'ai çà : 

 INFO janv./16 23:22:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
 INFO janv./17 00:05:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
 INFO janv./17 00:41:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
 INFO janv./17 01:13:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
 INFO janv./17 01:50:40 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread

Si je comprends bien le message, les taches d'optimisation de l'index se lancent bien et ce depuis le 14 janvier où nous avions du relancer l'application. Mais je ne vois pas pourquoi il s'est arrêté à 1:50 ce jour, bien que, dans catalina.out, je remarque qu'à cette date et à cette heure précise j'ai çà :

ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 34 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 34 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
 WARN [pool-2-thread-2] - Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.
 INFO [pool-2-thread-2] - URI problem with current link 'http://halshs.archives-ouvertes.fr/halshs-00146195/en/' and new link '', 'YMUX50:VQ30YQKY0ZZQ5J6ZU7L1M3U4LQ45KR3', ''
org.apache.commons.httpclient.URIException: incorrect scheme
	at org.apache.commons.httpclient.URI.parseUriReference(URI.java:1952)
	at org.apache.commons.httpclient.URI.<init>(URI.java:167)
	at org.apache.commons.httpclient.URI.<init>(URI.java:455)
	at com.torunski.crawler.util.LinksUtil.getURI(Unknown Source)
	at com.torunski.crawler.util.LinksUtil.retrieveLinks(Unknown Source)
	at com.torunski.crawler.util.LinksUtil$1.retrieveLinks(Unknown Source)
	at com.torunski.crawler.parser.httpclient.SimpleHttpClientParser.parse(Unknown Source)
	at com.torunski.crawler.Crawler.start(Unknown Source)
	at com.torunski.crawler.Crawler.start(Unknown Source)
	at org.orioai.indexing.crawler.CrawlingThread.run(Unknown Source)
	at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)
	at java.lang.Thread.run(Thread.java:662)

Si je comprends bien là aussi, le crawler a rencontré des problèmes au moment où il attaquait les notices rapatriées du dépôt de Hal-Shs à cause d'une url qui pose problème. La suite du log est du même tonneau.

Enfin, le log se termine par çà :

271423676 janv./17 14:47:05 INFO  cache.OriNameMatchCachingInterceptor run[261]  - synchronized put in cache : .public abstract java.lang.String org.orioai.ws.vocabulary.IVocabularyService.getVocabulary(java.lang.String).search_formats
Retrieving document at 'null'.

Ma question est la suivante : où peut-on modifier le lancement automatique de la gestion des liens et du crawler ? Peut-on envisager de le lancer qu'une seule fois dans la nuit après une dernière moisson sur une couche que l'on souhaite moissonner tous les jours ?

Bien à vous

Stéphane Loret
MSH - Tours
Crévilles.org



----- Mail Original -----
De: "Francois Jannin" <
            >
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Lundi 17 Janvier 2011 16h52:29 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson

Bonjour, 

D'après les logs l'invocation des webservices de l'indexing ne fonctionne pas, cela vient peut-être en effet du fait que le crawler verouille l'indexe à ce moment-là : à verifier toutefois dans les logs de l'indexing. 
Dans ce cas là, il faudrait vous arranger pour ne pas moissonner pendant le cron du crawling. 

Cordialement, 
François Jannin 

Le 17/01/2011 15:40, sdjloret@free.fr a écrit : 

Bonjour,

Je tente de supprimer une moisson à partir de l'interface en cliquant sur l'icone poubelle de l'onglet récoltes à la hauteur du dépôt que je souhaite supprimer. Une fois cliqué, rien ne se passe et j'ai une erreur dans ori-harvester.log

17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry
17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry

La récolte est encore là. Je suis allé dans le module indexing et le crawler était en fonctionnement, est-ce que l'erreur peut provenir de cela ?

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org 



Yohan Colmant
Bonjour,

Effectivement, on dirait que l'erreur se passe du côté de l'indexing.
Est-ce que vous avez des logs en erreur dans ce module au moment où vous tentez de supprimer la récolte ?

Je me demande si votre précédent test n'a pas corrompu l'index. En effet, ce n'est pas forcément un cas d'utilisation que nous avions prévu : vous avez tenté de supprimer des fiches en cours de mise à jour (le crawling fait une mise à jour de la fiche dans l'index).
Nous avons noté ce point comme important à régler dans les tâches de développement de la V2 pour ne plus que ça se produise dans cette nouvelle version.

Pour voir si le soucis vient de là, vous pouvez :
1) réinitialiser l'index depuis l'IHM de l'indexing
2) relancer la réindexation depuis l'IHM du harvester
3) tenter de supprimer une récolte

* 1) et 2) permettent de repartir sur un index propre et non corrompu si le problème venait de là.

Cordialement,

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI

Le 17/01/2011 18:15, sdjloret@free.fr a écrit :
Bonjour,

J'ai relancé les deux tomcat (l'un pour harvester, l'autre pour les autres modules). Tout se passe bien. J'ai relancé la moisson sur la couche qui nous intéresse, là aussi, çà passe, le processus arrive à son terme. Mais quand je veux supprimer la moisson, j'ai encore cette erreur : 

17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3842 index entry
17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3842 index entry
17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3843 index entry
17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3843 index entry
17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3846 index entry
17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3846 index entry
17 janv. 2011 18:02:13,883 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3844 index entry
17 janv. 2011 18:02:13,884 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3844 index entry


Alors que le gestionnaire de liens et le crawler sont à l'arrêt après que le module ait bien indexé les quelques notices rapatriées de la précédente moisson. L'erreur montre bien qu'il y a un souci au niveau de la suppression des items. Je ne vois pas où çà cloche.

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org



----- Mail Original -----
De: sdjloret@free.fr
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Lundi 17 Janvier 2011 17h36:15 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson

Merci pour la réponse.

J'ai retenté la suppression et j'ai le même résultat. Donc je pense aussi que cela provient du module indexing. Mon autre souci est donc au niveau de la gestion des liens et du crawler : celui-ci est en fonctionnement depuis pas mal de temps et reste "planté" à 1%. Nous avons, à l'heure actuelle 2300 notices provenant de deux sources de moissons. Dans le log du module ori-oai-indexing, j'ai çà : 

 INFO janv./16 23:22:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
 INFO janv./17 00:05:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
 INFO janv./17 00:41:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
 INFO janv./17 01:13:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
 INFO janv./17 01:50:40 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread

Si je comprends bien le message, les taches d'optimisation de l'index se lancent bien et ce depuis le 14 janvier où nous avions du relancer l'application. Mais je ne vois pas pourquoi il s'est arrêté à 1:50 ce jour, bien que, dans catalina.out, je remarque qu'à cette date et à cette heure précise j'ai çà :

ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 34 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 34 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: MailScanner soupçonne le lien suivant d'être une tentative de fraude de la part de "www.w3.org"  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
 WARN [pool-2-thread-2] - Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.
 INFO [pool-2-thread-2] - URI problem with current link 'http://halshs.archives-ouvertes.fr/halshs-00146195/en/' and new link '', 'YMUX50:VQ30YQKY0ZZQ5J6ZU7L1M3U4LQ45KR3', ''
org.apache.commons.httpclient.URIException: incorrect scheme
	at org.apache.commons.httpclient.URI.parseUriReference(URI.java:1952)
	at org.apache.commons.httpclient.URI.<init>(URI.java:167)
	at org.apache.commons.httpclient.URI.<init>(URI.java:455)
	at com.torunski.crawler.util.LinksUtil.getURI(Unknown Source)
	at com.torunski.crawler.util.LinksUtil.retrieveLinks(Unknown Source)
	at com.torunski.crawler.util.LinksUtil$1.retrieveLinks(Unknown Source)
	at com.torunski.crawler.parser.httpclient.SimpleHttpClientParser.parse(Unknown Source)
	at com.torunski.crawler.Crawler.start(Unknown Source)
	at com.torunski.crawler.Crawler.start(Unknown Source)
	at org.orioai.indexing.crawler.CrawlingThread.run(Unknown Source)
	at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)
	at java.lang.Thread.run(Thread.java:662)

Si je comprends bien là aussi, le crawler a rencontré des problèmes au moment où il attaquait les notices rapatriées du dépôt de Hal-Shs à cause d'une url qui pose problème. La suite du log est du même tonneau.

Enfin, le log se termine par çà :

271423676 janv./17 14:47:05 INFO  cache.OriNameMatchCachingInterceptor run[261]  - synchronized put in cache : .public abstract java.lang.String org.orioai.ws.vocabulary.IVocabularyService.getVocabulary(java.lang.String).search_formats
Retrieving document at 'null'.

Ma question est la suivante : où peut-on modifier le lancement automatique de la gestion des liens et du crawler ? Peut-on envisager de le lancer qu'une seule fois dans la nuit après une dernière moisson sur une couche que l'on souhaite moissonner tous les jours ?

Bien à vous

Stéphane Loret
MSH - Tours
Crévilles.org



----- Mail Original -----
De: "Francois Jannin" <
            >
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Lundi 17 Janvier 2011 16h52:29 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson

Bonjour, 

D'après les logs l'invocation des webservices de l'indexing ne fonctionne pas, cela vient peut-être en effet du fait que le crawler verouille l'indexe à ce moment-là : à verifier toutefois dans les logs de l'indexing. 
Dans ce cas là, il faudrait vous arranger pour ne pas moissonner pendant le cron du crawling. 

Cordialement, 
François Jannin 

Le 17/01/2011 15:40, sdjloret@free.fr a écrit : 

Bonjour,

Je tente de supprimer une moisson à partir de l'interface en cliquant sur l'icone poubelle de l'onglet récoltes à la hauteur du dépôt que je souhaite supprimer. Une fois cliqué, rien ne se passe et j'ai une erreur dans ori-harvester.log

17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry
17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry

La récolte est encore là. Je suis allé dans le module indexing et le crawler était en fonctionnement, est-ce que l'erreur peut provenir de cela ?

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org 


stephaneloret
Bonjour,

J'ai relancé les deux tomcat (l'un pour harvester, l'autre pour les autres modules). Tout se passe bien. J'ai relancé la moisson sur la couche qui nous intéresse, là aussi, çà passe, le processus arrive à son terme. Mais quand je veux supprimer la moisson, j'ai encore cette erreur :

17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3842 index entry
17 janv. 2011 18:02:13,859 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3842 index entry
17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3843 index entry
17 janv. 2011 18:02:13,867 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3843 index entry
17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3846 index entry
17 janv. 2011 18:02:13,875 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3846 index entry
17 janv. 2011 18:02:13,883 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3844 index entry
17 janv. 2011 18:02:13,884 [ERROR] catalina-exec-4 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3844 index entry

Alors que le gestionnaire de liens et le crawler sont à l'arrêt après que le module ait bien indexé les quelques notices rapatriées de la précédente moisson. L'erreur montre bien qu'il y a un souci au niveau de la suppression des items. Je ne vois pas où çà cloche.

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org

----- Mail Original -----
De: sdjloret@free.fr
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Lundi 17 Janvier 2011 17h36:15 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson

Merci pour la réponse.

J'ai retenté la suppression et j'ai le même résultat. Donc je pense aussi que cela provient du module indexing. Mon autre souci est donc au niveau de la gestion des liens et du crawler : celui-ci est en fonctionnement depuis pas mal de temps et reste "planté" à 1%. Nous avons, à l'heure actuelle 2300 notices provenant de deux sources de moissons. Dans le log du module ori-oai-indexing, j'ai çà :

INFO janv./16 23:22:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
INFO janv./17 00:05:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
INFO janv./17 00:41:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
INFO janv./17 01:13:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
INFO janv./17 01:50:40 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread

Si je comprends bien le message, les taches d'optimisation de l'index se lancent bien et ce depuis le 14 janvier où nous avions du relancer l'application. Mais je ne vois pas pourquoi il s'est arrêté à 1:50 ce jour, bien que, dans catalina.out, je remarque qu'à cette date et à cette heure précise j'ai çà :

ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 34 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 34 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
WARN [pool-2-thread-2] - Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.
INFO [pool-2-thread-2] - URI problem with current link 'http://halshs.archives-ouvertes.fr/halshs-00146195/en/' and new link '', 'YMUX50:VQ30YQKY0ZZQ5J6ZU7L1M3U4LQ45KR3', ''
org.apache.commons.httpclient.URIException: incorrect scheme
at org.apache.commons.httpclient.URI.parseUriReference(URI.java:1952)
at org.apache.commons.httpclient.URI.(URI.java:167)
at org.apache.commons.httpclient.URI.(URI.java:455)
at com.torunski.crawler.util.LinksUtil.getURI(Unknown Source)
at com.torunski.crawler.util.LinksUtil.retrieveLinks(Unknown Source)
at com.torunski.crawler.util.LinksUtil$1.retrieveLinks(Unknown Source)
at com.torunski.crawler.parser.httpclient.SimpleHttpClientParser.parse(Unknown Source)
at com.torunski.crawler.Crawler.start(Unknown Source)
at com.torunski.crawler.Crawler.start(Unknown Source)
at org.orioai.indexing.crawler.CrawlingThread.run(Unknown Source)
at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)
at java.lang.Thread.run(Thread.java:662)

Si je comprends bien là aussi, le crawler a rencontré des problèmes au moment où il attaquait les notices rapatriées du dépôt de Hal-Shs à cause d'une url qui pose problème. La suite du log est du même tonneau.

Enfin, le log se termine par çà :

271423676 janv./17 14:47:05 INFO cache.OriNameMatchCachingInterceptor run[261] - synchronized put in cache : .public abstract java.lang.String org.orioai.ws.vocabulary.IVocabularyService.getVocabulary(java.lang.String).search_formats
Retrieving document at 'null'.

Ma question est la suivante : où peut-on modifier le lancement automatique de la gestion des liens et du crawler ? Peut-on envisager de le lancer qu'une seule fois dans la nuit après une dernière moisson sur une couche que l'on souhaite moissonner tous les jours ?

Bien à vous

Stéphane Loret
MSH - Tours
Crévilles.org

----- Mail Original -----
De: "Francois Jannin" < >
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Lundi 17 Janvier 2011 16h52:29 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson

Bonjour,

D'après les logs l'invocation des webservices de l'indexing ne fonctionne pas, cela vient peut-être en effet du fait que le crawler verouille l'indexe à ce moment-là : à verifier toutefois dans les logs de l'indexing.
Dans ce cas là, il faudrait vous arranger pour ne pas moissonner pendant le cron du crawling.

Cordialement,
François Jannin

Le 17/01/2011 15:40, sdjloret@free.fr a écrit :

Bonjour,

Je tente de supprimer une moisson à partir de l'interface en cliquant sur l'icone poubelle de l'onglet récoltes à la hauteur du dépôt que je souhaite supprimer. Une fois cliqué, rien ne se passe et j'ai une erreur dans ori-harvester.log

17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry
17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry

La récolte est encore là. Je suis allé dans le module indexing et le crawler était en fonctionnement, est-ce que l'erreur peut provenir de cela ?

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org

--

François Jannin
DSI - Développement et déploiement d'applications
Tél : +33 (0)5 34 32 30 51

INP Toulouse
6 allée Emile Monso - BP 34038
31029 Toulouse cedex 4
http://www.inp-toulouse.fr

Avant d’imprimer ce courriel, demandez-vous si ceci est nécessaire.

stephaneloret
Merci pour la réponse.

J'ai retenté la suppression et j'ai le même résultat. Donc je pense aussi que cela provient du module indexing. Mon autre souci est donc au niveau de la gestion des liens et du crawler : celui-ci est en fonctionnement depuis pas mal de temps et reste "planté" à 1%. Nous avons, à l'heure actuelle 2300 notices provenant de deux sources de moissons. Dans le log du module ori-oai-indexing, j'ai çà :

INFO janv./16 23:22:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
INFO janv./17 00:05:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
INFO janv./17 00:41:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
INFO janv./17 01:13:39 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread
INFO janv./17 01:50:40 org.orioai.indexing.optimisation.OptimisationThread :: OptimisationThread.run :: Optimisation de l'index via le thread

Si je comprends bien le message, les taches d'optimisation de l'index se lancent bien et ce depuis le 14 janvier où nous avions du relancer l'application. Mais je ne vois pas pourquoi il s'est arrêté à 1:50 ce jour, bien que, dans catalina.out, je remarque qu'à cette date et à cette heure précise j'ai çà :

ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 34 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 34 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-symbol.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 29 of document http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml-lat1.ent".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
ERROR [pool-2-thread-2] - Error on line 2: External entity not found: "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd".: Unexpected end of file from server
WARN [pool-2-thread-2] - Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.
INFO [pool-2-thread-2] - URI problem with current link 'http://halshs.archives-ouvertes.fr/halshs-00146195/en/' and new link '', 'YMUX50:VQ30YQKY0ZZQ5J6ZU7L1M3U4LQ45KR3', ''
org.apache.commons.httpclient.URIException: incorrect scheme
at org.apache.commons.httpclient.URI.parseUriReference(URI.java:1952)
at org.apache.commons.httpclient.URI.(URI.java:167)
at org.apache.commons.httpclient.URI.(URI.java:455)
at com.torunski.crawler.util.LinksUtil.getURI(Unknown Source)
at com.torunski.crawler.util.LinksUtil.retrieveLinks(Unknown Source)
at com.torunski.crawler.util.LinksUtil$1.retrieveLinks(Unknown Source)
at com.torunski.crawler.parser.httpclient.SimpleHttpClientParser.parse(Unknown Source)
at com.torunski.crawler.Crawler.start(Unknown Source)
at com.torunski.crawler.Crawler.start(Unknown Source)
at org.orioai.indexing.crawler.CrawlingThread.run(Unknown Source)
at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)
at java.lang.Thread.run(Thread.java:662)

Si je comprends bien là aussi, le crawler a rencontré des problèmes au moment où il attaquait les notices rapatriées du dépôt de Hal-Shs à cause d'une url qui pose problème. La suite du log est du même tonneau.

Enfin, le log se termine par çà :

271423676 janv./17 14:47:05 INFO cache.OriNameMatchCachingInterceptor run[261] - synchronized put in cache : .public abstract java.lang.String org.orioai.ws.vocabulary.IVocabularyService.getVocabulary(java.lang.String).search_formats
Retrieving document at 'null'.

Ma question est la suivante : où peut-on modifier le lancement automatique de la gestion des liens et du crawler ? Peut-on envisager de le lancer qu'une seule fois dans la nuit après une dernière moisson sur une couche que l'on souhaite moissonner tous les jours ?

Bien à vous

Stéphane Loret
MSH - Tours
Crévilles.org

----- Mail Original -----
De: "Francois Jannin" < >
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Lundi 17 Janvier 2011 16h52:29 GMT +01:00 Amsterdam / Berlin / Berne / Rome / Stockholm / Vienne
Objet: Re: [ori-oai-utilisateurs] Problème de suppression de moisson

Bonjour,

D'après les logs l'invocation des webservices de l'indexing ne fonctionne pas, cela vient peut-être en effet du fait que le crawler verouille l'indexe à ce moment-là : à verifier toutefois dans les logs de l'indexing.
Dans ce cas là, il faudrait vous arranger pour ne pas moissonner pendant le cron du crawling.

Cordialement,
François Jannin

Le 17/01/2011 15:40, sdjloret@free.fr a écrit :

Bonjour,

Je tente de supprimer une moisson à partir de l'interface en cliquant sur l'icone poubelle de l'onglet récoltes à la hauteur du dépôt que je souhaite supprimer. Une fois cliqué, rien ne se passe et j'ai une erreur dans ori-harvester.log

17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry
17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry

La récolte est encore là. Je suis allé dans le module indexing et le crawler était en fonctionnement, est-ce que l'erreur peut provenir de cela ?

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org

--

François Jannin
DSI - Développement et déploiement d'applications
Tél : +33 (0)5 34 32 30 51

INP Toulouse
6 allée Emile Monso - BP 34038
31029 Toulouse cedex 4
http://www.inp-toulouse.fr

Avant d’imprimer ce courriel, demandez-vous si ceci est nécessaire.

francoisjannin
Bonjour,

D'après les logs l'invocation des webservices de l'indexing ne fonctionne pas, cela vient peut-être en effet du fait que le crawler verouille l'indexe à ce moment-là : à verifier toutefois dans les logs de l'indexing.
Dans ce cas là, il faudrait vous arranger pour ne pas moissonner pendant le cron du crawling.

Cordialement,
François Jannin

Le 17/01/2011 15:40, sdjloret@free.fr a écrit :
Bonjour,

Je tente de supprimer une moisson à partir de l'interface en cliquant sur l'icone poubelle de l'onglet récoltes à la hauteur du dépôt que je souhaite supprimer. Une fois cliqué, rien ne se passe et j'ai une erreur dans ori-harvester.log

17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry
17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry

La récolte est encore là. Je suis allé dans le module indexing et le crawler était en fonctionnement, est-ce que l'erreur peut provenir de cela ?

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org


--
" alt="" height="46" width="60" border="0">
François Jannin
DSI - Développement et déploiement d'applications
Tél : +33 (0)5 34 32 30 51
" height="58" width="597">
INP Toulouse
6 allée Emile Monso - BP 34038
31029 Toulouse cedex 4
http://www.inp-toulouse.fr
" height="16" width="16"> Avant d’imprimer ce courriel, demandez-vous si ceci est nécessaire.
stephaneloret
Bonjour,

Je tente de supprimer une moisson à partir de l'interface en cliquant sur l'icone poubelle de l'onglet récoltes à la hauteur du dépôt que je souhaite supprimer. Une fois cliqué, rien ne se passe et j'ai une erreur dans ori-harvester.log

17 janv. 2011 14:58:31,179 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:102 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,187 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:104 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,195 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:109 index entry
17 janv. 2011 14:58:31,202 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,203 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:3755 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,211 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:111 index entry
17 janv. 2011 14:58:31,218 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,219 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:396 index entry
17 janv. 2011 14:58:31,226 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker getUnindexingResult - indexing return error code while indexing / updating oai:oai.crevilles.org:458 index entry
17 janv. 2011 14:58:31,227 [ERROR] catalina-exec-14 org.orioai.harvesting.domain.service.ORIIndexerInvoker deleteRecord - an error occured deleting oai:oai.crevilles.org:458 index entry

La récolte est encore là. Je suis allé dans le module indexing et le crawler était en fonctionnement, est-ce que l'erreur peut provenir de cela ?

Bien cordialement

Stéphane Loret
MSH - Tours
Crévilles.org

Options d'affichage des commentaires

Sélectionnez la méthode d'affichage des commentaires que vous préférez, puis cliquez sur « Enregistrer les paramètres » pour activer vos changements.
Sujet clos