Requete qui ne devrait rien trouver

  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:c7aea3098c2feca0270a75c305a23ff9' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\">\n<HTML><HEAD>\n<META http-equiv=Content-Type content=\"text/html; charset=iso-8859-1\">\n<META content=\"MSHTML 6.00.2900.5848\" name=GENERATOR>\n<STYLE></STYLE>\n</HEAD>\n<BODY bgColor=#ffffff>\n<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>\n<DIV><FONT face=Arial size=2>Bonjour,</FONT></DIV>\n<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>\n<DI</div>', created = 1507751718, expire = 1507838118, headers = '', serialized = 0 WHERE cid = '4:c7aea3098c2feca0270a75c305a23ff9' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:c7aea3098c2feca0270a75c305a23ff9' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\">\n<HTML><HEAD>\n<META http-equiv=Content-Type content=\"text/html; charset=iso-8859-1\">\n<META content=\"MSHTML 6.00.2900.5848\" name=GENERATOR>\n<STYLE></STYLE>\n</HEAD>\n<BODY bgColor=#ffffff>\n<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>\n<DIV><FONT face=Arial size=2>Bonjour,</FONT></DIV>\n<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>\n<DI</div>', created = 1507751718, expire = 1507838118, headers = '', serialized = 0 WHERE cid = '4:c7aea3098c2feca0270a75c305a23ff9' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:a645e370d4317c385887de6042300030' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Rebonjour,</p>\n<p>J\'ai le problème suivant avec l\'indexeur 1.5.0:</p>\n<p>J\'utilise le fichier de configuration liusConfig.xml attaché. Comme j\'utilise l\'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: <a href=\"http://sourceforge.net/projects/lius/files/\" title=\"http://sourceforge.net/projects/lius/files/\">http://sourceforge.net/projects/lius/files/</a>) dans l\'application web.</p>\n<p>Parmi les fiches que j\'ai indexées, il y a la fiche fiche.xml (V.attachement).</p>\n<p>Lorsque j\'exécute la requête suivante:</p>\n<p>%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)</p>\n<p>Aucune fiche n\'est trouvée. Jusque là, tout va bien.</p>\n<p>Par contre, si j\'exécute la requête suivante:</p>\n<p>%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)</p>\n<p>La fiche est trouvée. </p>\n<p>Comment est-ce possible? La deuxième partie de la condition devrait faire en sorte qu\'aucune fiche ne soit trouvée, il me semble, non? </p>\n<p>Est-ce un bug ou plutôt un problème d\'incompréhension de ma part?</p>\n<p>Frédéric Bergeron<br />\nLicef, Teluq</p>\n</div>\n', created = 1507751719, expire = 1507838119, headers = '', serialized = 0 WHERE cid = '4:a645e370d4317c385887de6042300030' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:f3ae49c75b7e8e40bbdbb54e1ca75f78' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n<head>\n <meta content=\"text/html;charset=ISO-8859-1\" http-equiv=\"Content-Type\">\n <title></title>\n</head>\n<body bgcolor=\"#ffffff\" text=\"#000000\">\n<font size=\"-1\"><font face=\"Verdana\">Bonjour Fr&eacute;d&eacute;ric,<br>\n<br>\nJe me demande si ton probl&egrave;me ne vient pas du fait que ta requ&ecirc;te sur\nl\'ID ne porte que sur un seul caract&egrave;re.<br>\nAu lieu d\'utiliser les valeurs A et B, ne peux-tu pas essayer avec TITI\net TOTO pour voir ?<br>\n<br>\nJ\'imagine 2 probl&egrave;mes potentiels:<br>\n- je ne suis pas s&ucirc;r que Lucene accepte une recherche sur le seul terme\nA<br>\n- le terme A pourrait peut-&ecirc;tre &ecirc;tre consid&eacute;rer comme un mot vide<br>\n--&gt; tes tests avec TITI et TOTO nous aideront &agrave; voir si &ccedil;a vient de\nl&agrave;.<br>\n<br>\nTu peux aussi essayer en mettant dans la requ&ecirc;te ....id:(\"A\") avec\nguillemets pour voir.<br>\n<br>\nDans ce cas, est-ce que A et B sont des exemples ou de r&eacute;els ids ?\nEst-ce que tu peux utiliser autre chose ou non ?<br>\nSi non, on pourra essayer une config sp&eacute;cifique pour ce champ dans\nori-oai-indexing, mais pour cela, il faudra que tu nous donnes toute la\nnomenclatures que tu utilises pour ce champ.<br>\n<br>\nAussi, je vois que tu utilises 2 xpaths <br>\n</font></font>%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring<font\n size=\"-1\"><font face=\"Verdana\"><br>\n</font></font>%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid\n<font size=\"-1\"><font face=\"Verdana\"><br>\nPourquoi ne pas prendre un seul xpath\n//lom:classification/lom:taxonPath[lom:source/lom:string=\'</font></font>http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/skill.rdf\']/lom:taxon/lom:id\n?<br>\nJe pense que c\'est la meilleure solution car tu risques d\'avoir des\nprobl&egrave;mes si tu as plusieurs sources de classifications dans la m&ecirc;me\nfiche !<br>\n<br>\nDis-nous ce que &ccedil;a donne !<br>\nA+<br>\n<div class=\"moz-signature\">\n<div class=\"moz-signature\"><font face=\"Verdana\"><small>Yohan COLMANT<br>\nService Informatique<br>\n<a href=\"http://www.univ-valenciennes.fr\">UVHC</a> - Universit&eacute; de\nValenciennes et du Hainaut Cambr&eacute;sis<br>\nCoordinateur Technique du projet <a href=\"http://www.ori-oai.org\">ORI-OAI</a>\n</small></font></div>\n</div>\n<br>\n<br>\nFrederic Bergeron a &eacute;crit&nbsp;:\n<div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <pre wrap=\"\">Rebonjour,\n\nJ\'ai le probl&egrave;me suivant avec l\'indexeur 1.5.0:\n\nJ\'utilise le fichier de configuration liusConfig.xml attach&eacute;. Comme j\'utilise l\'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: <a\n class=\"moz-txt-link-freetext\"\n href=\"http://sourceforge.net/projects/lius/files/\">http://sourceforge.net/projects/lius/files/</a>) dans l\'application web.\n\nParmi les fiches que j\'ai index&eacute;es, il y a la fiche fiche.xml (V.attachement).\n\nLorsque j\'ex&eacute;cute la requ&ecirc;te suivante:\n\n%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)\n\nAucune fiche n\'est trouv&eacute;e. Jusque l&agrave;, tout va bien.\n\nPar contre, si j\'ex&eacute;cute la requ&ecirc;te suivante:\n\n%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)\n\nLa fiche est trouv&eacute;e. \n\nComment est-ce possible? La deuxi&egrave;me partie de la condition devrait faire en sorte qu\'aucune fiche ne soit trouv&eacute;e, il me semble, non? \n\nEst-ce un bug ou plut&ocirc;t un probl&egrave;me d\'incompr&eacute;hension de ma part?\n\nFr&eacute;d&eacute;ric Bergeron\nLicef, Teluq\n\n\n </pre>\n</blockquote></div></div>\n</body>\n</html>\n</div>', created = 1507751720, expire = 1507838120, headers = '', serialized = 0 WHERE cid = '4:f3ae49c75b7e8e40bbdbb54e1ca75f78' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:6c4f8147fedbff0073e0badbd803b940' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n<head>\n <meta content=\"text/html;charset=ISO-8859-1\" http-equiv=\"Content-Type\">\n</head>\n<body bgcolor=\"#ffffff\" text=\"#000000\">\nBonjour,<br>\n<br>\nj\'ai reproduit le probl&egrave;me de mon c&ocirc;t&eacute; avec votre liusConfig.xml. <br>\nD\'abord les sources de Lius, dans lesquelles se trouve\n\"org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer.java\",\nsont d&eacute;j&agrave; pr&eacute;sentes dans le module ori-oai-indexing. Il est donc\ninutile d\'int&eacute;grer Lius1.0.jar, d\'autant plus que certaines classes de\nLius ont &eacute;t&eacute; modifi&eacute;es dans le module d\'indexation.<br>\n<br>\nEnsuite en regardant le code de cet Analyzer on voit qu\'il contient des\nmots stop tels que \"a\", \"c\" ... Je pense que le probl&egrave;me vient de l&agrave;.<br>\nJe vous propose donc d\'utiliser votre propre classe bas&eacute;e sur cet\nanalyzer et dont vous supprimez les mots stop &agrave; un seul caract&egrave;re, et\nde l\'appeler dans liusConfig.xml. Ceci vous permettra de ne pas avoir &agrave;\nretoucher &agrave; UTF8AccentRemoverAnalyzer.java &agrave; chaque nouvelle version\nd\'OOIndexing.<br>\n<br>\nEst-ce que &ccedil;a r&eacute;sout votre probl&egrave;me?<br>\n<br>\nUne autre solution serait d\'utiliser les remplacements de caract&egrave;res\ndans le fichier configIndexing.xml (partie nomm&eacute;e : Chaines de\nremplacement). N\'h&eacute;sitez pas &agrave; revenir vers moi pour vous aider &agrave;\nconfigurer cette partie.<br>\n<br>\n<br>\nCordialement<br>\n<br>\nYannick<br>\n<br>\n<br>\nFrederic Bergeron a &eacute;crit&nbsp;:\n<div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <pre wrap=\"\">On Thu, Sep 10, 2009 at 07:43:12PM +0200, Yohan Colmant wrote:\n </pre>\n <div class=\"emailFilter_Author_1\"><blockquote type=\"cite\">\n <pre wrap=\"\">Bonjour Fr&eacute;d&eacute;ric,\n\nJe me demande si ton probl&egrave;me ne vient pas du fait que ta requ&ecirc;te sur l\'ID ne\nporte que sur un seul caract&egrave;re.\nAu lieu d\'utiliser les valeurs A et B, ne peux-tu pas essayer avec TITI et TOTO\npour voir ?\n\nJ\'imagine 2 probl&egrave;mes potentiels:\n- je ne suis pas s&ucirc;r que Lucene accepte une recherche sur le seul terme A\n- le terme A pourrait peut-&ecirc;tre &ecirc;tre consid&eacute;rer comme un mot vide\n--&gt; tes tests avec TITI et TOTO nous aideront &agrave; voir si &ccedil;a vient de l&agrave;.\n </pre>\n </blockquote></div>\n <pre wrap=\"\"><!---->\nC\'est probablement &ccedil;a le probl&egrave;me. Quand j\'utilise une seule lettre, des fois &ccedil;a semble fonctionner, d\'autres fois, non. Avec des chiffres pourtant, &ccedil;a fonctionne toujours.\n\n\n </pre>\n <div class=\"emailFilter_Author_1\"><blockquote type=\"cite\">\n <pre wrap=\"\">Tu peux aussi essayer en mettant dans la requ&ecirc;te ....id:(\"A\") avec guillemets\npour voir.\n </pre>\n </blockquote></div>\n <pre wrap=\"\"><!---->\n&Ccedil;a ne change rien.\n\n\n </pre>\n <div class=\"emailFilter_Author_1\"><blockquote type=\"cite\">\n <pre wrap=\"\">Dans ce cas, est-ce que A et B sont des exemples ou de r&eacute;els ids ? Est-ce que\ntu peux utiliser autre chose ou non ?\nSi non, on pourra essayer une config sp&eacute;cifique pour ce champ dans\nori-oai-indexing, mais pour cela, il faudra que tu nous donnes toute la\nnomenclatures que tu utilises pour ce champ.\n </pre>\n </blockquote></div>\n <pre wrap=\"\"><!---->\nCe sont des vrais ids. \n\nLes d&eacute;tais pour les 3 classifications que j\'utilise le plus souvent sont ici:\n\n<a class=\"moz-txt-link-freetext\" href=\"http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf\">http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf</a>\n<a class=\"moz-txt-link-freetext\" href=\"http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf\">http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf</a>\n<a class=\"moz-txt-link-freetext\" href=\"http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf\">http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf</a>\n\nToutes ces classifications comportent des ids avec 1 caract&egrave;re :-(\n\nComme plusieurs ressources font d&eacute;j&agrave; r&eacute;f&eacute;rence &agrave; ces derni&egrave;res. Je ne peux pas vraiment les changer. J\'attache un lom utilisant plusieurs valeurs provenant de ces classifications pour illustrer.\n\n\n </pre>\n <div class=\"emailFilter_Author_1\"><blockquote type=\"cite\">\n <pre wrap=\"\">Aussi, je vois que tu utilises 2 xpaths\n%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring\n%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid\nPourquoi ne pas prendre un seul xpath //lom:classification/lom:taxonPath\n[lom:source/lom:string=\'http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/\nskill.rdf\']/lom:taxon/lom:id ?\nJe pense que c\'est la meilleure solution car tu risques d\'avoir des probl&egrave;mes\nsi tu as plusieurs sources de classifications dans la m&ecirc;me fiche !\n </pre>\n </blockquote></div>\n <pre wrap=\"\"><!---->\nEn effet, c\'est meilleur comme &ccedil;a. J\'ai eu des probl&egrave;mes avec la valeur string entre crochets. Semble-t-il qu\'elle doit &ecirc;tre encoder pour que &ccedil;a fonctionne correctement, comme ceci:\n\n%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%5Bcontains%28lom%3Asource%2Flom%3Astring%2C%27http%3A%2F%2Fwww1.licef.ca%2Fontology%2Fskill%2FGPaquette-200506%2Fskill.rdf%27%29%5D%2Flom%3Ataxon%2Flom%3Aid:(B)\n\n\n </pre>\n <div class=\"emailFilter_Author_1\"><blockquote type=\"cite\">\n <pre wrap=\"\"> Rebonjour,\n\n J\'ai le probl&egrave;me suivant avec l\'indexeur 1.5.0:\n\n J\'utilise le fichier de configuration liusConfig.xml attach&eacute;. Comme j\'utilise l\'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: <a class=\"moz-txt-link-freetext\" href=\"http://sourceforge.net/projects/lius/files/\">http://sourceforge.net/projects/lius/files/</a>) dans l\'application web.\n\n Parmi les fiches que j\'ai index&eacute;es, il y a la fiche fiche.xml (V.attachement).\n\n Lorsque j\'ex&eacute;cute la requ&ecirc;te suivante:\n\n %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)\n\n Aucune fiche n\'est trouv&eacute;e. Jusque l&agrave;, tout va bien.\n\n Par contre, si j\'ex&eacute;cute la requ&ecirc;te suivante:\n\n %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)\n\n La fiche est trouv&eacute;e.\n\n Comment est-ce possible? La deuxi&egrave;me partie de la condition devrait faire en sorte qu\'aucune fiche ne soit trouv&eacute;e, il me semble, non?\n\n Est-ce un bug ou plut&ocirc;t un probl&egrave;me d\'incompr&eacute;hension de ma part?\n\n Fr&eacute;d&eacute;ric Bergeron\n Licef, Teluq\n\n\n\n\n </pre>\n </blockquote></div>\n <pre wrap=\"\"><!---->\n </pre>\n</blockquote></div></div>\n<br>\n</body>\n</html>\n</div>', created = 1507751720, expire = 1507838120, headers = '', serialized = 0 WHERE cid = '4:6c4f8147fedbff0073e0badbd803b940' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:85373b1ef5713a73fbbfa7c7820d9056' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">On Tue, Sep 15, 2009 at 05:17:46PM +0200, Yannick Caillaux wrote:<br />\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Bonjour,<br />\n><br />\n> Ensuite en regardant le code de cet Analyzer on voit qu\'il contient des mots<br />\n> stop tels que \"a\", \"c\" ... Je pense que le problème vient de là.<br />\n> Je vous propose donc d\'utiliser votre propre classe basée sur cet analyzer et<br />\n> dont vous supprimez les mots stop à un seul caractère, et de l\'appeler dans<br />\n> liusConfig.xml. Ceci vous permettra de ne pas avoir à retoucher à<br />\n> UTF8AccentRemoverAnalyzer.java à chaque nouvelle version d\'OOIndexing.<br />\n><br />\n> Est-ce que ça résout votre problème?</div>\n</blockquote>\n<p>Oui, ça marche. Merci beaucoup Yannick!</p>\n</div>\n', created = 1507751720, expire = 1507838120, headers = '', serialized = 0 WHERE cid = '4:85373b1ef5713a73fbbfa7c7820d9056' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:06aaa2fef12791641a109e4f917ca281' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">On Thu, Sep 10, 2009 at 07:43:12PM +0200, Yohan Colmant wrote:<br />\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Bonjour Frédéric,<br />\n><br />\n> Je me demande si ton problème ne vient pas du fait que ta requête sur l\'ID ne<br />\n> porte que sur un seul caractère.<br />\n> Au lieu d\'utiliser les valeurs A et B, ne peux-tu pas essayer avec TITI et TOTO<br />\n> pour voir ?<br />\n><br />\n> J\'imagine 2 problèmes potentiels:<br />\n> - je ne suis pas sûr que Lucene accepte une recherche sur le seul terme A<br />\n> - le terme A pourrait peut-être être considérer comme un mot vide<br />\n> --> tes tests avec TITI et TOTO nous aideront à voir si ça vient de là.</div>\n</blockquote>\n<p>C\'est probablement ça le problème. Quand j\'utilise une seule lettre, des fois ça semble fonctionner, d\'autres fois, non. Avec des chiffres pourtant, ça fonctionne toujours.</p>\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Tu peux aussi essayer en mettant dans la requête ....id:(\"A\") avec guillemets<br />\n> pour voir.</div>\n</blockquote>\n<p>Ça ne change rien.</p>\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Dans ce cas, est-ce que A et B sont des exemples ou de réels ids ? Est-ce que<br />\n> tu peux utiliser autre chose ou non ?<br />\n> Si non, on pourra essayer une config spécifique pour ce champ dans<br />\n> ori-oai-indexing, mais pour cela, il faudra que tu nous donnes toute la<br />\n> nomenclatures que tu utilises pour ce champ.</div>\n</blockquote>\n<p>Ce sont des vrais ids. </p>\n<p>Les détais pour les 3 classifications que j\'utilise le plus souvent sont ici:</p>\n<p><a href=\"http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf\" title=\"http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf\">http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf</a><br />\n<a href=\"http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf\" title=\"http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf\">http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf</a><br />\n<a href=\"http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf\" title=\"http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf\">http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf</a></p>\n<p>Toutes ces classifications comportent des ids avec 1 caractère :-(</p>\n<p>Comme plusieurs ressources font déjà référence à ces dernières. Je ne peux pas vraiment les changer. J\'attache un lom utilisant plusieurs valeurs provenant de ces classifications pour illustrer.</p>\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Aussi, je vois que tu utilises 2 xpaths<br />\n> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring<br />\n> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid<br />\n> Pourquoi ne pas prendre un seul xpath //lom:classification/lom:taxonPath<br />\n> [lom:source/lom:string=\'http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/<br />\n> skill.rdf\']/lom:taxon/lom:id ?<br />\n> Je pense que c\'est la meilleure solution car tu risques d\'avoir des problèmes<br />\n> si tu as plusieurs sources de classifications dans la même fiche !</div>\n</blockquote>\n<p>En effet, c\'est meilleur comme ça. J\'ai eu des problèmes avec la valeur string entre crochets. Semble-t-il qu\'elle doit être encoder pour que ça fonctionne correctement, comme ceci:</p>\n<p>%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%5Bcontains%28lom%3Asource%2Flom%3Astring%2C%27http%3A%2F%2Fwww1.licef.ca%2Fontology%2Fskill%2FGPaquette-200506%2Fskill.rdf%27%29%5D%2Flom%3Ataxon%2Flom%3Aid:(B)</p>\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Rebonjour,<br />\n><br />\n> J\'ai le problème suivant avec l\'indexeur 1.5.0:<br />\n><br />\n> J\'utilise le fichier de configuration liusConfig.xml attaché. Comme j\'utilise l\'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: <a href=\"http://sourceforge.net/projects/lius/files/\" title=\"http://sourceforge.net/projects/lius/files/\">http://sourceforge.net/projects/lius/files/</a>) dans l\'application web.<br />\n><br />\n> Parmi les fiches que j\'ai indexées, il y a la fiche fiche.xml (V.attachement).<br />\n><br />\n> Lorsque j\'exécute la requête suivante:<br />\n><br />\n> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)<br />\n><br />\n> Aucune fiche n\'est trouvée. Jusque là, tout va bien.<br />\n><br />\n> Par contre, si j\'exécute la requête suivante:<br />\n><br />\n> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)<br />\n><br />\n> La fiche est trouvée.<br />\n><br />\n> Comment est-ce possible? La deuxième partie de la condition devrait faire en sorte qu\'aucune fiche ne soit trouvée, il me semble, non?<br />\n><br />\n> Est-ce un bug ou plutôt un problème d\'incompréhension de ma part?<br />\n><br />\n> Frédéric Bergeron<br />\n> Licef, Teluq<br />\n><br />\n><br />\n><br />\n> </div>\n</blockquote>\n<p>--<br />\nSHA1 Fingerprint : 787E 8700 36EF 49F4 FD89 0868 E90F AFB5 06CB 2F53<br />\nCA Certificate : <a href=\"http://www1.licef.teluq.uquebec.ca/ssl/ca.crt\" title=\"http://www1.licef.teluq.uquebec.ca/ssl/ca.crt\">http://www1.licef.teluq.uquebec.ca/ssl/ca.crt</a></p>\n</div>\n', created = 1507751720, expire = 1507838120, headers = '', serialized = 0 WHERE cid = '4:06aaa2fef12791641a109e4f917ca281' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
5 messages / 0 nouveaux
Dernière contribution
fredericbergeron
Requete qui ne devrait rien trouver
Rebonjour,

J'ai le problème suivant avec l'indexeur 1.5.0:

J'utilise le fichier de configuration liusConfig.xml attaché. Comme j'utilise l'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: http://sourceforge.net/projects/lius/files/) dans l'application web.

Parmi les fiches que j'ai indexées, il y a la fiche fiche.xml (V.attachement).

Lorsque j'exécute la requête suivante:

%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)

Aucune fiche n'est trouvée. Jusque là, tout va bien.

Par contre, si j'exécute la requête suivante:

%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\://www1.licef.ca/ontology/skill/GPaquette\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)

La fiche est trouvée.

Comment est-ce possible? La deuxième partie de la condition devrait faire en sorte qu'aucune fiche ne soit trouvée, il me semble, non?

Est-ce un bug ou plutôt un problème d'incompréhension de ma part?

Frédéric Bergeron
Licef, Teluq

Yohan Colmant
Bonjour Frédéric,

Je me demande si ton problème ne vient pas du fait que ta requête sur l'ID ne porte que sur un seul caractère.
Au lieu d'utiliser les valeurs A et B, ne peux-tu pas essayer avec TITI et TOTO pour voir ?

J'imagine 2 problèmes potentiels:
- je ne suis pas sûr que Lucene accepte une recherche sur le seul terme A
- le terme A pourrait peut-être être considérer comme un mot vide
--> tes tests avec TITI et TOTO nous aideront à voir si ça vient de là.

Tu peux aussi essayer en mettant dans la requête ....id:("A") avec guillemets pour voir.

Dans ce cas, est-ce que A et B sont des exemples ou de réels ids ? Est-ce que tu peux utiliser autre chose ou non ?
Si non, on pourra essayer une config spécifique pour ce champ dans ori-oai-indexing, mais pour cela, il faudra que tu nous donnes toute la nomenclatures que tu utilises pour ce champ.

Aussi, je vois que tu utilises 2 xpaths
%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring
%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid
Pourquoi ne pas prendre un seul xpath //lom:classification/lom:taxonPath[lom:source/lom:string='
http\://www1.licef.ca/ontology/skill/GPaquette\-200506/skill.rdf']/lom:taxon/lom:id ?
Je pense que c'est la meilleure solution car tu risques d'avoir des problèmes si tu as plusieurs sources de classifications dans la même fiche !

Dis-nous ce que ça donne !
A+
Yohan COLMANT
Service Informatique
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI


Frederic Bergeron a écrit :
Rebonjour,

J'ai le problème suivant avec l'indexeur 1.5.0:

J'utilise le fichier de configuration liusConfig.xml attaché.   Comme j'utilise l'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: http://sourceforge.net/projects/lius/files/) dans l'application web.

Parmi les fiches que j'ai indexées, il y a la fiche fiche.xml (V.attachement).

Lorsque j'exécute la requête suivante:

%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)

Aucune fiche n'est trouvée.  Jusque là, tout va bien.

Par contre, si j'exécute la requête suivante:

%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\://www1.licef.ca/ontology/skill/GPaquette\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)

La fiche est trouvée.  

Comment est-ce possible?  La deuxième partie de la condition devrait faire en sorte qu'aucune fiche ne soit trouvée, il me semble, non?  

Est-ce un bug ou plutôt un problème d'incompréhension de ma part?

Frédéric Bergeron
Licef, Teluq


  
yannickcaillaux
Bonjour,

j'ai reproduit le problème de mon côté avec votre liusConfig.xml.
D'abord les sources de Lius, dans lesquelles se trouve "org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer.java", sont déjà présentes dans le module ori-oai-indexing. Il est donc inutile d'intégrer Lius1.0.jar, d'autant plus que certaines classes de Lius ont été modifiées dans le module d'indexation.

Ensuite en regardant le code de cet Analyzer on voit qu'il contient des mots stop tels que "a", "c" ... Je pense que le problème vient de là.
Je vous propose donc d'utiliser votre propre classe basée sur cet analyzer et dont vous supprimez les mots stop à un seul caractère, et de l'appeler dans liusConfig.xml. Ceci vous permettra de ne pas avoir à retoucher à UTF8AccentRemoverAnalyzer.java à chaque nouvelle version d'OOIndexing.

Est-ce que ça résout votre problème?

Une autre solution serait d'utiliser les remplacements de caractères dans le fichier configIndexing.xml (partie nommée : Chaines de remplacement). N'hésitez pas à revenir vers moi pour vous aider à configurer cette partie.


Cordialement

Yannick


Frederic Bergeron a écrit :
On Thu, Sep 10, 2009 at 07:43:12PM +0200, Yohan Colmant wrote:
  
Bonjour Frédéric,

Je me demande si ton problème ne vient pas du fait que ta requête sur l'ID ne
porte que sur un seul caractère.
Au lieu d'utiliser les valeurs A et B, ne peux-tu pas essayer avec TITI et TOTO
pour voir ?

J'imagine 2 problèmes potentiels:
- je ne suis pas sûr que Lucene accepte une recherche sur le seul terme A
- le terme A pourrait peut-être être considérer comme un mot vide
--> tes tests avec TITI et TOTO nous aideront à voir si ça vient de là.
    

C'est probablement ça le problème.  Quand j'utilise une seule lettre, des fois ça semble fonctionner, d'autres fois, non.  Avec des chiffres pourtant, ça fonctionne toujours.


  
Tu peux aussi essayer en mettant dans la requête ....id:("A") avec guillemets
pour voir.
    

Ça ne change rien.


  
Dans ce cas, est-ce que A et B sont des exemples ou de réels ids ? Est-ce que
tu peux utiliser autre chose ou non ?
Si non, on pourra essayer une config spécifique pour ce champ dans
ori-oai-indexing, mais pour cela, il faudra que tu nous donnes toute la
nomenclatures que tu utilises pour ce champ.
    

Ce sont des vrais ids.  

Les détais pour les 3 classifications que j'utilise le plus souvent sont ici:

http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf
http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf
http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf

Toutes ces classifications comportent des ids avec 1 caractère :-(

Comme plusieurs ressources font déjà référence à ces dernières.  Je ne peux pas vraiment les changer.  J'attache un lom utilisant plusieurs valeurs provenant de ces classifications pour illustrer.


  
Aussi, je vois que tu utilises 2 xpaths
%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring
%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid
Pourquoi ne pas prendre un seul xpath //lom:classification/lom:taxonPath
[lom:source/lom:string='http\://www1.licef.ca/ontology/skill/GPaquette\-200506/
skill.rdf']/lom:taxon/lom:id ?
Je pense que c'est la meilleure solution car tu risques d'avoir des problèmes
si tu as plusieurs sources de classifications dans la même fiche !
    

En effet, c'est meilleur comme ça.  J'ai eu des problèmes avec la valeur string entre crochets.  Semble-t-il qu'elle doit être encoder pour que ça fonctionne correctement, comme ceci:

%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%5Bcontains%28lom%3Asource%2Flom%3Astring%2C%27http%3A%2F%2Fwww1.licef.ca%2Fontology%2Fskill%2FGPaquette-200506%2Fskill.rdf%27%29%5D%2Flom%3Ataxon%2Flom%3Aid:(B)


  
    Rebonjour,

    J'ai le problème suivant avec l'indexeur 1.5.0:

    J'utilise le fichier de configuration liusConfig.xml attaché.   Comme j'utilise l'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: http://sourceforge.net/projects/lius/files/) dans l'application web.

    Parmi les fiches que j'ai indexées, il y a la fiche fiche.xml (V.attachement).

    Lorsque j'exécute la requête suivante:

    %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)

    Aucune fiche n'est trouvée.  Jusque là, tout va bien.

    Par contre, si j'exécute la requête suivante:

    %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\://www1.licef.ca/ontology/skill/GPaquette\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)

    La fiche est trouvée.

    Comment est-ce possible?  La deuxième partie de la condition devrait faire en sorte qu'aucune fiche ne soit trouvée, il me semble, non?

    Est-ce un bug ou plutôt un problème d'incompréhension de ma part?

    Frédéric Bergeron
    Licef, Teluq




    

  

fredericbergeron
On Tue, Sep 15, 2009 at 05:17:46PM +0200, Yannick Caillaux wrote:

> Bonjour,
>
> Ensuite en regardant le code de cet Analyzer on voit qu'il contient des mots
> stop tels que "a", "c" ... Je pense que le problème vient de là.
> Je vous propose donc d'utiliser votre propre classe basée sur cet analyzer et
> dont vous supprimez les mots stop à un seul caractère, et de l'appeler dans
> liusConfig.xml. Ceci vous permettra de ne pas avoir à retoucher à
> UTF8AccentRemoverAnalyzer.java à chaque nouvelle version d'OOIndexing.
>
> Est-ce que ça résout votre problème?

Oui, ça marche. Merci beaucoup Yannick!

fredericbergeron
On Thu, Sep 10, 2009 at 07:43:12PM +0200, Yohan Colmant wrote:

> Bonjour Frédéric,
>
> Je me demande si ton problème ne vient pas du fait que ta requête sur l'ID ne
> porte que sur un seul caractère.
> Au lieu d'utiliser les valeurs A et B, ne peux-tu pas essayer avec TITI et TOTO
> pour voir ?
>
> J'imagine 2 problèmes potentiels:
> - je ne suis pas sûr que Lucene accepte une recherche sur le seul terme A
> - le terme A pourrait peut-être être considérer comme un mot vide
> --> tes tests avec TITI et TOTO nous aideront à voir si ça vient de là.

C'est probablement ça le problème. Quand j'utilise une seule lettre, des fois ça semble fonctionner, d'autres fois, non. Avec des chiffres pourtant, ça fonctionne toujours.

> Tu peux aussi essayer en mettant dans la requête ....id:("A") avec guillemets
> pour voir.

Ça ne change rien.

> Dans ce cas, est-ce que A et B sont des exemples ou de réels ids ? Est-ce que
> tu peux utiliser autre chose ou non ?
> Si non, on pourra essayer une config spécifique pour ce champ dans
> ori-oai-indexing, mais pour cela, il faudra que tu nous donnes toute la
> nomenclatures que tu utilises pour ce champ.

Ce sont des vrais ids.

Les détais pour les 3 classifications que j'utilise le plus souvent sont ici:

http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf
http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf
http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf

Toutes ces classifications comportent des ids avec 1 caractère :-(

Comme plusieurs ressources font déjà référence à ces dernières. Je ne peux pas vraiment les changer. J'attache un lom utilisant plusieurs valeurs provenant de ces classifications pour illustrer.

> Aussi, je vois que tu utilises 2 xpaths
> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring
> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid
> Pourquoi ne pas prendre un seul xpath //lom:classification/lom:taxonPath
> [lom:source/lom:string='http\://www1.licef.ca/ontology/skill/GPaquette\-200506/
> skill.rdf']/lom:taxon/lom:id ?
> Je pense que c'est la meilleure solution car tu risques d'avoir des problèmes
> si tu as plusieurs sources de classifications dans la même fiche !

En effet, c'est meilleur comme ça. J'ai eu des problèmes avec la valeur string entre crochets. Semble-t-il qu'elle doit être encoder pour que ça fonctionne correctement, comme ceci:

%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%5Bcontains%28lom%3Asource%2Flom%3Astring%2C%27http%3A%2F%2Fwww1.licef.ca%2Fontology%2Fskill%2FGPaquette-200506%2Fskill.rdf%27%29%5D%2Flom%3Ataxon%2Flom%3Aid:(B)

> Rebonjour,
>
> J'ai le problème suivant avec l'indexeur 1.5.0:
>
> J'utilise le fichier de configuration liusConfig.xml attaché. Comme j'utilise l'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: http://sourceforge.net/projects/lius/files/) dans l'application web.
>
> Parmi les fiches que j'ai indexées, il y a la fiche fiche.xml (V.attachement).
>
> Lorsque j'exécute la requête suivante:
>
> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)
>
> Aucune fiche n'est trouvée. Jusque là, tout va bien.
>
> Par contre, si j'exécute la requête suivante:
>
> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\://www1.licef.ca/ontology/skill/GPaquette\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)
>
> La fiche est trouvée.
>
> Comment est-ce possible? La deuxième partie de la condition devrait faire en sorte qu'aucune fiche ne soit trouvée, il me semble, non?
>
> Est-ce un bug ou plutôt un problème d'incompréhension de ma part?
>
> Frédéric Bergeron
> Licef, Teluq
>
>
>
>

--
SHA1 Fingerprint : 787E 8700 36EF 49F4 FD89 0868 E90F AFB5 06CB 2F53
CA Certificate : http://www1.licef.teluq.uquebec.ca/ssl/ca.crt

Options d'affichage des commentaires

Sélectionnez la méthode d'affichage des commentaires que vous préférez, puis cliquez sur « Enregistrer les paramètres » pour activer vos changements.
Sujet clos