Requete qui ne devrait rien trouver

user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:c7aea3098c2feca0270a75c305a23ff9' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\">\n<HTML><HEAD>\n<META http-equiv=Content-Type content=\"text/html; charset=iso-8859-1\">\n<META content=\"MSHTML 6.00.2900.5848\" name=GENERATOR>\n<STYLE></STYLE>\n</HEAD>\n<BODY bgColor=#ffffff>\n<DIV><FONT face=Arial size=2></FONT> </DIV>\n<DIV><FONT face=Arial size=2>Bonjour,</FONT></DIV>\n<DIV><FONT face=Arial size=2></FONT> </DIV>\n<DI</div>', created = 1507751718, expire = 1507838118, headers = '', serialized = 0 WHERE cid = '4:c7aea3098c2feca0270a75c305a23ff9' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:c7aea3098c2feca0270a75c305a23ff9' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\">\n<HTML><HEAD>\n<META http-equiv=Content-Type content=\"text/html; charset=iso-8859-1\">\n<META content=\"MSHTML 6.00.2900.5848\" name=GENERATOR>\n<STYLE></STYLE>\n</HEAD>\n<BODY bgColor=#ffffff>\n<DIV><FONT face=Arial size=2></FONT> </DIV>\n<DIV><FONT face=Arial size=2>Bonjour,</FONT></DIV>\n<DIV><FONT face=Arial size=2></FONT> </DIV>\n<DI</div>', created = 1507751718, expire = 1507838118, headers = '', serialized = 0 WHERE cid = '4:c7aea3098c2feca0270a75c305a23ff9' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:a645e370d4317c385887de6042300030' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Rebonjour,</p>\n<p>J\'ai le problème suivant avec l\'indexeur 1.5.0:</p>\n<p>J\'utilise le fichier de configuration liusConfig.xml attaché. Comme j\'utilise l\'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: <a href=\"http://sourceforge.net/projects/lius/files/\" title=\"http://sourceforge.net/projects/lius/files/\">http://sourceforge.net/projects/lius/files/</a>) dans l\'application web.</p>\n<p>Parmi les fiches que j\'ai indexées, il y a la fiche fiche.xml (V.attachement).</p>\n<p>Lorsque j\'exécute la requête suivante:</p>\n<p>%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)</p>\n<p>Aucune fiche n\'est trouvée. Jusque là, tout va bien.</p>\n<p>Par contre, si j\'exécute la requête suivante:</p>\n<p>%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)</p>\n<p>La fiche est trouvée. </p>\n<p>Comment est-ce possible? La deuxième partie de la condition devrait faire en sorte qu\'aucune fiche ne soit trouvée, il me semble, non? </p>\n<p>Est-ce un bug ou plutôt un problème d\'incompréhension de ma part?</p>\n<p>Frédéric Bergeron<br />\nLicef, Teluq</p>\n</div>\n', created = 1507751719, expire = 1507838119, headers = '', serialized = 0 WHERE cid = '4:a645e370d4317c385887de6042300030' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:f3ae49c75b7e8e40bbdbb54e1ca75f78' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n<head>\n <meta content=\"text/html;charset=ISO-8859-1\" http-equiv=\"Content-Type\">\n <title></title>\n</head>\n<body bgcolor=\"#ffffff\" text=\"#000000\">\n<font size=\"-1\"><font face=\"Verdana\">Bonjour Frédéric,<br>\n<br>\nJe me demande si ton problème ne vient pas du fait que ta requête sur\nl\'ID ne porte que sur un seul caractère.<br>\nAu lieu d\'utiliser les valeurs A et B, ne peux-tu pas essayer avec TITI\net TOTO pour voir ?<br>\n<br>\nJ\'imagine 2 problèmes potentiels:<br>\n- je ne suis pas sûr que Lucene accepte une recherche sur le seul terme\nA<br>\n- le terme A pourrait peut-être être considérer comme un mot vide<br>\n--> tes tests avec TITI et TOTO nous aideront à voir si ça vient de\nlà.<br>\n<br>\nTu peux aussi essayer en mettant dans la requête ....id:(\"A\") avec\nguillemets pour voir.<br>\n<br>\nDans ce cas, est-ce que A et B sont des exemples ou de réels ids ?\nEst-ce que tu peux utiliser autre chose ou non ?<br>\nSi non, on pourra essayer une config spécifique pour ce champ dans\nori-oai-indexing, mais pour cela, il faudra que tu nous donnes toute la\nnomenclatures que tu utilises pour ce champ.<br>\n<br>\nAussi, je vois que tu utilises 2 xpaths <br>\n</font></font>%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring<font\n size=\"-1\"><font face=\"Verdana\"><br>\n</font></font>%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid\n<font size=\"-1\"><font face=\"Verdana\"><br>\nPourquoi ne pas prendre un seul xpath\n//lom:classification/lom:taxonPath[lom:source/lom:string=\'</font></font>http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/skill.rdf\']/lom:taxon/lom:id\n?<br>\nJe pense que c\'est la meilleure solution car tu risques d\'avoir des\nproblèmes si tu as plusieurs sources de classifications dans la même\nfiche !<br>\n<br>\nDis-nous ce que ça donne !<br>\nA+<br>\n<div class=\"moz-signature\">\n<div class=\"moz-signature\"><font face=\"Verdana\"><small>Yohan COLMANT<br>\nService Informatique<br>\n<a href=\"http://www.univ-valenciennes.fr\">UVHC</a> - Université de\nValenciennes et du Hainaut Cambrésis<br>\nCoordinateur Technique du projet <a href=\"http://www.ori-oai.org\">ORI-OAI</a>\n</small></font></div>\n</div>\n<br>\n<br>\nFrederic Bergeron a écrit :\n<div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <pre wrap=\"\">Rebonjour,\n\nJ\'ai le problème suivant avec l\'indexeur 1.5.0:\n\nJ\'utilise le fichier de configuration liusConfig.xml attaché. Comme j\'utilise l\'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: <a\n class=\"moz-txt-link-freetext\"\n href=\"http://sourceforge.net/projects/lius/files/\">http://sourceforge.net/projects/lius/files/</a>) dans l\'application web.\n\nParmi les fiches que j\'ai indexées, il y a la fiche fiche.xml (V.attachement).\n\nLorsque j\'exécute la requête suivante:\n\n%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)\n\nAucune fiche n\'est trouvée. Jusque là, tout va bien.\n\nPar contre, si j\'exécute la requête suivante:\n\n%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)\n\nLa fiche est trouvée. \n\nComment est-ce possible? La deuxième partie de la condition devrait faire en sorte qu\'aucune fiche ne soit trouvée, il me semble, non? \n\nEst-ce un bug ou plutôt un problème d\'incompréhension de ma part?\n\nFrédéric Bergeron\nLicef, Teluq\n\n\n </pre>\n</blockquote></div></div>\n</body>\n</html>\n</div>', created = 1507751720, expire = 1507838120, headers = '', serialized = 0 WHERE cid = '4:f3ae49c75b7e8e40bbdbb54e1ca75f78' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:6c4f8147fedbff0073e0badbd803b940' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n<head>\n <meta content=\"text/html;charset=ISO-8859-1\" http-equiv=\"Content-Type\">\n</head>\n<body bgcolor=\"#ffffff\" text=\"#000000\">\nBonjour,<br>\n<br>\nj\'ai reproduit le problème de mon côté avec votre liusConfig.xml. <br>\nD\'abord les sources de Lius, dans lesquelles se trouve\n\"org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer.java\",\nsont déjà présentes dans le module ori-oai-indexing. Il est donc\ninutile d\'intégrer Lius1.0.jar, d\'autant plus que certaines classes de\nLius ont été modifiées dans le module d\'indexation.<br>\n<br>\nEnsuite en regardant le code de cet Analyzer on voit qu\'il contient des\nmots stop tels que \"a\", \"c\" ... Je pense que le problème vient de là.<br>\nJe vous propose donc d\'utiliser votre propre classe basée sur cet\nanalyzer et dont vous supprimez les mots stop à un seul caractère, et\nde l\'appeler dans liusConfig.xml. Ceci vous permettra de ne pas avoir à\nretoucher à UTF8AccentRemoverAnalyzer.java à chaque nouvelle version\nd\'OOIndexing.<br>\n<br>\nEst-ce que ça résout votre problème?<br>\n<br>\nUne autre solution serait d\'utiliser les remplacements de caractères\ndans le fichier configIndexing.xml (partie nommée : Chaines de\nremplacement). N\'hésitez pas à revenir vers moi pour vous aider à\nconfigurer cette partie.<br>\n<br>\n<br>\nCordialement<br>\n<br>\nYannick<br>\n<br>\n<br>\nFrederic Bergeron a écrit :\n<div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <pre wrap=\"\">On Thu, Sep 10, 2009 at 07:43:12PM +0200, Yohan Colmant wrote:\n </pre>\n <div class=\"emailFilter_Author_1\"><blockquote type=\"cite\">\n <pre wrap=\"\">Bonjour Frédéric,\n\nJe me demande si ton problème ne vient pas du fait que ta requête sur l\'ID ne\nporte que sur un seul caractère.\nAu lieu d\'utiliser les valeurs A et B, ne peux-tu pas essayer avec TITI et TOTO\npour voir ?\n\nJ\'imagine 2 problèmes potentiels:\n- je ne suis pas sûr que Lucene accepte une recherche sur le seul terme A\n- le terme A pourrait peut-être être considérer comme un mot vide\n--> tes tests avec TITI et TOTO nous aideront à voir si ça vient de là.\n </pre>\n </blockquote></div>\n <pre wrap=\"\">\nC\'est probablement ça le problème. Quand j\'utilise une seule lettre, des fois ça semble fonctionner, d\'autres fois, non. Avec des chiffres pourtant, ça fonctionne toujours.\n\n\n </pre>\n <div class=\"emailFilter_Author_1\"><blockquote type=\"cite\">\n <pre wrap=\"\">Tu peux aussi essayer en mettant dans la requête ....id:(\"A\") avec guillemets\npour voir.\n </pre>\n </blockquote></div>\n <pre wrap=\"\">\nÇa ne change rien.\n\n\n </pre>\n <div class=\"emailFilter_Author_1\"><blockquote type=\"cite\">\n <pre wrap=\"\">Dans ce cas, est-ce que A et B sont des exemples ou de réels ids ? Est-ce que\ntu peux utiliser autre chose ou non ?\nSi non, on pourra essayer une config spécifique pour ce champ dans\nori-oai-indexing, mais pour cela, il faudra que tu nous donnes toute la\nnomenclatures que tu utilises pour ce champ.\n </pre>\n </blockquote></div>\n <pre wrap=\"\">\nCe sont des vrais ids. \n\nLes détais pour les 3 classifications que j\'utilise le plus souvent sont ici:\n\n<a class=\"moz-txt-link-freetext\" href=\"http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf\">http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf</a>\n<a class=\"moz-txt-link-freetext\" href=\"http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf\">http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf</a>\n<a class=\"moz-txt-link-freetext\" href=\"http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf\">http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf</a>\n\nToutes ces classifications comportent des ids avec 1 caractère :-(\n\nComme plusieurs ressources font déjà référence à ces dernières. Je ne peux pas vraiment les changer. J\'attache un lom utilisant plusieurs valeurs provenant de ces classifications pour illustrer.\n\n\n </pre>\n <div class=\"emailFilter_Author_1\"><blockquote type=\"cite\">\n <pre wrap=\"\">Aussi, je vois que tu utilises 2 xpaths\n%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring\n%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid\nPourquoi ne pas prendre un seul xpath //lom:classification/lom:taxonPath\n[lom:source/lom:string=\'http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/\nskill.rdf\']/lom:taxon/lom:id ?\nJe pense que c\'est la meilleure solution car tu risques d\'avoir des problèmes\nsi tu as plusieurs sources de classifications dans la même fiche !\n </pre>\n </blockquote></div>\n <pre wrap=\"\">\nEn effet, c\'est meilleur comme ça. J\'ai eu des problèmes avec la valeur string entre crochets. Semble-t-il qu\'elle doit être encoder pour que ça fonctionne correctement, comme ceci:\n\n%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%5Bcontains%28lom%3Asource%2Flom%3Astring%2C%27http%3A%2F%2Fwww1.licef.ca%2Fontology%2Fskill%2FGPaquette-200506%2Fskill.rdf%27%29%5D%2Flom%3Ataxon%2Flom%3Aid:(B)\n\n\n </pre>\n <div class=\"emailFilter_Author_1\"><blockquote type=\"cite\">\n <pre wrap=\"\"> Rebonjour,\n\n J\'ai le problème suivant avec l\'indexeur 1.5.0:\n\n J\'utilise le fichier de configuration liusConfig.xml attaché. Comme j\'utilise l\'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: <a class=\"moz-txt-link-freetext\" href=\"http://sourceforge.net/projects/lius/files/\">http://sourceforge.net/projects/lius/files/</a>) dans l\'application web.\n\n Parmi les fiches que j\'ai indexées, il y a la fiche fiche.xml (V.attachement).\n\n Lorsque j\'exécute la requête suivante:\n\n %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)\n\n Aucune fiche n\'est trouvée. Jusque là, tout va bien.\n\n Par contre, si j\'exécute la requête suivante:\n\n %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)\n\n La fiche est trouvée.\n\n Comment est-ce possible? La deuxième partie de la condition devrait faire en sorte qu\'aucune fiche ne soit trouvée, il me semble, non?\n\n Est-ce un bug ou plutôt un problème d\'incompréhension de ma part?\n\n Frédéric Bergeron\n Licef, Teluq\n\n\n\n\n </pre>\n </blockquote></div>\n <pre wrap=\"\">\n </pre>\n</blockquote></div></div>\n<br>\n</body>\n</html>\n</div>', created = 1507751720, expire = 1507838120, headers = '', serialized = 0 WHERE cid = '4:6c4f8147fedbff0073e0badbd803b940' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:85373b1ef5713a73fbbfa7c7820d9056' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">On Tue, Sep 15, 2009 at 05:17:46PM +0200, Yannick Caillaux wrote:<br />\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Bonjour,<br />\n><br />\n> Ensuite en regardant le code de cet Analyzer on voit qu\'il contient des mots<br />\n> stop tels que \"a\", \"c\" ... Je pense que le problème vient de là.<br />\n> Je vous propose donc d\'utiliser votre propre classe basée sur cet analyzer et<br />\n> dont vous supprimez les mots stop à un seul caractère, et de l\'appeler dans<br />\n> liusConfig.xml. Ceci vous permettra de ne pas avoir à retoucher à<br />\n> UTF8AccentRemoverAnalyzer.java à chaque nouvelle version d\'OOIndexing.<br />\n><br />\n> Est-ce que ça résout votre problème?</div>\n</blockquote>\n<p>Oui, ça marche. Merci beaucoup Yannick!</p>\n</div>\n', created = 1507751720, expire = 1507838120, headers = '', serialized = 0 WHERE cid = '4:85373b1ef5713a73fbbfa7c7820d9056' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:06aaa2fef12791641a109e4f917ca281' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">On Thu, Sep 10, 2009 at 07:43:12PM +0200, Yohan Colmant wrote:<br />\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Bonjour Frédéric,<br />\n><br />\n> Je me demande si ton problème ne vient pas du fait que ta requête sur l\'ID ne<br />\n> porte que sur un seul caractère.<br />\n> Au lieu d\'utiliser les valeurs A et B, ne peux-tu pas essayer avec TITI et TOTO<br />\n> pour voir ?<br />\n><br />\n> J\'imagine 2 problèmes potentiels:<br />\n> - je ne suis pas sûr que Lucene accepte une recherche sur le seul terme A<br />\n> - le terme A pourrait peut-être être considérer comme un mot vide<br />\n> --> tes tests avec TITI et TOTO nous aideront à voir si ça vient de là.</div>\n</blockquote>\n<p>C\'est probablement ça le problème. Quand j\'utilise une seule lettre, des fois ça semble fonctionner, d\'autres fois, non. Avec des chiffres pourtant, ça fonctionne toujours.</p>\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Tu peux aussi essayer en mettant dans la requête ....id:(\"A\") avec guillemets<br />\n> pour voir.</div>\n</blockquote>\n<p>Ça ne change rien.</p>\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Dans ce cas, est-ce que A et B sont des exemples ou de réels ids ? Est-ce que<br />\n> tu peux utiliser autre chose ou non ?<br />\n> Si non, on pourra essayer une config spécifique pour ce champ dans<br />\n> ori-oai-indexing, mais pour cela, il faudra que tu nous donnes toute la<br />\n> nomenclatures que tu utilises pour ce champ.</div>\n</blockquote>\n<p>Ce sont des vrais ids. </p>\n<p>Les détais pour les 3 classifications que j\'utilise le plus souvent sont ici:</p>\n<p><a href=\"http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf\" title=\"http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf\">http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf</a><br />\n<a href=\"http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf\" title=\"http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf\">http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf</a><br />\n<a href=\"http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf\" title=\"http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf\">http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf</a></p>\n<p>Toutes ces classifications comportent des ids avec 1 caractère :-(</p>\n<p>Comme plusieurs ressources font déjà référence à ces dernières. Je ne peux pas vraiment les changer. J\'attache un lom utilisant plusieurs valeurs provenant de ces classifications pour illustrer.</p>\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Aussi, je vois que tu utilises 2 xpaths<br />\n> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring<br />\n> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid<br />\n> Pourquoi ne pas prendre un seul xpath //lom:classification/lom:taxonPath<br />\n> [lom:source/lom:string=\'http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/<br />\n> skill.rdf\']/lom:taxon/lom:id ?<br />\n> Je pense que c\'est la meilleure solution car tu risques d\'avoir des problèmes<br />\n> si tu as plusieurs sources de classifications dans la même fiche !</div>\n</blockquote>\n<p>En effet, c\'est meilleur comme ça. J\'ai eu des problèmes avec la valeur string entre crochets. Semble-t-il qu\'elle doit être encoder pour que ça fonctionne correctement, comme ceci:</p>\n<p>%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%5Bcontains%28lom%3Asource%2Flom%3Astring%2C%27http%3A%2F%2Fwww1.licef.ca%2Fontology%2Fskill%2FGPaquette-200506%2Fskill.rdf%27%29%5D%2Flom%3Ataxon%2Flom%3Aid:(B)</p>\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Rebonjour,<br />\n><br />\n> J\'ai le problème suivant avec l\'indexeur 1.5.0:<br />\n><br />\n> J\'utilise le fichier de configuration liusConfig.xml attaché. Comme j\'utilise l\'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: <a href=\"http://sourceforge.net/projects/lius/files/\" title=\"http://sourceforge.net/projects/lius/files/\">http://sourceforge.net/projects/lius/files/</a>) dans l\'application web.<br />\n><br />\n> Parmi les fiches que j\'ai indexées, il y a la fiche fiche.xml (V.attachement).<br />\n><br />\n> Lorsque j\'exécute la requête suivante:<br />\n><br />\n> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)<br />\n><br />\n> Aucune fiche n\'est trouvée. Jusque là, tout va bien.<br />\n><br />\n> Par contre, si j\'exécute la requête suivante:<br />\n><br />\n> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\\://www1.licef.ca/ontology/skill/GPaquette\\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)<br />\n><br />\n> La fiche est trouvée.<br />\n><br />\n> Comment est-ce possible? La deuxième partie de la condition devrait faire en sorte qu\'aucune fiche ne soit trouvée, il me semble, non?<br />\n><br />\n> Est-ce un bug ou plutôt un problème d\'incompréhension de ma part?<br />\n><br />\n> Frédéric Bergeron<br />\n> Licef, Teluq<br />\n><br />\n><br />\n><br />\n> </div>\n</blockquote>\n<p>--<br />\nSHA1 Fingerprint : 787E 8700 36EF 49F4 FD89 0868 E90F AFB5 06CB 2F53<br />\nCA Certificate : <a href=\"http://www1.licef.teluq.uquebec.ca/ssl/ca.crt\" title=\"http://www1.licef.teluq.uquebec.ca/ssl/ca.crt\">http://www1.licef.teluq.uquebec.ca/ssl/ca.crt</a></p>\n</div>\n', created = 1507751720, expire = 1507838120, headers = '', serialized = 0 WHERE cid = '4:06aaa2fef12791641a109e4f917ca281' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.

5 messages / 0 nouveaux

Sujet clos

Dernière contribution

9 septembre 2009 - 4:30pm

fredericbergeron

Requete qui ne devrait rien trouver

Rebonjour,

J'ai le problème suivant avec l'indexeur 1.5.0:

J'utilise le fichier de configuration liusConfig.xml attaché. Comme j'utilise l'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: http://sourceforge.net/projects/lius/files/) dans l'application web.

Parmi les fiches que j'ai indexées, il y a la fiche fiche.xml (V.attachement).

Lorsque j'exécute la requête suivante:

%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)

Aucune fiche n'est trouvée. Jusque là, tout va bien.

Par contre, si j'exécute la requête suivante:

%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\://www1.licef.ca/ontology/skill/GPaquette\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)

La fiche est trouvée.

Comment est-ce possible? La deuxième partie de la condition devrait faire en sorte qu'aucune fiche ne soit trouvée, il me semble, non?

Est-ce un bug ou plutôt un problème d'incompréhension de ma part?

Frédéric Bergeron
Licef, Teluq

10 septembre 2009 - 7:43pm

Yohan Colmant

Bonjour Frédéric,

Je me demande si ton problème ne vient pas du fait que ta requête sur l'ID ne porte que sur un seul caractère.
Au lieu d'utiliser les valeurs A et B, ne peux-tu pas essayer avec TITI et TOTO pour voir ?

J'imagine 2 problèmes potentiels:
- je ne suis pas sûr que Lucene accepte une recherche sur le seul terme A
- le terme A pourrait peut-être être considérer comme un mot vide
--> tes tests avec TITI et TOTO nous aideront à voir si ça vient de là.

Tu peux aussi essayer en mettant dans la requête ....id:("A") avec guillemets pour voir.

Dans ce cas, est-ce que A et B sont des exemples ou de réels ids ? Est-ce que tu peux utiliser autre chose ou non ?
Si non, on pourra essayer une config spécifique pour ce champ dans ori-oai-indexing, mais pour cela, il faudra que tu nous donnes toute la nomenclatures que tu utilises pour ce champ.

Aussi, je vois que tu utilises 2 xpaths
%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring
%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid
Pourquoi ne pas prendre un seul xpath //lom:classification/lom:taxonPath[lom:source/lom:string='http\://www1.licef.ca/ontology/skill/GPaquette\-200506/skill.rdf']/lom:taxon/lom:id ?
Je pense que c'est la meilleure solution car tu risques d'avoir des problèmes si tu as plusieurs sources de classifications dans la même fiche !

Dis-nous ce que ça donne !
A+

Yohan COLMANT
Service Informatique
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI

Frederic Bergeron a écrit :

Rebonjour,

J'ai le problème suivant avec l'indexeur 1.5.0:

J'utilise le fichier de configuration liusConfig.xml attaché.   Comme j'utilise l'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: http://sourceforge.net/projects/lius/files/) dans l'application web.

Parmi les fiches que j'ai indexées, il y a la fiche fiche.xml (V.attachement).

Lorsque j'exécute la requête suivante:

%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)

Aucune fiche n'est trouvée.  Jusque là, tout va bien.

Par contre, si j'exécute la requête suivante:

%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\://www1.licef.ca/ontology/skill/GPaquette\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)

La fiche est trouvée.  

Comment est-ce possible?  La deuxième partie de la condition devrait faire en sorte qu'aucune fiche ne soit trouvée, il me semble, non?  

Est-ce un bug ou plutôt un problème d'incompréhension de ma part?

Frédéric Bergeron
Licef, Teluq

15 septembre 2009 - 5:17pm

(Répondre à #2) #3

yannickcaillaux

Bonjour,

j'ai reproduit le problème de mon côté avec votre liusConfig.xml.
D'abord les sources de Lius, dans lesquelles se trouve "org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer.java", sont déjà présentes dans le module ori-oai-indexing. Il est donc inutile d'intégrer Lius1.0.jar, d'autant plus que certaines classes de Lius ont été modifiées dans le module d'indexation.

Ensuite en regardant le code de cet Analyzer on voit qu'il contient des mots stop tels que "a", "c" ... Je pense que le problème vient de là.
Je vous propose donc d'utiliser votre propre classe basée sur cet analyzer et dont vous supprimez les mots stop à un seul caractère, et de l'appeler dans liusConfig.xml. Ceci vous permettra de ne pas avoir à retoucher à UTF8AccentRemoverAnalyzer.java à chaque nouvelle version d'OOIndexing.

Est-ce que ça résout votre problème?

Une autre solution serait d'utiliser les remplacements de caractères dans le fichier configIndexing.xml (partie nommée : Chaines de remplacement). N'hésitez pas à revenir vers moi pour vous aider à configurer cette partie.

Cordialement

Yannick

Frederic Bergeron a écrit :

On Thu, Sep 10, 2009 at 07:43:12PM +0200, Yohan Colmant wrote:

Bonjour Frédéric,

Je me demande si ton problème ne vient pas du fait que ta requête sur l'ID ne
porte que sur un seul caractère.
Au lieu d'utiliser les valeurs A et B, ne peux-tu pas essayer avec TITI et TOTO
pour voir ?

J'imagine 2 problèmes potentiels:
- je ne suis pas sûr que Lucene accepte une recherche sur le seul terme A
- le terme A pourrait peut-être être considérer comme un mot vide
--> tes tests avec TITI et TOTO nous aideront à voir si ça vient de là.


C'est probablement ça le problème.  Quand j'utilise une seule lettre, des fois ça semble fonctionner, d'autres fois, non.  Avec des chiffres pourtant, ça fonctionne toujours.

Tu peux aussi essayer en mettant dans la requête ....id:("A") avec guillemets
pour voir.


Ça ne change rien.

Dans ce cas, est-ce que A et B sont des exemples ou de réels ids ? Est-ce que
tu peux utiliser autre chose ou non ?
Si non, on pourra essayer une config spécifique pour ce champ dans
ori-oai-indexing, mais pour cela, il faudra que tu nous donnes toute la
nomenclatures que tu utilises pour ce champ.


Ce sont des vrais ids.  

Les détais pour les 3 classifications que j'utilise le plus souvent sont ici:

http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf
http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf
http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf

Toutes ces classifications comportent des ids avec 1 caractère :-(

Comme plusieurs ressources font déjà référence à ces dernières.  Je ne peux pas vraiment les changer.  J'attache un lom utilisant plusieurs valeurs provenant de ces classifications pour illustrer.

Aussi, je vois que tu utilises 2 xpaths
%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring
%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid
Pourquoi ne pas prendre un seul xpath //lom:classification/lom:taxonPath
[lom:source/lom:string='http\://www1.licef.ca/ontology/skill/GPaquette\-200506/
skill.rdf']/lom:taxon/lom:id ?
Je pense que c'est la meilleure solution car tu risques d'avoir des problèmes
si tu as plusieurs sources de classifications dans la même fiche !


En effet, c'est meilleur comme ça.  J'ai eu des problèmes avec la valeur string entre crochets.  Semble-t-il qu'elle doit être encoder pour que ça fonctionne correctement, comme ceci:

%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%5Bcontains%28lom%3Asource%2Flom%3Astring%2C%27http%3A%2F%2Fwww1.licef.ca%2Fontology%2Fskill%2FGPaquette-200506%2Fskill.rdf%27%29%5D%2Flom%3Ataxon%2Flom%3Aid:(B)

    Rebonjour,

    J'ai le problème suivant avec l'indexeur 1.5.0:

    J'utilise le fichier de configuration liusConfig.xml attaché.   Comme j'utilise l'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: http://sourceforge.net/projects/lius/files/) dans l'application web.

    Parmi les fiches que j'ai indexées, il y a la fiche fiche.xml (V.attachement).

    Lorsque j'exécute la requête suivante:

    %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)

    Aucune fiche n'est trouvée.  Jusque là, tout va bien.

    Par contre, si j'exécute la requête suivante:

    %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\://www1.licef.ca/ontology/skill/GPaquette\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)

    La fiche est trouvée.

    Comment est-ce possible?  La deuxième partie de la condition devrait faire en sorte qu'aucune fiche ne soit trouvée, il me semble, non?

    Est-ce un bug ou plutôt un problème d'incompréhension de ma part?

    Frédéric Bergeron
    Licef, Teluq

16 septembre 2009 - 11:39am

(Répondre à #3) #4

fredericbergeron

On Tue, Sep 15, 2009 at 05:17:46PM +0200, Yannick Caillaux wrote:

> Bonjour,
>
> Ensuite en regardant le code de cet Analyzer on voit qu'il contient des mots
> stop tels que "a", "c" ... Je pense que le problème vient de là.
> Je vous propose donc d'utiliser votre propre classe basée sur cet analyzer et
> dont vous supprimez les mots stop à un seul caractère, et de l'appeler dans
> liusConfig.xml. Ceci vous permettra de ne pas avoir à retoucher à
> UTF8AccentRemoverAnalyzer.java à chaque nouvelle version d'OOIndexing.
>
> Est-ce que ça résout votre problème?

Oui, ça marche. Merci beaucoup Yannick!

15 septembre 2009 - 11:49am

(Répondre à #2) #5

fredericbergeron

On Thu, Sep 10, 2009 at 07:43:12PM +0200, Yohan Colmant wrote:

> Bonjour Frédéric,
>
> Je me demande si ton problème ne vient pas du fait que ta requête sur l'ID ne
> porte que sur un seul caractère.
> Au lieu d'utiliser les valeurs A et B, ne peux-tu pas essayer avec TITI et TOTO
> pour voir ?
>
> J'imagine 2 problèmes potentiels:
> - je ne suis pas sûr que Lucene accepte une recherche sur le seul terme A
> - le terme A pourrait peut-être être considérer comme un mot vide
> --> tes tests avec TITI et TOTO nous aideront à voir si ça vient de là.

C'est probablement ça le problème. Quand j'utilise une seule lettre, des fois ça semble fonctionner, d'autres fois, non. Avec des chiffres pourtant, ça fonctionne toujours.

> Tu peux aussi essayer en mettant dans la requête ....id:("A") avec guillemets
> pour voir.

Ça ne change rien.

> Dans ce cas, est-ce que A et B sont des exemples ou de réels ids ? Est-ce que
> tu peux utiliser autre chose ou non ?
> Si non, on pourra essayer une config spécifique pour ce champ dans
> ori-oai-indexing, mais pour cela, il faudra que tu nous donnes toute la
> nomenclatures que tu utilises pour ce champ.

Ce sont des vrais ids.

Les détais pour les 3 classifications que j'utilise le plus souvent sont ici:

http://www1.licef.ca/ontology/skill/GPaquette-200506/skill.rdf
http://www1.licef.ca/ontology/resource/licef-200506/resource.rdf
http://www1.licef.ca/ontology/DDC/licef-200506/DDC.rdf

Toutes ces classifications comportent des ids avec 1 caractère :-(

Comme plusieurs ressources font déjà référence à ces dernières. Je ne peux pas vraiment les changer. J'attache un lom utilisant plusieurs valeurs provenant de ces classifications pour illustrer.

> Aussi, je vois que tu utilises 2 xpaths
> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring
> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid
> Pourquoi ne pas prendre un seul xpath //lom:classification/lom:taxonPath
> [lom:source/lom:string='http\://www1.licef.ca/ontology/skill/GPaquette\-200506/
> skill.rdf']/lom:taxon/lom:id ?
> Je pense que c'est la meilleure solution car tu risques d'avoir des problèmes
> si tu as plusieurs sources de classifications dans la même fiche !

En effet, c'est meilleur comme ça. J'ai eu des problèmes avec la valeur string entre crochets. Semble-t-il qu'elle doit être encoder pour que ça fonctionne correctement, comme ceci:

%2F%2Flom%3Aclassification%2Flom%3AtaxonPath%5Bcontains%28lom%3Asource%2Flom%3Astring%2C%27http%3A%2F%2Fwww1.licef.ca%2Fontology%2Fskill%2FGPaquette-200506%2Fskill.rdf%27%29%5D%2Flom%3Ataxon%2Flom%3Aid:(B)

> Rebonjour,
>
> J'ai le problème suivant avec l'indexeur 1.5.0:
>
> J'utilise le fichier de configuration liusConfig.xml attaché. Comme j'utilise l'analyseur org.apache.lucene.analysis.lius.unicode.UTF8AccentRemoverAnalyzer, on doit inclure le fichier Lius-1.0.jar (qui se trouve ici: http://sourceforge.net/projects/lius/files/) dans l'application web.
>
> Parmi les fiches que j'ai indexées, il y a la fiche fiche.xml (V.attachement).
>
> Lorsque j'exécute la requête suivante:
>
> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)
>
> Aucune fiche n'est trouvée. Jusque là, tout va bien.
>
> Par contre, si j'exécute la requête suivante:
>
> %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Asource%2Flom%3Astring:(http\://www1.licef.ca/ontology/skill/GPaquette\-200506/skill.rdf) AND %2F%2Flom%3Aclassification%2Flom%3AtaxonPath%2Flom%3Ataxon%2Flom%3Aid:(A)
>
> La fiche est trouvée.
>
> Comment est-ce possible? La deuxième partie de la condition devrait faire en sorte qu'aucune fiche ne soit trouvée, il me semble, non?
>
> Est-ce un bug ou plutôt un problème d'incompréhension de ma part?
>
> Frédéric Bergeron
> Licef, Teluq
>
>
>
>

--
SHA1 Fingerprint : 787E 8700 36EF 49F4 FD89 0868 E90F AFB5 06CB 2F53
CA Certificate : http://www1.licef.teluq.uquebec.ca/ssl/ca.crt

Sujet clos

Valoriser le patrimoine numérique scientifique, pédagogique et documentaire des universités et le partager par un réseau de portails communicants en OAI

Traduction auto Google

Aide

Options d'affichage des commentaires