filtrage des fiches entreposées,

  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:f5894239d532484655761b30bd86aefc' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour,</p>\n<p> J\'ai paramétré mon worflow de facon a ce qu\'il y ai une moderation<br />\ntechnique suivi d\'une moderation scd. Mon probleme c\'est que je n\'arrive<br />\npas a afficher le menu \"Ressources que je dois moderer\" aux moderateurs<br />\nen question (ils recoivent bien le mail).\n</div>\n', created = 1507746167, expire = 1507832567, headers = '', serialized = 0 WHERE cid = '4:f5894239d532484655761b30bd86aefc' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:f5894239d532484655761b30bd86aefc' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour,</p>\n<p> J\'ai paramétré mon worflow de facon a ce qu\'il y ai une moderation<br />\ntechnique suivi d\'une moderation scd. Mon probleme c\'est que je n\'arrive<br />\npas a afficher le menu \"Ressources que je dois moderer\" aux moderateurs<br />\nen question (ils recoivent bien le mail).\n</div>\n', created = 1507746167, expire = 1507832567, headers = '', serialized = 0 WHERE cid = '4:f5894239d532484655761b30bd86aefc' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:bdb3fc03ddf78f8828239d6cd145a03f' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">\nBonjour,</p>\n<p>Après le moissonnage d\'un seul entrepôt autre, le contenu de l\'entrepôt<br />\nlocal est constitué d\'un certain nombre de données en provenance de diverses<br />\nuniversités.<br />\nDans le cas où, il est souhaité de ne disposer dans l\'entrepôt local que des<br />\nfiches d\'une seule de ces universités et non de toutes les universités,<br />\nexiste-t-il via l\'entrepôt ou bien du moissonneur une solution pour filtrer<br />\nles ressources ?</p>\n<p>En sachant que tout le contenu de l\'entrepôt moissonné appartient au même<br />\nensemble.</p>\n<p>Merci d\'avance pour toute réponse,</p>\n<p>cdt,</p>\n<p>Karine Lauro, faculté de médecine de Rennes 1<br />\n--<br />\nCe message a\n</div>\n', created = 1507746167, expire = 1507832567, headers = '', serialized = 0 WHERE cid = '4:bdb3fc03ddf78f8828239d6cd145a03f' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:a1de2c3533c7f3665fc6d9e7fd15e9be' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n<head>\n <meta content=\"text/html;charset=UTF-8\" http-equiv=\"Content-Type\">\n</head>\n<body bgcolor=\"#ffffff\" text=\"#000000\">\nBonjour Karine,<br>\n<br>\n<a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#107;&#97;&#114;&#105;&#110;&#101;&#46;&#108;&#97;&#117;&#114;&#111;&#64;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#107;&#97;&#114;&#105;&#110;&#101;&#46;&#108;&#97;&#117;&#114;&#111;&#64;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a> a écrit :\n<div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <pre wrap=\"\">Bonjour,\n\nAprès le moissonnage d\'un seul entrepôt autre, le contenu de l\'entrepôt\nlocal est constitué d\'un certain nombre de données en provenance de diverses\nuniversités.\nDans le cas où, il est souhaité de ne disposer dans l\'entrepôt local que des\nfiches d\'une seule de ces universités et non de toutes les universités,\nexiste-t-il via l\'entrepôt ou bien du moissonneur une solution pour filtrer\nles ressources ?\n </pre>\n</blockquote></div></div>\n<br>\nCe que vous voulez faire, si j\'ai bien compris, c\'est, à partir d\'une\nmoisson d\'un entrepôt \"autre\" (extérieur) qui contient les fiches de\nprovenances différentes (mais qui n\'ont pas d\'entrepôts séparés),\nexposer seulement les fiches de l\'université A afin de constituer un\nentrepôt propre à l\'université A ?<br>\nC\'est en quelque sorte une dés-agrégation de données ?<br>\nEn passant, la façon plus protocolaire de réaliser cet objectif serait\nde disposer, au niveau de l\'entrepôt \"autre\" , de set OAI différents\npour chque université, et de ne moissonner que le set qui va bien.<br>\n<br>\nsi ces sets ne sont pas disponibles, vous avez d\'autres façons d\'agir  :<br>\n<br>\n1. avec la version 1.1.1 du harvester, vous pouvez filtrer les fiches\nen fonction de leur identifiants OAI, afin de ne PAS les moissonner,\nmais pour cela il faut que les fiches de l\'université aient quelque\nchose qui les distinguent au niveau de leurs identifiants OAI des\nautres universités.<br>\nexemple, si vous avez des fiches avec des identifiants comme suit:<br>\noai:univ1-xxx<br>\noai:univ2-xxx<br>\noai:univ3-xxx<br>\net que vous ne voulez exposer que les fiches de univ1, il vous faut\najouter les valeurs univ2 et univ3 dans les idFilters ( voir doc\n<a class=\"moz-txt-link-freetext\" href=\"http://sourcesup.cru.fr/ori-oai-harvest/1.1/installation.html#4.2\">http://sourcesup.cru.fr/ori-oai-harvest/1.1/installation.html#4.2</a> )<br>\n<br>\n2. si l\'élément permettant la distinction des fiches entre les\nuniversités n\'est pas dans l\'identifiant de la fiche, il y a un\nfiltrage possible au niveau du repository<br>\n-Actuellement il existe dans la version 1.1.3,  la possibilité de\nfiltrer les fiches exposées en fonction du repository name et /ou du\nformat de métadonnées <b>uniquement</b>. (voir doc\n<a class=\"moz-txt-link-freetext\" href=\"http://sourcesup.cru.fr/ori-oai-repo/1.1/installation.html#2.4\">http://sourcesup.cru.fr/ori-oai-repo/1.1/installation.html#2.4</a>)<br>\n<br>\n-dans la version 1.5 du repository, il sera possible de filtrer les\nfiches exposées avec n\'importe quelle métadonnée indexée de la fiche\n(ex: (dewey=540* OU keyword=math*) ET title=info*))<br>\n<br>\nEn espérant avoir répondu à votre question,<br>\n<br>\nCordialement,<br>\n<br>\nFrançois<br>\n<br>\n<br>\n<br>\n<div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <pre wrap=\"\">\nEn sachant que tout le contenu de l\'entrepôt moissonné appartient au même\nensemble.\n\nMerci d\'avance pour toute réponse,\n\ncdt,\n\nKarine Lauro, faculté de médecine de Rennes 1</pre>\n</blockquote></div></div>\n<br>\n</body>\n<br />-- \n<br />Ce message a </div>', created = 1507746169, expire = 1507832569, headers = '', serialized = 0 WHERE cid = '4:a1de2c3533c7f3665fc6d9e7fd15e9be' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:644679ce01e1dcf9a79193a5f931012a' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">\nJe vous remercie de votre réponse. Vous avez parfaitement compris ma<br />\nproblématique et je ne dispose pas effectivement des sets oai au niveau de<br />\nl\'entrepôt \"autre\".</p>\n<p>J\'examine vos solutions alternatives.</p>\n<p>Merci, encore.</p>\n<p>cdt,</p>\n<p>Karine Lauro<br />\n--<br />\nCe message a\n</div>\n', created = 1507746169, expire = 1507832569, headers = '', serialized = 0 WHERE cid = '4:644679ce01e1dcf9a79193a5f931012a' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:c9f3d07e836a7225b9b00f0d168a52a4' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">\nBonjour,</p>\n<p>Juste une précision, dans le cas de l\'ajout de la propriété idFilters à<br />\najouter dans le fichier harvester-domain.xml, dans quel bean faut-il placer<br />\ncette propriété ?</p>\n<p>Merci,</p>\n<p>Karine Lauro.<br />\n--<br />\nCe message a\n</div>\n', created = 1507746169, expire = 1507832569, headers = '', serialized = 0 WHERE cid = '4:c9f3d07e836a7225b9b00f0d168a52a4' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:9a8b55c8530ec95ee1cf5681dd187cb4' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">\nBonjour,</p>\n<p>J\'ai une seconde question, la solution poposée concerne le filtrage des<br />\nidentifiants non souhaités. est-il possible de raisonner en sens inverse,<br />\nc\'est-à-dire plutôt que de préciser les urls non souhaitées, préciser<br />\ncelles-voulues et le moissonnage se fait sur celles-ci ?</p>\n<p>Car, l\'entrepôt que je moissonne dispose de plus de 4200 fiches dont seulement<br />\n400 m\'intéressent. Il me faut donc lister 3800 urls à filtrer.</p>\n<p>Merci,</p>\n<p>Karine Lauro<br />\n--<br />\nCe message a\n</div>\n', created = 1507746169, expire = 1507832569, headers = '', serialized = 0 WHERE cid = '4:9a8b55c8530ec95ee1cf5681dd187cb4' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:6ab73d39755a73fa81eda85b34ed9884' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour,</p>\n<p><a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#107;&#97;&#114;&#105;&#110;&#101;&#46;&#108;&#97;&#117;&#114;&#111;&#64;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#107;&#97;&#114;&#105;&#110;&#101;&#46;&#108;&#97;&#117;&#114;&#111;&#64;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a> a écrit :<br />\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Bonjour,<br />\n><br />\n> </div>\n</blockquote>\n<p>Bonjour,<br />\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> J\'ai une seconde question, la solution poposée concerne le filtrage des<br />\n> identifiants non souhaités. est-il possible de raisonner en sens inverse,<br />\n> c\'est-à-dire plutôt que de préciser les urls non souhaitées, préciser<br />\n> celles-voulues et le moissonnage se fait sur celles-ci ?<br />\n><br />\n> </div>\n</blockquote>\n<p>Non, ce n\'est pas possible. Si vous voulez faire de la sélection<br />\npositive en OAI, ça se fait normalement par le biais de set<br />\n(ensembles) permettant d\'isoler des groupe de fiches.<br />\nLe filtrage négatif dont je parlais est uniquement prévu au départ pour<br />\nne pas moissonner ses propres fiches locales, dans votre cas c\'est plus<br />\nune astuce que je vous proposais dans une contexte donné. Si les 4200<br />\nfiches dont vous parlez ne possèdent pas de sous-chaines communes<br />\npermettant de les filtrer par groupes, il vous faudra attendre la<br />\nversion 1.5 du repository.<br />\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Car, l\'entrepôt que je moissonne dispose de plus de 4200 fiches dont seulement<br />\n> 400 m\'intéressent. Il me faut donc lister 3800 urls à filtrer.<br />\n><br />\n> </div>\n</blockquote>\n<p>Vous n\'avez pas à filtrer chacune des 3800 fiches individuellement, le<br />\nfiltrage porte sur une sous-chaine de leurs identifiants OAI( et non de<br />\nleur url).<br />\nAvez vous vérifier qu\'il n\'existe pas de set dans l\'entrepôt que vous<br />\nmoissonnez ne contenant que les 400 fiches souhaitées ? Car encore une<br />\nfois, le filtrage côté moissonneur n\'est pas la solution idéale, cela<br />\ndéroge au protocole OAI qui prévoit des sets pour cela.</p>\n<p>François<br />\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Merci,<br />\n><br />\n> Karine Lauro</div>\n</blockquote>\n<p>--<br />\nCe message a\n</div>\n', created = 1507746169, expire = 1507832569, headers = '', serialized = 0 WHERE cid = '4:6ab73d39755a73fa81eda85b34ed9884' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:df2ef21bf8df720519611f67bb4f3476' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">\nBonjour,</p>\n<p>Merci pour la réponse, je suis entièrement d\'accord avec vous, il s\'agit<br />\nd\'une astuce car j\'ai vérifié sur l\'existence d\'un set oai et la réponse est<br />\nque l\'entrepôt ne supporte pas les sets oai et le développement de cette<br />\nfonctionnalité n\'est pas prévu à l\'ordre du jour.</p>\n<p>Par contre, vous dîtes que le filtrage se fait sur une sous-chaîne, je n\'ai<br />\npas vraiment suivi.<br />\nLes adresses que je souhaite filtrer commencent toutes de la même façon<br />\noai:nom de l\'entrepôt/xxx</p>\n<p>Que faut-il préciser dans la propriété idfilters ? et dans quel bean se<br />\npositionne cette proporiété ?</p>\n<p>Karine</p>\n<p>--<br />\nCe message a\n</div>\n', created = 1507746169, expire = 1507832569, headers = '', serialized = 0 WHERE cid = '4:df2ef21bf8df720519611f67bb4f3476' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:54e60bfa60689788a14ef3590f3a2c1d' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><span id=\"919301b5c518c9ff00d1a59ebc883be5\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'919301b5c518c9ff00d1a59ebc883be5\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#107;&#97;&#114;&#105;&#110;&#101;&#46;&#108;&#97;&#117;&#114;&#111;&#64;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\'+\'\">\'+\'&#107;&#97;&#114;&#105;&#110;&#101;&#46;&#108;&#97;&#117;&#114;&#111;&#64;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script> a écrit :<br />\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Bonjour,<br />\n><br />\n> Merci pour la réponse, je suis entièrement d\'accord avec vous, il s\'agit<br />\n> d\'une astuce car j\'ai vérifié sur l\'existence d\'un set oai et la réponse est<br />\n> que l\'entrepôt ne supporte pas les sets oai et le développement de cette<br />\n> fonctionnalité n\'est pas prévu à l\'ordre du jour.<br />\n><br />\n> Par contre, vous dîtes que le filtrage se fait sur une sous-chaîne, je n\'ai<br />\n> pas vraiment suivi.<br />\n> Les adresses que je souhaite filtrer commencent toutes de la même façon<br />\n> oai:nom de l\'entrepôt/xxx<br />\n><br />\n> Que faut-il préciser dans la propriété idfilters ? et dans quel bean se<br />\n> positionne cette proporiété ?<br />\n><br />\n> </div>\n</blockquote>\n<p>Il s\'agit du bean harvestServiceNoTx. Vous devez lister les noms<br />\nd\'entrepôts que vous ne voulez pas moissonner :</p>\n<property name=\"idFilters\">\n<list>\n <value>nom de l\'entrepot 1</value><br />\n <value>nom de l\'entrepot 2</value><br />\n etc....<br />\n </list>\n </property>\n<p>François</p>\n<p>--<br />\nCe message a\n</div>\n', created = 1507746169, expire = 1507832569, headers = '', serialized = 0 WHERE cid = '4:54e60bfa60689788a14ef3590f3a2c1d' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:ba598f6ec33d0dc481bf27e6d29bd35f' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">\nBonjour,</p>\n<p>J\'ai quelques soucis pour définir les valeurs de la propriété idFilters.<br />\nJ\'ai cette erreur qui me le montre au démarrage du tomcat pour le module<br />\nharvester.<br />\nCaused by:<br />\norg.springframework.beans.factory.BeanCreationException: Error creating bean<br />\nwith name \'harvestServiceNoTx\' defined in ServletContext resource<br />\n[/WEB-INF/classes/properties/harvester-domain.xml]: Error setting property<br />\nvalues; nested exception is<br />\norg.springframework.beans.NotWritablePropertyException: Invalid property<br />\n\'idFilters\' of bean class<br />\n[org.orioai.harvesting.domain.service.HarvestServiceImpl]: Bean property<br />\n\'idFilters\' is not writable or has an invalid setter method. Does the parameter<br />\ntype of the setter match the return type of the getter?</p>\n<p>en fait, j\'ai laissé <value>${local.repositoryIdentifier}</value><br />\net j\'ai modifié [filtre identifiant fiches] dans <value>[filtre identifiant<br />\nfiches]</value></p>\n<p>Mais, il y a problème. Auriez-vous un exemple pour le contenu de [filtre<br />\nidentifiant fiches] ?<br />\nLa ligne <value>${local.repositoryIdentifier}</value> doit-elle être<br />\nabsolument laissée ?</p>\n<p>Merci,</p>\n<p>Karine Lauro<br />\n--<br />\nCe message a\n</div>\n', created = 1507746169, expire = 1507832569, headers = '', serialized = 0 WHERE cid = '4:ba598f6ec33d0dc481bf27e6d29bd35f' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:2bb38d661e4e1835e5251f6bb8fffc35' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour,</p>\n<p>Dans mon mail du 26 j\'ai donné un exemple de ce filtre, que je redonne<br />\nici :</p>\n<property name=\"idFilters\">\n<list>\n <value>nom de l\'entrepot 1</value><br />\n <value>nom de l\'entrepot 2</value><br />\n </list>\n </property>\n<p>Le mieux serait que vous montriez votre configuration xml dans le<br />\ndétail, car je ne vois pas ce qui pose problème.<br />\nPourriez-vous transmettre à la liste votre fharvester-domain.xml ou bien<br />\nle contenu de la balise <bean id=\"harvestServiceNoTx\"> ?</p>\n<p><a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#107;&#97;&#114;&#105;&#110;&#101;&#46;&#108;&#97;&#117;&#114;&#111;&#64;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#107;&#97;&#114;&#105;&#110;&#101;&#46;&#108;&#97;&#117;&#114;&#111;&#64;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a> a écrit :<br />\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Bonjour,<br />\n><br />\n> J\'ai quelques soucis pour définir les valeurs de la propriété idFilters.<br />\n> J\'ai cette erreur qui me le montre au démarrage du tomcat pour le module<br />\n> harvester.<br />\n> Caused by:<br />\n> org.springframework.beans.factory.BeanCreationException: Error creating bean<br />\n> with name \'harvestServiceNoTx\' defined in ServletContext resource<br />\n> [/WEB-INF/classes/properties/harvester-domain.xml]: Error setting property<br />\n> values; nested exception is<br />\n> org.springframework.beans.NotWritablePropertyException: Invalid property<br />\n> \'idFilters\' of bean class<br />\n> [org.orioai.harvesting.domain.service.HarvestServiceImpl]: Bean property<br />\n> \'idFilters\' is not writable or has an invalid setter method. Does the parameter<br />\n> type of the setter match the return type of the getter?<br />\n><br />\n> en fait, j\'ai laissé <value>${local.repositoryIdentifier}</value><br />\n> et j\'ai modifié [filtre identifiant fiches] dans <value>[filtre identifiant<br />\n> fiches]</value><br />\n><br />\n> Mais, il y a problème. Auriez-vous un exemple pour le contenu de [filtre<br />\n> identifiant fiches] ?<br />\n> La ligne <value>${local.repositoryIdentifier}</value> doit-elle être<br />\n> absolument laissée ?<br />\n><br />\n> </div>\n</blockquote>\n<p>non, cette ligne est une facilité pour aller chercher la valeur<br />\ndirectement dans le fichier ori.properties, pour ne pas editer chaque<br />\nfichier xml un par un.<br />\nSi vous définissez des valeurs en editant ce fichier, vous n\'avez donc<br />\nplus besoin de cette facilité.</p>\n<p>Cordialement,</p>\n<p>François</p>\n<p>--<br />\nCe message a\n</div>\n', created = 1507746169, expire = 1507832569, headers = '', serialized = 0 WHERE cid = '4:2bb38d661e4e1835e5251f6bb8fffc35' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
10 messages / 0 nouveaux
Dernière contribution
karine.lauro
filtrage des fiches entreposées,
Bonjour,

Après le moissonnage d'un seul entrepôt autre, le contenu de l'entrepôt
local est constitué d'un certain nombre de données en provenance de diverses
universités.
Dans le cas où, il est souhaité de ne disposer dans l'entrepôt local que des
fiches d'une seule de ces universités et non de toutes les universités,
existe-t-il via l'entrepôt ou bien du moissonneur une solution pour filtrer
les ressources ?

En sachant que tout le contenu de l'entrepôt moissonné appartient au même
ensemble.

Merci d'avance pour toute réponse,

cdt,

Karine Lauro, faculté de médecine de Rennes 1
--
Ce message a

francoisjannin
Bonjour Karine,

karine.lauro@univ-rennes1.fr a écrit :
Bonjour,

Après le moissonnage d'un seul entrepôt autre, le contenu de l'entrepôt
local est constitué d'un certain nombre de données en provenance de diverses
universités.
Dans le cas où, il est souhaité de ne disposer dans l'entrepôt local que des
fiches d'une seule de ces universités	et non de toutes les universités,
existe-t-il via l'entrepôt ou bien du moissonneur une solution pour filtrer
les ressources	?
  

Ce que vous voulez faire, si j'ai bien compris, c'est, à partir d'une moisson d'un entrepôt "autre" (extérieur) qui contient les fiches de provenances différentes (mais qui n'ont pas d'entrepôts séparés), exposer seulement les fiches de l'université A afin de constituer un entrepôt propre à l'université A ?
C'est en quelque sorte une dés-agrégation de données ?
En passant, la façon plus protocolaire de réaliser cet objectif serait de disposer, au niveau de l'entrepôt "autre" , de set OAI différents pour chque université, et de ne moissonner que le set qui va bien.

si ces sets ne sont pas disponibles, vous avez d'autres façons d'agir  :

1. avec la version 1.1.1 du harvester, vous pouvez filtrer les fiches en fonction de leur identifiants OAI, afin de ne PAS les moissonner, mais pour cela il faut que les fiches de l'université aient quelque chose qui les distinguent au niveau de leurs identifiants OAI des autres universités.
exemple, si vous avez des fiches avec des identifiants comme suit:
oai:univ1-xxx
oai:univ2-xxx
oai:univ3-xxx
et que vous ne voulez exposer que les fiches de univ1, il vous faut ajouter les valeurs univ2 et univ3 dans les idFilters ( voir doc http://sourcesup.cru.fr/ori-oai-harvest/1.1/installation.html#4.2 )

2. si l'élément permettant la distinction des fiches entre les universités n'est pas dans l'identifiant de la fiche, il y a un filtrage possible au niveau du repository
-Actuellement il existe dans la version 1.1.3,  la possibilité de filtrer les fiches exposées en fonction du repository name et /ou du format de métadonnées uniquement. (voir doc http://sourcesup.cru.fr/ori-oai-repo/1.1/installation.html#2.4)

-dans la version 1.5 du repository, il sera possible de filtrer les fiches exposées avec n'importe quelle métadonnée indexée de la fiche (ex: (dewey=540* OU keyword=math*) ET title=info*))

En espérant avoir répondu à votre question,

Cordialement,

François



En sachant que tout le contenu de l'entrepôt moissonné appartient au même
ensemble.

Merci d'avance pour toute réponse,

cdt,

Karine Lauro, faculté de médecine de Rennes 1


--
Ce message a
karine.lauro
Je vous remercie de votre réponse. Vous avez parfaitement compris ma
problématique et je ne dispose pas effectivement des sets oai au niveau de
l'entrepôt "autre".

J'examine vos solutions alternatives.

Merci, encore.

cdt,

Karine Lauro
--
Ce message a

karine.lauro
Bonjour,

Juste une précision, dans le cas de l'ajout de la propriété idFilters à
ajouter dans le fichier harvester-domain.xml, dans quel bean faut-il placer
cette propriété ?

Merci,

Karine Lauro.
--
Ce message a

karine.lauro
Bonjour,

J'ai une seconde question, la solution poposée concerne le filtrage des
identifiants non souhaités. est-il possible de raisonner en sens inverse,
c'est-à-dire plutôt que de préciser les urls non souhaitées, préciser
celles-voulues et le moissonnage se fait sur celles-ci ?

Car, l'entrepôt que je moissonne dispose de plus de 4200 fiches dont seulement
400 m'intéressent. Il me faut donc lister 3800 urls à filtrer.

Merci,

Karine Lauro
--
Ce message a

francoisjannin
Bonjour,

karine.lauro@univ-rennes1.fr a écrit :

> Bonjour,
>
>

Bonjour,

> J'ai une seconde question, la solution poposée concerne le filtrage des
> identifiants non souhaités. est-il possible de raisonner en sens inverse,
> c'est-à-dire plutôt que de préciser les urls non souhaitées, préciser
> celles-voulues et le moissonnage se fait sur celles-ci ?
>
>

Non, ce n'est pas possible. Si vous voulez faire de la sélection
positive en OAI, ça se fait normalement par le biais de set
(ensembles) permettant d'isoler des groupe de fiches.
Le filtrage négatif dont je parlais est uniquement prévu au départ pour
ne pas moissonner ses propres fiches locales, dans votre cas c'est plus
une astuce que je vous proposais dans une contexte donné. Si les 4200
fiches dont vous parlez ne possèdent pas de sous-chaines communes
permettant de les filtrer par groupes, il vous faudra attendre la
version 1.5 du repository.

> Car, l'entrepôt que je moissonne dispose de plus de 4200 fiches dont seulement
> 400 m'intéressent. Il me faut donc lister 3800 urls à filtrer.
>
>

Vous n'avez pas à filtrer chacune des 3800 fiches individuellement, le
filtrage porte sur une sous-chaine de leurs identifiants OAI( et non de
leur url).
Avez vous vérifier qu'il n'existe pas de set dans l'entrepôt que vous
moissonnez ne contenant que les 400 fiches souhaitées ? Car encore une
fois, le filtrage côté moissonneur n'est pas la solution idéale, cela
déroge au protocole OAI qui prévoit des sets pour cela.

François

> Merci,
>
> Karine Lauro

--
Ce message a

karine.lauro
Bonjour,

Merci pour la réponse, je suis entièrement d'accord avec vous, il s'agit
d'une astuce car j'ai vérifié sur l'existence d'un set oai et la réponse est
que l'entrepôt ne supporte pas les sets oai et le développement de cette
fonctionnalité n'est pas prévu à l'ordre du jour.

Par contre, vous dîtes que le filtrage se fait sur une sous-chaîne, je n'ai
pas vraiment suivi.
Les adresses que je souhaite filtrer commencent toutes de la même façon
oai:nom de l'entrepôt/xxx

Que faut-il préciser dans la propriété idfilters ? et dans quel bean se
positionne cette proporiété ?

Karine

--
Ce message a

francoisjannin
a écrit :

> Bonjour,
>
> Merci pour la réponse, je suis entièrement d'accord avec vous, il s'agit
> d'une astuce car j'ai vérifié sur l'existence d'un set oai et la réponse est
> que l'entrepôt ne supporte pas les sets oai et le développement de cette
> fonctionnalité n'est pas prévu à l'ordre du jour.
>
> Par contre, vous dîtes que le filtrage se fait sur une sous-chaîne, je n'ai
> pas vraiment suivi.
> Les adresses que je souhaite filtrer commencent toutes de la même façon
> oai:nom de l'entrepôt/xxx
>
> Que faut-il préciser dans la propriété idfilters ? et dans quel bean se
> positionne cette proporiété ?
>
>

Il s'agit du bean harvestServiceNoTx. Vous devez lister les noms
d'entrepôts que vous ne voulez pas moissonner :

nom de l'entrepot 1
nom de l'entrepot 2
etc....

François

--
Ce message a

karine.lauro
Bonjour,

J'ai quelques soucis pour définir les valeurs de la propriété idFilters.
J'ai cette erreur qui me le montre au démarrage du tomcat pour le module
harvester.
Caused by:
org.springframework.beans.factory.BeanCreationException: Error creating bean
with name 'harvestServiceNoTx' defined in ServletContext resource
[/WEB-INF/classes/properties/harvester-domain.xml]: Error setting property
values; nested exception is
org.springframework.beans.NotWritablePropertyException: Invalid property
'idFilters' of bean class
[org.orioai.harvesting.domain.service.HarvestServiceImpl]: Bean property
'idFilters' is not writable or has an invalid setter method. Does the parameter
type of the setter match the return type of the getter?

en fait, j'ai laissé ${local.repositoryIdentifier}
et j'ai modifié [filtre identifiant fiches] dans [filtre identifiant
fiches]

Mais, il y a problème. Auriez-vous un exemple pour le contenu de [filtre
identifiant fiches] ?
La ligne ${local.repositoryIdentifier} doit-elle être
absolument laissée ?

Merci,

Karine Lauro
--
Ce message a

francoisjannin
Bonjour,

Dans mon mail du 26 j'ai donné un exemple de ce filtre, que je redonne
ici :

nom de l'entrepot 1
nom de l'entrepot 2

Le mieux serait que vous montriez votre configuration xml dans le
détail, car je ne vois pas ce qui pose problème.
Pourriez-vous transmettre à la liste votre fharvester-domain.xml ou bien
le contenu de la balise ?

karine.lauro@univ-rennes1.fr a écrit :

> Bonjour,
>
> J'ai quelques soucis pour définir les valeurs de la propriété idFilters.
> J'ai cette erreur qui me le montre au démarrage du tomcat pour le module
> harvester.
> Caused by:
> org.springframework.beans.factory.BeanCreationException: Error creating bean
> with name 'harvestServiceNoTx' defined in ServletContext resource
> [/WEB-INF/classes/properties/harvester-domain.xml]: Error setting property
> values; nested exception is
> org.springframework.beans.NotWritablePropertyException: Invalid property
> 'idFilters' of bean class
> [org.orioai.harvesting.domain.service.HarvestServiceImpl]: Bean property
> 'idFilters' is not writable or has an invalid setter method. Does the parameter
> type of the setter match the return type of the getter?
>
> en fait, j'ai laissé ${local.repositoryIdentifier}
> et j'ai modifié [filtre identifiant fiches] dans [filtre identifiant
> fiches]

>
> Mais, il y a problème. Auriez-vous un exemple pour le contenu de [filtre
> identifiant fiches] ?
> La ligne ${local.repositoryIdentifier} doit-elle être
> absolument laissée ?
>
>

non, cette ligne est une facilité pour aller chercher la valeur
directement dans le fichier ori.properties, pour ne pas editer chaque
fichier xml un par un.
Si vous définissez des valeurs en editant ce fichier, vous n'avez donc
plus besoin de cette facilité.

Cordialement,

François

--
Ce message a

Options d'affichage des commentaires

Sélectionnez la méthode d'affichage des commentaires que vous préférez, puis cliquez sur « Enregistrer les paramètres » pour activer vos changements.
Sujet clos