question à propos de l'affichage du rapport de l'harvester

  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:be69fd1fe94d9d0faae74f11879494a1' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour à tous,</p>\n<p>Cette question est adressée plus particulièrement aux développeurs ORI-OAI,<br />\nque je tiens à féliciter pour leur excellent travail.</p>\n<p>La société Onext développe pour l\'université Paris 1 un portail sous Typo3.</p>\n<p>Dans ce portail un plugin permettra de déposer les documents Typo3 dans<br />\nun répertoire de l\'espace Webdav ESUP.\n</div>\n', created = 1507745899, expire = 1507832299, headers = '', serialized = 0 WHERE cid = '4:be69fd1fe94d9d0faae74f11879494a1' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:be69fd1fe94d9d0faae74f11879494a1' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour à tous,</p>\n<p>Cette question est adressée plus particulièrement aux développeurs ORI-OAI,<br />\nque je tiens à féliciter pour leur excellent travail.</p>\n<p>La société Onext développe pour l\'université Paris 1 un portail sous Typo3.</p>\n<p>Dans ce portail un plugin permettra de déposer les documents Typo3 dans<br />\nun répertoire de l\'espace Webdav ESUP.\n</div>\n', created = 1507745899, expire = 1507832299, headers = '', serialized = 0 WHERE cid = '4:be69fd1fe94d9d0faae74f11879494a1' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:cf143f2022d5e19f8da88995d9c44aa0' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour,</p>\n<p>j\'ai une question à propos du module de moissonnage.</p>\n<p>D\'abord j\'expose mon problème :</p>\n<p>Quand je moissonne l\'entrepôt de l\'INSA de Lyon à la fin de la récolte<br />\nsi je regarde le nombre de documents moissonnée j\'obtiens un total de 687.<br />\nPourtant quand je regarde le rapport de moisson il m\'indique avoir<br />\nmoissonné 688 documents.</p>\n<p>J\'ai donc regardé à la source pour savoir ce qu\'il en était.</p>\n<p>J\'ai donc fait un calcul rapide du nombre de fiches disponibles sur leur<br />\nsite :</p>\n<p>$ wget<br />\n\"http://docinsa.insa-lyon.fr/oai/oai2.php?verb=ListIdentifiers&amp;metadataPrefix=oai_dc\"<br />\n-O - 2> /dev/null|grep \"<identifier>\"|wc -l<br />\n688</p>\n<p>Il y en a donc bien 688.<br />\nPar contre si je regarde d\'un peu plus près en ne gardant que les fiches<br />\nayant un identifier distinct :</p>\n<p>$ wget<br />\n\"http://docinsa.insa-lyon.fr/oai/oai2.php?verb=ListIdentifiers&amp;metadataPrefix=oai_dc\"<br />\n-O - 2> /dev/null|grep \"<identifier>\"|sort|uniq|wc -l<br />\n687</p>\n<p>J\'en obtiens 687, donc cela veut dire qu\'il y a un identifier en double.<br />\nJe le trouve facilement :</p>\n<p>$ wget<br />\n\"http://docinsa.insa-lyon.fr/oai/oai2.php?verb=ListIdentifiers&amp;metadataPrefix=oai_dc\"<br />\n-O - 2> /dev/null|grep \"<identifier>\"|sort|uniq -d<br />\n <identifier>oai:docinsa.insa-lyon.fr:le_nost</identifier></p>\n<p>J\'en arrive donc à ma question : l\'identifier d\'une fiche de métadonnées<br />\nn\'est-il pas sensé être unique? Du coup il y aurait un problème dans<br />\nl\'index de l\'INSA de Lyon?.</p>\n<p>À+</p>\n<p>--<br />\nCe message a\n</div>\n', created = 1507745899, expire = 1507832299, headers = '', serialized = 0 WHERE cid = '4:cf143f2022d5e19f8da88995d9c44aa0' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:0384c1e52683e710025ad2bfba4b086a' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour,</p>\n<p>Oui, je confirme le diagnostic : l\'écart entre le nombre de fiches<br />\nmoissonnées (onglet rapport) et le nombre de fiches indexées (onglet<br />\nRécoltes) siginfie généralement (c\'est-à-dire dans 100% des cas avérés<br />\njusqu\'ici) que des identifiants sont en double dans l\'entrepôt moissonné.<br />\nLe moissonneur considère qu\'il s\'agit d\'une mise à jour de la même fiche<br />\net donc le compte pour un.</p>\n<p>François</p>\n<p>Mikael Le Bohec wrote:</p>\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Bonjour,<br />\n><br />\n> j\'ai une question à propos du module de moissonnage.<br />\n><br />\n> D\'abord j\'expose mon problème :<br />\n><br />\n> Quand je moissonne l\'entrepôt de l\'INSA de Lyon à la fin de la récolte<br />\n> si je regarde le nombre de documents moissonnée j\'obtiens un total de<br />\n> 687.<br />\n> Pourtant quand je regarde le rapport de moisson il m\'indique avoir<br />\n> moissonné 688 documents.<br />\n><br />\n> J\'ai donc regardé à la source pour savoir ce qu\'il en était.<br />\n><br />\n> J\'ai donc fait un calcul rapide du nombre de fiches disponibles sur<br />\n> leur site :<br />\n><br />\n> $ wget<br />\n> \"http://docinsa.insa-lyon.fr/oai/oai2.php?verb=ListIdentifiers&amp;metadataPrefix=oai_dc\"<br />\n> -O - 2> /dev/null|grep \"<identifier>\"|wc -l<br />\n> 688<br />\n><br />\n> Il y en a donc bien 688.<br />\n> Par contre si je regarde d\'un peu plus près en ne gardant que les<br />\n> fiches ayant un identifier distinct :<br />\n><br />\n> $ wget<br />\n> \"http://docinsa.insa-lyon.fr/oai/oai2.php?verb=ListIdentifiers&amp;metadataPrefix=oai_dc\"<br />\n> -O - 2> /dev/null|grep \"<identifier>\"|sort|uniq|wc -l<br />\n> 687<br />\n><br />\n> J\'en obtiens 687, donc cela veut dire qu\'il y a un identifier en double.<br />\n> Je le trouve facilement :<br />\n><br />\n> $ wget<br />\n> \"http://docinsa.insa-lyon.fr/oai/oai2.php?verb=ListIdentifiers&amp;metadataPrefix=oai_dc\"<br />\n> -O - 2> /dev/null|grep \"<identifier>\"|sort|uniq -d<br />\n> <identifier>oai:docinsa.insa-lyon.fr:le_nost</identifier><br />\n><br />\n> J\'en arrive donc à ma question : l\'identifier d\'une fiche de<br />\n> métadonnées n\'est-il pas sensé être unique? Du coup il y aurait un<br />\n> problème dans l\'index de l\'INSA de Lyon?.<br />\n><br />\n> À+</div>\n</blockquote>\n<p>--<br />\nCe message a\n</div>\n', created = 1507745900, expire = 1507832300, headers = '', serialized = 0 WHERE cid = '4:0384c1e52683e710025ad2bfba4b086a' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
2 messages / 0 nouveaux
Dernière contribution
mikaellebohec
question à propos de l'affichage du rapport de l'harvester
Bonjour,

j'ai une question à propos du module de moissonnage.

D'abord j'expose mon problème :

Quand je moissonne l'entrepôt de l'INSA de Lyon à la fin de la récolte
si je regarde le nombre de documents moissonnée j'obtiens un total de 687.
Pourtant quand je regarde le rapport de moisson il m'indique avoir
moissonné 688 documents.

J'ai donc regardé à la source pour savoir ce qu'il en était.

J'ai donc fait un calcul rapide du nombre de fiches disponibles sur leur
site :

$ wget
"http://docinsa.insa-lyon.fr/oai/oai2.php?verb=ListIdentifiers&metadataPrefix=oai_dc"
-O - 2> /dev/null|grep ""|wc -l
688

Il y en a donc bien 688.
Par contre si je regarde d'un peu plus près en ne gardant que les fiches
ayant un identifier distinct :

$ wget
"http://docinsa.insa-lyon.fr/oai/oai2.php?verb=ListIdentifiers&metadataPrefix=oai_dc"
-O - 2> /dev/null|grep ""|sort|uniq|wc -l
687

J'en obtiens 687, donc cela veut dire qu'il y a un identifier en double.
Je le trouve facilement :

$ wget
"http://docinsa.insa-lyon.fr/oai/oai2.php?verb=ListIdentifiers&metadataPrefix=oai_dc"
-O - 2> /dev/null|grep ""|sort|uniq -d
oai:docinsa.insa-lyon.fr:le_nost

J'en arrive donc à ma question : l'identifier d'une fiche de métadonnées
n'est-il pas sensé être unique? Du coup il y aurait un problème dans
l'index de l'INSA de Lyon?.

À+

--
Ce message a

francoisjannin
Bonjour,

Oui, je confirme le diagnostic : l'écart entre le nombre de fiches
moissonnées (onglet rapport) et le nombre de fiches indexées (onglet
Récoltes) siginfie généralement (c'est-à-dire dans 100% des cas avérés
jusqu'ici) que des identifiants sont en double dans l'entrepôt moissonné.
Le moissonneur considère qu'il s'agit d'une mise à jour de la même fiche
et donc le compte pour un.

François

Mikael Le Bohec wrote:

> Bonjour,
>
> j'ai une question à propos du module de moissonnage.
>
> D'abord j'expose mon problème :
>
> Quand je moissonne l'entrepôt de l'INSA de Lyon à la fin de la récolte
> si je regarde le nombre de documents moissonnée j'obtiens un total de
> 687.
> Pourtant quand je regarde le rapport de moisson il m'indique avoir
> moissonné 688 documents.
>
> J'ai donc regardé à la source pour savoir ce qu'il en était.
>
> J'ai donc fait un calcul rapide du nombre de fiches disponibles sur
> leur site :
>
> $ wget
> "http://docinsa.insa-lyon.fr/oai/oai2.php?verb=ListIdentifiers&metadataPrefix=oai_dc"
> -O - 2> /dev/null|grep ""|wc -l
> 688
>
> Il y en a donc bien 688.
> Par contre si je regarde d'un peu plus près en ne gardant que les
> fiches ayant un identifier distinct :
>
> $ wget
> "http://docinsa.insa-lyon.fr/oai/oai2.php?verb=ListIdentifiers&metadataPrefix=oai_dc"
> -O - 2> /dev/null|grep ""|sort|uniq|wc -l
> 687
>
> J'en obtiens 687, donc cela veut dire qu'il y a un identifier en double.
> Je le trouve facilement :
>
> $ wget
> "http://docinsa.insa-lyon.fr/oai/oai2.php?verb=ListIdentifiers&metadataPrefix=oai_dc"
> -O - 2> /dev/null|grep ""|sort|uniq -d
> oai:docinsa.insa-lyon.fr:le_nost
>
> J'en arrive donc à ma question : l'identifier d'une fiche de
> métadonnées n'est-il pas sensé être unique? Du coup il y aurait un
> problème dans l'index de l'INSA de Lyon?.
>
> À+

--
Ce message a

Options d'affichage des commentaires

Sélectionnez la méthode d'affichage des commentaires que vous préférez, puis cliquez sur « Enregistrer les paramètres » pour activer vos changements.
Sujet clos