Pb import TEF - STAR (2)

  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:878b4d9a34f11c7d3b976725f50668e6' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour Yohan,<br />Non, ce n\'est pas bloquant. Il suffit qu\'il y ait qq<br />\nchose dans l\'index pour que rien n\'y paraisse !<br />Je peux<br />\n&quot;tenir&quot; ...<br />Merci.<br />A bientot.<br<br />\n/>Fran&ccedil;oise.</p>\n<p>Le Mar 7 septembre 2010 13:58, Yohan<br />\nColmant a &eacute;crit : <br />&gt; Fran&ccedil;oise, <br />&gt; <br<br />\n/>&gt;\n</div>\n', created = 1507746918, expire = 1507833318, headers = '', serialized = 0 WHERE cid = '4:878b4d9a34f11c7d3b976725f50668e6' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:878b4d9a34f11c7d3b976725f50668e6' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Bonjour Yohan,<br />Non, ce n\'est pas bloquant. Il suffit qu\'il y ait qq<br />\nchose dans l\'index pour que rien n\'y paraisse !<br />Je peux<br />\n&quot;tenir&quot; ...<br />Merci.<br />A bientot.<br<br />\n/>Fran&ccedil;oise.</p>\n<p>Le Mar 7 septembre 2010 13:58, Yohan<br />\nColmant a &eacute;crit : <br />&gt; Fran&ccedil;oise, <br />&gt; <br<br />\n/>&gt;\n</div>\n', created = 1507746918, expire = 1507833318, headers = '', serialized = 0 WHERE cid = '4:878b4d9a34f11c7d3b976725f50668e6' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:db9c0ffd887bc3fcdbe3a53b5a512848' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">\nJe confirme aussi que ORI n\'importe pas le bloc <mets:mdWrap MDTYPE=\"OTHER\" OTHERMDTYPE=\"tef_desc_edition\"> pour les thèses STAR ce qui explique le message d\'erreur décrit par Jean-François :</p>\n<p>\"Toute EDITION de la thèse doit être associée à des métadonnées de type \"tef_desc_edition\". \"</p>\n<p>Nous ne rencontrons pas ce pb sur les TEF-Sudoc que nous importons.</p>\n<p>Alain </p>\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Bonjour,<br />\n><br />\n> Un autre problème lié à l\'import de STAR (en plus du caractère étrange en début de fichier et de l\'erreur signalé par Jean-François dans le workflow) :<br />\n><br />\n> Ori importe :<br />\n> <mets:FLocat LOCTYPE=\"URL\" xlink:href=\"\\\\Sql01\\depot_these\\Theses\\STAR\\STOCK\\THESE_5162\\DepotEdition\\khelfaanissa1\\khelfaanissa2\\Khelfa.Anissa.SMZ0915.pdf\"/><br />\n><br />\n> Ce qui fait que nous nous retrouvons avec une belle URL de type :<br />\n> \\\\Sql01\\depot_these\\Theses\\STAR\\STOCK\\THESE_5162\\DepotEdition\\khelfaanissa1\\khelfaanissa2\\Khelfa.Anissa.SMZ0915.pdf<br />\n><br />\n> L\'URL correcte est dans tef:edition :<br />\n> <dc:identifier xsi:type=\"dcterms:URI\"><br />\n> <a href=\"ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf\" title=\"ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf\">ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf</a><br />\n> </dc:identifier><br />\n> <dc:identifier xsi:type=\"dcterms:URI\">http://STARFileDirectory/khelfaanissa1</dc:identifier><br />\n><br />\n><br />\n> Bon week-end !<br />\n><br />\n> Alain<br />\n><br />\n><br />\n><br />\n><br />\n><br />\n><br />\n> </p></blockquote>\n<blockquote class=\"emailFilter_Author_1\"><p>> > Salut Yann,<br />\n> ><br />\n> > Elle est en PJ. Bon week-end !<br />\n> ><br />\n> > Jean-François.<br />\n> ><br />\n> > Yann Nicolas a écrit :</p></blockquote>\n<blockquote class=\"emailFilter_Author_2\"><p>> > > Un exemple de fiche TEF avec cette erreur ?<br />\n> > ><br />\n> > > Yann<br />\n> > ><br />\n> > ><br />\n> > > ----- Mail Original -----<br />\n> > > De: \"Yohan Colmant\" <<span id=\"919301b5c518c9ff00d1a59ebc883be5\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'919301b5c518c9ff00d1a59ebc883be5\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\'+\'\">\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>><br />\n> > > À: <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a><br />\n> > > Envoyé: Vendredi 10 Septembre 2010 15:06:53<br />\n> > > Objet: Re: [ori-oai-utilisateurs] Pb import TEF<br />\n> > ><br />\n> > > Salut JF,<br />\n> > ><br />\n> > > Je réponds dans le mail.<br />\n> > ><br />\n> > > Yohan COLMANT<br />\n> > > Direction des Systèmes d\'Information<br />\n> > > UVHC <http://www.univ-valenciennes.fr> - Université de Valenciennes et<br />\n> > > du Hainaut Cambrésis<br />\n> > > Coordinateur Technique du projet ORI-OAI <http://www.ori-oai.org><br />\n> > ><br />\n> > ><br />\n> > > Jean-François Lutz a écrit :<br />\n> > ><br />\n> > > Bonjour Yohan,<br />\n> > ><br />\n> > > Merci pour ton aide toujours aussi efficace !<br />\n> > ><br />\n> > > Je me permets de répondre sur les imports de fiches issues de<br />\n> > > STAR. Comme l\'indiquait Alain nous ne pouvons pas nous contenter<br />\n> > > de les moissonner car les laboratoires et les écoles doctorales<br />\n> > > ont été saisies dans STAR sans aucune liste ou forme d\'autorité,<br />\n> > > d\'où un nombre très élevé de doublons (un même labo décrit de 5<br />\n> > > manières différentes par exemples, sachant qu\'il y a 82<br />\n> > > laboratoires...). Nous allons donc les importer et utiliser les<br />\n> > > listes d\'autorité internes à ORI-OAI.<br />\n> > ><br />\n> > > 1. au niveau de l\'import du fichier XML le problème est résolu.<br />\n> > > Les fiches TEF XML produites par STAR comportent les trois<br />\n> > > caractères suivants  avant la première balise de l\'entête et<br />\n> > > ils font planter l\'import. Il suffit pour l\'instant de les<br />\n> > > supprimer. Peut-être la nouvelle version de STAR corrigera-t-elle<br />\n> > > ce bug.<br />\n> > ><br />\n> > > bonne nouvelle :-)<br />\n> > ><br />\n> > ><br />\n> > > 2. dans le workflow, l\'édition se passe sans problème mais au<br />\n> > > niveau de la publication, outre le fait qu\'il faut cocher la case<br />\n> > > \"fichier maître\" ce qui est un détail, un problème persiste sans<br />\n> > > qu\'Alain et moi arrivions à déterminer son origine. Le message<br />\n> > > suivant apparaît dans la colonne \"Informations\" et il empêche de<br />\n> > > publier la fiche : \"Toute EDITION de la thèse doit être associée à<br />\n> > > des métadonnées de type \"tef_desc_edition\".\" Quelqu\'un aurait-il<br />\n> > > une idée de la solution ? Merci par avance.<br />\n> > ><br />\n> > > Tu as l\'erreur quand tu essayes de la publier simplement ou quand tu<br />\n> > > tentes de l\'envoyer à l\'ABES ? Et le problème a lieu avec une fiche<br />\n> > > importée ou saisie de zéro dans ORI-OAI ?<br />\n> > ><br />\n> > > Si je regarde cette erreur, elle vient du schematron de l\'ABES avec<br />\n> > > cette règle :<br />\n> > ><br />\n> > ><br />\n<pattern name=\"mets_structMap_meta_Edition\"<br />\n> > > id=\"mets_structMap_meta_Edition\"><br />\n> > > <rule<br />\n> > > context=\"/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE=\'EDITION\']\"><br />\n> > > <assert test=\"@DMDID =<br />\n> > > /mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE=\'tef_desc_edition\']]/@ID\">tef_easy.schematron.tef-abes.structMap.meta_Edition.check_rule</assert><br />\n> > > </rule><br />\n> > > </pattern>\n> > ><br />\n> > > Donc autrement dit, l\'erreur apparait quand<br />\n> > > /mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE=\'EDITION\']/@DMDID<br />\n> > ><br />\n> > > n\'est pas égal à<br />\n> > > /mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE=\'tef_desc_edition\']]/@ID<br />\n> > > dans la fiche TEF.<br />\n> > ><br />\n> > > Est-ce que ça parle à quelqu\'un ?<br />\n> > ><br />\n> > ><br />\n> > > Bon week-end.<br />\n> > ><br />\n> > > Jean-François.<br />\n> > ><br />\n> > ><br />\n> > > Yohan Colmant a écrit :<br />\n> > ><br />\n> > > Alain,<br />\n> > ><br />\n> > > Nous venons d\'avoir une réponse de l\'ABES pour le PPN et tu<br />\n> > > avais bien raison : \"le dernier caractère est un chiffre de<br />\n> > > contrôle, qui peut être soit un numéro soit un X, il n\'y a pas<br />\n> > > d\'autre caractère alphabétique possible. \".<br />\n> > > Je te propose donc ce correctif (qui sera intégré dans une<br />\n> > > prochaine version).<br />\n> > ><br />\n> > > Dans<br />\n> > > ori-oai-md-editor\\WEB-INF\\resources\\forms\\ori-md-editor\\tef-global\\form\\form.xhtml<br />\n> > > il faut remplacer toutes les occurrences de<br />\n> > > [0-9]{9}<br />\n> > > par<br />\n> > > [0-9]{8}[X0-9]{1}<br />\n> > ><br />\n> > > Donc pour les fiches du SUDOC, à part les champs qui ne sont<br />\n> > > pas remplis à fond, ceci corrige ton problème ?<br />\n> > ><br />\n> > ><br />\n> > > Concernant les fiches qui proviennent de STAR, tu ne m\'en<br />\n> > > avais pas parlé ?<br />\n> > ><br />\n> > > Peux-tu m\'en envoyer une d\'exemple stp ?<br />\n> > > Quand tu dis que ça plante, c\'est au niveau du md-editor ou<br />\n> > > déjà dans le workflow ?<br />\n> > ><br />\n> > > Merci<br />\n> > ><br />\n> > > Yohan COLMANT<br />\n> > > Direction des Systèmes d\'Information<br />\n> > > UVHC <http://www.univ-valenciennes.fr> - Université de<br />\n> > > Valenciennes et du Hainaut Cambrésis<br />\n> > > Coordinateur Technique du projet ORI-OAI <http://www.ori-oai.org><br />\n> > ><br />\n> > ><br />\n> > > le drezen alain a écrit :<br />\n> > ><br />\n> > > Bonjour Yohan,<br />\n> > ><br />\n> > > Voici les éléments de réponse.<br />\n> > ><br />\n> > > Le 10/09/2010 10:31, Yohan Colmant a écrit :<br />\n> > ><br />\n> > > Salut Alain,<br />\n> > ><br />\n> > > Je commence ENFIN à me pencher sur ton problème.<br />\n> > ><br />\n> > > En premier lieu, pourquoi importes-tu les fiches dans<br />\n> > > ton workflow ? Tu ne peux pas les moissonner plutôt ?<br />\n> > > Comment les as-tu récupérées ?<br />\n> > ><br />\n> > > Pour le SUDOC pas de moissonnage possible. Pour Star le<br />\n> > > moissonnage serait possible. Mais dans les deux cas nous<br />\n> > > devons modifier les notices ce qui n\'est pas possible sur<br />\n> > > une notice moissonnée.<br />\n> > ><br />\n> > > Là, les erreurs que tu mentionnes apparaissent dans le<br />\n> > > md-editor, mais pas dans le workflow ? Si tu veux<br />\n> > > juste importer ces fiches et les publier, rien ne te<br />\n> > > bloque ?<br />\n> > ><br />\n> > > En ce qui concerne l\'import, en effet pas de problème pour<br />\n> > > les notices SUDOC. Ce n\'est pas le cas pour les notices<br />\n> > > STAR qui elles plantent dès l\'import..<br />\n> > > Cependant certaines notices SUDOC ne sont pas éditable<br />\n> > > dans le workflow ce qui empêchera de les compléter et donc<br />\n> > > de les publier.<br />\n> > ><br />\n> > > Si je n\'arrivais pas à débloquer ton problème avant le<br />\n> > > retour de Nolwen, est-ce que tu serais bloqué ? En<br />\n> > > gros, as-tu besoin de modifier les fiches que tu<br />\n> > > importes ou non ?<br />\n> > ><br />\n> > > Oui, nous devons les modifier avant de les publier. Par<br />\n> > > exemple la thèse nommée \"Quelle formation pour le médecin<br />\n> > > généraliste psychothérapeute de fait\" ne s\'ouvre pas dans<br />\n> > > l\'éditeur à cause des caractères spéciaux en début de titre.<br />\n> > ><br />\n> > > Si non, tu peux simplement importer les fiches et les<br />\n> > > indexer. Effectivement, si tu cherches à les<br />\n> > > visualiser dans le md-editor, tu auras ces soucis,<br />\n> > > mais cela te permet tout de même de faire l\'import en<br />\n> > > attendant ?<br />\n> > ><br />\n> > ><br />\n> > > Second point, c\'est Nolwen qui est plus à même de<br />\n> > > répondre à tes interrogations sur le module, donc je<br />\n> > > vais faire de mon mieux :-(<br />\n> > ><br />\n> > ><br />\n> > > Pour commencer, j\'ai pris en exemple la fiche<br />\n> > > Metz_13738551X.xml<br />\n> > ><br />\n> > > 1) Les erreurs liées au nom et prénom qui ne doivent<br />\n> > > pas être vides sont connues. Là on a des choses à<br />\n> > > faire par la suite, mais c\'est juste un soucis<br />\n> > > d\'affichage. Il te suffit de cliquer sur le nom et<br />\n> > > refermer la fenêtre de saisie de la personne pour voir<br />\n> > > que l\'erreur disparait. Nolwen n\'avait pas réussi à<br />\n> > > contourner ce problème avant son départ.<br />\n> > > Lorsque tu as un PPN composé de 9 chiffres comme prévu<br />\n> > > jusqu\'ici dans l\'éditeur TEF, le même problème se<br />\n> > > pose, ouvre et referme la fenêtre de saisie, tu verras<br />\n> > > que ça marche en fait.<br />\n> > ><br />\n> > > Ca c\'est un pb connu<br />\n> > ><br />\n> > > 2) Il manque des mots-clefs en français. Ils sont<br />\n> > > décrits comme obligatoires dans le TEF :<br />\n> > > <a href=\"http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html\" title=\"http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html\">http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html</a><br />\n> > ><br />\n> > ><br />\n> > > Ok normal<br />\n> > ><br />\n> > ><br />\n> > > 3) Pour le PPN qui comporte 8 chiffres et une lettre ....<br />\n> > > J\'ai essayé de joindre les collègues fonctionnels mais<br />\n> > > ils ne sont pas joignables pour le moment. Les<br />\n> > > quelques docs que j\'ai trouvées parlent bien de 9<br />\n> > > chiffres. Tu as une info ou une doc où ils parlent<br />\n> > > d\'une possibilité de caractères autres ?<br />\n> > ><br />\n> > ><br />\n> > > Voici un extrait de la doc de l\'ABES :<br />\n> > > Zone 001 : Numéro d\'identification de la notice<br />\n> > > Zone système protégée, obligatoire, non répétable, sans<br />\n> > > indicateurs et sans sous-zones.<br />\n> > > Le contenu de la zone est générée automatiquement par le<br />\n> > > système lors de la validation d\'une nouvelle notice<br />\n> > > Dans le Sudoc, l\'identifiant unique de la notice est<br />\n> > > appelé ppn (= Pica production number). Il comporte 9<br />\n> > > caractères :<br />\n> > > 8 chiffres (attribués par le système de manière<br />\n> > > séquentielle = numéro d\'\"ordre\" de la notice dans la base<br />\n> > > de données)<br />\n> > > une clé de contrôle sur 1 caractère, qui peut être un<br />\n> > > chiffre ou \"X\"<br />\n> > ><br />\n> > > 4) Concernant le fichier maintenant ...<br />\n> > > Je ne connais pas assez le TEF, mais je sais que le<br />\n> > > type mime et l\'URL du fichier sont à 2 endroits dans<br />\n> > > le TEF que nous générons.<br />\n> > > Dans tes fiches, cela n\'apparait qu\'une fois. Il reste<br />\n> > > la rubrique suivante qui est vide :<br />\n> > > <mets:fileSec><br />\n> > > <mets:fileGrp USE=\"archive\" ID=\"FGrID1\"><br />\n> > > <mets:file ID=\"FID1\" MIMETYPE=\"\" ADMID=\"file_1\"<br />\n> > > USE=\"maitre\"><br />\n> > > <mets:FLocat LOCTYPE=\"URL\" xlink:href=\"\"/><br />\n> > > </mets:file><br />\n> > > </mets:fileGrp><br />\n> > > </mets:fileSec><br />\n> > > D\'où l\'erreur dans l\'IHM ...<br />\n> > > Si on se réfère à cette doc, on lit \"*Seule l\'édition<br />\n> > > d\'archivage doit obligatoirement être représentée dans<br />\n> > > cette section.* Cette présence est facultative pour<br />\n> > > les autres éditions. \".<br />\n> > > Dans ton cas, si je prends la fiche<br />\n> > > Metz_13738551X.xml, on voit bien USE=\"archive\" dans le<br />\n> > > bloc mets:fileSec. Si je comprends bien, dans ce cas,<br />\n> > > les métadonnées MIMETYPE et URL sont obligatoires. Ici<br />\n> > > elles ne sont pas remplies.<br />\n> > ><br />\n> > > J\'ai corrigé mes fichiers en remplissant <mets:fileSec> et<br />\n> > > je récupe^\'re bien l\'URL lors de l\'import.<br />\n> > > Pour l\'anecdote je n\'ai pas réussi à importer un fichier<br />\n> > > TEF généré par ORI (pas de chance ???)<br />\n> > ><br />\n> > ><br />\n> > ><br />\n> > > Je reviens vers toi quand tu auras pu me donner un peu<br />\n> > > plus d\'infos et fait un retour sur ce mail.<br />\n> > > Je te dirai aussi ce que j\'ai eu comme infos pour le PPN.<br />\n> > ><br />\n> > > A bientôt,<br />\n> > ><br />\n> > > Yohan COLMANT<br />\n> > > Direction des Systèmes d\'Information<br />\n> > > UVHC <http://www.univ-valenciennes.fr> - Université de<br />\n> > > Valenciennes et du Hainaut Cambrésis<br />\n> > > Coordinateur Technique du projet ORI-OAI<br />\n> > > <http://www.ori-oai.org><br />\n> > ><br />\n> > ><br />\n> > > Alain Le Drezen a écrit :<br />\n> > ><br />\n> > > Bonjour,<br />\n> > ><br />\n> > > Voici quelques problèmes rencontrés lors de<br />\n> > > l\'import de notices de thèses du SUDOC (import en<br />\n> > > pièce jointe).<br />\n> > ><br />\n> > > L\'URL du fichier (<dc:identifier<br />\n> > > xsi:type=\"dcterms:URI\">) ne s\'importe pas.<br />\n> > ><br />\n> > > La notice de la thèse \"Quelle formation pour le<br />\n> > > médecin généraliste psychothérapeute de fait\" ne<br />\n> > > s\'affiche pas dans l\'éditeur (page grise vide). Il<br />\n> > > semble que ce soit lié à la présence de caractères<br />\n> > > étranges en début du titre. Mais ceci ne devrait<br />\n> > > pas être bloquant.<br />\n> > ><br />\n> > > Dans l\'éditeur, l\'erreur \"Le PPN du mot sujet<br />\n> > > Rameau doit être composé de neuf chiffres\" est<br />\n> > > erronée. Un PPN peu contenir des caractères.<br />\n> > ><br />\n> > > Merci d\'avance pour tout élément de réponse.<br />\n> > ><br />\n> > > Alain<br />\n> > ><br />\n> > ><br />\n> > ><br />\n> > ><br />\n> > ><br />\n> > ><br />\n> > ><br />\n> > ><br />\n> > ><br />\n> > ><br />\n> > ></p></blockquote>\n<blockquote class=\"emailFilter_Author_1\"><p>> > </p></blockquote>\n<blockquote class=\"emailFilter_Author_0\"><p>><br />\n> </div>\n</blockquote>\n</div>\n', created = 1507746918, expire = 1507833318, headers = '', serialized = 0 WHERE cid = '4:db9c0ffd887bc3fcdbe3a53b5a512848' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
1 message / 0 nouveaux
Dernière contribution
ledrezen
Pb import TEF - STAR (2)
Je confirme aussi que ORI n'importe pas le bloc pour les thèses STAR ce qui explique le message d'erreur décrit par Jean-François :

"Toute EDITION de la thèse doit être associée à des métadonnées de type "tef_desc_edition". "

Nous ne rencontrons pas ce pb sur les TEF-Sudoc que nous importons.

Alain

> Bonjour,
>
> Un autre problème lié à l'import de STAR (en plus du caractère étrange en début de fichier et de l'erreur signalé par Jean-François dans le workflow) :
>
> Ori importe :
>
>
> Ce qui fait que nous nous retrouvons avec une belle URL de type :
> \\Sql01\depot_these\Theses\STAR\STOCK\THESE_5162\DepotEdition\khelfaanissa1\khelfaanissa2\Khelfa.Anissa.SMZ0915.pdf
>
> L'URL correcte est dans tef:edition :
>
> ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf
>

> http://STARFileDirectory/khelfaanissa1
>
>
> Bon week-end !
>
> Alain
>
>
>
>
>
>
>

> > Salut Yann,
> >
> > Elle est en PJ. Bon week-end !
> >
> > Jean-François.
> >
> > Yann Nicolas a écrit :

> > > Un exemple de fiche TEF avec cette erreur ?
> > >
> > > Yann
> > >
> > >
> > > ----- Mail Original -----
> > > De: "Yohan Colmant" < >
> > > À: ori-oai-utilisateurs@listes.univ-rennes1.fr
> > > Envoyé: Vendredi 10 Septembre 2010 15:06:53
> > > Objet: Re: [ori-oai-utilisateurs] Pb import TEF
> > >
> > > Salut JF,
> > >
> > > Je réponds dans le mail.
> > >
> > > Yohan COLMANT
> > > Direction des Systèmes d'Information
> > > UVHC - Université de Valenciennes et
> > > du Hainaut Cambrésis
> > > Coordinateur Technique du projet ORI-OAI
> > >
> > >
> > > Jean-François Lutz a écrit :
> > >
> > > Bonjour Yohan,
> > >
> > > Merci pour ton aide toujours aussi efficace !
> > >
> > > Je me permets de répondre sur les imports de fiches issues de
> > > STAR. Comme l'indiquait Alain nous ne pouvons pas nous contenter
> > > de les moissonner car les laboratoires et les écoles doctorales
> > > ont été saisies dans STAR sans aucune liste ou forme d'autorité,
> > > d'où un nombre très élevé de doublons (un même labo décrit de 5
> > > manières différentes par exemples, sachant qu'il y a 82
> > > laboratoires...). Nous allons donc les importer et utiliser les
> > > listes d'autorité internes à ORI-OAI.
> > >
> > > 1. au niveau de l'import du fichier XML le problème est résolu.
> > > Les fiches TEF XML produites par STAR comportent les trois
> > > caractères suivants  avant la première balise de l'entête et
> > > ils font planter l'import. Il suffit pour l'instant de les
> > > supprimer. Peut-être la nouvelle version de STAR corrigera-t-elle
> > > ce bug.
> > >
> > > bonne nouvelle :-)
> > >
> > >
> > > 2. dans le workflow, l'édition se passe sans problème mais au
> > > niveau de la publication, outre le fait qu'il faut cocher la case
> > > "fichier maître" ce qui est un détail, un problème persiste sans
> > > qu'Alain et moi arrivions à déterminer son origine. Le message
> > > suivant apparaît dans la colonne "Informations" et il empêche de
> > > publier la fiche : "Toute EDITION de la thèse doit être associée à
> > > des métadonnées de type "tef_desc_edition"." Quelqu'un aurait-il
> > > une idée de la solution ? Merci par avance.
> > >
> > > Tu as l'erreur quand tu essayes de la publier simplement ou quand tu
> > > tentes de l'envoyer à l'ABES ? Et le problème a lieu avec une fiche
> > > importée ou saisie de zéro dans ORI-OAI ?
> > >
> > > Si je regarde cette erreur, elle vient du schematron de l'ABES avec
> > > cette règle :
> > >
> > >
> > > id="mets_structMap_meta_Edition">
> > > > > > context="/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE='EDITION']">
> > > tef_easy.schematron.tef-abes.structMap.meta_Edition.check_rule
> > >
> > >
> > >
> > > Donc autrement dit, l'erreur apparait quand
> > > /mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE='EDITION']/@DMDID
> > >
> > > n'est pas égal à
> > > /mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE='tef_desc_edition']]/@ID
> > > dans la fiche TEF.
> > >
> > > Est-ce que ça parle à quelqu'un ?
> > >
> > >
> > > Bon week-end.
> > >
> > > Jean-François.
> > >
> > >
> > > Yohan Colmant a écrit :
> > >
> > > Alain,
> > >
> > > Nous venons d'avoir une réponse de l'ABES pour le PPN et tu
> > > avais bien raison : "le dernier caractère est un chiffre de
> > > contrôle, qui peut être soit un numéro soit un X, il n'y a pas
> > > d'autre caractère alphabétique possible. ".
> > > Je te propose donc ce correctif (qui sera intégré dans une
> > > prochaine version).
> > >
> > > Dans
> > > ori-oai-md-editor\WEB-INF\resources\forms\ori-md-editor\tef-global\form\form.xhtml
> > > il faut remplacer toutes les occurrences de
> > > [0-9]{9}
> > > par
> > > [0-9]{8}[X0-9]{1}
> > >
> > > Donc pour les fiches du SUDOC, à part les champs qui ne sont
> > > pas remplis à fond, ceci corrige ton problème ?
> > >
> > >
> > > Concernant les fiches qui proviennent de STAR, tu ne m'en
> > > avais pas parlé ?
> > >
> > > Peux-tu m'en envoyer une d'exemple stp ?
> > > Quand tu dis que ça plante, c'est au niveau du md-editor ou
> > > déjà dans le workflow ?
> > >
> > > Merci
> > >
> > > Yohan COLMANT
> > > Direction des Systèmes d'Information
> > > UVHC - Université de
> > > Valenciennes et du Hainaut Cambrésis
> > > Coordinateur Technique du projet ORI-OAI
> > >
> > >
> > > le drezen alain a écrit :
> > >
> > > Bonjour Yohan,
> > >
> > > Voici les éléments de réponse.
> > >
> > > Le 10/09/2010 10:31, Yohan Colmant a écrit :
> > >
> > > Salut Alain,
> > >
> > > Je commence ENFIN à me pencher sur ton problème.
> > >
> > > En premier lieu, pourquoi importes-tu les fiches dans
> > > ton workflow ? Tu ne peux pas les moissonner plutôt ?
> > > Comment les as-tu récupérées ?
> > >
> > > Pour le SUDOC pas de moissonnage possible. Pour Star le
> > > moissonnage serait possible. Mais dans les deux cas nous
> > > devons modifier les notices ce qui n'est pas possible sur
> > > une notice moissonnée.
> > >
> > > Là, les erreurs que tu mentionnes apparaissent dans le
> > > md-editor, mais pas dans le workflow ? Si tu veux
> > > juste importer ces fiches et les publier, rien ne te
> > > bloque ?
> > >
> > > En ce qui concerne l'import, en effet pas de problème pour
> > > les notices SUDOC. Ce n'est pas le cas pour les notices
> > > STAR qui elles plantent dès l'import..
> > > Cependant certaines notices SUDOC ne sont pas éditable
> > > dans le workflow ce qui empêchera de les compléter et donc
> > > de les publier.
> > >
> > > Si je n'arrivais pas à débloquer ton problème avant le
> > > retour de Nolwen, est-ce que tu serais bloqué ? En
> > > gros, as-tu besoin de modifier les fiches que tu
> > > importes ou non ?
> > >
> > > Oui, nous devons les modifier avant de les publier. Par
> > > exemple la thèse nommée "Quelle formation pour le médecin
> > > généraliste psychothérapeute de fait" ne s'ouvre pas dans
> > > l'éditeur à cause des caractères spéciaux en début de titre.
> > >
> > > Si non, tu peux simplement importer les fiches et les
> > > indexer. Effectivement, si tu cherches à les
> > > visualiser dans le md-editor, tu auras ces soucis,
> > > mais cela te permet tout de même de faire l'import en
> > > attendant ?
> > >
> > >
> > > Second point, c'est Nolwen qui est plus à même de
> > > répondre à tes interrogations sur le module, donc je
> > > vais faire de mon mieux :-(
> > >
> > >
> > > Pour commencer, j'ai pris en exemple la fiche
> > > Metz_13738551X.xml
> > >
> > > 1) Les erreurs liées au nom et prénom qui ne doivent
> > > pas être vides sont connues. Là on a des choses à
> > > faire par la suite, mais c'est juste un soucis
> > > d'affichage. Il te suffit de cliquer sur le nom et
> > > refermer la fenêtre de saisie de la personne pour voir
> > > que l'erreur disparait. Nolwen n'avait pas réussi à
> > > contourner ce problème avant son départ.
> > > Lorsque tu as un PPN composé de 9 chiffres comme prévu
> > > jusqu'ici dans l'éditeur TEF, le même problème se
> > > pose, ouvre et referme la fenêtre de saisie, tu verras
> > > que ça marche en fait.
> > >
> > > Ca c'est un pb connu
> > >
> > > 2) Il manque des mots-clefs en français. Ils sont
> > > décrits comme obligatoires dans le TEF :
> > > http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html
> > >
> > >
> > > Ok normal
> > >
> > >
> > > 3) Pour le PPN qui comporte 8 chiffres et une lettre ....
> > > J'ai essayé de joindre les collègues fonctionnels mais
> > > ils ne sont pas joignables pour le moment. Les
> > > quelques docs que j'ai trouvées parlent bien de 9
> > > chiffres. Tu as une info ou une doc où ils parlent
> > > d'une possibilité de caractères autres ?
> > >
> > >
> > > Voici un extrait de la doc de l'ABES :
> > > Zone 001 : Numéro d'identification de la notice
> > > Zone système protégée, obligatoire, non répétable, sans
> > > indicateurs et sans sous-zones.
> > > Le contenu de la zone est générée automatiquement par le
> > > système lors de la validation d'une nouvelle notice
> > > Dans le Sudoc, l'identifiant unique de la notice est
> > > appelé ppn (= Pica production number). Il comporte 9
> > > caractères :
> > > 8 chiffres (attribués par le système de manière
> > > séquentielle = numéro d'"ordre" de la notice dans la base
> > > de données)
> > > une clé de contrôle sur 1 caractère, qui peut être un
> > > chiffre ou "X"
> > >
> > > 4) Concernant le fichier maintenant ...
> > > Je ne connais pas assez le TEF, mais je sais que le
> > > type mime et l'URL du fichier sont à 2 endroits dans
> > > le TEF que nous générons.
> > > Dans tes fiches, cela n'apparait qu'une fois. Il reste
> > > la rubrique suivante qui est vide :
> > >
> > >
> > > > > > USE="maitre">
> > >
> > >

> > >

> > >

> > > D'où l'erreur dans l'IHM ...
> > > Si on se réfère à cette doc, on lit "*Seule l'édition
> > > d'archivage doit obligatoirement être représentée dans
> > > cette section.* Cette présence est facultative pour
> > > les autres éditions. ".
> > > Dans ton cas, si je prends la fiche
> > > Metz_13738551X.xml, on voit bien USE="archive" dans le
> > > bloc mets:fileSec. Si je comprends bien, dans ce cas,
> > > les métadonnées MIMETYPE et URL sont obligatoires. Ici
> > > elles ne sont pas remplies.
> > >
> > > J'ai corrigé mes fichiers en remplissant et
> > > je récupe^'re bien l'URL lors de l'import.
> > > Pour l'anecdote je n'ai pas réussi à importer un fichier
> > > TEF généré par ORI (pas de chance ???)
> > >
> > >
> > >
> > > Je reviens vers toi quand tu auras pu me donner un peu
> > > plus d'infos et fait un retour sur ce mail.
> > > Je te dirai aussi ce que j'ai eu comme infos pour le PPN.
> > >
> > > A bientôt,
> > >
> > > Yohan COLMANT
> > > Direction des Systèmes d'Information
> > > UVHC - Université de
> > > Valenciennes et du Hainaut Cambrésis
> > > Coordinateur Technique du projet ORI-OAI
> > >
> > >
> > >
> > > Alain Le Drezen a écrit :
> > >
> > > Bonjour,
> > >
> > > Voici quelques problèmes rencontrés lors de
> > > l'import de notices de thèses du SUDOC (import en
> > > pièce jointe).
> > >
> > > L'URL du fichier ( > > > xsi:type="dcterms:URI">) ne s'importe pas.
> > >
> > > La notice de la thèse "Quelle formation pour le
> > > médecin généraliste psychothérapeute de fait" ne
> > > s'affiche pas dans l'éditeur (page grise vide). Il
> > > semble que ce soit lié à la présence de caractères
> > > étranges en début du titre. Mais ceci ne devrait
> > > pas être bloquant.
> > >
> > > Dans l'éditeur, l'erreur "Le PPN du mot sujet
> > > Rameau doit être composé de neuf chiffres" est
> > > erronée. Un PPN peu contenir des caractères.
> > >
> > > Merci d'avance pour tout élément de réponse.
> > >
> > > Alain
> > >
> > >
> > >
> > >
> > >
> > >
> > >
> > >
> > >
> > >
> > >

> >

>
>