Pb import TEF - STAR (3)

  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:0d8abf6bfc95df48f388c0d69eb6d2da' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n<head>\n <meta content=\"text/html;charset=UTF-8\" http-equiv=\"Content-Type\">\n</head>\n<body bgcolor=\"#ffffff\" text=\"#000000\">\n<font size=\"-1\"><font face=\"Verdana\">Bonjour,<br>\n<br>\nOui oui, que ce soit en standalone ou intégré à tous les modules, le\nrepository répond aux 6 verbes OAI-PMH.<br>\n</div>', created = 1507752238, expire = 1507838638, headers = '', serialized = 0 WHERE cid = '4:0d8abf6bfc95df48f388c0d69eb6d2da' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:0d8abf6bfc95df48f388c0d69eb6d2da' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n<head>\n <meta content=\"text/html;charset=UTF-8\" http-equiv=\"Content-Type\">\n</head>\n<body bgcolor=\"#ffffff\" text=\"#000000\">\n<font size=\"-1\"><font face=\"Verdana\">Bonjour,<br>\n<br>\nOui oui, que ce soit en standalone ou intégré à tous les modules, le\nrepository répond aux 6 verbes OAI-PMH.<br>\n</div>', created = 1507752238, expire = 1507838638, headers = '', serialized = 0 WHERE cid = '4:0d8abf6bfc95df48f388c0d69eb6d2da' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:291d2f759382db97b7e38dd37113d9fa' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n<head>\n <meta content=\"text/html; charset=UTF-8\" http-equiv=\"Content-Type\">\n</head>\n<body text=\"#000000\" bgcolor=\"#ffffff\">\nBonjour ,<br>\n<br>\n<br>\nVoici un petit complément d\'info.<br>\nC\'est en fait le md_editor qui supprime le bloc de \"tef_desc_version\"\ndans les thèses de STAR. Si on valide une fiche dans le workflow sans\nl\'ouvrir dans le md_editor , ça passe.<br>\nJ\'essaie désespérément de trouver la raison en comparant les notice\nSTAR problématiques et d\'autre notices , mais je ne voie rien de\nparticulier .<br>\n<br>\nAlain<br>\n<br>\n<br>\n<br>\n<br>\n<br>\nLe 13/09/2010 11:50, Yohan Colmant a écrit :\n<div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <defanged_meta content=\"text/html;charset=UTF-8\"\n http-equiv=\"Content-Type\"><font size=\"-1\"><font face=\"Verdana\">Alain,<br>\n <br>\nJ\'avais regardé à ce problème vendredi et je ne vois pas comment\ncontourner la chose rapidement côté md-editor.<br>\n <br>\n </font></font>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\"><font face=\"Verdana\"><small>Yohan COLMANT<br>\nDirection des Systèmes d\'Information<br>\n <a moz-do-not-send=\"true\" href=\"http://www.univ-valenciennes.fr\">UVHC</a>\n- Université de\nValenciennes et du Hainaut Cambrésis<br>\nCoordinateur Technique du projet <a moz-do-not-send=\"true\"\n href=\"http://www.ori-oai.org\">ORI-OAI</a>\n </small></font></div>\n </div>\n <br>\n <br>\nle drezen alain a écrit :\n <div class=\"emailFilter_Author_1\"><blockquote>Concernant\nle\nmessage d\'erreur ci dessous, le problème d\'import ne se produit plus\nsi on ajoute USE=\"maitre\" à  mets:file <br>\n <br>\nJe ne m\'explique pas ce comportement si ce n\'est pas un problème lors\ndu chargement du bloc suivant dans  mets:structMap  : <br>\n <br>\n&lt;mets:div TYPE=\"EDITION\"\nCONTENTIDS=\"CONTENTIDS.ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE\"\nDMDID=\"ABES.STAR.THESE_5152.VERSION_COMPLETE.DESCRIPTION.EDITION_ARCHIVAGE\"&gt;\n\n <br>\n&lt;mets:fptr\nFILEID=\"ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE.FILEGRP\"\n/&gt;\n\n <br>\n&lt;/mets:div&gt; <br>\n <br>\nL\'attribut USE dans mets:file est facultatif et son absence ne devrait\ndonc pas poser de pb à l\'import. <br>\n <br>\n <br>\n <br>\nSinon concernant le deuxième point très gênant relatif à la présence de\nBOM (Byte Order Mark) dans les notice STAR (merci à Yann Nicolas)\nest-il possible de corriger ORI pour palier à ce pb ou devons nous\ntourner vers STAR  ? <br>\n <br>\n <br>\n <br>\nMerci d\'avance pour tout élément de réponse <br>\n <br>\nAlain <br>\n <br>\n <br>\n <br>\n <br>\n <br>\nLe 11/09/2010 09:05, Alain Le Drezen a écrit : <br>\n <div class=\"emailFilter_Author_2\"><blockquote type=\"cite\">Je confirme aussi que ORI n\'importe pas le\nbloc&lt;mets:mdWrap MDTYPE=\"OTHER\" OTHERMDTYPE=\"tef_desc_edition\"&gt; \npour les thèses STAR ce qui explique le message d\'erreur décrit par\nJean-François : <br>\n <br>\n\"Toute EDITION de la thèse doit être associée à des métadonnées de type\n\"tef_desc_edition\".\" <br>\n <br>\nNous ne rencontrons pas ce pb sur les TEF-Sudoc que nous importons. <br>\n <br>\nAlain <br>\n <br>\n <br>\n  \n <div class=\"emailFilter_Author_3\"><blockquote type=\"cite\">Bonjour, <br>\n <br>\nUn autre problème lié à l\'import de STAR (en plus du caractère étrange\nen début de fichier et de l\'erreur signalé par Jean-François dans le\nworkflow) : <br>\n <br>\n  Ori importe : <br>\n&lt;mets:FLocat LOCTYPE=\"URL\"\nxlink:href=\"\\\\Sql01\\depot_these\\Theses\\STAR\\STOCK\\THESE_5162\\DepotEdition\\khelfaanissa1\\khelfaanissa2\\Khelfa.Anissa.SMZ0915.pdf\"/&gt;\n\n <br>\n <br>\nCe qui fait que nous nous retrouvons avec une belle URL de type : <br>\n\\\\Sql01\\depot_these\\Theses\\STAR\\STOCK\\THESE_5162\\DepotEdition\\khelfaanissa1\\khelfaanissa2\\Khelfa.Anissa.SMZ0915.pdf\n\n <br>\n <br>\nL\'URL correcte est dans tef:edition : <br>\n&lt;dc:identifier xsi:type=\"dcterms:URI\"&gt; <br>\n <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\"\n href=\"ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf\">ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf</a>\n <br>\n&lt;/dc:identifier&gt; <br>\n&lt;dc:identifier\nxsi:type=\"dcterms:URI\"&gt;<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-freetext\"\n href=\"http://STARFileDirectory/khelfaanissa1\">http://STARFileDirectory/khelfaanissa1</a>&lt;/dc:identifier&gt;\n\n <br>\n <br>\n <br>\nBon week-end ! <br>\n <br>\nAlain <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n    \n <div class=\"emailFilter_Author_4\"><blockquote type=\"cite\">Salut Yann, <br>\n <br>\nElle est en PJ. Bon week-end ! <br>\n <br>\nJean-François. <br>\n <br>\nYann Nicolas a écrit : <br>\n      \n <div class=\"emailFilter_Author_5\"><blockquote type=\"cite\">Un exemple de fiche TEF avec cette\nerreur ? <br>\n <br>\nYann <br>\n <br>\n <br>\n----- Mail Original ----- <br>\nDe: \"Yohan Colmant\"<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-rfc2396E\"\n href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\">&lt;<span id=\"919301b5c518c9ff00d1a59ebc883be5\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'919301b5c518c9ff00d1a59ebc883be5\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\'+\'\">\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>&gt;</a>\n <br>\nÀ: <a moz-do-not-send=\"true\" class=\"moz-txt-link-abbreviated\"\n href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a>\n <br>\nEnvoyé: Vendredi 10 Septembre 2010 15:06:53 <br>\nObjet: Re: [ori-oai-utilisateurs] Pb import TEF <br>\n <br>\nSalut JF, <br>\n <br>\nJe réponds dans le mail. <br>\n <br>\nYohan COLMANT <br>\nDirection des Systèmes d\'Information <br>\nUVHC<a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\"\n href=\"http://www.univ-valenciennes.fr\">&lt;http://www.univ-valenciennes.fr&gt;</a> \n- Université de\nValenciennes et <br>\ndu Hainaut Cambrésis <br>\nCoordinateur Technique du projet ORI-OAI<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-rfc2396E\" href=\"http://www.ori-oai.org\">&lt;http://www.ori-oai.org&gt;</a>\n <br>\n <br>\n <br>\nJean-François Lutz a écrit : <br>\n <br>\n     Bonjour Yohan, <br>\n <br>\n     Merci pour ton aide toujours aussi efficace ! <br>\n <br>\n     Je me permets de répondre sur les imports de fiches issues de <br>\n     STAR. Comme l\'indiquait Alain nous ne pouvons pas nous contenter <br>\n     de les moissonner car les laboratoires et les écoles doctorales <br>\n     ont été saisies dans STAR sans aucune liste ou forme\nd\'autorité, <br>\n     d\'où un nombre très élevé de doublons (un même labo décrit\nde 5 <br>\n     manières différentes par exemples, sachant qu\'il y a 82 <br>\n     laboratoires...). Nous allons donc les importer et utiliser les <br>\n     listes d\'autorité internes à ORI-OAI. <br>\n <br>\n     1. au niveau de l\'import du fichier XML le problème est résolu. <br>\n     Les fiches TEF XML produites par STAR comportent les trois <br>\n     caractères suivants  avant la première balise de l\'entête\net <br>\n     ils font planter l\'import. Il suffit pour l\'instant de les <br>\n     supprimer. Peut-être la nouvelle version de STAR corrigera-t-elle\n <br>\n     ce bug. <br>\n <br>\nbonne nouvelle :-) <br>\n <br>\n <br>\n     2. dans le workflow, l\'édition se passe sans problème mais au <br>\n     niveau de la publication, outre le fait qu\'il faut cocher la case <br>\n     \"fichier maître\" ce qui est un détail, un problème persiste\nsans <br>\n     qu\'Alain et moi arrivions à déterminer son origine. Le message <br>\n     suivant apparaît dans la colonne \"Informations\" et il empêche de\n <br>\n     publier la fiche : \"Toute EDITION de la thèse doit être\nassociée à      des métadonnées de type \"tef_desc_edition\".\"\nQuelqu\'un aurait-il <br>\n     une idée de la solution ? Merci par avance. <br>\n <br>\nTu as l\'erreur quand tu essayes de la publier simplement ou quand tu <br>\ntentes de l\'envoyer à l\'ABES ? Et le problème a lieu avec une fiche <br>\nimportée ou saisie de zéro dans ORI-OAI ? <br>\n <br>\nSi je regarde cette erreur, elle vient du schematron de l\'ABES avec <br>\ncette règle : <br>\n <br>\n   &lt;pattern name=\"mets_structMap_meta_Edition\" <br>\nid=\"mets_structMap_meta_Edition\"&gt; <br>\n     &lt;rule <br>\ncontext=\"/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE=\'EDITION\']\"&gt;\n\n <br>\n       &lt;assert test=\"@DMDID = <br>\n/mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE=\'tef_desc_edition\']]/@ID\"&gt;tef_easy.schematron.tef-abes.structMap.meta_Edition.check_rule&lt;/assert&gt;\n\n <br>\n     &lt;/rule&gt; <br>\n   &lt;/pattern&gt; <br>\n <br>\nDonc autrement dit, l\'erreur apparait quand <br>\n/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE=\'EDITION\']/@DMDID\n\n <br>\n <br>\nn\'est pas égal Ã\n/mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE=\'tef_desc_edition\']]/@ID\n\n <br>\ndans la fiche TEF. <br>\n <br>\nEst-ce que ça parle à quelqu\'un ? <br>\n <br>\n <br>\n     Bon week-end. <br>\n <br>\n     Jean-François. <br>\n <br>\n <br>\n     Yohan Colmant a écrit : <br>\n <br>\n         Alain, <br>\n <br>\n         Nous venons d\'avoir une réponse de l\'ABES pour le PPN et tu <br>\n         avais bien raison : \"le dernier caractère est un chiffre de <br>\n         contrôle, qui peut être soit un numéro soit un X, il n\'y a\npas <br>\n         d\'autre caractère alphabétique possible. \". <br>\n         Je te propose donc ce correctif (qui sera intégré dans une <br>\n         prochaine version). <br>\n <br>\n         Dans <br>\n        \nori-oai-md-editor\\WEB-INF\\resources\\forms\\ori-md-editor\\tef-global\\form\\form.xhtml\n\n <br>\n         il faut remplacer toutes les occurrences de <br>\n         [0-9]{9} <br>\n         par <br>\n         [0-9]{8}[X0-9]{1} <br>\n <br>\n         Donc pour les fiches du SUDOC, à part les champs qui ne sont <br>\n         pas remplis à fond, ceci corrige ton problème ? <br>\n <br>\n <br>\n         Concernant les fiches qui proviennent de STAR, tu ne m\'en <br>\n         avais pas parlé ? <br>\n <br>\n         Peux-tu m\'en envoyer une d\'exemple stp ? <br>\n         Quand tu dis que ça plante, c\'est au niveau du md-editor ou <br>\n         déjà dans le workflow ? <br>\n <br>\n         Merci <br>\n <br>\n         Yohan COLMANT <br>\n         Direction des Systèmes d\'Information <br>\n         UVHC<a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\"\n href=\"http://www.univ-valenciennes.fr\">&lt;http://www.univ-valenciennes.fr&gt;</a> \n- Université de <br>\n         Valenciennes et du Hainaut Cambrésis <br>\n         Coordinateur Technique du projet\nORI-OAI<a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\"\n href=\"http://www.ori-oai.org\">&lt;http://www.ori-oai.org&gt;</a> <br>\n <br>\n <br>\n         le drezen alain a écrit : <br>\n <br>\n             Bonjour Yohan, <br>\n <br>\n             Voici les éléments de réponse. <br>\n <br>\n             Le 10/09/2010 10:31, Yohan Colmant a écrit : <br>\n <br>\n                 Salut Alain, <br>\n <br>\n                 Je commence ENFIN à me pencher sur ton problème. <br>\n <br>\n                 En premier lieu, pourquoi importes-tu les fiches dans <br>\n                 ton workflow ? Tu ne peux pas les moissonner plutôt ?\n <br>\n                 Comment les as-tu récupérées ? <br>\n <br>\n             Pour le SUDOC pas de moissonnage possible. Pour Star le <br>\n             moissonnage serait possible. Mais dans les deux cas nous <br>\n             devons modifier les notices ce qui n\'est pas possible sur <br>\n             une notice moissonnée. <br>\n <br>\n                 Là , les erreurs que tu mentionnes apparaissent dans\nle <br>\n                 md-editor, mais pas dans le workflow ? Si tu veux <br>\n                 juste importer ces fiches et les publier, rien ne te <br>\n                 bloque ? <br>\n <br>\n             En ce qui concerne l\'import, en effet pas de problème\npour <br>\n             les notices SUDOC. Ce n\'est pas le cas pour les notices <br>\n             STAR qui elles plantent dès l\'import.. <br>\n             Cependant certaines notices SUDOC ne sont pas éditable <br>\n             dans le workflow ce qui empêchera de les compléter et\ndonc <br>\n             de les publier. <br>\n <br>\n                 Si je n\'arrivais pas à débloquer ton problème avant\nle <br>\n                 retour de Nolwen, est-ce que tu serais bloqué ? En <br>\n                 gros, as-tu besoin de modifier les fiches que tu <br>\n                 importes ou non ? <br>\n <br>\n             Oui, nous devons les modifier avant de les publier. Par <br>\n             exemple la thèse nommée \"Quelle formation pour le\nmédecin <br>\n             généraliste psychothérapeute de fait\" ne s\'ouvre pas\ndans <br>\n             l\'éditeur à cause des caractères spéciaux en début de\ntitre. <br>\n <br>\n                 Si non, tu peux simplement importer les fiches et les <br>\n                 indexer. Effectivement, si tu cherches à les <br>\n                 visualiser dans le md-editor, tu auras ces soucis, <br>\n                 mais cela te permet tout de même de faire l\'import en\n <br>\n                 attendant ? <br>\n <br>\n <br>\n                 Second point, c\'est Nolwen qui est plus à même de <br>\n                 répondre à tes interrogations sur le module, donc je\n <br>\n                 vais faire de mon mieux :-( <br>\n <br>\n <br>\n                 Pour commencer, j\'ai pris en exemple la fiche <br>\n                 Metz_13738551X.xml <br>\n <br>\n                 1) Les erreurs liées au nom et prénom qui ne doivent\n <br>\n                 pas être vides sont connues. Là on a des choses Ã\n                 faire par la suite, mais c\'est juste un soucis <br>\n                 d\'affichage. Il te suffit de cliquer sur le nom et <br>\n                 refermer la fenêtre de saisie de la personne pour\nvoir <br>\n                 que l\'erreur disparait. Nolwen n\'avait pas réussi Ã\n                 contourner ce problème avant son départ. <br>\n                 Lorsque tu as un PPN composé de 9 chiffres comme\nprévu <br>\n                 jusqu\'ici dans l\'éditeur TEF, le même problème se <br>\n                 pose, ouvre et referme la fenêtre de saisie, tu\nverras <br>\n                 que ça marche en fait. <br>\n <br>\n             Ca c\'est un pb connu <br>\n <br>\n                 2) Il manque des mots-clefs en français. Ils sont <br>\n                 décrits comme obligatoires dans le TEF : <br>\n                \n <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\"\n href=\"http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html\">http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html</a>\n <br>\n <br>\n <br>\n             Ok normal <br>\n <br>\n <br>\n                 3) Pour le PPN qui comporte 8 chiffres et une lettre\n.... <br>\n                 J\'ai essayé de joindre les collègues fonctionnels\nmais <br>\n                 ils ne sont pas joignables pour le moment. Les <br>\n                 quelques docs que j\'ai trouvées parlent bien de 9 <br>\n                 chiffres. Tu as une info ou une doc où ils parlent <br>\n                 d\'une possibilité de caractères autres ? <br>\n <br>\n <br>\n             Voici un extrait de la doc de l\'ABES : <br>\n             Zone 001 : Numéro d\'identification de la notice <br>\n             Zone système protégée, obligatoire, non répétable,\nsans <br>\n             indicateurs et sans sous-zones. <br>\n             Le contenu de la zone est générée automatiquement par\nle <br>\n             système lors de la validation d\'une nouvelle notice <br>\n             Dans le Sudoc, l\'identifiant unique de la notice est <br>\n             appelé ppn (= Pica production number). Il comporte 9 <br>\n             caractères : <br>\n             8 chiffres (attribués par le système de manière <br>\n             séquentielle = numéro d\'\"ordre\" de la notice dans la\nbase <br>\n             de données) <br>\n             une clé de contrôle sur 1 caractère, qui peut être un <br>\n             chiffre ou \"X\" <br>\n <br>\n                 4) Concernant le fichier maintenant ... <br>\n                 Je ne connais pas assez le TEF, mais je sais que le <br>\n                 type mime et l\'URL du fichier sont à 2 endroits dans <br>\n                 le TEF que nous générons. <br>\n                 Dans tes fiches, cela n\'apparait qu\'une fois. Il reste\n <br>\n                 la rubrique suivante qui est vide : <br>\n                 &lt;mets:fileSec&gt; <br>\n                 &lt;mets:fileGrp USE=\"archive\" ID=\"FGrID1\"&gt; <br>\n                 &lt;mets:file ID=\"FID1\" MIMETYPE=\"\" ADMID=\"file_1\" <br>\n                 USE=\"maitre\"&gt; <br>\n                 &lt;mets:FLocat LOCTYPE=\"URL\" xlink:href=\"\"/&gt; <br>\n                 &lt;/mets:file&gt; <br>\n                 &lt;/mets:fileGrp&gt; <br>\n                 &lt;/mets:fileSec&gt; <br>\n                 D\'où l\'erreur dans l\'IHM ... <br>\n                 Si on se réfère à cette doc, on lit \"*Seule\nl\'édition <br>\n                 d\'archivage doit obligatoirement être représentée\ndans <br>\n                 cette section.* Cette présence est facultative pour <br>\n                 les autres éditions. \". <br>\n                 Dans ton cas, si je prends la fiche <br>\n                 Metz_13738551X.xml, on voit bien USE=\"archive\" dans le\n <br>\n                 bloc mets:fileSec. Si je comprends bien, dans ce cas, <br>\n                 les métadonnées MIMETYPE et URL sont obligatoires.\nIci <br>\n                 elles ne sont pas remplies. <br>\n <br>\n             J\'ai corrigé mes fichiers en\nremplissant&lt;mets:fileSec&gt;  et <br>\n             je récupe^\'re bien l\'URL lors de l\'import. <br>\n             Pour l\'anecdote je n\'ai pas réussi à importer un fichier\n <br>\n             TEF généré par ORI (pas de chance ???) <br>\n <br>\n <br>\n <br>\n                 Je reviens vers toi quand tu auras pu me donner un peu\n <br>\n                 plus d\'infos et fait un retour sur ce mail. <br>\n                 Je te dirai aussi ce que j\'ai eu comme infos pour le\nPPN. <br>\n <br>\n                 A bientôt, <br>\n <br>\n                 Yohan COLMANT <br>\n                 Direction des Systèmes d\'Information <br>\n                 UVHC<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-rfc2396E\" href=\"http://www.univ-valenciennes.fr\">&lt;http://www.univ-valenciennes.fr&gt;</a> \n-\nUniversité de <br>\n                 Valenciennes et du Hainaut Cambrésis <br>\n                 Coordinateur Technique du projet ORI-OAI <br>\n                 <a moz-do-not-send=\"true\"\n class=\"moz-txt-link-rfc2396E\" href=\"http://www.ori-oai.org\">&lt;http://www.ori-oai.org&gt;</a>\n <br>\n <br>\n <br>\n                 Alain Le Drezen a écrit : <br>\n <br>\n                     Bonjour, <br>\n <br>\n                     Voici quelques problèmes rencontrés lors de <br>\n                     l\'import de notices de thèses du SUDOC (import en\n <br>\n                     pièce jointe). <br>\n <br>\n                     L\'URL du fichier (&lt;dc:identifier <br>\n                     xsi:type=\"dcterms:URI\"&gt;) ne s\'importe pas. <br>\n <br>\n                     La notice de la thèse \"Quelle formation pour le <br>\n                     médecin généraliste psychothérapeute de fait\"\nne <br>\n                     s\'affiche pas dans l\'éditeur (page grise vide).\nIl <br>\n                     semble que ce soit lié à la présence de\ncaractères <br>\n                     étranges en début du titre. Mais ceci ne devrait\n <br>\n                     pas être bloquant. <br>\n <br>\n                     Dans l\'éditeur, l\'erreur \"Le PPN du mot sujet <br>\n                     Rameau doit être composé de neuf chiffres\" est <br>\n                     erronée. Un PPN peu contenir des caractères. <br>\n <br>\n                     Merci d\'avance pour tout élément de réponse. <br>\n <br>\n                     Alain <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n         </blockquote></div>\n       </blockquote></div>\n <br>\n     </blockquote></div>\n <br>\n   </blockquote></div>\n <br>\n <br>\n <br>\n <br>\n <br>\n </blockquote></div>\n </defanged_meta></blockquote></div></div>\n<br>\n</body>\n</html>\n</div>', created = 1507752239, expire = 1507838639, headers = '', serialized = 0 WHERE cid = '4:291d2f759382db97b7e38dd37113d9fa' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:f84e47a522bb0b22db73bfce20470418' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n<head>\n <meta content=\"text/html;charset=UTF-8\" http-equiv=\"Content-Type\">\n</head>\n<body bgcolor=\"#ffffff\" text=\"#000000\">\n<font size=\"-1\"><font face=\"Verdana\">Alain,<br>\n<br>\nJ\'avais regardé à ce problème vendredi et je ne vois pas comment\ncontourner la chose rapidement côté md-editor.<br>\n<br>\n</font></font>\n<div class=\"moz-signature\">\n<div class=\"moz-signature\"><font face=\"Verdana\"><small>\nYohan COLMANT<br>\nDirection des Systèmes d\'Information<br>\n<a href=\"http://www.univ-valenciennes.fr\">UVHC</a> - Université de\nValenciennes et du Hainaut Cambrésis<br>\nCoordinateur Technique du projet <a href=\"http://www.ori-oai.org\">ORI-OAI</a>\n</small></font>\n</div>\n</div>\n<br>\n<br>\nle drezen alain a écrit :\n<div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>Concernant\nle message d\'erreur ci dessous, le problème d\'import ne se produit plus\nsi on ajoute USE=\"maitre\" à  mets:file\n <br>\n <br>\nJe ne m\'explique pas ce comportement si ce n\'est pas un problème lors\ndu chargement du bloc suivant dans  mets:structMap  :\n <br>\n <br>\n&lt;mets:div TYPE=\"EDITION\"\nCONTENTIDS=\"CONTENTIDS.ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE\"\nDMDID=\"ABES.STAR.THESE_5152.VERSION_COMPLETE.DESCRIPTION.EDITION_ARCHIVAGE\"&gt;\n <br>\n&lt;mets:fptr\nFILEID=\"ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE.FILEGRP\"\n/&gt;\n <br>\n&lt;/mets:div&gt;\n <br>\n <br>\nL\'attribut USE dans mets:file est facultatif et son absence ne devrait\ndonc pas poser de pb à l\'import.\n <br>\n <br>\n <br>\n <br>\nSinon concernant le deuxième point très gênant relatif à la présence de\nBOM (Byte Order Mark) dans les notice STAR (merci à Yann Nicolas)\nest-il possible de corriger ORI pour palier à ce pb ou devons nous\ntourner vers STAR  ?\n <br>\n <br>\n <br>\n <br>\nMerci d\'avance pour tout élément de réponse\n <br>\n <br>\nAlain\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\nLe 11/09/2010 09:05, Alain Le Drezen a écrit :\n <br>\n <div class=\"emailFilter_Author_1\"><blockquote type=\"cite\">Je confirme aussi que ORI n\'importe pas le\nbloc&lt;mets:mdWrap MDTYPE=\"OTHER\" OTHERMDTYPE=\"tef_desc_edition\"&gt; \npour les thèses STAR ce qui explique le message d\'erreur décrit par\nJean-François :\n <br>\n <br>\n\"Toute EDITION de la thèse doit être associée à des métadonnées de type\n\"tef_desc_edition\".\"\n <br>\n <br>\nNous ne rencontrons pas ce pb sur les TEF-Sudoc que nous importons.\n <br>\n <br>\nAlain\n <br>\n <br>\n <br>\n  \n <div class=\"emailFilter_Author_2\"><blockquote type=\"cite\">Bonjour,\n <br>\n <br>\nUn autre problème lié à l\'import de STAR (en plus du caractère étrange\nen début de fichier et de l\'erreur signalé par Jean-François dans le\nworkflow) :\n <br>\n <br>\n  Ori importe :\n <br>\n&lt;mets:FLocat LOCTYPE=\"URL\"\nxlink:href=\"\\\\Sql01\\depot_these\\Theses\\STAR\\STOCK\\THESE_5162\\DepotEdition\\khelfaanissa1\\khelfaanissa2\\Khelfa.Anissa.SMZ0915.pdf\"/&gt;\n <br>\n <br>\nCe qui fait que nous nous retrouvons avec une belle URL de type :\n <br>\n\\\\Sql01\\depot_these\\Theses\\STAR\\STOCK\\THESE_5162\\DepotEdition\\khelfaanissa1\\khelfaanissa2\\Khelfa.Anissa.SMZ0915.pdf\n <br>\n <br>\nL\'URL correcte est dans tef:edition :\n <br>\n&lt;dc:identifier xsi:type=\"dcterms:URI\"&gt;\n <br>\n<a class=\"moz-txt-link-freetext\" href=\"ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf\">ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf</a>\n <br>\n&lt;/dc:identifier&gt;\n <br>\n&lt;dc:identifier\nxsi:type=\"dcterms:URI\"&gt;<a class=\"moz-txt-link-freetext\" href=\"http://STARFileDirectory/khelfaanissa1\">http://STARFileDirectory/khelfaanissa1</a>&lt;/dc:identifier&gt;\n <br>\n <br>\n <br>\nBon week-end !\n <br>\n <br>\nAlain\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n    \n <div class=\"emailFilter_Author_3\"><blockquote type=\"cite\">Salut Yann,\n <br>\n <br>\nElle est en PJ. Bon week-end !\n <br>\n <br>\nJean-François.\n <br>\n <br>\nYann Nicolas a écrit :\n <br>\n      \n <div class=\"emailFilter_Author_4\"><blockquote type=\"cite\">Un exemple de fiche TEF avec cette\nerreur ?\n <br>\n <br>\nYann\n <br>\n <br>\n <br>\n----- Mail Original -----\n <br>\nDe: \"Yohan Colmant\"<a class=\"moz-txt-link-rfc2396E\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\">&lt;<span id=\"a3d5e92c57484df32761ceb295829e87\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'a3d5e92c57484df32761ceb295829e87\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\'+\'\">\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>&gt;</a>\n <br>\nÀ: <a class=\"moz-txt-link-abbreviated\" href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a>\n <br>\nEnvoyé: Vendredi 10 Septembre 2010 15:06:53\n <br>\nObjet: Re: [ori-oai-utilisateurs] Pb import TEF\n <br>\n <br>\nSalut JF,\n <br>\n <br>\nJe réponds dans le mail.\n <br>\n <br>\nYohan COLMANT\n <br>\nDirection des Systèmes d\'Information\n <br>\nUVHC<a class=\"moz-txt-link-rfc2396E\" href=\"http://www.univ-valenciennes.fr\">&lt;http://www.univ-valenciennes.fr&gt;</a>  - Université de\nValenciennes et\n <br>\ndu Hainaut Cambrésis\n <br>\nCoordinateur Technique du projet ORI-OAI<a class=\"moz-txt-link-rfc2396E\" href=\"http://www.ori-oai.org\">&lt;http://www.ori-oai.org&gt;</a>\n <br>\n <br>\n <br>\nJean-François Lutz a écrit :\n <br>\n <br>\n     Bonjour Yohan,\n <br>\n <br>\n     Merci pour ton aide toujours aussi efficace !\n <br>\n <br>\n     Je me permets de répondre sur les imports de fiches issues de\n <br>\n     STAR. Comme l\'indiquait Alain nous ne pouvons pas nous contenter\n <br>\n     de les moissonner car les laboratoires et les écoles doctorales\n <br>\n     ont été saisies dans STAR sans aucune liste ou forme\nd\'autorité,\n <br>\n     d\'où un nombre très élevé de doublons (un même labo décrit\nde 5\n <br>\n     manières différentes par exemples, sachant qu\'il y a 82\n <br>\n     laboratoires...). Nous allons donc les importer et utiliser les\n <br>\n     listes d\'autorité internes à ORI-OAI.\n <br>\n <br>\n     1. au niveau de l\'import du fichier XML le problème est résolu.\n <br>\n     Les fiches TEF XML produites par STAR comportent les trois\n <br>\n     caractères suivants  avant la première balise de l\'entête\net\n <br>\n     ils font planter l\'import. Il suffit pour l\'instant de les\n <br>\n     supprimer. Peut-être la nouvelle version de STAR corrigera-t-elle\n <br>\n     ce bug.\n <br>\n <br>\nbonne nouvelle :-)\n <br>\n <br>\n <br>\n     2. dans le workflow, l\'édition se passe sans problème mais au\n <br>\n     niveau de la publication, outre le fait qu\'il faut cocher la case\n <br>\n     \"fichier maître\" ce qui est un détail, un problème persiste\nsans\n <br>\n     qu\'Alain et moi arrivions à déterminer son origine. Le message\n <br>\n     suivant apparaît dans la colonne \"Informations\" et il empêche de\n <br>\n     publier la fiche : \"Toute EDITION de la thèse doit être\nassociée à      des métadonnées de type \"tef_desc_edition\".\"\nQuelqu\'un aurait-il\n <br>\n     une idée de la solution ? Merci par avance.\n <br>\n <br>\nTu as l\'erreur quand tu essayes de la publier simplement ou quand tu\n <br>\ntentes de l\'envoyer à l\'ABES ? Et le problème a lieu avec une fiche\n <br>\nimportée ou saisie de zéro dans ORI-OAI ?\n <br>\n <br>\nSi je regarde cette erreur, elle vient du schematron de l\'ABES avec\n <br>\ncette règle :\n <br>\n <br>\n   &lt;pattern name=\"mets_structMap_meta_Edition\"\n <br>\nid=\"mets_structMap_meta_Edition\"&gt;\n <br>\n     &lt;rule\n <br>\ncontext=\"/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE=\'EDITION\']\"&gt;\n <br>\n       &lt;assert test=\"@DMDID =\n <br>\n/mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE=\'tef_desc_edition\']]/@ID\"&gt;tef_easy.schematron.tef-abes.structMap.meta_Edition.check_rule&lt;/assert&gt;\n <br>\n     &lt;/rule&gt;\n <br>\n   &lt;/pattern&gt;\n <br>\n <br>\nDonc autrement dit, l\'erreur apparait quand\n <br>\n/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE=\'EDITION\']/@DMDID\n <br>\n <br>\nn\'est pas égal Ã\n/mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE=\'tef_desc_edition\']]/@ID\n <br>\ndans la fiche TEF.\n <br>\n <br>\nEst-ce que ça parle à quelqu\'un ?\n <br>\n <br>\n <br>\n     Bon week-end.\n <br>\n <br>\n     Jean-François.\n <br>\n <br>\n <br>\n     Yohan Colmant a écrit :\n <br>\n <br>\n         Alain,\n <br>\n <br>\n         Nous venons d\'avoir une réponse de l\'ABES pour le PPN et tu\n <br>\n         avais bien raison : \"le dernier caractère est un chiffre de\n <br>\n         contrôle, qui peut être soit un numéro soit un X, il n\'y a\npas\n <br>\n         d\'autre caractère alphabétique possible. \".\n <br>\n         Je te propose donc ce correctif (qui sera intégré dans une\n <br>\n         prochaine version).\n <br>\n <br>\n         Dans\n <br>\n        \nori-oai-md-editor\\WEB-INF\\resources\\forms\\ori-md-editor\\tef-global\\form\\form.xhtml\n <br>\n         il faut remplacer toutes les occurrences de\n <br>\n         [0-9]{9}\n <br>\n         par\n <br>\n         [0-9]{8}[X0-9]{1}\n <br>\n <br>\n         Donc pour les fiches du SUDOC, à part les champs qui ne sont\n <br>\n         pas remplis à fond, ceci corrige ton problème ?\n <br>\n <br>\n <br>\n         Concernant les fiches qui proviennent de STAR, tu ne m\'en\n <br>\n         avais pas parlé ?\n <br>\n <br>\n         Peux-tu m\'en envoyer une d\'exemple stp ?\n <br>\n         Quand tu dis que ça plante, c\'est au niveau du md-editor ou\n <br>\n         déjà dans le workflow ?\n <br>\n <br>\n         Merci\n <br>\n <br>\n         Yohan COLMANT\n <br>\n         Direction des Systèmes d\'Information\n <br>\n         UVHC<a class=\"moz-txt-link-rfc2396E\" href=\"http://www.univ-valenciennes.fr\">&lt;http://www.univ-valenciennes.fr&gt;</a>  - Université de\n <br>\n         Valenciennes et du Hainaut Cambrésis\n <br>\n         Coordinateur Technique du projet\nORI-OAI<a class=\"moz-txt-link-rfc2396E\" href=\"http://www.ori-oai.org\">&lt;http://www.ori-oai.org&gt;</a>\n <br>\n <br>\n <br>\n         le drezen alain a écrit :\n <br>\n <br>\n             Bonjour Yohan,\n <br>\n <br>\n             Voici les éléments de réponse.\n <br>\n <br>\n             Le 10/09/2010 10:31, Yohan Colmant a écrit :\n <br>\n <br>\n                 Salut Alain,\n <br>\n <br>\n                 Je commence ENFIN à me pencher sur ton problème.\n <br>\n <br>\n                 En premier lieu, pourquoi importes-tu les fiches dans\n <br>\n                 ton workflow ? Tu ne peux pas les moissonner plutôt ?\n <br>\n                 Comment les as-tu récupérées ?\n <br>\n <br>\n             Pour le SUDOC pas de moissonnage possible. Pour Star le\n <br>\n             moissonnage serait possible. Mais dans les deux cas nous\n <br>\n             devons modifier les notices ce qui n\'est pas possible sur\n <br>\n             une notice moissonnée.\n <br>\n <br>\n                 Là , les erreurs que tu mentionnes apparaissent dans\nle\n <br>\n                 md-editor, mais pas dans le workflow ? Si tu veux\n <br>\n                 juste importer ces fiches et les publier, rien ne te\n <br>\n                 bloque ?\n <br>\n <br>\n             En ce qui concerne l\'import, en effet pas de problème\npour\n <br>\n             les notices SUDOC. Ce n\'est pas le cas pour les notices\n <br>\n             STAR qui elles plantent dès l\'import..\n <br>\n             Cependant certaines notices SUDOC ne sont pas éditable\n <br>\n             dans le workflow ce qui empêchera de les compléter et\ndonc\n <br>\n             de les publier.\n <br>\n <br>\n                 Si je n\'arrivais pas à débloquer ton problème avant\nle\n <br>\n                 retour de Nolwen, est-ce que tu serais bloqué ? En\n <br>\n                 gros, as-tu besoin de modifier les fiches que tu\n <br>\n                 importes ou non ?\n <br>\n <br>\n             Oui, nous devons les modifier avant de les publier. Par\n <br>\n             exemple la thèse nommée \"Quelle formation pour le\nmédecin\n <br>\n             généraliste psychothérapeute de fait\" ne s\'ouvre pas\ndans\n <br>\n             l\'éditeur à cause des caractères spéciaux en début de\ntitre.\n <br>\n <br>\n                 Si non, tu peux simplement importer les fiches et les\n <br>\n                 indexer. Effectivement, si tu cherches à les\n <br>\n                 visualiser dans le md-editor, tu auras ces soucis,\n <br>\n                 mais cela te permet tout de même de faire l\'import en\n <br>\n                 attendant ?\n <br>\n <br>\n <br>\n                 Second point, c\'est Nolwen qui est plus à même de\n <br>\n                 répondre à tes interrogations sur le module, donc je\n <br>\n                 vais faire de mon mieux :-(\n <br>\n <br>\n <br>\n                 Pour commencer, j\'ai pris en exemple la fiche\n <br>\n                 Metz_13738551X.xml\n <br>\n <br>\n                 1) Les erreurs liées au nom et prénom qui ne doivent\n <br>\n                 pas être vides sont connues. Là on a des choses Ã\n                 faire par la suite, mais c\'est juste un soucis\n <br>\n                 d\'affichage. Il te suffit de cliquer sur le nom et\n <br>\n                 refermer la fenêtre de saisie de la personne pour\nvoir\n <br>\n                 que l\'erreur disparait. Nolwen n\'avait pas réussi Ã\n                 contourner ce problème avant son départ.\n <br>\n                 Lorsque tu as un PPN composé de 9 chiffres comme\nprévu\n <br>\n                 jusqu\'ici dans l\'éditeur TEF, le même problème se\n <br>\n                 pose, ouvre et referme la fenêtre de saisie, tu\nverras\n <br>\n                 que ça marche en fait.\n <br>\n <br>\n             Ca c\'est un pb connu\n <br>\n <br>\n                 2) Il manque des mots-clefs en français. Ils sont\n <br>\n                 décrits comme obligatoires dans le TEF :\n <br>\n                \n<a class=\"moz-txt-link-freetext\" href=\"http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html\">http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html</a>\n <br>\n <br>\n <br>\n             Ok normal\n <br>\n <br>\n <br>\n                 3) Pour le PPN qui comporte 8 chiffres et une lettre\n....\n <br>\n                 J\'ai essayé de joindre les collègues fonctionnels\nmais\n <br>\n                 ils ne sont pas joignables pour le moment. Les\n <br>\n                 quelques docs que j\'ai trouvées parlent bien de 9\n <br>\n                 chiffres. Tu as une info ou une doc où ils parlent\n <br>\n                 d\'une possibilité de caractères autres ?\n <br>\n <br>\n <br>\n             Voici un extrait de la doc de l\'ABES :\n <br>\n             Zone 001 : Numéro d\'identification de la notice\n <br>\n             Zone système protégée, obligatoire, non répétable,\nsans\n <br>\n             indicateurs et sans sous-zones.\n <br>\n             Le contenu de la zone est générée automatiquement par\nle\n <br>\n             système lors de la validation d\'une nouvelle notice\n <br>\n             Dans le Sudoc, l\'identifiant unique de la notice est\n <br>\n             appelé ppn (= Pica production number). Il comporte 9\n <br>\n             caractères :\n <br>\n             8 chiffres (attribués par le système de manière\n <br>\n             séquentielle = numéro d\'\"ordre\" de la notice dans la\nbase\n <br>\n             de données)\n <br>\n             une clé de contrôle sur 1 caractère, qui peut être un\n <br>\n             chiffre ou \"X\"\n <br>\n <br>\n                 4) Concernant le fichier maintenant ...\n <br>\n                 Je ne connais pas assez le TEF, mais je sais que le\n <br>\n                 type mime et l\'URL du fichier sont à 2 endroits dans\n <br>\n                 le TEF que nous générons.\n <br>\n                 Dans tes fiches, cela n\'apparait qu\'une fois. Il reste\n <br>\n                 la rubrique suivante qui est vide :\n <br>\n                 &lt;mets:fileSec&gt;\n <br>\n                 &lt;mets:fileGrp USE=\"archive\" ID=\"FGrID1\"&gt;\n <br>\n                 &lt;mets:file ID=\"FID1\" MIMETYPE=\"\" ADMID=\"file_1\"\n <br>\n                 USE=\"maitre\"&gt;\n <br>\n                 &lt;mets:FLocat LOCTYPE=\"URL\" xlink:href=\"\"/&gt;\n <br>\n                 &lt;/mets:file&gt;\n <br>\n                 &lt;/mets:fileGrp&gt;\n <br>\n                 &lt;/mets:fileSec&gt;\n <br>\n                 D\'où l\'erreur dans l\'IHM ...\n <br>\n                 Si on se réfère à cette doc, on lit \"*Seule\nl\'édition\n <br>\n                 d\'archivage doit obligatoirement être représentée\ndans\n <br>\n                 cette section.* Cette présence est facultative pour\n <br>\n                 les autres éditions. \".\n <br>\n                 Dans ton cas, si je prends la fiche\n <br>\n                 Metz_13738551X.xml, on voit bien USE=\"archive\" dans le\n <br>\n                 bloc mets:fileSec. Si je comprends bien, dans ce cas,\n <br>\n                 les métadonnées MIMETYPE et URL sont obligatoires.\nIci\n <br>\n                 elles ne sont pas remplies.\n <br>\n <br>\n             J\'ai corrigé mes fichiers en\nremplissant&lt;mets:fileSec&gt;  et\n <br>\n             je récupe^\'re bien l\'URL lors de l\'import.\n <br>\n             Pour l\'anecdote je n\'ai pas réussi à importer un fichier\n <br>\n             TEF généré par ORI (pas de chance ???)\n <br>\n <br>\n <br>\n <br>\n                 Je reviens vers toi quand tu auras pu me donner un peu\n <br>\n                 plus d\'infos et fait un retour sur ce mail.\n <br>\n                 Je te dirai aussi ce que j\'ai eu comme infos pour le\nPPN.\n <br>\n <br>\n                 A bientôt,\n <br>\n <br>\n                 Yohan COLMANT\n <br>\n                 Direction des Systèmes d\'Information\n <br>\n                 UVHC<a class=\"moz-txt-link-rfc2396E\" href=\"http://www.univ-valenciennes.fr\">&lt;http://www.univ-valenciennes.fr&gt;</a>  -\nUniversité de\n <br>\n                 Valenciennes et du Hainaut Cambrésis\n <br>\n                 Coordinateur Technique du projet ORI-OAI\n <br>\n                 <a class=\"moz-txt-link-rfc2396E\" href=\"http://www.ori-oai.org\">&lt;http://www.ori-oai.org&gt;</a>\n <br>\n <br>\n <br>\n                 Alain Le Drezen a écrit :\n <br>\n <br>\n                     Bonjour,\n <br>\n <br>\n                     Voici quelques problèmes rencontrés lors de\n <br>\n                     l\'import de notices de thèses du SUDOC (import en\n <br>\n                     pièce jointe).\n <br>\n <br>\n                     L\'URL du fichier (&lt;dc:identifier\n <br>\n                     xsi:type=\"dcterms:URI\"&gt;) ne s\'importe pas.\n <br>\n <br>\n                     La notice de la thèse \"Quelle formation pour le\n <br>\n                     médecin généraliste psychothérapeute de fait\"\nne\n <br>\n                     s\'affiche pas dans l\'éditeur (page grise vide).\nIl\n <br>\n                     semble que ce soit lié à la présence de\ncaractères\n <br>\n                     étranges en début du titre. Mais ceci ne devrait\n <br>\n                     pas être bloquant.\n <br>\n <br>\n                     Dans l\'éditeur, l\'erreur \"Le PPN du mot sujet\n <br>\n                     Rameau doit être composé de neuf chiffres\" est\n <br>\n                     erronée. Un PPN peu contenir des caractères.\n <br>\n <br>\n                     Merci d\'avance pour tout élément de réponse.\n <br>\n <br>\n                     Alain\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n         </blockquote></div>\n       </blockquote></div>\n <br>\n     </blockquote></div>\n <br>\n   </blockquote></div>\n <br>\n <br>\n <br>\n <br>\n <br>\n</blockquote></div></div>\n</body>\n</html>\n</div>', created = 1507752240, expire = 1507838640, headers = '', serialized = 0 WHERE cid = '4:f84e47a522bb0b22db73bfce20470418' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:27760736a92f0faeb9c219b1c9cdb305' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Concernant le message d\'erreur ci dessous, le problème d\'import ne se<br />\nproduit plus si on ajoute USE=\"maitre\" à mets:file</p>\n<p>Je ne m\'explique pas ce comportement si ce n\'est pas un problème lors du<br />\nchargement du bloc suivant dans mets:structMap :</p>\n<p><mets:div TYPE=\"EDITION\"<br />\nCONTENTIDS=\"CONTENTIDS.ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE\"<br />\nDMDID=\"ABES.STAR.THESE_5152.VERSION_COMPLETE.DESCRIPTION.EDITION_ARCHIVAGE\"><br />\n<mets:fptr<br />\nFILEID=\"ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE.FILEGRP\" /><br />\n</mets:div></p>\n<p>L\'attribut USE dans mets:file est facultatif et son absence ne devrait<br />\ndonc pas poser de pb à l\'import.</p>\n<p>Sinon concernant le deuxième point très gênant relatif à la présence de<br />\nBOM (Byte Order Mark) dans les notice STAR (merci à Yann Nicolas) est-il<br />\npossible de corriger ORI pour palier à ce pb ou devons nous tourner vers<br />\nSTAR ?</p>\n<p>Merci d\'avance pour tout élément de réponse</p>\n<p>Alain</p>\n<p>Le 11/09/2010 09:05, Alain Le Drezen a écrit :<br />\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Je confirme aussi que ORI n\'importe pas le bloc<mets:mdWrap MDTYPE=\"OTHER\" OTHERMDTYPE=\"tef_desc_edition\"> pour les thèses STAR ce qui explique le message d\'erreur décrit par Jean-François :<br />\n><br />\n> \"Toute EDITION de la thèse doit être associée à des métadonnées de type \"tef_desc_edition\".\"<br />\n><br />\n> Nous ne rencontrons pas ce pb sur les TEF-Sudoc que nous importons.<br />\n><br />\n> Alain<br />\n><br />\n><br />\n> </p></blockquote>\n<blockquote class=\"emailFilter_Author_1\"><p>>> Bonjour,<br />\n>><br />\n>> Un autre problème lié à l\'import de STAR (en plus du caractère étrange en début de fichier et de l\'erreur signalé par Jean-François dans le workflow) :<br />\n>><br />\n>> Ori importe :<br />\n>> <mets:FLocat LOCTYPE=\"URL\" xlink:href=\"\\\\Sql01\\depot_these\\Theses\\STAR\\STOCK\\THESE_5162\\DepotEdition\\khelfaanissa1\\khelfaanissa2\\Khelfa.Anissa.SMZ0915.pdf\"/><br />\n>><br />\n>> Ce qui fait que nous nous retrouvons avec une belle URL de type :<br />\n>> \\\\Sql01\\depot_these\\Theses\\STAR\\STOCK\\THESE_5162\\DepotEdition\\khelfaanissa1\\khelfaanissa2\\Khelfa.Anissa.SMZ0915.pdf<br />\n>><br />\n>> L\'URL correcte est dans tef:edition :<br />\n>> <dc:identifier xsi:type=\"dcterms:URI\"><br />\n>> <a href=\"ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf\" title=\"ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf\">ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf</a><br />\n>> </dc:identifier><br />\n>> <dc:identifier xsi:type=\"dcterms:URI\">http://STARFileDirectory/khelfaanissa1</dc:identifier><br />\n>><br />\n>><br />\n>> Bon week-end !<br />\n>><br />\n>> Alain<br />\n>><br />\n>><br />\n>><br />\n>><br />\n>><br />\n>><br />\n>><br />\n>> </p></blockquote>\n<blockquote class=\"emailFilter_Author_2\"><p>>>> Salut Yann,<br />\n>>><br />\n>>> Elle est en PJ. Bon week-end !<br />\n>>><br />\n>>> Jean-François.<br />\n>>><br />\n>>> Yann Nicolas a écrit :<br />\n>>> </p></blockquote>\n<blockquote class=\"emailFilter_Author_3\"><p>>>>> Un exemple de fiche TEF avec cette erreur ?<br />\n>>>><br />\n>>>> Yann<br />\n>>>><br />\n>>>><br />\n>>>> ----- Mail Original -----<br />\n>>>> De: \"Yohan Colmant\"<<span id=\"e390b2fbe7141abbf400b0017fdabd65\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'e390b2fbe7141abbf400b0017fdabd65\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\'+\'\">\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>><br />\n>>>> À: <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a><br />\n>>>> Envoyé: Vendredi 10 Septembre 2010 15:06:53<br />\n>>>> Objet: Re: [ori-oai-utilisateurs] Pb import TEF<br />\n>>>><br />\n>>>> Salut JF,<br />\n>>>><br />\n>>>> Je réponds dans le mail.<br />\n>>>><br />\n>>>> Yohan COLMANT<br />\n>>>> Direction des Systèmes d\'Information<br />\n>>>> UVHC<http://www.univ-valenciennes.fr> - Université de Valenciennes et<br />\n>>>> du Hainaut Cambrésis<br />\n>>>> Coordinateur Technique du projet ORI-OAI<http://www.ori-oai.org><br />\n>>>><br />\n>>>><br />\n>>>> Jean-François Lutz a écrit :<br />\n>>>><br />\n>>>> Bonjour Yohan,<br />\n>>>><br />\n>>>> Merci pour ton aide toujours aussi efficace !<br />\n>>>><br />\n>>>> Je me permets de répondre sur les imports de fiches issues de<br />\n>>>> STAR. Comme l\'indiquait Alain nous ne pouvons pas nous contenter<br />\n>>>> de les moissonner car les laboratoires et les écoles doctorales<br />\n>>>> ont été saisies dans STAR sans aucune liste ou forme d\'autorité,<br />\n>>>> d\'où un nombre très élevé de doublons (un même labo décrit de 5<br />\n>>>> manières différentes par exemples, sachant qu\'il y a 82<br />\n>>>> laboratoires...). Nous allons donc les importer et utiliser les<br />\n>>>> listes d\'autorité internes à ORI-OAI.<br />\n>>>><br />\n>>>> 1. au niveau de l\'import du fichier XML le problème est résolu.<br />\n>>>> Les fiches TEF XML produites par STAR comportent les trois<br />\n>>>> caractères suivants  avant la première balise de l\'entête et<br />\n>>>> ils font planter l\'import. Il suffit pour l\'instant de les<br />\n>>>> supprimer. Peut-être la nouvelle version de STAR corrigera-t-elle<br />\n>>>> ce bug.<br />\n>>>><br />\n>>>> bonne nouvelle :-)<br />\n>>>><br />\n>>>><br />\n>>>> 2. dans le workflow, l\'édition se passe sans problème mais au<br />\n>>>> niveau de la publication, outre le fait qu\'il faut cocher la case<br />\n>>>> \"fichier maître\" ce qui est un détail, un problème persiste sans<br />\n>>>> qu\'Alain et moi arrivions à déterminer son origine. Le message<br />\n>>>> suivant apparaît dans la colonne \"Informations\" et il empêche de<br />\n>>>> publier la fiche : \"Toute EDITION de la thèse doit être associée Ã<br />\n>>>> des métadonnées de type \"tef_desc_edition\".\" Quelqu\'un aurait-il<br />\n>>>> une idée de la solution ? Merci par avance.<br />\n>>>><br />\n>>>> Tu as l\'erreur quand tu essayes de la publier simplement ou quand tu<br />\n>>>> tentes de l\'envoyer à l\'ABES ? Et le problème a lieu avec une fiche<br />\n>>>> importée ou saisie de zéro dans ORI-OAI ?<br />\n>>>><br />\n>>>> Si je regarde cette erreur, elle vient du schematron de l\'ABES avec<br />\n>>>> cette règle :<br />\n>>>><br />\n>>>><br />\n<pattern name=\"mets_structMap_meta_Edition\"<br />\n>>>> id=\"mets_structMap_meta_Edition\"><br />\n>>>> <rule<br />\n>>>> context=\"/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE=\'EDITION\']\"><br />\n>>>> <assert test=\"@DMDID =<br />\n>>>> /mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE=\'tef_desc_edition\']]/@ID\">tef_easy.schematron.tef-abes.structMap.meta_Edition.check_rule</assert><br />\n>>>> </rule><br />\n>>>> </pattern>\n>>>><br />\n>>>> Donc autrement dit, l\'erreur apparait quand<br />\n>>>> /mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE=\'EDITION\']/@DMDID<br />\n>>>><br />\n>>>> n\'est pas égal Ã<br />\n>>>> /mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE=\'tef_desc_edition\']]/@ID<br />\n>>>> dans la fiche TEF.<br />\n>>>><br />\n>>>> Est-ce que ça parle à quelqu\'un ?<br />\n>>>><br />\n>>>><br />\n>>>> Bon week-end.<br />\n>>>><br />\n>>>> Jean-François.<br />\n>>>><br />\n>>>><br />\n>>>> Yohan Colmant a écrit :<br />\n>>>><br />\n>>>> Alain,<br />\n>>>><br />\n>>>> Nous venons d\'avoir une réponse de l\'ABES pour le PPN et tu<br />\n>>>> avais bien raison : \"le dernier caractère est un chiffre de<br />\n>>>> contrôle, qui peut être soit un numéro soit un X, il n\'y a pas<br />\n>>>> d\'autre caractère alphabétique possible. \".<br />\n>>>> Je te propose donc ce correctif (qui sera intégré dans une<br />\n>>>> prochaine version).<br />\n>>>><br />\n>>>> Dans<br />\n>>>> ori-oai-md-editor\\WEB-INF\\resources\\forms\\ori-md-editor\\tef-global\\form\\form.xhtml<br />\n>>>> il faut remplacer toutes les occurrences de<br />\n>>>> [0-9]{9}<br />\n>>>> par<br />\n>>>> [0-9]{8}[X0-9]{1}<br />\n>>>><br />\n>>>> Donc pour les fiches du SUDOC, à part les champs qui ne sont<br />\n>>>> pas remplis à fond, ceci corrige ton problème ?<br />\n>>>><br />\n>>>><br />\n>>>> Concernant les fiches qui proviennent de STAR, tu ne m\'en<br />\n>>>> avais pas parlé ?<br />\n>>>><br />\n>>>> Peux-tu m\'en envoyer une d\'exemple stp ?<br />\n>>>> Quand tu dis que ça plante, c\'est au niveau du md-editor ou<br />\n>>>> déjà dans le workflow ?<br />\n>>>><br />\n>>>> Merci<br />\n>>>><br />\n>>>> Yohan COLMANT<br />\n>>>> Direction des Systèmes d\'Information<br />\n>>>> UVHC<http://www.univ-valenciennes.fr> - Université de<br />\n>>>> Valenciennes et du Hainaut Cambrésis<br />\n>>>> Coordinateur Technique du projet ORI-OAI<http://www.ori-oai.org><br />\n>>>><br />\n>>>><br />\n>>>> le drezen alain a écrit :<br />\n>>>><br />\n>>>> Bonjour Yohan,<br />\n>>>><br />\n>>>> Voici les éléments de réponse.<br />\n>>>><br />\n>>>> Le 10/09/2010 10:31, Yohan Colmant a écrit :<br />\n>>>><br />\n>>>> Salut Alain,<br />\n>>>><br />\n>>>> Je commence ENFIN à me pencher sur ton problème.<br />\n>>>><br />\n>>>> En premier lieu, pourquoi importes-tu les fiches dans<br />\n>>>> ton workflow ? Tu ne peux pas les moissonner plutôt ?<br />\n>>>> Comment les as-tu récupérées ?<br />\n>>>><br />\n>>>> Pour le SUDOC pas de moissonnage possible. Pour Star le<br />\n>>>> moissonnage serait possible. Mais dans les deux cas nous<br />\n>>>> devons modifier les notices ce qui n\'est pas possible sur<br />\n>>>> une notice moissonnée.<br />\n>>>><br />\n>>>> Là , les erreurs que tu mentionnes apparaissent dans le<br />\n>>>> md-editor, mais pas dans le workflow ? Si tu veux<br />\n>>>> juste importer ces fiches et les publier, rien ne te<br />\n>>>> bloque ?<br />\n>>>><br />\n>>>> En ce qui concerne l\'import, en effet pas de problème pour<br />\n>>>> les notices SUDOC. Ce n\'est pas le cas pour les notices<br />\n>>>> STAR qui elles plantent dès l\'import..<br />\n>>>> Cependant certaines notices SUDOC ne sont pas éditable<br />\n>>>> dans le workflow ce qui empêchera de les compléter et donc<br />\n>>>> de les publier.<br />\n>>>><br />\n>>>> Si je n\'arrivais pas à débloquer ton problème avant le<br />\n>>>> retour de Nolwen, est-ce que tu serais bloqué ? En<br />\n>>>> gros, as-tu besoin de modifier les fiches que tu<br />\n>>>> importes ou non ?<br />\n>>>><br />\n>>>> Oui, nous devons les modifier avant de les publier. Par<br />\n>>>> exemple la thèse nommée \"Quelle formation pour le médecin<br />\n>>>> généraliste psychothérapeute de fait\" ne s\'ouvre pas dans<br />\n>>>> l\'éditeur à cause des caractères spéciaux en début de titre.<br />\n>>>><br />\n>>>> Si non, tu peux simplement importer les fiches et les<br />\n>>>> indexer. Effectivement, si tu cherches à les<br />\n>>>> visualiser dans le md-editor, tu auras ces soucis,<br />\n>>>> mais cela te permet tout de même de faire l\'import en<br />\n>>>> attendant ?<br />\n>>>><br />\n>>>><br />\n>>>> Second point, c\'est Nolwen qui est plus à même de<br />\n>>>> répondre à tes interrogations sur le module, donc je<br />\n>>>> vais faire de mon mieux :-(<br />\n>>>><br />\n>>>><br />\n>>>> Pour commencer, j\'ai pris en exemple la fiche<br />\n>>>> Metz_13738551X.xml<br />\n>>>><br />\n>>>> 1) Les erreurs liées au nom et prénom qui ne doivent<br />\n>>>> pas être vides sont connues. Là on a des choses Ã<br />\n>>>> faire par la suite, mais c\'est juste un soucis<br />\n>>>> d\'affichage. Il te suffit de cliquer sur le nom et<br />\n>>>> refermer la fenêtre de saisie de la personne pour voir<br />\n>>>> que l\'erreur disparait. Nolwen n\'avait pas réussi Ã<br />\n>>>> contourner ce problème avant son départ.<br />\n>>>> Lorsque tu as un PPN composé de 9 chiffres comme prévu<br />\n>>>> jusqu\'ici dans l\'éditeur TEF, le même problème se<br />\n>>>> pose, ouvre et referme la fenêtre de saisie, tu verras<br />\n>>>> que ça marche en fait.<br />\n>>>><br />\n>>>> Ca c\'est un pb connu<br />\n>>>><br />\n>>>> 2) Il manque des mots-clefs en français. Ils sont<br />\n>>>> décrits comme obligatoires dans le TEF :<br />\n>>>> <a href=\"http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html\" title=\"http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html\">http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html</a><br />\n>>>><br />\n>>>><br />\n>>>> Ok normal<br />\n>>>><br />\n>>>><br />\n>>>> 3) Pour le PPN qui comporte 8 chiffres et une lettre ....<br />\n>>>> J\'ai essayé de joindre les collègues fonctionnels mais<br />\n>>>> ils ne sont pas joignables pour le moment. Les<br />\n>>>> quelques docs que j\'ai trouvées parlent bien de 9<br />\n>>>> chiffres. Tu as une info ou une doc où ils parlent<br />\n>>>> d\'une possibilité de caractères autres ?<br />\n>>>><br />\n>>>><br />\n>>>> Voici un extrait de la doc de l\'ABES :<br />\n>>>> Zone 001 : Numéro d\'identification de la notice<br />\n>>>> Zone système protégée, obligatoire, non répétable, sans<br />\n>>>> indicateurs et sans sous-zones.<br />\n>>>> Le contenu de la zone est générée automatiquement par le<br />\n>>>> système lors de la validation d\'une nouvelle notice<br />\n>>>> Dans le Sudoc, l\'identifiant unique de la notice est<br />\n>>>> appelé ppn (= Pica production number). Il comporte 9<br />\n>>>> caractères :<br />\n>>>> 8 chiffres (attribués par le système de manière<br />\n>>>> séquentielle = numéro d\'\"ordre\" de la notice dans la base<br />\n>>>> de données)<br />\n>>>> une clé de contrôle sur 1 caractère, qui peut être un<br />\n>>>> chiffre ou \"X\"<br />\n>>>><br />\n>>>> 4) Concernant le fichier maintenant ...<br />\n>>>> Je ne connais pas assez le TEF, mais je sais que le<br />\n>>>> type mime et l\'URL du fichier sont à 2 endroits dans<br />\n>>>> le TEF que nous générons.<br />\n>>>> Dans tes fiches, cela n\'apparait qu\'une fois. Il reste<br />\n>>>> la rubrique suivante qui est vide :<br />\n>>>> <mets:fileSec><br />\n>>>> <mets:fileGrp USE=\"archive\" ID=\"FGrID1\"><br />\n>>>> <mets:file ID=\"FID1\" MIMETYPE=\"\" ADMID=\"file_1\"<br />\n>>>> USE=\"maitre\"><br />\n>>>> <mets:FLocat LOCTYPE=\"URL\" xlink:href=\"\"/><br />\n>>>> </mets:file><br />\n>>>> </mets:fileGrp><br />\n>>>> </mets:fileSec><br />\n>>>> D\'où l\'erreur dans l\'IHM ...<br />\n>>>> Si on se réfère à cette doc, on lit \"*Seule l\'édition<br />\n>>>> d\'archivage doit obligatoirement être représentée dans<br />\n>>>> cette section.* Cette présence est facultative pour<br />\n>>>> les autres éditions. \".<br />\n>>>> Dans ton cas, si je prends la fiche<br />\n>>>> Metz_13738551X.xml, on voit bien USE=\"archive\" dans le<br />\n>>>> bloc mets:fileSec. Si je comprends bien, dans ce cas,<br />\n>>>> les métadonnées MIMETYPE et URL sont obligatoires. Ici<br />\n>>>> elles ne sont pas remplies.<br />\n>>>><br />\n>>>> J\'ai corrigé mes fichiers en remplissant<mets:fileSec> et<br />\n>>>> je récupe^\'re bien l\'URL lors de l\'import.<br />\n>>>> Pour l\'anecdote je n\'ai pas réussi à importer un fichier<br />\n>>>> TEF généré par ORI (pas de chance ???)<br />\n>>>><br />\n>>>><br />\n>>>><br />\n>>>> Je reviens vers toi quand tu auras pu me donner un peu<br />\n>>>> plus d\'infos et fait un retour sur ce mail.<br />\n>>>> Je te dirai aussi ce que j\'ai eu comme infos pour le PPN.<br />\n>>>><br />\n>>>> A bientôt,<br />\n>>>><br />\n>>>> Yohan COLMANT<br />\n>>>> Direction des Systèmes d\'Information<br />\n>>>> UVHC<http://www.univ-valenciennes.fr> - Université de<br />\n>>>> Valenciennes et du Hainaut Cambrésis<br />\n>>>> Coordinateur Technique du projet ORI-OAI<br />\n>>>> <http://www.ori-oai.org><br />\n>>>><br />\n>>>><br />\n>>>> Alain Le Drezen a écrit :<br />\n>>>><br />\n>>>> Bonjour,<br />\n>>>><br />\n>>>> Voici quelques problèmes rencontrés lors de<br />\n>>>> l\'import de notices de thèses du SUDOC (import en<br />\n>>>> pièce jointe).<br />\n>>>><br />\n>>>> L\'URL du fichier (<dc:identifier<br />\n>>>> xsi:type=\"dcterms:URI\">) ne s\'importe pas.<br />\n>>>><br />\n>>>> La notice de la thèse \"Quelle formation pour le<br />\n>>>> médecin généraliste psychothérapeute de fait\" ne<br />\n>>>> s\'affiche pas dans l\'éditeur (page grise vide). Il<br />\n>>>> semble que ce soit lié à la présence de caractères<br />\n>>>> étranges en début du titre. Mais ceci ne devrait<br />\n>>>> pas être bloquant.<br />\n>>>><br />\n>>>> Dans l\'éditeur, l\'erreur \"Le PPN du mot sujet<br />\n>>>> Rameau doit être composé de neuf chiffres\" est<br />\n>>>> erronée. Un PPN peu contenir des caractères.<br />\n>>>><br />\n>>>> Merci d\'avance pour tout élément de réponse.<br />\n>>>><br />\n>>>> Alain<br />\n>>>><br />\n>>>><br />\n>>>><br />\n>>>><br />\n>>>><br />\n>>>><br />\n>>>><br />\n>>>><br />\n>>>><br />\n>>>><br />\n>>>><br />\n>>>> </p></blockquote>\n<blockquote class=\"emailFilter_Author_2\"><p>>>> </p></blockquote>\n<blockquote class=\"emailFilter_Author_1\"><p>>><br />\n>> </p></blockquote>\n<blockquote class=\"emailFilter_Author_0\"><p>><br />\n> </div>\n</blockquote>\n</div>\n', created = 1507752240, expire = 1507838640, headers = '', serialized = 0 WHERE cid = '4:27760736a92f0faeb9c219b1c9cdb305' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:b487305ff7a6dd96fce4b9327a6c36e8' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\">Oui, voici des liens :</p>\n<p><a href=\"http://193.52.26.83/STAR_STOCK_THESES/THESE_5191/ABES/TEF/These_Bilan_Bordereau.xml\" title=\"http://193.52.26.83/STAR_STOCK_THESES/THESE_5191/ABES/TEF/These_Bilan_Bordereau.xml\">http://193.52.26.83/STAR_STOCK_THESES/THESE_5191/ABES/TEF/These_Bilan_Bo...</a><br />\n<a href=\"http://193.52.26.83/STAR_STOCK_THESES/THESE_5152/ABES/TEF/These_Bilan_Bordereau.xml\" title=\"http://193.52.26.83/STAR_STOCK_THESES/THESE_5152/ABES/TEF/These_Bilan_Bordereau.xml\">http://193.52.26.83/STAR_STOCK_THESES/THESE_5152/ABES/TEF/These_Bilan_Bo...</a><br />\n<a href=\"http://193.52.26.83/STAR_STOCK_THESES/THESE_5147/ABES/TEF/These_Bilan_Bordereau.xml\" title=\"http://193.52.26.83/STAR_STOCK_THESES/THESE_5147/ABES/TEF/These_Bilan_Bordereau.xml\">http://193.52.26.83/STAR_STOCK_THESES/THESE_5147/ABES/TEF/These_Bilan_Bo...</a></p>\n<div class=\"emailFilter_Toggle\">\n<blockquote class=\"emailFilter_Author_0\"><p>> Salut Alain,<br />\n><br />\n> Peux-tu nous donner une fiche d\'exemple, qui, une fois importée et<br />\n> enregistrée dans le md-editor perd le bloc tef_desc_version stp ?<br />\n><br />\n> Merci,<br />\n> Yohan COLMANT<br />\n> Direction des Systèmes d\'Information<br />\n> UVHC - Université de Valenciennes et du Hainaut Cambrésis<br />\n> Coordinateur Technique du projet ORI-OAI<br />\n><br />\n><br />\n> le drezen alain a écrit :</p></blockquote>\n<blockquote class=\"emailFilter_Author_1\"><p>> > Bonjour ,<br />\n> ><br />\n> ><br />\n> > Voici un petit complément d\'info.<br />\n> > C\'est en fait le md_editor qui supprime le bloc de \"tef_desc_version\"<br />\n> > dans les thèses de STAR. Si on valide une fiche dans le workflow sans<br />\n> > l\'ouvrir dans le md_editor , ça passe.<br />\n> > J\'essaie désespérément de trouver la raison en comparant les notice<br />\n> > STAR problématiques et d\'autre notices , mais je ne voie rien de<br />\n> > particulier .<br />\n> ><br />\n> > Alain<br />\n> ><br />\n> ><br />\n> ><br />\n> ><br />\n> ><br />\n> > Le 13/09/2010 11:50, Yohan Colmant a écrit :</p></blockquote>\n<blockquote class=\"emailFilter_Author_2\"><p>> >> Alain,<br />\n> >><br />\n> >> J\'avais regardé à ce problème vendredi et je ne vois pas comment<br />\n> >> contourner la chose rapidement côté md-editor.<br />\n> >><br />\n> >> Yohan COLMANT<br />\n> >> Direction des Systèmes d\'Information<br />\n> >> UVHC <http://www.univ-valenciennes.fr> - Université de Valenciennes<br />\n> >> et du Hainaut Cambrésis<br />\n> >> Coordinateur Technique du projet ORI-OAI <http://www.ori-oai.org><br />\n> >><br />\n> >><br />\n> >> le drezen alain a écrit :</p></blockquote>\n<blockquote class=\"emailFilter_Author_3\"><p>> >>> Concernant le message d\'erreur ci dessous, le problème d\'import ne<br />\n> >>> se produit plus si on ajoute USE=\"maitre\" à mets:file<br />\n> >>><br />\n> >>> Je ne m\'explique pas ce comportement si ce n\'est pas un problème<br />\n> >>> lors du chargement du bloc suivant dans mets:structMap :<br />\n> >>><br />\n> >>> <mets:div TYPE=\"EDITION\"<br />\n> >>> CONTENTIDS=\"CONTENTIDS.ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE\"<br />\n> >>> DMDID=\"ABES.STAR.THESE_5152.VERSION_COMPLETE.DESCRIPTION.EDITION_ARCHIVAGE\"><br />\n> >>><br />\n> >>> <mets:fptr<br />\n> >>> FILEID=\"ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE.FILEGRP\"<br />\n> >>> /><br />\n> >>> </mets:div><br />\n> >>><br />\n> >>> L\'attribut USE dans mets:file est facultatif et son absence ne<br />\n> >>> devrait donc pas poser de pb à l\'import.<br />\n> >>><br />\n> >>><br />\n> >>><br />\n> >>> Sinon concernant le deuxième point très gênant relatif à la présence<br />\n> >>> de BOM (Byte Order Mark) dans les notice STAR (merci à Yann Nicolas)<br />\n> >>> est-il possible de corriger ORI pour palier à ce pb ou devons nous<br />\n> >>> tourner vers STAR ?<br />\n> >>><br />\n> >>><br />\n> >>><br />\n> >>> Merci d\'avance pour tout élément de réponse<br />\n> >>><br />\n> >>> Alain<br />\n> >>><br />\n> >>><br />\n> >>><br />\n> >>><br />\n> >>><br />\n> >>> Le 11/09/2010 09:05, Alain Le Drezen a écrit :</p></blockquote>\n<blockquote class=\"emailFilter_Author_4\"><p>> >>>> Je confirme aussi que ORI n\'importe pas le bloc<mets:mdWrap<br />\n> >>>> MDTYPE=\"OTHER\" OTHERMDTYPE=\"tef_desc_edition\"> pour les thèses<br />\n> >>>> STAR ce qui explique le message d\'erreur décrit par Jean-François :<br />\n> >>>><br />\n> >>>> \"Toute EDITION de la thèse doit être associée à des métadonnées de<br />\n> >>>> type \"tef_desc_edition\".\"<br />\n> >>>><br />\n> >>>> Nous ne rencontrons pas ce pb sur les TEF-Sudoc que nous importons.<br />\n> >>>><br />\n> >>>> Alain<br />\n> >>>><br />\n> >>>><br />\n> >>>> </p></blockquote>\n<blockquote class=\"emailFilter_Author_5\"><p>> >>>>> Bonjour,<br />\n> >>>>><br />\n> >>>>> Un autre problème lié à l\'import de STAR (en plus du caractère<br />\n> >>>>> étrange en début de fichier et de l\'erreur signalé par<br />\n> >>>>> Jean-François dans le workflow) :<br />\n> >>>>><br />\n> >>>>> Ori importe :<br />\n> >>>>> <mets:FLocat LOCTYPE=\"URL\"<br />\n> >>>>> xlink:href=\"\\\\Sql01\\depot_these\\Theses\\STAR\\STOCK\\THESE_5162\\DepotEdition\\khelfaanissa1\\khelfaanissa2\\Khelfa.Anissa.SMZ0915.pdf\"/><br />\n> >>>>><br />\n> >>>>><br />\n> >>>>> Ce qui fait que nous nous retrouvons avec une belle URL de type :<br />\n> >>>>> \\\\Sql01\\depot_these\\Theses\\STAR\\STOCK\\THESE_5162\\DepotEdition\\khelfaanissa1\\khelfaanissa2\\Khelfa.Anissa.SMZ0915.pdf<br />\n> >>>>><br />\n> >>>>><br />\n> >>>>> L\'URL correcte est dans tef:edition :<br />\n> >>>>> <dc:identifier xsi:type=\"dcterms:URI\"><br />\n> >>>>> <a href=\"ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf\" title=\"ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf\">ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf</a><br />\n> >>>>> </dc:identifier><br />\n> >>>>> <dc:identifier<br />\n> >>>>> xsi:type=\"dcterms:URI\">http://STARFileDirectory/khelfaanissa1</dc:identifier><br />\n> >>>>><br />\n> >>>>><br />\n> >>>>><br />\n> >>>>> Bon week-end !<br />\n> >>>>><br />\n> >>>>> Alain<br />\n> >>>>><br />\n> >>>>><br />\n> >>>>><br />\n> >>>>><br />\n> >>>>><br />\n> >>>>><br />\n> >>>>><br />\n> >>>>> </p></blockquote>\n<blockquote class=\"emailFilter_Author_6\"><p>> >>>>>> Salut Yann,<br />\n> >>>>>><br />\n> >>>>>> Elle est en PJ. Bon week-end !<br />\n> >>>>>><br />\n> >>>>>> Jean-François.<br />\n> >>>>>><br />\n> >>>>>> Yann Nicolas a écrit :<br />\n> >>>>>> </p></blockquote>\n<blockquote class=\"emailFilter_Author_7\"><p>> >>>>>>> Un exemple de fiche TEF avec cette erreur ?<br />\n> >>>>>>><br />\n> >>>>>>> Yann<br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> ----- Mail Original -----<br />\n> >>>>>>> De: \"Yohan Colmant\"<<span id=\"9100882bc513913dc72d7ce5de21ceb0\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'9100882bc513913dc72d7ce5de21ceb0\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\'+\'\">\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>><br />\n> >>>>>>> À: <a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a><br />\n> >>>>>>> Envoyé: Vendredi 10 Septembre 2010 15:06:53<br />\n> >>>>>>> Objet: Re: [ori-oai-utilisateurs] Pb import TEF<br />\n> >>>>>>><br />\n> >>>>>>> Salut JF,<br />\n> >>>>>>><br />\n> >>>>>>> Je réponds dans le mail.<br />\n> >>>>>>><br />\n> >>>>>>> Yohan COLMANT<br />\n> >>>>>>> Direction des Systèmes d\'Information<br />\n> >>>>>>> UVHC<http://www.univ-valenciennes.fr> - Université de<br />\n> >>>>>>> Valenciennes et<br />\n> >>>>>>> du Hainaut Cambrésis<br />\n> >>>>>>> Coordinateur Technique du projet ORI-OAI<http://www.ori-oai.org><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> Jean-François Lutz a écrit :<br />\n> >>>>>>><br />\n> >>>>>>> Bonjour Yohan,<br />\n> >>>>>>><br />\n> >>>>>>> Merci pour ton aide toujours aussi efficace !<br />\n> >>>>>>><br />\n> >>>>>>> Je me permets de répondre sur les imports de fiches issues de<br />\n> >>>>>>> STAR. Comme l\'indiquait Alain nous ne pouvons pas nous<br />\n> >>>>>>> contenter<br />\n> >>>>>>> de les moissonner car les laboratoires et les écoles<br />\n> >>>>>>> doctorales<br />\n> >>>>>>> ont été saisies dans STAR sans aucune liste ou forme<br />\n> >>>>>>> d\'autorité,<br />\n> >>>>>>> d\'où un nombre très élevé de doublons (un même labo<br />\n> >>>>>>> décrit de 5<br />\n> >>>>>>> manières différentes par exemples, sachant qu\'il y a 82<br />\n> >>>>>>> laboratoires...). Nous allons donc les importer et utiliser<br />\n> >>>>>>> les<br />\n> >>>>>>> listes d\'autorité internes à ORI-OAI.<br />\n> >>>>>>><br />\n> >>>>>>> 1. au niveau de l\'import du fichier XML le problème est<br />\n> >>>>>>> résolu.<br />\n> >>>>>>> Les fiches TEF XML produites par STAR comportent les trois<br />\n> >>>>>>> caractères suivants  avant la première balise de<br />\n> >>>>>>> l\'entête et<br />\n> >>>>>>> ils font planter l\'import. Il suffit pour l\'instant de les<br />\n> >>>>>>> supprimer. Peut-être la nouvelle version de STAR<br />\n> >>>>>>> corrigera-t-elle<br />\n> >>>>>>> ce bug.<br />\n> >>>>>>><br />\n> >>>>>>> bonne nouvelle :-)<br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> 2. dans le workflow, l\'édition se passe sans problème<br />\n> >>>>>>> mais au<br />\n> >>>>>>> niveau de la publication, outre le fait qu\'il faut cocher<br />\n> >>>>>>> la case<br />\n> >>>>>>> \"fichier maître\" ce qui est un détail, un problème<br />\n> >>>>>>> persiste sans<br />\n> >>>>>>> qu\'Alain et moi arrivions à déterminer son origine. Le<br />\n> >>>>>>> message<br />\n> >>>>>>> suivant apparaît dans la colonne \"Informations\" et il<br />\n> >>>>>>> empêche de<br />\n> >>>>>>> publier la fiche : \"Toute EDITION de la thèse doit être<br />\n> >>>>>>> associée à des métadonnées de type \"tef_desc_edition\".\"<br />\n> >>>>>>> Quelqu\'un aurait-il<br />\n> >>>>>>> une idée de la solution ? Merci par avance.<br />\n> >>>>>>><br />\n> >>>>>>> Tu as l\'erreur quand tu essayes de la publier simplement ou<br />\n> >>>>>>> quand tu<br />\n> >>>>>>> tentes de l\'envoyer à l\'ABES ? Et le problème a lieu avec une<br />\n> >>>>>>> fiche<br />\n> >>>>>>> importée ou saisie de zéro dans ORI-OAI ?<br />\n> >>>>>>><br />\n> >>>>>>> Si je regarde cette erreur, elle vient du schematron de l\'ABES avec<br />\n> >>>>>>> cette règle :<br />\n> >>>>>>><br />\n> >>>>>>><br />\n<pattern name=\"mets_structMap_meta_Edition\"<br />\n> >>>>>>> id=\"mets_structMap_meta_Edition\"><br />\n> >>>>>>> <rule<br />\n> >>>>>>> context=\"/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE=\'EDITION\']\"><br />\n> >>>>>>><br />\n> >>>>>>> <assert test=\"@DMDID =<br />\n> >>>>>>> /mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE=\'tef_desc_edition\']]/@ID\">tef_easy.schematron.tef-abes.structMap.meta_Edition.check_rule</assert><br />\n> >>>>>>><br />\n> >>>>>>> </rule><br />\n> >>>>>>> </pattern>\n> >>>>>>><br />\n> >>>>>>> Donc autrement dit, l\'erreur apparait quand<br />\n> >>>>>>> /mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE=\'EDITION\']/@DMDID<br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> n\'est pas égal Ã<br />\n> >>>>>>> /mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE=\'tef_desc_edition\']]/@ID<br />\n> >>>>>>><br />\n> >>>>>>> dans la fiche TEF.<br />\n> >>>>>>><br />\n> >>>>>>> Est-ce que ça parle à quelqu\'un ?<br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> Bon week-end.<br />\n> >>>>>>><br />\n> >>>>>>> Jean-François.<br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> Yohan Colmant a écrit :<br />\n> >>>>>>><br />\n> >>>>>>> Alain,<br />\n> >>>>>>><br />\n> >>>>>>> Nous venons d\'avoir une réponse de l\'ABES pour le PPN<br />\n> >>>>>>> et tu<br />\n> >>>>>>> avais bien raison : \"le dernier caractère est un<br />\n> >>>>>>> chiffre de<br />\n> >>>>>>> contrôle, qui peut être soit un numéro soit un X, il<br />\n> >>>>>>> n\'y a pas<br />\n> >>>>>>> d\'autre caractère alphabétique possible. \".<br />\n> >>>>>>> Je te propose donc ce correctif (qui sera intégré<br />\n> >>>>>>> dans une<br />\n> >>>>>>> prochaine version).<br />\n> >>>>>>><br />\n> >>>>>>> Dans<br />\n> >>>>>>><br />\n> >>>>>>> ori-oai-md-editor\\WEB-INF\\resources\\forms\\ori-md-editor\\tef-global\\form\\form.xhtml<br />\n> >>>>>>><br />\n> >>>>>>> il faut remplacer toutes les occurrences de<br />\n> >>>>>>> [0-9]{9}<br />\n> >>>>>>> par<br />\n> >>>>>>> [0-9]{8}[X0-9]{1}<br />\n> >>>>>>><br />\n> >>>>>>> Donc pour les fiches du SUDOC, à part les champs qui<br />\n> >>>>>>> ne sont<br />\n> >>>>>>> pas remplis à fond, ceci corrige ton problème ?<br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> Concernant les fiches qui proviennent de STAR, tu ne m\'en<br />\n> >>>>>>> avais pas parlé ?<br />\n> >>>>>>><br />\n> >>>>>>> Peux-tu m\'en envoyer une d\'exemple stp ?<br />\n> >>>>>>> Quand tu dis que ça plante, c\'est au niveau du<br />\n> >>>>>>> md-editor ou<br />\n> >>>>>>> déjà dans le workflow ?<br />\n> >>>>>>><br />\n> >>>>>>> Merci<br />\n> >>>>>>><br />\n> >>>>>>> Yohan COLMANT<br />\n> >>>>>>> Direction des Systèmes d\'Information<br />\n> >>>>>>> UVHC<http://www.univ-valenciennes.fr> - Université de<br />\n> >>>>>>> Valenciennes et du Hainaut Cambrésis<br />\n> >>>>>>> Coordinateur Technique du projet<br />\n> >>>>>>> ORI-OAI<http://www.ori-oai.org><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> le drezen alain a écrit :<br />\n> >>>>>>><br />\n> >>>>>>> Bonjour Yohan,<br />\n> >>>>>>><br />\n> >>>>>>> Voici les éléments de réponse.<br />\n> >>>>>>><br />\n> >>>>>>> Le 10/09/2010 10:31, Yohan Colmant a écrit :<br />\n> >>>>>>><br />\n> >>>>>>> Salut Alain,<br />\n> >>>>>>><br />\n> >>>>>>> Je commence ENFIN à me pencher sur ton problème.<br />\n> >>>>>>><br />\n> >>>>>>> En premier lieu, pourquoi importes-tu les<br />\n> >>>>>>> fiches dans<br />\n> >>>>>>> ton workflow ? Tu ne peux pas les moissonner<br />\n> >>>>>>> plutôt ?<br />\n> >>>>>>> Comment les as-tu récupérées ?<br />\n> >>>>>>><br />\n> >>>>>>> Pour le SUDOC pas de moissonnage possible. Pour<br />\n> >>>>>>> Star le<br />\n> >>>>>>> moissonnage serait possible. Mais dans les deux cas<br />\n> >>>>>>> nous<br />\n> >>>>>>> devons modifier les notices ce qui n\'est pas<br />\n> >>>>>>> possible sur<br />\n> >>>>>>> une notice moissonnée.<br />\n> >>>>>>><br />\n> >>>>>>> Là , les erreurs que tu mentionnes apparaissent<br />\n> >>>>>>> dans le<br />\n> >>>>>>> md-editor, mais pas dans le workflow ? Si tu veux<br />\n> >>>>>>> juste importer ces fiches et les publier, rien<br />\n> >>>>>>> ne te<br />\n> >>>>>>> bloque ?<br />\n> >>>>>>><br />\n> >>>>>>> En ce qui concerne l\'import, en effet pas de<br />\n> >>>>>>> problème pour<br />\n> >>>>>>> les notices SUDOC. Ce n\'est pas le cas pour les<br />\n> >>>>>>> notices<br />\n> >>>>>>> STAR qui elles plantent dès l\'import..<br />\n> >>>>>>> Cependant certaines notices SUDOC ne sont pas<br />\n> >>>>>>> éditable<br />\n> >>>>>>> dans le workflow ce qui empêchera de les<br />\n> >>>>>>> compléter et donc<br />\n> >>>>>>> de les publier.<br />\n> >>>>>>><br />\n> >>>>>>> Si je n\'arrivais pas à débloquer ton<br />\n> >>>>>>> problème avant le<br />\n> >>>>>>> retour de Nolwen, est-ce que tu serais bloqué<br />\n> >>>>>>> ? En<br />\n> >>>>>>> gros, as-tu besoin de modifier les fiches que tu<br />\n> >>>>>>> importes ou non ?<br />\n> >>>>>>><br />\n> >>>>>>> Oui, nous devons les modifier avant de les publier.<br />\n> >>>>>>> Par<br />\n> >>>>>>> exemple la thèse nommée \"Quelle formation pour le<br />\n> >>>>>>> médecin<br />\n> >>>>>>> généraliste psychothérapeute de fait\" ne s\'ouvre<br />\n> >>>>>>> pas dans<br />\n> >>>>>>> l\'éditeur à cause des caractères spéciaux en<br />\n> >>>>>>> début de titre.<br />\n> >>>>>>><br />\n> >>>>>>> Si non, tu peux simplement importer les fiches<br />\n> >>>>>>> et les<br />\n> >>>>>>> indexer. Effectivement, si tu cherches à les<br />\n> >>>>>>> visualiser dans le md-editor, tu auras ces soucis,<br />\n> >>>>>>> mais cela te permet tout de même de faire<br />\n> >>>>>>> l\'import en<br />\n> >>>>>>> attendant ?<br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> Second point, c\'est Nolwen qui est plus Ã<br />\n> >>>>>>> même de<br />\n> >>>>>>> répondre à tes interrogations sur le module,<br />\n> >>>>>>> donc je<br />\n> >>>>>>> vais faire de mon mieux :-(<br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> Pour commencer, j\'ai pris en exemple la fiche<br />\n> >>>>>>> Metz_13738551X.xml<br />\n> >>>>>>><br />\n> >>>>>>> 1) Les erreurs liées au nom et prénom qui ne<br />\n> >>>>>>> doivent<br />\n> >>>>>>> pas être vides sont connues. Là on a des<br />\n> >>>>>>> choses à faire par la suite, mais c\'est juste<br />\n> >>>>>>> un soucis<br />\n> >>>>>>> d\'affichage. Il te suffit de cliquer sur le nom et<br />\n> >>>>>>> refermer la fenêtre de saisie de la personne<br />\n> >>>>>>> pour voir<br />\n> >>>>>>> que l\'erreur disparait. Nolwen n\'avait pas<br />\n> >>>>>>> réussi à contourner ce problème avant son<br />\n> >>>>>>> départ.<br />\n> >>>>>>> Lorsque tu as un PPN composé de 9 chiffres<br />\n> >>>>>>> comme prévu<br />\n> >>>>>>> jusqu\'ici dans l\'éditeur TEF, le même<br />\n> >>>>>>> problème se<br />\n> >>>>>>> pose, ouvre et referme la fenêtre de saisie,<br />\n> >>>>>>> tu verras<br />\n> >>>>>>> que ça marche en fait.<br />\n> >>>>>>><br />\n> >>>>>>> Ca c\'est un pb connu<br />\n> >>>>>>><br />\n> >>>>>>> 2) Il manque des mots-clefs en français. Ils sont<br />\n> >>>>>>> décrits comme obligatoires dans le TEF :<br />\n> >>>>>>><br />\n> >>>>>>> <a href=\"http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html\" title=\"http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html\">http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html</a><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> Ok normal<br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> 3) Pour le PPN qui comporte 8 chiffres et une<br />\n> >>>>>>> lettre ....<br />\n> >>>>>>> J\'ai essayé de joindre les collègues<br />\n> >>>>>>> fonctionnels mais<br />\n> >>>>>>> ils ne sont pas joignables pour le moment. Les<br />\n> >>>>>>> quelques docs que j\'ai trouvées parlent bien de 9<br />\n> >>>>>>> chiffres. Tu as une info ou une doc où ils<br />\n> >>>>>>> parlent<br />\n> >>>>>>> d\'une possibilité de caractères autres ?<br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> Voici un extrait de la doc de l\'ABES :<br />\n> >>>>>>> Zone 001 : Numéro d\'identification de la notice<br />\n> >>>>>>> Zone système protégée, obligatoire, non<br />\n> >>>>>>> répétable, sans<br />\n> >>>>>>> indicateurs et sans sous-zones.<br />\n> >>>>>>> Le contenu de la zone est générée<br />\n> >>>>>>> automatiquement par le<br />\n> >>>>>>> système lors de la validation d\'une nouvelle notice<br />\n> >>>>>>> Dans le Sudoc, l\'identifiant unique de la notice est<br />\n> >>>>>>> appelé ppn (= Pica production number). Il comporte 9<br />\n> >>>>>>> caractères :<br />\n> >>>>>>> 8 chiffres (attribués par le système de manière<br />\n> >>>>>>> séquentielle = numéro d\'\"ordre\" de la notice dans<br />\n> >>>>>>> la base<br />\n> >>>>>>> de données)<br />\n> >>>>>>> une clé de contrôle sur 1 caractère, qui peut<br />\n> >>>>>>> être un<br />\n> >>>>>>> chiffre ou \"X\"<br />\n> >>>>>>><br />\n> >>>>>>> 4) Concernant le fichier maintenant ...<br />\n> >>>>>>> Je ne connais pas assez le TEF, mais je sais<br />\n> >>>>>>> que le<br />\n> >>>>>>> type mime et l\'URL du fichier sont à 2<br />\n> >>>>>>> endroits dans<br />\n> >>>>>>> le TEF que nous générons.<br />\n> >>>>>>> Dans tes fiches, cela n\'apparait qu\'une fois.<br />\n> >>>>>>> Il reste<br />\n> >>>>>>> la rubrique suivante qui est vide :<br />\n> >>>>>>> <mets:fileSec><br />\n> >>>>>>> <mets:fileGrp USE=\"archive\" ID=\"FGrID1\"><br />\n> >>>>>>> <mets:file ID=\"FID1\" MIMETYPE=\"\" ADMID=\"file_1\"<br />\n> >>>>>>> USE=\"maitre\"><br />\n> >>>>>>> <mets:FLocat LOCTYPE=\"URL\" xlink:href=\"\"/><br />\n> >>>>>>> </mets:file><br />\n> >>>>>>> </mets:fileGrp><br />\n> >>>>>>> </mets:fileSec><br />\n> >>>>>>> D\'où l\'erreur dans l\'IHM ...<br />\n> >>>>>>> Si on se réfère à cette doc, on lit \"*Seule<br />\n> >>>>>>> l\'édition<br />\n> >>>>>>> d\'archivage doit obligatoirement être<br />\n> >>>>>>> représentée dans<br />\n> >>>>>>> cette section.* Cette présence est facultative<br />\n> >>>>>>> pour<br />\n> >>>>>>> les autres éditions. \".<br />\n> >>>>>>> Dans ton cas, si je prends la fiche<br />\n> >>>>>>> Metz_13738551X.xml, on voit bien USE=\"archive\"<br />\n> >>>>>>> dans le<br />\n> >>>>>>> bloc mets:fileSec. Si je comprends bien, dans<br />\n> >>>>>>> ce cas,<br />\n> >>>>>>> les métadonnées MIMETYPE et URL sont<br />\n> >>>>>>> obligatoires. Ici<br />\n> >>>>>>> elles ne sont pas remplies.<br />\n> >>>>>>><br />\n> >>>>>>> J\'ai corrigé mes fichiers en<br />\n> >>>>>>> remplissant<mets:fileSec> et<br />\n> >>>>>>> je récupe^\'re bien l\'URL lors de l\'import.<br />\n> >>>>>>> Pour l\'anecdote je n\'ai pas réussi à importer un<br />\n> >>>>>>> fichier<br />\n> >>>>>>> TEF généré par ORI (pas de chance ???)<br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> Je reviens vers toi quand tu auras pu me donner<br />\n> >>>>>>> un peu<br />\n> >>>>>>> plus d\'infos et fait un retour sur ce mail.<br />\n> >>>>>>> Je te dirai aussi ce que j\'ai eu comme infos<br />\n> >>>>>>> pour le PPN.<br />\n> >>>>>>><br />\n> >>>>>>> A bientôt,<br />\n> >>>>>>><br />\n> >>>>>>> Yohan COLMANT<br />\n> >>>>>>> Direction des Systèmes d\'Information<br />\n> >>>>>>> UVHC<http://www.univ-valenciennes.fr> -<br />\n> >>>>>>> Université de<br />\n> >>>>>>> Valenciennes et du Hainaut Cambrésis<br />\n> >>>>>>> Coordinateur Technique du projet ORI-OAI<br />\n> >>>>>>> <http://www.ori-oai.org><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> Alain Le Drezen a écrit :<br />\n> >>>>>>><br />\n> >>>>>>> Bonjour,<br />\n> >>>>>>><br />\n> >>>>>>> Voici quelques problèmes rencontrés lors de<br />\n> >>>>>>> l\'import de notices de thèses du SUDOC<br />\n> >>>>>>> (import en<br />\n> >>>>>>> pièce jointe).<br />\n> >>>>>>><br />\n> >>>>>>> L\'URL du fichier (<dc:identifier<br />\n> >>>>>>> xsi:type=\"dcterms:URI\">) ne s\'importe pas.<br />\n> >>>>>>><br />\n> >>>>>>> La notice de la thèse \"Quelle formation<br />\n> >>>>>>> pour le<br />\n> >>>>>>> médecin généraliste psychothérapeute de<br />\n> >>>>>>> fait\" ne<br />\n> >>>>>>> s\'affiche pas dans l\'éditeur (page grise<br />\n> >>>>>>> vide). Il<br />\n> >>>>>>> semble que ce soit lié à la présence de<br />\n> >>>>>>> caractères<br />\n> >>>>>>> étranges en début du titre. Mais ceci ne<br />\n> >>>>>>> devrait<br />\n> >>>>>>> pas être bloquant.<br />\n> >>>>>>><br />\n> >>>>>>> Dans l\'éditeur, l\'erreur \"Le PPN du mot sujet<br />\n> >>>>>>> Rameau doit être composé de neuf<br />\n> >>>>>>> chiffres\" est<br />\n> >>>>>>> erronée. Un PPN peu contenir des caractères.<br />\n> >>>>>>><br />\n> >>>>>>> Merci d\'avance pour tout élément de<br />\n> >>>>>>> réponse.<br />\n> >>>>>>><br />\n> >>>>>>> Alain<br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>><br />\n> >>>>>>> </p></blockquote>\n<blockquote class=\"emailFilter_Author_6\"><p>> >>>>>> </p></blockquote>\n<blockquote class=\"emailFilter_Author_5\"><p>> >>>>><br />\n> >>>>> </p></blockquote>\n<blockquote class=\"emailFilter_Author_4\"><p>> >>>><br />\n> >>>> </p></blockquote>\n<blockquote class=\"emailFilter_Author_3\"><p>> >>><br />\n> >>><br />\n> >>><br />\n> >>><br />\n> >>></p></blockquote>\n<blockquote class=\"emailFilter_Author_1\"><p>> ></p></blockquote>\n<blockquote class=\"emailFilter_Author_0\"><p>><br />\n> </div>\n</blockquote>\n</div>\n', created = 1507752240, expire = 1507838640, headers = '', serialized = 0 WHERE cid = '4:b487305ff7a6dd96fce4b9327a6c36e8' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '4:46e9b8e99f56dccb4a02fe3fbe0c5698' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 27.
  • user warning: Table './drupal_www_ori_oai_org/cache_filter' is marked as crashed and last (automatic?) repair failed query: UPDATE cache_filter SET data = '<div class=\"emailFilter\"><!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html>\n<head>\n <meta content=\"text/html;charset=UTF-8\" http-equiv=\"Content-Type\">\n <title></title>\n</head>\n<body bgcolor=\"#ffffff\" text=\"#000000\">\n<font size=\"-1\"><font face=\"Verdana\">Salut Alain,<br>\n<br>\nPeux-tu nous donner une fiche d\'exemple, qui, une fois importée et\nenregistrée dans le md-editor perd le bloc tef_desc_version stp ?<br>\n<br>\nMerci,<br>\n</font></font>\n<div class=\"moz-signature\">\n<div class=\"moz-signature\"><font face=\"Verdana\"><small>\nYohan COLMANT<br>\nDirection des Systèmes d\'Information<br>\nUVHC - Université de Valenciennes et du Hainaut Cambrésis<br>\nCoordinateur Technique du projet ORI-OAI\n</small></font>\n</div>\n</div>\n<br>\n<br>\nle drezen alain a écrit :\n<div class=\"emailFilter_Toggle\"><div class=\"emailFilter_Author_0\"><blockquote>\n <meta content=\"text/html; charset=UTF-8\" http-equiv=\"Content-Type\">\nBonjour ,<br>\n <br>\n <br>\nVoici un petit complément d\'info.<br>\nC\'est en fait le md_editor qui supprime le bloc de \"tef_desc_version\"\ndans les thèses de STAR. Si on valide une fiche dans le workflow sans\nl\'ouvrir dans le md_editor , ça passe.<br>\nJ\'essaie désespérément de trouver la raison en comparant les notice\nSTAR problématiques et d\'autre notices , mais je ne voie rien de\nparticulier .<br>\n <br>\nAlain<br>\n <br>\n <br>\n <br>\n <br>\n <br>\nLe 13/09/2010 11:50, Yohan Colmant a écrit :\n <div class=\"emailFilter_Author_1\"><blockquote> <defanged_meta content=\"text/html;charset=UTF-8\"\n http-equiv=\"Content-Type\"><font size=\"-1\"><font face=\"Verdana\">Alain,<br>\n <br>\nJ\'avais regardé à ce problème vendredi et je ne vois pas comment\ncontourner la chose rapidement côté md-editor.<br>\n <br>\n </font></font> </defanged_meta>\n <div class=\"moz-signature\">\n <div class=\"moz-signature\"><font face=\"Verdana\"><small>Yohan COLMANT<br>\nDirection des Systèmes d\'Information<br>\n <a moz-do-not-send=\"true\" href=\"http://www.univ-valenciennes.fr\">UVHC</a>\n- Université de\nValenciennes et du Hainaut Cambrésis<br>\nCoordinateur Technique du projet <a moz-do-not-send=\"true\"\n href=\"http://www.ori-oai.org\">ORI-OAI</a> </small></font></div>\n </div>\n <br>\n <br>\nle drezen alain a écrit :\n <div class=\"emailFilter_Author_2\"><blockquote>Concernant\nle\nmessage d\'erreur ci dessous, le problème d\'import ne se produit plus\nsi on ajoute USE=\"maitre\" à  mets:file <br>\n <br>\nJe ne m\'explique pas ce comportement si ce n\'est pas un problème lors\ndu chargement du bloc suivant dans  mets:structMap  : <br>\n <br>\n&lt;mets:div TYPE=\"EDITION\"\nCONTENTIDS=\"CONTENTIDS.ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE\"\nDMDID=\"ABES.STAR.THESE_5152.VERSION_COMPLETE.DESCRIPTION.EDITION_ARCHIVAGE\"&gt;\n <br>\n&lt;mets:fptr\nFILEID=\"ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE.FILEGRP\"\n/&gt; <br>\n&lt;/mets:div&gt; <br>\n <br>\nL\'attribut USE dans mets:file est facultatif et son absence ne devrait\ndonc pas poser de pb à l\'import. <br>\n <br>\n <br>\n <br>\nSinon concernant le deuxième point très gênant relatif à la présence de\nBOM (Byte Order Mark) dans les notice STAR (merci à Yann Nicolas)\nest-il possible de corriger ORI pour palier à ce pb ou devons nous\ntourner vers STAR  ? <br>\n <br>\n <br>\n <br>\nMerci d\'avance pour tout élément de réponse <br>\n <br>\nAlain <br>\n <br>\n <br>\n <br>\n <br>\n <br>\nLe 11/09/2010 09:05, Alain Le Drezen a écrit : <br>\n <div class=\"emailFilter_Author_3\"><blockquote type=\"cite\">Je confirme aussi que ORI n\'importe pas\nle\nbloc&lt;mets:mdWrap MDTYPE=\"OTHER\" OTHERMDTYPE=\"tef_desc_edition\"&gt; \npour les thèses STAR ce qui explique le message d\'erreur décrit par\nJean-François : <br>\n <br>\n\"Toute EDITION de la thèse doit être associée à des métadonnées de type\n\"tef_desc_edition\".\" <br>\n <br>\nNous ne rencontrons pas ce pb sur les TEF-Sudoc que nous importons. <br>\n <br>\nAlain <br>\n <br>\n <br>\n  \n <div class=\"emailFilter_Author_4\"><blockquote type=\"cite\">Bonjour, <br>\n <br>\nUn autre problème lié à l\'import de STAR (en plus du caractère étrange\nen début de fichier et de l\'erreur signalé par Jean-François dans le\nworkflow) : <br>\n <br>\n  Ori importe : <br>\n&lt;mets:FLocat LOCTYPE=\"URL\"\nxlink:href=\"\\\\Sql01\\depot_these\\Theses\\STAR\\STOCK\\THESE_5162\\DepotEdition\\khelfaanissa1\\khelfaanissa2\\Khelfa.Anissa.SMZ0915.pdf\"/&gt;\n <br>\n <br>\nCe qui fait que nous nous retrouvons avec une belle URL de type : <br>\n\\\\Sql01\\depot_these\\Theses\\STAR\\STOCK\\THESE_5162\\DepotEdition\\khelfaanissa1\\khelfaanissa2\\Khelfa.Anissa.SMZ0915.pdf\n <br>\n <br>\nL\'URL correcte est dans tef:edition : <br>\n&lt;dc:identifier xsi:type=\"dcterms:URI\"&gt; <br>\n <a moz-do-not-send=\"true\" class=\"moz-txt-link-freetext\"\n href=\"ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf\">ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf</a>\n <br>\n&lt;/dc:identifier&gt; <br>\n&lt;dc:identifier\nxsi:type=\"dcterms:URI\"&gt;<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-freetext\"\n href=\"http://STARFileDirectory/khelfaanissa1\">http://STARFileDirectory/khelfaanissa1</a>&lt;/dc:identifier&gt;\n <br>\n <br>\n <br>\nBon week-end ! <br>\n <br>\nAlain <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n    \n <div class=\"emailFilter_Author_5\"><blockquote type=\"cite\">Salut Yann, <br>\n <br>\nElle est en PJ. Bon week-end ! <br>\n <br>\nJean-François. <br>\n <br>\nYann Nicolas a écrit : <br>\n      \n <div class=\"emailFilter_Author_6\"><blockquote type=\"cite\">Un exemple de fiche TEF avec cette\nerreur ? <br>\n <br>\nYann <br>\n <br>\n <br>\n----- Mail Original ----- <br>\nDe: \"Yohan Colmant\"<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-rfc2396E\"\n href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\">&lt;<span id=\"4a8d885f9defe78bd82caa80c3dc4374\"></span>\n <script type=\"text/javascript\" > <!--\n document.getElementById(\'4a8d885f9defe78bd82caa80c3dc4374\')\n .innerHTML = \'<a href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\'+\'\">\'+\'&#121;&#111;&#104;&#97;&#110;&#46;&#99;&#111;&#108;&#109;&#97;&#110;&#116;&#64;&#117;&#110;&#105;&#118;&#45;&#118;&#97;&#108;&#101;&#110;&#99;&#105;&#101;&#110;&#110;&#101;&#115;&#46;&#102;&#114;\' + \'</a>\';\n // --> </script>&gt;</a>\n <br>\nÀ: <a moz-do-not-send=\"true\" class=\"moz-txt-link-abbreviated\"\n href=\"&#109;&#97;&#105;&#108;&#116;&#111;&#58;&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;\">&#111;&#114;&#105;&#45;&#111;&#97;&#105;&#45;&#117;&#116;&#105;&#108;&#105;&#115;&#97;&#116;&#101;&#117;&#114;&#115;&#64;&#108;&#105;&#115;&#116;&#101;&#115;&#46;&#117;&#110;&#105;&#118;&#45;&#114;&#101;&#110;&#110;&#101;&#115;&#49;&#46;&#102;&#114;</a>\n <br>\nEnvoyé: Vendredi 10 Septembre 2010 15:06:53 <br>\nObjet: Re: [ori-oai-utilisateurs] Pb import TEF <br>\n <br>\nSalut JF, <br>\n <br>\nJe réponds dans le mail. <br>\n <br>\nYohan COLMANT <br>\nDirection des Systèmes d\'Information <br>\nUVHC<a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\"\n href=\"http://www.univ-valenciennes.fr\">&lt;http://www.univ-valenciennes.fr&gt;</a> \n- Université de\nValenciennes et <br>\ndu Hainaut Cambrésis <br>\nCoordinateur Technique du projet ORI-OAI<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-rfc2396E\" href=\"http://www.ori-oai.org\">&lt;http://www.ori-oai.org&gt;</a>\n <br>\n <br>\n <br>\nJean-François Lutz a écrit : <br>\n <br>\n     Bonjour Yohan, <br>\n <br>\n     Merci pour ton aide toujours aussi efficace ! <br>\n <br>\n     Je me permets de répondre sur les imports de fiches issues de <br>\n     STAR. Comme l\'indiquait Alain nous ne pouvons pas nous contenter <br>\n     de les moissonner car les laboratoires et les écoles doctorales <br>\n     ont été saisies dans STAR sans aucune liste ou forme\nd\'autorité, <br>\n     d\'où un nombre très élevé de doublons (un même labo décrit\nde 5 <br>\n     manières différentes par exemples, sachant qu\'il y a 82 <br>\n     laboratoires...). Nous allons donc les importer et utiliser les <br>\n     listes d\'autorité internes à ORI-OAI. <br>\n <br>\n     1. au niveau de l\'import du fichier XML le problème est résolu. <br>\n     Les fiches TEF XML produites par STAR comportent les trois <br>\n     caractères suivants  avant la première balise de l\'entête\net <br>\n     ils font planter l\'import. Il suffit pour l\'instant de les <br>\n     supprimer. Peut-être la nouvelle version de STAR corrigera-t-elle\n <br>\n     ce bug. <br>\n <br>\nbonne nouvelle :-) <br>\n <br>\n <br>\n     2. dans le workflow, l\'édition se passe sans problème mais au <br>\n     niveau de la publication, outre le fait qu\'il faut cocher la case <br>\n     \"fichier maître\" ce qui est un détail, un problème persiste\nsans <br>\n     qu\'Alain et moi arrivions à déterminer son origine. Le message <br>\n     suivant apparaît dans la colonne \"Informations\" et il empêche de\n <br>\n     publier la fiche : \"Toute EDITION de la thèse doit être\nassociée à      des métadonnées de type \"tef_desc_edition\".\"\nQuelqu\'un aurait-il <br>\n     une idée de la solution ? Merci par avance. <br>\n <br>\nTu as l\'erreur quand tu essayes de la publier simplement ou quand tu <br>\ntentes de l\'envoyer à l\'ABES ? Et le problème a lieu avec une fiche <br>\nimportée ou saisie de zéro dans ORI-OAI ? <br>\n <br>\nSi je regarde cette erreur, elle vient du schematron de l\'ABES avec <br>\ncette règle : <br>\n <br>\n   &lt;pattern name=\"mets_structMap_meta_Edition\" <br>\nid=\"mets_structMap_meta_Edition\"&gt; <br>\n     &lt;rule <br>\ncontext=\"/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE=\'EDITION\']\"&gt;\n <br>\n       &lt;assert test=\"@DMDID = <br>\n/mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE=\'tef_desc_edition\']]/@ID\"&gt;tef_easy.schematron.tef-abes.structMap.meta_Edition.check_rule&lt;/assert&gt;\n <br>\n     &lt;/rule&gt; <br>\n   &lt;/pattern&gt; <br>\n <br>\nDonc autrement dit, l\'erreur apparait quand <br>\n/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE=\'EDITION\']/@DMDID\n <br>\n <br>\nn\'est pas égal Ã\n/mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE=\'tef_desc_edition\']]/@ID\n <br>\ndans la fiche TEF. <br>\n <br>\nEst-ce que ça parle à quelqu\'un ? <br>\n <br>\n <br>\n     Bon week-end. <br>\n <br>\n     Jean-François. <br>\n <br>\n <br>\n     Yohan Colmant a écrit : <br>\n <br>\n         Alain, <br>\n <br>\n         Nous venons d\'avoir une réponse de l\'ABES pour le PPN et tu <br>\n         avais bien raison : \"le dernier caractère est un chiffre de <br>\n         contrôle, qui peut être soit un numéro soit un X, il n\'y a\npas <br>\n         d\'autre caractère alphabétique possible. \". <br>\n         Je te propose donc ce correctif (qui sera intégré dans une <br>\n         prochaine version). <br>\n <br>\n         Dans <br>\n        \nori-oai-md-editor\\WEB-INF\\resources\\forms\\ori-md-editor\\tef-global\\form\\form.xhtml\n <br>\n         il faut remplacer toutes les occurrences de <br>\n         [0-9]{9} <br>\n         par <br>\n         [0-9]{8}[X0-9]{1} <br>\n <br>\n         Donc pour les fiches du SUDOC, à part les champs qui ne sont <br>\n         pas remplis à fond, ceci corrige ton problème ? <br>\n <br>\n <br>\n         Concernant les fiches qui proviennent de STAR, tu ne m\'en <br>\n         avais pas parlé ? <br>\n <br>\n         Peux-tu m\'en envoyer une d\'exemple stp ? <br>\n         Quand tu dis que ça plante, c\'est au niveau du md-editor ou <br>\n         déjà dans le workflow ? <br>\n <br>\n         Merci <br>\n <br>\n         Yohan COLMANT <br>\n         Direction des Systèmes d\'Information <br>\n         UVHC<a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\"\n href=\"http://www.univ-valenciennes.fr\">&lt;http://www.univ-valenciennes.fr&gt;</a> \n- Université de <br>\n         Valenciennes et du Hainaut Cambrésis <br>\n         Coordinateur Technique du projet\nORI-OAI<a moz-do-not-send=\"true\" class=\"moz-txt-link-rfc2396E\"\n href=\"http://www.ori-oai.org\">&lt;http://www.ori-oai.org&gt;</a> <br>\n <br>\n <br>\n         le drezen alain a écrit : <br>\n <br>\n             Bonjour Yohan, <br>\n <br>\n             Voici les éléments de réponse. <br>\n <br>\n             Le 10/09/2010 10:31, Yohan Colmant a écrit : <br>\n <br>\n                 Salut Alain, <br>\n <br>\n                 Je commence ENFIN à me pencher sur ton problème. <br>\n <br>\n                 En premier lieu, pourquoi importes-tu les fiches dans <br>\n                 ton workflow ? Tu ne peux pas les moissonner plutôt ?\n <br>\n                 Comment les as-tu récupérées ? <br>\n <br>\n             Pour le SUDOC pas de moissonnage possible. Pour Star le <br>\n             moissonnage serait possible. Mais dans les deux cas nous <br>\n             devons modifier les notices ce qui n\'est pas possible sur <br>\n             une notice moissonnée. <br>\n <br>\n                 Là , les erreurs que tu mentionnes apparaissent dans\nle <br>\n                 md-editor, mais pas dans le workflow ? Si tu veux <br>\n                 juste importer ces fiches et les publier, rien ne te <br>\n                 bloque ? <br>\n <br>\n             En ce qui concerne l\'import, en effet pas de problème\npour <br>\n             les notices SUDOC. Ce n\'est pas le cas pour les notices <br>\n             STAR qui elles plantent dès l\'import.. <br>\n             Cependant certaines notices SUDOC ne sont pas éditable <br>\n             dans le workflow ce qui empêchera de les compléter et\ndonc <br>\n             de les publier. <br>\n <br>\n                 Si je n\'arrivais pas à débloquer ton problème avant\nle <br>\n                 retour de Nolwen, est-ce que tu serais bloqué ? En <br>\n                 gros, as-tu besoin de modifier les fiches que tu <br>\n                 importes ou non ? <br>\n <br>\n             Oui, nous devons les modifier avant de les publier. Par <br>\n             exemple la thèse nommée \"Quelle formation pour le\nmédecin <br>\n             généraliste psychothérapeute de fait\" ne s\'ouvre pas\ndans <br>\n             l\'éditeur à cause des caractères spéciaux en début de\ntitre. <br>\n <br>\n                 Si non, tu peux simplement importer les fiches et les <br>\n                 indexer. Effectivement, si tu cherches à les <br>\n                 visualiser dans le md-editor, tu auras ces soucis, <br>\n                 mais cela te permet tout de même de faire l\'import en\n <br>\n                 attendant ? <br>\n <br>\n <br>\n                 Second point, c\'est Nolwen qui est plus à même de <br>\n                 répondre à tes interrogations sur le module, donc je\n <br>\n                 vais faire de mon mieux :-( <br>\n <br>\n <br>\n                 Pour commencer, j\'ai pris en exemple la fiche <br>\n                 Metz_13738551X.xml <br>\n <br>\n                 1) Les erreurs liées au nom et prénom qui ne doivent\n <br>\n                 pas être vides sont connues. Là on a des choses Ã\n                 faire par la suite, mais c\'est juste un soucis <br>\n                 d\'affichage. Il te suffit de cliquer sur le nom et <br>\n                 refermer la fenêtre de saisie de la personne pour\nvoir <br>\n                 que l\'erreur disparait. Nolwen n\'avait pas réussi Ã\n                 contourner ce problème avant son départ. <br>\n                 Lorsque tu as un PPN composé de 9 chiffres comme\nprévu <br>\n                 jusqu\'ici dans l\'éditeur TEF, le même problème se <br>\n                 pose, ouvre et referme la fenêtre de saisie, tu\nverras <br>\n                 que ça marche en fait. <br>\n <br>\n             Ca c\'est un pb connu <br>\n <br>\n                 2) Il manque des mots-clefs en français. Ils sont <br>\n                 décrits comme obligatoires dans le TEF : <br>\n                 <a moz-do-not-send=\"true\"\n class=\"moz-txt-link-freetext\"\n href=\"http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html\">http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html</a>\n <br>\n <br>\n <br>\n             Ok normal <br>\n <br>\n <br>\n                 3) Pour le PPN qui comporte 8 chiffres et une lettre\n.... <br>\n                 J\'ai essayé de joindre les collègues fonctionnels\nmais <br>\n                 ils ne sont pas joignables pour le moment. Les <br>\n                 quelques docs que j\'ai trouvées parlent bien de 9 <br>\n                 chiffres. Tu as une info ou une doc où ils parlent <br>\n                 d\'une possibilité de caractères autres ? <br>\n <br>\n <br>\n             Voici un extrait de la doc de l\'ABES : <br>\n             Zone 001 : Numéro d\'identification de la notice <br>\n             Zone système protégée, obligatoire, non répétable,\nsans <br>\n             indicateurs et sans sous-zones. <br>\n             Le contenu de la zone est générée automatiquement par\nle <br>\n             système lors de la validation d\'une nouvelle notice <br>\n             Dans le Sudoc, l\'identifiant unique de la notice est <br>\n             appelé ppn (= Pica production number). Il comporte 9 <br>\n             caractères : <br>\n             8 chiffres (attribués par le système de manière <br>\n             séquentielle = numéro d\'\"ordre\" de la notice dans la\nbase <br>\n             de données) <br>\n             une clé de contrôle sur 1 caractère, qui peut être un <br>\n             chiffre ou \"X\" <br>\n <br>\n                 4) Concernant le fichier maintenant ... <br>\n                 Je ne connais pas assez le TEF, mais je sais que le <br>\n                 type mime et l\'URL du fichier sont à 2 endroits dans <br>\n                 le TEF que nous générons. <br>\n                 Dans tes fiches, cela n\'apparait qu\'une fois. Il reste\n <br>\n                 la rubrique suivante qui est vide : <br>\n                 &lt;mets:fileSec&gt; <br>\n                 &lt;mets:fileGrp USE=\"archive\" ID=\"FGrID1\"&gt; <br>\n                 &lt;mets:file ID=\"FID1\" MIMETYPE=\"\" ADMID=\"file_1\" <br>\n                 USE=\"maitre\"&gt; <br>\n                 &lt;mets:FLocat LOCTYPE=\"URL\" xlink:href=\"\"/&gt; <br>\n                 &lt;/mets:file&gt; <br>\n                 &lt;/mets:fileGrp&gt; <br>\n                 &lt;/mets:fileSec&gt; <br>\n                 D\'où l\'erreur dans l\'IHM ... <br>\n                 Si on se réfère à cette doc, on lit \"*Seule\nl\'édition <br>\n                 d\'archivage doit obligatoirement être représentée\ndans <br>\n                 cette section.* Cette présence est facultative pour <br>\n                 les autres éditions. \". <br>\n                 Dans ton cas, si je prends la fiche <br>\n                 Metz_13738551X.xml, on voit bien USE=\"archive\" dans le\n <br>\n                 bloc mets:fileSec. Si je comprends bien, dans ce cas, <br>\n                 les métadonnées MIMETYPE et URL sont obligatoires.\nIci <br>\n                 elles ne sont pas remplies. <br>\n <br>\n             J\'ai corrigé mes fichiers en\nremplissant&lt;mets:fileSec&gt;  et <br>\n             je récupe^\'re bien l\'URL lors de l\'import. <br>\n             Pour l\'anecdote je n\'ai pas réussi à importer un fichier\n <br>\n             TEF généré par ORI (pas de chance ???) <br>\n <br>\n <br>\n <br>\n                 Je reviens vers toi quand tu auras pu me donner un peu\n <br>\n                 plus d\'infos et fait un retour sur ce mail. <br>\n                 Je te dirai aussi ce que j\'ai eu comme infos pour le\nPPN. <br>\n <br>\n                 A bientôt, <br>\n <br>\n                 Yohan COLMANT <br>\n                 Direction des Systèmes d\'Information <br>\n                 UVHC<a moz-do-not-send=\"true\"\n class=\"moz-txt-link-rfc2396E\" href=\"http://www.univ-valenciennes.fr\">&lt;http://www.univ-valenciennes.fr&gt;</a> \n-\nUniversité de <br>\n                 Valenciennes et du Hainaut Cambrésis <br>\n                 Coordinateur Technique du projet ORI-OAI <br>\n                 <a moz-do-not-send=\"true\"\n class=\"moz-txt-link-rfc2396E\" href=\"http://www.ori-oai.org\">&lt;http://www.ori-oai.org&gt;</a>\n <br>\n <br>\n <br>\n                 Alain Le Drezen a écrit : <br>\n <br>\n                     Bonjour, <br>\n <br>\n                     Voici quelques problèmes rencontrés lors de <br>\n                     l\'import de notices de thèses du SUDOC (import en\n <br>\n                     pièce jointe). <br>\n <br>\n                     L\'URL du fichier (&lt;dc:identifier <br>\n                     xsi:type=\"dcterms:URI\"&gt;) ne s\'importe pas. <br>\n <br>\n                     La notice de la thèse \"Quelle formation pour le <br>\n                     médecin généraliste psychothérapeute de fait\"\nne <br>\n                     s\'affiche pas dans l\'éditeur (page grise vide).\nIl <br>\n                     semble que ce soit lié à la présence de\ncaractères <br>\n                     étranges en début du titre. Mais ceci ne devrait\n <br>\n                     pas être bloquant. <br>\n <br>\n                     Dans l\'éditeur, l\'erreur \"Le PPN du mot sujet <br>\n                     Rameau doit être composé de neuf chiffres\" est <br>\n                     erronée. Un PPN peu contenir des caractères. <br>\n <br>\n                     Merci d\'avance pour tout élément de réponse. <br>\n <br>\n                     Alain <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n <br>\n         </blockquote></div>\n       </blockquote></div>\n <br>\n     </blockquote></div>\n <br>\n   </blockquote></div>\n <br>\n <br>\n <br>\n <br>\n <br>\n </blockquote></div>\n </blockquote></div>\n <br>\n</blockquote></div></div>\n</body>\n</html>\n</div>', created = 1507752240, expire = 1507838640, headers = '', serialized = 0 WHERE cid = '4:46e9b8e99f56dccb4a02fe3fbe0c5698' in /home/ori-oai/drupal/drupal-6.34/includes/cache.inc on line 112.
5 messages / 0 nouveaux
Dernière contribution
ledrezen
Pb import TEF - STAR (3)
Bonjour ,


Voici un petit complément d'info.
C'est en fait le md_editor qui supprime le bloc de "tef_desc_version" dans les thèses de STAR. Si on valide une fiche dans le workflow sans l'ouvrir dans le md_editor , ça passe.
J'essaie désespérément de trouver la raison en comparant les notice STAR problématiques et d'autre notices , mais je ne voie rien de particulier .

Alain





Le 13/09/2010 11:50, Yohan Colmant a écrit :
Alain,

J'avais regardé à ce problème vendredi et je ne vois pas comment contourner la chose rapidement côté md-editor.

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI


le drezen alain a écrit :
Concernant le message d'erreur ci dessous, le problème d'import ne se produit plus si on ajoute USE="maitre" à  mets:file

Je ne m'explique pas ce comportement si ce n'est pas un problème lors du chargement du bloc suivant dans  mets:structMap  :

<mets:div TYPE="EDITION" CONTENTIDS="CONTENTIDS.ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE" DMDID="ABES.STAR.THESE_5152.VERSION_COMPLETE.DESCRIPTION.EDITION_ARCHIVAGE">
<mets:fptr FILEID="ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE.FILEGRP" />
</mets:div>

L'attribut USE dans mets:file est facultatif et son absence ne devrait donc pas poser de pb à l'import.



Sinon concernant le deuxième point très gênant relatif à la présence de BOM (Byte Order Mark) dans les notice STAR (merci à Yann Nicolas) est-il possible de corriger ORI pour palier à ce pb ou devons nous tourner vers STAR  ?



Merci d'avance pour tout élément de réponse

Alain





Le 11/09/2010 09:05, Alain Le Drezen a écrit :
Je confirme aussi que ORI n'importe pas le bloc<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_edition">  pour les thèses STAR ce qui explique le message d'erreur décrit par Jean-François :

"Toute EDITION de la thèse doit être associée à des métadonnées de type "tef_desc_edition"."

Nous ne rencontrons pas ce pb sur les TEF-Sudoc que nous importons.

Alain


  
Bonjour,

Un autre problème lié à l'import de STAR (en plus du caractère étrange en début de fichier et de l'erreur signalé par Jean-François dans le workflow) :

  Ori importe :
<mets:FLocat LOCTYPE="URL" xlink:href="\\Sql01\depot_these\Theses\STAR\STOCK\THESE_5162\DepotEdition\khelfaanissa1\khelfaanissa2\Khelfa.Anissa.SMZ0915.pdf"/>

Ce qui fait que nous nous retrouvons avec une belle URL de type :
\\Sql01\depot_these\Theses\STAR\STOCK\THESE_5162\DepotEdition\khelfaanissa1\khelfaanissa2\Khelfa.Anissa.SMZ0915.pdf

L'URL correcte est dans tef:edition :
<dc:identifier xsi:type="dcterms:URI">
ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf
</dc:identifier>
<dc:identifier xsi:type="dcterms:URI">http://STARFileDirectory/khelfaanissa1</dc:identifier>


Bon week-end !

Alain







    
Salut Yann,

Elle est en PJ. Bon week-end !

Jean-François.

Yann Nicolas a écrit :
      
Un exemple de fiche TEF avec cette erreur ?

Yann


----- Mail Original -----
De: "Yohan Colmant"< >
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Vendredi 10 Septembre 2010 15:06:53
Objet: Re: [ori-oai-utilisateurs] Pb import TEF

Salut JF,

Je réponds dans le mail.

Yohan COLMANT
Direction des Systèmes d'Information
UVHC<http://www.univ-valenciennes.fr>  - Université de Valenciennes et
du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI<http://www.ori-oai.org>


Jean-François Lutz a écrit :

     Bonjour Yohan,

     Merci pour ton aide toujours aussi efficace !

     Je me permets de répondre sur les imports de fiches issues de
     STAR. Comme l'indiquait Alain nous ne pouvons pas nous contenter
     de les moissonner car les laboratoires et les écoles doctorales
     ont été saisies dans STAR sans aucune liste ou forme d'autorité,
     d'où un nombre très élevé de doublons (un même labo décrit de 5
     manières différentes par exemples, sachant qu'il y a 82
     laboratoires...). Nous allons donc les importer et utiliser les
     listes d'autorité internes à ORI-OAI.

     1. au niveau de l'import du fichier XML le problème est résolu.
     Les fiches TEF XML produites par STAR comportent les trois
     caractères suivants  avant la première balise de l'entête et
     ils font planter l'import. Il suffit pour l'instant de les
     supprimer. Peut-être la nouvelle version de STAR corrigera-t-elle
     ce bug.

bonne nouvelle :-)


     2. dans le workflow, l'édition se passe sans problème mais au
     niveau de la publication, outre le fait qu'il faut cocher la case
     "fichier maître" ce qui est un détail, un problème persiste sans
     qu'Alain et moi arrivions à déterminer son origine. Le message
     suivant apparaît dans la colonne "Informations" et il empêche de
     publier la fiche : "Toute EDITION de la thèse doit être associée à      des métadonnées de type "tef_desc_edition"." Quelqu'un aurait-il
     une idée de la solution ? Merci par avance.

Tu as l'erreur quand tu essayes de la publier simplement ou quand tu
tentes de l'envoyer à l'ABES ? Et le problème a lieu avec une fiche
importée ou saisie de zéro dans ORI-OAI ?

Si je regarde cette erreur, elle vient du schematron de l'ABES avec
cette règle :

   <pattern name="mets_structMap_meta_Edition"
id="mets_structMap_meta_Edition">
     <rule
context="/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE='EDITION']">
       <assert test="@DMDID =
/mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE='tef_desc_edition']]/@ID">tef_easy.schematron.tef-abes.structMap.meta_Edition.check_rule</assert>
     </rule>
   </pattern>

Donc autrement dit, l'erreur apparait quand
/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE='EDITION']/@DMDID

n'est pas égal à /mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE='tef_desc_edition']]/@ID
dans la fiche TEF.

Est-ce que ça parle à quelqu'un ?


     Bon week-end.

     Jean-François.


     Yohan Colmant a écrit :

         Alain,

         Nous venons d'avoir une réponse de l'ABES pour le PPN et tu
         avais bien raison : "le dernier caractère est un chiffre de
         contrôle, qui peut être soit un numéro soit un X, il n'y a pas
         d'autre caractère alphabétique possible. ".
         Je te propose donc ce correctif (qui sera intégré dans une
         prochaine version).

         Dans
         ori-oai-md-editor\WEB-INF\resources\forms\ori-md-editor\tef-global\form\form.xhtml
         il faut remplacer toutes les occurrences de
         [0-9]{9}
         par
         [0-9]{8}[X0-9]{1}

         Donc pour les fiches du SUDOC, à part les champs qui ne sont
         pas remplis à fond, ceci corrige ton problème ?


         Concernant les fiches qui proviennent de STAR, tu ne m'en
         avais pas parlé ?

         Peux-tu m'en envoyer une d'exemple stp ?
         Quand tu dis que ça plante, c'est au niveau du md-editor ou
         déjà dans le workflow ?

         Merci

         Yohan COLMANT
         Direction des Systèmes d'Information
         UVHC<http://www.univ-valenciennes.fr>  - Université de
         Valenciennes et du Hainaut Cambrésis
         Coordinateur Technique du projet ORI-OAI<http://www.ori-oai.org>


         le drezen alain a écrit :

             Bonjour Yohan,

             Voici les éléments de réponse.

             Le 10/09/2010 10:31, Yohan Colmant a écrit :

                 Salut Alain,

                 Je commence ENFIN à me pencher sur ton problème.

                 En premier lieu, pourquoi importes-tu les fiches dans
                 ton workflow ? Tu ne peux pas les moissonner plutôt ?
                 Comment les as-tu récupérées ?

             Pour le SUDOC pas de moissonnage possible. Pour Star le
             moissonnage serait possible. Mais dans les deux cas nous
             devons modifier les notices ce qui n'est pas possible sur
             une notice moissonnée.

                 LÃ , les erreurs que tu mentionnes apparaissent dans le
                 md-editor, mais pas dans le workflow ? Si tu veux
                 juste importer ces fiches et les publier, rien ne te
                 bloque ?

             En ce qui concerne l'import, en effet pas de problème pour
             les notices SUDOC. Ce n'est pas le cas pour les notices
             STAR qui elles plantent dès l'import..
             Cependant certaines notices SUDOC ne sont pas éditable
             dans le workflow ce qui empêchera de les compléter et donc
             de les publier.

                 Si je n'arrivais pas à débloquer ton problème avant le
                 retour de Nolwen, est-ce que tu serais bloqué ? En
                 gros, as-tu besoin de modifier les fiches que tu
                 importes ou non ?

             Oui, nous devons les modifier avant de les publier. Par
             exemple la thèse nommée "Quelle formation pour le médecin
             généraliste psychothérapeute de fait" ne s'ouvre pas dans
             l'éditeur à cause des caractères spéciaux en début de titre.

                 Si non, tu peux simplement importer les fiches et les
                 indexer. Effectivement, si tu cherches à les
                 visualiser dans le md-editor, tu auras ces soucis,
                 mais cela te permet tout de même de faire l'import en
                 attendant ?


                 Second point, c'est Nolwen qui est plus à même de
                 répondre à tes interrogations sur le module, donc je
                 vais faire de mon mieux :-(


                 Pour commencer, j'ai pris en exemple la fiche
                 Metz_13738551X.xml

                 1) Les erreurs liées au nom et prénom qui ne doivent
                 pas être vides sont connues. Là on a des choses à                  faire par la suite, mais c'est juste un soucis
                 d'affichage. Il te suffit de cliquer sur le nom et
                 refermer la fenêtre de saisie de la personne pour voir
                 que l'erreur disparait. Nolwen n'avait pas réussi à                  contourner ce problème avant son départ.
                 Lorsque tu as un PPN composé de 9 chiffres comme prévu
                 jusqu'ici dans l'éditeur TEF, le même problème se
                 pose, ouvre et referme la fenêtre de saisie, tu verras
                 que ça marche en fait.

             Ca c'est un pb connu

                 2) Il manque des mots-clefs en français. Ils sont
                 décrits comme obligatoires dans le TEF :
                 http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html


             Ok normal


                 3) Pour le PPN qui comporte 8 chiffres et une lettre ....
                 J'ai essayé de joindre les collègues fonctionnels mais
                 ils ne sont pas joignables pour le moment. Les
                 quelques docs que j'ai trouvées parlent bien de 9
                 chiffres. Tu as une info ou une doc où ils parlent
                 d'une possibilité de caractères autres ?


             Voici un extrait de la doc de l'ABES :
             Zone 001 : Numéro d'identification de la notice
             Zone système protégée, obligatoire, non répétable, sans
             indicateurs et sans sous-zones.
             Le contenu de la zone est générée automatiquement par le
             système lors de la validation d'une nouvelle notice
             Dans le Sudoc, l'identifiant unique de la notice est
             appelé ppn (= Pica production number). Il comporte 9
             caractères :
             8 chiffres (attribués par le système de manière
             séquentielle = numéro d'"ordre" de la notice dans la base
             de données)
             une clé de contrôle sur 1 caractère, qui peut être un
             chiffre ou "X"

                 4) Concernant le fichier maintenant ...
                 Je ne connais pas assez le TEF, mais je sais que le
                 type mime et l'URL du fichier sont à 2 endroits dans
                 le TEF que nous générons.
                 Dans tes fiches, cela n'apparait qu'une fois. Il reste
                 la rubrique suivante qui est vide :
                 <mets:fileSec>
                 <mets:fileGrp USE="archive" ID="FGrID1">
                 <mets:file ID="FID1" MIMETYPE="" ADMID="file_1"
                 USE="maitre">
                 <mets:FLocat LOCTYPE="URL" xlink:href=""/>
                 </mets:file>
                 </mets:fileGrp>
                 </mets:fileSec>
                 D'où l'erreur dans l'IHM ...
                 Si on se réfère à cette doc, on lit "*Seule l'édition
                 d'archivage doit obligatoirement être représentée dans
                 cette section.* Cette présence est facultative pour
                 les autres éditions. ".
                 Dans ton cas, si je prends la fiche
                 Metz_13738551X.xml, on voit bien USE="archive" dans le
                 bloc mets:fileSec. Si je comprends bien, dans ce cas,
                 les métadonnées MIMETYPE et URL sont obligatoires. Ici
                 elles ne sont pas remplies.

             J'ai corrigé mes fichiers en remplissant<mets:fileSec>  et
             je récupe^'re bien l'URL lors de l'import.
             Pour l'anecdote je n'ai pas réussi à importer un fichier
             TEF généré par ORI (pas de chance ???)



                 Je reviens vers toi quand tu auras pu me donner un peu
                 plus d'infos et fait un retour sur ce mail.
                 Je te dirai aussi ce que j'ai eu comme infos pour le PPN.

                 A bientôt,

                 Yohan COLMANT
                 Direction des Systèmes d'Information
                 UVHC<http://www.univ-valenciennes.fr>  - Université de
                 Valenciennes et du Hainaut Cambrésis
                 Coordinateur Technique du projet ORI-OAI
                 <http://www.ori-oai.org>


                 Alain Le Drezen a écrit :

                     Bonjour,

                     Voici quelques problèmes rencontrés lors de
                     l'import de notices de thèses du SUDOC (import en
                     pièce jointe).

                     L'URL du fichier (<dc:identifier
                     xsi:type="dcterms:URI">) ne s'importe pas.

                     La notice de la thèse "Quelle formation pour le
                     médecin généraliste psychothérapeute de fait" ne
                     s'affiche pas dans l'éditeur (page grise vide). Il
                     semble que ce soit lié à la présence de caractères
                     étranges en début du titre. Mais ceci ne devrait
                     pas être bloquant.

                     Dans l'éditeur, l'erreur "Le PPN du mot sujet
                     Rameau doit être composé de neuf chiffres" est
                     erronée. Un PPN peu contenir des caractères.

                     Merci d'avance pour tout élément de réponse.

                     Alain











        
      

    

  






Yohan Colmant
Alain,

J'avais regardé à ce problème vendredi et je ne vois pas comment contourner la chose rapidement côté md-editor.

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI


le drezen alain a écrit :
Concernant le message d'erreur ci dessous, le problème d'import ne se produit plus si on ajoute USE="maitre" à  mets:file

Je ne m'explique pas ce comportement si ce n'est pas un problème lors du chargement du bloc suivant dans  mets:structMap  :

<mets:div TYPE="EDITION" CONTENTIDS="CONTENTIDS.ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE" DMDID="ABES.STAR.THESE_5152.VERSION_COMPLETE.DESCRIPTION.EDITION_ARCHIVAGE">
<mets:fptr FILEID="ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE.FILEGRP" />
</mets:div>

L'attribut USE dans mets:file est facultatif et son absence ne devrait donc pas poser de pb à l'import.



Sinon concernant le deuxième point très gênant relatif à la présence de BOM (Byte Order Mark) dans les notice STAR (merci à Yann Nicolas) est-il possible de corriger ORI pour palier à ce pb ou devons nous tourner vers STAR  ?



Merci d'avance pour tout élément de réponse

Alain





Le 11/09/2010 09:05, Alain Le Drezen a écrit :
Je confirme aussi que ORI n'importe pas le bloc<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_edition">  pour les thèses STAR ce qui explique le message d'erreur décrit par Jean-François :

"Toute EDITION de la thèse doit être associée à des métadonnées de type "tef_desc_edition"."

Nous ne rencontrons pas ce pb sur les TEF-Sudoc que nous importons.

Alain


  
Bonjour,

Un autre problème lié à l'import de STAR (en plus du caractère étrange en début de fichier et de l'erreur signalé par Jean-François dans le workflow) :

  Ori importe :
<mets:FLocat LOCTYPE="URL" xlink:href="\\Sql01\depot_these\Theses\STAR\STOCK\THESE_5162\DepotEdition\khelfaanissa1\khelfaanissa2\Khelfa.Anissa.SMZ0915.pdf"/>

Ce qui fait que nous nous retrouvons avec une belle URL de type :
\\Sql01\depot_these\Theses\STAR\STOCK\THESE_5162\DepotEdition\khelfaanissa1\khelfaanissa2\Khelfa.Anissa.SMZ0915.pdf

L'URL correcte est dans tef:edition :
<dc:identifier xsi:type="dcterms:URI">
ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf
</dc:identifier>
<dc:identifier xsi:type="dcterms:URI">http://STARFileDirectory/khelfaanissa1</dc:identifier>


Bon week-end !

Alain







    
Salut Yann,

Elle est en PJ. Bon week-end !

Jean-François.

Yann Nicolas a écrit :
      
Un exemple de fiche TEF avec cette erreur ?

Yann


----- Mail Original -----
De: "Yohan Colmant"< >
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Vendredi 10 Septembre 2010 15:06:53
Objet: Re: [ori-oai-utilisateurs] Pb import TEF

Salut JF,

Je réponds dans le mail.

Yohan COLMANT
Direction des Systèmes d'Information
UVHC<http://www.univ-valenciennes.fr>  - Université de Valenciennes et
du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI<http://www.ori-oai.org>


Jean-François Lutz a écrit :

     Bonjour Yohan,

     Merci pour ton aide toujours aussi efficace !

     Je me permets de répondre sur les imports de fiches issues de
     STAR. Comme l'indiquait Alain nous ne pouvons pas nous contenter
     de les moissonner car les laboratoires et les écoles doctorales
     ont été saisies dans STAR sans aucune liste ou forme d'autorité,
     d'où un nombre très élevé de doublons (un même labo décrit de 5
     manières différentes par exemples, sachant qu'il y a 82
     laboratoires...). Nous allons donc les importer et utiliser les
     listes d'autorité internes à ORI-OAI.

     1. au niveau de l'import du fichier XML le problème est résolu.
     Les fiches TEF XML produites par STAR comportent les trois
     caractères suivants  avant la première balise de l'entête et
     ils font planter l'import. Il suffit pour l'instant de les
     supprimer. Peut-être la nouvelle version de STAR corrigera-t-elle
     ce bug.

bonne nouvelle :-)


     2. dans le workflow, l'édition se passe sans problème mais au
     niveau de la publication, outre le fait qu'il faut cocher la case
     "fichier maître" ce qui est un détail, un problème persiste sans
     qu'Alain et moi arrivions à déterminer son origine. Le message
     suivant apparaît dans la colonne "Informations" et il empêche de
     publier la fiche : "Toute EDITION de la thèse doit être associée à      des métadonnées de type "tef_desc_edition"." Quelqu'un aurait-il
     une idée de la solution ? Merci par avance.

Tu as l'erreur quand tu essayes de la publier simplement ou quand tu
tentes de l'envoyer à l'ABES ? Et le problème a lieu avec une fiche
importée ou saisie de zéro dans ORI-OAI ?

Si je regarde cette erreur, elle vient du schematron de l'ABES avec
cette règle :

   <pattern name="mets_structMap_meta_Edition"
id="mets_structMap_meta_Edition">
     <rule
context="/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE='EDITION']">
       <assert test="@DMDID =
/mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE='tef_desc_edition']]/@ID">tef_easy.schematron.tef-abes.structMap.meta_Edition.check_rule</assert>
     </rule>
   </pattern>

Donc autrement dit, l'erreur apparait quand
/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE='EDITION']/@DMDID

n'est pas égal à /mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE='tef_desc_edition']]/@ID
dans la fiche TEF.

Est-ce que ça parle à quelqu'un ?


     Bon week-end.

     Jean-François.


     Yohan Colmant a écrit :

         Alain,

         Nous venons d'avoir une réponse de l'ABES pour le PPN et tu
         avais bien raison : "le dernier caractère est un chiffre de
         contrôle, qui peut être soit un numéro soit un X, il n'y a pas
         d'autre caractère alphabétique possible. ".
         Je te propose donc ce correctif (qui sera intégré dans une
         prochaine version).

         Dans
         ori-oai-md-editor\WEB-INF\resources\forms\ori-md-editor\tef-global\form\form.xhtml
         il faut remplacer toutes les occurrences de
         [0-9]{9}
         par
         [0-9]{8}[X0-9]{1}

         Donc pour les fiches du SUDOC, à part les champs qui ne sont
         pas remplis à fond, ceci corrige ton problème ?


         Concernant les fiches qui proviennent de STAR, tu ne m'en
         avais pas parlé ?

         Peux-tu m'en envoyer une d'exemple stp ?
         Quand tu dis que ça plante, c'est au niveau du md-editor ou
         déjà dans le workflow ?

         Merci

         Yohan COLMANT
         Direction des Systèmes d'Information
         UVHC<http://www.univ-valenciennes.fr>  - Université de
         Valenciennes et du Hainaut Cambrésis
         Coordinateur Technique du projet ORI-OAI<http://www.ori-oai.org>


         le drezen alain a écrit :

             Bonjour Yohan,

             Voici les éléments de réponse.

             Le 10/09/2010 10:31, Yohan Colmant a écrit :

                 Salut Alain,

                 Je commence ENFIN à me pencher sur ton problème.

                 En premier lieu, pourquoi importes-tu les fiches dans
                 ton workflow ? Tu ne peux pas les moissonner plutôt ?
                 Comment les as-tu récupérées ?

             Pour le SUDOC pas de moissonnage possible. Pour Star le
             moissonnage serait possible. Mais dans les deux cas nous
             devons modifier les notices ce qui n'est pas possible sur
             une notice moissonnée.

                 LÃ , les erreurs que tu mentionnes apparaissent dans le
                 md-editor, mais pas dans le workflow ? Si tu veux
                 juste importer ces fiches et les publier, rien ne te
                 bloque ?

             En ce qui concerne l'import, en effet pas de problème pour
             les notices SUDOC. Ce n'est pas le cas pour les notices
             STAR qui elles plantent dès l'import..
             Cependant certaines notices SUDOC ne sont pas éditable
             dans le workflow ce qui empêchera de les compléter et donc
             de les publier.

                 Si je n'arrivais pas à débloquer ton problème avant le
                 retour de Nolwen, est-ce que tu serais bloqué ? En
                 gros, as-tu besoin de modifier les fiches que tu
                 importes ou non ?

             Oui, nous devons les modifier avant de les publier. Par
             exemple la thèse nommée "Quelle formation pour le médecin
             généraliste psychothérapeute de fait" ne s'ouvre pas dans
             l'éditeur à cause des caractères spéciaux en début de titre.

                 Si non, tu peux simplement importer les fiches et les
                 indexer. Effectivement, si tu cherches à les
                 visualiser dans le md-editor, tu auras ces soucis,
                 mais cela te permet tout de même de faire l'import en
                 attendant ?


                 Second point, c'est Nolwen qui est plus à même de
                 répondre à tes interrogations sur le module, donc je
                 vais faire de mon mieux :-(


                 Pour commencer, j'ai pris en exemple la fiche
                 Metz_13738551X.xml

                 1) Les erreurs liées au nom et prénom qui ne doivent
                 pas être vides sont connues. Là on a des choses à                  faire par la suite, mais c'est juste un soucis
                 d'affichage. Il te suffit de cliquer sur le nom et
                 refermer la fenêtre de saisie de la personne pour voir
                 que l'erreur disparait. Nolwen n'avait pas réussi à                  contourner ce problème avant son départ.
                 Lorsque tu as un PPN composé de 9 chiffres comme prévu
                 jusqu'ici dans l'éditeur TEF, le même problème se
                 pose, ouvre et referme la fenêtre de saisie, tu verras
                 que ça marche en fait.

             Ca c'est un pb connu

                 2) Il manque des mots-clefs en français. Ils sont
                 décrits comme obligatoires dans le TEF :
                 http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html


             Ok normal


                 3) Pour le PPN qui comporte 8 chiffres et une lettre ....
                 J'ai essayé de joindre les collègues fonctionnels mais
                 ils ne sont pas joignables pour le moment. Les
                 quelques docs que j'ai trouvées parlent bien de 9
                 chiffres. Tu as une info ou une doc où ils parlent
                 d'une possibilité de caractères autres ?


             Voici un extrait de la doc de l'ABES :
             Zone 001 : Numéro d'identification de la notice
             Zone système protégée, obligatoire, non répétable, sans
             indicateurs et sans sous-zones.
             Le contenu de la zone est générée automatiquement par le
             système lors de la validation d'une nouvelle notice
             Dans le Sudoc, l'identifiant unique de la notice est
             appelé ppn (= Pica production number). Il comporte 9
             caractères :
             8 chiffres (attribués par le système de manière
             séquentielle = numéro d'"ordre" de la notice dans la base
             de données)
             une clé de contrôle sur 1 caractère, qui peut être un
             chiffre ou "X"

                 4) Concernant le fichier maintenant ...
                 Je ne connais pas assez le TEF, mais je sais que le
                 type mime et l'URL du fichier sont à 2 endroits dans
                 le TEF que nous générons.
                 Dans tes fiches, cela n'apparait qu'une fois. Il reste
                 la rubrique suivante qui est vide :
                 <mets:fileSec>
                 <mets:fileGrp USE="archive" ID="FGrID1">
                 <mets:file ID="FID1" MIMETYPE="" ADMID="file_1"
                 USE="maitre">
                 <mets:FLocat LOCTYPE="URL" xlink:href=""/>
                 </mets:file>
                 </mets:fileGrp>
                 </mets:fileSec>
                 D'où l'erreur dans l'IHM ...
                 Si on se réfère à cette doc, on lit "*Seule l'édition
                 d'archivage doit obligatoirement être représentée dans
                 cette section.* Cette présence est facultative pour
                 les autres éditions. ".
                 Dans ton cas, si je prends la fiche
                 Metz_13738551X.xml, on voit bien USE="archive" dans le
                 bloc mets:fileSec. Si je comprends bien, dans ce cas,
                 les métadonnées MIMETYPE et URL sont obligatoires. Ici
                 elles ne sont pas remplies.

             J'ai corrigé mes fichiers en remplissant<mets:fileSec>  et
             je récupe^'re bien l'URL lors de l'import.
             Pour l'anecdote je n'ai pas réussi à importer un fichier
             TEF généré par ORI (pas de chance ???)



                 Je reviens vers toi quand tu auras pu me donner un peu
                 plus d'infos et fait un retour sur ce mail.
                 Je te dirai aussi ce que j'ai eu comme infos pour le PPN.

                 A bientôt,

                 Yohan COLMANT
                 Direction des Systèmes d'Information
                 UVHC<http://www.univ-valenciennes.fr>  - Université de
                 Valenciennes et du Hainaut Cambrésis
                 Coordinateur Technique du projet ORI-OAI
                 <http://www.ori-oai.org>


                 Alain Le Drezen a écrit :

                     Bonjour,

                     Voici quelques problèmes rencontrés lors de
                     l'import de notices de thèses du SUDOC (import en
                     pièce jointe).

                     L'URL du fichier (<dc:identifier
                     xsi:type="dcterms:URI">) ne s'importe pas.

                     La notice de la thèse "Quelle formation pour le
                     médecin généraliste psychothérapeute de fait" ne
                     s'affiche pas dans l'éditeur (page grise vide). Il
                     semble que ce soit lié à la présence de caractères
                     étranges en début du titre. Mais ceci ne devrait
                     pas être bloquant.

                     Dans l'éditeur, l'erreur "Le PPN du mot sujet
                     Rameau doit être composé de neuf chiffres" est
                     erronée. Un PPN peu contenir des caractères.

                     Merci d'avance pour tout élément de réponse.

                     Alain











        
      

    

  





ledrezen
Concernant le message d'erreur ci dessous, le problème d'import ne se
produit plus si on ajoute USE="maitre" à mets:file

Je ne m'explique pas ce comportement si ce n'est pas un problème lors du
chargement du bloc suivant dans mets:structMap :

CONTENTIDS="CONTENTIDS.ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE"
DMDID="ABES.STAR.THESE_5152.VERSION_COMPLETE.DESCRIPTION.EDITION_ARCHIVAGE">
FILEID="ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE.FILEGRP" />

L'attribut USE dans mets:file est facultatif et son absence ne devrait
donc pas poser de pb à l'import.

Sinon concernant le deuxième point très gênant relatif à la présence de
BOM (Byte Order Mark) dans les notice STAR (merci à Yann Nicolas) est-il
possible de corriger ORI pour palier à ce pb ou devons nous tourner vers
STAR ?

Merci d'avance pour tout élément de réponse

Alain

Le 11/09/2010 09:05, Alain Le Drezen a écrit :

> Je confirme aussi que ORI n'importe pas le bloc pour les thèses STAR ce qui explique le message d'erreur décrit par Jean-François :
>
> "Toute EDITION de la thèse doit être associée à des métadonnées de type "tef_desc_edition"."
>
> Nous ne rencontrons pas ce pb sur les TEF-Sudoc que nous importons.
>
> Alain
>
>
>

>> Bonjour,
>>
>> Un autre problème lié à l'import de STAR (en plus du caractère étrange en début de fichier et de l'erreur signalé par Jean-François dans le workflow) :
>>
>> Ori importe :
>>
>>
>> Ce qui fait que nous nous retrouvons avec une belle URL de type :
>> \\Sql01\depot_these\Theses\STAR\STOCK\THESE_5162\DepotEdition\khelfaanissa1\khelfaanissa2\Khelfa.Anissa.SMZ0915.pdf
>>
>> L'URL correcte est dans tef:edition :
>>
>> ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf
>>

>> http://STARFileDirectory/khelfaanissa1
>>
>>
>> Bon week-end !
>>
>> Alain
>>
>>
>>
>>
>>
>>
>>
>>

>>> Salut Yann,
>>>
>>> Elle est en PJ. Bon week-end !
>>>
>>> Jean-François.
>>>
>>> Yann Nicolas a écrit :
>>>

>>>> Un exemple de fiche TEF avec cette erreur ?
>>>>
>>>> Yann
>>>>
>>>>
>>>> ----- Mail Original -----
>>>> De: "Yohan Colmant"< >
>>>> À: ori-oai-utilisateurs@listes.univ-rennes1.fr
>>>> Envoyé: Vendredi 10 Septembre 2010 15:06:53
>>>> Objet: Re: [ori-oai-utilisateurs] Pb import TEF
>>>>
>>>> Salut JF,
>>>>
>>>> Je réponds dans le mail.
>>>>
>>>> Yohan COLMANT
>>>> Direction des Systèmes d'Information
>>>> UVHC - Université de Valenciennes et
>>>> du Hainaut Cambrésis
>>>> Coordinateur Technique du projet ORI-OAI
>>>>
>>>>
>>>> Jean-François Lutz a écrit :
>>>>
>>>> Bonjour Yohan,
>>>>
>>>> Merci pour ton aide toujours aussi efficace !
>>>>
>>>> Je me permets de répondre sur les imports de fiches issues de
>>>> STAR. Comme l'indiquait Alain nous ne pouvons pas nous contenter
>>>> de les moissonner car les laboratoires et les écoles doctorales
>>>> ont été saisies dans STAR sans aucune liste ou forme d'autorité,
>>>> d'où un nombre très élevé de doublons (un même labo décrit de 5
>>>> manières différentes par exemples, sachant qu'il y a 82
>>>> laboratoires...). Nous allons donc les importer et utiliser les
>>>> listes d'autorité internes à ORI-OAI.
>>>>
>>>> 1. au niveau de l'import du fichier XML le problème est résolu.
>>>> Les fiches TEF XML produites par STAR comportent les trois
>>>> caractères suivants  avant la première balise de l'entête et
>>>> ils font planter l'import. Il suffit pour l'instant de les
>>>> supprimer. Peut-être la nouvelle version de STAR corrigera-t-elle
>>>> ce bug.
>>>>
>>>> bonne nouvelle :-)
>>>>
>>>>
>>>> 2. dans le workflow, l'édition se passe sans problème mais au
>>>> niveau de la publication, outre le fait qu'il faut cocher la case
>>>> "fichier maître" ce qui est un détail, un problème persiste sans
>>>> qu'Alain et moi arrivions à déterminer son origine. Le message
>>>> suivant apparaît dans la colonne "Informations" et il empêche de
>>>> publier la fiche : "Toute EDITION de la thèse doit être associée Ã
>>>> des métadonnées de type "tef_desc_edition"." Quelqu'un aurait-il
>>>> une idée de la solution ? Merci par avance.
>>>>
>>>> Tu as l'erreur quand tu essayes de la publier simplement ou quand tu
>>>> tentes de l'envoyer à l'ABES ? Et le problème a lieu avec une fiche
>>>> importée ou saisie de zéro dans ORI-OAI ?
>>>>
>>>> Si je regarde cette erreur, elle vient du schematron de l'ABES avec
>>>> cette règle :
>>>>
>>>>
>>>> id="mets_structMap_meta_Edition">
>>>> >>>> context="/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE='EDITION']">
>>>> tef_easy.schematron.tef-abes.structMap.meta_Edition.check_rule
>>>>
>>>>
>>>>
>>>> Donc autrement dit, l'erreur apparait quand
>>>> /mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE='EDITION']/@DMDID
>>>>
>>>> n'est pas égal Ã
>>>> /mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE='tef_desc_edition']]/@ID
>>>> dans la fiche TEF.
>>>>
>>>> Est-ce que ça parle à quelqu'un ?
>>>>
>>>>
>>>> Bon week-end.
>>>>
>>>> Jean-François.
>>>>
>>>>
>>>> Yohan Colmant a écrit :
>>>>
>>>> Alain,
>>>>
>>>> Nous venons d'avoir une réponse de l'ABES pour le PPN et tu
>>>> avais bien raison : "le dernier caractère est un chiffre de
>>>> contrôle, qui peut être soit un numéro soit un X, il n'y a pas
>>>> d'autre caractère alphabétique possible. ".
>>>> Je te propose donc ce correctif (qui sera intégré dans une
>>>> prochaine version).
>>>>
>>>> Dans
>>>> ori-oai-md-editor\WEB-INF\resources\forms\ori-md-editor\tef-global\form\form.xhtml
>>>> il faut remplacer toutes les occurrences de
>>>> [0-9]{9}
>>>> par
>>>> [0-9]{8}[X0-9]{1}
>>>>
>>>> Donc pour les fiches du SUDOC, Ã part les champs qui ne sont
>>>> pas remplis à fond, ceci corrige ton problème ?
>>>>
>>>>
>>>> Concernant les fiches qui proviennent de STAR, tu ne m'en
>>>> avais pas parlé ?
>>>>
>>>> Peux-tu m'en envoyer une d'exemple stp ?
>>>> Quand tu dis que ça plante, c'est au niveau du md-editor ou
>>>> déjà dans le workflow ?
>>>>
>>>> Merci
>>>>
>>>> Yohan COLMANT
>>>> Direction des Systèmes d'Information
>>>> UVHC - Université de
>>>> Valenciennes et du Hainaut Cambrésis
>>>> Coordinateur Technique du projet ORI-OAI
>>>>
>>>>
>>>> le drezen alain a écrit :
>>>>
>>>> Bonjour Yohan,
>>>>
>>>> Voici les éléments de réponse.
>>>>
>>>> Le 10/09/2010 10:31, Yohan Colmant a écrit :
>>>>
>>>> Salut Alain,
>>>>
>>>> Je commence ENFIN à me pencher sur ton problème.
>>>>
>>>> En premier lieu, pourquoi importes-tu les fiches dans
>>>> ton workflow ? Tu ne peux pas les moissonner plutôt ?
>>>> Comment les as-tu récupérées ?
>>>>
>>>> Pour le SUDOC pas de moissonnage possible. Pour Star le
>>>> moissonnage serait possible. Mais dans les deux cas nous
>>>> devons modifier les notices ce qui n'est pas possible sur
>>>> une notice moissonnée.
>>>>
>>>> LÃ , les erreurs que tu mentionnes apparaissent dans le
>>>> md-editor, mais pas dans le workflow ? Si tu veux
>>>> juste importer ces fiches et les publier, rien ne te
>>>> bloque ?
>>>>
>>>> En ce qui concerne l'import, en effet pas de problème pour
>>>> les notices SUDOC. Ce n'est pas le cas pour les notices
>>>> STAR qui elles plantent dès l'import..
>>>> Cependant certaines notices SUDOC ne sont pas éditable
>>>> dans le workflow ce qui empêchera de les compléter et donc
>>>> de les publier.
>>>>
>>>> Si je n'arrivais pas à débloquer ton problème avant le
>>>> retour de Nolwen, est-ce que tu serais bloqué ? En
>>>> gros, as-tu besoin de modifier les fiches que tu
>>>> importes ou non ?
>>>>
>>>> Oui, nous devons les modifier avant de les publier. Par
>>>> exemple la thèse nommée "Quelle formation pour le médecin
>>>> généraliste psychothérapeute de fait" ne s'ouvre pas dans
>>>> l'éditeur à cause des caractères spéciaux en début de titre.
>>>>
>>>> Si non, tu peux simplement importer les fiches et les
>>>> indexer. Effectivement, si tu cherches à les
>>>> visualiser dans le md-editor, tu auras ces soucis,
>>>> mais cela te permet tout de même de faire l'import en
>>>> attendant ?
>>>>
>>>>
>>>> Second point, c'est Nolwen qui est plus à même de
>>>> répondre à tes interrogations sur le module, donc je
>>>> vais faire de mon mieux :-(
>>>>
>>>>
>>>> Pour commencer, j'ai pris en exemple la fiche
>>>> Metz_13738551X.xml
>>>>
>>>> 1) Les erreurs liées au nom et prénom qui ne doivent
>>>> pas être vides sont connues. Là on a des choses Ã
>>>> faire par la suite, mais c'est juste un soucis
>>>> d'affichage. Il te suffit de cliquer sur le nom et
>>>> refermer la fenêtre de saisie de la personne pour voir
>>>> que l'erreur disparait. Nolwen n'avait pas réussi Ã
>>>> contourner ce problème avant son départ.
>>>> Lorsque tu as un PPN composé de 9 chiffres comme prévu
>>>> jusqu'ici dans l'éditeur TEF, le même problème se
>>>> pose, ouvre et referme la fenêtre de saisie, tu verras
>>>> que ça marche en fait.
>>>>
>>>> Ca c'est un pb connu
>>>>
>>>> 2) Il manque des mots-clefs en français. Ils sont
>>>> décrits comme obligatoires dans le TEF :
>>>> http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html
>>>>
>>>>
>>>> Ok normal
>>>>
>>>>
>>>> 3) Pour le PPN qui comporte 8 chiffres et une lettre ....
>>>> J'ai essayé de joindre les collègues fonctionnels mais
>>>> ils ne sont pas joignables pour le moment. Les
>>>> quelques docs que j'ai trouvées parlent bien de 9
>>>> chiffres. Tu as une info ou une doc où ils parlent
>>>> d'une possibilité de caractères autres ?
>>>>
>>>>
>>>> Voici un extrait de la doc de l'ABES :
>>>> Zone 001 : Numéro d'identification de la notice
>>>> Zone système protégée, obligatoire, non répétable, sans
>>>> indicateurs et sans sous-zones.
>>>> Le contenu de la zone est générée automatiquement par le
>>>> système lors de la validation d'une nouvelle notice
>>>> Dans le Sudoc, l'identifiant unique de la notice est
>>>> appelé ppn (= Pica production number). Il comporte 9
>>>> caractères :
>>>> 8 chiffres (attribués par le système de manière
>>>> séquentielle = numéro d'"ordre" de la notice dans la base
>>>> de données)
>>>> une clé de contrôle sur 1 caractère, qui peut être un
>>>> chiffre ou "X"
>>>>
>>>> 4) Concernant le fichier maintenant ...
>>>> Je ne connais pas assez le TEF, mais je sais que le
>>>> type mime et l'URL du fichier sont à 2 endroits dans
>>>> le TEF que nous générons.
>>>> Dans tes fiches, cela n'apparait qu'une fois. Il reste
>>>> la rubrique suivante qui est vide :
>>>>
>>>>
>>>> >>>> USE="maitre">
>>>>
>>>>

>>>>

>>>>

>>>> D'où l'erreur dans l'IHM ...
>>>> Si on se réfère à cette doc, on lit "*Seule l'édition
>>>> d'archivage doit obligatoirement être représentée dans
>>>> cette section.* Cette présence est facultative pour
>>>> les autres éditions. ".
>>>> Dans ton cas, si je prends la fiche
>>>> Metz_13738551X.xml, on voit bien USE="archive" dans le
>>>> bloc mets:fileSec. Si je comprends bien, dans ce cas,
>>>> les métadonnées MIMETYPE et URL sont obligatoires. Ici
>>>> elles ne sont pas remplies.
>>>>
>>>> J'ai corrigé mes fichiers en remplissant et
>>>> je récupe^'re bien l'URL lors de l'import.
>>>> Pour l'anecdote je n'ai pas réussi à importer un fichier
>>>> TEF généré par ORI (pas de chance ???)
>>>>
>>>>
>>>>
>>>> Je reviens vers toi quand tu auras pu me donner un peu
>>>> plus d'infos et fait un retour sur ce mail.
>>>> Je te dirai aussi ce que j'ai eu comme infos pour le PPN.
>>>>
>>>> A bientôt,
>>>>
>>>> Yohan COLMANT
>>>> Direction des Systèmes d'Information
>>>> UVHC - Université de
>>>> Valenciennes et du Hainaut Cambrésis
>>>> Coordinateur Technique du projet ORI-OAI
>>>>
>>>>
>>>>
>>>> Alain Le Drezen a écrit :
>>>>
>>>> Bonjour,
>>>>
>>>> Voici quelques problèmes rencontrés lors de
>>>> l'import de notices de thèses du SUDOC (import en
>>>> pièce jointe).
>>>>
>>>> L'URL du fichier ( >>>> xsi:type="dcterms:URI">) ne s'importe pas.
>>>>
>>>> La notice de la thèse "Quelle formation pour le
>>>> médecin généraliste psychothérapeute de fait" ne
>>>> s'affiche pas dans l'éditeur (page grise vide). Il
>>>> semble que ce soit lié à la présence de caractères
>>>> étranges en début du titre. Mais ceci ne devrait
>>>> pas être bloquant.
>>>>
>>>> Dans l'éditeur, l'erreur "Le PPN du mot sujet
>>>> Rameau doit être composé de neuf chiffres" est
>>>> erronée. Un PPN peu contenir des caractères.
>>>>
>>>> Merci d'avance pour tout élément de réponse.
>>>>
>>>> Alain
>>>>
>>>>
>>>>
>>>>
>>>>
>>>>
>>>>
>>>>
>>>>
>>>>
>>>>
>>>>

>>>

>>
>>

>
>

ledrezen
Oui, voici des liens :

http://193.52.26.83/STAR_STOCK_THESES/THESE_5191/ABES/TEF/These_Bilan_Bo...
http://193.52.26.83/STAR_STOCK_THESES/THESE_5152/ABES/TEF/These_Bilan_Bo...
http://193.52.26.83/STAR_STOCK_THESES/THESE_5147/ABES/TEF/These_Bilan_Bo...

> Salut Alain,
>
> Peux-tu nous donner une fiche d'exemple, qui, une fois importée et
> enregistrée dans le md-editor perd le bloc tef_desc_version stp ?
>
> Merci,
> Yohan COLMANT
> Direction des Systèmes d'Information
> UVHC - Université de Valenciennes et du Hainaut Cambrésis
> Coordinateur Technique du projet ORI-OAI
>
>
> le drezen alain a écrit :

> > Bonjour ,
> >
> >
> > Voici un petit complément d'info.
> > C'est en fait le md_editor qui supprime le bloc de "tef_desc_version"
> > dans les thèses de STAR. Si on valide une fiche dans le workflow sans
> > l'ouvrir dans le md_editor , ça passe.
> > J'essaie désespérément de trouver la raison en comparant les notice
> > STAR problématiques et d'autre notices , mais je ne voie rien de
> > particulier .
> >
> > Alain
> >
> >
> >
> >
> >
> > Le 13/09/2010 11:50, Yohan Colmant a écrit :

> >> Alain,
> >>
> >> J'avais regardé à ce problème vendredi et je ne vois pas comment
> >> contourner la chose rapidement côté md-editor.
> >>
> >> Yohan COLMANT
> >> Direction des Systèmes d'Information
> >> UVHC - Université de Valenciennes
> >> et du Hainaut Cambrésis
> >> Coordinateur Technique du projet ORI-OAI
> >>
> >>
> >> le drezen alain a écrit :

> >>> Concernant le message d'erreur ci dessous, le problème d'import ne
> >>> se produit plus si on ajoute USE="maitre" à mets:file
> >>>
> >>> Je ne m'explique pas ce comportement si ce n'est pas un problème
> >>> lors du chargement du bloc suivant dans mets:structMap :
> >>>
> >>> > >>> CONTENTIDS="CONTENTIDS.ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE"
> >>> DMDID="ABES.STAR.THESE_5152.VERSION_COMPLETE.DESCRIPTION.EDITION_ARCHIVAGE">
> >>>
> >>> > >>> FILEID="ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE.FILEGRP"
> >>> />
> >>>

> >>>
> >>> L'attribut USE dans mets:file est facultatif et son absence ne
> >>> devrait donc pas poser de pb à l'import.
> >>>
> >>>
> >>>
> >>> Sinon concernant le deuxième point très gênant relatif à la présence
> >>> de BOM (Byte Order Mark) dans les notice STAR (merci à Yann Nicolas)
> >>> est-il possible de corriger ORI pour palier à ce pb ou devons nous
> >>> tourner vers STAR ?
> >>>
> >>>
> >>>
> >>> Merci d'avance pour tout élément de réponse
> >>>
> >>> Alain
> >>>
> >>>
> >>>
> >>>
> >>>
> >>> Le 11/09/2010 09:05, Alain Le Drezen a écrit :

> >>>> Je confirme aussi que ORI n'importe pas le bloc > >>>> MDTYPE="OTHER" OTHERMDTYPE="tef_desc_edition"> pour les thèses
> >>>> STAR ce qui explique le message d'erreur décrit par Jean-François :
> >>>>
> >>>> "Toute EDITION de la thèse doit être associée à des métadonnées de
> >>>> type "tef_desc_edition"."
> >>>>
> >>>> Nous ne rencontrons pas ce pb sur les TEF-Sudoc que nous importons.
> >>>>
> >>>> Alain
> >>>>
> >>>>
> >>>>

> >>>>> Bonjour,
> >>>>>
> >>>>> Un autre problème lié à l'import de STAR (en plus du caractère
> >>>>> étrange en début de fichier et de l'erreur signalé par
> >>>>> Jean-François dans le workflow) :
> >>>>>
> >>>>> Ori importe :
> >>>>> > >>>>> xlink:href="\\Sql01\depot_these\Theses\STAR\STOCK\THESE_5162\DepotEdition\khelfaanissa1\khelfaanissa2\Khelfa.Anissa.SMZ0915.pdf"/>
> >>>>>
> >>>>>
> >>>>> Ce qui fait que nous nous retrouvons avec une belle URL de type :
> >>>>> \\Sql01\depot_these\Theses\STAR\STOCK\THESE_5162\DepotEdition\khelfaanissa1\khelfaanissa2\Khelfa.Anissa.SMZ0915.pdf
> >>>>>
> >>>>>
> >>>>> L'URL correcte est dans tef:edition :
> >>>>>
> >>>>> ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf
> >>>>>

> >>>>> > >>>>> xsi:type="dcterms:URI">http://STARFileDirectory/khelfaanissa1
> >>>>>
> >>>>>
> >>>>>
> >>>>> Bon week-end !
> >>>>>
> >>>>> Alain
> >>>>>
> >>>>>
> >>>>>
> >>>>>
> >>>>>
> >>>>>
> >>>>>
> >>>>>

> >>>>>> Salut Yann,
> >>>>>>
> >>>>>> Elle est en PJ. Bon week-end !
> >>>>>>
> >>>>>> Jean-François.
> >>>>>>
> >>>>>> Yann Nicolas a écrit :
> >>>>>>

> >>>>>>> Un exemple de fiche TEF avec cette erreur ?
> >>>>>>>
> >>>>>>> Yann
> >>>>>>>
> >>>>>>>
> >>>>>>> ----- Mail Original -----
> >>>>>>> De: "Yohan Colmant"< >
> >>>>>>> À: ori-oai-utilisateurs@listes.univ-rennes1.fr
> >>>>>>> Envoyé: Vendredi 10 Septembre 2010 15:06:53
> >>>>>>> Objet: Re: [ori-oai-utilisateurs] Pb import TEF
> >>>>>>>
> >>>>>>> Salut JF,
> >>>>>>>
> >>>>>>> Je réponds dans le mail.
> >>>>>>>
> >>>>>>> Yohan COLMANT
> >>>>>>> Direction des Systèmes d'Information
> >>>>>>> UVHC - Université de
> >>>>>>> Valenciennes et
> >>>>>>> du Hainaut Cambrésis
> >>>>>>> Coordinateur Technique du projet ORI-OAI
> >>>>>>>
> >>>>>>>
> >>>>>>> Jean-François Lutz a écrit :
> >>>>>>>
> >>>>>>> Bonjour Yohan,
> >>>>>>>
> >>>>>>> Merci pour ton aide toujours aussi efficace !
> >>>>>>>
> >>>>>>> Je me permets de répondre sur les imports de fiches issues de
> >>>>>>> STAR. Comme l'indiquait Alain nous ne pouvons pas nous
> >>>>>>> contenter
> >>>>>>> de les moissonner car les laboratoires et les écoles
> >>>>>>> doctorales
> >>>>>>> ont été saisies dans STAR sans aucune liste ou forme
> >>>>>>> d'autorité,
> >>>>>>> d'où un nombre très élevé de doublons (un même labo
> >>>>>>> décrit de 5
> >>>>>>> manières différentes par exemples, sachant qu'il y a 82
> >>>>>>> laboratoires...). Nous allons donc les importer et utiliser
> >>>>>>> les
> >>>>>>> listes d'autorité internes à ORI-OAI.
> >>>>>>>
> >>>>>>> 1. au niveau de l'import du fichier XML le problème est
> >>>>>>> résolu.
> >>>>>>> Les fiches TEF XML produites par STAR comportent les trois
> >>>>>>> caractères suivants  avant la première balise de
> >>>>>>> l'entête et
> >>>>>>> ils font planter l'import. Il suffit pour l'instant de les
> >>>>>>> supprimer. Peut-être la nouvelle version de STAR
> >>>>>>> corrigera-t-elle
> >>>>>>> ce bug.
> >>>>>>>
> >>>>>>> bonne nouvelle :-)
> >>>>>>>
> >>>>>>>
> >>>>>>> 2. dans le workflow, l'édition se passe sans problème
> >>>>>>> mais au
> >>>>>>> niveau de la publication, outre le fait qu'il faut cocher
> >>>>>>> la case
> >>>>>>> "fichier maître" ce qui est un détail, un problème
> >>>>>>> persiste sans
> >>>>>>> qu'Alain et moi arrivions à déterminer son origine. Le
> >>>>>>> message
> >>>>>>> suivant apparaît dans la colonne "Informations" et il
> >>>>>>> empêche de
> >>>>>>> publier la fiche : "Toute EDITION de la thèse doit être
> >>>>>>> associée à des métadonnées de type "tef_desc_edition"."
> >>>>>>> Quelqu'un aurait-il
> >>>>>>> une idée de la solution ? Merci par avance.
> >>>>>>>
> >>>>>>> Tu as l'erreur quand tu essayes de la publier simplement ou
> >>>>>>> quand tu
> >>>>>>> tentes de l'envoyer à l'ABES ? Et le problème a lieu avec une
> >>>>>>> fiche
> >>>>>>> importée ou saisie de zéro dans ORI-OAI ?
> >>>>>>>
> >>>>>>> Si je regarde cette erreur, elle vient du schematron de l'ABES avec
> >>>>>>> cette règle :
> >>>>>>>
> >>>>>>>
> >>>>>>> id="mets_structMap_meta_Edition">
> >>>>>>> > >>>>>>> context="/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE='EDITION']">
> >>>>>>>
> >>>>>>> tef_easy.schematron.tef-abes.structMap.meta_Edition.check_rule
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>> Donc autrement dit, l'erreur apparait quand
> >>>>>>> /mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE='EDITION']/@DMDID
> >>>>>>>
> >>>>>>>
> >>>>>>> n'est pas égal Ã
> >>>>>>> /mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE='tef_desc_edition']]/@ID
> >>>>>>>
> >>>>>>> dans la fiche TEF.
> >>>>>>>
> >>>>>>> Est-ce que ça parle à quelqu'un ?
> >>>>>>>
> >>>>>>>
> >>>>>>> Bon week-end.
> >>>>>>>
> >>>>>>> Jean-François.
> >>>>>>>
> >>>>>>>
> >>>>>>> Yohan Colmant a écrit :
> >>>>>>>
> >>>>>>> Alain,
> >>>>>>>
> >>>>>>> Nous venons d'avoir une réponse de l'ABES pour le PPN
> >>>>>>> et tu
> >>>>>>> avais bien raison : "le dernier caractère est un
> >>>>>>> chiffre de
> >>>>>>> contrôle, qui peut être soit un numéro soit un X, il
> >>>>>>> n'y a pas
> >>>>>>> d'autre caractère alphabétique possible. ".
> >>>>>>> Je te propose donc ce correctif (qui sera intégré
> >>>>>>> dans une
> >>>>>>> prochaine version).
> >>>>>>>
> >>>>>>> Dans
> >>>>>>>
> >>>>>>> ori-oai-md-editor\WEB-INF\resources\forms\ori-md-editor\tef-global\form\form.xhtml
> >>>>>>>
> >>>>>>> il faut remplacer toutes les occurrences de
> >>>>>>> [0-9]{9}
> >>>>>>> par
> >>>>>>> [0-9]{8}[X0-9]{1}
> >>>>>>>
> >>>>>>> Donc pour les fiches du SUDOC, Ã part les champs qui
> >>>>>>> ne sont
> >>>>>>> pas remplis à fond, ceci corrige ton problème ?
> >>>>>>>
> >>>>>>>
> >>>>>>> Concernant les fiches qui proviennent de STAR, tu ne m'en
> >>>>>>> avais pas parlé ?
> >>>>>>>
> >>>>>>> Peux-tu m'en envoyer une d'exemple stp ?
> >>>>>>> Quand tu dis que ça plante, c'est au niveau du
> >>>>>>> md-editor ou
> >>>>>>> déjà dans le workflow ?
> >>>>>>>
> >>>>>>> Merci
> >>>>>>>
> >>>>>>> Yohan COLMANT
> >>>>>>> Direction des Systèmes d'Information
> >>>>>>> UVHC - Université de
> >>>>>>> Valenciennes et du Hainaut Cambrésis
> >>>>>>> Coordinateur Technique du projet
> >>>>>>> ORI-OAI
> >>>>>>>
> >>>>>>>
> >>>>>>> le drezen alain a écrit :
> >>>>>>>
> >>>>>>> Bonjour Yohan,
> >>>>>>>
> >>>>>>> Voici les éléments de réponse.
> >>>>>>>
> >>>>>>> Le 10/09/2010 10:31, Yohan Colmant a écrit :
> >>>>>>>
> >>>>>>> Salut Alain,
> >>>>>>>
> >>>>>>> Je commence ENFIN à me pencher sur ton problème.
> >>>>>>>
> >>>>>>> En premier lieu, pourquoi importes-tu les
> >>>>>>> fiches dans
> >>>>>>> ton workflow ? Tu ne peux pas les moissonner
> >>>>>>> plutôt ?
> >>>>>>> Comment les as-tu récupérées ?
> >>>>>>>
> >>>>>>> Pour le SUDOC pas de moissonnage possible. Pour
> >>>>>>> Star le
> >>>>>>> moissonnage serait possible. Mais dans les deux cas
> >>>>>>> nous
> >>>>>>> devons modifier les notices ce qui n'est pas
> >>>>>>> possible sur
> >>>>>>> une notice moissonnée.
> >>>>>>>
> >>>>>>> LÃ , les erreurs que tu mentionnes apparaissent
> >>>>>>> dans le
> >>>>>>> md-editor, mais pas dans le workflow ? Si tu veux
> >>>>>>> juste importer ces fiches et les publier, rien
> >>>>>>> ne te
> >>>>>>> bloque ?
> >>>>>>>
> >>>>>>> En ce qui concerne l'import, en effet pas de
> >>>>>>> problème pour
> >>>>>>> les notices SUDOC. Ce n'est pas le cas pour les
> >>>>>>> notices
> >>>>>>> STAR qui elles plantent dès l'import..
> >>>>>>> Cependant certaines notices SUDOC ne sont pas
> >>>>>>> éditable
> >>>>>>> dans le workflow ce qui empêchera de les
> >>>>>>> compléter et donc
> >>>>>>> de les publier.
> >>>>>>>
> >>>>>>> Si je n'arrivais pas à débloquer ton
> >>>>>>> problème avant le
> >>>>>>> retour de Nolwen, est-ce que tu serais bloqué
> >>>>>>> ? En
> >>>>>>> gros, as-tu besoin de modifier les fiches que tu
> >>>>>>> importes ou non ?
> >>>>>>>
> >>>>>>> Oui, nous devons les modifier avant de les publier.
> >>>>>>> Par
> >>>>>>> exemple la thèse nommée "Quelle formation pour le
> >>>>>>> médecin
> >>>>>>> généraliste psychothérapeute de fait" ne s'ouvre
> >>>>>>> pas dans
> >>>>>>> l'éditeur à cause des caractères spéciaux en
> >>>>>>> début de titre.
> >>>>>>>
> >>>>>>> Si non, tu peux simplement importer les fiches
> >>>>>>> et les
> >>>>>>> indexer. Effectivement, si tu cherches à les
> >>>>>>> visualiser dans le md-editor, tu auras ces soucis,
> >>>>>>> mais cela te permet tout de même de faire
> >>>>>>> l'import en
> >>>>>>> attendant ?
> >>>>>>>
> >>>>>>>
> >>>>>>> Second point, c'est Nolwen qui est plus Ã
> >>>>>>> même de
> >>>>>>> répondre à tes interrogations sur le module,
> >>>>>>> donc je
> >>>>>>> vais faire de mon mieux :-(
> >>>>>>>
> >>>>>>>
> >>>>>>> Pour commencer, j'ai pris en exemple la fiche
> >>>>>>> Metz_13738551X.xml
> >>>>>>>
> >>>>>>> 1) Les erreurs liées au nom et prénom qui ne
> >>>>>>> doivent
> >>>>>>> pas être vides sont connues. Là on a des
> >>>>>>> choses à faire par la suite, mais c'est juste
> >>>>>>> un soucis
> >>>>>>> d'affichage. Il te suffit de cliquer sur le nom et
> >>>>>>> refermer la fenêtre de saisie de la personne
> >>>>>>> pour voir
> >>>>>>> que l'erreur disparait. Nolwen n'avait pas
> >>>>>>> réussi à contourner ce problème avant son
> >>>>>>> départ.
> >>>>>>> Lorsque tu as un PPN composé de 9 chiffres
> >>>>>>> comme prévu
> >>>>>>> jusqu'ici dans l'éditeur TEF, le même
> >>>>>>> problème se
> >>>>>>> pose, ouvre et referme la fenêtre de saisie,
> >>>>>>> tu verras
> >>>>>>> que ça marche en fait.
> >>>>>>>
> >>>>>>> Ca c'est un pb connu
> >>>>>>>
> >>>>>>> 2) Il manque des mots-clefs en français. Ils sont
> >>>>>>> décrits comme obligatoires dans le TEF :
> >>>>>>>
> >>>>>>> http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>> Ok normal
> >>>>>>>
> >>>>>>>
> >>>>>>> 3) Pour le PPN qui comporte 8 chiffres et une
> >>>>>>> lettre ....
> >>>>>>> J'ai essayé de joindre les collègues
> >>>>>>> fonctionnels mais
> >>>>>>> ils ne sont pas joignables pour le moment. Les
> >>>>>>> quelques docs que j'ai trouvées parlent bien de 9
> >>>>>>> chiffres. Tu as une info ou une doc où ils
> >>>>>>> parlent
> >>>>>>> d'une possibilité de caractères autres ?
> >>>>>>>
> >>>>>>>
> >>>>>>> Voici un extrait de la doc de l'ABES :
> >>>>>>> Zone 001 : Numéro d'identification de la notice
> >>>>>>> Zone système protégée, obligatoire, non
> >>>>>>> répétable, sans
> >>>>>>> indicateurs et sans sous-zones.
> >>>>>>> Le contenu de la zone est générée
> >>>>>>> automatiquement par le
> >>>>>>> système lors de la validation d'une nouvelle notice
> >>>>>>> Dans le Sudoc, l'identifiant unique de la notice est
> >>>>>>> appelé ppn (= Pica production number). Il comporte 9
> >>>>>>> caractères :
> >>>>>>> 8 chiffres (attribués par le système de manière
> >>>>>>> séquentielle = numéro d'"ordre" de la notice dans
> >>>>>>> la base
> >>>>>>> de données)
> >>>>>>> une clé de contrôle sur 1 caractère, qui peut
> >>>>>>> être un
> >>>>>>> chiffre ou "X"
> >>>>>>>
> >>>>>>> 4) Concernant le fichier maintenant ...
> >>>>>>> Je ne connais pas assez le TEF, mais je sais
> >>>>>>> que le
> >>>>>>> type mime et l'URL du fichier sont à 2
> >>>>>>> endroits dans
> >>>>>>> le TEF que nous générons.
> >>>>>>> Dans tes fiches, cela n'apparait qu'une fois.
> >>>>>>> Il reste
> >>>>>>> la rubrique suivante qui est vide :
> >>>>>>>
> >>>>>>>
> >>>>>>> > >>>>>>> USE="maitre">
> >>>>>>>
> >>>>>>>

> >>>>>>>

> >>>>>>>

> >>>>>>> D'où l'erreur dans l'IHM ...
> >>>>>>> Si on se réfère à cette doc, on lit "*Seule
> >>>>>>> l'édition
> >>>>>>> d'archivage doit obligatoirement être
> >>>>>>> représentée dans
> >>>>>>> cette section.* Cette présence est facultative
> >>>>>>> pour
> >>>>>>> les autres éditions. ".
> >>>>>>> Dans ton cas, si je prends la fiche
> >>>>>>> Metz_13738551X.xml, on voit bien USE="archive"
> >>>>>>> dans le
> >>>>>>> bloc mets:fileSec. Si je comprends bien, dans
> >>>>>>> ce cas,
> >>>>>>> les métadonnées MIMETYPE et URL sont
> >>>>>>> obligatoires. Ici
> >>>>>>> elles ne sont pas remplies.
> >>>>>>>
> >>>>>>> J'ai corrigé mes fichiers en
> >>>>>>> remplissant et
> >>>>>>> je récupe^'re bien l'URL lors de l'import.
> >>>>>>> Pour l'anecdote je n'ai pas réussi à importer un
> >>>>>>> fichier
> >>>>>>> TEF généré par ORI (pas de chance ???)
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>> Je reviens vers toi quand tu auras pu me donner
> >>>>>>> un peu
> >>>>>>> plus d'infos et fait un retour sur ce mail.
> >>>>>>> Je te dirai aussi ce que j'ai eu comme infos
> >>>>>>> pour le PPN.
> >>>>>>>
> >>>>>>> A bientôt,
> >>>>>>>
> >>>>>>> Yohan COLMANT
> >>>>>>> Direction des Systèmes d'Information
> >>>>>>> UVHC -
> >>>>>>> Université de
> >>>>>>> Valenciennes et du Hainaut Cambrésis
> >>>>>>> Coordinateur Technique du projet ORI-OAI
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>> Alain Le Drezen a écrit :
> >>>>>>>
> >>>>>>> Bonjour,
> >>>>>>>
> >>>>>>> Voici quelques problèmes rencontrés lors de
> >>>>>>> l'import de notices de thèses du SUDOC
> >>>>>>> (import en
> >>>>>>> pièce jointe).
> >>>>>>>
> >>>>>>> L'URL du fichier ( > >>>>>>> xsi:type="dcterms:URI">) ne s'importe pas.
> >>>>>>>
> >>>>>>> La notice de la thèse "Quelle formation
> >>>>>>> pour le
> >>>>>>> médecin généraliste psychothérapeute de
> >>>>>>> fait" ne
> >>>>>>> s'affiche pas dans l'éditeur (page grise
> >>>>>>> vide). Il
> >>>>>>> semble que ce soit lié à la présence de
> >>>>>>> caractères
> >>>>>>> étranges en début du titre. Mais ceci ne
> >>>>>>> devrait
> >>>>>>> pas être bloquant.
> >>>>>>>
> >>>>>>> Dans l'éditeur, l'erreur "Le PPN du mot sujet
> >>>>>>> Rameau doit être composé de neuf
> >>>>>>> chiffres" est
> >>>>>>> erronée. Un PPN peu contenir des caractères.
> >>>>>>>
> >>>>>>> Merci d'avance pour tout élément de
> >>>>>>> réponse.
> >>>>>>>
> >>>>>>> Alain
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>
> >>>>>>>

> >>>>>>

> >>>>>
> >>>>>

> >>>>
> >>>>

> >>>
> >>>
> >>>
> >>>
> >>>

> >

>
>

Yohan Colmant
Salut Alain,

Peux-tu nous donner une fiche d'exemple, qui, une fois importée et enregistrée dans le md-editor perd le bloc tef_desc_version stp ?

Merci,
Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI


le drezen alain a écrit :
Bonjour ,


Voici un petit complément d'info.
C'est en fait le md_editor qui supprime le bloc de "tef_desc_version" dans les thèses de STAR. Si on valide une fiche dans le workflow sans l'ouvrir dans le md_editor , ça passe.
J'essaie désespérément de trouver la raison en comparant les notice STAR problématiques et d'autre notices , mais je ne voie rien de particulier .

Alain





Le 13/09/2010 11:50, Yohan Colmant a écrit :
Alain,

J'avais regardé à ce problème vendredi et je ne vois pas comment contourner la chose rapidement côté md-editor.

Yohan COLMANT
Direction des Systèmes d'Information
UVHC - Université de Valenciennes et du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI


le drezen alain a écrit :
Concernant le message d'erreur ci dessous, le problème d'import ne se produit plus si on ajoute USE="maitre" à  mets:file

Je ne m'explique pas ce comportement si ce n'est pas un problème lors du chargement du bloc suivant dans  mets:structMap  :

<mets:div TYPE="EDITION" CONTENTIDS="CONTENTIDS.ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE" DMDID="ABES.STAR.THESE_5152.VERSION_COMPLETE.DESCRIPTION.EDITION_ARCHIVAGE">
<mets:fptr FILEID="ABES.STAR.THESE_5152.VERSION_COMPLETE.EDITION_ARCHIVAGE.FILEGRP" />
</mets:div>

L'attribut USE dans mets:file est facultatif et son absence ne devrait donc pas poser de pb à l'import.



Sinon concernant le deuxième point très gênant relatif à la présence de BOM (Byte Order Mark) dans les notice STAR (merci à Yann Nicolas) est-il possible de corriger ORI pour palier à ce pb ou devons nous tourner vers STAR  ?



Merci d'avance pour tout élément de réponse

Alain





Le 11/09/2010 09:05, Alain Le Drezen a écrit :
Je confirme aussi que ORI n'importe pas le bloc<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="tef_desc_edition">  pour les thèses STAR ce qui explique le message d'erreur décrit par Jean-François :

"Toute EDITION de la thèse doit être associée à des métadonnées de type "tef_desc_edition"."

Nous ne rencontrons pas ce pb sur les TEF-Sudoc que nous importons.

Alain


  
Bonjour,

Un autre problème lié à l'import de STAR (en plus du caractère étrange en début de fichier et de l'erreur signalé par Jean-François dans le workflow) :

  Ori importe :
<mets:FLocat LOCTYPE="URL" xlink:href="\\Sql01\depot_these\Theses\STAR\STOCK\THESE_5162\DepotEdition\khelfaanissa1\khelfaanissa2\Khelfa.Anissa.SMZ0915.pdf"/>

Ce qui fait que nous nous retrouvons avec une belle URL de type :
\\Sql01\depot_these\Theses\STAR\STOCK\THESE_5162\DepotEdition\khelfaanissa1\khelfaanissa2\Khelfa.Anissa.SMZ0915.pdf

L'URL correcte est dans tef:edition :
<dc:identifier xsi:type="dcterms:URI">
ftp://ftp.scd.univ-metz.fr/pub/Theses/2009/Khelfa.Anissa.SMZ0915.pdf
</dc:identifier>
<dc:identifier xsi:type="dcterms:URI">http://STARFileDirectory/khelfaanissa1</dc:identifier>


Bon week-end !

Alain







    
Salut Yann,

Elle est en PJ. Bon week-end !

Jean-François.

Yann Nicolas a écrit :
      
Un exemple de fiche TEF avec cette erreur ?

Yann


----- Mail Original -----
De: "Yohan Colmant"< >
À: ori-oai-utilisateurs@listes.univ-rennes1.fr
Envoyé: Vendredi 10 Septembre 2010 15:06:53
Objet: Re: [ori-oai-utilisateurs] Pb import TEF

Salut JF,

Je réponds dans le mail.

Yohan COLMANT
Direction des Systèmes d'Information
UVHC<http://www.univ-valenciennes.fr>  - Université de Valenciennes et
du Hainaut Cambrésis
Coordinateur Technique du projet ORI-OAI<http://www.ori-oai.org>


Jean-François Lutz a écrit :

     Bonjour Yohan,

     Merci pour ton aide toujours aussi efficace !

     Je me permets de répondre sur les imports de fiches issues de
     STAR. Comme l'indiquait Alain nous ne pouvons pas nous contenter
     de les moissonner car les laboratoires et les écoles doctorales
     ont été saisies dans STAR sans aucune liste ou forme d'autorité,
     d'où un nombre très élevé de doublons (un même labo décrit de 5
     manières différentes par exemples, sachant qu'il y a 82
     laboratoires...). Nous allons donc les importer et utiliser les
     listes d'autorité internes à ORI-OAI.

     1. au niveau de l'import du fichier XML le problème est résolu.
     Les fiches TEF XML produites par STAR comportent les trois
     caractères suivants  avant la première balise de l'entête et
     ils font planter l'import. Il suffit pour l'instant de les
     supprimer. Peut-être la nouvelle version de STAR corrigera-t-elle
     ce bug.

bonne nouvelle :-)


     2. dans le workflow, l'édition se passe sans problème mais au
     niveau de la publication, outre le fait qu'il faut cocher la case
     "fichier maître" ce qui est un détail, un problème persiste sans
     qu'Alain et moi arrivions à déterminer son origine. Le message
     suivant apparaît dans la colonne "Informations" et il empêche de
     publier la fiche : "Toute EDITION de la thèse doit être associée à      des métadonnées de type "tef_desc_edition"." Quelqu'un aurait-il
     une idée de la solution ? Merci par avance.

Tu as l'erreur quand tu essayes de la publier simplement ou quand tu
tentes de l'envoyer à l'ABES ? Et le problème a lieu avec une fiche
importée ou saisie de zéro dans ORI-OAI ?

Si je regarde cette erreur, elle vient du schematron de l'ABES avec
cette règle :

   <pattern name="mets_structMap_meta_Edition"
id="mets_structMap_meta_Edition">
     <rule
context="/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE='EDITION']">
       <assert test="@DMDID =
/mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE='tef_desc_edition']]/@ID">tef_easy.schematron.tef-abes.structMap.meta_Edition.check_rule</assert>
     </rule>
   </pattern>

Donc autrement dit, l'erreur apparait quand
/mets:mets/mets:structMap/mets:div/mets:div/mets:div[@TYPE='EDITION']/@DMDID

n'est pas égal à /mets:mets/mets:dmdSec[mets:mdWrap[@OTHERMDTYPE='tef_desc_edition']]/@ID
dans la fiche TEF.

Est-ce que ça parle à quelqu'un ?


     Bon week-end.

     Jean-François.


     Yohan Colmant a écrit :

         Alain,

         Nous venons d'avoir une réponse de l'ABES pour le PPN et tu
         avais bien raison : "le dernier caractère est un chiffre de
         contrôle, qui peut être soit un numéro soit un X, il n'y a pas
         d'autre caractère alphabétique possible. ".
         Je te propose donc ce correctif (qui sera intégré dans une
         prochaine version).

         Dans
         ori-oai-md-editor\WEB-INF\resources\forms\ori-md-editor\tef-global\form\form.xhtml
         il faut remplacer toutes les occurrences de
         [0-9]{9}
         par
         [0-9]{8}[X0-9]{1}

         Donc pour les fiches du SUDOC, à part les champs qui ne sont
         pas remplis à fond, ceci corrige ton problème ?


         Concernant les fiches qui proviennent de STAR, tu ne m'en
         avais pas parlé ?

         Peux-tu m'en envoyer une d'exemple stp ?
         Quand tu dis que ça plante, c'est au niveau du md-editor ou
         déjà dans le workflow ?

         Merci

         Yohan COLMANT
         Direction des Systèmes d'Information
         UVHC<http://www.univ-valenciennes.fr>  - Université de
         Valenciennes et du Hainaut Cambrésis
         Coordinateur Technique du projet ORI-OAI<http://www.ori-oai.org>


         le drezen alain a écrit :

             Bonjour Yohan,

             Voici les éléments de réponse.

             Le 10/09/2010 10:31, Yohan Colmant a écrit :

                 Salut Alain,

                 Je commence ENFIN à me pencher sur ton problème.

                 En premier lieu, pourquoi importes-tu les fiches dans
                 ton workflow ? Tu ne peux pas les moissonner plutôt ?
                 Comment les as-tu récupérées ?

             Pour le SUDOC pas de moissonnage possible. Pour Star le
             moissonnage serait possible. Mais dans les deux cas nous
             devons modifier les notices ce qui n'est pas possible sur
             une notice moissonnée.

                 LÃ , les erreurs que tu mentionnes apparaissent dans le
                 md-editor, mais pas dans le workflow ? Si tu veux
                 juste importer ces fiches et les publier, rien ne te
                 bloque ?

             En ce qui concerne l'import, en effet pas de problème pour
             les notices SUDOC. Ce n'est pas le cas pour les notices
             STAR qui elles plantent dès l'import..
             Cependant certaines notices SUDOC ne sont pas éditable
             dans le workflow ce qui empêchera de les compléter et donc
             de les publier.

                 Si je n'arrivais pas à débloquer ton problème avant le
                 retour de Nolwen, est-ce que tu serais bloqué ? En
                 gros, as-tu besoin de modifier les fiches que tu
                 importes ou non ?

             Oui, nous devons les modifier avant de les publier. Par
             exemple la thèse nommée "Quelle formation pour le médecin
             généraliste psychothérapeute de fait" ne s'ouvre pas dans
             l'éditeur à cause des caractères spéciaux en début de titre.

                 Si non, tu peux simplement importer les fiches et les
                 indexer. Effectivement, si tu cherches à les
                 visualiser dans le md-editor, tu auras ces soucis,
                 mais cela te permet tout de même de faire l'import en
                 attendant ?


                 Second point, c'est Nolwen qui est plus à même de
                 répondre à tes interrogations sur le module, donc je
                 vais faire de mon mieux :-(


                 Pour commencer, j'ai pris en exemple la fiche
                 Metz_13738551X.xml

                 1) Les erreurs liées au nom et prénom qui ne doivent
                 pas être vides sont connues. Là on a des choses à                  faire par la suite, mais c'est juste un soucis
                 d'affichage. Il te suffit de cliquer sur le nom et
                 refermer la fenêtre de saisie de la personne pour voir
                 que l'erreur disparait. Nolwen n'avait pas réussi à                  contourner ce problème avant son départ.
                 Lorsque tu as un PPN composé de 9 chiffres comme prévu
                 jusqu'ici dans l'éditeur TEF, le même problème se
                 pose, ouvre et referme la fenêtre de saisie, tu verras
                 que ça marche en fait.

             Ca c'est un pb connu

                 2) Il manque des mots-clefs en français. Ils sont
                 décrits comme obligatoires dans le TEF :
                 http://www.abes.fr/abes/documents/tef/recommandation/dc_subject.html


             Ok normal


                 3) Pour le PPN qui comporte 8 chiffres et une lettre ....
                 J'ai essayé de joindre les collègues fonctionnels mais
                 ils ne sont pas joignables pour le moment. Les
                 quelques docs que j'ai trouvées parlent bien de 9
                 chiffres. Tu as une info ou une doc où ils parlent
                 d'une possibilité de caractères autres ?


             Voici un extrait de la doc de l'ABES :
             Zone 001 : Numéro d'identification de la notice
             Zone système protégée, obligatoire, non répétable, sans
             indicateurs et sans sous-zones.
             Le contenu de la zone est générée automatiquement par le
             système lors de la validation d'une nouvelle notice
             Dans le Sudoc, l'identifiant unique de la notice est
             appelé ppn (= Pica production number). Il comporte 9
             caractères :
             8 chiffres (attribués par le système de manière
             séquentielle = numéro d'"ordre" de la notice dans la base
             de données)
             une clé de contrôle sur 1 caractère, qui peut être un
             chiffre ou "X"

                 4) Concernant le fichier maintenant ...
                 Je ne connais pas assez le TEF, mais je sais que le
                 type mime et l'URL du fichier sont à 2 endroits dans
                 le TEF que nous générons.
                 Dans tes fiches, cela n'apparait qu'une fois. Il reste
                 la rubrique suivante qui est vide :
                 <mets:fileSec>
                 <mets:fileGrp USE="archive" ID="FGrID1">
                 <mets:file ID="FID1" MIMETYPE="" ADMID="file_1"
                 USE="maitre">
                 <mets:FLocat LOCTYPE="URL" xlink:href=""/>
                 </mets:file>
                 </mets:fileGrp>
                 </mets:fileSec>
                 D'où l'erreur dans l'IHM ...
                 Si on se réfère à cette doc, on lit "*Seule l'édition
                 d'archivage doit obligatoirement être représentée dans
                 cette section.* Cette présence est facultative pour
                 les autres éditions. ".
                 Dans ton cas, si je prends la fiche
                 Metz_13738551X.xml, on voit bien USE="archive" dans le
                 bloc mets:fileSec. Si je comprends bien, dans ce cas,
                 les métadonnées MIMETYPE et URL sont obligatoires. Ici
                 elles ne sont pas remplies.

             J'ai corrigé mes fichiers en remplissant<mets:fileSec>  et
             je récupe^'re bien l'URL lors de l'import.
             Pour l'anecdote je n'ai pas réussi à importer un fichier
             TEF généré par ORI (pas de chance ???)



                 Je reviens vers toi quand tu auras pu me donner un peu
                 plus d'infos et fait un retour sur ce mail.
                 Je te dirai aussi ce que j'ai eu comme infos pour le PPN.

                 A bientôt,

                 Yohan COLMANT
                 Direction des Systèmes d'Information
                 UVHC<http://www.univ-valenciennes.fr>  - Université de
                 Valenciennes et du Hainaut Cambrésis
                 Coordinateur Technique du projet ORI-OAI
                 <http://www.ori-oai.org>


                 Alain Le Drezen a écrit :

                     Bonjour,

                     Voici quelques problèmes rencontrés lors de
                     l'import de notices de thèses du SUDOC (import en
                     pièce jointe).

                     L'URL du fichier (<dc:identifier
                     xsi:type="dcterms:URI">) ne s'importe pas.

                     La notice de la thèse "Quelle formation pour le
                     médecin généraliste psychothérapeute de fait" ne
                     s'affiche pas dans l'éditeur (page grise vide). Il
                     semble que ce soit lié à la présence de caractères
                     étranges en début du titre. Mais ceci ne devrait
                     pas être bloquant.

                     Dans l'éditeur, l'erreur "Le PPN du mot sujet
                     Rameau doit être composé de neuf chiffres" est
                     erronée. Un PPN peu contenir des caractères.

                     Merci d'avance pour tout élément de réponse.

                     Alain











        
      

    

  






Options d'affichage des commentaires

Sélectionnez la méthode d'affichage des commentaires que vous préférez, puis cliquez sur « Enregistrer les paramètres » pour activer vos changements.
Sujet clos