Je ne suis pas sur le trunk, j'ai fait les modifs que tu m'as indiqué et ça marche.
Merci !
A+
Nolwen
Le 06/05/2011 14:16, Grégoire Neuville a écrit :
Re,
Ok, ça vient de la jar crimson.jar (un vieux parser xml) qui implémente des spécifications xml obsolètes. Sur quelle version de l'indexing es-tu ? Si tu es sur le trunk, je peux commiter rapidement les modifs nécessaires. Sinon, je te propose la démarche suivante :
- effacer les jar crimson.jar et xerces.jar de tes sources
- télécharger http://apache.cict.fr//xerces/j/Xerces-J-bin.2.11.0.tar.gz
- dézipper et copier dans webapp/WEB-INF/lib les jar : serializer.jar, xercesImpl.jar et xml-apis.jar
- recompiler et redéployer
Grégoire.
On 06/05/2011 12:51, Nolwen Clément-Huet wrote:
Salut Grégoire,
Je t'avoue que je comprend pas tout non plus à ce problème...
Dans l'indexing j'ai les logs suivant :
ERROR [http-8182-9] - Error on line 12: Illegal xml:lang
value "fre".
Pour info, j'ai fait la manip avec un entrepôt local et, sur le même
fichier, en ne modifiant que les éléments xml:lang : si ils ont les
valeurs 'fr'/'en' l'indexation marche, si les valeurs sont 'fre'/'eng'
ça ne fonctionne plus.
Le namespace est bien déclaré et je viens de vérifier dans le BCP_47, et
les codes sont bien corrects puisque présents dans la norme ISO 639-2.
Merci pour ton aide
Nolwen
Le 06/05/2011 12:32, Grégoire Neuville a écrit :
Salut Nolwen,
J'avoue ne pas comprendre. Il n'y a pas de validation contre schéma au
niveau de l'indexing, si ? Et l'attribut xml:lang n'est d'ailleurs pas
spécifique au dc. Ce que je vois comme problème potentiel lié à cet
attribut :
- le préfixe xml n'est pas déclaré dans le document (i.e associé à
aucun espace de nom)
- les valeurs stockées dans ne sont pas conformes à
http://en.wikipedia.org/wiki/BCP_47
Dans le deuxième cas, cela signifierait que le parseur jdom utilisé
dans l'indexing serait capable de détecter ces valeurs non conformes,
ce qui m'étonnerait un peu...
Que disent les logs exactement ?
À plus,
Grégoire.
On 06/05/2011 11:05, Nolwen Clément-Huet wrote:
Bonjour,
Je cherche à indexer les fiches Dublin Core moissonées de l'entrepôt
Gallica (http://oai.bnf.fr/oai2/OAIHandler). Aucun des champs //dc:XXX
n'est indexé. Après quelques recherches, il semblerait que cela
provienne de l'attribut xml:lang qui précise certains éléments (dc:type,
dc:rights) dont la valeur est sur 3 caractères au lieu des 2 plus
habituels. Je n'ai pas trouvé de contrindication à cet usage dans les
spécifications du DC.
Peut-on configurer l'indexing pour qu'il prenne en compte ce cas ?
Merci
Bonne journée
Nolwen
--
Nolwen CLEMENT-HUET
Université de Poitiers
Chargée de système d'information documentaire
[i-médias] Service Commun Informatique et Multimédia
Bâtiment B21 - 7 rue Shirin Ebadi - 86022 POITIERS Cedex
Tél : 05 49 36 64 06 - Fax : 05 49 45 35 99
http://www.univ-poitiers.fr -http://imedias.univ-poitiers.fr
Service Commun de la Documentation
1, allée Jeanne Chauvin - BP 605 86022 POITIERS Cedex
Tel : 05 49 4544 02 - Fax : 05 49 45 33 56
http://www.univ-poitiers.fr -http://scd.univ-poitiers.fr/
-- Nolwen CLEMENT-HUET Université de Poitiers Chargée de système d'information documentaire [i-médias] Service Commun Informatique et Multimédia Bâtiment B21 - 7 rue Shirin Ebadi - 86022 POITIERS Cedex Tél : 05 49 36 64 06 - Fax : 05 49 45 35 99 http://www.univ-poitiers.fr - http://imedias.univ-poitiers.fr Service Commun de la Documentation 1, allée Jeanne Chauvin - BP 605 86022 POITIERS Cedex Tel : 05 49 4544 02 - Fax : 05 49 45 33 56 http://www.univ-poitiers.fr - http://scd.univ-poitiers.fr/