Bonjour,
Nous diffusons actuellement des ressources pédagogiques et des thèses au format PDF qui sont protégées pour éviter les copier/coller par exemple. Nous avons également ces mêmes fichiers sous forme non protégée pour l'indexation plein texte.
En migrant vers ORI-OAI, nous souhaiterions continuer à proposer la recherche en texte intégrale sans remettre en question des fichiers doubles dans un premier temps. Ce que nous souhaiterions faire : lors de l'action de crawling, tester la présence d'une adresse de l'INSA dans la localisation du fichier, et si c'est le cas, remplacer un bout de l'URL pour indiquer au crawler l'adresse des fichiers non protégés, auquel lui seul aurait accès. Il s'agit d'une première solution, à développer et évaluer pour le plus long terme.
Nous souhaiterions avoir un peu d'aide pour localiser les fichiers à modifier.
Merci
Nolwen
Nous diffusons actuellement des ressources pédagogiques et des thèses au format PDF qui sont protégées pour éviter les copier/coller par exemple. Nous avons également ces mêmes fichiers sous forme non protégée pour l'indexation plein texte.
En migrant vers ORI-OAI, nous souhaiterions continuer à proposer la recherche en texte intégrale sans remettre en question des fichiers doubles dans un premier temps. Ce que nous souhaiterions faire : lors de l'action de crawling, tester la présence d'une adresse de l'INSA dans la localisation du fichier, et si c'est le cas, remplacer un bout de l'URL pour indiquer au crawler l'adresse des fichiers non protégés, auquel lui seul aurait accès. Il s'agit d'une première solution, à développer et évaluer pour le plus long terme.
Nous souhaiterions avoir un peu d'aide pour localiser les fichiers à modifier.
Merci
Nolwen
-- Nolwen CLEMENT-HUET Coordinateur Fonctionnel du projet ORI-OAI Doc'INSA - INSA de Lyon Mèl : nolwen.huet@insa-lyon.fr Tel : 04 72 43 70 32 Web : http://docinsa.insa-lyon.fr