per page, with , order by , clip by
Results of 0 - 1 of about 0 (0.000 sec.)
Fragmentation des documents
@digest: 2b6f0a3f346806c73e1eeaf45d867ee3
@id: 156887
@mdate: 2004-05-18T12:58:18Z
@size: 11189
@type: text/html
content-type: text/html; charset=ISO-8859-1
generator: Website XSL Stylesheet V2.1b1b1+
#keywords: documentaires (10268), unites (9472), affichable (7748), detruire (7586), cherchables (7323), fragmentation (7015), fragmenter (6721), doctorats (6386), cherchable (5926), imprimees (5627), volumineux (4689), indexation (4294), conserver (4034), fragments (3739), interieur (3216), constituer (3071), fragment (2999), appelees (2960), pertinente (2930), recursif (2911), pertinentes (2655), mentionner (2322), difficulte (2296), theses (2188), contenu (2034), processus (1990), attaches (1948), centaines (1865), destruction (1826), identifiant (1816), thesaurus (1794), contenir (1680)
Documentation SDX-2 Télécharger Installer Présentation Configuration Indexation Pipeline Original et usage Paramètres Format de sortie Champs SDX Documents attachés Fragmentation Thésaurus Recherche OAI Javadoc Référence API-XSP Migration Schemas Performances Fragmentation des documents La fragmentation des documents est une fonctionnalité très utile dans SDX. En effet, certains documents XML sont trop volumineux pour constituer des unités documentaires (unités d'information cherchables) pertinentes. Par exemple, dans une application de consultation de thèses de doctorats, le document XML contient en général une thèse complète, soit dans certains cas l'équivalent de quelques centaines de pages imprimées. Si les résultats de recherche ne font référence qu'à des thèses complètes, l'utilisateur peut avoir de la difficulté à trouver la partie pertinente dans la thèse. C'est pourquoi il est possible, lors du processus d'indexation d'un document XML, de le fragmenter en plusieurs unités documentaires. Ces unités seront appelées fragments de documents et il est important dès à présent de mentionner qu'un fragment de documents peut lui-même contenir d'autres fragments, ce qui indique que ce processus est récursif. Un fragment de document sera donc une unité d'information cherchable mais aussi affichable par SDX, comme tout document XML indexé normalement, sans fragmentation. La seule distinction que fera SDX sera de conserver une relation entre un fragment et l'identifiant du document ou fragment dans lequel il se situe. Cette relation doit être conservée car SDX va détruire tous les fragments d'un document qu'il s'apprête à détruire, et de manière récursive. Ainsi, même s'il est possible de détruire individuellement un fragment de document dans SDX, il faut savoir que la destruction de son document ou fragment parent va aussi entraîner sa propre destruction, et ce afin de conserver des relations cohérentes par rapport au moment où ils ont été indexés. Pour créer des fragments de documents, il suffit d'imbriquer des éléments sdx:document les uns à l'intérieur des autres. Pour les fragments, il est nécessaire de spécifier le contenu du XML en ajoutant ce contenu à l'intérieur même de l'élément sdx:document , en utilisant un espace de nom autre que celui de SDX. Voir l'exemple donnée dans le document sur le format de sortie du pipeline d'indexation. Auteur : Martin Sévigny ( AJLSM ) - 2003-05-14 Home Copyright © 2000, 2001, 2002, 2003, 2004 Ministère de la culture et de la communication, AJLSM. ...
http://www.gnu.org/savannah-checkouts/non-gnu/sdx/docs/html/doc-sdx2/fr/indexation/fragmentation.html - [detail] - [similar]
PREV NEXT
Powered by Hyper Estraier 1.4.13, with 213370 documents and 1081687 words.