<pre>http://lettuce.tapor.uvic.ca/cocoon/projects/mariage/
Choix d'encodage
Les documents dans cette base de données sont balisés en format "Text-Encoding Initiative's P5". Voir la page de schémas plus de plus amples détails. Tous les documents utilisent le même schéma, "mariage.xsd" (relié à d'autres filières)
Types de documents
Les documents dans la base de données font parties des catégories suivantes:
1. Images balisées
Les images sont balisées à l'aide de "Image Markup tool" avec le <tei Header>, les conventions normales comme décrites ci-dessous sont appliquées; Le "Image Markup Tool" ajoute toute autre information par lui-même dès que les données sont sauvegardées ou téléchargées, ainsi les informations additionnelles apparaîtront dans le <tei Header> de ces données. À l'intérieur même de ces annotations (lesquelles derrière les scènes sont étiquetées <div>), « normal block-elements » les éléments normaux "block-level" sont utilisés (<p>, <lg> et ainsi de suite), et sous ce niveau des balises les descriptions sont comme suit ci-dessous.
2. Textes autonomes
Les textes autonomes sont des documents tel que des brochures, qui ne font pas partie d’un plus grand texte tel qu'un livre. Ces documents sont normalement balisés en utilisant les structures suivantes :
#
<TEI>
<teiHeader></teiHeader>
<text>
<front>
<docTitle>
<titlePart type="main">[Document title]</titlePart>
</docTitle>
<docAuthor>
<name>[Document Author]</name>
</docAuthor>
</front>
<body>
<div>[Main body of the text]</div>
</body>
<back>[Optional back matter]</back>
</text>
</TEI>
#
3. Textes tirés d’une source de documents plus grands
Quelques textes de la banque de données sont sélectionnés à partir de documents plus grand. Ceux-ci ont généralement la structure suivante:
<TEI>
<teiHeader></teiHeader>
<text>
<body>
<div>
<head>[Document title</head>
[Main body of the text]
</div>
</body>
</text>
</TEI>
Dans les cas ci-dessus, l’encodage du contenu principal ("[Main body of the text]") suit les conventions ... ci-dessous dans "Block and inline content markup".
Le teiHeader
L’élément <teiHeader> est mieux documenté par l’utilisation d’un exemple commenté accessible ici.: sample_header.xml.
Pricipes de balisage
Les éléments suivants sont utilisés couramment dans ce projet :
* <div>: Le texte principal est entouré par un <div>, et d’autres <div>s peuvent être installés à l’intérieur de celui-ci. Les éléments <div> peuvent avoir un attribut type les désignant comme chapitre ou toutes autres divisions structurales.
* <head>: Pour les petits textes extraitsà partir de documents plus grands (type 3 au dessus), le titre du texte sera balisé avec une élément <head>. Pour les documents plus longs et isolés, l’élément <head> est utilisé comme entête interne. L’attribut type peut être utilsé pour distinguer le type ="main" du type="sub".
* <p>: élément de paragraphe normal.
* <lg> et <l>: les groupes de lignes sont par défaut des strophes, et des éléments de lignes et apparaissent à l’intérieur de celles-ci.
Pour des structures poétiques plus complexes (comme des sonnets), les éléments <lg> peuvent être insérés de façon à montrer un groupe de lignes faisant partie d’un plus grand groupe de lignes. Les éléments <l> peuvent apparaître seulement à l’intérieur des éléments <lg>. Les éléments <l> peuvent aussi porter un attribut n indiquant le numéro de la ligne; ceci devrait normalement être fait seulement dans les situations où le texte complet du poème n’est pas inclu (en d’autres mots, seulement où quelques extraits sont balisés), pour indiquer l'endroit où les lignes sont manquantes.
<pb>: L'élément du saut de page est un jalon (sans contenu) et est habituellement doté d'un attribut n indiquant le numéro de page de la page précédente, ainsi <pbn=”22” /> apparaîtra en marge entre les pages 21 et 22.
<hi>: L'élément surligné est utilisé pour indiquer un texte en caractères tels que: italique ou gras, utilisant l'attribut «rend» : <hi rend= “italics”>, <hi rend=”bold”>.
<note>: L'élément « note» est utilisé de deux façons distinctes:
1.Pour de simples notes alignées. Le texte de la note est englobé par l'élément <note>, laquelle est insérée n'importe où dans le texte à l'endroit précis où l'auteur souhaite l'ancrage. L'attribut resp peut être utilisé où une note n'est pas fournie par les éditeurs actuels. (ex.resp="19thc editor").
2.Pour les notes de liaison, dans lesquelles plusieurs liens entre les documents sont inclus avec une note explicative. Voici un exemple:
<note type="link"><ref target="amant.xml#wifes_lover bosse.xml#wifes_lover sur_un_jaloux.xml fantastique_repentir.xml#strophe_dix-huit">Dans l'image "Il cherche ce qu'il ne voudroit pas trouver" et l'image "La femme battant son mari", s'agit-il d'un ami de l'époux? Ce n'est pas impossible, comme les vers "Sur un jaloux" et "Fantastique repentir" le suggèrent aussi.</ref></note>
Ici l'élément <note> contient un élément<ref>; l'attribut target
de l'élément <ref> a une liste d'espaces délimités des références URI servant de repère pour d'autres locations, et les notes explicatives sont inclues dans l'élément <ref> . Dans cet exemple, il y a des liens à des emplacements / endroits dans quatre documents: l'élément avec le xml: attribut id "wifes_lover" dans le document "amant.xml", l'élément avec le même id dans le document "bosse.xml", un lien général au document "sur_un_jaloux" (n'indiquant pas une location spécifique dans ce document), et l'élément avec le xml: id "strophe_dix-huit" dans le document "fantastique_repentir.xml". De cette façon, plusieurs documents peuvent être reliés ensemble autour du même commentaire ou de la même note.
<list et <item>: Où les listes détaillées ou numérotées aparaissent dans le texte source, ils peuvent être balisés en utilisant un élément <list> (avec un attribut type de “ordered” pour des listes numérotées, sans ordre spécifique ou des listes à points) contenant des éléments <item>.