translation_markup_conventions
<pre>Le mariage sous L'Ancien Régime
Menu
Home
Instructions
Documents
Search
Schéma
Encodage
Text analysis
Credits
Project blog
Choix d'encodage
Les documents dans cette base de données sont balisés en format Text-Encoding Initiative P5.Voir la page de Schemas plus de plus amples détails. Tous les documents utilisent le même schéma, mariage.rng.
Types de documents
Les documents dans la base de données font parties des catégories suivantes :
1.Images balisées
Les images sont balisées à l'aide de Image Markup Tool. Dans le <teiHeader>, les conventions normales comme décrites ci-dessous sont appliquées; Le "Image Markup Tool" ajoute toute autre information automatiquement dès que les données sont sauvegardées ou téléchargées, ainsi les informations additionnelles apparaîtront dans le <teiHeader> de ces données. À l'intérieur même de ces annotations (lesquelles derrière les scènes sont étiquetées <div>), les éléments normaux "block-level" sont utilisés (<p>, <lg> et ainsi de suite), et sous ce niveau des balises les descriptions sont comme suit ci-dessous.
1.Textes autonomes
Les textes autonomes sont des documents tels que des brochures, qui ne font pas partie d’un plus grand texte telle qu’un volume. Ces documents sont normalement balisés en utilisant les structures suivantes :
<TEI>
<teiHeader></teiHeader>
<text>
<front>
<docTitle>
<titlePart type="main">[Document title]</titlePart>
</docTitle>
<docAuthor>
<name>[Document Author]</name>
</docAuthor>
</front>
<body>
<div>[Main body of the text]</div>
</body>
<back>[Optional back matter]</back>
</text>
</TEI>
1.Textes tirés d’une source de documents plus grands
Quelques textes de la banque de données sont sélectionnés à partir d’un volume plus grand. Ceux-ci ont généralement la structure suivante :
<TEI>
<teiHeader></teiHeader>
<text>
<body>
<div>
<head>[Document title</head>
[Main body of the text]
</div>
</body>
</text>
</TEI>
Dans les cas ci-dessus, l’encodage du contenu principal ("[Main body of the text]") suit les conventions ... ci-dessous dans "Block and inline content markup".
Le teiHeader
L’élément <teiHeader> est mieux documenté par l’utilisation d’un exemple commenté accessible ici : sample_header.xml.
Encodage aux niveaux "block" et "inline"
Les éléments suivants sont utilisés couramment dans ce projet :
<div> : Le texte principal est entouré par un <div>, et d’autres <div> peuvent être nichés à l’intérieur de celui-ci. Les éléments <div> peuvent avoir un attribut type les désignant comme “chapitre” ou toutes autres divisions structurales.
<head> : Pour les petits textes extraits à partir de plus grands documents (type 3 ci-dessus), le titre du texte sera balisé avec une élément <head>. Pour les documents plus long et isolés, les éléments <head> sont utilisées comme des entêtes internes. L’attribut type peut être utilsé pour distinguer le type="main" du type="sub".
<p> : élément de paragraphe normal.
<lg> et <l> : les groupes de lignes sont par défaut des strophes, et des éléments de lignes qui apparaissent à l’intérieur de celles-ci. Pour des structures poétiques plus complexes (comme des sonnets), les éléments <lg> peuvent être insérées de façon à montrer un groupe de lignes faisant partie d’un plus grand groupe de lignes. Les éléments <l> peuvent apparaître seulement à l’intérieur des éléments <lg>. Les éléments <l> peuvent aussi porter un n attribut indiquant le numéro de la ligne; ceci devrait normalement être fait seulement dans les cas où le texte complet du poème n’est pas inclu (en d’autres mots, seulement où quelques extraits sont balisés), pour indiquer où les lignes sont manquantes.
<pb>: L'élément du saut de page est un jalon (sans contenu) et est habituellement doté d'un attribut n indiquant le numéro de page de la page précédente, ainsi <pbn=”22” /> apparaîtra en marge entre les pages 21 et 22.
<hi>: L'élément surligné est utilisé pour indiquer un texte en caractères tel que: italique ou gras, utilisant l'attribut «rend» : <hi rend= “italics”>, <hi rend=”bold”>.
<note>: L'élément « note» est utilisé de deux façons distinctes:
1.Pour de simples notes alignées. Le texte de la note est englobé par l'élément <note>, laquelle est insérée n'importe où dans le texte à l'endroit précis où l'auteur souhaite l'ancrage. L'attribut resp peut être utilisé où une note n'est pas fournie par les éditeurs en question. (ex.resp="19thc editor").
Pour les notes