A little more was added into the markup.xml page. Only a couple of paragraphs are left now.
Uploaded all the files that Claire edited on Thursday, and also made a tweak to the CSS so that the popup box in the document list page is always fully on-screen; it was irritating me a bit.
Get the changed files from Claire and France's directory on the server, validate them, and push them into the db.
<pre>Le mariage sous L'Ancien Régime
Menu
Home
Instructions
Documents
Search
Schéma
Encodage
Text analysis
Credits
Project blog
Choix d'encodage
Les documents dans cette base de données sont balisés en format Text-Encoding Initiative P5.Voir la page de Schemas plus de plus amples détails. Tous les documents utilisent le même schéma, mariage.rng.
Types de documents
Les documents dans la base de données font parties des catégories suivantes :
1.Images balisées
Les images sont balisées à l'aide de Image Markup Tool. Dans le <teiHeader>, les conventions normales comme décrites ci-dessous sont appliquées; Le "Image Markup Tool" ajoute toute autre information automatiquement dès que les données sont sauvegardées ou téléchargées, ainsi les informations additionnelles apparaîtront dans le <teiHeader> de ces données. À l'intérieur même de ces annotations (lesquelles derrière les scènes sont étiquetées <div>), les éléments normaux "block-level" sont utilisés (<p>, <lg> et ainsi de suite), et sous ce niveau des balises les descriptions sont comme suit ci-dessous.
1.Textes autonomes
Les textes autonomes sont des documents tels que des brochures, qui ne font pas partie d’un plus grand texte telle qu’un volume. Ces documents sont normalement balisés en utilisant les structures suivantes :
<TEI>
<teiHeader></teiHeader>
<text>
<front>
<docTitle>
<titlePart type="main">[Document title]</titlePart>
</docTitle>
<docAuthor>
<name>[Document Author]</name>
</docAuthor>
</front>
<body>
<div>[Main body of the text]</div>
</body>
<back>[Optional back matter]</back>
</text>
</TEI>
1.Textes tirés d’une source de documents plus grands
Quelques textes de la banque de données sont sélectionnés à partir d’un volume plus grand. Ceux-ci ont généralement la structure suivante :
<TEI>
<teiHeader></teiHeader>
<text>
<body>
<div>
<head>[Document title</head>
[Main body of the text]
</div>
</body>
</text>
</TEI>
Dans les cas ci-dessus, l’encodage du contenu principal ("[Main body of the text]") suit les conventions ... ci-dessous dans "Block and inline content markup".
Le teiHeader
L’élément <teiHeader> est mieux documenté par l’utilisation d’un exemple commenté accessible ici : sample_header.xml.
Encodage aux niveaux "block" et "inline"
Les éléments suivants sont utilisés couramment dans ce projet :
<div> : Le texte principal est entouré par un <div>, et d’autres <div> peuvent être nichés à l’intérieur de celui-ci. Les éléments <div> peuvent avoir un attribut type les désignant comme “chapitre” ou toutes autres divisions structurales.
<head> : Pour les petits textes extraits à partir de plus grands documents (type 3 ci-dessus), le titre du texte sera balisé avec une élément <head>. Pour les documents plus long et isolés, les éléments <head> sont utilisées comme des entêtes internes. L’attribut type peut être utilsé pour distinguer le type="main" du type="sub".
<p> : élément de paragraphe normal.
<lg> et <l> : les groupes de lignes sont par défaut des strophes, et des éléments de lignes qui apparaissent à l’intérieur de celles-ci. Pour des structures poétiques plus complexes (comme des sonnets), les éléments <lg> peuvent être insérées de façon à montrer un groupe de lignes faisant partie d’un plus grand groupe de lignes. Les éléments <l> peuvent apparaître seulement à l’intérieur des éléments <lg>. Les éléments <l> peuvent aussi porter un n attribut indiquant le numéro de la ligne; ceci devrait normalement être fait seulement dans les cas où le texte complet du poème n’est pas inclu (en d’autres mots, seulement où quelques extraits sont balisés), pour indiquer où les lignes sont manquantes.
<pb>: L'élément du saut de page est un jalon (sans contenu) et est habituellement doté d'un attribut n indiquant le numéro de page de la page précédente, ainsi <pbn=”22” /> apparaîtra en marge entre les pages 21 et 22.
<hi>: L'élément surligné est utilisé pour indiquer un texte en caractères tel que: italique ou gras, utilisant l'attribut «rend» : <hi rend= “italics”>, <hi rend=”bold”>.
<note>: L'élément « note» est utilisé de deux façons distinctes:
1.Pour de simples notes alignées. Le texte de la note est englobé par l'élément <note>, laquelle est insérée n'importe où dans le texte à l'endroit précis où l'auteur souhaite l'ancrage. L'attribut resp peut être utilisé où une note n'est pas fournie par les éditeurs en question. (ex.resp="19thc editor").
Pour les notes
Claire pointed out the poor appearance of some of the 800px images used for the interactive image pages. This was caused by two factors: some where generated by the Image Markup Tool through its Web View output, which uses a default scaling algorithm that clearly isn't optimal for these images, and some images are in colour, even though they're essentially a greyscale format. I used the GIMP to re-generate all those images, converting the low-res ones to greyscale where required, but leaving the originals alone.
Two components to this task:
- For content owned by us (markup, editorial content, code etc.): use the Attribution-NonCommercial-NoDerivs 2.5 Canada licence.
- For the images, clarify that we are using them under licence (a copy will be posted when it is received), and anyone wishing to use or reproduce them will have to contact the BN.
The old site on Mustard is now obsolete, so I've implemented redirects in the sitemap so that anyone accessing it is automatically taken to the relevant page of the new site. This is the code:
<!-- First, catch one page whose name has changed. --> <map:match pattern="index.xq"> <map:redirect-to uri="http://mariage.uvic.ca/biblio.xq" /> </map:match> <!-- Now catch all the other stuff on the site. --> <map:match pattern="*"> <map:redirect-to uri="http://mariage.uvic.ca/{1}" /> </map:match>
</div>
</body>
</text>
</TEI>
Dans les cas ci-dessus, l’encodage du contenu principal ("[Main body of the text]") suit les conventions ... ci-dessous dans "Block and inline content markup".
Le teiHeader
L’élément <teiHeader> est mieux documenté par l’utilisation d’un exemple commenté accessible ici. : sample_header.xml.
Encodage d’un contenu pour arrêter et déterminer les lignes.
Block and inline content markup
Les étiquettes suivantes sont utilisées couramment dans ce projet :
* <div>: Le texte principal est ceinturé dans (entouré par) un <div>, et d’autres <div>s peuvent être nichés / (installés) à l’intérieur de celui-ci / (sous celui-ci). Les éléments <div> peuvent avoir un « type attribute » / les désignant comme “chapitre” ou quelques / toutes autres divisions structurales.
* <head>: Pour les petits texts extraits / pris / à partir de plus grands documents (type 3 au dessus), le titre du texte sera balisé avec une étiquette <head>. Pour les documents plus long et isolés, l’étiquette <head> est utilisée comme des entêtes internes. L’attribut type peut être utilsé pour distinguer le type ="main" du type="sub".
* <p>: étiquette de paragraphe normal.
* <lg> et <l>: les groupes de lignes sont par défaut (be default) des strophes, et des éléments de lignes apparaissent à l’intérieur de celles-ci.
Pour des structures poétiques plus complexes (comme des sonnets), les étiquettes <lg> peuvent être insérées de façon à montrer un groupe de lignes faisant partie d’un plus grand groupe de lignes. Les étiquettes <l> peuvent apparaître seulement à l’intérieur des étiquettes <lg>. Les étiquettes <l> peuvent aussi porter un n attribut indiquant le numéro de la ligne; ceci devrait normalement être fait seulement dans les situations /cas où le texte complet du poème n’est pas inclu (en d’autres mots, seulement où quelques extraits sont balisés), pour indiquer où les lignes sont manquantes.
« »
<pb>: L'étiquette du saut de page est un jalon (sans contenu) et est habituellement doté d'un attribut «n» indiquant le numéro de page de la page précédente, ainsi <pbn=”22” /> apparaîtra en marge entre les pages 21 et 22.
<hi>: L'étiquette surlignée est utilisée pour indiquer un texte en caractères tel que: italique ou gras, utilisant l'attribut «rend» : <hi rend= “italics”>, <hi rend=”bold”>.
<note>: L'étiquette « note» est utilisée de deux façons distinctes:
1. Pour de simples notes alignées. Le texte de la note est englobé par l'étiquette <note>, laquelle est insérée n'importe où dans le texte à l'endroit précis où l'auteur souhaite l'ancrage.