5. Criterios de codificación | Biblioteca Digital Prolope

5.1. Principios generales: la prioridad del texto

La codificación de nuestras ediciones críticas digitales en la Biblioteca Digital PROLOPE sigue unos principios generales de ortodoxia dentro de la filosofía y buenas prácticas de marcación en XML-TEI, aunque se ofrecen también algunas excepciones y limitaciones. Partimos de la centralidad del texto que se procura marcar de manera relativamente detallada, profunda y ortodoxa siguiendo siempre las Guidelines o Directrices de TEI (veremos luego excepciones). Dada la abundancia de etiquetas y la complejidad de su uso especialmente en casos de solapamiento (problema consustancial de XML y TEI), admitimos que el etiquetado del prólogo está más orientado a la publicación en web que a explotar posibles funcionalidades (así, por ejemplo, una referencia bibliográfica en el prólogo o en una nota, no va marcada como tal ni enlazada a la bibliografía, pues habría implicado una enorme sobrecarga de trabajo y marcado poco importante para nuestros principales intereses y debemos priorizar otras labores).

5.2. La documentación de proyecto

En una política de ciencia abierta y según las buenas prácticas de las Guías directrices y comunidad de usuarios XML-TEI, hemos creado un esquema Relax NG (→) así como documento ODD (→) que, alojados en nuestra comunidad Biblioteca Digital PROLOPE de ZENODO, pueden descargarse para la correcta validación, comprobación de buena formación, tanto para el buen uso y desarrollos propios como para facilitar su reutilización y desarrollo por parte de otros proyectos.

5.3. Los metadatos: nuestros headers

El Header o encabezado y metadatos de los archivos XML-TEI ha sido un aspecto al que hemos prestado la máxima atención, ofreciendo, claro, datos básicos de la propia obra con títulos alternativos, fechas de composición (las propuestas por Morley y Bruerton 1968, pero también por nuestros editores), publicación, la edición digital, la edición en papel que se tomó como base para la misma (sourceDesc), los testimonios antiguos, el editor, los responsables de codificación, revisión filológica, etc., e incluso hemos realizado una propuesta de Header (→) desarrollada y justificada teóricamente (→) por Guillermo Gómez Sánchez-Ferrer [2018] documento con pasarelas en lenguaje Dublin Core y RDF para facilitar la integración y el diálogo con los catálogos bibliotecarios, los datos enlazados y la web semántica y su posible uso en metacatálogos y bases de datos externas. Así, por ejemplo, el uso de Dublin Core en los términos que planteamos permitiría exportar fácilmente la descripción de nuestros recursos a través del protocolo de intercambio OAI-PMH, garantizando la fácil incorporación de nuestros recursos a los catálogos de las bibliotecas; con todo, claro, esas pasarelas serían solo funcionales en un catálogo o buscador que las transitara y dialogara con nuestros metadatos, de modo que lo hemos dejado como propuesta en el caso de una sola comedia, la primera que codificamos, El príncipe de Marruecos, como guante que lanzamos a las instituciones de la memoria o catálogos de un nivel superior, para que construyan su lado del puente si les parece de interés. En nuestra tarea de transformación digital hemos mantenido reuniones con diferentes responsables bibliotecarios y hemos procurado hacer lo que entendemos que nos correspondía de la mejor manera posible.

5.4. La codificación y la visualización del texto: selección de objetivos y etiquetas

Más allá de lo explicitado en la documentación del proyecto generada automáticamente por el esquema Relax NG (→) y el documento ODD (→) ya mencionados, conviene detenernos en la resolución de algunos problemas que plantea la codificación XML-TEI y la visualización de las variantes o aparato crítico en el caso de las variantes complejas y que nos han compelido a buscar tal vez, excepcionalmente, soluciones más particulares (véase apartado 5.6).

Dejando estas excepciones aparte, el resto de la marcación del texto se ha hecho conforme a los principios y uso ortodoxo de las etiquetas y propuestas de marcación de TEI. Ciertamente, los archivos XML-TEI que genera nuestro proyecto son unos archivos de marcación detallada y profunda que atiende principalmente a los fenómenos textuales y la edición crítica. Dado que nuestro objeto de trabajo son los textos y primordialmente, en este proyecto, le prestaremos atención preferente a las tradiciones textuales generadas por los impresos de las Partes de comedias, de nuevo, para no hacer nuestro marcado más complejo, renunciaremos, al menos por el momento, a etiquetas del módulo de descripción de manuscritos o las más específicas relativas a la rima o el ritmo. Pondremos en juego, claro, en cambio, las etiquetas relativas a testimonios, lecturas, lemas, etc., del módulo de TEI Aparato crítico.

5.5. Etiquetado de la versificación

Para marcar las estrofas hemos utilizado el elemento <milestone>, que, por un lado, nos evita problemas de solapamiento, por ser etiqueta única, sin necesidad de apertura y cierre, y por otro, nos permite también realizar búsquedas tras ella. Hemos creado atributos y valores para las distintas estrofas (señalados con el atributo <stanza> y los valores "redondilla", "pareados", "quintilla", "terceto", etc.), para las unidades poemáticas que se pueden identificar más claramente como tales (señalados con el atributo <poem> y los valores "soneto", "canción", "silva"), así como otro para la prosa, para los breves fragmentos en prosa en que normalmente se reproducen cartas, billetes y todo tipo de mensajes o breves escritos que son citados y ocasionalmente leídos por los personajes. Sirvan como ejemplo de los tres modelos básicos de codificación de estas unidades los siguientes:

Todas estas etiquetas implican categorías y posibilidades de consulta en la Sala de investigación bajo la opción ESTROFAS. Conforme aumente el corpus, aumentarán previsiblemente los tipos de estrofas y poemas etiquetados y a disposición, generándose, claro, nuevas versiones del esquema Relax NG y del ODD.

5.6. Variantes de desplazamiento, de orden y confluyentes

Aunque TEI es un lenguaje que señala qué son las entidades marcadas, y no cómo las vamos a ver en pantalla, también es verdad que en cierto modo cuando marquemos los fenómenos textuales que nos interesen, al final debemos imaginar y entender cómo será su presentación. Señalar el cambio de una palabra por otra en un testimonio es fácil y también imaginar cómo vamos a visualizar ese fenómeno según los sistemas diseñados (ya hemos visto ejemplos).

Sin embargo, otros fenómenos textuales muy usuales o posibles, como la alteración de orden, desplazamientos de versos o fragmentos y variantes confluyentes o dentro de otras variantes más amplias (en un segundo testimonio cambia la redacción de un fragmento respecto al original, y en otro, tercero, dentro de ese fragmento, cambia además una palabra concreta, por ejemplo) pueden plantear serios problemas de codificación y programación y, lo que es peor, de visualización y comprensión para el lector. Es necesario identificar los problemas y buscar las mejores soluciones, que a veces pueden ser menos ortodoxas en codificación TEI, pero más prácticas. También para esto hemos seguido otros modelos en que veíamos que se acudía a soluciones similares, como el de La dama boba. Edición crítica y archivo digital, aunque seguiremos trabajando y buscando la mejor solución.

Imaginemos algo tan sencillo como la alteración de orden de un par de octavas reales o el desplazamiento de una acotación. ¿Cómo lo señalaremos y cómo lo visualizaremos? En una solución ortodoxa TEI debería ser marcado y en nuestra opción de visualización de Mostrar variantes deberíamos reproducir de nuevo las dos octavas reales completas en el orden en que aparecen en la variante. Sin embargo, eso confundiría al lector: por un lado, debería leer con atención por completo los dieciséis endecasílabos de nuevo, percibir que se produce la alteración de orden, y asimismo que ese es el único fenómeno que se da y no otro. En un caso así resulta muchísimo más efectivo crear una nota explicativa que reproducir y codificar la variante completa para todos los testimonios. Basta redactar una nota que diga: «Orden de las dos octavas reales invertido en B», por ejemplo, y es mucho más económico y claro para el lector. Algo parecido ocurre con fenómenos de desplazamiento, que obligarían a codificar de nuevo el segmento textual y situarlo por igual en los dos lugares donde, en unos testimonios u otros, se encuentra.

En las «variantes dentro de variantes», también problemáticas fundamentalmente en lo que atañe a la visualización, optamos por un marcado ortodoxo, aunque añadiendo instrucciones de visualización, y por usar combinaciones de subrayado y fondo para identificar los segmentos donde se produce la doble variante. Conviene decir que conforme avancemos en el proyecto es posible que se generen nuevas situaciones (¿acumulación de triples, cuádruples variantes?) que debamos solucionar de maneras alternativas que se documentarán convenientemente.

→ 6. Almacenamiento, seguridad, descarga, versiones, licencias