El uso de XML en las revistas académicas latinoamericanas

Introducción

Dentro de nuestro vocabulario como lectores y productores de artículos, ya conocemos que estos pueden existir en diferentes formatos, tales como doc, pdf y html. En este ecosistema de las diversas formas de los artículos, se integra a nuestra conversación el xml.

Para dar un contexto a esta conversación, podemos partir de las revistas como las conocíamos (y que existen y seguirán existiendo). Su formato es un impreso, de un tamaño agradable de sostener en nuestras manos, con letras y gráficas (fotografías en algunos casos) pensadas para facilitar la lectura de los contenidos. Estas revistas, en algunos casos verdaderas obras de arte seriadas, son estables en su diseño, es decir, estáticas. No importa en el país en que se lean o del lector que las manipule avanzando entre sus páginas, pues su estructura es siempre la misma.

Hoy en día, sin embargo, el formato digital es distinto. Podemos leer un artículo en un computador de escritorio, un tablet, un teléfono móvil y, en general, en diversos tipos de pantallas que existen y que podrán existir. Por ejemplo, se podría imaginar a un estudiante usando el transporte público camino a la universidad, leyendo en el viaje un artículo de nuestras revistas en la pantalla de su reloj de pulsera. Algo más actual es el caso de un querido maestro, ya jubilado, que me contó que estaba perdiendo la vista, pero que había adaptado el televisor de su casa para leer los artículos de las revistas digitales, dado que la pantalla es muy grande.

El texto digital, entonces, se adapta dependiendo del contexto donde se lea. De lo anterior se derivan dos aspectos: el formato del artículo (su tipo de letra, por ejemplo, o el tamaño de la misma) es independiente del contenido (lo que dice el artículo). Ello no ocurre en la revista impresa, pues su formato y su contenido están por siempre unidos.

El lenguaje xml no es sobre el formato, sino sobre el contenido. No trata de decir “usar letra Arial tamaño 14, centrado y justificado”, sino que dice “este es el apellido del autor y aquí está el nombre”. Ello tiene una serie de ventajas, pero antes.

La propuesta de Redalyc

En la “semana del acceso abierto” de octubre de 2015, Redalyc realizó una serie de seminarios online (webminars) para editores de revistas académicas, que publicitó a través de sus redes sociales. Entre los temas tratados precisamente se habló del lenguaje xml, pues Redalyc tiene una propuesta: crear un sistema online, gratuito, que ayude a los editores de nuestras revistas a crear los xml de los artículos.

Por el momento, la propuesta se discutirá en un blog cerrado, pero se puede participar enviando un correo a Eduardo Aguado (eduardo.aguado@redalyc.org) o Arianna Becerril (arianna.becerril@redalyc.org).

Ventajas de XML

Un editor, luego que termina el artículo desde el punto de vista del contenido, comienza con otra serie de preocupaciones. Los archivos escritos en Word son transformados por los diseñadores gráficos de las imprentas o por los webmasters del sitio de la revista en archivos pdf o html. Con todo lo importante que son estos formatos, hay un problema que no pueden solucionar: no les pueden decir a las máquinas qué tienen precisamente a su interior.

En otras palabras, un estudiante lee el título o el resumen de un artículo y rápidamente decide si le interesa, pero ¿cómo sabe una máquina cuál es el título del artículo que le podría interesar a nuestro lector? Para ilustrar el punto, me acuerdo de mi colega Marcelo Arnold Cathalifaud. Muchas veces la gente lo citaba así: Cathalifaud, M.A., pues para nosotros es fácil entender que Marcelo es el nombre y, dada la popularidad de Arnold Schwarzenegger, bueno, “Arnold” tiene que ser otro nombre, quedando Cathalifaud como el apellido. Los hablantes del idioma inglés también tienen esa estructura: primer nombre, inicial del segundo nombre, apellido, como Robert K. Merton. Para desgracia de Marcelo, su primer apellido es Arnold. Con el tiempo empezó a firmar los artículos como Arnold-Cathalifaud, otras veces solo como Arnold. Hoy en día hay que buscar en las bases de datos artículos de Arnold, Arnold-Cathalifaud y Arnold Cathalifaud.

Supongamos ahora que le decimos a las máquinas que buscan los artículos específicamente qué buscar, por ejemplo:

<name>

<given-name>Marcelo</given-name>

<surname>Arnold Cathalifaud</surname>

</name>

Expresado de otra manera, le estamos diciendo a una base de datos o a un robot buscador de Google: “Mire, aquí, en esta parte del documento, se encuentra el nombre del autor del artículo. Este es su nombre de pila y este otro es el apellido”.

Ya percibo que un editor está a punto de dejar de leer este documento y pasárselo a un ayudante o estudiante destacado para que siga trabajando en el xml de la revista. Sin embargo, la buena nueva es que el editor no tendrá que saber programar, no tendrá que memorizar los códigos o preocuparse de tener otra carga más en sus pesados hombros editoriales (solo un poco para ser honesto).

El propósito del xml es decir en un artículo dónde se encuentran los contenidos: aquí el resumen, aquí está la referencia bibliográfica tal o cual, ésta es la institución que representa al primer autor, mientras que el segundo autor representa a esta otra y así. Lo anterior no es para nosotros (que es una obviedad que casi parece insulto), sino para las computadoras que buscan y presentan la información. Lo que queremos los editores es que los lectores encuentren los artículos en que hemos trabajado con esfuerzo y los autores quieren ser leídos, citados y vueltos a encontrar.

Aspectos estéticos

Entiendo perfectamente que el ejemplo del código es de una fealdad propia del fauno. Sin embargo, un programa de computación que ya usamos, como InDesign o como Acrobat Pro, podría ir al archivo xml y sacar el nombre del autor, luego el apellido y ponerlo elegantemente en una página con el tipo de letra que queramos, en el lugar deseado y con todos los cuidados estéticos que tanto buscamos conservar en este mundo digital.

Supongamos que estamos leyendo un artículo en un teléfono móvil (como mucha gente lo hace mientras viaja en metro), pues bien, el navegador de Internet del teléfono diría: “Bueno, este es el poco espacio que tengo en la pantalla, entonces pondré el nombre y apellido aquí y hacia abajo seguiré diagramando los contenidos según vaya leyendo este estudiante”. Lo anterior es posible porque el teléfono sabe dónde está el contenido (va a buscarlo a la fuente xml original) y presenta la información con el cuidado estético del diseñador gráfico para móviles.

Los protocolos

La clave del proceso es que le llamemos a las cosas por su nombre, es decir, un apellido es aquello que se encuentre marcado como surname. Esto es arbitrario y no tiene más validez que aceptar un acuerdo entre las partes, en el más clásico de los estilos.

La propuesta de Redalyc es que usemos el protocolo JATS (Journal Article Tag Suite), hoy en día un standard, desarrollado originalmente por revistas del área de la salud en Estados Unidos.

SciELO también usa JATS, aunque “para atender las necesidades de procesamiento de SciELO fue necesario agregar nuevas etiquetas JATS”, como por ejemplo, identificar las agencias que financiaron la investigación que permitió el artículo (Packer et. al. 2014)

DOAJ (Directory of Open Access Journals) también usa XML, pero no usa el protocolo JATS.

Por lo tanto, estamos en una conversación en desarrollo y mucho más tendremos que hablar al respecto, pero parece que el lenguaje xml llegó para quedarse y sería bueno que nosotros, los editores de LATINOAMERICANA, ingresemos a este modelo de publicación, pues será beneficioso para nuestros autores de artículos como para los lectores que los buscan.

Francisco Osorio

Editor revista Cinta de Moebio

Referencias

Abel L. Packer, Eliana Salgado, Javani Araujo, Letícia Aquino, Renata Almeida, Jesner Santos, Suely Lucena, Caroline M. Soares. 2014. ¿Por qué XML? SciELO en Perspectiva. http://blog.scielo.org/es/2014/04/04/porque-xml/

DOAJ XML format https://doaj.org/features#xml_upload

JATS Journal Article Tag Suite http://jats.nlm.nih.gov/

Video en YouTube: https://youtu.be/WZN-HkK3wuA