DARIAH Annual Event 2023
La Biblioteca Virtual Miguel de Cervantes (BVMC) asistirá al congreso DARIAH Annual Event 2023 en Budapest los días 6 al 9 de Junio. El programa se encuentra disponible en el siguiente enlace.
La participación de nuestra Biblioteca en el evento incluye la presentación del trabajo realizado a través del centro de competencia en digitalización Impact sobre el futuro y desafíos para las instituciones de patrimonio cultural.
Además, se presentará un póster sobre etiquetado y enriquecimiento de textos basado en las obras de la BVMC que se ha realizado en colaboración con estudiantes del Máster de Estudios Literarios de la Universidad de Alicante. Una selección de textos editados en TEI-XML se han enriquecido a través de la base de conocimiento Wikidata con enlaces de eventos, lugares deidades y seres mitológicos. El objetivo es entrenar un modelo de reconocimiento de entidades nombras en el texto (Named-Entity Recognition, en inglés) con la librería de procesamiento del lenguaje natural Spacy. La siguiente figura muestra los pasos a seguir para crear el modelo.
En total, se han anotado 8 obras creando alrededor de 500 enlaces a Wikidata. Gracias al enriquecimiento, es posible crear visualizaciones a partir de las localizaciones incluidas en una obra como por ejemplo el Burlador de Sevilla de Tirso de Molina:
Este trabajo se ampliará con la anotación de más obras y la creación de una colección de Jupyter Notebooks que permitan la reproducibilidad de los resultados.
Este trabajo ha sido realizado en colaboración con la red INTELE.