Cómo entrenar un modelo con un dataset

Fecha: 10 oct 2025
Visto: 1 vez

Este vídeo pertenece al “Módulo 3 – Análisis y exploración de información en Humanidades Digitales” del curso MOOC con título “Aprende los avances en IA en el procesamiento del lenguaje” disponible en UNED Abierta (https://iedra.uned.es/).

Utilizando la herramienta Transkribus y a partir de ficheros descargados desde la BNE conteniendo números del periódico histórico “Diario de Madrid” (1788-1825), en concreto con 201 páginas transcritas manualmente (35 números de periódico), se construye un dataset con el que se entrena un modelo Transkribus que luego automáticamente, transcribirá el resto de los periódicos del corpus.

Licencia: Copyright (Licencia propietaria)
    • Ana García Serrano Directora del curso y Profesora de la ETSI Informática de la UNED
    • Antonio Menta Garuz Profesional de IA y PLN
    • Yanco Torterolo Lingüista Computacional