Cómo construir un dataset para entrenar un modelo

Fecha: 10 oct 2025
Visto: 1 vez

Este vídeo pertenece al “Módulo 3 – Análisis y exploración de información en Humanidades Digitales” del curso MOOC con título “Aprende los avances en IA en el procesamiento del lenguaje” disponible en UNED Abierta (https://iedra.uned.es/).

Utilizando la herramienta Transkribus y a partir de un corpus descargado desde la BNE con números del periódico histórico “Diario de Madrid” (1788-1825), se transcriben manualmente una pequeña cantidad de esos periódicos, utilizando una guía de transcripción elaborada por el equipo investigador, con los que se entrenará un nuevo modelo Transkribus que luego automáticamente, transcribirá el resto de los periódicos del corpus.

Licencia: Copyright (Licencia propietaria)
    • Ana García Serrano Directora del curso y Profesora de la ETSI Informática de la UNED