MOOC: Aprende los avances en IA en el procesamiento del lenguaje - IA y PLN

Esta serie contiene los videos que complementan a los contenidos del curso MOOC de libre acceso (tras registro), disponible en UNED Abierta (https://iedra.uned.es/) con título “Aprende los avances en IA en el procesamiento del lenguaje”. El curso es una introducción teórico-práctica a la problemática que se plantea al trabajar con colecciones de textos (corpus) e intentar extraer información o interpretar su contenido en un contexto financiero, médico o periodo histórico. Además, en el módulo final (quinto) se abordan los retos actuales (a finales del 2025) y se incide en algunos aspectos de la revolución provocada por los Transformers en toda la tecnología con las aplicaciones IA (Inteligencia Artificial) o IAG (Inteligencia Artificial Generativa) como ChatGPT, Gemini y otros.

En general en el curso se pretende responder a la pregunta ¿Qué hacer cuando se dispone de corpus que contienen miles de textos, pero no de miles de millones de textos? ¿Pueden usarse tecnologías basadas en IA como son los modelos del lenguaje, en dominios específicos? En concreto se presentarán casos de estudio con corpus del dominio financiero (informes), médico (ensayos clínicos) e histórico (periódicos históricos de siglos pasados).

OBJETIVOS GENERALES DEL CURSO: Presentar la metodología y observar cómo la tecnología actual (2025) basada en Inteligencia Artificial (IA) se aplica en tareas de Procesamiento del Lenguaje Natural (PLN), en textos financieros, médicos o históricos.

OBJETIVOS ESPECÍFICOS DEL CURSO: Mostrar a nivel práctico las aproximaciones actuales basadas o no en IA necesarias para la gestión de corpus textuales para tratamiento tanto lingüístico como de dominio. Se presentarán conceptos relacionados con la creación de colecciones de textos, de anotación de documentos, de tareas y herramientas asociadas de interés para investigadores o profesionales no informáticos o interesados en la gestión de información textual.

El curso permitirá una aproximación fundamentalmente práctica al área del Procesamiento del Lenguaje Natural (PLN) y a la tecnología basada en la Inteligencia Artificial (IA) en que se basan actualmente aplicaciones bien conocidas como son los modelos del lenguaje o los sistemas de acceso, recuperación y visualización de información, de tipo propietario como es ChatGPT (Open AI), MidJourney, Copilot (Microsoft) o en abierto como Gemini (Google), Whisper, Perplexity y otras muchas que permiten a los grupos de investigación españoles refinar y crear nuevas aplicaciones para tareas específicas en español, como pueden ser el resumen de textos, la traducción o la simplificación de textos complejos en dominios específicos.