Título:
|
Minería de texto : Generación de resumen automático
|
Digitalizado bajo el título :
|
|
Autores:
|
Víctor Emanuel Rosas, Tesista ;
Carolina A. Cardoso, Docente guía
|
Tipo de documento:
|
texto manuscrito
|
Editorial:
|
Salta : Universidad Católica de Salta. Facultad de Ingeniería, 2019
|
Dimensiones:
|
140 p. / il. / 30 cm.
|
Material de acompañamiento:
|
1 CD
|
Nota general:
|
Tesis de Grado
Carrera: Ingeniería en Informática, Universidad Católica de Salta, 2019.
|
Langues:
|
Español
|
Clasificación:
|
TF004 (TF de Ciencia y tecnología de los ordenadores. Informática)
|
Materias:
|
Análisis de datos
|
Informática
|
Procesamiento de datos
|
Trabajo final de grado
|
Resumen:
|
La generación automática de resúmenes tiene como finalidad identificar la información más importante dentro de un texto o un conjunto de documentos y presentar los resultados obtenidos a los usuarios. Esta disciplina forma parte de las aplicaciones de la minería de texto donde a través de técnicas de aprendizaje automático se busca analizar textos no estructurados, reconocer patrones, comprender y extraer nueva información dentro de los mismos. Este proyecto se basa en analizar textos periodísticos publicados en un portal web informativo, analizando los aspectos generales y centrarse en la generación de resúmenes por extracción utilizando técnicas de aprendizaje automático supervisado. Para lograr esto se estudian las características de los textos, obteniendo los atributos más relevantes para la construcción de un modelo de clasificación, que permite catalogar los fragmentos de los artículos distinguiendo las oraciones más importantes dentro del mismo. El proceso de análisis y clasificación de textos se realiza sobre el software de minería de datos RapidMiner, y se hace uso de tecnologías web para poder presentar a los lectores los resultados obtenidos, a través de una interfaz que permite una fácil visualización de los fragmentos más relevantes de una noticia.
|