Usando Aprendizaje Automático para Extraer Información de Noticias de Desastres Naturales

Alberto Téllez Valero, Manuel Montes y Gómez, Luis Villaseñor Pineda

Resumen


LOS DESASTRES CAUSADOS POR FENÓMENOS NATURALES HAN ESTADO PRESENTES DESDE EL PRINCIPIO DE LA HISTORIA DEL HOMBRE; SIN EMBARGO, SUS CONSECUENCIAS SON CADA VEZ MAYORES. ESTA TENDENCIA PODRÍA NO SER REVERTIDA EN LOS PRÓXIMOS AÑOS; AL CONTRARIO, SE ESPERA QUE LOS FENÓMENOS NATURALES PUEDAN INCREMENTAR EN NÚMERO E INTENSIDAD DEBIDO AL CALENTAMIENTO GLOBAL. A CAUSA DE ESTA SITUACIÓN ES DE GRAN INTERÉS TENER SUFICIENTES DATOS RELACIONADOS A LOS DESASTRES NATURALES, YA QUE ESTOS DATOS SON ABSOLUTAMENTE NECESARIOS PARA ANALIZAR SU IMPACTO ASÍ COMO PARA ESTABLECER CONEXIONES ENTRE SU OCURRENCIA Y SUS EFECTOS. EN CORRESPONDENCIA CON ESTA NECESIDAD, EN ESTE ARTÍCULO DESCRIBIMOS UN SISTEMA BASADO EN MÉTODOS DE APRENDIZAJE AUTOMÁTICO QUE MEJORA LA ADQUISICIÓN DE DATOS DE DESASTRES NATURALES. ESTE SISTEMA AUTOMÁTICAMENTE LLENA UNA BASE DE DATOS DE DESASTRES NATURALES CON LA INFORMACIÓN EXTRAÍDA DE NOTICIAS DE PERIÓDICOS EN LÍNEA. EN PARTICULAR, ESTE SISTEMA PERMITE EXTRAER INFORMACIÓN ACERCA DE CINCO TIPOS DE DESASTRES NATURALES: HURACANES, TEMBLORES, INCENDIOS FORESTALES, INUNDACIONES Y SEQUÍAS. LOS RESULTADOS EXPERIMENTALES EN UNA COLECCIÓN DE NOTICIAS EN ESPAÑOL MUESTRAN LA EFICACIA DEL SISTEMA PROPUESTO TANTO PARA DETECTAR DOCUMENTOS RELEVANTES SOBRE DESASTRES NATURALES (ALCANZANDO UNA MEDIDA-F DE 98%), ASÍ COMO PARA EXTRAER HECHOS RELEVANTES PARA SER INSERTADOS EN UNA BASE DE DATOS DADA (ALCANZANDO UNA MEDIDA-F DE 76%).

Palabras clave


Aprendizaje Automático; Extracción de Información; Clasificación Temática de Textos; Desastres Naturales; Bases de Datos

Texto completo:

PDF


Contacto:
Oscar Zavala