Extracción de la información
- Extracción de la información
-
Extracción de la información
La Extracción de la información (de sus siglas en inglés IE, Information Extraction) es un tipo de recuperación de la información cuyo objetivo es extraer automáticamente información estructurada o semiestructurada desde documentos legibles por una computadora.
Una aplicación típica de IE es el escaneado de una serie de documentos escritos en una lengua natural y rellenar una base de datos con la información extraída. Las tendencias actuales en relación con la IE utilizan técnicas de procesamiento de lenguaje natural que se centran en áreas muy restringidas. Por ejemplo, la Message Understanding Conference (MUC), o Conferencia para la Comprensión de Mensajes es una competición que se ha centrado en los siguientes aspectos durante los últimos años:
- MUC-1 1987, MUC-2 1989: Mensajes para operaciones navales.
- MUC-3 1991: Terrorismo en países latinoamericanos.
- MUC-5 1993: Microelectrónica.
- MUC-6 1995: Nuevos artículos a cerca de los cambios en la gerencia.
- MUC-7 1998: Informes de lanzamiento de satélites.
Táreas típicas de la IE
Reconocimiento de nombres de personas, organizaciones, lugares, expresiones temporales y ciertas expresiones numéricas.
Coreferencialidad: identificar distintos sintagmas nominales que se refieren al mismo objeto. La anáfora es un tipo de coreferencialidad.
Véase también
Enlaces externos
Categoría: Lingüística computacional
Wikimedia foundation.
2010.
Mira otros diccionarios:
Extracción de la información — La Extracción de la información (IE) es un tipo de Recuperación de la información cuyo objetivo es extraer automáticamente información estructurada o semiestructurada desde documentos legibles por la máquina. Una aplicación típica de IE es el… … Enciclopedia Universal
Sistema de Información Geográfica — En la imagen capas raster y vectoriales en el SIG de código libre QGIS, usado como interfaz gráfica de usuario de GRASS … Wikipedia Español
Gestión de la Información — La Gestión de la Información, (GI), es un conjunto de procesos por los cuales se controla el ciclo de vida de la información, desde su obtención por creación o captura, hasta su disposición final archivada o eliminada. Los procesos también… … Wikipedia Español
Reconocimiento de patrones — El reconocimiento de patrones es la ciencia que se ocupa de los procesos sobre ingeniería, computación y matemáticas relacionados con objetos físicos o abstractos, con el propósito de extraer información que permita establecer propiedades de… … Wikipedia Español
General Architecture for Text Engineering — GATE ventana principal de GATE Developer v5 Desarrollador GATE research team … Wikipedia Español
Plataforma G — Saltar a navegación, búsqueda G es una tecnología basada en Grid desarrollado por la compañía maat GKnowledge, que gracias a su entorno de desarrollo basado en XML, garantiza su interoperabilidad con otros sistemas de Información preexistentes y… … Wikipedia Español
Procesamiento de lenguajes naturales — Saltar a navegación, búsqueda El Procesamiento de Lenguajes Naturales abreviado PLN, o NLP del idioma inglés Natural Language Processing es una subdisciplina de la Inteligencia Artificial y la rama ingenieril de la lingüística computacional. El… … Wikipedia Español
Documentación — Saltar a navegación, búsqueda En sentido restringido, la documentación como ciencia documental se podría definir (a grandes rasgos) como la ciencia del procesamiento de la información. Integradora y globalizadora, se trata de una ciencia… … Wikipedia Español
Lingüística computacional — La lingüística computacional es un campo multidisciplinar de la lingüística y la informática que utiliza la informática para estudiar y tratar el lenguaje humano. Para lograrlo, intenta modelar de forma lógica el lenguaje natural desde un punto… … Wikipedia Español
Marca de agua digital — Observación de una imagen con la etiqueta Brian Kell 2006 , de manera degradada y visible en la parte central. El watermarking o marca de agua digital es una técnica de ocultación de información que forma parte de las conocidas como… … Wikipedia Español