- WordNet
-
WordNet es una enorme base de datos léxica del idioma inglés. Agrupa las palabras en conjuntos de sinónimos llamados 'synsets', proporcionando definiciones cortas y generales, y almacenando las relaciones semánticas entre estos conjuntos de sinónimos. El propósito del proyecto es doble: por un lado producir una combinación de diccionario y tesauro cuyo uso es más intuitivo, y ayudar al análisis automático de textos y a las aplicaciones de inteligencia artificial. La base de datos y las herramientas se han liberado bajo una licencia BSD y pueden ser descargadas y usadas libremente. Además la base de datos puede consultarse online.
WordNet fue creado y es mantenido por el Cognitive Science Laboratory de la Universidad de Princeton bajo la dirección del profesor de psicología George A. Miller. El desarrollo comenzó en 1985. Durante los años el proyecto ha recibido alrededor de 3 millones de dólares, principalmente a través de agencias gubernamentales interesadas en traducción automática.
Contenido de la base de datos
Actualmente WordNet posee 147278 términos estructurados en 117659 synsets.
WordNet establece cuatro categorías gramaticales: nombres, verbos , adjetivos y adverbios, puesto que siguen diferentes reglas gramaticales. Cada synset contiene un grupo de palabras sinónimas o colocaciones (una colocación es una secuencia de palabras que juntas tienen un significado concreto, por ejemplo "car pool"); los diferentes sentidos de las palabras están en diferentes synsets. El significado de los synsets se clarifica con pequeñas glosas (definiciones y/o frases de ejemplo). Un ejemplo típico de synset con una pequeña glosa es:
good, right, ripe -- (más conveniente o correcto para un propósito en particular; "a good time to plant tomatoes"; "the right time to act"; "the time is ripe for great sociological changes")
Categorías:- Tesauros
- Traducción automática
- Diccionarios de inglés
Wikimedia foundation. 2010.