- Diccionario morfológico
-
Diccionario morfológico
Un diccionario morfológico es un archivo que contiene las correspondencias entre las formas superficiales y léxicas de las palabras. Las formas superficiales son palabras encontradas en un texto, en todas sus posibles formas (género, número, tiempo...). La forma léxica es la raíz o lema de las palabras, acompañado de esa información de género, número, etc. En español cantaríamos es una forma superficial, cuya forma léxica sería cantar, verbo, condicional, 1ª persona, plural. Se pueden encontrar 2 tipos de diccionarios morfológicos: alineados y no alineados.
Contenido
Diccionarios morfológicos alineados
En un diccionario morfológico alineado la correspondencia entre la forma superficial y léxica de una palabra se encuentra alineada a nivel de carácter. En el ejemplo anterior tendríamos:
- (c,c) (a,a) (n,n) (t,t) (θ,a) (θ,r) (θ,<vb>) (a,θ) (r,θ) (í,<cnd>) (a,θ) (m,<1>) (o,<pl>) (s,θ)
donde θ es el símbolo vacío y <vb>, <cnd>, <1>, <pl> se corresponden a verbo, condicional, 1ª persona y plural.
El primer carácter del carácter del ejemplo sería la entrada (forma superficial) y el segundo la salida (forma léxica). Esta ordenación sería valida para el uso en analizadores morfológicos, donde a partir de una forma superficial obtendríamos su forma léxica. En el caso del uso en generadores morfológicos la ordenación sería al revés.
Formalmente si Σ es el alfabeto de los símbolos de entrada y Γ el de los símbolos de salida, un diccionario morfológico alineado es un subconjunto donde:
es el alfabeto de todos los posibles alineamientos, incluyendo el símbolo vacío.
Diccionario morfológico no alineado
Un diccionario morfológico no alineado es simplemente un conjunto de parejas de palabras de entrada y salida. Un diccionario morfológico no alienado representaría el ejemplo anterior como:
(cantaríamos, cantar<vb><cnd><1><pl>)
Se puede obtener fácilmente un diccionario alineado a partir de uno no alineado.
Ambigüedades léxicas
En ocasiones puede existir más de una forma léxica asociada a una forma superficial. Por ejemplo canto puede corresponderse a la 1ª persona del singular del presente del verbo cantar, o bien, nombre (singular, masculino). Por ello es necesario una función que relaciona a las cadenas de entradas con sus correspondientes cadenas de salida.
Si definimos el conjunto de palabras de entrada, siendo . La función que haría la correspondencia sería definida como:
Referencias
- Alicia Garrido-Alenda and Mikel L. Forcada (2002). Comparing nondeterministic and quasideterministic finite-state transducers built from morphological dictionaries.
Véase también
- Traducción asistida
- Lingüística
- Traducción automática
- Traducción automática mediante lenguaje intermedio
- Traducción automática mediante transferencia
- Traducción automática basada en el contexto
- Traducción automática estadística
Categorías: Lingüística computacional | Bases de datos de traducción
Wikimedia foundation. 2010.