Palabras vacías

Palabras vacías

Palabras vacías

Palabras vacías es el nombre que reciben las palabras sin significado como artículos, pronombres, preposiciones, etc. que son filtradas antes o después del procesamiento de datos en lenguaje natural (texto). A Hans Peter Luhn, uno de los pioneros en recuperación de información, se le atribuye la acuñación de la locución inglesa stop words y el uso del concepto en su diseño. Está controlada por introducción humana y no automática.

No hay una lista definitiva de palabras vacías que todas las herramientas de procesamiento de lenguajes naturales incorporen. No todas las herramientas de PLN usan una lista de palabras vacías. Algunas herramientas evitan usarlo específicamente para soportar búsquedas por frase. El uso de un algoritmo de stemming puede reducir parte de la base lógica o dependencia de una lista de palabras vacías a filtrar.

Las palabras vacías pueden causar problemas al usar un motor de búsqueda para buscar frases que las incluyen, especialmente en nombres como 'La verdad' o 'Nunca Jamás'.

Véase también

Enlaces externos

Obtenido de "Palabras vac%C3%ADas"

Wikimedia foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Mira otros diccionarios:

  • Indización — De acuerdo a la norma ISO 5963 (1985) la indización es el proceso de describir o representar el contenido temático de un recurso de información. Este proceso da como resultado un índice de términos de indización que será utilizado como… …   Wikipedia Español

  • vacío — adj 1 Que no contiene nada: cajetillas vacías, botellas vacías, un vaso vacío 2 Que no está ocupado por nadie: sillas vacías, camiones vacíos, un departamento vacío, asientos vacíos 3 Que no tiene interés ni valor, que es superficial o vano: una… …   Español en México

  • Indización automática — La indización automática es la selección de un conjunto de términos que representen íntegramente un documento (texto, imagen, sonido) por medio de un programa informático. Hasta finales de la década de 1950, la indización se venía realizando en… …   Wikipedia Español

  • Latino sine Flexione — (latín sin flexión, abreviado LSF), también llamado Interlingua de Peano (abreviado IL), es una lengua auxiliar presentada por el matemático italiano Giuseppe Peano en el año 1903. Es una versión simplificada de la lengua latina, libre de… …   Wikipedia Español

  • Maurice Ravel — Joseph Maurice Ravel …   Wikipedia Español

  • Afternoon, a story — es una obra de literatura electrónica escrita en 1987 por el escritor estadounidense Michael Joyce. Fue publicada por la compañía Eastgate Systems en 1990 y está considerada como la primera obra de narrativa hipertextual. Contenido 1 Publicación… …   Wikipedia Español

  • Jean-Jacques Rousseau — Para otros usos de este término, véase Rousseau (desambiguación). Jean Jacques Rousseau Jean Jacques Rousseau a la edad de 41 años, pintado al pastel por …   Wikipedia Español

  • Michael Joyce — (n. 1945) es un escritor estadounidense conocido principalmente por ser uno de los pioneros en la utilización del hipertexto para la creación de obras narrativas de calidad. Su obra más conocida, Afternoon, a story (1987), distribuida por… …   Wikipedia Español

  • farfolla — sustantivo femenino 1. Área: botánica Envoltura de las mazorcas de maíz, mijo y panizo. 2. Uso/registro: coloquial. Pragmática: peyorativo. Cosa de mucha apariencia, pero de poca importancia: Su discurso no era más que farfolla, estaba llen …   Diccionario Salamanca de la Lengua Española

  • huero — ra adjetivo 1. [Huevo] que no ha sido fecundado por el macho y no produce cría: Esta gallina intenta incubar huevos hueros. 2. Uso/registro: elevado. Que no tiene sustancia o solidez: Fue un discurso huero, sin contenido, lleno de palabras vacía …   Diccionario Salamanca de la Lengua Española

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”