Stemming

Stemming

Stemming es un método para reducir una palabra a su raíz o (en inglés) a un stem o tema. Hay algunos algoritmos de stemming que ayudan en sistemas de recuperación de información. Stemming aumenta el recall que es una medida sobre el número de documentos que se pueden encontrar con una consulta. Por ejemplo una consulta sobre "bibliotecas" también encuentra documentos en los que solo aparezca "bibliotecario" porque el stem de las dos palabras es el mismo ("bibliotec").

Contenido

Algoritmos

El algoritmo más común para stemming es el algoritmo de Porter. Existen además métodos basados en análisis lexicográfico y otros algoritmos similares (KSTEM, stemming con cuerpo, métodos lingüísticos...).

Software

Snowball es un pequeño lenguaje de programación para el manejo de strings que permite implementar fácilmente algoritmos de stemming. Se puede generar código en ANSI C y Java. Las páginas de Snowball contienen stemmers para 12 idiomas (incluido el castellano , catalán y euskera). Todas las explicaciones, sin embargo, son dadas en inglés.

Stemming en buscadores comerciales

Desde hace poco tiempo Google utiliza stemming al igual que MSN search (donde tiene que activarse explícitamente). En general, los buscadores comerciales no dan muchas explicaciones sobre los algoritmos utilizados.

Enlaces externos


Wikimedia foundation. 2010.

Игры ⚽ Поможем написать реферат

Mira otros diccionarios:

  • Stemming — is the process for reducing inflected (or sometimes derived) words to their stem, base or root form ndash; generally a written word form. The stem need not be identical to the morphological root of the word; it is usually sufficient that related… …   Wikipedia

  • Stemming — es un método para reducir una palabra a su raíz o mejor a un stem o tema. Hay algunos algoritmos de stemming que ayudan en sistemas de recuperación de información. Stemming aumenta el recall que es una medida sobre el número de documentos que se… …   Enciclopedia Universal

  • Stemming — Als Stemming (Grundformenreduktion, Normalformenreduktion) bezeichnet man im Information Retrieval ein Verfahren, mit dem verschiedene morphologische Varianten eines Wortes auf ihren gemeinsamen Wortstamm zurückgeführt werden, z. B. Wikis… …   Deutsch Wikipedia

  • Stemming — Dt. Bildung von Wortstämmen . Bezeichnet die Reduzierung eines Wortes auf seinen Wortstamm. Stemming wird von fortschrittlichen Suchdiensten genutzt, um die Zahl gefundener Suchergebnisse zu maximieren und den Recall zu verbessern. Stemming… …   SEO Wörterbuch

  • Stemming — Normalformenreduktion; Grundformenreduktion * * * Stemming   [von engl. stem »Stamm«], die Rückführung von Wörtern auf ihre Wortstämme als Strategie zur Verbesserung einer Suche in Dokumenten (Dokumentsuchsystem). Stemming ermöglicht es, einen… …   Universal-Lexikon

  • Stemming — Stem Stem, v. t. [imp. & p. p. {Stemmed}; p. pr. & vb. n. {Stemming}.] [Either from stem, n., or akin to stammer; cf. G. stemmen to press against.] To oppose or cut with, or as with, the stem of a vessel; to resist, or make progress against; to… …   The Collaborative International Dictionary of English

  • stemming — noun a) Movement against a current, especially a tidal current. b) A process for removing the inflexional, and sometimes derivational, affixes from words. See Also: stemming algorithm …   Wiktionary

  • stemming search — kaitomoji paieška statusas T sritis informatika apibrėžtis Paieška pagal įvairias pateikto žodžio gramatines formas. Pavyzdžiui, pateikus žodį „žmogus“ turėtų būti pateikiami radiniai, kuriuose yra bet kuris iš žodžių: „žmogus“, „žmogaus“,… …   Enciklopedinis kompiuterijos žodynas

  • stemming — stem n. central stalk of a plant; petiole; slender part which connects or supports; main part of a word to which affixes are added (Grammar); family line of descent, ancestry v. arise, come from, originate; remove the stem from; stop, check, dam… …   English contemporary dictionary

  • stemming — present part of stem …   Useful english dictionary

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”