- Karen Spärck Jones
-
Karen Spärck Jones
Karen Spärck Jones en 2002Nacimiento 26 de agosto de 1935
Huddersfield, YorkshireFallecimiento 4 de abril de 2007
CambridgeshireResidencia Reino Unido Nacionalidad británica Instituciones Laboratorio de Computación (en la Universidad de Cambridge) Alma máter Universidad de Cambridge Conocido por trabajar en recuperación de datos y procesador de lenguajes naturales, en perticular su modelo probabilístico de documentos y recuperación de textos Premios
destacadosACL Lifetime Achievement Award, medalla BCS Lovelace, ACM-AAAI Allen Newell Award, ACM SIGIR Salton Award, American Society for Information Science and Technology’s Award of Merit Cónyuge Roger Needham Karen Spärck Jones (26 de agosto de 1935 – 4 de abril de 2007) fue una científica británica especializada en lingüística computación. Investigadora pionera en recuperación de información.
Contenido
Biografía
Karen Spärck nació en Huddersfield (Yorkshire). Su padre fue Owen Jones, un profesor en química y su madre fue Ida Spärck, que escapó de Noruega al Reino Unido durante la Segunda Guerra Mundial. Spärck Jones fue educada en una escuela gramática y luego en el Girton College, Cambridge desde 1953 hasta 1956, leyendo historia. Inicialmente ella era maestra en la escuela.
Comenzó su carrera investigadora en 1950 desarrollando un tesauro para la Unidad de Investigación del Lenguaje de la Universidad de Cambridge. En 1964 se doctoró con una tesis titulada Clasificación semántica y sinónima utilizando técnicas estadísticas y probabilísticas combinadas con técnicas lingüísticas. Su enfoque fue pionero en la materia.
Pudo seguir investigando en recuperación de información gracias a las distintas becas que le fueron concedidas por instituciones como la Royal Society o la Biblioteca Británica, hasta que fichó por el Laboratorio de Informática de la Universidad de Cambridge desde 1974 hasta su jubilación en 2002, aunque siguió trabajando allí hasta que murió por cáncer en 2007, en Willianghan (Cambridge).
Estuvo casada con Roger Needham desde 1958 hasta su fallecimiento.
Obra científica
Karen Spärck Jones lideró la indización automatizada creando un indicador capaz de hallar la importancia informativa de una palabra para un documento; lo que se llamaría a partir de entonces como indización ponderada o por pesos. Este logaritmo llamado ITF (inverse term frecuency o frecuencia inversa del término) obtiene la importancia de un término dependiendo del número de veces que aparezca en el documento en relación con el resto de términos que tenga. Este logaritmo desecha las palabras que aparezcan tanto en exceso como por defecto, al considerar que no aportan valor informativo suficiente como para describir el contenido del documento.
Este indicador daría paso a otro más importante todavía: el IDF (inverse document frecuency o frecuencia inversa del documento) cuyo procedimiento es similar al anterior pero que se emplea en todos los documentos de una base de datos. Con este logaritmo obtendríamos los documentos ordenados de mayor a menor relevancia ante una consulta. Este diseño fue el principio del modelo probabilístico de recuperación de información, desarrollado por Spärck Jones y Stephen Robertson, y continuado por otros investigadores como Keith van Rijsbergen, Peter Ingwersen o Ricardo Baeza-Yeats.
Publicaciones
Algunas de sus obras son:
- Automatic keywords classification for information retrieval. Londres : Butterworths, 1972
- Information retrieval experiment. Londres : Butterworths, 1981
- Readings in information retrieval (en coautoría con Willett). San Francisco : Morgan Kaufmann.
Publicó numerosos artículos en prestigiosas revistas de investigación científica, entre ellos:
- A statistical interpretation of term specificity and its application in retrieval (1972) en Journal of Documentation, nº 28.
- Index term weighting (1973) en Information Storage and Retrieval, nº 9.
Premios y condecoraciones
Ha sido galardonada con numerosos premios, entre ellos el Premio Gerard Salton en 1988, el Premio ASIST al Mérito Académico en 2002 o la medalla Lovelace en 2007, ya enferma de cáncer.
Bibliografía
- In memorian, Journal of de American Society for Information Science and Technology. 59(5). pp. 852-854, 2008.
- MOYA ANEGÓN; Felix de (2002): Técnicas avanzadas de recuperación de información. EN: Manual de ciencias de la documentación. Madrid : Pirámide.
Referencias externas
Categorías:- Nacidos en 1935
- Fallecidos en 2007
- Universidad de Cambridge
- Informáticos del Reino Unido
- Pedagogos del Reino Unido
- Fallecidos por cáncer
- Lingüística computacional
- Documentalistas del Reino Unido
- Premio ASIST al Mérito Académico
- Pioneros de la informática
Wikimedia foundation. 2010.