- Sistema de Datos Astrofísicos
-
El Sistema de Datos Astrofísicos (Astrophysics Data System en inglés o ADS sus siglas) es una base de datos en línea, financiada por la NASA, con más de cinco millones de artículos científicos sobre astronomía y astrofísica en revistas con revisión por pares y de fuentes sin ella. Tiene disponibles los resúmenes de estos artículos de forma gratuita para casi todos los artículos, así como numerosos artículos antiguos totalmente escaneados, disponibles como ficheros GIF o PDF. Los artículos mas modernos contienen enlaces a sus versiones electrónicas en el servidor web de la revista científica. Sin embargo, éstos se encuentran disponibles generalmente tan solo bajo suscripción a las correspondientes revistas (como la mayoría de revistas de investigación en astronomía).
El ADS es una herramienta para la investigación extremadamente útil y ha tenido un fuerte impacto en la eficacia de la búsqueda de datos astronómicos desde su inicio en 1992. Las búsquedas en la literatura científica astronómica que antes duraban días o semanas pueden realizarse en unos pocos segundos utilizando el motor de búsqueda de ADS. Los estudios han demostrado que los beneficios del sistema ADS ascienden a varios cientos de millones de dólares al año y ha triplicado el número de lectores de revistas científicas de astronomía.
El uso de ADS entre los astrónomos profesionales es prácticamente universal y sus estadísticas son utilizadas frecuentemente para explorar el impacto de un árticulo o investigador así como las tendencias globales en el campo de la astronomía. Por ejemplo, se ha encontrado que la investigación en astrofísica producida en un país dado es proporcional al cuadrado del PNB per capita del país.Contenido
historia
Durante muchos años, un problema creciente en la investigación astronómica fue que el número de artículos publicados en las principales revistas astronómicas fue en constante aumento, es decir, los astrónomos fueron capaces de leer cada vez menos de los últimos resultados de la investigación. Durante el decenio de 1980, los astrónomos vieron que las tecnologías incipientes que constituyen la base de la Internet podría, eventualmente, ser utilizada para construir un sistema electrónico de indexación de documentos de investigación astronómica que permita a los astrónomos mantenerse al tanto de una gama mucho mayor de la investigación.
La primera sugerencia de una base de datos de resúmenes de artículos se hizo en una conferencia sobre la astronomía de grandes bases de datos, celebrada en Garching bei München en 1987. Cuyo desarrollo inicial se llevó a cabo durante los dos años siguientes y en 1991 tuvo lugar un debate sobre cómo integrar los anuncios con la base de datos SIMBAD, que contiene todos los objetos del catálogo de los objetos exteriores del sistema solar, para crear una sistema en el que los astrónomos pueden buscar todos los documentos escritos sobre un determinado objeto.
La versión inicial de la ADS, con una base de datos constaba de 40 documentos. Se creó como prueba del concepto en 1988 y la base de datos de la ADS se conectó con la base de datos SIMBAD en el verano de 1993. Los creadores de éste creían que sería el primer uso de Internet para permitir la consulta simultánea de las bases de datos científicos transatlántica. Hasta 1994, el servicio estaba disponible a través de la red de software propietario, pero se transfirió a la naciente World Wide Web a principios de ese año. El número de usuarios del servicio se cuadruplicó en las cinco semanas siguientes a la introducción de la ADS de servicio basado en la web.
En primer lugar, los artículos científicos disponibles a través de ADS fueron digitalizadas de mapas de bits en el documento creado a partir de revistas, pero a partir de 1995, el Diario Astrofísico comenzó a publicar una edición en línea, seguido por las otras principales revistas, como la Astronomía y Astrofísica y el mensual Notices of the Royal Astronomical Society. ADS proporcionado enlaces a estas ediciones electrónicas de su primera aparición. Desde aproximadamente 1995, el número de usuarios de ADS, se ha duplicado aproximadamente cada dos años. ADS tiene acuerdos con casi todas las revistas astronómicas, que el suministro de resúmenes. Escaneado de artículos en una fecha tan lejana como la de principios del siglo XIX están disponibles a través del servicio, que ahora contiene más de cinco millones de documentos. El servicio se distribuye en todo el mundo, con la base de datos sincronizados por medio de actualizaciones semanales utilizando rsync, reflejando una utilidad que permite las actualizaciones sólo en las partes de la base de datos que han cambiado.
Datos en el sistema
Los documentos están indexados en la base de datos de su registro bibliográfico, que contiene los detalles de la revista en que se publicaron y metadatos asociados, tales como listas de autor, las referencias y citas. Originalmente, estos datos se almacenan en formato ASCII, pero con el tiempo las limitaciones de este alentó a migrar todos los registros a un formato XML (Extensible Markup Language) el formato en 2000. Registros bibliográficos están ahora almacenadas como un elemento XML, con sub-elementos de metadatos para las diferentes [4].
Desde la aparición de las ediciones en línea de revistas, resúmenes se cargan en el ADS en o antes de la fecha de publicación de artículos, con el texto completo de revistas disponibles para los suscriptores. Artículos más antiguos han sido escaneados, y un resumen es creado usando software de reconocimiento óptico de caracteres. Artículos escaneados antes de 1995 son por lo general libres, de acuerdo con los editores de la revista [5].
Artículos escaneados se guardan en formato TIFF, tanto en media y alta resolución. Los archivos TIFF se convierten en la demanda en archivos GIF para la visualización en pantalla, y los archivos PDF o PostScript para imprimir. Los archivos generados son entonces para eliminar el caché innecesariamente frecuentes regeneraciones de artículos de divulgación. A partir de 2000, figuran ADS 250 GB de exploraciones, que consistía en 1128955 páginas de artículos que comprende 138.789 artículos. Para 2005 este había crecido a 650 GB, y se espera que crezca aún más, a alrededor de 900 GB para el 2007. [5]
La base de datos inicialmente sólo contiene referencias astronómicas, pero ahora ha crecido hasta incorporar tres bases de datos, que abarca la astronomía (incluyendo las ciencias planetarias y física solar) las referencias, la física (incluida la instrumentación y las ciencias de la tierra) las referencias, así como preimpresiones de documentos científicos de arXiv. La astronomía es la base de datos, con mucho, los más avanzados y su utilización representa alrededor del 85% del total de uso de la ADS. Los artículos son asignados a las diferentes bases de datos según el tema en lugar de la revista se publican en, por lo que los artículos de cualquier revista pueden aparecer en las tres bases de datos objeto. La separación de las bases de datos permite la búsqueda en cada disciplina que adaptarse, por lo que las palabras pueden ser automáticamente diferentes funciones de peso en las búsquedas de bases de datos diferentes, dependiendo de la forma en que son comunes en el ámbito pertinente. [4]
Datos en el archivo de preimpresión se actualiza diariamente a partir de la arXiv, el repositorio principal de la física y la astronomía preimpresiones. El advenimiento de los servidores de preimpresión tiene, al igual que la ADS, tuvo un impacto significativo sobre la tasa de la investigación astronómica, como papeles suelen ser puestos a disposición de los servidores de preimpresión semanas o meses antes de su publicación en las revistas. La incorporación de preimpresiones de ADS en la arXiv significa que el motor de búsqueda puede devolver la mayoría de las investigaciones actuales disponibles, con la salvedad de que es posible que las preimpresiones no han sido revisados por expertos o para corregir el nivel requerido para su publicación en las principales revistas. ADS en la base de datos de enlaces preimpresiones posteriormente con los artículos publicados, siempre que sea posible, de manera que las búsquedas de citas y referencia volverá vínculos con el artículo de revista, donde se citó la preimpresión
Software y hardware
El software que gestiona el sistema ha sido escrito específicamente para él, lo que permite una amplia personalización a las necesidades astronómicos que no habría sido posible con el propósito general de bases de datos de software. Los scripts están diseñados para ser lo más independiente de la plataforma como sea posible, habida cuenta de la necesidad de facilitar el reflejo de los distintos sistemas en todo el mundo, aunque el creciente predominio de Linux como sistema operativo de elección dentro de la astronomía ha llevado a aumentar la optimización de las secuencias de comandos para la instalación en que la plataforma [4]. El principal servidor de ADS se encuentra en el Harvard-Smithsonian Center for Astrophysics, en Cambridge, Massachusetts, y es una sola PC con dos 3,6 GHz CPUs y 6 GB de RAM, corriendo la Fedora Core distribución Linux [5]. Espejos se encuentran en la Argentina , Brasil, Chile, China, Francia, Alemania, India, Japón, Rusia, Corea del Sur y el Reino Unido [7].
Indización
ADS reciben actualmente los resúmenes o tablas de contenido de cerca de doscientas revistas fuentes. El servicio puede recibir los datos que se refieren al mismo artículo de múltiples fuentes, y crea una referencia bibliográfica sobre la base de la forma más precisa los datos de cada fuente. El uso común de TeX y LaTeX en casi todas las revistas científicas que facilita la incorporación de los datos bibliográficos en el sistema en un formato normalizado, y la importación de HTML con código de artículos basados en la web también es sencillo. ADS utiliza scripts Perl para la importación, el procesamiento y normalización de datos bibliográficos. [4] La aparentemente mundana tarea de convertir los nombres de los autores en una norma Apellido, Inicial formato es realmente uno de los más difíciles de automatizar, debido a la gran variedad de convenciones de nombres en todo el mundo y la posibilidad de que un determinado nombre de Davis, como podría ser un primer nombre, segundo nombre o apellido. La conversión exacta de los nombres requiere un conocimiento detallado de los nombres de los autores que actúan en la astronomía, y ADS mantiene una extensa base de datos de nombres de autores, que también se utiliza en la búsqueda de la base de datos (véase más adelante). Para los artículos electrónicos, una lista de las referencias dadas al final del artículo es fácil de extraer. Para artículos escaneados, la referencia se basa en la extracción de OCR. La base de datos de referencia puede ser "invertida" de la lista de citas para cada documento en la base de datos. Cita listas se han utilizado en el pasado para identificar los artículos de divulgación de la base de datos que faltan, la mayoría eran de antes de 1975 y ahora se han añadido al sistema.
Cobertura
La base de datos contiene actualmente más de siete millones de artículos. En los casos de las principales revistas de astronomía (Astrophysical Journal, Diario Astronómico, Astronomía y Astrofísica, Publicaciones de la Sociedad Astronómica del Pacífico y la Monthly Notices of the Royal Astronomical Society), la cobertura es completa, con todos los temas indexados de número 1 hasta el presente. Estas publicaciones representan aproximadamente dos tercios de los documentos en la base de datos, consistente con el resto de artículos publicados en más de 100 revistas de todo el mundo [5]. Si bien la base de datos contiene el contenido completo de todas las grandes revistas y muchos menores y, su cobertura de las referencias y citas es mucho menos completa. Referencias y citas de artículos en las principales revistas son bastante completa, pero las referencias tales como "comunicación privada", "en prensa" o "en preparación" no puede ser igualado, y autor de errores en las listas de referencia también introducir posibles errores. Astronómico documentos puede citar y ser citado por los artículos en revistas que quedan fuera del ámbito de la ADS, como la química, las matemáticas o la biología revistas [8].
Buscador
Desde su creación, el ADS ha desarrollado un muy sofisticado motor de búsqueda para consultar el resumen y las bases de datos objeto. El motor de búsqueda es específico para la búsqueda astronómica resúmenes, y el motor y su interfaz de usuario de suponer que el usuario está bien versado en astronomía y poder interpretar los resultados de búsqueda que se han diseñado para volver más que la mayoría de los documentos pertinentes. La base de datos puede ser consultado por nombres de autores, objeto astronómico nombres, las palabras del título, y las palabras en el resumen de texto, y los resultados se pueden filtrar en función de varios criterios. Trabaja por primera recopilación de sinónimos y la simplificación de los términos de búsqueda como se ha descrito anteriormente y, a continuación, la generación de un "archivo invertido", que es una lista de todos los documentos se pongan en venta cada término de búsqueda. El usuario, seleccione la lógica y los filtros se aplican a esta lista invertida para generar resultados de búsqueda de la final [9].
Nombre del autor consultas
El sistema de índices de nombres de los autores por apellido e iniciales, y las cuentas de las posibles variaciones en la ortografía de los nombres de una lista de variaciones. Esto es común en el caso de los acentos en los nombres, tales como diéresis y transliteraciones del árabe o cirílico. Un ejemplo de una entrada en la lista es sinónimo de autores: AFANASJEV, V AFANAS'EV, V AFANAS'IEV, V Afanasev, V AFANASYEV, V AFANS'IEV, V AFANSEV, V
Nombre de búsquedas
La capacidad de búsqueda de documentos sobre objetos astronómicos ADS es una de las más potentes herramientas. El sistema utiliza datos de la SIMBAD, la NASA / IPAC Extragaláctica base de datos, la Unión Astronómica Internacional y Circulares Lunar y Planetaria del Instituto para identificar los documentos de referencia a un determinado objeto, y también puede buscar por objeto posición, lista de documentos que se refieren a objetos dentro de un 10 arcminute un determinado radio de ascensión recta y declinación. Estas bases de datos se combinan las múltiples denominaciones catálogo podría tener un objeto, de modo que la búsqueda de las Pléyades se encuentran también los documentos de la famosa lista que cúmulo abierto en Tauro en virtud de cualquiera de sus otras denominaciones o catálogo de nombres populares, como el M45, las Siete Hermanas o Melotte 22. [10]
Título y resumen búsquedas
El motor de búsqueda de filtros primero los términos de búsqueda de varias maneras. Una M seguida de un espacio o guion tiene el espacio o guion eliminado, de manera que la búsqueda de catálogo Messier objetos se simplifica y las aportaciones de los usuarios de un M45, M 45 o M-45 todo ello en la misma consulta en ejecución, al igual que NGC denominaciones y los términos de búsqueda comunes como Zapatero Levy y T Tauri son despojados de los espacios. Palabras sin importancia, tales como AT, O y A son despojados a cabo, aunque en algunos casos la sensibilidad caso se mantiene, de manera que mientras que un segundo se pasa por alto, un segundo se convierte en "Andromedae", ER y H se convierte en "Herculis", pero h er no se tiene en cuenta [11].
Sinónimo de sustitución
Una vez que los términos de búsqueda se han pre-procesada, se consulta la base de datos con la versión revisada del término de búsqueda, así como sinónimos de la misma. Así como simple sinónimo de sustitución, como la búsqueda de las dos formas singular y plural, ADS, también busca un gran número de sinónimos específicamente astronómico. Por ejemplo, el espectrógrafo y espectroscopio han básicamente el mismo significado, y, en un contexto astronómico metalicidad y abundancia son también sinónimos. ADS's sinónimo lista se ha creado manualmente, mediante la agrupación de la lista de palabras en la base de datos de acuerdo con significados similares. [4] Así como el idioma Inglés sinónimos, ADS también busca Inglés traducciones de términos de búsqueda exterior y viceversa, de modo que la búsqueda de la palabra francesa soleil recupera referencias a Sun, y documentos en otros idiomas aparte del Inglés puede ser devuelto por el Inglés términos de búsqueda. Sinónimo de reemplazo puede ser desactivada si es necesario, de modo que un raro término que es sinónimo de un plazo mucho más común (como "fecha" en lugar de "fecha") puede ser buscado específicamente.
Selección lógica
el motor de búsqueda permite la selección lógica, tanto en los campos y entre campos. Términos de búsqueda en cada campo se puede combinar con OR, AND, simple lógica o lógica booleana, y el usuario puede especificar qué campos debe ir acompañada de los resultados de búsqueda. Esto permite búsquedas complejas a construir, por ejemplo, el usuario puede buscar los documentos relativos a NGC 6543 o NGC 7009, con el documento que contiene los títulos (radio o velocidad) y no (la abundancia o la temperatura).
Resultado filtrado
Resultados de la búsqueda se puede filtrar de acuerdo a una serie de criterios, incluyendo la especificación de un período de años como 1975 a'1945 ','2000 hasta el día de hoy "o" antes de 1900 », y qué tipo de revista el artículo aparece en el - no -artículos revisados por pares, tales como actas de congresos puede ser excluido o específicamente de búsqueda, revistas específicas o pueden ser incluidos o excluidos de la búsqueda.
Resultados de la búsqueda
Aunque fue concebido como un medio de acceder a los resúmenes y ponencias, ADS ofrece una cantidad sustancial de información auxiliar, junto con los resultados de búsqueda. Para cada resumen devuelto, se ofrecen enlaces a otros documentos en la base de datos que se refieren, y que citar el documento, y se proporciona un enlace a una preimpresión, cuando exista. El sistema también genera un enlace a «también de leer los artículos - esto es, los que se accede con más frecuencia por aquellos que lean el artículo. De esta manera, un usuario puede determinar ADS documentos que son de mayor interés para los astrónomos que están interesados en el tema de un documento [9]. También devueltos son enlaces a los SIMBAD y / o base de datos de la NASA Extragaláctica bases de datos de nombre de objeto, a través de la cual un usuario puede encontrar rápidamente los datos de observaciones básicas acerca de los objetos analizados en un documento, y de encontrar más documentos sobre los objetos.
Impacto en la astronomía
ADS es casi universalmente utilizado un instrumento de investigación entre los astrónomos, y su impacto en la investigación astronómica es considerable. Varios estudios han estimado cuantitativamente la forma mucho más eficiente ADS ha hecho la astronomía; estima que un ADS, aumentó la eficiencia de la investigación astronómica de 333 equivalente a tiempo completo año de investigación por año [1], y otro consideró que su efecto en 2002 fue equivalente a 736 investigadores de tiempo completo, o todas las investigaciones astronómicas hecho en Francia. [2] ADS ha permitido búsquedas bibliográficas que previamente han tomado días o semanas para llevar a cabo para ser completada en cuestión de segundos, y se estima que los anuncios se ha incrementado el número de lectores y uso de la literatura astronómica por un factor de tres desde su inicio [2]. En términos monetarios, este aumento en la eficiencia representa una cantidad considerable. Hay alrededor de 12.000 investigadores en todo el mundo astronómico activa, por lo que la ADS es el equivalente de alrededor del 5% de la población activa de los astrónomos. El presupuesto de investigación astronómica mundial se estima entre 4000 y 5000 millones de dólares [12], por lo que el valor de la ADS a la astronomía sería de unos 200-250 millones de dólares anuales. Su presupuesto de funcionamiento es una pequeña fracción de esta cantidad [2]. La gran importancia de la ADS a los astrónomos ha sido reconocida por las Naciones Unidas, la Asamblea General de ADS que ha elogiado por su labor y el éxito, en particular, señalando su importancia para los astrónomos en el mundo en desarrollo, en los informes de la Comisión de las Naciones Unidas sobre el pacífico Utilización del Espacio Ultraterrestre. Un informe de 2002 por un comité para visitar el Centro de Astrofísica, en tanto, dijo que el servicio había "revolucionado la utilización de la literatura astronómica" y era "probablemente la más valiosa contribución a la astronomía de investigación que el Comité de Libertad Sindical ha hecho en su vida "[13].
Estudios sociológicos utilizando ADS
Debido a que es utilizado casi universalmente por los astrónomos, ADS puede revelar mucho sobre cómo la investigación astronómica se distribuye en todo el mundo. La mayoría de los usuarios del sistema de alcance de los institutos de educación superior, cuya dirección IP se puede utilizar fácilmente para determinar la ubicación geográfica del usuario. Los estudios revelan que las más altas per cápita de usuarios de ADS son Francia y Países Bajos a base de los astrónomos, y mientras los países más desarrollados (medido por el PIB per cápita) utilizar el sistema más de los países menos desarrollados, la relación entre el PIB per cápita y el uso de ADS no lineal. La gama de usos ADS per cápita es muy superior a la gama de PIB per cápita, y la investigación básica llevada a cabo en un país, medida por el uso de ADS, se ha encontrado a ser proporcional al cuadrado del PIB del país dividido por su población. [ 2] ADS en las estadísticas de uso sugieren también que los astrónomos de los países más desarrollados tienden a ser más productivos que los de los países menos desarrollados. El importe de la investigación básica llevada a cabo es proporcional al número de astrónomos en un país, multiplicado por el PIB per cápita. Las estadísticas también implica que los astrónomos de las culturas europeas llevar a cabo unas tres veces más que las de investigación en las culturas asiáticas y tal vez sugiriendo las diferencias culturales en la importancia que se concede a la investigación astronómica. [2] ADS se ha utilizado también para mostrar que la fracción de un solo autor astronomía papeles ha disminuido sustancialmente desde 1975 y que los documentos astronómicos con más de 50 autores se han vuelto más común desde 1990 [14].
Referencias
1^ a b c d Kurtz, M.J.; Eichhorn G., Accomazzi A., Grant C.S., Murray S.S., Watson J.M. (2000). "The NASA Astrophysics Data System: Overview". Astronomy and Astrophysics Supplement 143: 41–59. doi:10.1051/aas:2000170.
2^ a b c d e f g Kurtz, M.J.; Eichhorn G., Accomazzi A., Grant C.S., Demleitner M., Murray S.S. (2005). "Worldwide Use and Impact of the NASA Astrophysics Data System Digital Library". The Journal of the American Society for Information Science and Technology 56: 36. doi:10.1002/asi.20095. (Preprint)
3^ Good, J. C. (1992). Diana M. Worrall, Chris Biemesderfer and Jeannette Barnes. ed. "Overview of the Astrophysics Data System (ADS), Astronomical Data Analysis Software and Systems I". A.S.P. Conference Series 25: 35.
4^ a b c d e f Accomazzi, A.; Eichhorn G., Kurtz M.J., Grant C.S., Murray S.S. (2000). "The NASA Astrophysics Data System: Architecture". Astronomy and Astrophysics Supplement 143: 85–109. doi:10.1051/aas:2000172.
5^ a b c d "NASA ADS Abstract Service Mirroring Information". Harvard-Smithsonian Center for Astrophysics. 23 June 2005. Retrieved on 2008-11-02.
6^ "APS - 2007 APS March Meeting - Event - myADS-arXiv: A fully customized, open access virtual journal". meetings.aps.org. Retrieved on 2008-10-30.
7^ "SAO/NASA ADS at SAO: Mirror Sites". doc.adsabs.harvard.edu. Retrieved on 2008-10-30.
8^ "ADS Bibliographic Codes: Journal Abbreviations". adsabs.harvard.edu. Retrieved on 2008-10-30.
9^ a b Eichhorn, G.; Kurtz M.J., Accomazzi A., Grant C.S., Murray S.S. (2000). "The NASA Astrophysics Data System: The search engine and its user interface". Astronomy and Astrophysics Supplement 143: 61–83. doi:10.1051/aas:2000171.
10^ "SAO/NASA ADS HELP: Abstract Query Form - Position". doc.adsabs.harvard.edu. Retrieved on 2008-10-30.
11^ "SAO/NASA ADS HELP: Abstract Query Form - Stop". doc.adsabs.harvard.edu. Retrieved on 2008-10-30.
12^ Woltjer, L. (1998). "Economic Consequences of the Deterioration of the Astronomical Environment". ASP Conference Series 139, Preserving the Astronomical Windows: 243.
13^ "ADS Awards and Recognition". NASA ADS. Retrieved on 2008-11-02.
14^ Schulman, E.; French J.C., Powell A.L., Eichhorn G., Kurtz M.J., Murray S.S. (1997). "Trends in Astronomical Publication Between 1975 and 1996". Publications of the Astronomical Society of the Pacific 109: 1278–1284. doi:10.1086/134008.
Enlaces externos
En inglés
Wikimedia foundation. 2010.