- Genomica computacional
-
La Genómica computacional se refiere al uso de análisis computacional para descifrar la biología de las secuencias del genoma y de datos, así como el ADN y la secuencia de ARN, así como otros "post-genómica" de datos (es decir, datos experimentales obtenidos con tecnologías que requieren la secuencia del genoma, tales como microarrays de ADN genómico). Como tal, la genómica computacional puede ser considerado como un subconjunto de la bioinformática, pero con un enfoque en el uso de todo el genoma (en lugar de genes individuales) para entender los principios de la forma en que el ADN de una especie de control de su biología a nivel molecular y más allá. Con la actual abundancia de grandes conjuntos de datos biológicos, estudios computacionales se han convertido en uno de los medios más importantes para el descubrimiento biológico. [1]
Contenido
Historia
Las raíces de la genómica computacional se comparten con los de la bioinformática. Durante la década de 1960, Margaret Dayhoff y otros en el Nacional de Investigación Biomédica de la Fundación reunido las bases de datos de secuencias de proteínas homólogas para el estudio de la evolución. Su investigación ha desarrollado un árbol filogenético que determina los cambios evolutivos que se requiere para una proteína particular se transforme en otra base de proteínas de las secuencias de aminoácidos subyacente.[2] Esto les llevó a crear una matriz de puntuación que evalúa la probabilidad de una proteína que se relaciona con otro.
A partir de la década de 1980, las bases de datos de secuencias del genoma comenzó a ser registrado, pero esto presenta nuevos desafíos en la forma de búsqueda y comparación de las bases de datos de información genética. A diferencia de los algoritmos de búsqueda de texto que se utilizan en los sitios web como Google o Wikipedia, la búsqueda de las secciones de similitud genética requiere para encontrar cadenas que no son simplemente idénticos, pero similares. Esto llevó al desarrollo del algoritmo de Needleman-Wunsch, que es un algoritmo de programación dinámica para comparar conjuntos de secuencias de aminoácidos entre sí mediante el uso de las matrices de puntuación derivada de la investigación anterior de Dayhoff. Más tarde, el algoritmo BLAST fue desarrollado para realizar búsquedas rápidas y optimizadas de bases de datos de secuencias de genes. BLAST y sus derivados son probablemente los algoritmos más utilizados para este propósito.[3]
La aparición de la frase "la genómica computacional" coincide con la disponibilidad de genomas completos secuenciados en la década de 1990 y finales. La primera reunión de la Conferencia Anual de Genómica Computacional, organizado por científicos del Instituto de Investigación Genómica (TIGR) en 1998, proporcionando un foro para esta especialidad y eficacia diferencial de esta área de la ciencia de los campos más generales de Biología Genómica Computacional o. El primer uso de este término en la literatura científica, de acuerdo con MEDLINE resúmenes, fue justo un año antes en Nucleic Acids Research. La última conferencia de Genómica Computacional se llevó a cabo en 2006, con una charla magistral del Premio Nobel de Barry Marshall, co-descubridor de la relación entre el Helicobacter pylori y las úlceras de estómago. A partir de 2010, las conferencias de liderazgo en el campo incluyen sistemas inteligentes de Biología Molecular (ISMB), vuelva, y el Laboratorio Cold Spring Harbor y reuniones Sanger Institute titulado "Biología de los Genomas" e "Informática del Genoma".
El desarrollo de las matemáticas asistida por ordenador (usando productos tales como Mathematica o Matlab) ha ayudado a los ingenieros, matemáticos y científicos informáticos para comenzar a operar en este ámbito, y una colección pública de estudios de casos y demostraciones está creciendo, que van desde las comparaciones del genoma completo de genes análisis de la expresión. . Esto ha aumentado la introducción de ideas diferentes, incluyendo los conceptos de sistemas y control, teoría de la información, el análisis de secuencias y minería de datos. Se prevé que los enfoques computacionales y seguir siendo un tema estándar para la investigación y la enseñanza, mientras que los estudiantes con fluidez tanto en los temas empiezan a ser formados en los cursos de creación de varios en los últimos años.[4]
Contribuciones
Las Contribuciones de la investigación genómica computacional a la biología son:
- descubrir patrones sutiles en las secuencias genómicas
- proponer redes de señalización celular
- proponer los mecanismos de la evolución del genoma
- predecir la localización precisa de todos los genes humanos utilizando técnicas de genómica comparativa con varias especies de mamíferos y vertebrados
- predecir conservadas regiones genómicas que están relacionados con el desarrollo embrionario temprano
- descubrir los posibles vínculos entre los motivos de secuencias repetidas y tejidos específicos de expresión génica
- Medir las regiones de los genomas que han evolucionado extraordinariamente rápido
Véase también
Referencias
- ↑ Computational Genomics and Proteomics at MIT
- ↑ David Mount (2000), Bioinformatics, Sequence and Genome Analysis, pp. 2-3, Cold Spring Harbor Laboratory Press, ISBN 0-87969-597-8
- ↑ T.A. Brown (1999), Genomes, John Wiley & Sons, ISBN 0-471-31618-0
- ↑ Cristianini, N. and Hahn, M. Introduction to Computational Genomics, Cambridge University Press, 2006. (ISBN 978-0-521-67191-0 | ISBN 0-521-67191-4)
Enlaces externos
- Harvard Extension School Biophysics 101, Genomics and Computational Biology, http://www.courses.fas.harvard.edu/~bphys101/info/syllabus.html
- University of Bristol course in Computational Genomics, http://www.computational-genomics.net/
Wikimedia foundation. 2010.