Montaje de secuencias


Montaje de secuencias

En bioinformática, el montaje o ensamblaje de secuencias se refiere al alineamiento y mezcla de múltiples fragmentos de una secuencia de ADN mucho mayor para reconstruir la secuencia original. Normalmente los fragmentos cortos provienen de secuenciación "por perdigonada" (shotgun) de ADN genómico, o de transcripción genética (ESTs, o marcadores de secuencia expresada).

La primera generación de montadores de secuencias empezaron a aparecer en los últimos 80 y primeros 90 del siglo XX, para reconstruir las grandes cantidades de fragmentos generadas por instrumentos de secuenciación automática. Estos ensambladores de primera generación utilizaban varias estrategias para manejar las secuencias repetitivas y los errores de secuenciación, que podían confundir el ensamblado. Sin embargo, no podían manejar genomas mucho más largos que los de una bacteria (varios millones de bases de ADN), y fueron siendo reemplazados conforme el campo se movía hacia genomas mayores. Los que se relacionan a continuación fueron montadores de primera generación ampliamente usados en los 90 en universidades, instituciones gubernamentales y en la industria:

  • Phrap, por Phil Green, de la University de Washington.
  • TIGR Assembler, por Granger Sutton, The Institute for Genomic Research.
  • CAP3, por Xiaoqiu Huang, del Michigan Technological University.

Ensambladores modernos, como DNA Baser,[1] han traído importantes mejoras sobre los de primera generación reduciendo el tiempo necesario para crear un contig desde decenas de minutos a segundos, usando algoritmos de ensamblado inteligente, ensamblado por lotes, y detección automática de calidad y zonas terminales de corte.

Contenido

Montadores para genomas largos

Enfrentados al desafío de ensamblar el mucho más largo genoma de la mosca de la fruta Drosophila melanogaster en el año 2000, así como el genoma humano sólo un año después, los científicos desarrollaron montadores como el Celera Assembler (el primero desarrollado por una compañía privada) y Arachne, capaces de manejar genomas de 100-300 millones de pares de bases. Con posterioridad a estos esfuerzos, otros grupos, principalmente de los mayores centros de secuenciación, construyeron ensambladores a gran escala, y un esfuerzo de código abierto conocido como AMOS se lanzó para aglutinar todas las innovaciones en la tecnología de ensamblado de genomas bajo el marco de código abierto.

En ensamblado de ESTs difiere del ensamblado de genomas en varias características. Por ejemplo, los genomas tienen, a menudo, grandes cantidades de secuencias repetitivas, principalmente en las partes intergénicas. Puesto que las ESTs representan transcripciones génicas, no contienen estas repeticiones. Por otra parte, los genes se solapan a veces en el genoma (transcripción sentido-antisentido), y podrían ser todavía ensamblados idealmente de forma separada. El montaje de ESTs también es complicado por características tales como (cis-)splicing alternativo, trans-splicing, polimorfismos de nucleótido simple, recodificación, y modificaciones post-transcripcionales. Estas diferencias hacen a las nuevas generaciones de ensambladores menos aplicables al ensamblaje de ESTs.

Algoritmo voraz para el montado de secuencias

Dado un conjunto de fragmentos de secuencia, el objetivo es encontrar la supersecuencia común (o secuencia origen de los fragmentos) más corta:

  1. Calcular alineamientos por pares de todos los fragmentos.
  2. Elegir los dos fragmentos con el mayor solapamiento.
  3. Mezclar los fragmentos elegidos.
  4. Repetir los pasos 2. y 3. hasta que sólo quede un fragmento.

El resultado es una solución subóptima al problema.

Referencias

Véase también


Wikimedia foundation. 2010.

Mira otros diccionarios:

  • montaje — 1) Comunicación. En cine, organizar las secuencias rodadas de una película, seleccionando, cortando y uniendo los trozos convenientes para lograr una copia completa. Cuando se trata de un original publicitario se utiliza paste up (arte final). 2) …   Diccionario de Economía Alkona

  • montaje — 1) Comunicación. En cine, organizar las secuencias rodadas de una película, seleccionando, cortando y uniendo los trozos convenientes para lograr una copia completa. Cuando se trata de un original publicitario se utiliza paste up (arte final). 2) …   Diccionario de Economía

  • Bioinformática — Saltar a navegación, búsqueda La bioinformática, según una de sus definiciones más sencillas, es la aplicación de tecnología de computadores a la gestión y análisis de datos biológicos.[1] Los términos bioinformática, biología computacional y, en …   Wikipedia Español

  • Max Mix — El Max Mix es el primer Megamix editado en España en el año 1985 por la compañía discográfica Max Music. Contenido 1 Origen 2 Historia 2.1 Las Innovaciones Tecnológicas 2.2 El Resurgimiento …   Wikipedia Español

  • Trilogía cinematográfica de El Señor de los Anillos — Cajas de la edición en blu ray de la trilogía completa, expuestas en un establecimiento para su venta. Título …   Wikipedia Español

  • Indiana Jones y la última cruzada — Para los videojuegos basados en la película, véase Indiana Jones and the Last Crusade (videojuegos). Indiana Jones and the Last Crusade …   Wikipedia Español

  • Harry Potter y el prisionero de Azkaban (película) — Harry Potter and the Prisoner of Azkaban Título Harry Potter y el prisionero de Azkaban Ficha técnica …   Wikipedia Español

  • Lev Kuleshov — Lev Vladímirovich Kuleshov (En ruso: Лев Владимирович Кулешов; Tambov, Imperio Ruso, 13 de enero de 1899 – Moscú, URSS, 29 de marzo de 1970) fue uno de los pioneros del cine soviético. Cineasta y teórico famoso por sus experimentos en torno al… …   Wikipedia Español

  • Thelma y Louise — Thelma Louise Título Thelma Louise Ficha técnica Dirección Ridley Scott Producción Mimi Polk Gitlin Ridley Scott …   Wikipedia Español

  • Clipgenerator — Desarrollador Trivid GmbH clipgenerator.com Información general Género ? …   Wikipedia Español