Clustal


Clustal
Clustal
Desarrollador
Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (University College Dublin)
Clustal
Información general
Última versión estable 2.1
14. Octubre de 2008
Género Herramienta bioinformática
Sistema operativo UNIX, Linux, Mac, Windows
Licencia Libre para uso académico
En español ?

Clustal es un programa de computadora ampliamente utilizado para realizar alineamientos múltiples de secuencias. La última versión es la 2.0.12 (2009), cuya principal novedad es que fue completamente reescrita en C++.[1] Hay dos variantes:

  • ClustalW: interfaz de línea de comandos
  • ClustalX: esta versión tiene una interfaz gráfica. Está disponible para Unix/Linux, Mac OS y Windows.

El programa está disponible en European Bioinformatics Institute ftp server o en www.clustal.org.

Contenido

Entrada/Salida

Este programa acepta un amplio rango de formatos de entrada. Incluyendo NBRF/PIR, FASTA, EMBL/Swissprot, Clustal, GCC/MSF, GCG9 RSF y GDE.

El formato de salida puede ser alguno de los siguientes: Clustal, NBRF/PIR, GCG/MSF, PHYLIP, GDE, NEXUS.

Alineamiento múltiple de secuencias

Hay tres etapas importantes:

  1. Hacer un alineamiento por pares
  2. Crear un árbol filogenético (o usar un árbol definido por el usuario)
  3. Usar el árbol filogenético para llevar a cabo el alineamiento múltiple

Esto es hecho automáticamente cuando seleccionas "Do Complete Alignment" ("Hacer el alineamiento completo", en español). Otras opciones son "Do Alignment from guide tree" ("Hacer el alienamiento con el árbol guía) y "Produce guide tree only" ("Sólo producir el árbol guía).

Alineamientos de perfiles

Los alineamientos de parejas son computados con un método todos contra todos y las similitudes son guardadas en una matriz. Esta es luego convertida en una matriz de distancias, donde la longitud de la distancia refleja la distancia evolutiva entre cada par de secuencias.

De esta matriz de distancias, es creado un árbol de guía o filogenético utilizando un algoritmo de clustering neighbour-joining para determinar el orden n que los pares de secuencias serán alineados y combinados con alineamientos previos. Las secuencias son alineadas progresivamente en cada punto de ramificación empezando por los pares de secuencias más cercanos.

Configuraciones

Los usuarios pueden alinear las secuencias usando las configuraciones por defecto, pero ocasionalmente es más útil personalizar los parámetros. Los principales parámetros son la penalización por abrir huecos ("gaps") y por extenderlos.

Versión acelerada

Una versión basada en FPGA del algoritmo ClustalW es ofrecida por Progeniq, mostrando ser 20 veces más veloz que otras implementaciones.

Referencias

  1. Thompson JD, Gibson TJ, Plewniak F, Jeanmougin F, Higgins DG (1997). The ClustalX windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acids Research, 25:4876-4882.
  2. Chenna R, Sugawara H, Koike T, Lopez R, Gibson TJ, Higgins DG, Thompson JD (2003). Multiple sequence alignment with the Clustal series of programs. Nucleic Acids Res, 31:3497-3500.
  3. Larkin, M.A.et al. (2007): Clustal W and Clustal X version 2.0. In: Bioinformatics. Bd. 23, S. 2947-2948. PMID 17846036

Enlaces externos


Wikimedia foundation. 2010.

Mira otros diccionarios:

  • Clustal W — Clustal Entwickler: Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Aktuelle Version: 2.10 (14. Oktober 2008) Betriebssystem …   Deutsch Wikipedia

  • Clustal — Entwickler Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Aktuelle Version 2.1 (17. November 2010) Betriebssystem Unix, Linux, Mac OS X, Microsoft Win …   Deutsch Wikipedia

  • Clustal — Developer(s) Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Stable release 2.1 / 17 November 2010; 11 months ago (2010 11 17) Written in C++ …   Wikipedia

  • Clustal — Omega Тип Биоинформатика Разработчик Des Higgins, Fabian Sievers, David Dineen и Andreas Wilm (Conway Institute, UCD) Написана на C++ Операционная система UNIX, Linux, Mac, Windows Последняя версия 1.1.0 ( …   Википедия

  • ClustalW — Clustal Entwickler: Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Aktuelle Version: 2.10 (14. Oktober 2008) Betriebssystem …   Deutsch Wikipedia

  • ClustalX — Clustal Entwickler: Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD) Aktuelle Version: 2.10 (14. Oktober 2008) Betriebssystem …   Deutsch Wikipedia

  • Multiple sequence alignment — A multiple sequence alignment (MSA) is a sequence alignment of three or more biological sequences, generally protein, DNA, or RNA. In many cases, the input set of query sequences are assumed to have an evolutionary relationship by which they… …   Wikipedia

  • Alineamiento múltiple de secuencias — Un alineamiento múltiple de secuencias (MSA, por sus siglas en inglés) es un alineamiento de tres o más secuencias biológicas, generalmente proteínas, ADN o ARN. En general, se asume que el conjunto de secuencias de consulta que se ingresa como… …   Wikipedia Español

  • Alineamiento de secuencias — Un alineamiento de secuencias en bioinformática es una forma de representar y comparar dos o más secuencias o cadenas de ADN, ARN, o estructuras primarias proteicas para resaltar sus zonas de similitud, que podrían indicar relaciones funcionales… …   Wikipedia Español

  • Sequence alignment — In bioinformatics, a sequence alignment is a way of arranging the sequences of DNA, RNA, or protein to identify regions of similarity that may be a consequence of functional, structural, or evolutionary relationships between the sequences.[1]… …   Wikipedia