Anexo:Software para alineamiento de secuencias
Esta lista de software para alineamiento de secuencias es una compilación de herramientas software y portales web usados en alineamiento de secuencias de pares y alineamiento múltiple de secuencias. Ver Anexo:Software para alineamiento estructural para alineamiento estructural de proteínas.
Sólo búsquedas en bases de datos
editarNombre | Descripción | Tipo de secuencia* | Enlace | Referencia | Año |
---|---|---|---|---|---|
BLAST | Búsqueda local de k-tuplas (Basic Local Alignment Search Tool) | Ambos | NCBI EBI DDBJ DDBJ (psi-blast) GenomeNet PIR (Sólo proteínas) | [1] | 1990 |
Extensión combinatoria | Búsqueda de alineamiento estructural | Proteína | servidor | ||
FASTA | Búsqueda local de k-tuplas | Ambos | EBI DDBJ GenomeNet PIR (Sólo proteínas) | [2] | 1985 |
GGSEARCH / GLSEARCH | Alineamiento con estadística Global:Global (GG), Global:Local (GL) | Proteína | servidor FASTA | ||
HMMER | Búsqueda de perfiles ocultos de Markov | Proteína/ADN | Descargar DDBJ (HMMPFAM) | [3][4] | 1998 |
IDF | Inverse Document Frequency | Ambos | Descargar | ||
Infernal | Búsqueda SCFG de perfil | ARN | Descargar | [5] | 2009 |
SAM | Búsqueda de perfiles ocultos de Markov | Proteína/ADN | SAM | [6] | 1999 |
SSEARCH2SEQ | Búsqueda Smith-Waterman (más sensible que FASTA) | Ambos | SSEARCH2SEQ servidor | [7][8] | 1991 |
SWIMM | Búsqueda Smith-Waterman en arquitecturas multicore y manycore de Intel | Proteína | Descargar | [9] | 2015 |
*Tipo de secuencia: Proteína o nucleótido |
Alineamiento de pares de secuencias
editarNombre | Descripción | Tipo de secuencia* | Tipo de alineamiento** | Enlace | Referencia | Año |
---|---|---|---|---|---|---|
ACANA | Alineamiento de secuencias de ADN, diseñada para secuencias que comparten regiones conservadas y/o alta frecuencia de las largas inserciones o deleciones | ADN | Local y global | ACANA | [10] | 2006 |
BioconductorpairwiseAlignment
(paquete Biostrings) |
Programación dinámica | ADN y ARN | Local, global y solapamientos (ends-free) | Biostrings | [11][12] | 2008 |
BioPerl dpAlign | Programación dinámica | Ambos | Ambos + Ends-free | sitio web | Y. M. Chan | 2003 |
BLASTZ | Coincidencia de patrones (seeded pattern-matching) | Nucleótido | Local | descargar | [13][14] | 2003 |
DNADot | Herramienta dot-plot basada en web | Nucleótido | Global | servidor | R. Bowen | 1998 |
DOTLET | Herramienta dot-plot basada en Java | Ambos | Global | Dotlet Help sitio web | [15] | 2000 |
GGSEARCH2SEQ,
SSEARCH2SEQ, GLSEARCH |
Alineamiento con estadísticas Global:Global (GG), Local:Local (SS), Global:Local (GL) | Proteína | Global y local | GGSEARCH2SEQ servidorSSEARCH2SEQ servidorservidor FASTA | [7][8] | 1991 |
JAligner | Implementación Java de código abierto de Smith-Waterman | Ambos | Local | JWS | [16][17][18] | 2005 |
LALIGN | Múltiple, sin solapamiento, similitud local (mismo algoritmo que SIM) | Ambos | Local sin solapamiento | LALIGN servidorLALIGN/PLALIGN servidor FASTA | [19][8] | 1991 (algoritmo) |
matcher | Needleman optimizado para memoria, pero lenta programación dinámica (basado en LALIGN) | Ambos | Local | servidor | I. Longden (modificado de W. Pearson) | 1999 |
MCALIGN2 | Modelos explicites de evolución indel | ADN | Global | servidor | J. Wang et al. | 2006 |
MUMmer | Basado en árboles de sufijos | Nucleótido | Global | descargar | S. Kurtz et al. | 2004 |
needle | Programación dinámica Needleman-Wunsch | Ambos | Global | Needle servidorEBI | [20][21][8] | 1999 |
Ngila | Costes de hueco (gap) logarítmicos y modelos explícitos de evolución indel | Ambos | Global | descargar | R. Cartwright | 2007 |
PatternHunter | Concidencia de patrones (seeded pattern-matching) | Nucleótido | Local | descargar | [22][23] | 2002-2004 |
ProbA (also propA) | Muestreo por función de partición estocástica vía programación dinámica | Ambos | Global | descargar | [24] | 2002 |
PyMOL | El comando "align" alinea las sequencias y lo aplica a la estructura | Proteína | Global (por selección) | PyMOL sitio web oficial | [25] | 2000 |
REPuter | Basado en árboles de sufijos | Nucleótido | Local | descargar | [26] | 2001 |
SEQALN | Diferentes programaciones dinámicas | Ambos | Local o Global | servidor | M.S. Waterman and P. Hardy | 1996 |
SIM, GAP, NAP, LAP | Similitud local con tratamientos variables de los gaps | Ambos | Local o global | servidor | X. Huang and W. Miller | 1990-6 |
SIM | Similitud local | Ambos | Local | servidores | X. Huang and W. Miller | 1991 |
SLIM Search | Alineamiento de bloques ultrarrápido | Ambos | Ambos | sitio web | L. Bloksberg | 2004 |
stretcher | Optimizado para memoria, pero lenta programación dinámica | Ambos | Global | Stretcher servidorEBI | [27][21][8] | 1999 |
tranalign | Alinea secuencias de ácidos nucléicos dado un alineamiento de proteínas | Nucleótido | NA | servidor | G. Williams (modificado de B. Pearson) | 2002 |
water | Programación dinámica Smith-Waterman | Ambos | Local | Water servidor EBI | [28][21][8] | 1999 |
wordmatch | Coincidencia de k-tuplas por pares | Ambos | NA | Documentación | [21] | 1998 |
YASS | Coincidencia de patrones (seeded pattern-matching) | Nucleótido | Local | servidor descargar | [29] | 2005 |
*Tipo de secuencia: Proteína o Nucleótido. **Tipo de alineamiento: Local o global |
Alineamiento múltiple de secuencias
editarNombre | Descripción | Tipo de secuencia* | Tipo de alineamiento Type** | Enlace | Referencia | Año |
---|---|---|---|---|---|---|
ABA | Alineamiento A-Bruijn | Proteína | Global | descargar | [30] | 2004 |
ALE | Alineamiento manual; alguna asistencia software | Nucleótidos | Local | descargar | J. Blandy y K. Fogel | 1994 (última versión 2007) |
AMAP | Annealing de secuencias | Ambos | Global | servidor | [31] | 2007 |
BAli-Phy | Alineamientos árbol+multi; probabilísticos/bayesianos; joint estimation | Ambos | Global | WWW+descargar | [32][33] | 2006 (última versión 2021) |
BoulderALE | Alineamiento, anotación de pares de bases Watson-Crick y no Watson-Crick, y de estructuras secundarias | ARN | Local o Global | BoulderALE | [34] | 2011 |
COBALT | Alineamiento basado en restricciones de múltiples secuencias de proteínas, con anotación de dominios. | Proteína | Local o global | Linux executable download | [35] | 2007 |
CodonCode Aligner | Multi-alineamiento; soporte ClustalW y Phrap | Nucleótidos | Local o Global | descargar | P. Richterich et al. | 2003 (última versión 2007) |
CHAOS/DIALIGN | Alineamiento iterativo | Ambos | Local (preferida) | servidor | [36] | 2004 |
ClustalW | Alineamiento progresivo | Ambos | Local o Global | descargar EBI DDBJ PBIL EMBNet GenomeNet | [37] | 1994 |
DIALIGN-TX y DIALIGN-T | Método basado en segmentos | Ambos | Local (preferida) o Global | descargar y servidor | [38] | 2005 (última versión 2008) |
ADN Baser | Multi-alineamiento | Ambos | Local o Global + post-proceso | ADN Baser (comercial) | M. Gabriel | publicado en 2005 |
Ed'Nimbus | Seeded filtration | Nucleótidos | Local | servidor | [39] | 2006 |
Geneious | Alineamiento progresivo/iterativo; plugin para ClustalW | Ambos | Local o Global | descargar | [40] | 2006 (última versión 2012) |
Kalign | Alineamiento progresivo | Ambos | Global | servidorEBI MPItoolkit | [41][42] | 2005 (versión más reciente 2019) |
MSA | Programación dinámica | Ambos | Local o Global | descargar | [43] | 1989 (modificado 1995) |
PRRN/PRRP | Alineamiento iterativo (especialmente refinamiento) | Proteína | Local o Global | PRRP PRRN | Y. Totoki (basado en O. Gotoh) | 1991 y posteriores |
POA | Modelo oculto de Markov/orden parcial | Proteína | Local o Global | descargar | [44] | 2002 |
SAM | Modelo oculto de Markov | Proteína | Local o Global | servidor | [45][46] | 1994 (versión más reciente 2009) |
MAFFT | Alineamiento progresivo/iterativo | Ambos | Local o Global | GenomeNet MAFFT | [47] | 2002 |
MAVID | Alineamiento progresivo | Ambos | Global | servidor | [48] | 2004 |
MULTALIN | Programación dinámica/clustering | Ambos | Local o Global | servidor | [49] | 1988 |
Multi-LAGAN | Alineamiento progresivo por programación dinámica | Ambos | Global | servidor | [50] | 2003 |
MUSCLE | Alineamiento progresivo/iterativo | Ambos | Local o Global | servidor | [51] | 2004 |
ProbCons | Probabilístico/consistencia | Proteína | Local o Global | servidor | [52] | 2005 |
PSAlign | Alineamiento preservando no-heurística | Ambos | Local o Global | descargar | [53] | 2006 |
SAGA | Alineamiento de secuencias por algoritmo genético | Proteína | Local o Global | descargar | [54] | 1996 (nueva versión 1998) |
T-Coffee | Alineamiento progresivo más sensible | Ambos | Local o Global | servidor | [55] | 2000 |
RevTrans | Combina ADN y alineamiento de proteínas, por traducción inversa de alineamiento de proteínas a ADN. | ADN/Proteína (especial) | Local o Global | servidor | [56] | 2003 (versión más reciente 2005) |
*Tipo de secuencia: Proteína o nucleótido. **Tipo de alineamiento: Local o global |
Análisis genómico
editarNombre | Descripción | Tipo de secuencia* | Enlace |
---|---|---|---|
SLAM | Predicción de genes, alineamiento, anotación (identificación de homología humano-ratón) | Nucleótido | servidor |
Mauve | Alineamiento múltiple de genomas reorganizados | Nucleótido | descargar |
MGA | Alineador múltiple de genomas | Nucleótido | descargar |
Mulan | Alineamientos múltiples locales de secuencias de tamaño genómico | Nucleótido | servidor |
Sequerome | Perfilado de información sobre alineamiento de secuencias recurriendo a los principales servidores/servicios | Nucleótido/péptido | servidor |
AVID | Alineamiento global por pares con genomas completos | Nucleótido | servidor |
SIBsim4 / Sim4 | Programa diseñado para alinear una secuencia expresada de ADN con una secuencia genómica, permitiendo intrones | Nucleótido | descargar |
Shuffle-LAGAN | Alineamiento glocal de pares de regiones de genoma completas | Nucleótido | servidor |
ACT (Artemis Comparison Tool) | Sintenía y genómica comparativa | Nucleótido | servidor |
*Tipo de secuencia: Proteína o nucleótido |
Predicción de motivos
editarNombre | Descripción | Tipo de secuencia* | Enlace | Referencia | Año |
---|---|---|---|---|---|
BLOCKS | Identificación de motivos sin huecos en la base de datos BLOCKS | Ambos | servidor | ||
DREME | Identificación ab initio de motivos de sitios de unión de factores de transcripción al ADN en eucariotas. Diseñado para datos de ChIP-Seq. Obsoleto desde 2021; sustituido por STREME | ADN | servidor | [57] | 2011 |
eMOTIF | Extracción e identificación de motivos cortos | Ambos | servidors | ||
Gibbs motif sampler | Extracción estocástica de motivos por probabilidad estadística | Ambos | servidor (una de varias implementaciones) | [58][59] | 1995 (última versión 2003) |
I-sites | Biblioteca de motivos estructurales locales | Proteína | servidor | ||
MAST | Búsqueda y descubrimiento de motivos mediante la búsqueda de coincidencias entre una secuencia y un conjunto de motivos conocidos | Ambos | servidor | [60] | 1998 |
MEME | Búsqueda y descubrimiento de motivos | Ambos | servidor | [61][62] | 1995 |
PHI-Blast | Búsqueda de motivos y herramienta de alineamiento | Ambos | servidor | ||
PRATT | Generación de patrones para usar con ScanProsite | Proteína | servidor | [63][64] | 1995 (última versión 1997) |
ScanProsite | Herramienta de búsqueda de motivos en base de datos | Proteína | servidor | [65] | 2006 |
STREME | Identificación ab initio de motivos | Ambos | servidor | [66] | 2021 |
TEIRESIAS | Extracción de motivos y búsqueda en base de datos | Ambos | servidor | [67] | 1998 |
*Tipo de secuencia: Proteína o nucleótido |
Benchmarking
editarNombre | Enlace | Autores |
---|---|---|
BAliBASE | descargar | Thompson, Plewniak, Poch |
HOMSTRAD | descargar | Stebbings, Mizuguchi |
Oxbench | descargar | Raghava, Searle, Audley, Barber, Barton |
PFAM | descargar | |
PREFAB | descargar | Edgar |
SABmark | descargar | Van Walle, Lasters, Wyns |
SMART | descargar | Letunic, Copley, Schmidt, Ciccarelli, Doerks, Schultz, Ponting, Bork |
Visualizadores
editarJalview es un visualizador de alineamientos múltiples de secuencias, que se usa para integrar los resultados de una predicción de estructura secundaria vía el servidor web JPred, con un alineamiento múltiple de secuencias dado como entrada o derivado durante la ejecución del algoritmo.
Referencias
editar- ↑ Altschul, S. F.; Gish, W.; Miller, W.; Myers, E. W.; Lipman, D. J. (5 de octubre de 1990). «Basic local alignment search tool». Journal of Molecular Biology 215 (3): 403-410. ISSN 0022-2836. PMID 2231712. doi:10.1016/S0022-2836(05)80360-2. Consultado el 9 de julio de 2023.
- ↑ Lipman, D. J.; Pearson, W. R. (22 de marzo de 1985). «Rapid and sensitive protein similarity searches». Science (New York, N.Y.) 227 (4693): 1435-1441. ISSN 0036-8075. PMID 2983426. doi:10.1126/science.2983426. Consultado el 9 de julio de 2023.
- ↑ Durbin, R.; Eddy, S.; Krogh, A.; Mitchison, G. (1998). Biological sequence analysis: probabilistic models of proteins and nucleic acids (PDF) (en inglés). Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-62971-3. Archivado desde el original el 9 de marzo de 2023. Consultado el 9 de julio de 2023.
- ↑ Eddy, S. R. (1998). «Profile hidden Markov models». Bioinformatics (Oxford, England) 14 (9): 755-763. ISSN 1367-4803. PMID 9918945. doi:10.1093/bioinformatics/14.9.755. Consultado el 13 de julio de 2023.
- ↑ Nawrocki, Eric P.; Kolbe, Diana L.; Eddy, Sean R. (15 de mayo de 2009). «Infernal 1.0: inference of RNA alignments». Bioinformatics (Oxford, England) 25 (10): 1335-1337. ISSN 1367-4811. PMC 2732312. PMID 19307242. doi:10.1093/bioinformatics/btp157. Consultado el 13 de julio de 2023.
- ↑ Karplus, K.; Barrett, C.; Cline, M.; Diekhans, M.; Grate, L.; Hughey, R. (1999). «Predicting protein structure using only sequence information». Proteins. Suppl 3: 121-125. ISSN 0887-3585. PMID 10526360. doi:10.1002/(sici)1097-0134(1999)37:3+<121::aid-prot16>3.3.co;2-h. Consultado el 13 de julio de 2023.
- ↑ a b Pearson, W. R. (Noviembre de 1991). «Searching protein sequence libraries: comparison of the sensitivity and selectivity of the Smith-Waterman and FASTA algorithms». Genomics 11 (3): 635-650. ISSN 0888-7543. PMID 1774068. doi:10.1016/0888-7543(91)90071-l. Consultado el 24 de septiembre de 2023.
- ↑ a b c d e f Madeira, Fábio; Pearce, Matt; Tivey, Adrian R N; Basutkar, Prasad; Lee, Joon; Edbali, Ossama; Madhusoodanan, Nandana; Kolesnikov, Anton et al. (1 de julio de 2022). «Search and sequence analysis tools services from EMBL-EBI in 2022». Nucleic acids research 50 (W1): W276-W279. ISSN 1362-4962. PMC 9252731. PMID 35412617. doi:10.1093/nar/gkac240. Consultado el 24 de septiembre de 2023.
- ↑ Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (25 de diciembre de 2015). «An energy-aware performance analysis of SWIMM: S mith- W aterman implementation on I ntel's M ulticore and M anycore architectures: AN ENERGY-AWARE PERFORMANCE ANALYSIS OF SWIMM». Concurrency and Computation: Practice and Experience (en inglés) 27 (18): 5517-5537. doi:10.1002/cpe.3598. Consultado el 9 de julio de 2023.
- ↑ Huang, Weichun; Umbach, David M.; Li, Leping (1 de enero de 2006). «Accurate anchoring alignment of divergent sequences». Bioinformatics (Oxford, England) 22 (1): 29-34. ISSN 1367-4803. PMID 16301203. doi:10.1093/bioinformatics/bti772. Consultado el 17 de septiembre de 2023.
- ↑ Patrick Aboyoun, Gentleman Lab (16 de mayo de 2023). «Pairwise Sequence Alignments» (PDF) (en inglés). Fred Hutchinson Cancer Research Center Seattle, WA.
- ↑ Pagès H., Aboyoun P., Gentleman R., DebRoy S., H. (2023). «Biostrings - Efficient manipulation of biological strings. Version: Release (2.68.1)». Bioconductor.
- ↑ Schwartz, Scott; Kent, W. James; Smit, Arian; Zhang, Zheng; Baertsch, Robert; Hardison, Ross C.; Haussler, David; Miller, Webb (Enero de 2003). «Human-mouse alignments with BLASTZ». Genome Research 13 (1): 103-107. ISSN 1088-9051. PMID 12529312. doi:10.1101/gr.809403. Consultado el 16 de septiembre de 2023.
- ↑ Harris, Robert S. (2007). Improved Pairwise Alignmnet of Genomic DNA (Thesis) (PDF) (en inglés). Pennsilvania State University, College of Engineering. Consultado el 17 de septiembre de 2023.
- ↑ Junier, T.; Pagni, M. (Febrero de 2000). «Dotlet: diagonal plots in a web browser». Bioinformatics (Oxford, England) 16 (2): 178-179. ISSN 1367-4803. PMID 10842741. doi:10.1093/bioinformatics/16.2.178. Consultado el 24 de octubre de 2023.
- ↑ Smith, T. F.; Waterman, M. S. (25 de marzo de 1981). «Identification of common molecular subsequences». Journal of Molecular Biology 147 (1): 195-197. ISSN 0022-2836. PMID 7265238. doi:10.1016/0022-2836(81)90087-5. Consultado el 24 de septiembre de 2023.
- ↑ Gotoh, O. (15 de diciembre de 1982). «An improved algorithm for matching biological sequences». Journal of Molecular Biology 162 (3): 705-708. ISSN 0022-2836. PMID 7166760. doi:10.1016/0022-2836(82)90398-9. Consultado el 24 de septiembre de 2023.
- ↑ Ahmed Moustafa (2010). «JAligner: Java Implementation of the Smith-Waterman Algorithm for Biological Sequence Alignment». SourceForge. Consultado el 24 de septiembre de 2023.
- ↑ Pearson, W. R. (Noviembre de 1991). «Searching protein sequence libraries: comparison of the sensitivity and selectivity of the Smith-Waterman and FASTA algorithms». Genomics 11 (3): 635-650. ISSN 0888-7543. PMID 1774068. doi:10.1016/0888-7543(91)90071-l. Consultado el 24 de septiembre de 2023.
- ↑ Needleman, S. B.; Wunsch, C. D. (Marzo de 1970). «A general method applicable to the search for similarities in the amino acid sequence of two proteins». Journal of Molecular Biology 48 (3): 443-453. ISSN 0022-2836. PMID 5420325. doi:10.1016/0022-2836(70)90057-4. Consultado el 24 de septiembre de 2023.
- ↑ a b c d Rice, Peter; Longden, Ian; Bleasby, Alan (Junio de 2000). «EMBOSS: The European Molecular Biology Open Software Suite». Trends in Genetics 16 (6): 276-277. ISSN 0168-9525. doi:10.1016/s0168-9525(00)02024-2. Consultado el 24 de septiembre de 2023.
- ↑ Ma, Bin; Tromp, John; Li, Ming (Marzo de 2002). «PatternHunter: faster and more sensitive homology search». Bioinformatics (Oxford, England) 18 (3): 440-445. ISSN 1367-4803. PMID 11934743. doi:10.1093/bioinformatics/18.3.440. Consultado el 16 de septiembre de 2023.
- ↑ Li, Ming; Ma, Bin; Kisman, Derek; Tromp, John (Septiembre de 2004). «Patternhunter II: highly sensitive and fast homology search». Journal of Bioinformatics and Computational Biology 2 (3): 417-439. ISSN 0219-7200. PMID 15359419. doi:10.1142/s0219720004000661. Consultado el 16 de septiembre de 2023.
- ↑ Mückstein, U.; Hofacker, I. L.; Stadler, P. F. (2002). «Stochastic pairwise alignments». Bioinformatics (Oxford, England). 18 Suppl 2: S153-160. ISSN 1367-4803. PMID 12385998. doi:10.1093/bioinformatics/18.suppl_2.s153. Consultado el 16 de septiembre de 2023.
- ↑ Schrödinger LLC & DeLano W. (2020). «PyMOL by Schrödinger». Consultado el 24 de septiembre de 2023.
- ↑ Kurtz, S.; Choudhuri, J. V.; Ohlebusch, E.; Schleiermacher, C.; Stoye, J.; Giegerich, R. (15 de noviembre de 2001). «REPuter: the manifold applications of repeat analysis on a genomic scale». Nucleic Acids Research 29 (22): 4633-4642. ISSN 1362-4962. PMID 11713313. doi:10.1093/nar/29.22.4633. Consultado el 16 de septiembre de 2023.
- ↑ Myers, E W; Miller, W (1 de marzo de 1988). «Optimal alignments in linear space». Computer applications in the biosciences 4 (1): 11-17. ISSN 0266-7061. PMID 3382986. doi:10.1093/bioinformatics/4.1.11. Consultado el 24 de septiembre de 2023.
- ↑ Smith, T F; Waterman, M S (1 de marzo de 1981). «Identification of common molecular subsequences». Journal of molecular biology 147 (1): 195-197. ISSN 1089-8638. PMID 7265238. doi:10.1016/0022-2836(81)90087-5. Consultado el 24 de septiembre de 2023.
- ↑ Noé, Laurent; Kucherov, Gregory (1 de julio de 2005). «YASS: enhancing the sensitivity of DNA similarity search». Nucleic Acids Research 33 (Web Server issue): W540-543. ISSN 1362-4962. PMC 1160238. PMID 15980530. doi:10.1093/nar/gki478. Consultado el 16 de septiembre de 2023.
- ↑ Raphael, Benjamin; Zhi, Degui; Tang, Haixu; Pevzner, Pavel (Noviembre de 2004). «A novel method for multiple alignment of sequences with repeated and shuffled elements». Genome Research 14 (11): 2336-2346. ISSN 1088-9051. PMID 15520295. doi:10.1101/gr.2657504. Consultado el 14 de julio de 2023.
- ↑ Schwartz, Ariel S.; Pachter, Lior (15 de enero de 2007). «Multiple alignment by sequence annealing». Bioinformatics (Oxford, England) 23 (2): e24-29. ISSN 1367-4811. PMID 17237099. doi:10.1093/bioinformatics/btl311. Consultado el 14 de julio de 2023.
- ↑ Suchard, Marc A.; Redelings, Benjamin D. (15 de agosto de 2006). «BAli-Phy: simultaneous Bayesian inference of alignment and phylogeny». Bioinformatics (Oxford, England) 22 (16): 2047-2048. ISSN 1367-4811. PMID 16679334. doi:10.1093/bioinformatics/btl175. Consultado el 14 de julio de 2023.
- ↑ Redelings, Benjamin D. (29 de septiembre de 2021). «BAli-Phy version 3: model-based co-estimation of alignment and phylogeny». Bioinformatics (Oxford, England) 37 (18): 3032-3034. ISSN 1367-4811. PMID 33677478. doi:10.1093/bioinformatics/btab129. Consultado el 14 de julio de 2023.
- ↑ Stombaugh, Jesse; Widmann, Jeremy; McDonald, Daniel; Knight, Rob (15 de junio de 2011). «Boulder ALignment Editor (ALE): a web-based RNA alignment tool». Bioinformatics (Oxford, England) 27 (12): 1706-1707. ISSN 1367-4811. PMC 3106197. PMID 21546392. doi:10.1093/bioinformatics/btr258. Consultado el 14 de julio de 2023.
- ↑ Papadopoulos, Jason S.; Agarwala, Richa (1 de mayo de 2007). «COBALT: constraint-based alignment tool for multiple protein sequences». Bioinformatics (Oxford, England) 23 (9): 1073-1079. ISSN 1367-4811. PMID 17332019. doi:10.1093/bioinformatics/btm076. Consultado el 21 de julio de 2023.
- ↑ Brudno, Michael; Steinkamp, Rasmus; Morgenstern, Burkhard (1 de julio de 2004). «The CHAOS/DIALIGN WWW server for multiple alignment of genomic sequences». Nucleic Acids Research 32 (Web Server issue): W41-44. ISSN 1362-4962. PMID 15215346. doi:10.1093/nar/gkh361. Consultado el 14 de julio de 2023.
- ↑ Thompson, J. D.; Higgins, D. G.; Gibson, T. J. (11 de noviembre de 1994). «CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice». Nucleic Acids Research 22 (22): 4673-4680. ISSN 0305-1048. PMID 7984417. doi:10.1093/nar/22.22.4673. Consultado el 14 de julio de 2023.
- ↑ Subramanian, Amarendran Ramaswami (2009). Segment-based Multiple Sequence Alignment (Doctoral thesis) (PDF) (en alemán). Eberhard-Karls-Universität Tübingen. Consultado el 21 de julio de 2023.
- ↑ Peterlongo, Pierre (2006). DNA sequence filtration for the problem of finding long multiple repetitions (Doctoral thesis) (PDF) (en francés). Université de Marne-la-Vallée. Consultado el 21 de julio de 2023.
- ↑ Kearse, Matthew; Moir, Richard; Wilson, Amy; Stones-Havas, Steven; Cheung, Matthew; Sturrock, Shane; Buxton, Simon; Cooper, Alex et al. (15 de junio de 2012). «Geneious Basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data». Bioinformatics (Oxford, England) 28 (12): 1647-1649. ISSN 1367-4811. PMC 3371832. PMID 22543367. doi:10.1093/bioinformatics/bts199. Consultado el 21 de julio de 2023.
- ↑ Lassmann, Timo; Sonnhammer, Erik L. L. (12 de diciembre de 2005). «Kalign--an accurate and fast multiple sequence alignment algorithm». BMC bioinformatics 6: 298. ISSN 1471-2105. PMC 1325270. PMID 16343337. doi:10.1186/1471-2105-6-298. Consultado el 15 de julio de 2023.
- ↑ Lassmann, Timo (26 de octubre de 2019). «Kalign 3: multiple sequence alignment of large data sets». Bioinformatics (Oxford, England) 36 (6): 1928-1929. ISSN 1367-4811. PMC 7703769. PMID 31665271. doi:10.1093/bioinformatics/btz795. Consultado el 15 de julio de 2023.
- ↑ Lipman, D. J.; Altschul, S. F.; Kececioglu, J. D. (Junio de 1989). «A tool for multiple sequence alignment». Proceedings of the National Academy of Sciences of the United States of America 86 (12): 4412-4415. ISSN 0027-8424. PMID 2734293. doi:10.1073/pnas.86.12.4412. Consultado el 21 de julio de 2023.
- ↑ Lee, Christopher; Grasso, Catherine; Sharlow, Mark F. (Marzo de 2002). «Multiple sequence alignment using partial order graphs». Bioinformatics (Oxford, England) 18 (3): 452-464. ISSN 1367-4803. PMID 11934745. doi:10.1093/bioinformatics/18.3.452. Consultado el 15 de julio de 2023.
- ↑ Karplus, K.; Barrett, C.; Cline, M.; Diekhans, M.; Grate, L.; Hughey, R. (1999). «Predicting protein structure using only sequence information». Proteins. Suppl 3: 121-125. ISSN 0887-3585. PMID 10526360. doi:10.1002/(sici)1097-0134(1999)37:3+<121::aid-prot16>3.3.co;2-h. Consultado el 14 de julio de 2023.
- ↑ Karplus, Kevin (Julio de 2009). «SAM-T08, HMM-based protein structure prediction». Nucleic Acids Research 37 (Web Server issue): W492-497. ISSN 1362-4962. PMC 2703928. PMID 19483096. doi:10.1093/nar/gkp403. Consultado el 14 de julio de 2023.
- ↑ Katoh, Kazutaka; Misawa, Kazuharu; Kuma, Kei-ichi; Miyata, Takashi (15 de julio de 2002). «MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform». Nucleic Acids Research 30 (14): 3059-3066. ISSN 1362-4962. PMID 12136088. doi:10.1093/nar/gkf436. Consultado el 15 de julio de 2023.
- ↑ Bray, Nicolas; Pachter, Lior (Abril de 2004). «MAVID: constrained ancestral alignment of multiple sequences». Genome Research 14 (4): 693-699. ISSN 1088-9051. PMID 15060012. doi:10.1101/gr.1960404. Consultado el 15 de julio de 2023.
- ↑ Corpet, F. (25 de noviembre de 1988). «Multiple sequence alignment with hierarchical clustering». Nucleic Acids Research 16 (22): 10881-10890. ISSN 0305-1048. PMID 2849754. doi:10.1093/nar/16.22.10881. Consultado el 15 de julio de 2023.
- ↑ Brudno, Michael; Do, Chuong B.; Cooper, Gregory M.; Kim, Michael F.; Davydov, Eugene; NISC Comparative Sequencing Program; Green, Eric D.; Sidow, Arend et al. (Abril de 2003). «LAGAN and Multi-LAGAN: efficient tools for large-scale multiple alignment of genomic DNA». Genome Research 13 (4): 721-731. ISSN 1088-9051. PMID 12654723. doi:10.1101/gr.926603. Consultado el 15 de julio de 2023.
- ↑ Edgar, Robert C. (2004). «MUSCLE: multiple sequence alignment with high accuracy and high throughput». Nucleic Acids Research 32 (5): 1792-1797. ISSN 1362-4962. PMID 15034147. doi:10.1093/nar/gkh340. Consultado el 15 de julio de 2023.
- ↑ Do, Chuong B.; Mahabhashyam, Mahathi S. P.; Brudno, Michael; Batzoglou, Serafim (Febrero de 2005). «ProbCons: Probabilistic consistency-based multiple sequence alignment». Genome Research 15 (2): 330-340. ISSN 1088-9051. PMID 15687296. doi:10.1101/gr.2821705. Consultado el 15 de julio de 2023.
- ↑ Sze, Sing-Hoi; Lu, Yue; Yang, Qingwu (Marzo de 2006). «A polynomial time solvable formulation of multiple sequence alignment». Journal of Computational Biology: A Journal of Computational Molecular Cell Biology 13 (2): 309-319. ISSN 1066-5277. PMID 16597242. doi:10.1089/cmb.2006.13.309. Consultado el 15 de julio de 2023.
- ↑ Notredame, C.; Higgins, D. G. (15 de abril de 1996). «SAGA: sequence alignment by genetic algorithm». Nucleic Acids Research 24 (8): 1515-1524. ISSN 0305-1048. PMID 8628686. doi:10.1093/nar/24.8.1515. Consultado el 15 de julio de 2023.
- ↑ Notredame, C.; Higgins, D. G.; Heringa, J. (8 de septiembre de 2000). «T-Coffee: A novel method for fast and accurate multiple sequence alignment». Journal of Molecular Biology 302 (1): 205-217. ISSN 0022-2836. PMID 10964570. doi:10.1006/jmbi.2000.4042. Consultado el 15 de julio de 2023.
- ↑ Wernersson, Rasmus; Pedersen, Anders Gorm (1 de julio de 2003). «RevTrans: Multiple alignment of coding DNA from aligned amino acid sequences». Nucleic Acids Research 31 (13): 3537-3539. ISSN 1362-4962. PMID 12824361. doi:10.1093/nar/gkg609. Consultado el 15 de julio de 2023.
- ↑ Bailey, Timothy L. (15 de junio de 2011). «DREME: motif discovery in transcription factor ChIP-seq data». Bioinformatics (Oxford, England) 27 (12): 1653-1659. ISSN 1367-4811. PMC 3106199. PMID 21543442. doi:10.1093/bioinformatics/btr261. Consultado el 21 de julio de 2023.
- ↑ Neuwald, A. F.; Liu, J. S.; Lawrence, C. E. (Agosto de 1995). «Gibbs motif sampling: detection of bacterial outer membrane protein repeats». Protein Science: A Publication of the Protein Society 4 (8): 1618-1632. ISSN 0961-8368. PMC 2143180. PMID 8520488. doi:10.1002/pro.5560040820. Consultado el 24 de julio de 2023.
- ↑ Thompson, William; Rouchka, Eric C.; Lawrence, Charles E. (1 de julio de 2003). «Gibbs Recursive Sampler: finding transcription factor binding sites». Nucleic Acids Research 31 (13): 3580-3585. ISSN 1362-4962. PMID 12824370. doi:10.1093/nar/gkg608. Consultado el 24 de julio de 2023.
- ↑ Bailey, T. L.; Gribskov, M. (1998). «Combining evidence using p-values: application to sequence homology searches». Bioinformatics (Oxford, England) 14 (1): 48-54. ISSN 1367-4803. PMID 9520501. doi:10.1093/bioinformatics/14.1.48. Consultado el 21 de julio de 2023.
- ↑ Bailey, T. L.; Elkan, C. (1994). «Fitting a mixture model by expectation maximization to discover motifs in biopolymers». Proceedings. International Conference on Intelligent Systems for Molecular Biology 2: 28-36. ISSN 1553-0833. PMID 7584402. Consultado el 21 de julio de 2023.
- ↑ Bailey, Timothy L.; Elkan, Charles (1 de octubre de 1995). «Unsupervised learning of multiple motifs in biopolymers using expectation maximization». Machine Learning (en inglés) 21 (1): 51-80. ISSN 1573-0565. doi:10.1007/BF00993379. Consultado el 21 de julio de 2023.
- ↑ Jonassen, I.; Collins, J. F.; Higgins, D. G. (Agosto de 1995). «Finding flexible patterns in unaligned protein sequences». Protein Science: A Publication of the Protein Society 4 (8): 1587-1595. ISSN 0961-8368. PMC 2143188. PMID 8520485. doi:10.1002/pro.5560040817. Consultado el 24 de julio de 2023.
- ↑ Jonassen, Inge (1997). «Efficient discovery of conserved patterns using a pattern graph». Bioinformatics (en inglés) 13 (5): 509-522. ISSN 1367-4803. doi:10.1093/bioinformatics/13.5.509. Consultado el 24 de julio de 2023.
- ↑ de Castro, Edouard; Sigrist, Christian J. A.; Gattiker, Alexandre; Bulliard, Virginie; Langendijk-Genevaux, Petra S.; Gasteiger, Elisabeth; Bairoch, Amos; Hulo, Nicolas (1 de julio de 2006). «ScanProsite: detection of PROSITE signature matches and ProRule-associated functional and structural residues in proteins». Nucleic Acids Research 34 (Web Server issue): W362-365. ISSN 1362-4962. PMC 1538847. PMID 16845026. doi:10.1093/nar/gkl124. Consultado el 24 de julio de 2023.
- ↑ Bailey, Timothy L. (29 de septiembre de 2021). «STREME: accurate and versatile sequence motif discovery». Bioinformatics (Oxford, England) 37 (18): 2834-2840. ISSN 1367-4811. PMC 8479671. PMID 33760053. doi:10.1093/bioinformatics/btab203. Consultado el 21 de julio de 2023.
- ↑ Rigoutsos, I.; Floratos, A. (1998). «Combinatorial pattern discovery in biological sequences: The TEIRESIAS algorithm». Bioinformatics (Oxford, England) 14 (1): 55-67. ISSN 1367-4803. PMID 9520502. doi:10.1093/bioinformatics/14.1.55. Consultado el 21 de julio de 2023.
Enlaces externos
editar- Pollard et al. (2004) (Texto completo libre de PubMed Central): los autores discuten LAGAN, CHAOS, y Dialign como las más efectivas herramientas comprobadas para determinados usos.