Anexo:Software para alineamiento de secuencias

Esta lista de software para alineamiento de secuencias es una compilación de herramientas software y portales web usados en alineamiento de secuencias de pares y alineamiento múltiple de secuencias. Ver Anexo:Software para alineamiento estructural para alineamiento estructural de proteínas.

Sólo búsquedas en bases de datos

editar
Nombre Descripción Tipo de secuencia* Enlace Referencia Año
BLAST Búsqueda local de k-tuplas (Basic Local Alignment Search Tool) Ambos NCBI EBI DDBJ DDBJ (psi-blast) GenomeNet PIR (Sólo proteínas) [1] 1990
Extensión combinatoria Búsqueda de alineamiento estructural Proteína servidor
FASTA Búsqueda local de k-tuplas Ambos EBI DDBJ GenomeNet PIR (Sólo proteínas) [2] 1985
GGSEARCH / GLSEARCH Alineamiento con estadística Global:Global (GG), Global:Local (GL) Proteína servidor FASTA
HMMER Búsqueda de perfiles ocultos de Markov Proteína/ADN Descargar DDBJ (HMMPFAM) [3][4] 1998
IDF Inverse Document Frequency Ambos Descargar
Infernal Búsqueda SCFG de perfil ARN Descargar [5] 2009
SAM Búsqueda de perfiles ocultos de Markov Proteína/ADN SAM [6] 1999
SSEARCH2SEQ Búsqueda Smith-Waterman (más sensible que FASTA) Ambos SSEARCH2SEQ servidor [7][8] 1991
SWIMM Búsqueda Smith-Waterman en arquitecturas multicore y manycore de Intel Proteína Descargar [9] 2015
*Tipo de secuencia: Proteína o nucleótido

Alineamiento de pares de secuencias

editar
Nombre Descripción Tipo de secuencia* Tipo de alineamiento** Enlace Referencia Año
ACANA Alineamiento de secuencias de ADN, diseñada para secuencias que comparten regiones conservadas y/o alta frecuencia de las largas inserciones o deleciones ADN Local y global ACANA [10] 2006
BioconductorpairwiseAlignment

(paquete Biostrings)

Programación dinámica ADN y ARN Local, global y solapamientos (ends-free) Biostrings [11][12] 2008
BioPerl dpAlign Programación dinámica Ambos Ambos + Ends-free sitio web Y. M. Chan 2003
BLASTZ Coincidencia de patrones (seeded pattern-matching) Nucleótido Local descargar [13][14] 2003
DNADot Herramienta dot-plot basada en web Nucleótido Global servidor R. Bowen 1998
DOTLET Herramienta dot-plot basada en Java Ambos Global Dotlet Help sitio web [15] 2000
GGSEARCH2SEQ,

SSEARCH2SEQ, GLSEARCH

Alineamiento con estadísticas Global:Global (GG), Local:Local (SS), Global:Local (GL) Proteína Global y local GGSEARCH2SEQ servidorSSEARCH2SEQ servidorservidor FASTA [7][8] 1991
JAligner Implementación Java de código abierto de Smith-Waterman Ambos Local JWS [16][17][18] 2005
LALIGN Múltiple, sin solapamiento, similitud local (mismo algoritmo que SIM) Ambos Local sin solapamiento LALIGN servidorLALIGN/PLALIGN servidor FASTA [19][8] 1991 (algoritmo)
matcher Needleman optimizado para memoria, pero lenta programación dinámica (basado en LALIGN) Ambos Local servidor I. Longden (modificado de W. Pearson) 1999
MCALIGN2 Modelos explicites de evolución indel ADN Global servidor J. Wang et al. 2006
MUMmer Basado en árboles de sufijos Nucleótido Global descargar S. Kurtz et al. 2004
needle Programación dinámica Needleman-Wunsch Ambos Global Needle servidorEBI [20][21][8] 1999
Ngila Costes de hueco (gap) logarítmicos y modelos explícitos de evolución indel Ambos Global descargar R. Cartwright 2007
PatternHunter Concidencia de patrones (seeded pattern-matching) Nucleótido Local descargar [22][23] 2002-2004
ProbA (also propA) Muestreo por función de partición estocástica vía programación dinámica Ambos Global descargar [24] 2002
PyMOL El comando "align" alinea las sequencias y lo aplica a la estructura Proteína Global (por selección) PyMOL sitio web oficial [25] 2000
REPuter Basado en árboles de sufijos Nucleótido Local descargar [26] 2001
SEQALN Diferentes programaciones dinámicas Ambos Local o Global servidor M.S. Waterman and P. Hardy 1996
SIM, GAP, NAP, LAP Similitud local con tratamientos variables de los gaps Ambos Local o global servidor X. Huang and W. Miller 1990-6
SIM Similitud local Ambos Local servidores X. Huang and W. Miller 1991
SLIM Search Alineamiento de bloques ultrarrápido Ambos Ambos sitio web L. Bloksberg 2004
stretcher Optimizado para memoria, pero lenta programación dinámica Ambos Global Stretcher servidorEBI [27][21][8] 1999
tranalign Alinea secuencias de ácidos nucléicos dado un alineamiento de proteínas Nucleótido NA servidor G. Williams (modificado de B. Pearson) 2002
water Programación dinámica Smith-Waterman Ambos Local Water servidor EBI [28][21][8] 1999
wordmatch Coincidencia de k-tuplas por pares Ambos NA Documentación [21] 1998
YASS Coincidencia de patrones (seeded pattern-matching) Nucleótido Local servidor descargar [29] 2005
*Tipo de secuencia: Proteína o Nucleótido. **Tipo de alineamiento: Local o global


Alineamiento múltiple de secuencias

editar
Nombre Descripción Tipo de secuencia* Tipo de alineamiento Type** Enlace Referencia Año
ABA Alineamiento A-Bruijn Proteína Global descargar [30] 2004
ALE Alineamiento manual; alguna asistencia software Nucleótidos Local descargar J. Blandy y K. Fogel 1994 (última versión 2007)
AMAP Annealing de secuencias Ambos Global servidor [31] 2007
BAli-Phy Alineamientos árbol+multi; probabilísticos/bayesianos; joint estimation Ambos Global WWW+descargar [32][33] 2006 (última versión 2021)
BoulderALE Alineamiento, anotación de pares de bases Watson-Crick y no Watson-Crick, y de estructuras secundarias ARN Local o Global BoulderALE [34] 2011
COBALT Alineamiento basado en restricciones de múltiples secuencias de proteínas, con anotación de dominios. Proteína Local o global Linux executable download [35] 2007
CodonCode Aligner Multi-alineamiento; soporte ClustalW y Phrap Nucleótidos Local o Global descargar P. Richterich et al. 2003 (última versión 2007)
CHAOS/DIALIGN Alineamiento iterativo Ambos Local (preferida) servidor [36] 2004
ClustalW Alineamiento progresivo Ambos Local o Global descargar EBI DDBJ PBIL EMBNet GenomeNet [37] 1994
DIALIGN-TX y DIALIGN-T Método basado en segmentos Ambos Local (preferida) o Global descargar y servidor [38] 2005 (última versión 2008)
ADN Baser Multi-alineamiento Ambos Local o Global + post-proceso ADN Baser (comercial) M. Gabriel publicado en 2005
Ed'Nimbus Seeded filtration Nucleótidos Local servidor [39] 2006
Geneious Alineamiento progresivo/iterativo; plugin para ClustalW Ambos Local o Global descargar [40] 2006 (última versión 2012)
Kalign Alineamiento progresivo Ambos Global servidorEBI MPItoolkit [41][42] 2005 (versión más reciente 2019)
MSA Programación dinámica Ambos Local o Global descargar [43] 1989 (modificado 1995)
PRRN/PRRP Alineamiento iterativo (especialmente refinamiento) Proteína Local o Global PRRP PRRN Y. Totoki (basado en O. Gotoh) 1991 y posteriores
POA Modelo oculto de Markov/orden parcial Proteína Local o Global descargar [44] 2002
SAM Modelo oculto de Markov Proteína Local o Global servidor [45][46] 1994 (versión más reciente 2009)
MAFFT Alineamiento progresivo/iterativo Ambos Local o Global GenomeNet MAFFT [47] 2002
MAVID Alineamiento progresivo Ambos Global servidor [48] 2004
MULTALIN Programación dinámica/clustering Ambos Local o Global servidor [49] 1988
Multi-LAGAN Alineamiento progresivo por programación dinámica Ambos Global servidor [50] 2003
MUSCLE Alineamiento progresivo/iterativo Ambos Local o Global servidor [51] 2004
ProbCons Probabilístico/consistencia Proteína Local o Global servidor [52] 2005
PSAlign Alineamiento preservando no-heurística Ambos Local o Global descargar [53] 2006
SAGA Alineamiento de secuencias por algoritmo genético Proteína Local o Global descargar [54] 1996 (nueva versión 1998)
T-Coffee Alineamiento progresivo más sensible Ambos Local o Global servidor [55] 2000
RevTrans Combina ADN y alineamiento de proteínas, por traducción inversa de alineamiento de proteínas a ADN. ADN/Proteína (especial) Local o Global servidor [56] 2003 (versión más reciente 2005)
*Tipo de secuencia: Proteína o nucleótido. **Tipo de alineamiento: Local o global

Análisis genómico

editar
Nombre Descripción Tipo de secuencia* Enlace
SLAM Predicción de genes, alineamiento, anotación (identificación de homología humano-ratón) Nucleótido servidor
Mauve Alineamiento múltiple de genomas reorganizados Nucleótido descargar
MGA Alineador múltiple de genomas Nucleótido descargar
Mulan Alineamientos múltiples locales de secuencias de tamaño genómico Nucleótido servidor
Sequerome Perfilado de información sobre alineamiento de secuencias recurriendo a los principales servidores/servicios Nucleótido/péptido servidor
AVID Alineamiento global por pares con genomas completos Nucleótido servidor
SIBsim4 / Sim4 Programa diseñado para alinear una secuencia expresada de ADN con una secuencia genómica, permitiendo intrones Nucleótido descargar
Shuffle-LAGAN Alineamiento glocal de pares de regiones de genoma completas Nucleótido servidor
ACT (Artemis Comparison Tool) Sintenía y genómica comparativa Nucleótido servidor
*Tipo de secuencia: Proteína o nucleótido

Predicción de motivos

editar
Nombre Descripción Tipo de secuencia* Enlace Referencia Año
BLOCKS Identificación de motivos sin huecos en la base de datos BLOCKS Ambos servidor
DREME Identificación ab initio de motivos de sitios de unión de factores de transcripción al ADN en eucariotas. Diseñado para datos de ChIP-Seq. Obsoleto desde 2021; sustituido por STREME ADN servidor [57] 2011
eMOTIF Extracción e identificación de motivos cortos Ambos servidors
Gibbs motif sampler Extracción estocástica de motivos por probabilidad estadística Ambos servidor (una de varias implementaciones) [58][59] 1995 (última versión 2003)
I-sites Biblioteca de motivos estructurales locales Proteína servidor
MAST Búsqueda y descubrimiento de motivos mediante la búsqueda de coincidencias entre una secuencia y un conjunto de motivos conocidos Ambos servidor [60] 1998
MEME Búsqueda y descubrimiento de motivos Ambos servidor [61][62] 1995
PHI-Blast Búsqueda de motivos y herramienta de alineamiento Ambos servidor
PRATT Generación de patrones para usar con ScanProsite Proteína servidor [63][64] 1995 (última versión 1997)
ScanProsite Herramienta de búsqueda de motivos en base de datos Proteína servidor [65] 2006
STREME Identificación ab initio de motivos Ambos servidor [66] 2021
TEIRESIAS Extracción de motivos y búsqueda en base de datos Ambos servidor [67] 1998
*Tipo de secuencia: Proteína o nucleótido

Benchmarking

editar
Nombre Enlace Autores
BAliBASE descargar Thompson, Plewniak, Poch
HOMSTRAD descargar Stebbings, Mizuguchi
Oxbench descargar Raghava, Searle, Audley, Barber, Barton
PFAM descargar
PREFAB descargar Edgar
SABmark descargar Van Walle, Lasters, Wyns
SMART descargar Letunic, Copley, Schmidt, Ciccarelli, Doerks, Schultz, Ponting, Bork

Visualizadores

editar

Jalview es un visualizador de alineamientos múltiples de secuencias, que se usa para integrar los resultados de una predicción de estructura secundaria vía el servidor web JPred, con un alineamiento múltiple de secuencias dado como entrada o derivado durante la ejecución del algoritmo.

Referencias

editar
  1. Altschul, S. F.; Gish, W.; Miller, W.; Myers, E. W.; Lipman, D. J. (5 de octubre de 1990). «Basic local alignment search tool». Journal of Molecular Biology 215 (3): 403-410. ISSN 0022-2836. PMID 2231712. doi:10.1016/S0022-2836(05)80360-2. Consultado el 9 de julio de 2023. 
  2. Lipman, D. J.; Pearson, W. R. (22 de marzo de 1985). «Rapid and sensitive protein similarity searches». Science (New York, N.Y.) 227 (4693): 1435-1441. ISSN 0036-8075. PMID 2983426. doi:10.1126/science.2983426. Consultado el 9 de julio de 2023. 
  3. Durbin, R.; Eddy, S.; Krogh, A.; Mitchison, G. (1998). Biological sequence analysis: probabilistic models of proteins and nucleic acids (PDF) (en inglés). Cambridge, Reino Unido: Cambridge University Press. ISBN 978-0-521-62971-3. Archivado desde el original el 9 de marzo de 2023. Consultado el 9 de julio de 2023. 
  4. Eddy, S. R. (1998). «Profile hidden Markov models». Bioinformatics (Oxford, England) 14 (9): 755-763. ISSN 1367-4803. PMID 9918945. doi:10.1093/bioinformatics/14.9.755. Consultado el 13 de julio de 2023. 
  5. Nawrocki, Eric P.; Kolbe, Diana L.; Eddy, Sean R. (15 de mayo de 2009). «Infernal 1.0: inference of RNA alignments». Bioinformatics (Oxford, England) 25 (10): 1335-1337. ISSN 1367-4811. PMC 2732312. PMID 19307242. doi:10.1093/bioinformatics/btp157. Consultado el 13 de julio de 2023. 
  6. Karplus, K.; Barrett, C.; Cline, M.; Diekhans, M.; Grate, L.; Hughey, R. (1999). «Predicting protein structure using only sequence information». Proteins. Suppl 3: 121-125. ISSN 0887-3585. PMID 10526360. doi:10.1002/(sici)1097-0134(1999)37:3+<121::aid-prot16>3.3.co;2-h. Consultado el 13 de julio de 2023. 
  7. a b Pearson, W. R. (Noviembre de 1991). «Searching protein sequence libraries: comparison of the sensitivity and selectivity of the Smith-Waterman and FASTA algorithms». Genomics 11 (3): 635-650. ISSN 0888-7543. PMID 1774068. doi:10.1016/0888-7543(91)90071-l. Consultado el 24 de septiembre de 2023. 
  8. a b c d e f Madeira, Fábio; Pearce, Matt; Tivey, Adrian R N; Basutkar, Prasad; Lee, Joon; Edbali, Ossama; Madhusoodanan, Nandana; Kolesnikov, Anton et al. (1 de julio de 2022). «Search and sequence analysis tools services from EMBL-EBI in 2022». Nucleic acids research 50 (W1): W276-W279. ISSN 1362-4962. PMC 9252731. PMID 35412617. doi:10.1093/nar/gkac240. Consultado el 24 de septiembre de 2023. 
  9. Rucci, Enzo; García, Carlos; Botella, Guillermo; De Giusti, Armando; Naiouf, Marcelo; Prieto-Matías, Manuel (25 de diciembre de 2015). «An energy-aware performance analysis of SWIMM: S mith- W aterman implementation on I ntel's M ulticore and M anycore architectures: AN ENERGY-AWARE PERFORMANCE ANALYSIS OF SWIMM». Concurrency and Computation: Practice and Experience (en inglés) 27 (18): 5517-5537. doi:10.1002/cpe.3598. Consultado el 9 de julio de 2023. 
  10. Huang, Weichun; Umbach, David M.; Li, Leping (1 de enero de 2006). «Accurate anchoring alignment of divergent sequences». Bioinformatics (Oxford, England) 22 (1): 29-34. ISSN 1367-4803. PMID 16301203. doi:10.1093/bioinformatics/bti772. Consultado el 17 de septiembre de 2023. 
  11. Patrick Aboyoun, Gentleman Lab (16 de mayo de 2023). «Pairwise Sequence Alignments» (PDF) (en inglés). Fred Hutchinson Cancer Research Center Seattle, WA. 
  12. Pagès H., Aboyoun P., Gentleman R., DebRoy S., H. (2023). «Biostrings - Efficient manipulation of biological strings. Version: Release (2.68.1)». Bioconductor. 
  13. Schwartz, Scott; Kent, W. James; Smit, Arian; Zhang, Zheng; Baertsch, Robert; Hardison, Ross C.; Haussler, David; Miller, Webb (Enero de 2003). «Human-mouse alignments with BLASTZ». Genome Research 13 (1): 103-107. ISSN 1088-9051. PMID 12529312. doi:10.1101/gr.809403. Consultado el 16 de septiembre de 2023. 
  14. Harris, Robert S. (2007). Improved Pairwise Alignmnet of Genomic DNA (Thesis) (PDF) (en inglés). Pennsilvania State University, College of Engineering. Consultado el 17 de septiembre de 2023. 
  15. Junier, T.; Pagni, M. (Febrero de 2000). «Dotlet: diagonal plots in a web browser». Bioinformatics (Oxford, England) 16 (2): 178-179. ISSN 1367-4803. PMID 10842741. doi:10.1093/bioinformatics/16.2.178. Consultado el 24 de octubre de 2023. 
  16. Smith, T. F.; Waterman, M. S. (25 de marzo de 1981). «Identification of common molecular subsequences». Journal of Molecular Biology 147 (1): 195-197. ISSN 0022-2836. PMID 7265238. doi:10.1016/0022-2836(81)90087-5. Consultado el 24 de septiembre de 2023. 
  17. Gotoh, O. (15 de diciembre de 1982). «An improved algorithm for matching biological sequences». Journal of Molecular Biology 162 (3): 705-708. ISSN 0022-2836. PMID 7166760. doi:10.1016/0022-2836(82)90398-9. Consultado el 24 de septiembre de 2023. 
  18. Ahmed Moustafa (2010). «JAligner: Java Implementation of the Smith-Waterman Algorithm for Biological Sequence Alignment». SourceForge. Consultado el 24 de septiembre de 2023. 
  19. Pearson, W. R. (Noviembre de 1991). «Searching protein sequence libraries: comparison of the sensitivity and selectivity of the Smith-Waterman and FASTA algorithms». Genomics 11 (3): 635-650. ISSN 0888-7543. PMID 1774068. doi:10.1016/0888-7543(91)90071-l. Consultado el 24 de septiembre de 2023. 
  20. Needleman, S. B.; Wunsch, C. D. (Marzo de 1970). «A general method applicable to the search for similarities in the amino acid sequence of two proteins». Journal of Molecular Biology 48 (3): 443-453. ISSN 0022-2836. PMID 5420325. doi:10.1016/0022-2836(70)90057-4. Consultado el 24 de septiembre de 2023. 
  21. a b c d Rice, Peter; Longden, Ian; Bleasby, Alan (Junio de 2000). «EMBOSS: The European Molecular Biology Open Software Suite». Trends in Genetics 16 (6): 276-277. ISSN 0168-9525. doi:10.1016/s0168-9525(00)02024-2. Consultado el 24 de septiembre de 2023. 
  22. Ma, Bin; Tromp, John; Li, Ming (Marzo de 2002). «PatternHunter: faster and more sensitive homology search». Bioinformatics (Oxford, England) 18 (3): 440-445. ISSN 1367-4803. PMID 11934743. doi:10.1093/bioinformatics/18.3.440. Consultado el 16 de septiembre de 2023. 
  23. Li, Ming; Ma, Bin; Kisman, Derek; Tromp, John (Septiembre de 2004). «Patternhunter II: highly sensitive and fast homology search». Journal of Bioinformatics and Computational Biology 2 (3): 417-439. ISSN 0219-7200. PMID 15359419. doi:10.1142/s0219720004000661. Consultado el 16 de septiembre de 2023. 
  24. Mückstein, U.; Hofacker, I. L.; Stadler, P. F. (2002). «Stochastic pairwise alignments». Bioinformatics (Oxford, England). 18 Suppl 2: S153-160. ISSN 1367-4803. PMID 12385998. doi:10.1093/bioinformatics/18.suppl_2.s153. Consultado el 16 de septiembre de 2023. 
  25. Schrödinger LLC & DeLano W. (2020). «PyMOL by Schrödinger». Consultado el 24 de septiembre de 2023. 
  26. Kurtz, S.; Choudhuri, J. V.; Ohlebusch, E.; Schleiermacher, C.; Stoye, J.; Giegerich, R. (15 de noviembre de 2001). «REPuter: the manifold applications of repeat analysis on a genomic scale». Nucleic Acids Research 29 (22): 4633-4642. ISSN 1362-4962. PMID 11713313. doi:10.1093/nar/29.22.4633. Consultado el 16 de septiembre de 2023. 
  27. Myers, E W; Miller, W (1 de marzo de 1988). «Optimal alignments in linear space». Computer applications in the biosciences 4 (1): 11-17. ISSN 0266-7061. PMID 3382986. doi:10.1093/bioinformatics/4.1.11. Consultado el 24 de septiembre de 2023. 
  28. Smith, T F; Waterman, M S (1 de marzo de 1981). «Identification of common molecular subsequences». Journal of molecular biology 147 (1): 195-197. ISSN 1089-8638. PMID 7265238. doi:10.1016/0022-2836(81)90087-5. Consultado el 24 de septiembre de 2023. 
  29. Noé, Laurent; Kucherov, Gregory (1 de julio de 2005). «YASS: enhancing the sensitivity of DNA similarity search». Nucleic Acids Research 33 (Web Server issue): W540-543. ISSN 1362-4962. PMC 1160238. PMID 15980530. doi:10.1093/nar/gki478. Consultado el 16 de septiembre de 2023. 
  30. Raphael, Benjamin; Zhi, Degui; Tang, Haixu; Pevzner, Pavel (Noviembre de 2004). «A novel method for multiple alignment of sequences with repeated and shuffled elements». Genome Research 14 (11): 2336-2346. ISSN 1088-9051. PMID 15520295. doi:10.1101/gr.2657504. Consultado el 14 de julio de 2023. 
  31. Schwartz, Ariel S.; Pachter, Lior (15 de enero de 2007). «Multiple alignment by sequence annealing». Bioinformatics (Oxford, England) 23 (2): e24-29. ISSN 1367-4811. PMID 17237099. doi:10.1093/bioinformatics/btl311. Consultado el 14 de julio de 2023. 
  32. Suchard, Marc A.; Redelings, Benjamin D. (15 de agosto de 2006). «BAli-Phy: simultaneous Bayesian inference of alignment and phylogeny». Bioinformatics (Oxford, England) 22 (16): 2047-2048. ISSN 1367-4811. PMID 16679334. doi:10.1093/bioinformatics/btl175. Consultado el 14 de julio de 2023. 
  33. Redelings, Benjamin D. (29 de septiembre de 2021). «BAli-Phy version 3: model-based co-estimation of alignment and phylogeny». Bioinformatics (Oxford, England) 37 (18): 3032-3034. ISSN 1367-4811. PMID 33677478. doi:10.1093/bioinformatics/btab129. Consultado el 14 de julio de 2023. 
  34. Stombaugh, Jesse; Widmann, Jeremy; McDonald, Daniel; Knight, Rob (15 de junio de 2011). «Boulder ALignment Editor (ALE): a web-based RNA alignment tool». Bioinformatics (Oxford, England) 27 (12): 1706-1707. ISSN 1367-4811. PMC 3106197. PMID 21546392. doi:10.1093/bioinformatics/btr258. Consultado el 14 de julio de 2023. 
  35. Papadopoulos, Jason S.; Agarwala, Richa (1 de mayo de 2007). «COBALT: constraint-based alignment tool for multiple protein sequences». Bioinformatics (Oxford, England) 23 (9): 1073-1079. ISSN 1367-4811. PMID 17332019. doi:10.1093/bioinformatics/btm076. Consultado el 21 de julio de 2023. 
  36. Brudno, Michael; Steinkamp, Rasmus; Morgenstern, Burkhard (1 de julio de 2004). «The CHAOS/DIALIGN WWW server for multiple alignment of genomic sequences». Nucleic Acids Research 32 (Web Server issue): W41-44. ISSN 1362-4962. PMID 15215346. doi:10.1093/nar/gkh361. Consultado el 14 de julio de 2023. 
  37. Thompson, J. D.; Higgins, D. G.; Gibson, T. J. (11 de noviembre de 1994). «CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice». Nucleic Acids Research 22 (22): 4673-4680. ISSN 0305-1048. PMID 7984417. doi:10.1093/nar/22.22.4673. Consultado el 14 de julio de 2023. 
  38. Subramanian, Amarendran Ramaswami (2009). Segment-based Multiple Sequence Alignment (Doctoral thesis) (PDF) (en alemán). Eberhard-Karls-Universität Tübingen. Consultado el 21 de julio de 2023. 
  39. Peterlongo, Pierre (2006). DNA sequence filtration for the problem of finding long multiple repetitions (Doctoral thesis) (PDF) (en francés). Université de Marne-la-Vallée. Consultado el 21 de julio de 2023. 
  40. Kearse, Matthew; Moir, Richard; Wilson, Amy; Stones-Havas, Steven; Cheung, Matthew; Sturrock, Shane; Buxton, Simon; Cooper, Alex et al. (15 de junio de 2012). «Geneious Basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data». Bioinformatics (Oxford, England) 28 (12): 1647-1649. ISSN 1367-4811. PMC 3371832. PMID 22543367. doi:10.1093/bioinformatics/bts199. Consultado el 21 de julio de 2023. 
  41. Lassmann, Timo; Sonnhammer, Erik L. L. (12 de diciembre de 2005). «Kalign--an accurate and fast multiple sequence alignment algorithm». BMC bioinformatics 6: 298. ISSN 1471-2105. PMC 1325270. PMID 16343337. doi:10.1186/1471-2105-6-298. Consultado el 15 de julio de 2023. 
  42. Lassmann, Timo (26 de octubre de 2019). «Kalign 3: multiple sequence alignment of large data sets». Bioinformatics (Oxford, England) 36 (6): 1928-1929. ISSN 1367-4811. PMC 7703769. PMID 31665271. doi:10.1093/bioinformatics/btz795. Consultado el 15 de julio de 2023. 
  43. Lipman, D. J.; Altschul, S. F.; Kececioglu, J. D. (Junio de 1989). «A tool for multiple sequence alignment». Proceedings of the National Academy of Sciences of the United States of America 86 (12): 4412-4415. ISSN 0027-8424. PMID 2734293. doi:10.1073/pnas.86.12.4412. Consultado el 21 de julio de 2023. 
  44. Lee, Christopher; Grasso, Catherine; Sharlow, Mark F. (Marzo de 2002). «Multiple sequence alignment using partial order graphs». Bioinformatics (Oxford, England) 18 (3): 452-464. ISSN 1367-4803. PMID 11934745. doi:10.1093/bioinformatics/18.3.452. Consultado el 15 de julio de 2023. 
  45. Karplus, K.; Barrett, C.; Cline, M.; Diekhans, M.; Grate, L.; Hughey, R. (1999). «Predicting protein structure using only sequence information». Proteins. Suppl 3: 121-125. ISSN 0887-3585. PMID 10526360. doi:10.1002/(sici)1097-0134(1999)37:3+<121::aid-prot16>3.3.co;2-h. Consultado el 14 de julio de 2023. 
  46. Karplus, Kevin (Julio de 2009). «SAM-T08, HMM-based protein structure prediction». Nucleic Acids Research 37 (Web Server issue): W492-497. ISSN 1362-4962. PMC 2703928. PMID 19483096. doi:10.1093/nar/gkp403. Consultado el 14 de julio de 2023. 
  47. Katoh, Kazutaka; Misawa, Kazuharu; Kuma, Kei-ichi; Miyata, Takashi (15 de julio de 2002). «MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform». Nucleic Acids Research 30 (14): 3059-3066. ISSN 1362-4962. PMID 12136088. doi:10.1093/nar/gkf436. Consultado el 15 de julio de 2023. 
  48. Bray, Nicolas; Pachter, Lior (Abril de 2004). «MAVID: constrained ancestral alignment of multiple sequences». Genome Research 14 (4): 693-699. ISSN 1088-9051. PMID 15060012. doi:10.1101/gr.1960404. Consultado el 15 de julio de 2023. 
  49. Corpet, F. (25 de noviembre de 1988). «Multiple sequence alignment with hierarchical clustering». Nucleic Acids Research 16 (22): 10881-10890. ISSN 0305-1048. PMID 2849754. doi:10.1093/nar/16.22.10881. Consultado el 15 de julio de 2023. 
  50. Brudno, Michael; Do, Chuong B.; Cooper, Gregory M.; Kim, Michael F.; Davydov, Eugene; NISC Comparative Sequencing Program; Green, Eric D.; Sidow, Arend et al. (Abril de 2003). «LAGAN and Multi-LAGAN: efficient tools for large-scale multiple alignment of genomic DNA». Genome Research 13 (4): 721-731. ISSN 1088-9051. PMID 12654723. doi:10.1101/gr.926603. Consultado el 15 de julio de 2023. 
  51. Edgar, Robert C. (2004). «MUSCLE: multiple sequence alignment with high accuracy and high throughput». Nucleic Acids Research 32 (5): 1792-1797. ISSN 1362-4962. PMID 15034147. doi:10.1093/nar/gkh340. Consultado el 15 de julio de 2023. 
  52. Do, Chuong B.; Mahabhashyam, Mahathi S. P.; Brudno, Michael; Batzoglou, Serafim (Febrero de 2005). «ProbCons: Probabilistic consistency-based multiple sequence alignment». Genome Research 15 (2): 330-340. ISSN 1088-9051. PMID 15687296. doi:10.1101/gr.2821705. Consultado el 15 de julio de 2023. 
  53. Sze, Sing-Hoi; Lu, Yue; Yang, Qingwu (Marzo de 2006). «A polynomial time solvable formulation of multiple sequence alignment». Journal of Computational Biology: A Journal of Computational Molecular Cell Biology 13 (2): 309-319. ISSN 1066-5277. PMID 16597242. doi:10.1089/cmb.2006.13.309. Consultado el 15 de julio de 2023. 
  54. Notredame, C.; Higgins, D. G. (15 de abril de 1996). «SAGA: sequence alignment by genetic algorithm». Nucleic Acids Research 24 (8): 1515-1524. ISSN 0305-1048. PMID 8628686. doi:10.1093/nar/24.8.1515. Consultado el 15 de julio de 2023. 
  55. Notredame, C.; Higgins, D. G.; Heringa, J. (8 de septiembre de 2000). «T-Coffee: A novel method for fast and accurate multiple sequence alignment». Journal of Molecular Biology 302 (1): 205-217. ISSN 0022-2836. PMID 10964570. doi:10.1006/jmbi.2000.4042. Consultado el 15 de julio de 2023. 
  56. Wernersson, Rasmus; Pedersen, Anders Gorm (1 de julio de 2003). «RevTrans: Multiple alignment of coding DNA from aligned amino acid sequences». Nucleic Acids Research 31 (13): 3537-3539. ISSN 1362-4962. PMID 12824361. doi:10.1093/nar/gkg609. Consultado el 15 de julio de 2023. 
  57. Bailey, Timothy L. (15 de junio de 2011). «DREME: motif discovery in transcription factor ChIP-seq data». Bioinformatics (Oxford, England) 27 (12): 1653-1659. ISSN 1367-4811. PMC 3106199. PMID 21543442. doi:10.1093/bioinformatics/btr261. Consultado el 21 de julio de 2023. 
  58. Neuwald, A. F.; Liu, J. S.; Lawrence, C. E. (Agosto de 1995). «Gibbs motif sampling: detection of bacterial outer membrane protein repeats». Protein Science: A Publication of the Protein Society 4 (8): 1618-1632. ISSN 0961-8368. PMC 2143180. PMID 8520488. doi:10.1002/pro.5560040820. Consultado el 24 de julio de 2023. 
  59. Thompson, William; Rouchka, Eric C.; Lawrence, Charles E. (1 de julio de 2003). «Gibbs Recursive Sampler: finding transcription factor binding sites». Nucleic Acids Research 31 (13): 3580-3585. ISSN 1362-4962. PMID 12824370. doi:10.1093/nar/gkg608. Consultado el 24 de julio de 2023. 
  60. Bailey, T. L.; Gribskov, M. (1998). «Combining evidence using p-values: application to sequence homology searches». Bioinformatics (Oxford, England) 14 (1): 48-54. ISSN 1367-4803. PMID 9520501. doi:10.1093/bioinformatics/14.1.48. Consultado el 21 de julio de 2023. 
  61. Bailey, T. L.; Elkan, C. (1994). «Fitting a mixture model by expectation maximization to discover motifs in biopolymers». Proceedings. International Conference on Intelligent Systems for Molecular Biology 2: 28-36. ISSN 1553-0833. PMID 7584402. Consultado el 21 de julio de 2023. 
  62. Bailey, Timothy L.; Elkan, Charles (1 de octubre de 1995). «Unsupervised learning of multiple motifs in biopolymers using expectation maximization». Machine Learning (en inglés) 21 (1): 51-80. ISSN 1573-0565. doi:10.1007/BF00993379. Consultado el 21 de julio de 2023. 
  63. Jonassen, I.; Collins, J. F.; Higgins, D. G. (Agosto de 1995). «Finding flexible patterns in unaligned protein sequences». Protein Science: A Publication of the Protein Society 4 (8): 1587-1595. ISSN 0961-8368. PMC 2143188. PMID 8520485. doi:10.1002/pro.5560040817. Consultado el 24 de julio de 2023. 
  64. Jonassen, Inge (1997). «Efficient discovery of conserved patterns using a pattern graph». Bioinformatics (en inglés) 13 (5): 509-522. ISSN 1367-4803. doi:10.1093/bioinformatics/13.5.509. Consultado el 24 de julio de 2023. 
  65. de Castro, Edouard; Sigrist, Christian J. A.; Gattiker, Alexandre; Bulliard, Virginie; Langendijk-Genevaux, Petra S.; Gasteiger, Elisabeth; Bairoch, Amos; Hulo, Nicolas (1 de julio de 2006). «ScanProsite: detection of PROSITE signature matches and ProRule-associated functional and structural residues in proteins». Nucleic Acids Research 34 (Web Server issue): W362-365. ISSN 1362-4962. PMC 1538847. PMID 16845026. doi:10.1093/nar/gkl124. Consultado el 24 de julio de 2023. 
  66. Bailey, Timothy L. (29 de septiembre de 2021). «STREME: accurate and versatile sequence motif discovery». Bioinformatics (Oxford, England) 37 (18): 2834-2840. ISSN 1367-4811. PMC 8479671. PMID 33760053. doi:10.1093/bioinformatics/btab203. Consultado el 21 de julio de 2023. 
  67. Rigoutsos, I.; Floratos, A. (1998). «Combinatorial pattern discovery in biological sequences: The TEIRESIAS algorithm». Bioinformatics (Oxford, England) 14 (1): 55-67. ISSN 1367-4803. PMID 9520502. doi:10.1093/bioinformatics/14.1.55. Consultado el 21 de julio de 2023. 

Enlaces externos

editar
  • Pollard et al. (2004) (Texto completo libre de PubMed Central): los autores discuten LAGAN, CHAOS, y Dialign como las más efectivas herramientas comprobadas para determinados usos.

Véase también

editar