Subsucesión

relación binaria

En matemáticas, una subsucesión es una sucesión que puede derivarse de otra eliminando algunos elementos sin cambiar el orden de los elementos restantes. Por ejemplo, la sucesión es una subsucesión de obtenida tras eliminar los elementos , , y . La relación de ser una sucesión subsucesión de otra es un preorden.

No se debe confundir la subsucesión con la subcadena , que se puede obtener de la cadena eliminando la subcadena . El concepto de subcadena es un refinamiento del concepto de subsecuencia.

Subsucesión común

editar

Dadas dos sucesiones X e Y, se dice que una sucesión Z es una subsucesión común de X e Y, si Z es una subsucesión tanto de X como de Y. Por ejemplo, si

  e
 

una subsucesión común de X e Y puede ser

 

Esta no sería la subsucesión común más larga, dado que Z tiene solo longitud 3, y la subsucesión común   tiene longitud 4. La subsucesión común más larga de X e Y es  .

Aplicaciones

editar

Las subsucesiones tienen aplicaciones en ciencias de la computación,[1]​ especialmente en la disciplina de la bioinformática, donde se usan computadoras para comparar, analizar y almacenar secuencias de ADN, ARN y proteínas.

Tomando dos secuencias de ADN que contengan 37 elementos, por ejemplo:

SEQ1 = ACGGTGTCGTGCTATGCTGATGCTGACTTATATGCTA
SEQ2 = CGTTCGGCTATCGTACGTTCTATTCTATGATTTCTAA

La subsecuencia común más larga de las secuencias 1 y 2 es:

LCS(SEQ1,SEQ2) = CGTTCGGCTATGCTTCTACTTATTCTA

Esto se puede ilustrar resaltando los 27 elementos de la subsecuencia común más larga en las secuencias iniciales:

SEQ1 = ACGGTGTCGTGCTATGCTGATGCTGACTTATATGCTA
SEQ2 = CGTTCGGCTATCGTACGTTCTATTCTATGATTTCTAA

Otra forma es alinear las dos secuencias, esto es, colocar los elementos de la subsecuencia común más larga en la misma columna (indicada por una barra vertical) e introducir un carácter especial (en este caso, un guion) en una secuencia cuando dos elementos  en la misma columna difieren:

SEQ1 = ACGGTGTCGTGCTAT-G--C-TGATGCTGA--CT-T-ATATG-CTA-
        | || ||| ||||| |  | |  | || |  || | || |  |||
SEQ2 = -C-GT-TCG-GCTATCGTACGT--T-CT-ATTCTATGAT-T-TCTAA

Las subsecuencias se utilizan para determinar cómo de similares son las dos cadenas de ADN, usando las bases del ADN: adenina, guanina, citosina y timina.

Teoremas

editar

Véase también

editar

Referencias

editar
  1. En ciencias de la computación, se suele utilizar cadena como sinónimo de sucesión, pero es importante notar que subcadena y subsucesión no son sinónimos. Las subcadenas son partes consecutivas de una cadena, mientras que las subsucesiones no tienen por qué. Esto significa que una subcadena de una cierta cadena es siempre una subsucesión de la cadena, pero el recíproco no siempre se cumple. Esto viene tratado en Algorithms on Strings, Trees and Sequences: Computer Science and Computational Biology. USA: Cambridge University Press. 1999. p. 4. ISBN 0-521-58519-8. 

Este artículo incorpora material de subsequence en PlanetMath, que tiene licencia Creative Commons Atribución Compartir-Igual.