Emparejamiento óptimo

El emparejamiento óptimo es un método de análisis secuencial utilizado en ciencias sociales, para evaluar la similitud de arreglos ordenados de símbolos que normalmente representan una secuencia temporal ordenada de los estados socioeconómicos que dos individuos han experimentado. Una vez que tales distancias han sido calculadas para un conjunto de observaciones (por ejemplo, individuos de una cohorte) herramientas clásicas (tales como el Algoritmo de agrupamiento) pueden ser utilizados. El método fue adaptado a las ciencias sociales[1]​ a partir de una técnica introducida originalmente para estudiar la biología molecular. El emparejamiento óptimo utiliza el Algoritmo Needleman-Wunsch.

Algoritmo

editar

Sea   una secuencia de estados   que pertenecen a un conjunto finito de estados posibles. Denotemos   el espacio de secuencias, es decir, el conjunto de todas las posibles secuencias de estados. Los algoritmos de correspondencia óptimos funcionan mediante la definición de operador simples álgebras que manipulan secuencias, es decir, un conjunto de operadores  . En el enfoque más simple, se utiliza un conjunto compuesto de solamente tres operaciones básicas para transformar secuencias:

  • un estado   se inserta en la secuencia  
  • un estado es borrado de la secuencia   y
  • un estado   es reemplazado (substituted) por un estado  ,  .

Imagínese ahora que un coste   se asocia a cada operador. Dadas dos secuencias   and  , La idea es medir el costo de obtener   de   utilizando los operadores del álgebra. Dejar   ser una secuencia de operadores de manera que la aplicación de todos los operadores de esta secuencia La a la primera secuencia   da la segunda secuencia S_2 :   donde   denota el operador compuesto. A este conjunto asociamos el costo c (A) = \ sum_ {i = 1} ^ n c (a_i) , Que representa el costo total de la transformación. Hay que tener en cuenta en este punto que podría existir diferentes tales secuencias La que transforman   en  ; Una elección razonable es para seleccionar el más barato de tales secuencias. Por la presente instamos a distancia
 : 

es decir, el coste del conjunto menos costosa de las transformaciones que se convierten   en  . Tenga en cuenta que   es por definición no negativo, ya que es la suma de los costes de positivos, y trivialmente   si y sólo si  , Es decir, no hay ningún costo. La función de distancia es simétrica si los costos de inserción y supresión son iguales  , El término costo indel lo general se refiere a los gastos comunes de inserción y supresión.

Teniendo en cuenta un conjunto compuesto de sólo las tres operaciones básicas descritas anteriormente, esta medida proximidad satisface la desigualdad triangular. transitividad sin embargo, depende de la definición del conjunto de las operaciones elementales.

Crítica

editar

Aunque las técnicas de juego óptimas son ampliamente utilizadas en sociología y la demografía, estas técnicas también tienen sus defectos. Como se ha señalado por varios autores (por ejemplo L. L. Wu[2]​), el principal problema en la aplicación de emparejamiento óptimo es definir adecuadamente los costos  .

Emparejamiento óptimo en el modelado causal

editar

El emparejamiento óptimo es también un término usado en el modelado estadístico de efectos causales. En este contexto se refiere a la combinación "casos" con "controles", y es completamente independiente del sentido de la secuencia analítica.

Referencias

editar
  1. A. Abbott and A. Tsay, (2000) Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect Sociological Methods & Research], Vol. 29, 3-33. doi 10.1177/0049124100029001001
  2. L. L. Wu. (2000) Some Comments on "Sequence Analysis and Optimal Matching Methods in Sociology: Review and Prospect" Archivado el 24 de octubre de 2006 en Wayback Machine. Sociological Methods & Research, 29 41-64. doi 10.1177/0049124100029001003