Pfam es una base de datos que reúne una amplia colección de alineamientos múltiples de secuencias y modelos ocultos de Márkov que cubre buena parte de dominios proteicos y familias comunes. Para cada familia en Pfam se puede:

  • Ver alineamientos múltiples
  • Revisar las arquitecturas y organización de los dominios proteicos
  • Examinar la distribución de especies
  • Seguir enlaces a otras bases de datos
  • Ver estructuras proteicas conocidas

Nótese que una única proteína puede pertenecer a varias familias Pfam.

Pfam-A es la porción de la base de datos manualmente gestionada, y contiene alrededor de 9 000 entradas. Por cada una de ellas se almacena un alineamiento múltiple de secuencias de proteínas y un modelo oculto de Márkov. Estos modelos ocultos de Márkov pueden usarse para buscar en bases de datos de secuencias con el paquete HMMER. Puestos que estas entradas en Pfam-A no cubren todas las proteínas conocidas, se proporciona un suplemento generado automáticamente denominado Pfam-B. Pfam-B contiene un buen número de familias pequeñas derivadas de la base de datos PRODOM (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última).. Aunque de menor calidad, las familias Pfam-B pueden resultar útiles cuando no se encuentran familias Pfam-A.

La base de datos iPfam se construye sobre las descripciones de dominios de Pfam. Investiga si diferentes proteínas descritas conjuntamente en la base de datos PDB de estructura de proteínas se encuentran lo suficientemente cercanas para interactuar potencialmente.

Referencias

editar

Véase también

editar
  • TrEMBL Base de datos que realiza anotaciones automatizadas sobre secuencias de proteínas
  • InterPro Integración de bases de datos de dominios y de familias proteicas

Enlaces externos

editar