domingo, 8 de mayo de 2016

Archivos descargables

Archivos descargables: Secuencias

Secuencias de proteínas

A continuación se muestran distintos enlaces para la descarga de archivos en distintos formatos para subunidades de la AHAS de distinta procedencia:

Subunidad catalítica de la AHAS I de E. coli

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1NEluelZVcG9YVlk

Subunidad reguladora de la AHAS I de E. coli

PDB: https://drive.google.com/open?id=0B6036yPvBCH1LTlmdkppOFI4a0U
Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1V1RwemZMTnlUZDQ
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1TUZxQW9QeXUzbG8

Subunidad catalítica de la AHAS II de E. coli

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1OFJqOU5uRzMyUFk
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1eV9hZExka3RCWm8

Subunidad reguladora de la AHAS II de E. coli

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1bGpNOHI1U2R6UE0
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1NHhveG9LZjY4SmM

Subunidad catalítica de la AHAS III de E. coli

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1dVVxOHYtVzk2MnM
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1aVJ3Qmh0cWp3NFk

Subunidad reguladora de la AHAS III de E. coli

PDB: https://drive.google.com/open?id=0B6036yPvBCH1aGZWamI5NjdReG8
Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1RGlNb3dUUTU1UkU
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1V3FrMUMtTnUwQnM

 Subunidad catalítica de la AHAS de la levadura S. cerevisiae

PDB: https://drive.google.com/open?id=0B6036yPvBCH1R2xqcjdOajdMMmc
Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1djVOTDVTQmljMzQ
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1djFyc1E1ZHZSTWs
GenBank: https://drive.google.com/open?id=0B6036yPvBCH1b3YzbmxnUTR2Wms

Subunidad reguladora de la AHAS de la levadura S. cerevisiae

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1S1lJVmtORUF4bTA
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1a1VTNjRxWmtwZUU
GenBank: https://drive.google.com/open?id=0B6036yPvBCH1cXZrcU1IbXkyaVk

AHAS de la levadura S. cerevisiae en complejo con una sulfonilurea

PDB: https://drive.google.com/open?id=0B6036yPvBCH1bDFrNEhSbHpabnM

Subunidad catalítica de la AHAS de A. thaliana

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1eWVhQWt0NVFJTTA
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1Mk5tNDNYbS1ZZFU
GenBank: https://drive.google.com/open?id=0B6036yPvBCH1MGZjeTk0YnlBVEE

Subunidad reguladora de la AHAS de A. thaliana

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1akU5eWtjWEhHUGs
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1aF8wVWswQkwwdHM
GenBank: https://drive.google.com/open?id=0B6036yPvBCH1QkVkeEw3aVFNd00

AHAS vegetal de A. thalina en complejo con una sulfonilurea

PDB: https://drive.google.com/open?id=0B6036yPvBCH1X2pyMTRtck9uMjQ

AHAS vegetal de A. thaliana en complejo con una imidizolinona 

PDB: https://drive.google.com/open?id=0B6036yPvBCH1Qk5aLTd4dUxvdmc

Diferenciador de formatos 

Como se puede observar, se puede la secuencia de una proteína en diversos formatos. Cada formato tiene unas características propias y la información dispuesta de forma distinta. Para diferenciar entre los distintos formatos a partir de un fichero se puede seguir el siguiente algoritmo.
  • Si la primera línea comienza con "HEADER" : PDB
  • Si la primera línea comienza con "LOCUS" : GenBank
  • Si la primera línea comienza con "ID" :
    • Si la primera línea termina con "PB." : EMBL
    • Si la primera línea termina con "AA." : UniProt 
A continuación se proporciona un programa capaz de identificar a partir de un fichero de texto a cuál de los 4 formatos expuestos anteriormente pertenece. Además, también permite extraer la secuencia de aminoácidos a partir del fichero: 
La secuencia extraída se muestra en código de una letra. Una de las aplicaciones de este programa es comparar las secuencias de una misma proteína en distintos formatos. Por ejemplo, se pueden obtener las secuencias de la subunidad catalítica de la AHAS de levadura a partir de los 4 formatos proporcionados y realizar un alineamiento múltiple Clustal Omega para determinar el grado de identidad entre las distintas secuencias:



Se observa que las secuencias son las mismas excepto la primera región que se encuentra ausente en el PDB. Esta región corresponde a una región líder que es escindida durante el procesamiento para obtener la proteína activa. Como el PDB obtiene su secuencia aminoacídica de la estudio estructural de una proteína activa purificada no presenta esa región líder. No obstante, en los otros formatos, la secuencia se obtiene por traducción literal del ARN mensajero para la proteína, por lo que integran en la secuencia el fragmento líder.