jueves, 30 de junio de 2016

Programas ejecutables

Programas ejecutables

En esta entrada se disponen una serie de programas ejecutables y sus códigos de programación. Para cada programa se mostrará una breve explicación de su manejo y funcionamiento, así como un ejemplo haciendo uso de la AHAS de levadura libre de herbicidas. Todos los programas utilizan funciones que se recogen en el código de una libreria, cuyo código de programación en formato .pas se puede obtener con el siguiente link: 

Observación de proteínas 

Este programa permite explorar la posibilidad de asociar programas de visualización de proteínas, como RasMol, a Lazarus. Concretamente, este programa nos permite visualizar la región alrededor de la primera fenilalanina de la proteína y por tanto su conectividad, así como visualizar el esqueleto de carbonos coloreados en función de su temperatura, o lo que es lo mismo, de su libertad de movimiento o desorden. En primer lugar, es necesario cargar la proteína en formato .pdb mediante el botón "Cargar PDB". En segundo lugar, hay que elegir el programa de RasMol que se vaya a utilizar mediante el botón "Elegir RasMol". Una vez hecho esto ya se puede observar la conectividad de la primera fenilalanina haciendo click en el botón "Observar Conectividad de la Primera PHE", para lo cual primero hay que guardar un archivo PDB generado. Para observar el desorden de la cadena polipeptídica primero hay que seleccionar los carbonos alfa de la proteína mediante el botón "Obtener CA >>". A continuación se ha de guardar el nuevo archivo .pdb generado mediante el botón "Guardar en PDB". Por último, se puede observar la cadena de carbonos coloreada según su temperatura haciendo click en el botón "Observar Desorden de la Cadena". 




Código de programación: https://drive.google.com/open?id=0B6036yPvBCH1dUplRVlYbm54UXc

Utilizando como ejemplo la AHAS de levadura se observa la siguiente conectividad de la primera fenilalanina. Se observa que unos de los residuos más cercanos a esta fenilalanina son un residuo de aspartato, otro residuo de arginina, otro residuo de histidina y otro residuo de isoleucina. Con este último puede establecer alguna tipo de interacción hidrofóbica.


Utilizando la misma proteína se observa el siguiente desorden de la cadena de carbonos. Se puede observar que los residuos más superficiales tienen una mayor temperatura, es decir una mayor libertad de movimiento, mientras que el núcleo de la proteína tiene un movimiento mucho más restringido. Se puede observar que uno de los dominios de una de las dos subunidades (observado en la región más inferior de la imagen) presenta una temperatura general mayor que cualquier otro dominio de la proteína.


Cálculos geométricos de una proteína

Este programa permite obtener información geométrica de la disposición de los átomos de una proteína. Permite conocer la distancia entre dos átomos, el ángulo que forman 3 átomos y el ángulo diedro de torsión determinado por 4 átomos. Para utilizar el programa, en primer lugar hay que cargar una proteína en formato .pdb, mediante el botón superior "Cargar PDB" o bien en la pestaña "Archivo·". A continuación es necesario rellenar los campos de texto para cada átomo. El número de campos de texto que hay que rellenar varía en función del parámetro que quieras determinar, de modo que para calcular la distancia solo es necesario rellenar los primeros 2 campos, para calcular el ángulo solo es necesario rellenar los primeros 3 campos, y para calcular el ángulo de torsión es necesario rellenar todos los campos. En el caso de que todos los campos hayan sido rellenados, la distancia o el ángulo serán calculados con los átomos que ocupen las primeras posiciones. En estos campos hay que indicar el número del átomo según aparezca en el archivo PDB. Para calcular la distancia, el ángulo y el ángulo de torsión una vez rellenados los campos se pueden utilizar los botones que aparecen a la derecha de los campos de texto o bien la pestaña "Herramientas". Por último, el color del fondo puede ser modificado con la pestaña "Editar".



Por ejemplo, usando los 4 primeros átomos de la AHAS de levadura se obtienen los siguientes valores:


Se puede observar que estos valores son los correctos utilizando otras herramientas alternativas. Por ejemplo, se pueden utilizar herramientas de visualización de proteínas para calcular estos mismos parámetros. A continuación se muestra una tabla que representa los valores que se obtienen con el programa respecto a los valores que se obtienen con el comando "set picking torsion" de RasMol:

Se puede observar que los signos de los ángulos siempre coinciden en los dos programas, mientras que los valores varían en cuestión de décimas o centésimas.

Obtención de diagramas de Ramachandran

Este programa permite obtener un diagrama de Ramachandran a partir de una proteína en formato .pdb. Para ello primero hay que cargar la proteína mediante el botón "Cargar PDB". A continuación se puede observar el diagrama de Ramachandran haciendo click en el botón "Obtener Ramachandran". Este diagrama representa los valores de los ángulos de torsión de los enlaces entre el carbono alfa y el nitrógeno de los residuos, también denominados ángulos phi, en el eje de las abscisas, mientras que en el eje de las ordenadas se representan los valores de los ángulos de torsión de los enlaces entre el carbono alfa y el carbono carbonílico de los residuos, también denominados ángulos psi. Además, se puede observar la proteína en RasMol haciendo click en el botón "Observar en Rasmol" y buscando en el navegador que se abre el programa de RasMol en el que se quiera abrir la proteína.





Por ejemplo, usando la AHAS de levadura se obtiene el siguiente diagrama de Ramachandran:


La posición de los puntos es indicativa del tipo de estructuras secundarias a las que pertenecen. La agrupación de puntos situada en la zona media-izquierda de la gráfica pertenecerían a los residuos que forman hélices alfa con giros a la derecha. La agrupación de puntos situada en la esquina izquierda superior pertenecería a los residuos que forman láminas beta. Los puntos situados en otras zonas de la gráfica corresponderían a regiones no ordenadas de la proteína, en las que los ángulos de torsión adquirirían valores más aleatorios que en las regiones ordenadas.


Obtención de estereodiagramas

Este programa permite obtener un estereodiagrama que permite observar de forma tridimensional la conectividad de la primera fenilalanina de la proteína. Para ello primero hay que cargar una proteína en formato .pdb mediante el botón "Cargar PDB". Después se selecciona el programa de RasMol que se desea utilizar mediante el botón "Elegir Programa". A continuación es necesario hacer click en el botón "Obtener Fenilalanina" para guardar el archivo PDB de la fenilalanina y observarla en RasMol. Por último hay que hacer click en el botón "Obtener Estereodiagrama" para guardar el PDB de la fenilalanina girada 3º y observarla en RasMol. Es importante que estos dos botones se utilicen en este orden ya que el estereodiagrama se genera a partir del PDB generado mediante el botón "Observar Fenilalanina".



Código de programación: https://drive.google.com/open?id=0B6036yPvBCH1RmNjR3dLVS1RbDA

Utilizando como ejemplo la AHAS de levadura, se observa el siguiente estereodiagrama:


Para observar los estereodiagramas, aconsejo fijar la mirada en el infinito, por detrás de la imagen. Se observará como cada imagen se desdobla. Cuando un "doble" de cada imagen se solape con el "doble" de la otra imagen, hay que intentar enfocar poco a poco la mirada en la imagen tridimensional.

Manipulación espacial de un segmento proteico

Este programa permite observar la proyección de los 10 primeros aminoácidos en el plano XY y llevar a cabo su transformación espacial para que el primer y el último aminoácido coincidan en sus coordenadas X e Y, así como observar la proyección del polipéptido resultante. Para ello primero se carga la proteína en formato .pdb mediante el botón "Cargar PDB" y se espera que se terminen de "extraer" los carbonos alfa. A continuación se obtiene la proyección no manipulada gracias a al botón "Proyectar en el plano". Una vez obtenida esta proyección, la manipulación espacial del fragmento peptídico y su proyección se consiguen haciendo click en el botón "Superponer primer y último carbono".





Código de programación: https://drive.google.com/open?id=0B6036yPvBCH1YVhqbTNsUVl1UlE

Utilizando la AHAS de levadura se obtienen las siguientes proyecciones, las cuales pueden ser confirmadas usando RasMol.


Cálculo del RMSD de las 3 primeras cisteínas

Este programa permite calcular el RMSD de las 3 primeras cisteínas de una proteína. No tiene función más allá de comparar la estructura espacial de estas cisteínas. Para utilizar el programa solo es necesario cargar la proteína mediante el botón "Cargar PDB" y obtener los RMSD de las 3 parejas posibles de cisteínas haciendo click en el botón "Calcular RMSD". 



Utilizando como ejemplo la AHAS de levadura se obtienen los siguientes valores para los RMSD:


Hay que tener en cuenta que la AHAS de levadura presenta solo dos cisteínas por subunidad. De este modo, la cisteína número 3 es la misma cisteína que la 1 pero en la otra subunidad. Esto nos permite explicar por qué estas dos cisteínas (1 y 3) presentan una RMSD menor en comparación con la que presentan las dos frente a la cisteína 2. Podemos observar más detenidamente las diferencias entre las cisteínas haciendo uso de RasMol:

Se puede observar que la primera y la tercera cisteína presentan el oxígeno carbonílico y el nitrógeno en una posición trans, es decir, que presentarían un ángulo de torsión mayor de 90º. Además, el átomo de azufre está orientado hacia el "fondo" de la pantalla. De forma contrapuesta, en la segunda cisteína se puede observar que el oxígeno carbonílico y el nitrógeno están en posición cis y que el átomo de azufre está orientado hacia la "superficie" de la pantalla. Estas diferencias estructurales dan lugar a el alto valor del RMSD entre la cisteína 1 y la cisteína 2, así como entre la cisteína 3 y la cisteína 2. Las pequeñas diferencias estructurales entre la primera y la tercera cisteína dan lugar a que el RMSD entre estas dos cisteínas no sea nulo.

Mutación de la primera PHE en una TYR

Este programa permite producir una mutación específica en una proteína, sustituyendo la primera fenilalanina por una tirosina. Además permite observar la proteína mutada y la zona mutada mediante RasMol. Para utilizar el programa, primero hay que cargar una proteína en formato .pdb mediante el botón "Cargar PDB". Para mutar la proteína y guardar el nuevo archivo PDB generado se hace click en el botón "Mutar y Guardar PDB Mutado". Para observar la proteína, primero hay que elegir el programa de RasMol con el que se quiere observar la proteína mutada mediante el botón "Seleccionar RasMol", tras lo cual hay que hacer click en el botón "Observar Proteína Mutada". Por último, para observar de forma más detallada la zona mutada, se puede usar el botón "Observar Zona Mutada" para guardar un archivo PDB de la región mutada y observarlo en el programa de RasMol seleccionado anteriormente.



Código de programación: https://drive.google.com/open?id=0B6036yPvBCH1bmFITmpxeHNaNVE

Usando la AHAS de levadura se obtiene la siguiente zona mutada, la cual se compara con la misma zona no mutada:


Se puede observar que el nuevo átomo de oxígeno cae en una zona cercana a las cadenas laterales de un glutamato, una metionina y una asparragina (esta última se observa en la zona superior de la imagen). Es bastante probable que entre algún átomo de la asparragina y el grupo hidroxilo de la nueva tirosina se pueda establecer un puente de hidrógeno.

Búsqueda de puentes disulfuro 

Este programa permite identificar la posible presencia de puentes disulfuro en una proteína al detectar parejas de cisteínas que se encuentren a una longitud máxima determinada. En primer lugar, se ha de cargar la proteína en formato .pdb mediante el botón "Cargar PDB". A continuación se elige la distancia umbral, en amstrongs, por debajo de la cual se considera que dos cisteínas formarán un puente disulfuro. Por último se hace click en el botón "Calcular Puentes Disulfuro".





Ya que la AHAS de levadura no presenta puentes disulfuro, para este programa utilizaremos otro ejemplo. La insulina es un ejemplo de un polipéptido sencillo con varios puentes disulfuro, específicamente 3 de ellos. De este modo, seleccionando una longitud umbral de 3 Amstrongs se pueden detectar los puentes disulfuro:



En esta última imagen se muestra la insulina con los puentes disulfuro resaltados como líneas gruesas amarillas. Hay que tener en cuenta de que si una proteína tiene más de una cadena igual, y estas cadenas presentan puentes disulfuro, en el resultado del programa aparecerá repetida la misma combinación de cisteínas tantas veces como cadenas polipeptídicas tenga la proteína.

Obtención de perfiles hidrofóbicos

Este programa permite obtener un perfil hidrofóbico de un fragmento de tamaño ajustable de la proteína que se elija. Este perfil puede calcularse en función a distintos criterios, ya sea mediante una función de ponderación, mediante el cálculo de momentos de Eisenberg o bien mediante el espectro de potencias de Fourier de Stroud. Para utilizar el programa hay que seguir el siguiente procedimiento:

  • Cargar la proteína en formato .pdb mediante el botón "Cargar PDB". 
  • Elegir el fragmento del polipéptido a analizar, determinando el primer aminoácido y el último aminoácido mediante los SpinEdit que aparecen en el programa. 
  • Determinar el tamaño de la semiventana que se va a utilizar para elegir el tamaño de la región peptídica que afecta a la hidrofobicidad de un residuo. 
  • Elegir un archivo de texto mediante el botón "Cargar Tabla de Hidrofobicidad". Se proporciona a continuación una carpeta con diversas tablas de hidrofobicidad que asignan distintos valores de hidrofobicidad a los residuos siguiendo diferentes criterios. 
  • Por último, se consiguen los distintos perfiles hidrofóbicos haciendo uso de los botones que se disponen.





Código de programación:  https://drive.google.com/open?id=0B6036yPvBCH1ZzJLU1h6TmZiYTA

Tablas de Hidrofocidad:  https://drive.google.com/open?id=0B6036yPvBCH1MTlReGlYV2Vpc1U

Tomando la AHAS de levadura como ejemplo se consiguen los siguientes perfiles usando la tabla de hidrofobicidad de DooLittle. Se ha tomado un fragmento de 500 residuos y un tamaño de semiventana de 7:

  • Función de Ponderación: 

  • Cálculo de momentos de Eisenberg: 

  • Espectro de potencias de Fourier de Stroud: 

lunes, 20 de junio de 2016

Visualización de Proteínas

Visualización de Proteínas

En esta entrada se muestran diversas imágenes obtenidas a partir de Rasmol, las cuales hacen referencias a las estructuras descritas en la entrada "Estructura de la AHAS".

Imagen 1:


Esta imagen muestra la subunidad catalítica de la AHAS de levadura. Una de las cadenas polipeptídicas está representada en azul y la otra en cian. El átomo de magnesio se representa de color naranja, el cofactor TPP se representa de color verde y el FAD se representa de color rojo.

Imagen 2:

Esta imagen representa la subunidad catalítica de la AHAS de levadura conjugada con una sulfonilurea, la cual está representada de color morado.

Imagen 3:

Esta imagen muestra una subunidad catalítica de la AHAS vegetal unida a una sulfonilura. La proteína se muestra en cian, el átomo de magnesio en naranja, el cofactor TPP en verde, el FAD en rojo y la sulfonilurea en morado.

Imagen 4:

Esta imagen muestra una subunidad catalítica de la AHAS vegetal conjugada con un herbicida de la familia de las imidazolinonas, el cual se representa en morado.

Imagen 5:


Esta imagen muestra el dominio alfa de la subunidad catalítica de la AHAS vegetal. Se observan las 6 hebras beta de color amarillo. Se observan 8 hélices alfa de color magenta, 4 a cada lado de la lámina beta.

Imagen 6:


Esta imagen muestra el dominio beta de una subunidad catalítica de la AHAS vegetal. Se observan las 6 hebras beta de color amarillo. Se observan las hélices alfa de color magenta: 3 hélices mayores a cada lado de la hebra beta y otras hélices menores más deslocalizadas.

Imagen 7:


Esta imagen muestra el dominio gamma de una subunidad catalítica de la AHAS vegetal. Se observa la lámina beta central en amarillo y las hélices alfa en magenta. La lámina beta está rodeada por 6 hélices alfa. Otra hélice alfa aparece alejada de la zona centra, situada de forma paralela a las hebras beta.

Imagen 8:


Esta imagen muestra el centro activo de la AHAS vegetal. El cofactor TPP aparece representado en color CPK, excepto por el átomo C2, el cual se representa de color magenta de manera diferencial ya que es el átomo más importante para el mecanismo catalítico. Se muestran en diversos colores los diferentes residuos de la proteína presentes en el centro activo.

Imagen 9:


Esta imagen muestra la interacción del triptófano 586 con la sulfonilurea conjugada a la AHAS de levadura. La proteína se muestra en disposición de cintas, el triptófano se muestra en disposición de "palos y bolas" y la sulfonilurea en "spacefill". El triptófao ejerce una interacción hidrofóbica por apilamiento de anillos aromáticos con el anillo de pirimidina de la sulfonilurea. 

Imagen 10:


Esta imagen muestra las diferencias estructurales entre la AHAS de levadura unida a sulfonilurea y la AHAS de levadura libre de herbicida. La estructura superior es la AHAS asociada a sulfonilurea, la cual se muestra en "spacefill", mientras que la estructura inferior está libre de herbicida. Las regiones diferentes se muestran de color azul y verde, las cuales están ordenadas en forma de hélice alfa en la AHAS unida a sulfonilurea, y de forma desordenada en la AHAS libre de herbicida.

Imagen 11:


Esta imagen permite observar el ángulo de 112-113º que forman los dos anillos de la estructura del TPP cuando está se encuentra unido al centro activo de la AHAS vegetal.

Imagen 12:


Esta imagen permite observar las diferencias estructurales entre los cofactores de TPP de la AHAS vegetal (CPK) y la AHAS de levadura (amarillo). Se observa la diferente rotación del enlace C-C que une el anillo tiazol al grupo pirofosfato, y la ligera variación del ángulo de torsión que une los dos anillos de la estructura.

Imagen 13:


Esta imagen muestra las diferencias estructurales entre las AHAS vegetal (verde) y de levadura (amarilla). El cofactor TPP se muestra en CPK y "spacefill". En la AHAS vegetal, el TPP interacciona con una hélice alfa, en color azul. En la AHAS de levadura, la región que forma la hélice alfa en la AHAS vegetal no interacciona con el TPP y aparece con una conformación desordenada.

Imagen 14:


Esta imagen muestra la disposición entre el TPP y un residuo de glicina. Esta disposición da lugar a la formación de un puente de hidrógeno entre el grupo amino primario de la TPP y el oxígeno carbonílico de la glicina.

Imagen 15:


Esta imagen muestra los ligandos que se unen al átomo de magnesio presente en la estructura de la AHAS vegetal, el cual se muestra como una esfera de color verde. Dos de los ligandos pertenecen al grupo pirofosfato del cofactor TPP, mientras que los otros 3 corresponden a residuos de la proteína, concretamente a un aspartato, a una histidina y a una asparragina. Los residuos están representados en CPK.

Imagen 16:


Esta imagen permite observar la estructura distendida que el FAD adopta en su sitio de unión de la AHAS vegetal, gracias a las interacciones que establece con la lámina beta.

Imagen 17:


Esta imagen permite observar la estructura flexionada del anillo de isoaloxazina que presenta el FAD cuando se une a la AHAS vegetal.

Imagen 18:

Esta imagen permite observar una subunidad reguladora de la AHAS III de E. coli. Uno de los dos polipéptidos que forman el dímero está representado con colores en función de la estructura secundaria y el otro está representado de color cian. Se puede observar que cada polipéptido presenta dos dominios estructurales. También se aprecia la estructura beta-alfa-beta-beta-alfa-beta que presentan los dominios.

domingo, 8 de mayo de 2016

Archivos descargables

Archivos descargables: Secuencias

Secuencias de proteínas

A continuación se muestran distintos enlaces para la descarga de archivos en distintos formatos para subunidades de la AHAS de distinta procedencia:

Subunidad catalítica de la AHAS I de E. coli

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1NEluelZVcG9YVlk

Subunidad reguladora de la AHAS I de E. coli

PDB: https://drive.google.com/open?id=0B6036yPvBCH1LTlmdkppOFI4a0U
Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1V1RwemZMTnlUZDQ
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1TUZxQW9QeXUzbG8

Subunidad catalítica de la AHAS II de E. coli

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1OFJqOU5uRzMyUFk
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1eV9hZExka3RCWm8

Subunidad reguladora de la AHAS II de E. coli

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1bGpNOHI1U2R6UE0
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1NHhveG9LZjY4SmM

Subunidad catalítica de la AHAS III de E. coli

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1dVVxOHYtVzk2MnM
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1aVJ3Qmh0cWp3NFk

Subunidad reguladora de la AHAS III de E. coli

PDB: https://drive.google.com/open?id=0B6036yPvBCH1aGZWamI5NjdReG8
Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1RGlNb3dUUTU1UkU
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1V3FrMUMtTnUwQnM

 Subunidad catalítica de la AHAS de la levadura S. cerevisiae

PDB: https://drive.google.com/open?id=0B6036yPvBCH1R2xqcjdOajdMMmc
Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1djVOTDVTQmljMzQ
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1djFyc1E1ZHZSTWs
GenBank: https://drive.google.com/open?id=0B6036yPvBCH1b3YzbmxnUTR2Wms

Subunidad reguladora de la AHAS de la levadura S. cerevisiae

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1S1lJVmtORUF4bTA
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1a1VTNjRxWmtwZUU
GenBank: https://drive.google.com/open?id=0B6036yPvBCH1cXZrcU1IbXkyaVk

AHAS de la levadura S. cerevisiae en complejo con una sulfonilurea

PDB: https://drive.google.com/open?id=0B6036yPvBCH1bDFrNEhSbHpabnM

Subunidad catalítica de la AHAS de A. thaliana

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1eWVhQWt0NVFJTTA
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1Mk5tNDNYbS1ZZFU
GenBank: https://drive.google.com/open?id=0B6036yPvBCH1MGZjeTk0YnlBVEE

Subunidad reguladora de la AHAS de A. thaliana

Uniprot: https://drive.google.com/open?id=0B6036yPvBCH1akU5eWtjWEhHUGs
EMBL: https://drive.google.com/open?id=0B6036yPvBCH1aF8wVWswQkwwdHM
GenBank: https://drive.google.com/open?id=0B6036yPvBCH1QkVkeEw3aVFNd00

AHAS vegetal de A. thalina en complejo con una sulfonilurea

PDB: https://drive.google.com/open?id=0B6036yPvBCH1X2pyMTRtck9uMjQ

AHAS vegetal de A. thaliana en complejo con una imidizolinona 

PDB: https://drive.google.com/open?id=0B6036yPvBCH1Qk5aLTd4dUxvdmc

Diferenciador de formatos 

Como se puede observar, se puede la secuencia de una proteína en diversos formatos. Cada formato tiene unas características propias y la información dispuesta de forma distinta. Para diferenciar entre los distintos formatos a partir de un fichero se puede seguir el siguiente algoritmo.
  • Si la primera línea comienza con "HEADER" : PDB
  • Si la primera línea comienza con "LOCUS" : GenBank
  • Si la primera línea comienza con "ID" :
    • Si la primera línea termina con "PB." : EMBL
    • Si la primera línea termina con "AA." : UniProt 
A continuación se proporciona un programa capaz de identificar a partir de un fichero de texto a cuál de los 4 formatos expuestos anteriormente pertenece. Además, también permite extraer la secuencia de aminoácidos a partir del fichero: 
La secuencia extraída se muestra en código de una letra. Una de las aplicaciones de este programa es comparar las secuencias de una misma proteína en distintos formatos. Por ejemplo, se pueden obtener las secuencias de la subunidad catalítica de la AHAS de levadura a partir de los 4 formatos proporcionados y realizar un alineamiento múltiple Clustal Omega para determinar el grado de identidad entre las distintas secuencias:



Se observa que las secuencias son las mismas excepto la primera región que se encuentra ausente en el PDB. Esta región corresponde a una región líder que es escindida durante el procesamiento para obtener la proteína activa. Como el PDB obtiene su secuencia aminoacídica de la estudio estructural de una proteína activa purificada no presenta esa región líder. No obstante, en los otros formatos, la secuencia se obtiene por traducción literal del ARN mensajero para la proteína, por lo que integran en la secuencia el fragmento líder.