Guía Phylome DB

Esta guía pretende, por un lado, ser una fuente de consulta para los participantes en el piloto «Sube al árbol» y, por otro, un documento para quien quiera conocer cómo funciona esta potente herramienta.

Página principal
Búsqueda
Pestañas de navegación

Pantalla de resultados
Interactividad
Búsqueda entre árboles
Menú de herramientas y descargas
Marcadores de taxonomía
Dominios proteicos
Leyenda de nodos
Predicción de ortología

Página principal

Figura 1

La página principal contiene diferentes elementos.

De todos ellos, nos centraremos en:

(a) Motor de búsqueda. En este cuadro se introduce el nombre o código de la proteína de interés. El botón Search realiza la búsqueda deseada. Ver apartado propio en esta guía.

(d) Pestañas de navegación. Resulta especialmente interesante la pestaña Help, para ampliar la información de esta guía. Ver apartado propio en esta guía.

Podéis encontrar información más detallada de estos elementos en la página de ayuda de la herramienta.


Búsqueda

Las proteínas se pueden buscar a partir de su nombre o, para afinar más la búsqueda, a partir de su código, el cual puede estar en diferentes formatos.

La herramienta busca la proteína indicada. Si no se ha reconstruido un árbol usando esa proteína, se mostrará el árbol del homólogo más cercano posible que sí esté incluido en ella.

En caso de que la búsqueda por nombre o identificador no proporcione el resultado deseado existe la opción de realizar una búsqueda por BLAST. Esto nos permite realizar una búsqueda a partir de una secuencia concreta de aminoácidos. Esta búsqueda nos devolverá una lista de proteínas similares a la secuencia que hayamos proporcionado. A partir de esta lista podemos acceder a los diferentes árboles.


Pestañas de navegación



Pantalla de resultado

Como en el caso de la pantalla principal, nos encontramos diferentes zonas con información, las más relevantes de las cuales son:

guia_01
  1. Panel de búsqueda entre árboles
  2. Menú de herramientas y descargas
  3. Árbol de relaciones. En (g) encontramos la leyenda para los nodos
  4. Representación de los diferentes dominios de las proteínas.
  5. Lista de características (tree features) que se pueden añadir al árbol.
  6. Leyenda de los nodos

Bajo el árbol podemos encontrar un enlace para obtener predicciones de ortología a través de metaPhOrs.

guia_02

De nuevo, podéis ampliar esta información en la página de ayuda de la herramienta.


Interactividad

Todos los elementos del árbol son clicables. Al clicar sobre ellos obtendremos un menú contextual desplegable con información relacionada con el elemento clicado.

Así, por ejemplo, al clicar sobre una rama, podemos ocultar sus hijos, cambiarlos de orden, establecerla como raíz, etc.


Búsqueda entre árboles

guia_03

El primer desplegable nos permite cambiar entre árboles construidos a partir de la proteína de interés. Si este desplegable está vacío significa que la especie a la cual pertenece la proteína que se ha buscado nunca se ha utilizado como base para construir ningún filoma.

El segundo desplegable nos permite cambiar entre los modelos evolutivos utilizados para construir el filoma. Se prueban siete modelos distintos y se muestran en el desplegable los que han devuelto resultados matemáticamente más favorables.

El tercer desplegable nos muestra los árboles que contienen la proteína de interés, pero que no están construidos a partir de la misma. Se les denomina árboles colaterales.

Podéis encontrar información técnica sobre cómo funciona la herramienta en su página de ayuda.

Menú de herramientas y descargas

guia_04

  • Tree features. Abre un menú para mostrar/ocultar diferente información de las proteínas encontradas en el árbol. Hay que clicar Refresh para actualizar el árbol con los cambios seleccionados.
  • Search. Abre el menú de búsqueda de información dentro del árbol. Las ramas encontradas bajo los parámetros de búsqueda aparecerán marcadas con una burbuja amarilla.
  • Clear seach. Borra las posibles búsquedas realizadas dentro del árbol.
  • Image (PNG o SVG). Permite descargar un archivo de imagen del árbol. SVG es un formato vectorial.
  • Hard link. Abre una pestaña nueva con un enlace permanente al árbol generado.
  • Download OrthoXML. Abre una pestaña nueva en la que vemos un archivo de texto en formato xml con la información para visualizar el árbol.
  • See alignments. Abre una nueva pestaña en la que podemos ver todas las secuencias de aminoácidos alineadas.
  • Download data.tar.gz. Descarga de un archivo comprimido con toda la información del árbol.

Tree features

Clica sobre la imagen para verla ampliada

guia_05

 

Ejemplo de alineación de las secuencias proteicas

Clica sobre la imagen para verla ampliada
guia_06


Marcadores de taxonomía

Muestra las relaciones taxonómicas respecto a la especie sobre la que está construido el filoma.

Cada color corresponde a un nivel jerárquico dentro de la taxonomía (los colores pueden variar entre filomas).

Obtenemos más información sobre el nivel taxonómico al clicar sobre cada color.

Así, por ejemplo, al realizar un filoma a partir de la TP53 humana, encontraremos indicación taxonómica de la imagen (hemos clicado sobre el bloque lila).

Como se puede ver, el bloque de color se extiende por todos aquellos resultados que comparten un nivel taxonómico en concreto, aunque no sean colindantes.

guia_07

  • Rosa: Opisthokonta
  • Rojo: Chordata
  • Verde: Teleostomi
  • Azul: Amniota
  • Amarillo: Mammalia
  • Naranja: Laurasiatheria
  • Verde 2: Eutheria
  • Naranja 2: Primates
  • Lila: Hominidae
  • Naranja 3: Tetrapoda

Dominios proteicos

Se muestran diferentes dominios proteicos. Estos dominios se representan con formas geométricas (cuadrados, rombos, etc.) e incluyen su nombre, aunque puede aparecer cortado.

Los aminoácidos de las regiones codificantes que no pertenecen a ningún dominio conservado se muestran como líneas verticales, siguiendo el código estándar de colores para cada aminoácido.

Las líneas negras horizontales indican saltos en las regiones, cuando se comparan entre las especies. Durante la evolución, algunas proteínas pueden haber “perdido” o “ganado” regiones enteras. En nuestro árbol de la proteína P53, por ejemplo, podemos ver cómo la proteína p63, paráloga a la P53, de Bos taurus ha perdido toda la parte codificante inicial, que sí mantienen (aunque con diferencias) el resto de especies.

Los grandes dominios se han identificado, concretamente, a partir de la base de datos PFAM.

En nuestro ejemplo observamos que todas las proteínas comparten el dominio p53 y un dominio “_tetra”. La primera proteína, de Drosophila melanogaster, presenta un dominio P53_C ausente en el resto. Excepto las tres primeras, casi todas comparten, también un dominio “SAM_2”.

guia_09

 

Para profundizar más en estos dominios podemos clicar sobre una proteína y escoger la opción TreeFam (si aparece).

guia_10

Esta opción nos lleva hasta la página TreeFam de esa proteína. Al pasar el ratón por encima de los diferentes dominios podremos ampliar tanto su nombre como su información. En nuestro ejemplo, vemos que el dominio “_tetra” corresponde a P53_tetramer.

guia_11

También podemos dirigirnos al enlace directo a TrEMBL (uniprot) donde podemos encontrar muchísima información adicional, como la familia y los dominios de la proteína de interés (apartado Family & Domains).


Leyenda de nodos

guia_12

En azul, los eventos de especiación. En estos casos, el gen se encuentra compartido por dos o más especies; las diferencias observadas entre los genes de dichas especies se debe a los distintos caminos evolutivos que han seguido, y no a algún suceso particular de dicho gen (una duplicación, por ejemplo).

En rojo, los eventos de duplicación, en los que se duplicó un gen y cada copia siguió un camino evolutivo distinto.

Una burbuja verde indica la secuencia que se ha utilizado para construir el árbol.

Las burbujas rosas indican las ramas con baja consistencia, según el modelo escogido. A mayor radio, menor consistencia, lo que indica una menor fiabilidad de que el nodo sea correcto.

Las burbujas amarillas indican los resultados de las búsquedas internas (según menú de edición).

Para más información sobre cómo se determinan los nodos, dirigíos a la página de ayuda de la herramienta.

 


Predicción de ortología

Además de los árboles de relaciones, PhylomeDB ofrece un enlace directo a metaPhOrs, otra herramienta gratuita que permite generar predicciones de relaciones evolutivas entre las especies.

Esta herramienta realiza diferentes comparaciones basadas en siete servicios y muestra los resultados para cada uno de ellos. Además proporciona un resultado consenso basado en las diferentes herramientas. Para profundizar en los resultados de esta herramienta, <a href=”http://orthology.phylomedb.org/?q=home”>recomendamos su propia página.

guia_13