martes, 29 de mayo de 2018

Práctica 15: Secuenciación automática del genoma humano


OBJETIVO

En esta práctica, los estudiantes leerán secuencias de ADN obtenidos a partir de técnicas de secuenciación automáticas de ADN. Los datos se analizaron utilizando las bases de datos disponibles al público para identificar los genes y productos genéticos. El impacto de la genómica se discutirá en el contexto de la sociedad actual.

COMPONENTES

Esta práctica contiene un total de doce fragmentos de secuencias de ADN obtenidas automáticamente. Los estudiantes pueden usar cualquier base de datos de secuencias del Genoma Humano para llevar a cabo la práctica. En este protocolo se ha utilizado la base de datos ofrecida por el Centro Nacional de Información Biotecnológica, NCBI (National Center for Biotechnology Information).
  • Fragmentos de secuencias de ADN     12
  • Material requerido y no suministrado
  • Ordenador con acceso a internet.


DESCRIPCIÓN DEL EXPERIMENTO

En esta práctica, los estudiantes leerán secuencias de ADN obtenidos a partir de técnicas de secuenciación automáticas de ADN. Los datos se analizaron utilizando las bases de datos disponibles al público para identificar los genes y productos genéticos. El impacto de la genómica se discutirá en el contexto de la sociedad actual.

Consideraciones previas

Los estudiantes pueden usar cualquier base de datos de secuencias del Genoma Humano para llevar a cabo la práctica. Para la realización de este protocolo se ha utilizado la base de datos ofrecida por el Centro Nacional de Información Biotecnológica, NCBI (National Center for Biotechnology Information).

PROTOCOLO

  1. Escriba: www.ncbi.nlm.nih.gov para iniciar sesión en la página web del NCBI.
  2. En la parte superior izquierda de la pantalla, haga clic en el apartado “Resources” (Recursos) del menú desplegable.
  3. Haga clic en “Data and software” (Datos y software), a continuación, haga clic en “BLAST (Basic Local Alignment Search Tool)”.
  4. En la nueva pantalla de inicio, seleccione “Nucleotide blast” (Nucleótido blast), que es la primero opinión en la lista de “BLAST Basic”.
  5. En la nueva pantalla asegúrese de que la pestaña seleccionada es “BLASTN”.
  6. Introduzca la secuencia de nucleótidos en la caja grande en la sección “Enter Query Sequence” (“Entrar secuencia a consultar”); tenga cuidado al escribir la siguiente secuencia exactamente: ggcaactgcccaaagtgtgatccagcctgtctcaacagaa
  7. En “Choose Search Set” (Elija conjunto de búsqueda) asegúrese que se ha seleccionado “Others (nr etc)” (Otros (nr etc.)) y que “Nucleotide collection (nr/nt)” (Colección de nucleótidos (nr/nt)) aparece en el menú desplegable. Las entradas restantes deben dejarse en blanco.
  8. En la sección “Program Selection” (Selección del programa) seleccionar “Highly similar sequence (megablast)” (Secuencia de alta similitud (megablast)).
  9. Haga clic en el cuadro de consulta azul "BLAST".
  10. Una vez que se ha hecho click en el cuadro de búsqueda "BLAST", se le asignará un ID#. Anote este número para poder comprobar los resultados en un momento posterior.
  11. Examine el informe de búsqueda BLASTN. El informe incluye:
  12. Informe Resumen de Búsqueda muestra una visión general de los parámetros de la búsqueda BLASTN.
  13. Sección del Gráfico Resumen muestra la alineación de las coincidencias de la base de datos con la secuencia de consulta. El color de las cajas corresponde a la puntuación de la alineación, siendo el rojo el que representa las puntuaciones de alineación más altas.
  14. Sección de Descripción muestra todas las secuencias de la base de datos que presentan una homología significativa con nuestra secuencia. Por defecto, los resultados se clasifican de acuerdo con el “E-Value” (Valor E), pero puede hacer clic en el encabezado de columna para ordenar los resultados según diferentes categorías. Observe que puede haber varias entradas diferentes con una idéntica puntuación alta.
  15. Sección de Alineamiento muestra bloques con los alineamientos de cada “hit” del programa BLAST. Cada bloque de los alineamientos comienza con un resumen que incluye la “Max score” (puntuación máxima) y el valor esperado, la identidad de la secuencia, el número de huecos en el alineamiento, y la orientación de la secuencia de consulta con respecto a la secuencia sujeto.
  16. Seleccione una secuencia para centrarse en un análisis más profundo de la misma. Para ello, hacer clic en una barra de color en la sección de Gráfico Resumen, o hacer clic en el nombre de la secuencia en la sección de Descripción, o desplácese hacia abajo a la sección de Alineamiento. A continuación, hacer clic en el identificador de secuencia. Esto nos lleva a obtener información adicional acerca de la secuencia sujeto, incluyendo el nombre del gen, el género y la especie de origen, y artículos escritos sobre el gen. Después de realizar esta búsqueda, uno de los “hits” debe ser Bos taurus epidermal growth factor receptor (EGFR), mRNA (Bos taurus factor de crecimiento epidérmico (EGFR), ARNm). Secuencia ID: Ref |XM_002696890.4|. Si la parte superior del hit no coincide, volver a entrar la secuencia. Asegurarse que los parámetros de la búsqueda del BLASTN son los correctos.

A) Ejercicios
Ejercicio 1
Ahora que está familiarizado con el proceso de inscripción y presentación de BLAST, lea el análisis de la secuencia de ADN de la copia impresa del gel (cualquier carril) y encuentre el gen que identifica esta huella. Para hacer esto:
Identificar la secuencia de nucleótidos (nucleótidos 100-200) a partir de la lectura de la secuencia de ADN.
Escriba al menos 70 bases en el cuadro de consulta del programa BLAST en la página web del NCBI. Las bases pueden ser de cualquier región de la secuencia, pero deben ser contiguas.
Examinar el informe de búsqueda BLASTN, identificar un gen probable, y examinar la identificación de genes para obtener información detallada.
Una vez que el gen ha sido identificado, responda a las siguientes preguntas:
  1. ¿Cuál es el nombre de este gen?
  2. En comparación con la entrada GenBank, ¿Qué cadena has leído?
  3. ¿Se puede encontrar algún artículo escrito sobre este gen? Anote el nombre de uno de los autores que han contribuido.
  4. Al identificar una enfermedad causada por mutaciones en este gen. ¿Cuáles serían los motivos de un médico para realizar una búsqueda para esta enfermedad? ¿Y si quien realiza la búsqueda es una compañía de seguros?

Recuerde lo siguiente:
  • La secuencia automatizada diferencia las bases de la siguiente manera: A es de color verde, C es azul, G es negro, y T es rojo.
  • El ADN es de doble cadena y contiene una parte superior (5'→3') e inferior (3'→5') cadena (a veces esto corresponde a las hebras de codificación y no codificantes). Una secuencia de ADN se introduce siempre en la dirección 5'→3'.
  • A veces es difícil de leer un pico de nucleótidos. Esto es particularmente cierto en al principio y al final de una secuencia de lectura donde los picos pueden superponerse. Estos lugares de difícil identificación a menudo son etiquetados con una N en lugar de con uno de los cuatro nucleótidos. Generalmente, es mejor saltar secciones con una gran cantidad de N’s.
  • Debido a que los investigadores pueden llamar a los mismos genes con diferentes nombres, pueden existir varias posibilidades para cada secuencia.
  • Al hacer clic en el número de acceso de GenBank se puede acceder a información adicional, como la secuencia de proteína/aminoácidos, la descripción de la secuencia/gen, y los que contribuyen los nombres científicos.
  • Algunas de las secuencias que tienen una puntuación elevada pueden predecir genes que no tienen ningún trabajo de investigación relacionados con ellos. Los estudiantes pueden tener que revisar varios emparejamientos antes de que hallar una secuencia con una referencia asociado.
  • Ejercicio 2
  • Intercambiar la copia de secuencia automática con otro grupo y enviar la secuencia de análisis BLAST. Anote el gen. Seleccione una secuencia asociada a un documento publicado, grabar el título y el primer autor del artículo.
  • ¿Qué es la bioinformática? ¿Cómo han avanzado en la tecnología de secuenciación en este campo?
  • Nombre dos métodos de secuenciación y describir el compromiso entre la velocidad de producción y la longitud de las secuencias producidas.
  • ¿Qué suposición hace BLAST? ¿Cuáles son las ventajas y desventajas de hacer esta suposición?


RESULTADOS

La transducción de señales es un proceso importante por el que los receptores de las células actúan como amplificadores de la señal. La membrana de la superficie celular contiene sensores moleculares complejos que reciben, amplifican y reaccionan a señales extracelulares implicadas en el crecimiento y la diferenciación celular. La pérdida de capacidad de una célula para reaccionar a estas señales puede dar lugar a la transformación celular y la aparición de diversos tipos de cáncer.
El conjunto de tres secuencias corresponden a los nucleótidos de distintos genes que están funcionalmente relacionados y juegan un papel importante en la transducción de señales. La identidad de estos genes (y sus proteínas producto) puede determinarse utilizando la página web de NCBI como se ha descrito anteriormente en esta práctica. Tenga en cuenta que los detalles sobre identificación de genes, cadena, referencias e información sobre el autor, serán diferentes dependiendo del punto en que se centre el estudiante. Sin embargo, cada gen debe coincidir con la información básica que se presenta a continuación. Después de investigar las posibles enfermedades relacionadas con estos genes, los estudiantes pueden discutir los temas bioéticos relacionados.
Secuencia de ADN 1

Línea 1: 

GNNNNNTGGNNNNNNNATANTTGCGGCCGCGGTTTTNTTTTTTTNTTNNNCNNGGAGCACAANCNAATGNANTGTGTTGTTGTGGCGARGGC-
GARGGCGCCGTTHHTAAAACTGTCTCCTGATATCCTACACAACAAACAAATTTCAT

Línea 2: 

CGGAGTATGTACCGACTGTTTTTGACAACTATGCAGTCACAGTTATGATTGGTGGAGAACCATATACTCTTGGACTTTTTGATACTGCAGGGCAAGTTATGA-
CAGATTACGACCGCTCACTTATCCACAAACAG

Línea 3: 

ATGTATTTCTAGTCTGTTTTTCAGTGGTCTCTCCATCTTCATTTGAAAACGTGAAAGAAAAGTGGTGCCTGAGATAACTCACCACTGTCCAAGACNCCTTTCTT-
GCTTGTTGGGACTCAAATTGATCTCAACGAGATGACCC

Línea 4: 

CTCTACTATTGAGAAACTTGCCAAGAACAAACAGAAGCCTATCACTCCANAGACTGGGTGAAAAGCTGGCCCGTGACCTGAANGCNGTCAAAGTATGTG-
GAGTGTTCTGCACTTACACAGCAGANGTCTGAAAAATGTGTTNATGAAGC

Secuencia 1: Ciclo de división celular 42 (proteína de unión a GTP) o CDC42 La CDC42 es una molécula reguladora intracelular clave que está implicada en la forma de la célula. En células de mamíferos, la proteína CDC42 regula el citoesqueleto de actina (el andamiaje de una célula) para producir una estructura filamentosa llamada filopodio, que están implicadas en la detección de otras células y el movimiento celular. Las mutaciones en CDC42 y sus proteínas asociadas se correlacionan con ciertos tipos de cáncer.


Secuencia de ADN 2 
Línea 1: 

TGCNNNNNTGGNTNNGGNNNNNATTGNNTCNCTNTACCATGCNNGNGCACAANGTTTTTTTTTTTTTTTTTTTG
GGCAAAGCGTACAAAGGTTC-
CAAGGGACAGGACCAAGAACGAGGGGCTGAGACATTTACAACAGCAGGCATT
NOTA: Para obtener los mejores resultados, se recomienda la eliminación de los primeros 73 nucleótidos (en rojo) en el análisis de este carril.

Línea 2: 

TTTCTCTTCCTCTTCTTCACGGGAGGCGGGCANAGGACTGCTCGGATCGCTTCGTCAAACACTGTCTTGAGGCCTN
CTGTGTGAGCGCCGAGCACTCCAG-
GTATTTTACAGCACCAATCTCCTTANCCATGGCTANAC

Línea 3: 

CCCTGCGGATAGGTGATGGGAGTCAGCTTCTTCBCCTTCAGTTTCNCNATCGTGTCTTTATCATCCCTAAGATCAA
GTTTAGTTCCCACTANGATGATGGGAGT-
GTTGGGACAGTGGTGCCGCACCTCAGGATACCACTT

Línea 4: 

TGCACGGACATTTTCAAATGATGCAGGACTCACAAGGGAAAAGCAAATTAAGAACACATCTGTTTGCGGATAGGA
TAGGGGGCGTATTCTGTCATA-
ATCTTCTTGTCCAGCTGTATCCCAAAAAGCCCAGATTCACCGGTTT

Secuencia 2: Ras relacionada con toxina botulínica C3 substrato 1 (familia rho, pequeña unión GTP de proteína Rac1) o RAC1.
El gen RAC1 para una proteína reguladora que altera el citoesqueleto de actina para producir ondulaciones en la membrana, importantes para la motilidad celular. RAC1 es importante en un gran número de enfermedades, incluyendo el cáncer. Muchos tumores utilizarán la señalización RAC1 para conseguir un aumento de la motilidad y la capacidad invasiva, una de las primeras etapas requeridas para que el cáncer pueda propagarse por todo el cuerpo.
Secuencia de ADN 3

Línea 1: TGNNNNNNTGNNNNNNNGNNANAACGAAGTGCAGACTCAAAAGTGCCATCTCCCTCCCGACCATTGGAGGATC

CCAAGCTCTATGTTGCCCTTATTGT-
CACCAGTGACATTTAATTCCAAACAGGAGTCCTTCGGGCCAGCAA

Línea 2: 

GCTGCCCAGGCTTAGCTGCGAGCCCGTCATGGAGGAAAAAAGCTCAGGAGAAAACCAGTCTGTTGGAGAATGGG
ACAGTCCACCAGGGAGACACCTC-

GTGGGGCTCCAGCGGTTCTGCATCTCAGTCCAGCCAAGGCAGA
Línea 3: 

GACAGCCACTCCTCCAGCCTGTCCGAACAGTACCCCGACTGGGCCAGCCGAGGACATGTTTGACCATCCCACCCC

ATGCGAGCTCATCAAGGGGAAAGAC-
TAAGTCAGAGGAGTCCCTCTCTGACCTTACAGGTTCCCTCCCTCCTCTCC

Línea 4: CCTGCAAGCTTGATCTTGGGCCCTCACTTTTGGATGANGTGCTGAATGTTATGGATAAAAATAAGTAACTCGAGC
ATGCATCTAGAAGGGCCTATTCTATA-
ATGTCACCTAAATGCTAAACCTCGCTGATCAGCCTCGACTGTGCCNT


NOTA: Para obtener los mejores resultados, se recomienda la eliminación de los primeros 70 nucleótidos (en rojo) en el análisis de este carril.
Secuencia 3: proteína efectora CDC42 (Rho GTPasa vinculante) 3 o CDC42EP3 La CDC42 (secuencia 1) regula la formación de estructuras que contienen F-actina, mediante su interacción con diferentes proteínas efectoras. La CDC42EP3, una de estas proteínas efectoras, está implicada en la unión a la proteína CDC42, provocando cambios en la forma de una célula. Una célula detecta señales del ambiente externo mediante la creación de redes de moléculas de transmisión que indican a la célula cómo responder a dichas señales externas. Los defectos en estas moléculas de transmisión están implicados en muchas enfermedades, incluyendo cáncer.

No hay comentarios:

Publicar un comentario