OBJETIVO
En esta práctica, los estudiantes leerán secuencias de ADN
obtenidos a partir de técnicas de secuenciación automáticas de ADN. Los datos
se analizaron utilizando las bases de datos disponibles al público para
identificar los genes y productos genéticos. El impacto de la genómica se
discutirá en el contexto de la sociedad actual.
COMPONENTES
Esta práctica contiene un total de doce fragmentos de secuencias de ADN obtenidas automáticamente. Los estudiantes pueden usar cualquier base de datos de secuencias del Genoma Humano para llevar a cabo la práctica. En este protocolo se ha utilizado la base de datos ofrecida por el Centro Nacional de Información Biotecnológica, NCBI (National Center for Biotechnology Information).
- Fragmentos de secuencias de ADN 12
- Material requerido y no suministrado
- Ordenador con acceso a internet.
DESCRIPCIÓN DEL EXPERIMENTO
En esta práctica, los estudiantes leerán secuencias de ADN
obtenidos a partir de técnicas de secuenciación automáticas de ADN. Los datos
se analizaron utilizando las bases de datos disponibles al público para
identificar los genes y productos genéticos. El impacto de la genómica se
discutirá en el contexto de la sociedad actual.
Consideraciones previas
Los estudiantes pueden usar cualquier base de datos de
secuencias del Genoma Humano para llevar a cabo la práctica. Para la
realización de este protocolo se ha utilizado la base de datos ofrecida por el
Centro Nacional de Información Biotecnológica, NCBI (National Center for
Biotechnology Information).
PROTOCOLO
- Escriba: www.ncbi.nlm.nih.gov para iniciar sesión en la página web del NCBI.
- En la parte superior izquierda de la pantalla, haga clic en el apartado “Resources” (Recursos) del menú desplegable.
- Haga clic en “Data and software” (Datos y software), a continuación, haga clic en “BLAST (Basic Local Alignment Search Tool)”.
- En la nueva pantalla de inicio, seleccione “Nucleotide blast” (Nucleótido blast), que es la primero opinión en la lista de “BLAST Basic”.
- En la nueva pantalla asegúrese de que la pestaña seleccionada es “BLASTN”.
- Introduzca la secuencia de nucleótidos en la caja grande en la sección “Enter Query Sequence” (“Entrar secuencia a consultar”); tenga cuidado al escribir la siguiente secuencia exactamente: ggcaactgcccaaagtgtgatccagcctgtctcaacagaa
- En “Choose Search Set” (Elija conjunto de búsqueda) asegúrese que se ha seleccionado “Others (nr etc)” (Otros (nr etc.)) y que “Nucleotide collection (nr/nt)” (Colección de nucleótidos (nr/nt)) aparece en el menú desplegable. Las entradas restantes deben dejarse en blanco.
- En la sección “Program Selection” (Selección del programa) seleccionar “Highly similar sequence (megablast)” (Secuencia de alta similitud (megablast)).
- Haga clic en el cuadro de consulta azul "BLAST".
- Una vez que se ha hecho click en el cuadro de búsqueda "BLAST", se le asignará un ID#. Anote este número para poder comprobar los resultados en un momento posterior.
- Examine el informe de búsqueda BLASTN. El informe incluye:
- Informe Resumen de Búsqueda muestra una visión general de los parámetros de la búsqueda BLASTN.
- Sección del Gráfico Resumen muestra la alineación de las coincidencias de la base de datos con la secuencia de consulta. El color de las cajas corresponde a la puntuación de la alineación, siendo el rojo el que representa las puntuaciones de alineación más altas.
- Sección de Descripción muestra todas las secuencias de la base de datos que presentan una homología significativa con nuestra secuencia. Por defecto, los resultados se clasifican de acuerdo con el “E-Value” (Valor E), pero puede hacer clic en el encabezado de columna para ordenar los resultados según diferentes categorías. Observe que puede haber varias entradas diferentes con una idéntica puntuación alta.
- Sección de Alineamiento muestra bloques con los alineamientos de cada “hit” del programa BLAST. Cada bloque de los alineamientos comienza con un resumen que incluye la “Max score” (puntuación máxima) y el valor esperado, la identidad de la secuencia, el número de huecos en el alineamiento, y la orientación de la secuencia de consulta con respecto a la secuencia sujeto.
- Seleccione una secuencia para centrarse en un análisis más profundo de la misma. Para ello, hacer clic en una barra de color en la sección de Gráfico Resumen, o hacer clic en el nombre de la secuencia en la sección de Descripción, o desplácese hacia abajo a la sección de Alineamiento. A continuación, hacer clic en el identificador de secuencia. Esto nos lleva a obtener información adicional acerca de la secuencia sujeto, incluyendo el nombre del gen, el género y la especie de origen, y artículos escritos sobre el gen. Después de realizar esta búsqueda, uno de los “hits” debe ser Bos taurus epidermal growth factor receptor (EGFR), mRNA (Bos taurus factor de crecimiento epidérmico (EGFR), ARNm). Secuencia ID: Ref |XM_002696890.4|. Si la parte superior del hit no coincide, volver a entrar la secuencia. Asegurarse que los parámetros de la búsqueda del BLASTN son los correctos.
A) Ejercicios
Ejercicio 1
Ahora que está familiarizado con el proceso de inscripción y
presentación de BLAST, lea el análisis de la secuencia de ADN de la copia
impresa del gel (cualquier carril) y encuentre el gen que identifica esta
huella. Para hacer esto:
Identificar la secuencia de nucleótidos (nucleótidos
100-200) a partir de la lectura de la secuencia de ADN.
Escriba al menos 70 bases en el cuadro de consulta del
programa BLAST en la página web del NCBI. Las bases pueden ser de cualquier
región de la secuencia, pero deben ser contiguas.
Examinar el informe de búsqueda BLASTN, identificar un gen
probable, y examinar la identificación de genes para obtener información
detallada.
Una vez que el gen ha sido identificado, responda a las
siguientes preguntas:
- ¿Cuál es el nombre de este gen?
- En comparación con la entrada GenBank, ¿Qué cadena has leído?
- ¿Se puede encontrar algún artículo escrito sobre este gen? Anote el nombre de uno de los autores que han contribuido.
- Al identificar una enfermedad causada por mutaciones en este gen. ¿Cuáles serían los motivos de un médico para realizar una búsqueda para esta enfermedad? ¿Y si quien realiza la búsqueda es una compañía de seguros?
Recuerde lo siguiente:
- La secuencia automatizada diferencia las bases de la siguiente manera: A es de color verde, C es azul, G es negro, y T es rojo.
- El ADN es de doble cadena y contiene una parte superior (5'→3') e inferior (3'→5') cadena (a veces esto corresponde a las hebras de codificación y no codificantes). Una secuencia de ADN se introduce siempre en la dirección 5'→3'.
- A veces es difícil de leer un pico de nucleótidos. Esto es particularmente cierto en al principio y al final de una secuencia de lectura donde los picos pueden superponerse. Estos lugares de difícil identificación a menudo son etiquetados con una N en lugar de con uno de los cuatro nucleótidos. Generalmente, es mejor saltar secciones con una gran cantidad de N’s.
- Debido a que los investigadores pueden llamar a los mismos genes con diferentes nombres, pueden existir varias posibilidades para cada secuencia.
- Al hacer clic en el número de acceso de GenBank se puede acceder a información adicional, como la secuencia de proteína/aminoácidos, la descripción de la secuencia/gen, y los que contribuyen los nombres científicos.
- Algunas de las secuencias que tienen una puntuación elevada pueden predecir genes que no tienen ningún trabajo de investigación relacionados con ellos. Los estudiantes pueden tener que revisar varios emparejamientos antes de que hallar una secuencia con una referencia asociado.
- Ejercicio 2
- Intercambiar la copia de secuencia automática con otro grupo y enviar la secuencia de análisis BLAST. Anote el gen. Seleccione una secuencia asociada a un documento publicado, grabar el título y el primer autor del artículo.
- ¿Qué es la bioinformática? ¿Cómo han avanzado en la tecnología de secuenciación en este campo?
- Nombre dos métodos de secuenciación y describir el compromiso entre la velocidad de producción y la longitud de las secuencias producidas.
- ¿Qué suposición hace BLAST? ¿Cuáles son las ventajas y desventajas de hacer esta suposición?
RESULTADOS
La transducción de señales es un proceso importante por el
que los receptores de las células actúan como amplificadores de la señal. La
membrana de la superficie celular contiene sensores moleculares complejos que
reciben, amplifican y reaccionan a señales extracelulares implicadas en el
crecimiento y la diferenciación celular. La pérdida de capacidad de una célula
para reaccionar a estas señales puede dar lugar a la transformación celular y
la aparición de diversos tipos de cáncer.
El conjunto de tres secuencias corresponden a los
nucleótidos de distintos genes que están funcionalmente relacionados y juegan
un papel importante en la transducción de señales. La identidad de estos genes
(y sus proteínas producto) puede determinarse utilizando la página web de NCBI
como se ha descrito anteriormente en esta práctica. Tenga en cuenta que los
detalles sobre identificación de genes, cadena, referencias e información sobre
el autor, serán diferentes dependiendo del punto en que se centre el
estudiante. Sin embargo, cada gen debe coincidir con la información básica que
se presenta a continuación. Después de investigar las posibles enfermedades
relacionadas con estos genes, los estudiantes pueden discutir los temas
bioéticos relacionados.
Secuencia de ADN 1
Línea 1:
GNNNNNTGGNNNNNNNATANTTGCGGCCGCGGTTTTNTTTTTTTNTTNNNCNNGGAGCACAANCNAATGNANTGTGTTGTTGTGGCGARGGC-
GARGGCGCCGTTHHTAAAACTGTCTCCTGATATCCTACACAACAAACAAATTTCAT
Línea 2:
CGGAGTATGTACCGACTGTTTTTGACAACTATGCAGTCACAGTTATGATTGGTGGAGAACCATATACTCTTGGACTTTTTGATACTGCAGGGCAAGTTATGA-
CAGATTACGACCGCTCACTTATCCACAAACAG
Línea 3:
ATGTATTTCTAGTCTGTTTTTCAGTGGTCTCTCCATCTTCATTTGAAAACGTGAAAGAAAAGTGGTGCCTGAGATAACTCACCACTGTCCAAGACNCCTTTCTT-
GCTTGTTGGGACTCAAATTGATCTCAACGAGATGACCC
Línea 4:
CTCTACTATTGAGAAACTTGCCAAGAACAAACAGAAGCCTATCACTCCANAGACTGGGTGAAAAGCTGGCCCGTGACCTGAANGCNGTCAAAGTATGTG-
GAGTGTTCTGCACTTACACAGCAGANGTCTGAAAAATGTGTTNATGAAGC
Secuencia 1: Ciclo de división celular 42 (proteína de unión
a GTP) o CDC42 La CDC42 es una molécula reguladora intracelular clave que está
implicada en la forma de la célula. En células de mamíferos, la proteína CDC42
regula el citoesqueleto de actina (el andamiaje de una célula) para producir
una estructura filamentosa llamada filopodio, que están implicadas en la
detección de otras células y el movimiento celular. Las mutaciones en CDC42 y
sus proteínas asociadas se correlacionan con ciertos tipos de cáncer.
Secuencia de ADN 2
Línea 1:
TGCNNNNNTGGNTNNGGNNNNNATTGNNTCNCTNTACCATGCNNGNGCACAANGTTTTTTTTTTTTTTTTTTTG
GGCAAAGCGTACAAAGGTTC-
CAAGGGACAGGACCAAGAACGAGGGGCTGAGACATTTACAACAGCAGGCATT
NOTA: Para obtener los mejores resultados, se recomienda la
eliminación de los primeros 73 nucleótidos (en rojo) en el análisis de este
carril.
Línea 2:
TTTCTCTTCCTCTTCTTCACGGGAGGCGGGCANAGGACTGCTCGGATCGCTTCGTCAAACACTGTCTTGAGGCCTN
CTGTGTGAGCGCCGAGCACTCCAG-
GTATTTTACAGCACCAATCTCCTTANCCATGGCTANAC
Línea 3:
CCCTGCGGATAGGTGATGGGAGTCAGCTTCTTCBCCTTCAGTTTCNCNATCGTGTCTTTATCATCCCTAAGATCAA
GTTTAGTTCCCACTANGATGATGGGAGT-
GTTGGGACAGTGGTGCCGCACCTCAGGATACCACTT
Línea 4:
TGCACGGACATTTTCAAATGATGCAGGACTCACAAGGGAAAAGCAAATTAAGAACACATCTGTTTGCGGATAGGA
TAGGGGGCGTATTCTGTCATA-
ATCTTCTTGTCCAGCTGTATCCCAAAAAGCCCAGATTCACCGGTTT
Secuencia 2: Ras relacionada con toxina botulínica C3
substrato 1 (familia rho, pequeña unión GTP de proteína Rac1) o RAC1.
El gen RAC1 para una proteína reguladora que altera el
citoesqueleto de actina para producir ondulaciones en la membrana, importantes
para la motilidad celular. RAC1 es importante en un gran número de
enfermedades, incluyendo el cáncer. Muchos tumores utilizarán la señalización
RAC1 para conseguir un aumento de la motilidad y la capacidad invasiva, una de
las primeras etapas requeridas para que el cáncer pueda propagarse por todo el
cuerpo.
Secuencia de ADN 3
Línea 1: TGNNNNNNTGNNNNNNNGNNANAACGAAGTGCAGACTCAAAAGTGCCATCTCCCTCCCGACCATTGGAGGATC
CCAAGCTCTATGTTGCCCTTATTGT-
CACCAGTGACATTTAATTCCAAACAGGAGTCCTTCGGGCCAGCAA
Línea 2:
GCTGCCCAGGCTTAGCTGCGAGCCCGTCATGGAGGAAAAAAGCTCAGGAGAAAACCAGTCTGTTGGAGAATGGG
ACAGTCCACCAGGGAGACACCTC-
GTGGGGCTCCAGCGGTTCTGCATCTCAGTCCAGCCAAGGCAGA
Línea 3:
GACAGCCACTCCTCCAGCCTGTCCGAACAGTACCCCGACTGGGCCAGCCGAGGACATGTTTGACCATCCCACCCC
ATGCGAGCTCATCAAGGGGAAAGAC-
TAAGTCAGAGGAGTCCCTCTCTGACCTTACAGGTTCCCTCCCTCCTCTCC
Línea 4:
CCTGCAAGCTTGATCTTGGGCCCTCACTTTTGGATGANGTGCTGAATGTTATGGATAAAAATAAGTAACTCGAGC
ATGCATCTAGAAGGGCCTATTCTATA-
ATGTCACCTAAATGCTAAACCTCGCTGATCAGCCTCGACTGTGCCNT
NOTA: Para obtener los mejores resultados, se recomienda la
eliminación de los primeros 70 nucleótidos (en rojo) en el análisis de este
carril.
Secuencia 3: proteína efectora CDC42 (Rho GTPasa vinculante)
3 o CDC42EP3 La CDC42 (secuencia 1) regula la formación de estructuras que
contienen F-actina, mediante su interacción con diferentes proteínas efectoras.
La CDC42EP3, una de estas proteínas efectoras, está implicada en la unión a la
proteína CDC42, provocando cambios en la forma de una célula. Una célula
detecta señales del ambiente externo mediante la creación de redes de moléculas
de transmisión que indican a la célula cómo responder a dichas señales
externas. Los defectos en estas moléculas de transmisión están implicados en
muchas enfermedades, incluyendo cáncer.
No hay comentarios:
Publicar un comentario