Contenidos de investigación del Proyecto Genoma Humano
Marcadores de generación 65438+0
Los marcadores genéticos clásicos, como los marcadores de grupo sanguíneo ABO y los marcadores HLA, se utilizaron en la década de 1970. Posteriormente, el polimorfismo de longitud de fragmentos de restricción (RFLP). , el número de sitios supera los 105. La cadena de ADN se corta específicamente mediante una endonucleasa de restricción, que puede producir fragmentos de diferentes longitudes (alelos). Los polimorfismos se pueden mostrar mediante electroforesis en gel y los genes causantes se pueden encontrar mediante. Análisis de vinculación de información de polimorfismo de fragmentos y fenotipos de enfermedades. Sin embargo, la información está limitada con 2-3 fragmentos por resumen.
Marcadores de segunda generación
En 1985, núcleos de minisatélites y variables. Las repeticiones numéricas en tándem (VNTR) podrían proporcionar fragmentos de diferentes longitudes, con longitudes de unidades de repetición que oscilan entre 6 y 12 nucleótidos. En 1989, se descubrió y estableció el sistema de marcadores de microsatélites. La longitud de las unidades de repetición es de 2 ~ 100.
El marcador de tercera generación
1996 Lander ES del MIT propuso un sistema de marcadores genéticos. La tasa de mutación de cada nucleótido es de 10 a 9. El número de marcadores de doble columna en el genoma humano. 3 millones, con un promedio de alrededor de 3 a 4 pares por 1250 pares de bases. Hay de 8 a 16 haplotipos compuestos por marcadores adyacentes. El mapa físico se refiere a la información sobre la disposición y el espaciamiento de todos los genes que componen el genoma. El propósito de dibujar el mapa físico es medir las moléculas de ADN que forman el genoma. Una disposición lineal y sistemática de información genética sobre los genes y sus posiciones relativas en cada cromosoma. El mapa físico del ADN se refiere a la disposición de los fragmentos de restricción. de la cadena de ADN, es decir, la posición de los fragmentos de restricción en la cadena de ADN debido a restricciones. La escisión de las cadenas de ADN por la endonucleasa sexual se basa en secuencias específicas. La digestión del ADN con diferentes secuencias de nucleótidos producirá fragmentos de ADN de diferentes longitudes. formando así un patrón de digestión único. Por lo tanto, el mapa físico del ADN es la estructura molecular del ADN. Una de las características es que el ADN es una molécula muy grande y los fragmentos de ADN generados por las endonucleasas de restricción para las reacciones de secuenciación son solo una parte muy pequeña. de ellos. La relación posicional de estos fragmentos en la cadena de ADN es el primer problema a resolver. Por lo tanto, el mapa físico del ADN es la base para la determinación de la secuencia y también puede entenderse como un modelo para guiar la secuenciación del ADN. En términos generales, la secuenciación del ADN comienza con la elaboración de un mapa físico, que es el primer paso de la secuenciación. Hay muchas formas de hacer un mapa físico del ADN. Aquí, elegimos un método común y simple: la digestión enzimática parcial de fragmentos marcados para ilustrar el principio de mapeo.
La determinación del mapa físico del ADN mediante hidrólisis enzimática parcial implica dos pasos básicos:
(1) Degradación completa
Elegir una enzima de restricción adecuada para la degradación completa. Cadena de ADN a analizar (marcada con isótopo radiactivo), los productos de degradación se separan mediante electroforesis en gel y luego se desarrollan. El patrón obtenido muestra el número y tamaño de los fragmentos de restricción que componen la cadena de ADN.
(2) Degradación parcial
Utilice un isótopo trazador para marcar una hebra de ADN que se va a analizar y luego utilice la misma enzima mencionada anteriormente para degradar parcialmente la hebra de ADN, es decir, Es decir, a través de Las condiciones de reacción se controlan de modo que las mellas de la enzima en la cadena de ADN se rompan aleatoriamente, evitando así la degradación completa de todas las mellas. Parte de los productos de la hidrólisis enzimática también se sometió a separación por electroforesis y autorradiografía.
Al comparar los patrones de autorradiografía de los dos pasos anteriores, la posición del fragmento de restricción en la cadena de ADN se puede determinar en función del tamaño del fragmento y la diferencia entre los dos. La siguiente es una descripción detallada del mapa físico del ADN que determina los genes de histonas.
Un mapa físico completo debe incluir mapas contig de fragmentos de clones de ADN de diferentes vectores del genoma humano, mapas de puntos de corte de grandes fragmentos de endonucleasas de restricción y marcadores de fragmentos de ADN o mapas de secuencias de ADN específicas (STS). , mapas de marcadores de secuencias características que están ampliamente presentes en el genoma (como secuencias CpG, secuencias Alu, líneas isovolumétricas), mapas citogenéticos del genoma humano (es decir, regiones, bandas y subbandas cromosómicas, o longitudes de cromosomas) Marcados por porcentaje ), finalmente,
El principio básico es "romper" el enorme ADN que no se puede iniciar y luego unirlo. Mb, kb y pb se utilizan como distancias del mapa, y la secuencia STS (sitio de etiqueta de secuencia) de la sonda de ADN se utiliza como punto de referencia. En 1998, se completó un mapa físico de clones contiguos con 52.000 sitios de etiquetas de secuencia (STS), que cubría la mayoría de las regiones del genoma humano. Uno de los contenidos principales de la construcción de un mapa físico es conectar fragmentos de clones de ADN que contienen secuencias correspondientes a STS en "contigs" superpuestos. La biblioteca que contiene fragmentos de ADN humano vectorizados por "YAC" ha incluido la construcción de contigs de fragmentos altamente representativos con una cobertura total del 100%. En los últimos años, se han desarrollado bibliotecas BAC, PAC o cósmidos más fiables. Con la finalización del mapa genético y del mapa físico, la secuenciación se ha convertido en una máxima prioridad. La tecnología de análisis de secuencias de ADN es un proceso de varias etapas que incluye la fragmentación del ADN, el análisis de bases y la traducción de la información del ADN. Obtener el mapa de secuencia del genoma mediante secuenciación.
Estrategia básica para secuenciación a gran escala
Método de clonación por clonación
Los clones BAC predeterminados en la línea de clonación continua se subclonan y ensamblan uno por uno (dominio común plan de secuenciación).
Método de escopeta del genoma completo
Basado en cierta información cartográfica, el genoma se descompone directamente en pequeños fragmentos para una secuenciación aleatoria basada en la construcción de clones continuos de fragmentos grandes, y luego secuenciado por una supercomputadora (U.S. Celera Company) para su montaje. El mapeo transcripcional es un mapa basado en la identificación de las secuencias codificantes de proteínas contenidas en el genoma y la combinación de información como la secuencia genética, la ubicación y los patrones de expresión. El método más importante para identificar la ubicación, estructura y función de todos los genes en el 2% al 5% de longitud del genoma humano es rastrear la ubicación del cromosoma a través del producto de expresión del gen, el ARNm.
Principio
Todos los rasgos biológicos y las enfermedades están determinados por proteínas estructurales o funcionales. Todas las proteínas conocidas están codificadas por ARNm, por lo que pueden convertirse en proteínas mediante la síntesis de la transcriptasa inversa. El ARNm en ADNc o fragmentos parciales de ADNc se denomina EST, o el ADNc o fragmentos de ADNc se sintetizan artificialmente basándose en la información del ARNm, y luego el ADNc estable o EST se utiliza como una "sonda" para la hibridación molecular para identificar genes relacionados con la transcripción. EST (Etiqueta de secuencia expresada) se obtiene secuenciando varios cientos de pb del lado de la cola del ARNm utilizando oligo-T complementario PolyA o la secuencia relacionada del vector de clonación como cebador. En junio de 2000, el EMBL tenía 4.229.786 tecnologías ecológicamente racionales.
La importancia del mapa de transcripción
Puede reflejar eficazmente el mapa espaciotemporal de todo el gen expresado en condiciones normales o controladas. A través de esta imagen podemos conocer la expresión de un gen en diferentes tejidos y niveles en diferentes momentos. También podemos conocer los diferentes niveles de expresión de diferentes genes en un tejido en diferentes momentos, y también podemos conocer los diferentes niveles de expresión de diferentes genes en diferentes tejidos en momentos específicos.
El Genoma Humano es un proyecto de colaboración internacional: caracterizar el genoma humano, secuenciar y mapear el ADN de organismos modelo seleccionados, desarrollar nuevas tecnologías para la investigación del genoma y mejorar la ética involucrada en la investigación del genoma humano. , cuestiones legales y sociales, y capacitar a científicos que puedan utilizar estas tecnologías y recursos desarrollados por HGP para realizar investigaciones biológicas y promover la salud humana.