La Red de Conocimientos Pedagógicos - Conocimientos históricos - ¿De qué se trata el Proyecto Genoma Humano?

¿De qué se trata el Proyecto Genoma Humano?

Categoría: Cultura/Arte

Análisis:

El estudio del genoma humano supone la primera vez en las ciencias de la vida que se consigue el análisis de la información genética global Estudio de la función del genoma. El genoma es la suma de la información genética de un organismo vivo.

La unidad de almacenamiento de la información de la vida es en realidad lo que llamamos genes, y el portador es el ADN del ácido desoxirribonucleico. En los organismos multicelulares, la información fluye entre diferentes células, entre tejidos compuestos por diferentes células y entre órganos formados por diferentes tejidos. Esto es lo que llamamos: el dogma central de la genética. El genoma es la suma de la información genética de un organismo vivo. El descubrimiento de la doble hélice del ADN es probablemente el mayor avance en las ciencias biológicas del siglo XX. Las cuatro bases diferentes de ATCG constituyen un lenguaje genético complicado.

De hecho, la gran mayoría de las enfermedades humanas están controladas por poligenes. El Proyecto Genoma Humano se lanzó oficialmente en 1990 y se necesitarán 15 años para completar la determinación de la secuencia completa de ADN del genoma humano para 2005. A día de hoy, no disponemos de la tecnología para tomar un cromosoma y secuenciarlo directamente. Por lo tanto, todo el proyecto del genoma humano es en realidad un proceso que va de la complejidad a la simplicidad y luego de la simplicidad a la complejidad. Cuando se inició la secuenciación del genoma humano, el método de análisis de la secuencia de ADN utilizado en ese momento se basaba en la electroforesis en gel, que se hacía básicamente de forma manual. Pero después de la década de 1990, surgió una nueva tecnología de secuenciación: la tecnología de electroforesis capilar. Esto acelera enormemente la secuenciación. En un día se pueden secuenciar un millón de pares de bases de secuencias. China también se ha sumado a este proyecto de secuenciación y nosotros hemos asumido el 1% de la tarea. En abril de 2000, se completó el borrador de la secuenciación de toda la secuencia del cromosoma 21.

Ahora podemos puntear el genoma humano en un biochip del tamaño de una uña, y todos los genes estarán punteados en él. Si quieres ver a un médico en el futuro, no sólo necesitarás llevar tu tarjeta de enfermedad, sino también tu propio chip. Antes de que el médico le diagnostique medicamentos, utilizará un chip para ver qué enfermedades puede tener. Al comparar los genomas de organismos en diferentes etapas de evolución, podemos descubrir las reglas de regulación funcional de los componentes de la estructura del genoma. De hecho, los genes relacionados con enfermedades humanas también son información crucial para la integridad estructural y funcional del genoma humano. De hecho, en los últimos años, el estudio de las enfermedades ya se ha convertido en una parte integral de la investigación del genoma humano, un proyecto importante. En 1997 se propusieron dos proyectos: uno era el proyecto de disección del genoma tumoral y el otro se llamaba proyecto genoma ambiental. De hecho, todos ellos están relacionados con la salud. La contribución del Proyecto Genoma Humano a la medicina está en el diagnóstico y la terapia génica. Para los países en desarrollo como nosotros, deberíamos prestar más atención a la prevención.

El proyecto genoma de nuestro país se puso en marcha en 1994, partiendo de la perspectiva del genoma funcional. Preste igual atención a la estructura y función, establezca tecnologías clave en múltiples disciplinas y realice investigaciones sobre la diversidad del genoma y los genes de enfermedades. Esta era una estrategia cuando empezamos. Podemos estar orgullosos de decir que ahora, excepto el cromosoma Y, todos los cromosomas están cubiertos de genes descubiertos y nombrados por científicos chinos. Recientemente hemos iniciado un estudio a gran escala del genoma chino-SNP. Este trabajo ha pasado de la genética de poblaciones al estudio de la información genética sobre las características de nuestra población china y la aparición y desarrollo de enfermedades. Por lo tanto, si ahora podemos crear un catálogo sistemático y una base de datos de la variación de los elementos de la vida en la nación china, podemos obtener los derechos de propiedad intelectual de las innovaciones tecnológicas en las industrias biomédicas y farmacéuticas de mi país para beneficiar a las generaciones futuras y contribuir a toda la humanidad.

Texto completo

Por supuesto, la Universidad de Tsinghua es una de las universidades más importantes de nuestro país. Entonces, venir aquí hoy da un poco de miedo. Entonces lo principal es pedir consejo. Se puede decir que el estudio del genoma humano que quiero presentarles ahora es la primera vez que se realiza un cierto concepto de gran ciencia en las ciencias de la vida.

Es decir, se realiza un análisis global de la información genética y un estudio de la función del genoma. Por eso digo que las características actuales de la biología han cambiado desde las décadas de 1970 y 1980, que se centraban principalmente en el análisis, el refinamiento de las disciplinas y el refinamiento de la división del trabajo. Esta tendencia ha alcanzado una nueva plataforma. Esta plataforma es una gran síntesis. De hecho, nuestra ciencia china se ha centrado en la gran síntesis desde el principio. Puedes ver lo mismo con nuestro arte. Nuestra pintura a mano alzada es completa. Esta integración de Oriente y Occidente es muy importante. Si combinamos el análisis riguroso de Occidente con el pensamiento integral de China hace miles de años, creo que puede generar nuevas oportunidades de avance. Entonces, cuando pienso en esta imagen, me temo que no solo aquellos que se dedican a las ciencias de la vida, sino también nuestros estudiantes de ciencias no biológicas están muy familiarizados con el dogma central de la genética.

Todos sabemos que la esencia de la actividad vital es el flujo de información. Algunas personas siempre han dicho que todos nos dedicamos a las ciencias de la vida. Pero de repente salió una frase: "¿Qué es la vida"? Esto puede hacer que la gente piense en ello. Mi experiencia personal es que la unidad de almacenamiento de información vital es una de las características importantes de la vida. Tiene una función de memoria. Entonces, su unidad de almacenamiento es en realidad lo que llamamos genes. En la mayoría de los organismos vivos, sabemos que su portador es el ADN del ácido desoxirribonucleico. Pero su unidad de ejecución es principalmente la proteína. El lenguaje de la información que se utiliza aquí no es el mismo. Uno es el lenguaje de los ácidos nucleicos y el otro es el lenguaje de los aminoácidos. Por tanto, el flujo de información en este espacio requiere de algunos mecanismos de control. Como todos sabemos, el primer paso de esta normativa es la transcripción. En este momento, el lenguaje de la información de la vida no ha cambiado; es todo el lenguaje de los ácidos nucleicos. Sólo del ADN al ARNm, este proceso se llama transcripción. Entonces el idioma cambiará y se transformará, y será necesaria la traducción. Por tanto, el lenguaje de la vida en el ARNm se ha convertido en el lenguaje de la vida en las proteínas. Por supuesto que conocemos esta proteína y muchas proteínas tienen actividades metabólicas. Una de las diferencias importantes entre los cuerpos vivos y los cuerpos no vivos es que existe metabolismo y metabolismo, y luego las proteínas pueden formar configuraciones espaciales de nivel superior. Entonces, en esto, diferentes partes de la célula interactúan entre sí, y el núcleo y el citoplasma interactúan entre sí. Luego, en los organismos multicelulares, la información fluye entre diferentes células, entre tejidos compuestos por diferentes células y entre órganos formados por diferentes tejidos. Creo que esto es lo que llamamos el "dogma central de la genética". Bueno, todo el mundo tiene muy claro el concepto de genes, o el concepto básico es muy claro, pero la definición exacta puede no ser muy clara hoy en día.

Entonces, ¿qué significa genoma? El genoma es la suma de la información genética de un organismo vivo. Entonces aquí no tenemos un solo gen, sino todos los genes. La relación entre todos los aminoácidos que codifica es completamente diferente, por lo que las propiedades sensoriales son completamente diferentes. El descubrimiento de la estructura de doble hélice del ADN es probablemente el mayor avance en las ciencias biológicas del siglo XX. Así pues, cuatro bases diferentes, A, T, C y G, constituyen el complicado lenguaje de la genética, los símbolos más básicos de la información sobre la vida. Este símbolo tan básico realmente nos hace sentir muy simples. La naturaleza utiliza estos cuatro simples personajes para formar un fenómeno que nos sorprende con la diversidad de innumerables vidas en el vasto mundo. Entonces, su información genética, en la mayoría de los seres vivos, lo que acabo de mencionar es la molécula de ADN. Entonces su disposición y combinación se determinan allí, o en una medida considerable, determinan las actividades de la vida en el cuerpo humano, que es de lo que estamos hablando: nacimiento, vejez, enfermedad, muerte y otras actividades. Entonces, cuando hablamos de la estructura de doble hélice, todos sabemos que los pares de bases y el ADN son macromoléculas biológicas. Generalmente no utilizamos una unidad de masa para expresar su volumen, sino su longitud. Entonces, un pb se llama par de bases en chino. Pero en términos de genes, un gen a menudo requiere miles de pares de bases. Entonces introdujimos una escala como "pares de kilobases". Luego, cuando llegamos al genoma, todos sabíamos que era muy grande, por lo que se inventaron algunas unidades de escala nuevas, como Mb, que se refiere a millones de pares de bases.

Esto es lo que sabíamos sobre el genoma humano antes del proyecto genoma. Conocemos la longitud del genoma humano. La longitud de un genoma haploide es de aproximadamente 3 mil millones de pares de bases. Los libros de texto generales dicen que la secuencia codificante entre las secuencias, es decir, lo que acabamos de decir, la transcripción y la expresión, se puede llamar secuencia del gen. Quizás en realidad se refiere a ARNm maduro. La secuencia en el ARNm después del procesamiento es probablemente inferior al 5%. En otras palabras, las secuencias no codificantes representan la gran mayoría. En el núcleo de la célula humana, la información genética está organizada en forma de cromosomas, distribuidos en 22 autosomas y 2 cromosomas sexuales. Todos sabemos que las características de la ciencia biológica en el pasado eran básicamente un maestro dirigiendo a un aprendiz y una operación estilo taller. Entonces, a mediados de la década de 1980, creo que uno fue la gran expansión del pensamiento científico en las ciencias de la vida, y el segundo fue el avance de la tecnología. Por ejemplo, la ingeniería genética ya estaba muy madura en ese momento, y la secuenciación de ADN también estaba relativamente madura en ese momento, y luego la tecnología de PCR comenzó a producirse allí. Por lo tanto, allí brotaron las ambiciones de los científicos, los científicos de la vida, decididos a romper con el método de operación original de estilo taller que no era menospreciado por los círculos de la física e incluso de la química, y dedicarse a algo que podría llamarse gran ciencia. .

Por supuesto que quiero estudiar las condiciones para la investigación científica, el pensamiento es un aspecto. Pero, de hecho, si miramos hacia atrás en la historia de la ciencia, muchos acontecimientos importantes aún deben conducirse hasta allí. Algunos de nuestros científicos critican este enfoque, lo que significa que debemos prestar atención a combinar la investigación básica con las principales necesidades sociales. Creo que en realidad esto es un poco sesgado, es decir, hay varios tipos de investigación: algunas son una especie de exploración libre, entonces esto puede ser muy cuidadoso, y una persona puede tener la idea de un Premio Nobel en su mente. Pero también hay algunos estudios que realmente esperan beneficiar a la humanidad. Pero los desafíos que plantean tales investigaciones pueden en realidad generar las ideas de innumerables personas para el Premio Nobel. Entonces el Proyecto Genoma Humano es un ejemplo típico.

Veamos la primera, que puede considerarse una oferta formal. Cuando hacemos este proyecto, en términos generales, primero debemos preparar un documento de licitación. Así, la primera propuesta para el Proyecto Genoma Humano puede considerarse como un breve artículo publicado por el premio Nobel Dulbecco en la revista Science en 1986. ¿Cuál es el título de este breve artículo? "Un punto de inflexión en la investigación del cáncer: la investigación del genoma humano". De hecho, sabemos que después de que un joven y ambicioso presidente de los Estados Unidos, John F. Kennedy, llegó al poder, tenía dos grandes planes en el ámbito científico: uno era llevar humanos a la Luna y el otro era derrotar al cáncer. Bueno, con la implementación relativamente fluida del programa Apolo, los humanos llegaron a la luna en 1969. Pero el plan para vencer el tumor fue un fracaso. ¿Por qué? Resulta que los científicos pensaron que el problema era demasiado simple, pensando que los tumores eran sólo un problema de uno o dos genes. Pero, de hecho, la gran mayoría de los tumores son causados ​​por múltiples genes. Se trata de cuestiones relacionadas con el genoma completo y cuestiones relacionadas con el desorden de la información genética en su conjunto. Como se acaba de mencionar, no debemos pensar que si se inyecta un gen de fusión en un ratón, es suficiente para causarle leucemia. No es tan simple. Porque en ese caso, la leucemia ocurrirá tan pronto como la inyecte. De hecho, con nuestra leucemia PML Rolla, después de que se inyecta el gen de fusión en el óvulo fertilizado, la leucemia tardará un año en aparecer y la leucemia no ocurre. cada hora. Por lo que sugiere que hay otros factores determinantes involucrados. Ahora sabemos que, a veces, cuando se transmiten varios genes juntos, la tasa de leucemia se acelera considerablemente.

El artículo de Dulbecco decía que si queremos entender más sobre los tumores, debemos prestar atención al genoma de las células de ahora en adelante. ¿En qué especies deberíamos empezar a trabajar? Si queremos entender los tumores humanos, deberíamos empezar por los humanos. La investigación de tumores humanos recibirá un gran impulso gracias al conocimiento detallado del ADN. De hecho, la gran mayoría de las enfermedades humanas son poligénicas. El Proyecto Genoma Humano se lanzó oficialmente, en términos generales, en 1990.

Pero otra cuestión que alguna vez confundió a la comunidad académica es que si ahora estamos en una era de explosión de conocimiento, se puede decir que la explosión de información biológica es la más impresionante.

Vemos que antes de que comenzara el proyecto del genoma, el crecimiento de las secuencias de ADN en las bases de datos públicas era muy lento. Luego, después de 1990, hubo un período de crecimiento exponencial. Y he contado esto hasta que el año pasado y 2000, dos instituciones públicas del mundo, el Sequencing Project y Seral respectivamente, anunciaron la finalización de los llamados bocetos de trabajo. Esta era la situación en ese momento, y probablemente sea la situación ahora. En 1999, se enfrentó a un desafío contundente por parte de Seral. Se creó en 1998 y afirmó haber obtenido el genoma humano en tres años. El Proyecto Internacional del Genoma Humano decidió afrontar el desafío. Dieciséis grupos internacionales han compartido la tarea de secuenciar el genoma humano, y China también se ha sumado a ese proyecto de secuenciación. Por supuesto, somos responsables del 1% de las tareas, y el 1% sigue siendo muy importante. Porque hay que decir que no es fácil para un país en desarrollo meterse en un club de países desarrollados. Hay algunas cosas que quizás no podamos incluir incluso si quisiéramos, como el plan de la estación espacial, pero la gente todavía desconfía de usted.

Aquí me gustaría presentarles ¿qué es un diagrama de marco de trabajo? Dado que todo el mundo habla del diagrama del marco de trabajo, ¿qué es el diagrama del marco de trabajo? En realidad es sólo un boceto de trabajo. Entonces, ¿qué significa? Es decir, al secuenciar una cobertura de 4 a 5 veces de clones continuos de BAC (cromosoma artificial bacteriano) con posiciones de tinción claras, se puede obtener más del 90% de las secuencias genéticas del genoma y la tasa de error debe ser inferior a 1. %. En otras palabras, su cobertura debería alcanzar más del 90% del genoma. En cuanto al segundo, la tasa de error debería ser inferior al 1%. 100 bases opuestas te permiten tener un error de menos de un par de bases. Aunque esto es sólo un esbozo, ya se ha utilizado para la comprensión básica de la estructura del genoma, la identificación y análisis de genes, la clonación posicional de genes de enfermedades, el descubrimiento de polimorfismos de un solo nucleótido, etc.

Cuando se trata de bocetos, debe haber un diagrama final. Por lo tanto, la definición de este diagrama requiere que los clones utilizados para la secuenciación puedan representar fielmente la estructura del genoma de la eucromatina, con una tasa de cobertura superior. 99,9%, entonces la tasa de error de la secuencia debería ser inferior a 1 en 10.000. La relación con el diagrama del marco de trabajo es en realidad aumentar la cobertura de la secuencia y llenar los vacíos sobre la base del diagrama del marco de trabajo, de modo que la precisión de la secuencia aumente y pueda alcanzar dicho estándar. Es decir, es el siguiente paso en el boceto. ¿Cómo era la situación de la secuenciación el 25 de junio de 2000? Nos fijamos en los planes del sector público que fueron apoyados por los gobiernos de seis países en ese momento: Estados Unidos, Reino Unido, Alemania, Japón, Francia y China. Cubre aproximadamente el 86,8% del genoma humano. Se ha completado parte de él, que es el diagrama de secuencia final que acabamos de mencionar. La secuencia estándar es aproximadamente un poco más del 20%, y aproximadamente el 66% de la secuencia se encuentra en la llamada etapa de boceto de trabajo. También se puede decir que aún no está terminado. Porque dijimos que queremos llegar a más del 90%, pero al mismo tiempo Seral afirma que su tasa de cobertura ha superado el 95%. Por supuesto, su cobertura en realidad incluye esta contribución en todos los campos públicos, más su contribución, por lo que los dos suman. Creo que deberíamos creer que probablemente más del 90% de las secuencias están cubiertas por la calidad de una secuencia como un boceto de trabajo. Echemos un vistazo a la situación actual del programa de secuenciación de dominio público y su distribución en los 24 cromosomas. Sabemos que, efectivamente, en diciembre de 1999 se determinó la secuencia completa del cromosoma 22, uno de los cromosomas humanos más pequeños, o su autosoma, que se refiere a parte de la secuencia completa. Nos dimos cuenta de que su brazo corto es la región propensa a los cromosomas, lo que en realidad es muy difícil de medir. Porque hay muchas secuencias vacías y pocos genes. En abril de 2000 se completó la secuencia completa del cromosoma 21. Tiene la misma definición, es decir, esta parte del cromosoma autosómico. Vemos que está representado en color rojo oscuro, que es casi el resultado final.

Y este color amarillo representa el boceto de trabajo que acabamos de mencionar. En la mayoría de las áreas de los cromosomas, es la parte del boceto de trabajo. De hecho, cuando hablamos de completar la determinación de toda la secuencia del genoma humano, nos referimos a la parte autosómica, por lo que algunas personas dicen que es posible que la secuencia del genoma humano nunca se complete.

El 15 de febrero de 2001, sabemos que en el campo de los asuntos públicos en "Naturaleza", hay un sentimiento de lucha entre sí, soldados contra soldados y generales entre sí. Abordé la secuencia Seral el 16 de febrero. Obviamente, después de una nueva ronda de competición, la calidad de la secuencia completa fue mucho mayor que en junio de 2000. Entonces, en este caso, se debe considerar que la información de las dos empresas combinadas es un paso más allá de la definición general que acabo de mencionar. Por tanto, existe un estado intermedio entre el boceto de trabajo y el dibujo final completado. Este estado intermedio se denomina boceto de alta calidad. Pero es un boceto de tan alta calidad que nos permite saber básicamente qué tan grande es mi riqueza de información sobre la vida humana. Al final, descubrimos que nuestras posesiones parecían ser relativamente lamentables, en comparación con nuestra imaginación original, porque nuestro número de genes es sólo aproximadamente el doble que el de un organismo vivo con sólo más de 900 células en los nematodos. El doble de insectos. La complejidad del genoma de los organismos inferiores a los superiores está determinada no tanto por el número de genes, sino más principalmente por la longitud de los genes. Recientemente completamos la secuenciación de una bacteria llamada Leptospira, que puede causar enfermedades infecciosas. Tiene un gen por KB en promedio. Para algo tan pequeño, un genoma de 5 millones de pares de bases tiene 5.000 genes. Los humanos tenemos 3 mil millones de pares de bases, y sólo tenemos 30.000, o como mucho cerca de 40.000. Pero si nos fijamos en la levadura, si se trata de células eucariotas, entonces es de 5 a 10 KB por gen en promedio. Luego cuando se trata de Drosophila, aunque su número de genes no parece ser tanto como el de C. elegans. Pero la longitud de su gen ha alcanzado más de 10 KB, y luego, en los mamíferos, un gen probablemente tenga más de 100 KB de longitud. Por tanto, la posibilidad de sustitución y empalme aumenta considerablemente. Además, la complejidad de estas secuencias aumenta considerablemente en relación con la regulación del tiempo y el espacio, es decir, las etapas de desarrollo y la expresión específica de tejido. Aunque los genes de los organismos superiores pueden alcanzar el orden de magnitud de diez elevado a la quinta potencia, existen entre decenas y cientos de miles de organismos relativamente avanzados. Pero, de hecho, si se compara el genoma con un edificio, el número de piezas prefabricadas que componen este edificio es en realidad relativamente limitado. Luego hay otros organismos avanzados que tienen combinaciones de dominios más ricas. Los genes para la función neuronal, el desarrollo de tejidos específicos, la regulación, la hemostasia y el sistema inmunológico se han expandido enormemente en los vertebrados. Cientos de genes humanos se originan a partir de transferencias laterales de genes bacterianos en algún momento de la evolución de los vertebrados. Los genomas varían mucho entre individuos: los polimorfismos de un solo nucleótido, que varían en 1/1250 genes entre haplotipos, pueden causar menos del 1% de la variación de las proteínas.

Este libro genético se ha puesto frente a nosotros y el siguiente paso es comprenderlo. Para entenderlo hay que considerar cómo entenderlo desde el concepto de un gran sistema. Existe interacción entre la información de este genoma y el entorno externo. Además, esta información del genoma no cae del cielo, sino que se ha desarrollado a través de un largo proceso evolutivo de miles de millones de años, por lo que hay que utilizar un método comparativo para leerla. Además, debemos considerar que existen variaciones entre individuos y grupos, y esta variación también está sujeta a algunos ajustes por parte del entorno externo. Por lo tanto, aunque no existe una definición estricta del contenido de la investigación en genómica funcional, personalmente creo que incluye al menos estos aspectos: el estudio de la variabilidad de la secuencia del ADN del genoma humano, cuyo contenido central es el SNP, porque es el más común. tipo de variación y, por supuesto, hay muchas otras variaciones. Luego está el estudio de la regulación de la expresión del genoma, que es la variación de tejidos y órganos en la etapa de desarrollo, y luego el estudio de organismos modelo, que incluye el significado de la evolución y el uso de organismos modelo para la investigación funcional. Ciertamente estamos trabajando en todos estos estudios, tal como lo hacemos con los estudios de secuenciación.

¿Qué deberías hacer? ¿Cómo encontrar el gen de su enfermedad? Entonces existe un nuevo concepto llamado genética inversa. ¿Qué es? Encuentre primero sus genes y luego observe su fenotipo. Una vez que obtenga el gen, podrá deducir fácilmente la estructura de su proteína. Puedes producir anticuerpos y luego realizar muchas funciones genéticas. La investigación relacionada con la salud es una parte importante del PGH. En 1997 se propusieron sucesivamente el Proyecto de Anatomía del Genoma Tumoral y el Proyecto del Genoma Ambiental.

Aportaciones del Proyecto Genoma Humano a la Medicina. El diagnóstico genético, la terapia génica y el tratamiento basado en información genómica, los países en desarrollo y desarrollados están prestando cada vez más atención a la prevención de enfermedades, especialmente la prevención de enfermedades basada en información genómica. Nuestro país siempre ha abogado por la prevención primero. Si se pueden identificar los genes de susceptibilidad a las enfermedades cuando una persona recién nace, se pueden seleccionar los grupos de riesgo en una etapa temprana y luego se pueden implementar intervenciones basadas en factores ambientales y estilo de vida. La biotecnología ha experimentado cambios profundos y ha entrado más en el nivel de investigación de células, embriones y tejidos, impulsando la aplicación de la tecnología de células madre embrionarias y adultas. Investigación en hematología y otras ciencias avanzadas