Contenido y características del documento sobre espectro.
1 ¿Genómica y sus contenidos de investigación?
La palabra genoma (GENOMA) fue propuesta por Winkles en 1920 y está compuesta por genes y cromosomas. Se utiliza para describir el concepto de todos los genes y cromosomas de los organismos. Watson y Crick descubrieron la estructura de doble hélice del ADN en 1953, lo que marcó el nacimiento de la biología molecular. Con el desarrollo de diversas disciplinas, la investigación biológica actual ha entrado en una nueva generación y se combinan orgánicamente diferentes técnicas y métodos de investigación a nivel de macromoléculas biológicas para superar los problemas biológicos. ?
La investigación genómica puede entenderse como: (1) Investigación del perfil de expresión génica, es decir, comparar las diferencias en los patrones de expresión génica en diferentes tejidos y diferentes etapas de desarrollo, estados normales y patológicos, y células cultivadas en vitro. Estas técnicas incluyen RTPCR tradicional, ensayos de protección de RNasa e hibridación por transferencia Northern, pero tienen la desventaja de que solo se pueden realizar una a la vez. Los nuevos métodos de análisis de expresión de paso alto incluyen microarrays, análisis en serie de expresión genética (SAGE), chips de ADN, etc. (2) Estudios funcionales de productos genéticos-proteínas, incluidos métodos de expresión de proteínas in vitro y estudios de proteomas de genes individuales (3) Utilización de sistema de dos híbridos de levadura, sistema de un solo híbrido, sistema de tres híbridos (sistema de tres híbridos); y sistema híbrido inverso Se estudiaron las interacciones proteína-proteína.
En 65438-0986, el científico estadounidense Thomas Roderick propuso la genómica, que se refiere al mapeo genómico de todos los genes (incluidos mapas genéticos, mapas físicos y mapas de transcripción), mapeo de nucleósidos. La ciencia del análisis de secuencias ácidas, mapeo de genes. y análisis de la función genética. Por lo tanto, la investigación genómica debe incluir dos aspectos: genómica estructural con el fin de secuenciar el genoma completo y genómica funcional con el fin de identificar la función genética. La genómica estructural representa una etapa temprana del análisis del genoma y se centra en la construcción de mapas genéticos, físicos y transcripcionales de organismos de alta resolución. La genómica funcional representa una nueva etapa en el análisis genético, que es el estudio sistemático de la función de los genes utilizando información proporcionada por la genómica estructural. Se caracteriza por métodos experimentales a gran escala de alto rendimiento, análisis estadísticos e informáticos. Con la implementación del Proyecto Genoma Humano (PGH) en 1990, se lograron grandes logros. Al mismo tiempo, también está en marcha el proyecto del genoma de organismos modelo y se ha completado el análisis de la secuencia de varias especies. El foco de la investigación ha pasado de descubrir toda la información genética de la vida a estudiar la función a nivel molecular en su conjunto. El primer signo es el surgimiento de la genómica funcional y el segundo es el auge de la proteómica.
2¿Cuál es el contenido de investigación de la genómica estructural?
La genómica estructural es una parte importante y un campo de investigación de la genómica. Es una ciencia que determina la composición y la ubicación de los genes mediante el mapeo de genes y el análisis de secuencias de nucleótidos. La información genética está en los cromosomas, pero los cromosomas no se pueden secuenciar directamente. El genoma, un enorme objeto de investigación, debe descomponerse en pequeñas regiones estructurales que sean fáciles de manipular. Este proceso es el mapeo genético. Dependiendo de los signos y métodos utilizados, el mapeo se divide en tres tipos: construcción de mapas genéticos de alta resolución de genomas biológicos, mapas físicos y mapas transcripcionales.
2.1 Mapa genético
La disposición lineal de los genes de un cromosoma específico obtenida mediante recombinación genética se denomina mapa de ligamiento genético. Se trata de calcular la frecuencia de recombinación entre marcadores genéticos vinculados y determinar su distancia relativa, generalmente expresada en centímetros (cM, es decir, la frecuencia de recombinación de cada meiosis es del 1%). Existen muchos métodos para dibujar mapas de ligamiento genético, pero cuando la tecnología del polimorfismo del ADN aún no está desarrollada, rara vez se pueden identificar mapas de ligamiento. A medida que evolucionó el polimorfismo del ADN, la cantidad de marcadores genéticos disponibles se expandió rápidamente.
Los primeros marcadores polimórficos incluyen RFLP (polimorfismo de longitud de fragmentos de restricción), RAPD (ADN polimórfico amplificado con cebador aleatorio) y AFLP (polimorfismo de longitud de fragmentos amplificados). Después de la década de 1980, aparecieron el análisis de polimorfismo genético del ADN STR (secuencias repetidas cortas en tándem, también conocidas como microsatélites) y el análisis SNP (polimorfismo de un solo nucleótido) desarrollados en la década de 1990.
2.2 Mapa físico
El mapa físico es un cromosoma cortado en fragmentos mediante endonucleasas de restricción, y luego se determina la secuencia de conexión entre los fragmentos y la distancia física entre marcadores genéticos en base a la secuencias superpuestas Un mapa de [pares de bases (pb) o kilobases (kb) o megabytes (Mb)]. Tomando como ejemplo el mapa físico del genoma humano, incluye dos niveles de significado. Una es obtener 30.000 sitios de etiqueta de secuencia (STS, definidos como secuencias de copia única con ubicaciones cromosómicas claras que pueden amplificarse mediante PCR) distribuidos por todo el genoma. Clonar el ADNc del gen diana, secuenciarlo, determinar la secuencia de ADNc en ambos extremos, aproximadamente 200 pb, diseñar y sintetizar cebadores, y utilizar ADNc y ADN genómico como plantillas para la amplificación respectivamente; comparar y purificar sondas radiactivas preparadas por; Los STS se comparan con la hibridación de bits originales del genoma de modo que haya un marcador cada 100 kb. El segundo es construir grandes fragmentos que cubran cada cromosoma. Primero, construya cientos de kb de YAC (cromosoma artificial de levadura), mapee el YAC y obtenga clones continuos de YAC superpuestos, lo que se denomina mapeo físico de baja precisión. Luego, realicelo a nivel de fragmentos de ADN de decenas de kb y córtelos al azar. y cargarlo en arcilla se llama mapeo físico de alta precisión.
2.3 ¿Diagrama de transcripción?
El mapa genético molecular construido utilizando marcadores EST se denomina mapa de transcripción. La secuencia del extremo 5' o 3' de parte del ADNc obtenido a partir de la secuenciación de bandas aleatorias y la clonación en la biblioteca de ADNc se denomina etiqueta de secuencia expresada (EST), que generalmente tiene una longitud de aproximadamente 300 a 500 pb. En términos generales, la región 3' no traducida (3'-UTR) de un ARNm es una secuencia relativamente específica que representa cada gen. Al localizar RH la secuencia EST correspondiente a la 3'-UTR, se puede formar un mapa STS compuesto de genes. A finales de febrero de 1998, el número total de más de 65.438 tecnologías ecológicamente racionales de plantas distribuidas en la base de datos del Centro Nacional de Información Biotecnológica (NCBI) había llegado a decenas de miles, y el número de tecnologías ecológicamente racionales en el genoma humano había llegado a más de 18.000. Estas EST no sólo proporcionan una gran cantidad de marcadores moleculares para la construcción de mapas genéticos del genoma, sino que también proporcionan información valiosa para estudios funcionales de genes en diferentes tejidos y órganos. Además, el programa EST proporciona genes candidatos para la identificación de genes. Su desventaja es que a veces es difícil obtener aquellos genes expresados en baja abundancia y aquellos genes cuya expresión se induce en condiciones ambientales especiales (como estrés biótico y abiótico) mediante secuenciación aleatoria. Por lo tanto, para compensar las deficiencias de los proyectos EST, es necesario realizar la secuenciación del genoma. Analizando la secuencia del genoma se puede obtener información completa sobre la estructura del genoma, como el orden de los genes en el cromosoma, la estructura del espaciador intergénico, la estructura del promotor, la distribución de los intrones, etc.
3 ¿Investigación en genómica funcional?
La genómica funcional, también conocida comúnmente como posgenómica, utiliza la información y los productos proporcionados por la genómica estructural para desarrollar y aplicar nuevos métodos experimentales para analizar de manera integral las funciones de los genes a nivel del genoma o del sistema, permitiendo la investigación biológica. pasar del estudio de un solo gen o proteína al estudio sistemático simultáneo de múltiples genes o proteínas. Este es el estudio de la función biológica de la dinámica del genoma después de que se ha dilucidado la secuencia de bases estáticas del genoma. La investigación incluye el descubrimiento de la función genética, el análisis de la expresión genética y la detección de mutaciones. Las funciones de este gen incluyen: funciones biológicas, como fosforilar proteínas específicas como proteínas quinasas; funciones celulares, como participar en vías de señalización intercelular e intracelular, como participar en la morfogénesis, incluida la hibridación sustractiva clásica y el cribado diferencial; análisis de la expresión de ADNc y visualización diferencial de ARNm, pero estas técnicas no pueden analizar genes de manera integral y sistemática. Han surgido nuevas tecnologías, incluido el análisis sistemático de la expresión genética, micromatrices de ADNc, chips de ADN, etc. La forma más eficaz de identificar la función genética es observar los cambios fenotípicos a nivel celular y general después de que se bloquea o aumenta la expresión genética, por lo que es necesario establecer un organismo modelo.
La genómica comparada es una disciplina basada en el mapeo y secuenciación del genoma. Comparando genes y estructuras genómicas conocidas, podemos comprender las funciones de los genes, los mecanismos de expresión y la evolución de las especies.
Utilizando la homología de secuencias y estructuras codificantes entre genomas de organismos modelo y genomas humanos, se pueden clonar genes de enfermedades humanas, se pueden revelar las funciones genéticas y los mecanismos moleculares de las enfermedades, y se pueden revelar las relaciones evolutivas de las especies y la estructura interna del genoma. dilucidado. La investigación actual sobre genomas de organismos modelo ha establecido algunas reglas: los genomas de organismos modelo son generalmente más pequeños, pero tienen una mayor proporción de genes codificantes, menos secuencias repetitivas y secuencias no codificantes. Su% de G + C es relativamente alto; y la organización de las subunidades se conservan y los sitios de empalme son consistentes en muchos organismos. La redundancia del ADN, es decir, la repetición; la mayoría de las funciones biológicas centrales son realizadas por un número considerable de proteínas ortólogas; genes homólogos unidos colinealmente tienen el mismo enlace en diferentes genomas. La investigación del genoma de organismos modelo revela las funciones de los genes de enfermedades humanas, utiliza la homología de secuencias genéticas para clonar genes de enfermedades humanas y utiliza las ventajas de los sistemas experimentales de organismos modelo para analizar rasgos complejos mediante mapeo comparativo en la investigación del genoma humano, profundizando así la comprensión de estructura del genoma. Además, se pueden utilizar técnicas de mutagénesis para identificar genes desconocidos, diversidad genómica y aplicaciones bioinformáticas.
4 Investigación en Proteómica
Los genes son los portadores de la información genética, pero las proteínas son las ejecutoras de todas las funciones biológicas. Tiene sus propias reglas de actividad y está lejos de ser suficiente estudiarlo desde una perspectiva genética. Sólo estudiando el proceso de transcripción de genes y traducción de proteínas podemos revelar verdaderamente los patrones de actividad de la vida. Como resultado, ha surgido una nueva disciplina que estudia la composición y los patrones de actividad de las proteínas en las células: la proteómica. El proteoma fue propuesto por primera vez por Wilkins y Williams de la Universidad Macquarie en 1994 y apareció en "Electroforesis" en julio de 1995. Se refiere a todas las proteínas expresadas por todos los genes y sus métodos de existencia, y son todos los componentes proteicos expresados por un gen, una célula o un tejido. El proteoma es el estudio de grupos específicos de proteínas que funcionan en diferentes momentos y espacios. Explora el modo de acción, el mecanismo de acción, la regulación y las interacciones intragrupo de las proteínas desde el nivel proteico, proporcionando bases teóricas y fundamentos para el diagnóstico clínico, la investigación patológica, la detección de fármacos, el desarrollo de fármacos, las vías metabólicas, etc. ? La proteómica tiene como objetivo dilucidar los patrones de expresión y los patrones funcionales de todas las proteínas en los organismos, incluida la identificación de la expresión, el modo de existencia (forma modificada), la estructura, la función y el modo de interacción de las proteínas. Se diferencia de la ciencia de las proteínas tradicional en que se lleva a cabo al nivel proteico general de los organismos o células y revela las leyes de la vida a partir de la actividad proteica general de los organismos o células. Sin embargo, debido a la diversidad, variabilidad y complejidad de las proteínas, la detección de proteínas de baja expresión es difícil, por lo que conviene aclarar la dificultad de su estudio. En términos generales, la investigación se puede dividir en dos aspectos: investigación del modelo de expresión de proteínas (o composición de proteínas) e investigación del modelo funcional de proteínas (que actualmente se centra en las relaciones de redes de interacción de proteínas). El estudio del proteoma puede proporcionar la siguiente información: si se traduce el producto génico predicho por la secuencia del gen y cuándo; la concentración relativa del producto génico, el grado de modificación postraduccional, etc. Dado que el número de proteínas es menor que el número de marcos de lectura abiertos en el genoma, se propuso la proteómica funcional. Las proteínas funcionales se refieren a proteínas que se expresan activamente en el genoma en un momento específico, un entorno específico y condiciones experimentales, y son solo una parte del proteoma total. La investigación de proteómica funcional se encuentra entre la investigación de proteínas tradicional sobre proteínas individuales y la investigación de proteínas sobre todas las proteínas. Es un grupo de proteínas relacionadas con una determinada función o bajo determinadas condiciones. ?
El análisis y la identificación de la composición de proteínas requieren la caracterización de proteínas, es decir, el mapeo de separación e identificación, que incluye dos pasos de separación e identificación de proteínas. La electroforesis en gel bidimensional (2-DGE) y la espectrometría de masas (MS) son las principales técnicas. En los últimos años, las tecnologías relacionadas y la bioinformática han seguido desarrollándose y avanzando rápidamente. El sistema técnico de investigación de proteomas incluye: preparación de muestras; electroforesis en gel de poliacrilamida; tinción de proteínas; análisis de imágenes de proteomas; Tres de ellos son: tecnología de electroforesis en gel bidimensional, identificación por espectrometría de masas, procesamiento de datos de imágenes por computadora y base de datos de proteínas.
5. ¿El nacimiento de las disciplinas relacionadas con la genómica?
Con la profundización de la investigación genómica, se espera que los humanos revelen varias leyes previamente desconocidas del mundo físico de la vida, descubran por completo los misterios de la vida y luego impulsen la vida al servicio de la sociedad y la economía humanas.
La intersección entre la investigación genómica y otras disciplinas ha favorecido el nacimiento de algunas disciplinas, como la genómica nutricional, la genómica ambiental, la genómica, la genómica patógena, la genómica reproductiva, la genómica de poblaciones, etc. Entre ellas, la bioinformática se está convirtiendo en el punto de apoyo de nuevas industrias que han atraído mucha atención. ?
La bioinformática es una ciencia que estudia macromoléculas biológicas, utiliza computadoras como herramientas y utiliza puntos de vista, teorías y métodos de las matemáticas y las ciencias de la información para estudiar fenómenos de la vida y organizar y analizar datos de información biológica en crecimiento exponencial. Esta investigación se centra en la genómica y las proteínas. El primero es estudiar el ADN portador del material genético y las sustancias de alto peso molecular que codifica. Utilizamos las computadoras como herramientas para estudiar el método interdisciplinario de la bioinformática, descubrir sus regularidades y luego desarrollar varios software adecuados para recopilar, organizar, publicar, extraer y extraer secuencias y estructuras de ADN y proteínas. Procesamiento, análisis y descubrimiento. . Consta de tres partes: base de datos, red informática y software de aplicación. Sus enfoques de investigación incluyen: comparación de secuencias, identificación de genes y análisis de secuencias de ADN, predicción de estructuras de proteínas, evolución molecular y descubrimiento de conocimientos en bases de datos (KDD). Las principales cuestiones científicas en este campo son: continuar estableciendo y optimizando bases de datos; aprendiendo nuevas teorías, nuevas tecnologías y nuevos programas informáticos para bases de datos; análisis comparativo de algunos algoritmos importantes de la estructura de la información del genoma humano; códigos genéticos basados en datos de información biológica Investigación sobre la evolución biológica: formar profesionales en bioinformática y establecer una base de datos y un sistema de servicios biomédicos nacionales [5]. La acumulación de datos biológicos a finales del siglo XX conducirá a nuevos descubrimientos teóricos o descubrimientos científicos importantes. La bioinformática es una investigación basada en bases de datos y descubrimiento de conocimientos, que ha traído cambios revolucionarios a las ciencias biológicas y ha tenido un enorme impacto en la medicina, la salud, la alimentación, la agricultura y otras industrias.
Al hablar de las ciencias de la vida en el siglo XXI, el profesor Zou Chenglu dijo que la biología ha logrado grandes avances en el siglo XX. La ciencia matemática ha penetrado en la biología de manera amplia y profunda, revelando los misterios de la vida a un nuevo nivel. , revolucionó la faz de la biología. La biología no sólo es un tema candente en el desarrollo de las ciencias naturales en la actualidad, sino que lo seguirá siendo después de entrar en el siglo XXI. Los científicos llaman al siglo XXI la era de la información. La combinación de ciencias biológicas y ciencias de la información es sin duda el resultado inevitable del desarrollo multidisciplinario.