¿Qué es el análisis de patrones de expresión genética?
¿Qué es el análisis seriado de la expresión génica? Análisis en serie de genes
En 1995, Velculescu et al. propusieron la tecnología de análisis en serie de expresiones genéticas (SAGE), que puede estudiar miles de transcripciones al mismo tiempo.
El principio y la ruta experimental de 1. Sabio.
1.1 Principio de Sage
SAGE tiene dos fundamentos principales. En primer lugar, una etiqueta de secuencia de nucleótidos corta de 9 a 10 bases contiene suficiente información para identificar de forma única una transcripción. Por ejemplo, una secuencia de 9 bases puede distinguir 26.265.438+044 transcripciones diferentes (49), y el genoma humano sólo puede codificar 80.000 transcripciones, por lo que, en teoría, cada etiqueta de 9 bases puede representar una secuencia característica de transcripciones. En segundo lugar, si la etiqueta de 9 bases se puede secuenciar en un clon y la secuencia corta de nucleótidos obtenida se ingresa en la computadora para su procesamiento en forma de datos continuos, se pueden analizar miles de transcripciones de ARNm.
1.2 Ruta experimental SAGE.
Como se muestra en la Figura 1: (1) el ADNc se sintetiza mediante transcripción inversa utilizando oligo biotinilado (dT) como cebador y endonucleasa de restricción (enzima anclada).
Enzima anclada,
AE) digestión enzimática. Las enzimas ancladas requieren al menos un sitio de restricción en cada transcrito, lo que se puede lograr con una endonucleasa de restricción de 4 bases, ya que la mayoría de los ARNm tienen más de 256 bases (44). Recoja la porción del extremo 3' del CDN con perlas de estreptavidina. Para cada ARNm, sólo se recogió el fragmento entre la cola de poliA y el sitio de restricción más cercano. (2)
Divida el ADNc en dos partes, A y B, y conecte el adaptador A o el adaptador B respectivamente. Cada adaptador contiene una secuencia del sitio de restricción de la enzima etiquetadora (Tagging Enzyme)
TE) (La enzima etiquetadora es una enzima de restricción de tipo II que puede cortar el ADN en una posición aproximadamente a 20 bases de distancia del sitio de reconocimiento. doble cadena) . La estructura del conector es la secuencia del cebador A/B + sitio de reconocimiento de enzima marcadora + sitio de reconocimiento de enzima de anclaje. (3)
El fragmento corto de ADNc (aproximadamente 9 ~ 10 bases) conectado al adaptador se digiere con una enzima etiqueta. Los fragmentos cortos de ADNc de los dos grupos de ADNc se mezclan y ligan para formar una etiqueta doble. y luego los cebadores A y bAmplificación. (4)
Utilice una enzima de anclaje para cortar el producto de amplificación, extraer el fragmento, el clon y la secuencia de Ditga. Generalmente, cada clon tiene al menos 10 secuencias de etiquetas y el número de etiquetas en un clon oscila entre 10 y 50. (5)
Datos de etiqueta de proceso. Cada etiqueta en la secuencia probada está separada por una secuencia de enzima de anclaje, como se muestra en la Figura 1, donde la enzima de anclaje es Nia.
ⅲ Endonucleasa de restricción, la posición inicial y la dirección de la etiqueta están determinadas por la secuencia CATG/GTAC.
Figura 1 Diagrama esquemático del análisis de la serie SAGE.
La enzima ancla (AE) y la enzima etiqueta (TE) son Niaⅲⅲ y FokI.
x y O representan las secuencias de nucleótidos de diferentes etiquetas respectivamente.
Dado que la longitud del cuerpo de la etiqueta doble es básicamente la misma, no provocará un sesgo de amplificación. Al mismo tiempo, la posibilidad de conectar la misma etiqueta en un cuerpo de etiqueta doble es extremadamente pequeña, lo que garantiza. que cada etiqueta en el clon representan todos el producto de transcripción de una unidad de una transcripción en el estado celular actual. Por lo tanto, mediante análisis mediante software de computadora, se pueden obtener las secuencias de etiquetas y la abundancia de miles de productos de expresión génica.
Aunque la tecnología SAGE puede recopilar información de expresión genética de tejidos biológicos de la manera más completa posible, no puede garantizar completamente la cobertura de todo el ARNm de baja abundancia. Además, la ligación del cuerpo de la etiqueta puede ser causada por la interferencia del conector, lo que puede causar que el clon contenga muy pocos cuerpos de la etiqueta y los extremos de la secuencia clonada no puedan conectarse efectivamente al vector. Powell utiliza perlas magnéticas de biotina para adsorber específicamente cebadores y evitar interferencias de los adaptadores (Powell
1998).
2. Ventajas y aplicaciones de SAGE
SAGE es una tecnología de investigación de expresión génica rápida y eficaz que puede ser utilizada por cualquier laboratorio con PCR y equipos de secuenciación manual. Combinado con la tecnología de secuenciación automatizada, el análisis de 1000 transcripciones se puede completar en 3 horas. Además, el uso de diferentes enzimas de anclaje (endonucleasas de clase II que reconocen entre 5 y 20 bases) hace que la tecnología sea más flexible.
En primer lugar, SAGE se puede aplicar a la investigación del genoma humano. 1995 Velculescu et al seleccionaron B***F I y Nia.
ⅲ se utiliza como enzima de etiquetado y enzima de anclaje respectivamente, y los datos de la etiqueta de 9 bases se analizan por computadora y se buscan en GenBank. De las 1.000 etiquetas analizadas, más del 95% podrían representar una transcripción única. Los niveles de transcripción se pueden dividir en cuatro categorías según la frecuencia de aparición de la etiqueta: ①.
Tres veces más ***380 personas, lo que representa el 45,2%; ② 45 * * * aparece tres veces, lo que representa el 5,4%;
***351, lo que representa el 7,6%; (4) una sola vez;
***840, lo que representa el 41,8%. Por lo tanto, SAGE puede extraer de forma rápida y completa información sobre la expresión de genes biológicos y realizar análisis cuantitativos de genes conocidos. SAGE también se puede utilizar para descubrir nuevos genes. Aunque la etiqueta SAGE solo contiene 9 bases, la secuencia de 13 bases se puede confirmar agregando la secuencia del sitio de la enzima de anclaje (4 bases) * * *. Si una etiqueta no tiene una secuencia homóloga cuando se busca una secuencia conocida, el fragmento de 13 bases se puede utilizar como sonda para examinar la biblioteca de ADNc y obtener clones de ADNc.
En segundo lugar, SAGE se puede utilizar para comparar cuantitativamente la expresión genética específica en tejidos y células en diferentes condiciones. Stephenl et al. (1997) utilizaron la tecnología SAGE para comparar la expresión genética en fibroblastos de blastocisto de ratón. Los fibroblastos del saco embrionario de ratón pueden producir la proteína del gen supresor de tumores P53 sensible a la temperatura, por lo que podemos comparar las diferencias en la expresión génica a dos temperaturas diferentes mediante el análisis SAGE. De aproximadamente 15 de los miles de genes analizados, se encontró que la expresión de 14 genes dependía de la proteína P53, y la expresión de 3 genes estaba relacionada significativamente con la inactivación de la proteína P53. Zhang et al. (1997) compararon la expresión genética de 300.000 transcripciones en células normales y células tumorales y encontraron que entre las 4.500 transcripciones analizadas, al menos 500 tenían diferencias significativas en la expresión en los dos tejidos celulares.
En tercer lugar, debido a que SAGE puede recopilar información de expresión genética de un genoma simultáneamente al máximo, los datos del análisis de transcripción se pueden utilizar para construir mapas de expresión cromosómica (cromosomas
representación
p>
Map). Victor et al. analizaron la expresión genética del genoma de la levadura y encontraron 4655 genes de 60633 transcripciones (los niveles de expresión oscilaron entre 0,3 y 2,0/célula), de los cuales 1981 genes han sido confirmados y El gen 2684 aún no se ha informado. El mapa de expresión cromosómica elaborado integrando la información de expresión genética con el mapa del genoma vincula la expresión genética con la estructura física, lo que es más propicio para el estudio de los patrones de expresión genética. (Velculescu, 1997)
SAGE es una herramienta eficaz para la investigación cualitativa y cuantitativa sobre la expresión genética, y es muy adecuada para comparar la expresión genética biológica en diferentes estados de desarrollo o enfermedad. Además, SAGE puede obtener información de expresión genómica casi completa y puede leer directamente información de expresión genética de cualquier tipo de célula o tejido. La aplicación de la tecnología SAGE acelerará enormemente el progreso de la investigación del genoma, pero debe combinarse con otras tecnologías y complementarse entre sí para realizar investigaciones sobre la expresión genética del genoma de la manera más completa posible.
¿Qué es la expresión genética? Se refiere al proceso mediante el cual los organismos convierten la información genética transportada por los genes en cadenas polipeptídicas biológicas.
Expresión génica La expresión génica se refiere a la conversión de información genética almacenada en secuencias de ADN en moléculas de proteínas biológicamente activas durante el proceso de vida de las células. Varias proteínas y enzimas funcionales en los organismos están codificadas por genes estructurales correspondientes.
El proceso de transcripción
Bajo la catálisis de la ARN polimerasa, el proceso de síntesis de ARNm utilizando el ADN como plantilla se llama transcripción. En el ADN de doble cadena, la cadena que sirve como plantilla para la transcripción se llama cadena plantilla o cadena antisentido. La cadena que no se utiliza como plantilla para la transcripción se llama cadena codificante o codificante.
La cadena de ADN complementaria a la plantilla de transcripción en el ADN bicatenario es la cadena codificante. La única diferencia entre esta y el producto de la transcripción es que la T del ADN se convierte en la U del ARN. En el ADN de doble hebra que contiene muchos genes, la hebra modelo para cada gen no siempre está en la misma hebra, es decir, una hebra puede servir como hebra modelo para algunos genes pero también puede servir como plantilla para otros genes. .
Se requiere procesamiento postranscripcional, que incluye:
(1) Empalme: los exones e intrones de un gen se transcriben en una molécula de ARN transcrita original. Esta molécula de ARN transcrita se llamado pre-ARNm, también conocido como ARN nuclear heterólogo (Hurna). Por lo tanto, la molécula de pre-ARNm tiene secuencias tanto exónicas como intrónicas, así como secuencias no traducidas antes y después de la región codificante. Estas secuencias de intrones deben estar ramificadas y las secuencias de exones deben estar conectadas para producir moléculas de ARNm maduras y funcionales. Este proceso se llama empalme de ARN. La escisión ocurre en el extremo 3' del exón de GT y AG ocurre en la unión del extremo 3' del intrón y el siguiente exón.
(2) Capping: Casi todos los ARNm eucariotas tienen una estructura de "cap" al final. Aunque la transcripción del ARNm de eucarióticos está dirigida por el trifosfato de nucleótidos de purina (pppAG o pppG), un nucleótido en el extremo 5' es siempre trifosfato de 7-metilguanosina (m7GpppAGpNp). Esta estructura en el extremo 5' del MNR se llama tapa. Los ARNm de diferentes eucariotas tienen tapas diferentes.
Estructura y función de la tapa del ARNm: ① Puede ser reconocido por la subunidad pequeña del ribosoma y promueve la combinación de ARNm y ribosomas. ② La estructura m7Gppp puede bloquear eficazmente el extremo 5' del ARN, protegiendo así el ARNm; del ácido nucleico 5' La degradación por exonucleasa mejora la estabilidad del ARNm.
(3) Cola: la mayoría de los eucariotas tienen una cola Poli(A) compuesta de 100~200 A en el extremo 3' del ARNm. La cola de poli(A) no está codificada por el ADN, pero el pre-ARNm transcrito se polimeriza hasta el extremo 3' utilizando ATP como precursor y está catalizado por la adenililtransferasa del ARN terminal o poli(A) polimerasa. La cola no se añade al extremo 3' de la terminación de la transcripción, sino al extremo 3' del producto de la transcripción. Una enzima específica reconoce la señal de reconocimiento de la cola AAUAAA aguas arriba del punto de corte de 13 a 20 bases y la secuencia conservada GUGUGUG aguas abajo del punto de corte, corta una sección aguas abajo del punto de corte y luego es catalizada por la poli(A) polimerasa. Cola de poli(A). Si la señal de reconocimiento muta, las funciones de la cola de mRNAPoly(A) son las siguientes: ① Puede ayudar al transporte de mRNA desde el núcleo al citoplasma; ② Evita la degradación por las ribozimas en la célula y mejora la estabilidad del mRNA.
2. Proceso de traducción La transcripción y procesamiento de las células eucariotas se realiza en el núcleo, pero el proceso de traducción se realiza en el citoplasma.
Utilizando ARNm como plantilla y ARNt como portador, el proceso de ensamblar aminoácidos activados en cadenas polipeptídicas de proteínas en ribosomas (también conocidos como ribosomas) se denomina traducción y se puede dividir a grandes rasgos en tres etapas:
p>
(1) Iniciación de la cadena peptídica: bajo la acción de muchos factores de iniciación, la subunidad pequeña del ribosoma se une primero al codón de inicio del ARNm y luego se une a la formilmetionina. El ARNt (tRNA fMet) se combina para formar un complejo inicial. A través del anticodón UAC del ARNt, el codón de inicio AUG en el ARNm se reconoce y se empareja entre sí, y luego la subunidad grande del ribosoma se combina con la subunidad pequeña para formar un complejo estable, completando así la función inicial.
(2) Extensión y longitud de la cadena peptídica: hay dos puntos de unión en la posición del ribosoma-P y en la posición A, que pueden unirse a dos aminoacil tRNA al mismo tiempo. A medida que el ribosoma se mueve a lo largo del ARNm de 5' a 3', los codones se leen secuencialmente. Primero el tRNAfMet se une al sitio P, luego el segundo aminoacil tRNA ingresa al sitio A. En este momento, bajo la catálisis de la peptidil transferasa, se forma un enlace peptídico entre los dos aminoácidos en la posición P y la posición A. El primer ARNt perdió el aminoácido que transportaba y se desprendió de la posición p, dejando la posición p vacía. El aminoacil-ARNt en la posición A se mueve a la posición P bajo la acción de la translocasa y el GTP, mientras que la posición A está vacía. El ribosoma mueve un codón a lo largo del extremo 5' del ARNm hasta el extremo 3'. El tercer aminoacil ARNt entra en la posición A, forma un enlace peptídico con el aminoácido en la posición P y acepta la cadena peptídica en la posición P. El ARNt en la posición P se libera y la cadena peptídica en la posición A se mueve a la posición P.
Repetidamente, la cadena peptídica continúa extendiéndose hasta que aparece el código de terminación del ARNm y ningún aminoacil-ARNt puede unirse a él, por lo que termina la extensión de la cadena peptídica.
(3) Terminación de la cadena peptídica: La señal de terminación es el codón de terminación (UAA, UAG o UGA) en el ARNm. A medida que el ribosoma se mueve a lo largo del ARNm, la cadena polipeptídica continúa extendiéndose. Después de que aparece la señal de terminación en la posición A, no hay conexión aminoacil-ARNt y la síntesis de la cadena polipeptídica entra en la etapa de terminación. Bajo la acción del factor de liberación, el enlace éster del peptidil tRNA se separa, por lo que se liberan la cadena polipeptídica completa y la subunidad grande del ribosoma, y luego la subunidad pequeña también se separa del mRNA.
(4) Procesamiento postraduccional: los polipéptidos liberados por los ribosomas deben procesarse y modificarse aún más para formar proteínas biológicamente activas. El procesamiento de cadenas peptídicas postraduccionales incluye escisión de cadenas peptídicas, hidroxilación, fosforilación, acetilación y glicosilación de ciertos aminoácidos. Los eucariotas escinden la metionina postraduccionalmente en cadenas peptídicas de mano nacientes. Existe un tipo de gen cuyo producto de traducción precursor contiene múltiples secuencias de aminoácidos y puede escindirse en diferentes proteínas o polipéptidos, llamados poliproteínas. Por ejemplo, la insulina es un producto de traducción primaria de 86 aminoácidos llamado proinsulina. La proinsulina consta de tres segmentos: A, B y C. Después del procesamiento, se elimina el segmento del péptido C inactivo y se forma un enlace disulfuro entre el péptido A y el péptido B, obteniendo así insulina activa compuesta de 51 aminoácidos.
3. La correlación entre exones e intrones en el proceso de expresión. A juzgar por las definiciones de intrones y exones, no se pueden confundir, pero no todos los exones en eucariotas son "obvios" (codifican aminoácidos). Además de los exones de los genes de ARNt y de ARNr, el primer y segundo exón de casi todos los genes estructurales solo codifican una parte de aminoácidos, y también hay exones que no codifican ningún aminoácido, como el primer exón del Exposición del gen G6PD humano.
Se ha descubierto que los exones de un gen pueden ser intrones de otro gen y viceversa. Tomemos como ejemplo el gen de la amilasa del ratón, que es el mismo gen del hígado y las glándulas salivales. El gen de la amilasa consta de cuatro exones. La amilasa producida en el hígado no retiene el exón 1, mientras que la amilasa producida en la glándula salival retiene la secuencia de 50 pb del exón 1, pero el exón 2 se escinde junto con el primer y segundo intrones. Después del corte y empalme, el exón 2 se convierte en un intrón del gen de la amilasa salival.
4. El mismo gen puede producir diferentes productos génicos en diferentes tejidos, y se pueden producir proteínas similares en diferentes tejidos. Estas proteínas pueden estar codificadas por el mismo gen. Este fenómeno se debe al hecho de que los potenciadores de los genes son específicos de cada tejido y pueden unirse a factores específicos de cada tejido en diferentes tejidos. Por lo tanto, el mismo gen producirá diferentes transcripciones y procesamiento postranscripcional en diferentes tejidos. Además, los genes eucarióticos pueden tener un sitio poli(A), por lo que se pueden producir diferentes pre-ARNm en el extremo 3' en diferentes células, por lo que habrá diferentes métodos de corte y empalme. Debido a que la mayoría de las transcripciones de genes eucariotas se empalman después de agregar una cola poli (A), en diferentes tejidos y células, diferentes factores interferirán con la poliadenilación y, en última instancia, afectarán el método de empalme.
La expresión génica es transcripción y traducción. La transcripción ocurre en el núcleo y la traducción ocurre en los ribosomas en el citoplasma.
La expresión génica se refiere a la conversión de la información genética almacenada en secuencias de ADN en moléculas de proteínas biológicamente activas durante la vida de las células.
La expresión génica se refiere a la conversión de la información genética almacenada en secuencias de ADN en moléculas de proteínas biológicamente activas durante la vida de las células. Varias proteínas y enzimas funcionales en los organismos están codificadas por genes estructurales correspondientes.
La expresión génica incluye la transcripción (ADN a ARN) y la traducción (ARN a proteína).
La expresión génica se refiere a la conversión de la información genética almacenada en secuencias de ADN en moléculas de proteínas biológicamente activas durante la vida de las células. Varias proteínas y enzimas funcionales en los organismos están codificadas por genes estructurales correspondientes.
¿El análisis de la expresión genética del genoma completo incluye el lncRNA? Por lo tanto, si el lncRNA puede servir con éxito como objetivo molecular para el diagnóstico clínico y el tratamiento del cáncer está estrechamente relacionado con la diferenciación y el desarrollo celular.
Las funciones de emergencia, especialmente aquellas asociadas al envejecimiento, están estrechamente relacionadas, como las enfermedades cardiovasculares y la enfermedad de Alzheimer. El LncRNA puede participar en la respuesta inmune y la defensa del huésped como un complejo de proteínas intracelulares que reclutan señales.
LncRNA y enfermedad: LncRNA está relacionado con muchas enfermedades humanas Las funciones de LncRNA en los organismos se pueden dividir en tres categorías:
Funciones biológicas: LncRNA está relacionado con la regulación epigenética y transcripcional. regulación. A diferencia de la traducción de ARNm, que requiere un uso estricto de codones tripletes, donde una mutación por desplazamiento de marco de un solo codón puede provocar la pérdida de la función de la proteína, el segmento conservado de lncRNA puede estar solo en una región muy corta. Estas regiones más cortas son críticas para la estructura o las interacciones específicas de secuencia, la regulación postranscripcional, el cáncer y la regulación de miARN: diseñar 1 grn en ambos extremos de la secuencia genómica del lncRNA da como resultado la eliminación de todo el fragmento de lncRNA o de la mayor parte del fragmento. secuencia, logrando así el Knockdown del lncRNA.
Dado que la mayoría de los ARN no codificantes largos no tienen una conservación de secuencia obvia entre especies, los lncRNA aún pueden exhibir sus características biológicas originales cuando se someten a sustituciones, inserciones o eliminaciones de bases de ciertas secuencias activas.
Tecnología patentada
Principio de knockout de LncRNA. Por lo tanto, la pérdida de la función del lncRNA debe completarse eliminando esta región conservada, lo que será una dificultad y un punto crítico en su desarrollo futuro en la diabetes.
¿Cuál es la conexión entre el análisis de la expresión génica y la secuenciación del genoma? El análisis de la expresión genética se basa en los niveles de expresión. La secuenciación del genoma depende de las mutaciones que haya en el genoma, si hay deleciones o mutaciones, etc. Uno es cuantitativo y el otro es cualitativo, lo que puede entenderse como