1. Descripción general de los métodos de investigación proteómica (Parte 1)
Nota: Esta nota fue compilada de la clase en línea de proteómica organizada por Crick College y Kang Yusheng en 2016-2017 y se eliminó. Este curso lo imparte el Dr. Ku Xin, investigador asistente del Instituto de Biomedicina de Sistemas de la Universidad Jiao Tong de Shanghai.
Como todos sabemos, la proteómica es el estudio de todas las proteínas expresadas por una célula o un organismo. Aunque la secuenciación del genoma es muy popular ahora, no debemos ignorar que las proteínas son las unidades básicas que realizan las funciones de los organismos vivos, y las proteínas realizan diversas funciones biológicas formando diversos complejos y redes de vías. Por lo tanto, hay muchas cuestiones biológicas que sólo pueden estudiarse y explorarse a nivel de proteínas y deben examinarse a nivel de sistema, como por ejemplo: interacciones proteína-proteína, localización celular de proteínas, modificaciones postraduccionales, vías de señalización. y vías metabólicas, control y funciones, etc. ¡Por eso la proteómica es tan importante!
Dado que es importante, ¡los científicos naturalmente hacen todo lo posible para estudiarlo! La primera tecnología utilizada fue la legendaria electroforesis en gel bidimensional (2-DE). Debido a diversos problemas, como la baja resolución y la superposición de proteínas, tanto el rendimiento como la precisión no fueron satisfactorios. Cuando surgió la tecnología de espectrometría de masas, fue rápidamente reemplazada.
Hablando del nacimiento de la tecnología de espectrometría de masas, supongo que muchos amigos han oído hablar del famoso chiste del contraataque DIAO, que trata sobre el premio Nobel de Química de 2002, Koichi Tanaka, uno de los inventores de la espectrometría de proteínas. En primer lugar, debido a una adición accidental de glicerol durante el experimento, la tecnología de espectrometría de masas se introdujo milagrosamente en el campo de aplicación de la identificación de macromoléculas biológicas. Piénselo, toda la historia del desarrollo de la ciencia y la tecnología humana, así como la vida de cada individuo, están llenas de cosas increíbles ~
Cuando la tecnología de espectrometría de masas y la proteómica se unen, es realmente un rayo. ¡El fuego produce fuertes reacciones químicas y detona rápidamente el desarrollo de toda la disciplina! En solo una docena de años, los objetivos de investigación de la proteómica han variado desde modelos celulares, modelos animales, hasta fluidos corporales humanos, tejidos y otras muestras humanas, y la complejidad biológica del rango de aplicación es cada vez mayor. El propósito de la investigación abarca desde la derivación inicial de secuencias de péptidos hasta el análisis cualitativo y cuantitativo de péptidos y proteínas, pasando por modificaciones postraduccionales y proteómica dirigida, que se ha convertido en un nuevo tema candente hoy en día. En resumen, ¡es imparable!
Hablando de proteómica dirigida, todos sabemos que el campo de aplicación de la proteómica siempre ha sido principalmente para la biología básica, como el estudio de rutas, complejos de proteínas, redes de interacción y caracterización de células y tejidos, observación de proteínas. expresión durante el ciclo celular, etc. En los últimos años, debido al rápido desarrollo de la tecnología, la proteómica ha comenzado a utilizarse en la investigación médica y de fármacos. Por ejemplo, es posible que la investigación sobre medicamentos no se utilice mucho en China, pero ha comenzado a generalizarse cada vez más en Europa y Estados Unidos. Tomando como ejemplo la hepatotoxicidad, la proteómica puede proporcionar métodos de investigación para la evaluación de la hepatotoxicidad en las primeras etapas del desarrollo de fármacos.
Entonces, ¿cómo aplicar la proteómica al desarrollo clínico y de fármacos? ¡Se necesita tecnología proteómica específica! En el pasado, la tecnología proteómica se utilizaba principalmente para descubrir nuevas incógnitas, como péptidos, complejos proteicos y modificaciones postraduccionales de proteínas. Esta parte tiene una amplia gama de aplicaciones, el umbral técnico es relativamente bajo y los métodos son relativamente comunes. Pero el problema es que este método no puede manejar una gran cantidad de muestras clínicas y la reproducibilidad y precisión no pueden cumplir con los requisitos.
Como resultado, el análisis dirigido comenzó a aumentar, es decir, antes del análisis, sabemos claramente qué sustancia necesita ser analizada y luego la seleccionamos para una cuantificación y análisis precisos. No necesitamos verificar miles de proteínas a la vez, pero necesitamos verificar una docena o docenas de proteínas que nos interesan en cientos de muestras, y estas proteínas suelen ser proteínas con concentraciones muy bajas. destino perdido (explicaré en detalle por qué se perdió más adelante). ¡Con tecnología dirigida, existen mayores posibilidades y un mayor apoyo para estudiar biomarcadores para el diagnóstico clínico!
A continuación, de acuerdo con las ideas didácticas del profesor, compartiré lo que aprendí en la conferencia desde tres aspectos: detección cualitativa, detección cuantitativa y proteómica dirigida.
Ya sean pruebas cualitativas o cuantitativas, la preparación de muestras es una preparación indispensable. Las muestras de proteínas utilizadas para la espectrometría de masas provienen de una amplia gama de fuentes, siempre que contengan proteínas, pueden utilizarse como fuentes. Para muestras complejas, como fluidos corporales humanos o muestras de tejido, la extracción y reducción de proteínas a menudo requieren un procesamiento complejo y delicado, y los procedimientos de procesamiento varían según la muestra y el propósito de la investigación. Esta parte del contenido se discutirá en detalle en la segunda conferencia "Preprocesamiento de muestras". Los amigos interesados pueden esperar mis próximas notas de la conferencia ~
En otras palabras, hay dos ideas para la detección cualitativa de proteínas. .: De abajo hacia arriba y de arriba hacia abajo. De arriba hacia abajo se refiere a partir de una proteína completa, realizar un procesamiento de fragmentación en espectrometría de masas y deducir la secuencia de la proteína mediante la detección de moléculas fragmentadas. El método ascendente que realmente representa la gran mayoría de las aplicaciones, que es lo que a menudo llamamos el método de escopeta, aprovecha al máximo las características de la proteína misma: puede ser escindida en un sitio específico por una enzima específica. La idea básica es usar primero proteasa para digerir la secuencia de proteínas y luego identificar los fragmentos de péptidos después de la digestión. Por lo tanto, el objeto de detección que ingresa al espectrómetro de masas es siempre el fragmento de péptido y luego la secuencia de proteínas se deduce en función de la secuencia de péptidos. .
1. Procesamiento de muestras: Obtenga diversas muestras de fuentes de proteínas para su preprocesamiento y optimización.
2. Separación de proteínas: según las necesidades de la investigación, utilice la separación en gel para extraer las proteínas requeridas, o no las separe y utilícelas todas para realizar pruebas. Preste atención a la eliminación de impurezas.
3. Digestión enzimática: utilice enzimas específicas de secuencia para digerir la proteína.
4. Separación de péptidos: los péptidos digeridos ingresan a HPLC (cromatografía líquida de alta presión), que es lo que solemos decir en LC; -MS, los péptidos se separarán previamente debido a la diferencia en el tiempo de retención en el empaque de la columna cromatográfica;
5. Ionización: los péptidos separados se ionizan aplicando voltaje (ESI) o use MALDI; disociación láser asistida por matriz, que no requiere el proceso de HPLC
6. Análisis de espectrometría de masas: envíe el péptido cargado al espectrómetro de masas y el péptido estará en el campo magnético. Se produce una desviación (lo básico). principio del espectrómetro de masas), la señal se recoge en el espectro de masas y se obtiene el espectro.
7. Búsqueda en bases de datos: utilice software de búsqueda para analizar automáticamente espectros de masas y obtener información de secuencias de péptidos y proteínas.
Desde otra perspectiva, podemos resumir el proceso del método Shotgun de la siguiente manera:
El indicador más crítico aquí se llama coincidencia péptido-espectro (PSM), que es el espectro de los dedos. Emparejamiento de gráficos y péptidos. Cuanto mejor sea la coincidencia, más precisa será la proteína deducida. Este proceso de coincidencia es lo que a menudo llamamos búsqueda en bases de datos.
A continuación, compartiré los conocimientos previos sobre la búsqueda en bases de datos, las herramientas y algoritmos de búsqueda de bases de datos y la evaluación de los resultados de búsqueda que aprendí en el curso.
La espectrometría de masas suena muy sofisticada, por muy cara que sea, se compone de tres partes: fuente de iones, analizador de masas y detector.
Un espectrómetro de masas puede tener más de una fuente de iones\analizador\detector, y se pueden conectar varios en serie para usarlos en diferentes necesidades de análisis.
Fuente de iones
Hablemos primero de la fuente de iones. ¡La ESI (ionización por electropulverización) utilizada en espectroscopia de proteínas es un invento histórico para la proteómica! Debido a que la ionización se lleva a cabo directamente desde la fase líquida, resulta más fácil combinarla con LC (cromatografía líquida). Primero podemos usar LC para separar previamente mezclas de péptidos muy complejas, reduciendo la complejidad del número de analitos cada vez. Los péptidos separados se pueden introducir directamente en ESI para formar un aerosol de ionización.
Entonces, ¿cómo se forma el spray ESI? En pocas palabras, hay una pequeña abertura en el extremo frontal de la columna de separación, y los analitos pasan a través de la pequeña abertura en el extremo frontal en secuencia según su masa y carga. Se aplica un voltaje a la pequeña abertura. Al principio, la fuerza electrostática es la misma que la tensión superficial. Cuando la fuerza electrostática aumenta para hacerla mayor que la tensión superficial, la película líquida se rompe y forma innumerables pequeñas gotas cargadas. un aerosol. Al igual que la tecnología nanoESI relativamente nueva, el caudal de LC es más lento y el efecto de ionización es mejor. Para aquellos que sientan que la descripción anterior no es lo suficientemente vívida, simplemente miren la imagen:
Analizador de masas
Después de hablar de la fuente de iones, hablemos del analizador de masas, que Está dentro del espectrómetro de masas. La parte más importante. Los nombres de varios espectrómetros de masas que escuchamos habitualmente se denominan según el tipo de analizador de masas. Cada componente de nuestra muestra se ioniza en la fuente de iones y, después de la acción del campo eléctrico acelerado, forma un haz de iones y ingresa al analizador de masas. El analizador de masas separa los iones cargados según su relación masa-carga y registra el número de masa y la abundancia de varios iones para su posterior análisis cualitativo y cuantitativo.
Un analizador de masas tiene dos parámetros técnicos principales: rango de masas y resolución. El rango de masa se refiere al rango de relaciones masa-carga que se pueden medir, lo que determina el rango de iones que podemos detectar. Por ejemplo, la fuente de iones ESI puede producir muchos iones con m/z superiores a 3000. Si el analizador de masas que elija no tiene un límite superior de 3000, no podrá detectar iones superiores a 3000.
¡Sin embargo, otro indicador más importante es la resolución del analizador de masas! Comencemos con la fórmula anterior:
Resolución = relación masa-carga de un pico del espectro de masas observado/ancho de pico a la mitad de la altura del pico (FWHM)
¿Qué significa? Por ejemplo, el pico más a la izquierda en la figura siguiente tiene una relación masa-carga de 1085,55 y el ancho del pico a la mitad de la altura del pico es 0,217, por lo que:
Resolución=1085,55/0,217= 5000
Si esto aún no está claro, simplemente puedes entender que cuanto mayor sea la resolución del espectro de masas, más nítidos y delgados serán los picos que obtendremos. Quizás te preguntes: ¿Cuál es la ventaja de tener picos espectrales finos y nítidos? ¡Esta es una buena pregunta! De hecho, la resolución puede caracterizar la capacidad de distinguir dos picos espectrales adyacentes en un espectro de masas. Echemos un vistazo a la imagen a continuación para sentir cómo nos pueden proporcionar los diferentes espectros de picos de los espectrómetros de masas con diferentes resoluciones.
La figura toma como ejemplo el glucagón (glucagón) para mostrar los picos espectrales dados por espectrómetros de masas con diferentes resoluciones.
Cuando la resolución es 1000, solo se puede ver un pico muy amplio (azul); cuando la resolución aumenta a 3000, el pico es más estrecho (rojo), pero no hay una diferencia obvia cuando se aumenta a 10000; Se puede ver claramente que en realidad hay 8 picos aquí (verde); cuando se aumenta a 30,000, el ancho del medio pico es más estrecho y dos picos adyacentes se pueden separar completamente (negro). Obviamente, cuando tenemos una resolución de 1000 o 3000, no podemos detectar con precisión el peso molecular preciso del péptido que se está analizando, lo que resulta en la incapacidad de hacer coincidir los espectros o en una falta de coincidencia.
Los diferentes analizadores de masas tienen diferentes resoluciones. El orden habitual es: la espectrometría de masas por transformada de Fourier tiene la resolución más alta, pero el costo es demasiado caro, seguida por Orbitrap (serie Orbitrap), que tiene una resolución mucho mayor. que otros espectrómetros de masas; nuevamente TOF (espectrometría de masas de tiempo de vuelo); luego trampa de iones (Ion Trap) y finalmente espectrometría de masas cuadrupolo (Quadrupole);
Permítanme decir una cosa más: la alta resolución es buena, pero el precio es definitivamente caro. Al elegir un espectrómetro de masas, debemos basarlo en nuestros propios propósitos de investigación y rango de presupuesto.
Espectrometría de masas secundaria
Sin embargo, para identificar péptidos, la espectrometría de masas primaria obviamente no es posible inferir en función del valor m/z del ion peptídico qué residuos de aminoácidos. ¿En qué consiste este péptido (hay muchas combinaciones posibles) y cuál es el orden de la secuencia, verdad? Por lo tanto, también se requiere espectrometría de masas secundaria para identificar péptidos.
¿Qué es la espectrometría de masas secundaria? En pocas palabras, la mezcla de péptidos obtiene el espectro de primer nivel a través de la espectrometría de masas de primer nivel, luego selecciona un péptido de él y utiliza algunos métodos, como la colisión con gas aleatorio, para triturar el péptido y obtener iones fragmentados. y luego formar el espectro secundario. Inferimos la composición de residuos del fragmento peptídico observando la distribución de masa de los iones del fragmento y finalmente inferimos qué es la proteína. La imagen anterior ayuda a todos a comprender de dónde proviene el espectro de masas secundario.
En el párrafo anterior, mencioné que un péptido se "selecciona" del espectro de masas primario al espectro de masas secundario. Esto puede parecer una afirmación desenfadada, pero en realidad, ¡cómo elegir es una cuestión muy crítica! El método que normalmente elegimos se puede llamar método "TOP" (este es el nombre que me puse a mí mismo, por ejemplo, TOP15 significa seleccionar los primeros 15 picos del espectro primario, separar un péptido a la vez y luego analizarlo). péptido. Escanee y obtenga el espectro secundario.
¿Ya lo has notado? Si un péptido no entra en el TOP15 del espectro primario, ¡ni siquiera está calificado para ser incluido en el espectro secundario! ¡Resulta que la competencia mundial en espectrometría de masas también es muy cruel! Los péptidos que se pueden escanear mediante la espectrometría de masas secundaria se determinan mediante la espectrometría de masas primaria, por lo que llamamos a este método "adquisición dependiente de datos (DDA)".
Entienda, DDA es ¡De ahí surgió el nombre! Siguiente Cada vez que escuches a alguien decir DDA, no tendrás cien signos de interrogación rondando por tu mente, ¿verdad?
Si lo pensamos detenidamente, no es difícil descubrir que si una proteína si la concentración es. no es lo suficientemente alto, es decir, es difícil que sus péptidos se conviertan en TOP en el espectro primario, por lo que básicamente no hay posibilidad de que pueda ingresar al espectro de masas secundario. Esta es la razón por la que las proteínas de baja curtosis son difíciles de identificar. ! Es por eso que cuando tomamos muestras como sangre, debemos eliminar proteínas de alto pico como la hemoglobina (si la proteína que desea identificar no es hemoglobina)
¡Obviamente, las limitaciones del método DDA! El sexo está ahí. ¿Cómo pueden tolerar esto los científicos que quieren estudiar proteínas de baja curtosis? Entonces, surgió un nuevo método llamado adquisición independiente de datos (DIA), que se detallará en el próximo tweet. .
Usemos la siguiente figura para sentir la relación entre el espectro primario y el espectro secundario:
Por ejemplo, en el primer momento, primero realizamos un escaneo MS1, luego seleccione un péptido con una altura máxima para el escaneo MS2, y así sucesivamente. En algunos espectrómetros de masas con velocidades de escaneo relativamente rápidas, un espectro MS1 puede realizar 80 escaneos MS2.
Identificación de iones fragmentados
Bien, hemos descubierto de dónde proviene el espectro de masas secundario, entonces, ¿cómo podemos inferir de qué aminoácido se trata en función de la información del ion detectado? Tal vez dirás, ¿no es esto simple? ¡Según el peso molecular!
Así es, ¿no es el peso molecular de los diferentes aminoácidos un simple valor? Sin embargo, este asunto no es tan simple, porque hay otra cosa mágica en este mundo, ¡y su nombre es isótopo!
Por ejemplo, el elemento carbono es el más común con un peso atómico de 12, al que llamamos C12. Sin embargo, también tiene un buen amigo igualmente estable, C13 (un neutrón más). Por tanto, tenemos que tener en cuenta el contenido de estos dos isótopos estables (La Enciclopedia Baidu dice que C13 representa 1,11 y C12 representa 98,89). Para un aminoácido, obtendremos dos pesos moleculares diferentes:
¿Qué quieres decir con promedio? Porque cuando el peso molecular de un péptido es mayor, la posibilidad de que contenga varios isótopos y diferentes combinaciones es mayor. Si calculamos el peso molecular de cada combinación, obtendremos una lista larga cuando llegue el momento de hacer la comparación espectral. ¿Se debe utilizar el valor? Ni idea tampoco. Así que simplemente usa un promedio para representarlo.
Utilicemos la siguiente tabla para sentir la diferencia entre el peso molecular monoisotópico y el peso molecular promedio de varios residuos de aminoácidos:
Puedes preguntar nuevamente, estas dos diferencias ¿Bajo qué? ¿En qué circunstancias se utilizan los pesos moleculares? Aquí tenemos que hablar nuevamente de resolución. Si usamos un espectrómetro de masas de alta resolución, los diferentes picos de isótopos están claramente separados. Es decir, podemos ver varios picos de isótopos en el espectro. El peso puede corresponder con precisión al pico monoisotópico correspondiente. Pero en un espectrómetro de masas de baja resolución, es probable que estos picos se mezclen y parezcan ser solo un pico. En este caso, no hay otra manera que utilizar el peso molecular promedio para aproximarlo.
La siguiente imagen puede mostrar vívidamente cuán grande es la diferencia entre el peso molecular monoisotópico y el peso molecular promedio en el espectro de masas. Desde la perspectiva de la espectrometría de masas de alta resolución, se trata de dos iones completamente diferentes. Como dijimos anteriormente, el cálculo basado en el peso molecular promedio no es exacto, pero el cálculo basado en el peso molecular monoisotópico puede corresponder con precisión.
Además de los isótopos, hay otro factor que también debemos tener en cuenta, es decir, cuando el péptido se fragmenta y entra en el espectrómetro de masas secundario, se pueden formar tres tipos de iones diferentes. Generalmente se llama iones, iones ax e iones cz.
La razón por la que se forman diferentes pares de iones es porque diferentes métodos de fragmentación provocan diferentes posiciones de fragmentación de péptidos. Todo el mundo lo entenderá si miras la imagen de arriba. Cuando utilizamos la fragmentación CID (disociación inducida por colisión) o HCD (disociación de trampa C de alta energía), lo que choca con el gas inerte es el enlace CN. Aquí, los iones y se generan en el extremo C y los iones b se generan en el extremo C. el extremo N. Estos son dos de los pares de iones más comunes producidos por espectrometría de masas.
Cuando utilizamos la fragmentación ETD (disociación por transferencia de electrones), debido a que hay un proceso de reacción de electrones, la fragmentación se genera después de agregar electrones. Su posición de fractura puede aparecer en el enlace N-C, formando iones cz, y los instrumentos de clase TOF pueden producir iones ax.
La información del tipo de ion debe pasarse a los pasos posteriores de búsqueda de la biblioteca (normalmente especificamos el tipo de instrumento en el software de búsqueda de la biblioteca y el software coincidirá automáticamente con el tipo de ion), y la computadora debe Simule la posición de fragmentación más probable, genere el espectro teórico correspondiente y luego compárelo con el espectro real. Tomemos el ion by como ejemplo para ver en qué iones fragmentados se puede fragmentar un péptido:
Entonces puede generar un espectro como el siguiente:
A juzgar por el espectro, todos por Se han detectado iones de este péptido. En términos generales, es muy común que péptidos con buena abundancia y longitud adecuada sean capturados por completo en espectrómetros de masas de alta precisión. Por lo general, se pueden capturar entre 50 y 80 iones.
El próximo artículo continuará hablando sobre herramientas de búsqueda en bases de datos, evaluación de resultados en pruebas cualitativas y diversos conocimientos previos sobre pruebas cuantitativas.