Análisis de empalme de variables
Las funciones de IsoformSwitchAnalyzeR se resumen a continuación.
Nota:
En resumen, IsoformSwitchAnalyzeR no solo puede analizar eventos de empalme alternativos, sino también integrar información como la estructura de la proteína para determinar si el empalme alternativo afecta la función de la proteína, incluido el análisis del genoma completo. .
En este artículo, los datos de RNA-seq se utilizan para someterse al proceso de análisis de IsoformSwitchAnalyzeR. Los datos de entrada son resultados cuantitativos para el salmón. Los estudiantes que no sepan cómo utilizar el salmón deberían consultar el salmón para cuantificar su expediente académico.
Instalar con BiocManager.
Importar datos cuantitativos de salmón. Salmon, los resultados de cada muestra están en un directorio separado, donde parentDir es el directorio principal de estos directorios y puede contener todos los resultados.
Después de importarlo, se guardará en un objeto de lista. Contiene información como el recuento de lecturas, TxPM enriquecido y la longitud efectiva de cada transcripción.
Utilice la función importRdata para integrar toda la información necesaria, incluidos datos de expresión, matriz de diseño, información de anotaciones, etc.
IsoformNtFasta es el archivo de secuencia Fasta para cada transcripción y también se utiliza para el índice de Salmon. Devuelve el objeto switchAnalyzeRlist cuando esté completo.
Filtrado para reducir los análisis y cálculos posteriores.
Isoforma (análisis de empalme de variables diferenciales) para analizar la expresión diferencial.
Donde α es el umbral del valor p ajustado.
Análisis de ORF y adquisición de secuencias, incluida la traducción de secuencias de ORF en aminoácidos.
El archivo se enviará al directorio especificado por pathToOutput. El archivo de salida puede ser analizado por CPAT, Pfam, SignalP, etc. Los resultados del análisis de este software luego se integran en el objeto switchAnalyzeRlist.
Nota: En este punto, usaremos los archivos de secuencia de salida para realizar análisis CPAT, Pfam y SignalP nosotros mismos y luego procederemos al análisis de corte variable después de obtener los resultados de estos análisis. Por supuesto, tampoco puedes hacer ninguno de estos análisis, o solo hacer algunos. Hice CPAT y Pfam aquí, no análisis SignalP.
Realizar análisis de corte alternativo.
Aquí, seleccione las consecuencias para analizar en función de los datos de anotación integrados. Puedo integrar los resultados de CPAT aquí y agregar el análisis coding_potential. El análisis Signal_peptide_identified no se puede realizar sin integrar los resultados de SignalP.
Genere un gráfico de resultados de recorte variable, donde n es un número Inf que representa todos los resultados que se generarán.
Después de que se generen todos los eventos de recorte de variables, puede ver los genes/eventos de interés. A continuación se muestran algunas imágenes de mis resultados esta vez. En la figura, puede ver la estructura de cada isoforma, el uso de muestras y si existen diferencias significativas entre los grupos.
Las siguientes funciones pueden ver el análisis de corte variable de la población del genoma.
Ejemplo de gráfico resumen de SplicingSummary:
El segundo gráfico muestra los resultados de la función prop.test. Indica si ha habido un cambio significativo en la relación ganancias/pérdidas. 0,5 significa que la escala no ha cambiado.
Significado de la abreviatura:
[Referencia]
IsoformSwitchAnalyzeR.utf8