Tweets de formación interna
Pero después de leer este tweet, quizás conozcas parte de él.
TBtools ha estado abierto al público durante más de dos años. De vez en cuando, personas conocidas y desconocidas me hablan sobre TBtools. TBtools puede ser diferente en la percepción de cada uno.
Algunas personas piensan que TBtools simplemente está retrasando lo que llaman investigación bioinformática.
Algunas personas dicen que TBtools garantizó su graduación.
Algunas personas también dijeron que TBtools publicó un artículo para él.
O TBtools. .
Empecé a escribir TBtools hace tres años. La función es muy simple, principalmente para extracción de secuencias, y también para BlastWrapper (que no era robusto en ese momento). El propósito es puro. Las personas del equipo de investigación no me pedirán que extraiga secuencias, pero también pueden ir directamente al transcriptoma para buscar secuencias. Los amigos que entraron en contacto con TBtools en ese momento probablemente así lo pensaron.
Por supuesto, posteriormente realicé varias mejoras en este aspecto para garantizar su solidez actual. Ventana de entrada, que admite diferentes entradas, ya sea extrayendo la longitud completa de la secuencia o extrayendo fragmentos de secuencia, no solo admite la extracción de ID, sino que también admite la coincidencia de subcadenas de ID; ...
Además, se ha agregado una función de extracción de secuencias basada en gff3, como extraer CDS de longitud completa y exones de longitud completa de todas las secuencias, e incluso se pueden extraer todas las secuencias promotoras de una especie. extraído en lotes a la vez.
Además de Blast Wrapper, es posible que también deba llamar a un programa externo, por lo que es muscular (principalmente porque el algoritmo NW que implementé no es eficiente, lo cual no se mencionará cuando se use para múltiples alineación de secuencia).
Esto lo puedes ver desde el submenú.
Relativamente rica en funciones, que incluyen
Ya sea que se comparen directamente dos secuencias, dos archivos de secuencia o dos intervalos específicos de dos genomas, la GUI se proporciona en Blast y TBtools. Y los cuatro métodos de visualización tienden a satisfacer las necesidades de la mayoría de las personas.
Por ejemplo
Más tarde porque Blast2GO era demasiado lento. Según la lógica de IDmapping, generalmente escribí una función anotada GO. Por supuesto, puede ser más importante escribir funciones directamente para el análisis de enriquecimiento GO y KEGG. Más tarde, muchos amigos que no son organismos modelo pensaron que TBtools realmente hacía esto. También incluye algunas visualizaciones, como la visualización del segundo nivel de Go. Posteriormente también escribí algunas visualizaciones de los resultados condensados.
Poco a poco, descubrí que las herramientas basadas en web, como Venny, obviamente tienen funciones de diagrama de Venn muy pequeñas y la red es demasiado pobre. Esperar a que se almacene en búfer siempre me ocupa demasiado tiempo. Debe estar localizado. Así que simplemente escribí una herramienta de diagrama de Venn que admite hasta seis grupos. Por supuesto, también hay herramientas de trama impopulares en la etapa posterior.
Herramientas como MapChart muestran genes en los cromosomas.
Además, algunas herramientas, como el dibujo de mapas de calor, son realmente incómodas de usar. O hay muy pocos parámetros o varios detalles son difíciles de ajustar. Entonces también escribí una herramienta de mapa de calor.
Por lo tanto, algunos amigos realmente pueden pensar que su herramienta es solo un kit de herramientas de dibujo.
Diagrama de Venn y diagrama de perturbación
Por supuesto, también puedes dibujar SeqLogo directamente.
Según mis tweets anteriores, en general, con TBtools, puede completar el análisis de familias de genes comunes sin ninguna línea de comando ni operaciones de Linux o máquinas virtuales.
Las herramientas que generalmente se incluyen son:
Parece que algunas instituciones de capacitación brindan capacitación en análisis de familias genéticas en línea y fuera de línea, y todo tipo de máquinas virtuales, Linux, comandos y scripts que necesitan disponibles. Es posible que los proyectos comunes de análisis de familias de genes solo requieran TBtools.
Con este fin, unos amigos empezaron a definir TBtools: TBtools es un conjunto de herramientas de análisis de familias de genes. En mi opinión, estos amigos en realidad tienen un gran malentendido sobre TBtools.
Nunca pensé en escribir una herramienta para el análisis de familias genéticas. No es porque TBtools sea una herramienta para el análisis de familias de genes, sino porque el análisis de familias de genes en sí es la habilidad básica del análisis de datos biológicos que todos necesitan y comprenden. Simplemente simplifiqué la implementación de estas habilidades.
De la siguiente manera, en TBtools que escribí, es posible que muchas personas no piensen en las funciones.
TBtools no es tanto una herramienta de análisis de familias de genes como crees, sino una herramienta de análisis comparativo de genomas, por lo que parece más avanzada.
En el último medio mes, bajo la coordinación del grupo de investigación, participé en algunos trabajos relacionados con el análisis del genoma;
El análisis del genoma en sí es en realidad una actividad intelectual y física. Durante el proceso de análisis, también descubrimos algunos métodos de análisis que pueden permitir que todos obtengan información biológica.
Así que pasé dos noches escribiendo varias herramientas.
Junto con algunas herramientas que existían anteriormente en TBtools, creo que será útil para los amigos que realizan análisis del genoma.
Sin embargo, tenga en cuenta que no puedo garantizar el uso de estas herramientas a menos que patrocine las actividades de extensión al aire libre de nuestro grupo de investigación o las unidades asociadas.
MCScanX es una herramienta comúnmente utilizada para el análisis comparativo del genoma. Lo he empaquetado en TBtools para que incluso los usuarios de Windows puedan analizarlo fácilmente. Además, los usuarios no necesitan asegurarse de que los nombres del archivo gff y del archivo blast sean los mismos.
Para obtener información detallada sobre esta herramienta, consulte los tweets anteriores de la cuenta oficial de WeChat.
El cálculo de Ka/Ks es a menudo cuestionado. De hecho, es muy fácil implementar el algoritmo NG simplemente calculándolo. Actualmente, KaksCalculator2 y PAML se utilizan ampliamente. Ambos programas son excelentes. En TBtools, finalmente abrí la lógica de cálculo de NG implementada el año pasado o el año anterior y creé una GUI muy conveniente. Los usuarios pueden calcular información directamente utilizando casi únicamente secuencias CDS y pares de genes, sin perder tiempo en arreglos de formatos de archivos.
Las herramientas se optimizan y desarrollan constantemente.
Se seguirá superando el umbral de análisis.
Quizás darle a todos la capacidad de hacer algún análisis también sea una forma de promover el desarrollo de algunas cosas.
Bienvenidos amigos que aún no se han unido al grupo TBtools QQ. ¡participar!
Cada verano, el grupo de investigación ofrece formación introductoria interna para los estudiantes, principalmente para los nuevos estudiantes en el laboratorio (así como para los miembros que se dedican principalmente a experimentos húmedos). Sigo teniendo la idea de que a otros grupos de investigación les gustaría saber sobre el análisis de datos de las cartas de los estudiantes de nuestro grupo de investigación. Por ello, tras la propuesta del director de doctorado y la discusión del grupo de investigación, tenemos previsto añadir 10 plazas de formación básica para estudiantes este verano (julio-agosto) (anteriormente solo se formaba dentro del grupo de investigación y no estaba abierta al público). Ver/