La Red de Conocimientos Pedagógicos - Currículum vitae - Denominación de variantes según las reglas de HGVS (2) | "Desentrañando los capullos" de diferentes tipos de mutaciones a nivel de ADN

Denominación de variantes según las reglas de HGVS (2) | "Desentrañando los capullos" de diferentes tipos de mutaciones a nivel de ADN

Este artículo se publicó por primera vez en la cuenta pública de WeChat "Gene Tribe". Bienvenido a seguirlo y obtener más información útil.

Para diferentes tipos de mutaciones, HGVS ha formulado reglas de descripción de mutaciones correspondientes. Este artículo presenta el formato de denominación para diferentes tipos de mutaciones a nivel del ADN.

Sustitución

Sustitución

Definición de HGVS:

un cambio de secuencia donde, en comparación con una secuencia de referencia, un nucleótido se reemplaza por uno otro nucleótido.

Formato de descripción:

"prefijo" "posición_sustituida" "referencia_nucleótido"">"nuevo_nucleótido"

?Por ejemplo: g.123A>G

“prefijo” = secuencia de referencia = g.

“position_substituted” = posición de la base sustituida = 123

“reference_nucleótido” = base sustituida = A

”>” = Reemplazo =

“new_nucleótido” = Nueva base después del reemplazo = G

Algunos puntos a tener en cuenta:

1. predix : La secuencia de referencia puede ser g. (genoma), m. (mitocondrias), c. (ADN codificante), n. (ADN no codificante)

2. Número de bases: no están limitadas. a sustituciones entre bases únicas. Pueden ser bases múltiples y pueden describirse como delins. Cuando hay múltiples bases involucradas en una mutación, si hay dos mutaciones, la mutación se describirá por separado sin fusionarse con delins. las bases variantes afectan a un aminoácido, la descripción debe combinarse, como el polimorfismo c.142_144delinsTGG (p.Arg48Trp). El sitio polimórfico no se puede describir como: c.76A/G. en el pasado, la vista actual es describir los cambios base de manera objetiva y neutral, sin ninguna predicción o información de función conocida.

Por ejemplo:

NC_000023.10:g.33038255 C. >A

La C en la posición 33038255 se reemplaza por A

NG_012232.1(NM_004006.1):c.93+1G>T

La G en la posición c.93+1 de la secuencia de ADN codificante se reemplaza por T. (Introducido en el artículo anterior. La descripción de la posición del ADN codificante no se repetirá aquí)

LRG_199t1: c. 79_80delinsTTor c.[79G>T;80C>T]

En general, se recomienda utilizar la forma c 79_80delinsTT, cuando una de las dos mutaciones c.79G>T y c.80C>T es. una mutación conocida de alta frecuencia, se recomienda utilizar c.[79G>T;80C>T].

Nota: Según la definición de sustitución de bases, una base se reemplaza por otra base. Por lo tanto, la siguiente descripción es incorrecta: c.79_80GC>TT o c.79GC>TT.

NM_004006.1:c.[145C>T;147C>G]

Lo anterior también se puede describir como NM_004006.1:c.145_147delinsTGG, a menos que c.145C>T y c Cuando una de .147C>G es una mutación conocida de alta frecuencia, se debe utilizar c.[145C>T;147C>G].

LRG_199t1:c.54G>H

La base G en la posición c.54 se reemplaza por A, C o T.

Interludio: ¿Conoces los símbolos de la siguiente tabla?

NM_004006.1:c.123=

No hay cambio de aminoácidos en la posición c.123.

LRG_199t1:c.85=/T>C

En la posición c.85 se encontró una base T que es consistente con la secuencia de referencia y una base sustituida por C También se encontró la condición.

Nota: Independientemente de la proporción de las dos situaciones anteriores, las bases que son consistentes con la secuencia de referencia deben enumerarse primero.

NM_004006.1:c.85=//T>C

La situación de quimera incluye células c.85= y células c.85T>C.

Nota: Independientemente de la proporción de las dos situaciones anteriores, las bases que son consistentes con la secuencia de referencia deben enumerarse primero.

Eliminación

Eliminación

Definición de HGVS:

un cambio de secuencia en el que, en comparación con una secuencia de referencia, uno o más nucleótidos no están presente (eliminado).

Formato de descripción:

prefijo” “position(s)_deleted” “del”

Como g.123_127del

“prefijo” ?= secuencia de referencia = g.

“position(s)_deleted” =?

La posición de la base faltante o la posición inicial de la base faltante = 123_127

“del” =?

Falta = del

Algunos puntos a tener en cuenta:

1. “posición(es) _deleted” significa posiciones diferentes, como g. 123_126 en lugar de 123_123.

2. La descripción de la posición "position(s)_deleted" debe realizarse desde el extremo 5' hasta el extremo 3'. : secuencia del genoma circular, como o. y m., cuando la base eliminada se ubica en las posiciones final e inicial de la secuencia de referencia, se puede describir de 3' a 5'

3. ?Regla del extremo 3' más cercano: eliminación. Se considera que las bases están más cerca del extremo 3', no del extremo 5'. Por ejemplo, ACTTGTGCC se convierte en ACTTGCC y faltan tres bases. , comenzando desde el extremo 5', ¿aparece la secuencia inconsistente?, ¿o contando desde la secuencia inconsistente en el extremo 3'? Según la regla más cercana al extremo 3', TGT está más cerca del extremo 3' que TTG. la descripción de la variante debe considerarse como TGT faltante (c.5_7del) en lugar de TTG (c .4_6del).

Alternativamente, podemos entender que al comparar la secuencia de referencia y la secuencia mutada, comenzando desde la 5. ' El final de la primera base inconsistente se considera una mutación. La posición inicial de La influencia de sub. Si CAGgtg se convierte en CAgtg, debe describirse como c.3+1delG en lugar de c.3delG.

Por ejemplo:

NG_012232.1:g.19_21del

¿La secuencia original? AGAA TCA CA?, también se puede utilizar la secuencia eliminada AGAA ___ CA. Enumere las bases que faltan, como NG_012232.1:g.19_21delTCA.

NG_012232.1(NM_004006.1):c.183_186+48del

La eliminación abarca los límites de exones e intrones.

NG_012232.1(NM_004006.1):c.4072-1234_5155-246del

Esta situación es una eliminación de exón que abarca un intrón, es decir, exón30 (c.4072 Inicio) al exón36 (hasta c.5154). En este caso, dado que el número de bases faltantes es grande, no se deben enumerar las bases faltantes.

NG_012232.1(NM_004006.1):c.(4071+1_4072-1)_(5154+1_5155-1)del

El punto de interrupción que falta aún no se puede determinar.

NG_012232.1(NM_004006.1):c.(?_-245)_(31+1_32-1)del

El sitio de inicio eliminado se encuentra en algún lugar aguas arriba del sitio del gen, el sitio identificado más cercano es c.-244.

Duplicación

Duplicación

Definición de HGVS:

un cambio de secuencia donde, en comparación con una secuencia de referencia, una copia de una o más ¿Se insertan nucleótidos directamente a 3'? de la copia original de esa secuencia.

Formato de descripción:

"prefijo" "posición(s)_duplicada" "dup"

Por ejemplo: g.123_345dup

“prefijo” ?= secuencia de referencia = g.

“posición(s)_duplicada” =?

ocurre Base repetida o posición inicial de base = 123_345

“dup” =?

Repetir = dup

Algunos puntos a tener en cuenta:

1. La descripción de la posición de las bases repetidas también debe seguir la "regla del extremo 3' más cercano".

2. Según la definición de repetición de base, la base repetida se ubica directamente en el extremo 3’ de la base repetida, en lugar de en otro lugar (inserción). Cuando no se sabe si la base repetida está ubicada directamente en el extremo 3' de la base repetida o insertada en otro lugar, no puede describirse como un dup, pero debe describirse como una inserción.

3. Cuando el número de repeticiones es mayor o igual a 2 copias, debe citar los corchetes para enumerar el número de repeticiones. Por ejemplo, [3] significa repetido 3 veces. consulte las reglas de nomenclatura de secuencias repetidas (mendaciones /ADN/variante/repetida/).

? c.20dupT, y se describe incorrectamente como c.19_20insT. La base repetida es una base única, por lo que no se puede describir como un rango.

NM_004006.2:c.20_23dup(NC_000023.10:g.33229407_33229410dup)

Para la repetición de múltiples bases, se debe enumerar la posición inicial de la base repetida, por lo que Debe describirse en forma de rango.

Inserción

Inserción

Definición de HGVS:

un cambio de secuencia donde, en comparación con la secuencia de referencia, se insertan uno o más nucleótidos ? y ?donde la inserción no es una copia de una secuencia inmediatamente 5'

Formato de descripción:

"prefix" "positions_flanking" "ins" "inserted_sequence"

Por ejemplo: g.123_124insAGC

“prefijo” ?= secuencia de referencia = g.

“positions_flanking” =?

El inicio de la base insertada Posición = 123_124

“ins” =?

Insertar = ins

“inserted_sequence” =?

Secuencia de bases insertada = AGC

Algunos puntos a tener en cuenta:

1. La posición inicial de la base insertada significa que otras secuencias se insertan entre las dos bases, por lo tanto, 123_124 significa que el AGC se inserta entre la base 123 y base 124.

2. La posición de inserción descrita debe ser el rango conectado por subrayados, no un solo sitio.

3. La descripción de la posición de la base insertada también debe seguir la "regla del extremo 3' más cercano".

Por ejemplo:

NC_000023.10:g.32867861_32867862insT(NM_004006.2:c.169_170insA)

Entre c.169 y c.170 Base A está insertado.

NM_004006.2:c.(222_226)insG(p.Asn75fs)

Cuando la posición de inserción sea incierta, utilice paréntesis para indicar que la incertidumbre es de c.222 a c La base G se insertó en esa posición entre .226.

NC_000004.11:g.(3076562_3076732)ins(12)

¿Se insertan 12 bases en algún lugar entre g.3076562 y g.3076732?.

NC_000023.10:g.32717298_32717299insNN(NM_004006.2:c.761_762insNN)

Se insertó una base entre c.761 y c.762, pero la inserción no es segura. secuencia de bases.

NM_004006.2:c.761_762insNNNNN(o NM_004006.1:c.761_762ins(5))

Si hay muchas bases insertadas, se pueden representar mediante números entre paréntesis. ?

Secuencias repetidas

Secuencias repetidas

Este tipo es común en mutaciones dinámicas.

Definición de HGVS:

una secuencia en la que, en comparación con una secuencia de referencia, un segmento de uno o más nucleótidos (la unidad repetida) está presente varias veces, una tras otra.

Formato de descripción (unidad de repetición):

" prefijo" "position_first_nucleótido_first_repeat_unit" "repeat_sequence" ["copy_number"]

Por ejemplo: g.123CAG[16 ]

“prefijo” ?=secuencia de referencia=?g.

“position_first_nucleótido_first_repeat_unit” ?= primera posición base de la unidad de repetición= 123

“repeat_sequence” ?= repetir unidad=CAG

[ ?=repetir número entre corchetes= [

“número_copia” ?=número de unidades repetidas= 16

] ?= Usar corchetes para el número de repeticiones = ]

Por ejemplo:

NC_000014.8:g.101179660TG[14]

TG de doble base se repite 14 veces

NC_000014.8:g.101179660TG[14];[18]

TG de doble base, repetido 14 veces en un alelo y 18 veces en el otro alelo.

NM_002024.5:c.-128_-69GGC[10]GGA[1]GGC[9]GGA[1]GGC[10]

En c.-128 a c Dentro del rango de .-69, GGC se repite 10 veces, GGA se repite una vez, GGC se repite 9 veces, GGA se repite una vez y GGC se repite 10 veces.

Lo anterior enumera los nombres de mutaciones a nivel de ADN más utilizados, y hay algunos otros tipos que no figuran en la lista, como inversión, conversión, translocación, etc.

Avance del próximo número: Denominación de mutaciones a nivel de aminoácidos, así que estad atentos.

Referencia:

mendations/DNA/variant/substitution/#polymorphism

http://varnomen.hgvs.org/bg-material/standards/