Epigenoma humano - Human epigenome

O epigenoma humano é o conjunto completo de modificações estruturais da cromatina e modificações químicas das histonas e nucleotídeos (como a metilação da citosina ). Essas modificações afetam a expressão gênica de acordo com o tipo celular e o estado de desenvolvimento. Vários estudos mostram que o epigenoma depende de fatores exógenos.

Modificações químicas

Existem diferentes tipos de modificações químicas e o procedimento experimental ChIP-seq pode ser realizado para estudá-las. Os perfis epigenéticos dos tecidos humanos revelam as seguintes modificações distintas de histonas em diferentes áreas funcionais:

Promotores Ativos Melhoradores ativos Corpos Genéticos Transcritos Regiões Silenciadas
H3K4me3 H3K4me1 H3K36me3 H3K27me3
H3K27ac H3K27ac H3K9me3

Metilação

O DNA interage funcionalmente com uma variedade de marcas epigenéticas, como a metilação da citosina, também conhecida como 5-metilcitosina (5mC). Essa marca epigenética é amplamente conservada e desempenha papéis importantes na regulação da expressão gênica, no silenciamento de elementos transponíveis e sequências repetidas .

Os indivíduos diferem com seu perfil epigenético, por exemplo, a variância na metilação CpG entre os indivíduos é de cerca de 42%. Ao contrário, o perfil epigenético (incluindo o perfil de metilação) de cada indivíduo é constante ao longo de um ano, refletindo a constância de nosso fenótipo e características metabólicas. O perfil de metilação, em particular, é bastante estável em um período de 12 meses e parece mudar mais ao longo das décadas.

Locais de metilação

CoRSIVs são regiões correlacionadas de variação interindividual sistêmica na metilação do DNA. Eles abrangem apenas 0,1% do genoma humano, então são muito raros; eles podem ser inter-correlacionados em longas distâncias genômicas (> 50 kbp). CoRSIVs também estão associados a genes envolvidos em muitos distúrbios humanos, incluindo tumores, distúrbios mentais e doenças cardiovasculares. Foi observado que os locais CpG associados à doença são 37% enriquecidos em CoRSIVs em comparação com as regiões de controle e 53% em CoRSIVs em relação a tDMRs (regiões diferencialmente metiladas específicas de tecido).

A maioria dos CoRSIVs tem apenas 200 - 300 bp de comprimento e inclui 5–10 dinucleotídeos CpG, o maior abrange vários kb e envolve centenas de CpGs. Essas regiões tendem a ocorrer em clusters e as duas áreas genômicas de alta densidade CoRSIV são observadas no locus de histocompatibilidade principal ( MHC ) no cromossomo 6 e na região pericentromérica no braço longo do cromossomo 20.

CoRSIVs são enriquecidos em regiões intergênicas e quiescentes (por exemplo, regiões subteloméricas ) e contêm muitos elementos transponíveis, mas poucas ilhas CpG (CGI) e sítios de ligação de fator de transcrição. CoRSIVs estão sub-representados na proximidade de genes, em regiões heterocromáticas , promotores ativos e potencializadores . Eles também geralmente não estão presentes em regiões genômicas altamente conservadas.

CoRSIVs pode ter uma aplicação útil: medições de metilação de CoRSIV em um tecido podem fornecer algumas informações sobre a regulação epigenética em outros tecidos; na verdade, podemos prever a expressão de genes associados porque as variantes epigenéticas sistêmicas são geralmente consistentes em todos os tecidos e tipos de células.

Fatores que afetam o padrão de metilação

A quantificação da base hereditária subjacente à variação epigenômica da população também é importante para delinear sua arquitetura cis- e trans-regulatória. Em particular, a maioria dos estudos afirma que as diferenças interindividuais na metilação do DNA são determinadas principalmente por polimorfismos de sequência regulatória cis , provavelmente envolvendo mutações em TFBSs (locais de ligação do fator de transcrição) com consequências a jusante no ambiente da cromatina local. A escassez de polimorfismos de ação trans em humanos sugere que tais efeitos são altamente deletérios. De fato, espera-se que os fatores de ação trans sejam causados ​​por mutações nos genes de controle da cromatina ou outros reguladores altamente pleiotrópicos. Se as variantes trans-atuantes existem em populações humanas, provavelmente segregam como alelos raros ou se originam de mutações somáticas e se apresentam com fenótipos clínicos, como é o caso de muitos cânceres.

Correlação entre metilação e expressão gênica

A metilação do DNA (em particular nas regiões CpG) é capaz de afetar a expressão do gene: as regiões hipermetiladas tendem a ser expressas diferencialmente. Na verdade, pessoas com um perfil de metilação semelhante tendem a ter o mesmo transcriptoma . Além disso, uma observação chave da metilação humana é que a maioria das mudanças funcionalmente relevantes na metilação CpG ocorrem em elementos reguladores, como intensificadores.

De qualquer forma, a expressão diferencial diz respeito a apenas um pequeno número de genes metilados: apenas um quinto dos genes com metilação CpG mostra expressão variável de acordo com seu estado de metilação. É importante notar que a metilação não é o único fator que afeta a regulação do gene .

Metilação em embriões

Foi revelado por experimentos de imunocoloração que em embriões humanos pré-implantados existe um processo global de desmetilação do DNA . Após a fertilização , o nível de metilação do DNA diminui drasticamente nos primeiros pronúcleos . Esta é uma consequência da desmetilação ativa do DNA neste estágio. Mas a desmetilação global não é um processo irreversível; na verdade, a metilação de novo que ocorre do estágio inicial ao pronuclear médio e do estágio de 4 células ao estágio de 8 células.

A porcentagem de metilação do DNA é diferente nos oócitos e nos espermatozoides : o oócito maduro tem um nível intermediário de metilação do DNA (72%), ao invés do esperma ter um alto nível de metilação do DNA (86%). A desmetilação no genoma paterno ocorre rapidamente após a fertilização, enquanto o genoma materno é bastante resistente ao processo de desmetilação nesta fase. As diferentes regiões metiladas maternas (DMRs) são mais resistentes à onda de desmetilação pré-implantação.

A metilação de CpG é semelhante no estágio de vesícula germinativa (GV), estágio de metáfase intermediária I (MI) e estágio de metáfase madura II (MII). A metilação não CpG continua a se acumular nesses estágios.

A acessibilidade da cromatina na linha germinativa foi avaliada por diferentes abordagens, como sc ATAC-seq e sciATAC-seq, scCOOL-seq, scNOMe-seq e sc DNase-seq . As regiões proximais e distais específicas do estágio com regiões de cromatina acessíveis foram identificadas. A acessibilidade global à cromatina diminui gradualmente do zigoto para o estágio de 8 células e, em seguida, aumenta. A análise específica do alelo parental mostra que o genoma paterno se torna mais aberto do que o genoma materno do estágio zigoto tardio ao estágio de 4 células, o que pode refletir a descondensação do genoma paterno com substituição de protaminas por histonas .

Metilação específica de alelo dependente de sequência

Os desequilíbrios de metilação do DNA entre cromossomos homólogos mostram um comportamento dependente da sequência. A diferença no estado de metilação das citosinas vizinhas no mesmo cromossomo ocorre devido à diferença na sequência de DNA entre os cromossomos. Sequenciamento de bissulfito de genoma inteiro (WGBS) é usado para explorar metilação específica de alelo dependente de sequência (SD-ASM) em um nível de resolução de cromossomo único e cobertura abrangente de todo o genoma. Os resultados do WGBS testado em 49 metilomas revelaram desequilíbrios de metilação CpG superiores a 30% de diferenças em 5% dos loci.

Nos locais de loci reguladores de genes ligados por fatores de transcrição, foi observada a troca aleatória entre os estados metilado e não metilado do DNA. Isso também é conhecido como comutação estocástica e está relacionado ao buffer seletivo do circuito regulador do gene contra mutações e doenças genéticas. Apenas raras variantes genéticas mostram o tipo estocástico de regulação gênica.

O estudo de Onuchic et al. teve como objetivo construir os mapas dos desequilíbrios alélicos na metilação do DNA, na transcrição do gene e também nas modificações das histonas. 36 tipos de células e tecidos de 13 doadores participantes foram usados ​​para examinar 71 epigenomas. Os resultados do WGBS testado em 49 metilomas revelaram desequilíbrios de metilação CpG superiores a 30% de diferenças em 5% dos loci. A troca estocástica ocorreu em milhares de loci reguladores heterozigotos que estavam ligados a fatores de transcrição. O estado de metilação intermediário é referido às frequências relativas entre epialelos metilados e não metilados. As variações da frequência da epialele estão correlacionadas com a afinidade do alelo por fatores de transcrição.

A análise do estudo sugere que o epigenoma humano em média cobre aproximadamente 200 variantes SD-ASM adversas. A sensibilidade dos genes com padrões de expressão específicos do tecido dá a oportunidade para a inovação evolutiva na regulação do gene.

A estratégia de reconstrução do haplótipo é usada para rastrear modificações químicas da cromatina (usando ChIP-seq) em uma variedade de tecidos humanos. Mapas epigenômicos resolvidos por haplótipo podem rastrear vieses alélicos na configuração da cromatina. Uma variação substancial entre os diferentes tecidos e indivíduos é observada. Isso permite uma compreensão mais profunda das relações cis-regulatórias entre genes e sequências de controle.

Modificações estruturais

Durante os últimos anos, vários métodos foram desenvolvidos para estudar as modificações estruturais e, consequentemente, as funcionais da cromatina. O primeiro projeto que utilizou perfis epigenômicos para identificar elementos regulatórios no genoma humano foi a ENCODE (Enciclopédia de Elementos de DNA), que se concentrou em criar perfis de modificações de histonas em linhas celulares. Alguns anos mais tarde, o ENCODE foi incluído no International Human Epigenome Consortium (IHEC), que visa coordenar estudos internacionais de epigenoma.

As modificações estruturais que esses projetos visam estudar podem ser divididas em cinco grupos principais:

  • Ocupação de nucleossomos para detectar regiões com genes reguladores;
  • Interações e domínios da cromatina;

Domínios associados topológicos (TADs)

Os domínios associados topológicos são um grau de organização estrutural do genoma da célula. Eles são formados por regiões de cromatina, com tamanhos de 100 quilobases até megabases, que se auto-interagem altamente. Os domínios são ligados por outras regiões genômicas, que, com base em seu tamanho, são chamadas de “regiões de contorno topológicas” ou “cromatina desorganizada”. Essas regiões limítrofes separam os domínios topológicos da heterocromatina e evitam a amplificação desta. Domínios topológicos são difundidos em mamíferos, embora partições de genoma semelhantes tenham sido identificadas também em Drosophila .

Domínios topológicos em humanos, como em outros mamíferos, têm muitas funções relacionadas à expressão gênica e ao processo de controle da transcrição . Dentro desses domínios, a cromatina mostra-se bem emaranhada, enquanto nas regiões limítrofes as interações da cromatina estão bem menos presentes. Essas áreas de fronteira em particular apresentam algumas peculiaridades que determinam as funções de todos os domínios topológicos.

Em primeiro lugar, eles contêm regiões isolantes e elementos de barreira, os quais funcionam como inibidores da transcrição posterior da enzima RNA polimerase . Tais elementos são caracterizados pela presença maciça de proteínas de ligação a isoladores CTCF .

Em segundo lugar, as regiões limítrofes bloqueiam a propagação da heterocromatina, evitando assim a perda de informações genéticas úteis. Esta informação deriva da observação de que as sequências de H3K9me3 da marca heterocromatina interrompem claramente as sequências de fronteira.

Em terceiro lugar, os sítios de início da transcrição (TSS), genes housekeeping e genes tRNA são particularmente abundantes nas regiões limítrofes, denotando que essas áreas têm uma atividade transcricional prolífica, graças às suas características estruturais, diferentes de outras regiões topológicas.

Por fim, nas áreas de fronteira dos domínios topológicos e seus arredores ocorre um enriquecimento dos retrotransposons SINE Alu / B1 e B2 . Nos últimos anos, essas sequências foram encaminhadas para alterar o sítio de ligação do CTCF, interferindo na expressão de algumas áreas genômicas.

Outras provas para um papel na modulação genética e regulação da transcrição referem-se à grande conservação do padrão de fronteira ao longo da evolução dos mamíferos, com uma gama dinâmica de pequenas diversidades dentro de diferentes tipos de células, sugerindo que esses domínios topológicos participam de eventos regulatórios específicos do tipo de célula. .

Correlação entre metilação e estrutura 3D

O projeto Nucleome 4D visa realizar mapas 3D de genomas de mamíferos para desenvolver modelos preditivos para correlacionar modificações epigenômicas com variação genética. Em particular, o objectivo é o de ligar as modificações genéticas e epigenômicos com os intensificadores e promotores que eles interagem com no espaço tridimensional, descobrindo assim definir-gene interactoma e vias como novos candidatos para análise funcional e direccionamento terapêutico.

Hi-C é um método experimental usado para mapear as conexões entre fragmentos de DNA no espaço tridimensional em uma escala de genoma. Esta técnica combina a reticulação química da cromatina com a digestão por enzimas de restrição e o sequenciamento de DNA de última geração.

Este tipo de estudos está atualmente limitado pela falta ou indisponibilidade de dados brutos.

Veja também

Referências