Domínio de ligação a DNA - DNA-binding domain

Um domínio de ligação de DNA ( DBD ) é um domínio de proteína dobrado independentemente que contém pelo menos um motivo estrutural que reconhece DNA de fita simples ou dupla . Um DBD pode reconhecer uma sequência de DNA específica (uma sequência de reconhecimento ) ou ter uma afinidade geral com o DNA. Alguns domínios de ligação de DNA também podem incluir ácidos nucleicos em sua estrutura dobrada.

Função

Exemplo de um domínio de ligação ao DNA no contexto de uma proteína. O domínio de ligação ao DNA do terminal N (marcado) do repressor Lac é regulado por um domínio regulador do terminal C (marcado). O domínio regulatório se liga a uma molécula efetora alostérica (verde). A resposta alostérica da proteína é comunicada do domínio regulatório para o domínio de ligação ao DNA por meio da região de ligação.

Um ou mais domínios de ligação de DNA são frequentemente parte de uma proteína maior que consiste em outros domínios de proteína com funções diferentes. Os domínios extras freqüentemente regulam a atividade do domínio de ligação ao DNA. A função da ligação ao DNA é estrutural ou envolve a regulação da transcrição , com as duas funções às vezes se sobrepondo.

Os domínios de ligação ao DNA com funções que envolvem a estrutura do DNA têm papéis biológicos na replicação , reparo , armazenamento e modificação do DNA , como a metilação .

Muitas proteínas envolvidas na regulação da expressão gênica contêm domínios de ligação ao DNA. Por exemplo, proteínas que regulam a transcrição ligando-se ao DNA são chamadas de fatores de transcrição . O resultado final da maioria das cascatas de sinalização celular é a regulação gênica.

O DBD interage com os nucleotídeos do DNA de uma maneira específica para a sequência de DNA ou não específica para a sequência, mas mesmo o reconhecimento não específico para a sequência envolve algum tipo de complementaridade molecular entre a proteína e o DNA. O reconhecimento do DNA pelo DBD pode ocorrer no sulco maior ou menor do DNA, ou no esqueleto do DNA açúcar-fosfato (veja a estrutura do DNA ). Cada tipo específico de reconhecimento de DNA é feito sob medida para a função da proteína. Por exemplo, a enzima de corte de DNA DNAse I corta o DNA quase ao acaso e, portanto, deve se ligar ao DNA de uma maneira não específica para a sequência. Mas, mesmo assim, ADNase I reconhece um determinado ADN 3-D estrutura , dando origem a um padrão de clivagem de ADN pouco específico que pode ser útil para estudar o reconhecimento de ADN através de uma técnica chamada de pegada de ADN .

Muitos domínios de ligação ao DNA devem reconhecer sequências de DNA específicas, como DBDs de fatores de transcrição que ativam genes específicos ou de enzimas que modificam o DNA em locais específicos, como enzimas de restrição e telomerase . O padrão de ligação de hidrogênio no sulco principal do DNA é menos degenerado do que o do sulco menor do DNA, fornecendo um local mais atraente para o reconhecimento de DNA específico para a sequência .

A especificidade das proteínas de ligação ao DNA pode ser estudada usando muitas técnicas bioquímicas e biofísicas, como eletroforese em gel , ultracentrifugação analítica , calorimetria , mutação do DNA , mutação ou modificação da estrutura da proteína , ressonância magnética nuclear , cristalografia de raios-x , ressonância plasmônica de superfície , elétron ressonância paramagnética , reticulação e termoforese em microescala (MST).

Proteína de ligação ao DNA em genomas

Uma grande fração de genes em cada genoma codifica proteínas de ligação ao DNA (ver Tabela). No entanto, apenas um pequeno número de famílias de proteínas se ligam ao DNA. Por exemplo, mais de 2.000 das ~ 20.000 proteínas humanas são "ligadas ao DNA", incluindo cerca de 750 proteínas dedo de zinco.

Espécies Proteínas de ligação a DNA Famílias de ligação a DNA
Arabidopsis thaliana (agrião thale) 4471 300
Saccharomyces cerevisiae (levedura) 720 243
Caenorhabditis elegans (verme) 2028 271
Drosophila melanogaster (mosca da fruta) 2620 283

Tipos

Hélice-volta-hélice

Descoberto originalmente em bactérias, o motivo hélice-volta-hélice é comumente encontrado em proteínas repressoras e tem cerca de 20 aminoácidos de comprimento. Nos eucariotos, o homeodomínio compreende 2 hélices, uma das quais reconhece o DNA (também conhecida como hélice de reconhecimento). São comuns em proteínas que regulam os processos de desenvolvimento ( PRÓSITE HTH ).

Dedo de zinco

Estrutura cristalográfica ( PDB : 1R4O ) de um dímero do dedo de zinco contendo DBD do receptor de glicocorticóide (parte superior) ligado ao DNA (parte inferior). Os átomos de zinco são representados por esferas cinza e as cadeias laterais de cisteína coordenadas são representadas como bastões.

O domínio dedo de zinco é encontrado principalmente em eucariotos, mas alguns exemplos foram encontrados em bactérias. O domínio dedo de zinco tem geralmente entre 23 e 28 aminoácidos de comprimento e é estabilizado pela coordenação de íons de zinco com resíduos de coordenação de zinco regularmente espaçados (histidinas ou cisteínas). A classe mais comum de dedo de zinco (Cys2His2) coordena um único íon zinco e consiste em uma hélice de reconhecimento e uma folha beta de 2 fitas. Em fatores de transcrição, esses domínios são frequentemente encontrados em matrizes (geralmente separados por sequências ligantes curtas) e dedos adjacentes são espaçados em intervalos de 3 pares de bases quando ligados ao DNA.

Zíper leucina

O domínio zíper de leucina básico ( bZIP ) é encontrado principalmente em eucariotos e, até certo ponto, em bactérias. O domínio bZIP contém uma hélice alfa com uma leucina a cada 7 aminoácidos. Se duas dessas hélices se encontrarem, as leucinas podem interagir como os dentes em um zíper, permitindo a dimerização de duas proteínas. Quando se ligam ao DNA, os resíduos de aminoácidos básicos se ligam à estrutura do açúcar-fosfato, enquanto as hélices ficam nas ranhuras principais. Ele regula a expressão do gene.

Hélice alada

Consistindo em cerca de 110 aminoácidos, o domínio da hélice alada (WH) tem quatro hélices e uma folha beta de duas fitas.

Hélice-volta-hélice alada

O domínio da hélice-volta-hélice alada (wHTH) SCOP 46785 tem tipicamente 85-90 aminoácidos de comprimento. É formado por um feixe de 3 hélices e uma folha beta de 4 fitas (asa).

Helix-loop-helix

O domínio básico da hélice-alça-hélice (bHLH) é encontrado em alguns fatores de transcrição e é caracterizado por duas hélices alfa (α-hélices) conectadas por uma alça. Uma hélice é normalmente menor e, devido à flexibilidade da alça, permite a dimerização dobrando e empacotando contra outra hélice. A hélice maior normalmente contém as regiões de ligação ao DNA.

HMG-box

Os domínios HMG-box são encontrados em proteínas de grupo de alta mobilidade que estão envolvidas em uma variedade de processos dependentes de DNA, como replicação e transcrição. Eles também alteram a flexibilidade do DNA induzindo curvas. O domínio consiste em três hélices alfa separadas por loops.

Domínio Wor3

Os domínios Wor3, nomeados em homenagem ao regulador branco-opaco 3 (Wor3) em Candida albicans surgiram mais recentemente no tempo evolutivo do que a maioria dos domínios de ligação de DNA descritos anteriormente e são restritos a um pequeno número de fungos.

Domínio de dobra OB

A dobra OB é um pequeno motivo estrutural originalmente denominado por suas propriedades de b indução o ligonucleotídeo / o ligossacarídeo . Os domínios de dobra OB variam entre 70 e 150 aminoácidos de comprimento. As dobras OB ligam-se ao DNA de fita simples e, portanto, são proteínas de ligação de fita simples .

Proteínas OB-dobragem foram identificadas como críticas para a replicação de ADN , a recombinação de ADN , reparação de ADN , transcrição , tradução , resposta ao choque a frio , e dos telómeros manutenção.

Incomum

Dobra de imunoglobulina

O domínio de imunoglobulina ( InterProIPR013783 ) consiste em uma estrutura de folha beta com grandes laços de conexão, que servem para reconhecer sulcos principais de DNA ou antígenos. Geralmente encontrados em proteínas de imunoglobulina, eles também estão presentes em proteínas Stat da via das citocinas. Isso provavelmente ocorre porque a via das citocinas evoluiu relativamente recentemente e fez uso de sistemas que já eram funcionais, em vez de criar os seus próprios.

Domínio B3

O B3 DBD ( InterProIPR003340 , SCOP 117343 ) é encontrado exclusivamente em fatores de transcrição de plantas superiores e endonucleases de restrição EcoRII e BfiI e normalmente consiste em 100-120 resíduos. Inclui sete folhas beta e duas hélices alfa , que formam uma dobra protéica do pseudobarrel de ligação ao DNA .

Efetora TAL

Os efetores TAL são encontrados em patógenos de plantas bacterianas do gênero Xanthomonas e estão envolvidos na regulação dos genes da planta hospedeira a fim de facilitar a virulência, proliferação e disseminação bacteriana. Eles contêm uma região central de repetições de 33-35 resíduos em tandem e cada região de repetição codifica uma única base de DNA no local de ligação do TALE. Dentro da repetição, é o resíduo 13 sozinho que entra em contato direto com a base do DNA, determinando a especificidade da sequência, enquanto outras posições fazem contato com o esqueleto do DNA, estabilizando a interação de ligação ao DNA. Cada repetição dentro da matriz assume a forma de hélices alfa emparelhadas, enquanto a matriz de repetição inteira forma uma superhélice destra, envolvendo a hélice dupla de DNA. Foi demonstrado que as matrizes de repetição efetoras de TAL se contraem após a ligação ao DNA e um mecanismo de busca de dois estados foi proposto, por meio do qual o TALE alongado começa a se contrair em torno do DNA, começando com um reconhecimento de timina bem-sucedido de uma unidade de repetição única N-terminal do TAL central -efector de repetição array. Proteínas relacionadas são encontradas no patógeno vegetal bacteriano Ralstonia solanacearum , no endossimbionte fúngico Burkholderia rhizoxinica e em dois microrganismos marinhos ainda não identificados. O código de ligação ao DNA e a estrutura do array de repetição são conservados entre esses grupos, chamados coletivamente de TALE-like .

Guiado por RNA

O sistema CRISPR / Cas de Streptococcus pyogenes pode ser programado para direcionar a ativação e repressão para promotores eucarióticos naturais e artificiais por meio da engenharia simples de RNAs guia com complementaridade de pareamento de base para sítios de DNA alvo. Cas9 pode ser usado como uma plataforma de ligação de DNA guiada por RNA personalizável. Domínio Cas9 pode ser funcionalizado com domínios regulatórios de interesse (por exemplo, ativação, repressão ou efetor epigenético) ou com domínio de endonuclease como uma ferramenta versátil para biologia de engenharia de genoma. e, em seguida, ser direcionado para vários locais usando diferentes RNAs-guia.

Veja também

Referências

links externos