Gene órfão - Orphan gene

Genes órfãos (também chamados de ORF ans , especialmente na literatura microbiana) são genes sem homólogos detectáveis em outras linhagens. Órfãos são um subconjunto de genes restritos taxonomicamente (TRGs), que são únicos a um nível taxonômico específico (por exemplo, específico de planta). Em contraste com os TRGs não órfãos, os órfãos são geralmente considerados únicos para um táxon muito estreito, geralmente uma espécie.

O modelo clássico de evolução é baseado na duplicação, rearranjo e mutação de genes com a ideia de descendência comum. Os genes órfãos diferem por serem específicos de linhagem, sem história conhecida de duplicação compartilhada e rearranjo fora de sua espécie ou clado específico. Os genes órfãos podem surgir por meio de uma variedade de mecanismos, como transferência horizontal de genes , duplicação e divergência rápida e emergência de novo a partir de uma sequência não codificadora . Esses processos podem agir em taxas diferentes em insetos, primatas e plantas. Apesar de sua origem relativamente recente, os genes órfãos podem codificar proteínas funcionalmente importantes.

História de genes órfãos

Os genes órfãos foram descobertos pela primeira vez quando o projeto de sequenciamento do genoma da levedura começou em 1996. Os genes órfãos representavam cerca de 26% do genoma da levedura, mas acreditava-se que esses genes poderiam ser classificados com homólogos quando mais genomas fossem sequenciados. Na época, a duplicação do gene era considerada o único modelo sério de evolução do gene e havia poucos genomas sequenciados para comparação, então a falta de homólogos detectáveis ​​foi considerada provavelmente devido à falta de dados de sequenciamento e não devido a uma falta real de homologia. No entanto, os genes órfãos continuaram a persistir à medida que a quantidade de genomas sequenciados crescia, eventualmente levando à conclusão de que os genes órfãos são onipresentes em todos os genomas. As estimativas da porcentagem de genes órfãos variam enormemente entre as espécies e entre os estudos; 10-30% é um valor comumente citado.

O estudo de genes órfãos surgiu em grande parte após a virada do século. Em 2003, um estudo de Caenorhabditis briggsae e espécies relacionadas comparou mais de 2.000 genes. Eles propuseram que esses genes devem estar evoluindo muito rapidamente para serem detectados e, conseqüentemente, são locais de evolução muito rápida. Em 2005, Wilson examinou 122 espécies bacterianas para tentar examinar se o grande número de genes órfãos em muitas espécies era legítimo. O estudo descobriu que era legítimo e desempenhou um papel na adaptação bacteriana. A definição de genes restritos taxonomicamente foi introduzida na literatura para fazer os genes órfãos parecerem menos "misteriosos".

Em 2008, descobriu-se que uma proteína de levedura de funcionalidade estabelecida, BSC4, evoluiu de novo a partir de sequências não codificantes cuja homologia ainda era detectável em espécies irmãs.

Em 2009, um gene órfão foi descoberto para regular uma rede biológica interna: o gene órfão, QQS, de Arabidopsis thaliana modifica a composição da planta. A proteína órfã QQS interage com um fator de transcrição conservado, esses dados explicam as mudanças de composição (aumento da proteína) que são induzidas quando QQS é projetado em diversas espécies. Em 2011, um estudo abrangente de todo o genoma da extensão e origens evolutivas de genes órfãos em plantas foi conduzido na planta modelo Arabidopsis thaliana "

Como identificar genes órfãos

Os genes podem ser provisoriamente classificados como órfãos se nenhuma proteína ortóloga puder ser encontrada nas espécies próximas.

Um método usado para estimar a similaridade de sequência de nucleotídeos ou proteína indicativa de homologia (ou seja, similaridade devido à origem comum) é a Ferramenta de Pesquisa de Alinhamento Local Básico (BLAST). O BLAST permite que as sequências de consulta sejam pesquisadas rapidamente em grandes bancos de dados de sequência. Simulações sugerem que, sob certas condições, o BLAST é adequado para detectar parentes distantes de um gene. No entanto, genes que são curtos e evoluem rapidamente podem ser facilmente perdidos pelo BLAST.

A detecção sistemática de homologia para anotar genes órfãos é chamada de filoestratigrafia. A filoestratigrafia gera uma árvore filogenética na qual a homologia é calculada entre todos os genes de uma espécie focal e os genes de outras espécies. O primeiro ancestral comum de um gene determina a idade, ou filostrato , do gene. O termo "órfão" às vezes é usado apenas para o filostrato mais jovem contendo apenas uma única espécie, mas quando interpretado amplamente como um gene restrito taxonomicamente, pode se referir a todos, exceto ao filostrato mais antigo, com o gene órfão dentro de um clado maior.

Fontes

Genes órfãos surgem de fontes múltiplas, predominantemente por meio de origem de novo , duplicação e divergência rápida e transferência horizontal de genes.

Gene de novo nascimento

Novos genes órfãos surgem continuamente de novo a partir de sequências não codificantes. Esses novos genes podem ser suficientemente benéficos para serem levados à fixação por seleção. Ou, mais provavelmente, eles desaparecerão no pano de fundo não genético. Esta última opção é apoiada por pesquisas em Drosophila que mostram que os genes jovens são mais propensos a se extinguir.

Antigamente , pensava-se que genes de novo eram quase impossíveis devido às complexidades complexas e potencialmente frágeis de criar e manter polipeptídeos funcionais, mas a pesquisa dos últimos 10 anos encontrou vários exemplos de genes de novo , alguns dos quais estão associados com processos biológicos importantes, particularmente a função dos testículos em animais. Genes de novo também foram encontrados em fungos e plantas.

Para genes jovens órfãos, às vezes é possível encontrar sequências de DNA não codificantes homólogas em táxons irmãos, o que é geralmente aceito como forte evidência de origem de novo . No entanto, a contribuição da origem de novo para genes taxonomicamente restritos de origem mais antiga, particularmente em relação à teoria da duplicação de genes tradicional da evolução do gene, permanece contestada.

Duplicação e divergência

O modelo de duplicação e divergência para genes órfãos envolve um novo gene sendo criado a partir de algum evento de duplicação ou divergência e passando por um período de rápida evolução em que toda semelhança detectável com o gene originalmente duplicado é perdida. Embora esta explicação seja consistente com os entendimentos atuais dos mecanismos de duplicação, o número de mutações necessárias para perder a similaridade detectável é grande o suficiente para ser um evento raro, e o mecanismo evolutivo pelo qual uma duplicata de gene poderia ser sequestrada e divergir tão rapidamente permanece obscuro.

Transferência horizontal de genes

Outra explicação para o surgimento de genes órfãos é por meio de um mecanismo de duplicação denominado transferência horizontal de genes , em que o gene duplicado original deriva de uma linhagem separada e desconhecida. Essa explicação para a origem dos genes órfãos é especialmente relevante em bactérias e arqueas, onde a transferência horizontal de genes é comum.

Características da proteína

Genes órfãos tendem a ser muito curtos (~ 6 vezes mais curtos do que genes maduros), e alguns são fracamente expressos, específicos para tecidos e mais simples no uso de códons e composição de aminoácidos. Genes órfãos tendem a codificar proteínas mais intrinsecamente desordenadas , embora alguma estrutura tenha sido encontrada em um dos genes órfãos mais bem caracterizados. Das dezenas de milhares de enzimas do metabolismo primário ou especializado que foram caracterizadas até agora, nenhuma é órfã, ou mesmo de linhagem restrita; aparentemente, a catálise requer centenas de milhões de anos de evolução.

Funções biológicas

Embora a prevalência de genes órfãos tenha sido estabelecida, o papel evolutivo dos órfãos e sua importância resultante ainda estão sendo debatidos. Uma teoria é que muitos órfãos não têm papel evolutivo; os genomas contêm estruturas de leitura aberta não funcionais (ORFs) que criam produtos polipeptídicos espúrios não mantidos por seleção, o que significa que é improvável que sejam conservados entre as espécies e provavelmente seriam detectados como genes órfãos. No entanto, uma variedade de outros estudos mostraram que pelo menos alguns órfãos são funcionalmente importantes e podem ajudar a explicar o surgimento de novos fenótipos.

Referências