Conjunto de genes metabólicos - Metabolic gene cluster

Aglomerados de genes metabólicos ou aglomerados de genes biossintéticos são conjuntos estreitamente ligados de genes principalmente não homólogos que participam de uma via metabólica comum e discreta. Os genes estão na vizinhança física uns dos outros no genoma e sua expressão costuma ser co-regulada. Aglomerados de genes metabólicos são características comuns dos genomas bacterianos e da maioria dos fungos , e são menos freqüentemente encontrados em outros organismos. Eles são mais amplamente conhecidos por produzirem metabólitos secundários , que são a fonte ou base da maioria dos compostos farmacêuticos , toxinas naturais e comunicação química e guerra química entre organismos. Aglomerados de genes metabólicos também estão envolvidos na aquisição de nutrientes, degradação de toxinas, resistência antimicrobiana e biossíntese de vitaminas. Dadas todas essas propriedades dos aglomerados de genes metabólicos, eles desempenham um papel fundamental na formação de ecossistemas microbianos, incluindo interações microbioma- hospedeiro. Assim, várias ferramentas de genômica computacional foram desenvolvidas para prever agrupamentos de genes metabólicos.

Bancos de dados

MIBiG, BiG-FAM

Ferramentas bioinformáticas

Ferramentas baseadas em regras

Ferramentas de bioinformática foram desenvolvidas para prever e determinar a abundância e expressão desse tipo de agrupamento de genes em amostras de microbioma, a partir de dados metagenômicos. Uma vez que o tamanho dos dados metagenômicos é considerável, a filtragem e a clusterização dos mesmos são partes importantes dessas ferramentas. Esses processos podem consistir em técnicas de redução de dimensionalidade, como Minhash , e algoritmos de clusterização, como k-medoides e propagação de afinidade . Além disso, várias métricas e semelhanças foram desenvolvidas para compará-los.

A mineração de genomas para agrupamentos de genes biossintéticos (BGCs) tornou-se parte integrante da descoberta de produtos naturais. Os> 200.000 genomas microbianos agora disponíveis publicamente contêm informações sobre uma abundante nova química. Uma forma de navegar nessa vasta diversidade genômica é por meio da análise comparativa de BGCs homólogos, que permite a identificação de padrões de espécies cruzadas que podem ser combinados com a presença de metabólitos ou atividades biológicas. No entanto, as ferramentas atuais são prejudicadas por um gargalo causado pela abordagem cara baseada em rede usada para agrupar esses BGCs em famílias de agrupamento de genes (GCFs). BiG-SLiCE (Biosynthetic Genes Super-Linear Clustering Engine), uma ferramenta projetada para agrupar um grande número de BGCs. Ao representá-los no espaço euclidiano, BiG-SLiCE pode agrupar BGCs em GCFs de uma forma quase linear não emparelhada.

Satria et. al, 2021 em BiG-SLiCE demonstram a utilidade de tais análises, reconstruindo um mapa global da diversidade metabólica secundária em taxonomia para identificar potencial biossintético desconhecido, abre novas possibilidades para acelerar a descoberta de produtos naturais e oferece um primeiro passo para a construção de um sistema global e pesquisável rede interconectada de BGCs. À medida que mais genomas são sequenciados de táxons pouco estudados, mais informações podem ser extraídas para destacar sua química potencialmente nova.

ferramentas baseadas em aprendizado de máquina

Evolução

A origem e a evolução dos agrupamentos de genes metabólicos têm sido debatidos desde a década de 1990. Desde então, foi demonstrado que agrupamentos de genes metabólicos podem surgir em um genoma por rearranjo do genoma, duplicação de genes ou transferência horizontal de genes , e alguns agrupamentos metabólicos evoluíram convergentemente em várias espécies. A transferência horizontal de agrupamento de genes tem sido associada a nichos ecológicos nos quais se pensa que as vias codificadas fornecem um benefício. Argumentou-se que o agrupamento de genes para funções ecológicas resulta de tendências reprodutivas entre os organismos e continua a contribuir para a adaptação acelerada, aumentando o refinamento de funções complexas no pangenome de uma população.

Referências