Tubo enrolado soldado de aço inoxidável 304/tubulação zhemical zomponent, potencial biossintético do microbioma marinho global

Obrigado por visitar Nature.com.Você está usando uma versão de navegador com suporte CSS limitado.Para obter a melhor experiência, recomendamos que você use um navegador atualizado (ou desative o Modo de Compatibilidade no Internet Explorer).Além disso, para garantir suporte contínuo, mostramos o site sem estilos e JavaScript.
Sliders mostrando três artigos por slide.Use os botões voltar e avançar para percorrer os slides ou os botões do controlador de slides no final para percorrer cada slide.

Descrição detalhada do produto

Tubo espiral soldado de aço inoxidável 304 /tubulação
1. Especificação: Tubo / tubulação de bobina de aço inoxidável
2. Tipo: soldado ou sem costura
3. Padrão: ASTM A269, ASTM A249
4. Tubo de bobina de aço inoxidável OD: 6 mm a 25,4 mm
5. Comprimento: 600-3500MM ou conforme a necessidade do cliente.
6. Espessura da parede: 0,2 mm a 2,0 mm.

7. Tolerância: diâmetro externo: +/-0,01 mm;Espessura: +/-0,01%.

8. Tamanho do furo interno da bobina: 500MM-1500MM (pode ser ajustado de acordo com as necessidades do cliente)

9. Altura da bobina: 200MM-400MM (pode ser ajustado de acordo com as necessidades do cliente)

10. Superfície: Brilhante ou recozida
11. Material: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, liga 625, 825, 2205, 2507, etc.
12. Embalagem: sacos de tecido em caixa de madeira, palete de madeira, eixo de madeira ou conforme a necessidade do cliente
13. Teste: componente químico, resistência ao escoamento, resistência à tração, medição de dureza
14. Garantia: Inspeção de terceiros (por exemplo: SGS TV), etc.
15. Aplicação: Decoração, móveis, transporte de óleo, trocador de calor, fabricação de grades, fabricação de papel, automóvel, processamento de alimentos, medicina, etc.

Toda a composição química e propriedades físicas do aço inoxidável conforme abaixo:

Material Composição Química ASTM A269 % Máx.
C Mn P S Si Cr Ni Mo Observação Nb Ti
TP304 0,08 2h00 0,045 0,030 1,00 18h00-20h00 8,0-11,0 ^ ^ ^ . ^
TP304L 0,035 2h00 0,045 0,030 1,00 18h00-20h00 8,0-12,0 ^ ^ ^ ^
TP316 0,08 2h00 0,045 0,030 1,00 16,0-18,0 10,0-14,0 2h00-3h00 ^ ^ ^
TP316L 0,035D 2h00 0,045 0,030 1,00 16,0-18,0 10,0-15,0 2h00-3h00 ^ ^ ^
TP321 0,08 2h00 0,045 0,030 1,00 17,0-19,0 9,0-12,0 ^ ^ ^ 5C -0,70
TP347 0,08 2h00 0,045 0,030 1,00 17,0-19,0 9,0-12,0 10C -1,10 ^

 

Material Tratamento térmico Temperatura F (C) Mín. Dureza
Brinell Rockwell
TP304 Solução 1900 (1040) 192HBW/200HV 90 HRB
TP304L Solução 1900 (1040) 192HBW/200HV 90 HRB
TP316 Solução 1900(1040) 192HBW/200HV 90 HRB
TP316L Solução 1900(1040) 192HBW/200HV 90 HRB
TP321 Solução 1900(1040)F 192HBW/200HV 90 HRB
TP347 Solução 1900(1040) 192HBW/200HV 90 HRB

 

diâmetro externo, polegada Polegada de tolerância OD (mm) % de tolerância ao peso Tolerância de comprimento em polegadas (mm)
+ -
≤ 1/2 ±0,005 (0,13) ± 15 1/8 (3,2) 0
> 1/2 ~1 1/2 ±0,005(0,13) ± 10 1/8 (3,2) 0
> 1 1/2 ~< 3 1/2 ±0,010(0,25) ± 10 3/16 (4,8) 0
> 3 1/2 ~< 5 1/2 ±0,015(0,38) ± 10 3/16 (4,8) 0
> 5 1/2 ~< 8 ±0,030(0,76) ± 10 3/16 (4,8) 0
8~< 12 ±0,040(1,01) ± 10 3/16 (4,8) 0
12~< 14 ±0,050(1,26) ± 10 3/16 (4,8) 0

As comunidades microbianas naturais são filogeneticamente e metabolicamente diversas.Além de grupos de organismos pouco estudados1, essa diversidade também possui um rico potencial para a descoberta de enzimas e compostos bioquímicos ecologicamente e biotecnologicamente significativos2,3.No entanto, estudar esta diversidade para determinar as vias genômicas que sintetizam tais compostos e os ligam aos seus respectivos hospedeiros permanece um desafio.O potencial biossintético dos microrganismos no oceano aberto permanece em grande parte desconhecido devido às limitações na análise de dados de resolução do genoma completo em escala global.Aqui, exploramos a diversidade e diversidade de agrupamentos de genes biossintéticos no oceano, integrando cerca de 10.000 genomas microbianos de células cultivadas e células individuais com mais de 25.000 genomas de rascunho recentemente reconstruídos de mais de 1.000 amostras de água do mar.Esses esforços identificaram cerca de 40.000 supostos agrupamentos de genes biossintéticos, em sua maioria novos, alguns dos quais foram encontrados em grupos filogenéticos anteriormente insuspeitados.Nessas populações, identificamos uma linhagem enriquecida em agrupamentos de genes biossintéticos (“Candidatus Eudormicrobiaceae”) que pertencia a um filo bacteriano não cultivado e incluía alguns dos microrganismos mais biossinteticamente diversos neste ambiente.Destes, caracterizamos as vias do peptídeo fosfatase e da pitonamida, identificando casos de estrutura e enzimologia incomuns de compostos bioativos, respectivamente.Em conclusão, este estudo demonstra como estratégias baseadas em microbiomas podem permitir a exploração de enzimas e alimentos naturais anteriormente não descritos em uma microbiota e ambiente pouco compreendidos.
Os micróbios impulsionam os ciclos biogeoquímicos globais, mantêm as cadeias alimentares e mantêm as plantas e os animais saudáveis5.A sua enorme diversidade filogenética, metabólica e funcional representa um rico potencial para a descoberta de novos táxons1, enzimas e compostos bioquímicos, incluindo produtos naturais6.Nas comunidades ecológicas, essas moléculas proporcionam aos microrganismos uma variedade de funções fisiológicas e ecológicas, desde a comunicação até a competição 2, 7 .Além de suas funções originais, esses produtos naturais e suas vias de produção geneticamente codificadas fornecem exemplos de aplicações biotecnológicas e terapêuticas2,3.A identificação de tais vias e conexões foi muito facilitada pelo estudo de micróbios cultivados.No entanto, estudos taxonômicos de ambientes naturais mostraram que a grande maioria dos microrganismos não foi cultivada8.Este preconceito cultural limita a nossa capacidade de explorar a diversidade funcional codificada por muitos micróbios4,9.
Para superar essas limitações, os avanços tecnológicos da última década permitiram aos pesquisadores sequenciar diretamente (ou seja, sem cultura prévia) fragmentos de DNA microbiano de comunidades inteiras (metagenômica) ou de células individuais.A capacidade de montar esses fragmentos em fragmentos maiores do genoma e reconstruir múltiplos genomas metagenomicamente montados (MAGs) ou genomas únicos amplificados (SAGs), respectivamente, abre uma oportunidade importante para estudos taxocêntricos do microbioma (isto é, comunidades microbianas e o microbioma).abrir novos caminhos.possuir material genético em determinado ambiente) 10,11,12.De facto, estudos recentes expandiram enormemente a representação filogenética da diversidade microbiana na Terra1, 13 e revelaram grande parte da diversidade funcional em comunidades microbianas individuais não anteriormente cobertas por sequências genómicas de referência de microrganismos cultivados (REFs)14.A capacidade de colocar a diversidade funcional não descoberta no contexto do genoma do hospedeiro (ou seja, a resolução do genoma) é crítica para prever linhas microbianas ainda não caracterizadas que presumivelmente codificam novos produtos naturais ou para rastrear tais compostos até ao seu produtor original .Por exemplo, uma abordagem combinada de análise metagenômica e genômica unicelular levou à identificação de Candidatus Entotheonella, um grupo de bactérias associadas a esponjas metabolicamente ricas, como produtoras de uma variedade de potenciais medicamentosos .No entanto, apesar das recentes tentativas de exploração genómica de diversas comunidades microbianas,16,19 mais de dois terços dos dados metagenómicos globais do maior oceano de ecossistemas da Terra16,20 ainda estão em falta.Assim, em geral, o potencial biossintético do microbioma marinho e o seu potencial como repositório de novos produtos enzimáticos e naturais permanecem largamente pouco estudados.
Para explorar o potencial biossintético dos microbiomas marinhos em escala global, primeiro reunimos genomas microbianos marinhos obtidos usando métodos dependentes de cultura e não culturais para criar um extenso banco de dados de filogenética e função genética.O exame deste banco de dados revelou uma grande variedade de agrupamentos de genes biossintéticos (BGCs), a maioria dos quais pertence a famílias de agrupamentos de genes ainda não caracterizados (GCF).Além disso, identificamos uma família bacteriana desconhecida que exibe a maior diversidade conhecida de BGCs em oceano aberto até o momento.Selecionamos duas vias de síntese ribossômica e de peptídeos modificados pós-tradução (RiPP) para validação experimental com base em suas diferenças genéticas em relação às vias atualmente conhecidas.A caracterização funcional destas vias revelou exemplos inesperados de enzimologia, bem como compostos estruturalmente incomuns com atividade inibidora de protease.
Inicialmente, nosso objetivo era criar um recurso global de dados para análise do genoma, com foco em seus componentes bacterianos e arqueais.Para este fim, reunimos dados metagenómicos e 1038 amostras de água do mar de 215 locais de amostragem distribuídos globalmente (faixa de latitude = 141,6°) e várias camadas profundas (de 1 a 5600 m de profundidade, cobrindo as zonas pelágica, mesopelágica e abissal).Antecedentes21,22,23 (Fig. 1a, dados estendidos, Fig. 1a e Tabela Suplementar 1).Além de fornecer uma ampla cobertura geográfica, essas amostras filtradas seletivamente nos permitiram comparar vários componentes do microbioma marinho, incluindo ricos em vírus (<0,2 µm), ricos em procarióticos (0,2–3 µm), ricos em partículas (0,8 µm). ).–20 µm) e colônias esgotadas de vírus (>0,2 µm).
a, Um total de 1.038 genomas publicamente disponíveis (metagenômica) de comunidades microbianas marinhas coletados em 215 locais distribuídos globalmente (62°S a 79°N e 179°W a 179°E).Blocos de mapa © Esri.Fontes: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ e Esri.b, esses metagenomas foram utilizados para reconstruir MAGs (métodos e informações adicionais), que diferem em quantidade e qualidade (métodos) nos conjuntos de dados (marcados em cores).Os MAGs reconstruídos foram complementados com genomas publicamente disponíveis (externos), incluindo MAG26, SAG27 e REF artesanais.27 Compilar OMD.c, em comparação com relatórios anteriores baseados apenas em SAG (GORG)20 ou MAG (GEM)16, o OMD melhora a caracterização genómica de comunidades microbianas marinhas (taxa de mapeamento de leitura metagenómica; método) em duas a três vezes com representação mais consistente em profundidade e latitude..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, agrupamento OMD em nível de agrupamento de espécies (95% de identidade média de nucleotídeos) identifica um total de aproximadamente 8.300 espécies, mais da metade das quais não foram previamente caracterizadas de acordo com anotações taxonômicas usando o GTDB (versão 89) e, a classificação das espécies por tipo de genoma mostrou que MAG, SAG e REFs se complementam bem ao refletir a diversidade filogenética de o microbioma marinho.Em particular, 55%, 26% e 11% das espécies eram específicas para MAG, SAG e REF, respectivamente.BATS, Série Temporal do Atlântico das Bermudas;GEM, genomas do microbioma terrestre;GORG, genoma global de referência dos oceanos;HOT, série temporal do Oceano Havaiano.
Usando este conjunto de dados, reconstruímos um total de 26.293 MAGs, principalmente bacterianos e arqueais (Fig. 1b e dados expandidos, Fig. 1b).Criamos esses MAGs a partir de montagens de amostras metagenômicas separadas, em vez de agrupadas, para evitar o colapso da variação da sequência natural entre amostras de diferentes locais ou pontos no tempo (métodos).Além disso, agrupamos fragmentos genômicos com base em suas correlações de prevalência em um grande número de amostras (de 58 a 610 amostras, dependendo da pesquisa; método).O Tribunal constatou que esta é uma etapa demorada, mas importante24, que foi ignorada em vários trabalhos de reconstrução de grande escala do MAG16, 19, 25 e que melhora significativamente a quantidade (2,7 vezes em média) e a qualidade (+20 % em média) do genoma.reconstruído a partir do metagenoma marinho aqui estudado (dados estendidos, Fig. 2a e informações adicionais).No geral, estes esforços resultaram num aumento de 4,5 vezes nos MAG microbianos marinhos (6 vezes se apenas os MAG de alta qualidade forem considerados) em comparação com o recurso MAG mais abrangente disponível atualmente16 (Métodos).Este conjunto MAG recém-criado foi então combinado com 830 MAG26s escolhidos a dedo, 5969 SAG27s e 1707 REFs.Vinte e sete espécies de bactérias marinhas e archaea formaram uma coleção combinatória de 34.799 genomas (Fig. 1b).
Em seguida, avaliamos o recurso recém-criado para melhorar sua capacidade de representar comunidades microbianas marinhas e avaliar o impacto da integração de diferentes tipos de genoma.Em média, descobrimos que cobre aproximadamente 40-60% dos dados metagenómicos marinhos (Figura 1c), duas a três vezes a cobertura dos relatórios anteriores apenas MAG em profundidade e latitude. Mais serial 16 ou SAG20.Além disso, para medir sistematicamente a diversidade taxonômica em coleções estabelecidas, anotamos todos os genomas usando o kit de ferramentas (métodos) do Genome Taxonomy Database (GTDB) e usamos uma identidade média de nucleotídeos em todo o genoma de 95%.28 para identificar 8.304 agrupamentos de espécies (espécies).Dois terços dessas espécies (incluindo novos clados) não haviam aparecido anteriormente no GTDB, das quais 2.790 foram descobertas usando o MAG reconstruído neste estudo (Fig. 1d).Além disso, descobrimos que diferentes tipos de genomas são altamente complementares: 55%, 26% e 11% das espécies são compostas inteiramente por MAG, SAG e REF, respectivamente (Fig. 1e).Além disso, o MAG cobriu todos os 49 tipos encontrados na coluna d’água, enquanto o SAG e o REF representaram apenas 18 e 11 deles, respectivamente.No entanto, o SAG representa melhor a diversidade dos clados mais comuns (dados expandidos, Fig. 3a), como Pelagic Bacteriales (SAR11), com o SAG cobrindo quase 1300 espécies e o MAG apenas 390 espécies.Notavelmente, REFs raramente se sobrepunham a MAGs ou SAGs em nível de espécie e representavam> 95% dos aproximadamente 1.000 genomas não encontrados nos conjuntos metagenômicos de oceano aberto estudados aqui, principalmente devido a interações com outros tipos de espécimes marinhos representativos isolados (por exemplo, sedimentos) .ou associado anfitrião).Para torná-lo amplamente disponível à comunidade científica, este recurso do genoma marinho, que também inclui fragmentos não classificados (por exemplo, de fagos previstos, ilhas genómicas e fragmentos de genoma para os quais não existem dados suficientes para a reconstrução do MAG), pode ser comparado com dados taxonómicos .Acesse anotações junto com a função genética e parâmetros contextuais no Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Em seguida, partimos para explorar a riqueza e a novidade do potencial biossintético em microbiomas de oceano aberto.Para este fim, primeiro usamos o antiSMASH para todos os MAGs, SAGs e REFs encontrados em 1.038 metagenomas marinhos (métodos) para prever um total de 39.055 BGCs.Em seguida, agrupamos estes em 6.907 GCFs não redundantes e 151 populações de agrupamentos de genes (GCCs; Tabela Suplementar 2 e métodos) para explicar a redundância inerente (ou seja, o mesmo BGC pode ser codificado em múltiplos genomas) e dados metagenômicos Fragmentação de BGCs concentrados.Os BGCs incompletos não aumentaram significativamente, se houver (Informação Suplementar), o número de GCFs e GCCs, respectivamente, contendo pelo menos um membro intacto do BGC em 44% e 86% dos casos.
No nível do GCC, encontramos uma grande variedade de RiPPs previstos e outros produtos naturais (Fig. 2a).Entre eles, por exemplo, arilpolienos, carotenóides, ectoínas e sideróforos pertencem a CCGs com ampla distribuição filogenética e alta abundância em metagenomas oceânicos, o que pode indicar uma ampla adaptação dos microrganismos ao ambiente marinho, incluindo resistência a espécies reativas de oxigênio, estresse oxidativo e osmótico..ou absorção de ferro (mais informações).Esta diversidade funcional contrasta com uma análise recente de aproximadamente 1,2 milhão de BGCs entre aproximadamente 190.000 genomas armazenados no banco de dados RefSeq do NCBI (BiG-FAM/RefSeq, doravante denominado RefSeq)29, que mostrou que os peptídeos não ribossômicos da sintetase (NRPS) e a policetídeo sintase (PKS) BGCs (Informações Suplementares).Também encontramos 44 (29%) GCCs apenas remotamente relacionados a qualquer RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; Fig. 2a e métodos) e 53 (35%) GCCs apenas em MAG, destacando o potencial para detectar produtos químicos anteriormente não descritos em OMD.Dado que cada um destes GCCs provavelmente representa funções biossintéticas altamente diversas, analisamos ainda mais os dados ao nível do GCF num esforço para fornecer um agrupamento mais detalhado de BGCs previstos para codificar produtos naturais semelhantes .Um total de 3.861 (56%) GCFs identificados não se sobrepuseram ao RefSeq, e> 97% dos GCFs não estavam presentes no MIBiG, um dos maiores bancos de dados de BGCs validados experimentalmente (Figura 2b).Embora não seja surpreendente descobrir muitos novos caminhos potenciais em ambientes que não são bem representados pelo genoma de referência, nosso método para desreplicar BGCs em GCFs antes do benchmarking difere dos relatórios anteriores 16 e nos permite fornecer uma avaliação imparcial da novidade.A maior parte da nova diversidade (3012 GCF ou 78%) corresponde a terpenos previstos, RiPP ou outros produtos naturais, e a maior parte (1815 GCF ou 47%) é codificada em tipos desconhecidos devido ao seu potencial biossintético.Ao contrário dos clusters PKS e NRPS, esses BGCs compactos têm menos probabilidade de serem fragmentados durante a montagem metagenômica 31 e permitem uma caracterização funcional de seus produtos que consome mais tempo e recursos.
Um total de 39.055 BGCs foram agrupados em 6.907 GCFs e 151 GCCs.a, representação de dados (interna externa).Agrupamento hierárquico de distâncias BGC baseado em GCC, 53 das quais são fixadas apenas por MAG.O GCC contém BGCs de diferentes táxons (frequência de porta transformada em ln) e diferentes classes de BGC (o tamanho do círculo corresponde à sua frequência).Para cada GCC, a camada externa representa o número de BGCs, a prevalência (porcentagem de amostras) e a distância (distância mínima do cosseno do BGC (min (dMIBiG))) do BiG-FAM ao BGC.GCCs com BGCs intimamente relacionados com BGCs verificados experimentalmente (MIBiG) são destacados com setas.b Comparando o GCF com os BGCs previstos (BiG-FAM) e validados experimentalmente (MIBiG), foram encontrados 3.861 novos (d–> 0,2) GCFs.A maioria (78%) deles codifica RiPP, terpenos e outros supostos produtos naturais.c, todos os genomas do OMD encontrados em 1.038 metagenomas marinhos foram colocados na árvore base do GTDB para mostrar a cobertura filogenética do OMD.Clados sem genomas no OMD são mostrados em cinza.O número de BGCs corresponde ao maior número de BGCs previstos por genoma em um determinado clado.Para maior clareza, os últimos 15% dos nós estão recolhidos.As setas indicam clados ricos em BGC (>15 BGC), com exceção de Mycobacterium, Gordonia (perdendo apenas para Rhodococcus) e Crocosphaera (perdendo apenas para Synechococcus).d, Desconhecido c.Eremiobacterota apresentou a maior diversidade biossintética (índice de Shannon baseado no tipo de produto natural).Cada banda representa o genoma com mais BGCs na espécie.T1PKS, PKS tipo I, T2/3PKS, PKS tipo II e tipo III.
Além da riqueza e da novidade, exploramos a estrutura biogeográfica do potencial biossintético do microbioma marinho.O agrupamento de amostras pela distribuição média do número de cópias metagenômicas do GCF (Métodos) mostrou que comunidades de baixa latitude, superficiais, ricas em procarióticos e pobres em vírus, principalmente de águas superficiais ou mais profundas iluminadas pelo sol, eram ricas em terpenos RiPP e BGC.Em contraste, comunidades polares, de águas profundas, ricas em vírus e partículas foram associadas a maiores abundâncias de NRPS e PKS BGC (dados expandidos, Fig. 4 e informações adicionais).Finalmente, descobrimos que comunidades tropicais e pelágicas bem estudadas são as fontes mais promissoras de novos terpenos (Figura de Dados Aumentados).Maior potencial para PKS, RiPP e outros produtos naturais (Figura 5a com dados expandidos).
Para complementar o nosso estudo do potencial biossintético dos microbiomas marinhos, pretendemos mapear a sua distribuição filogenética e identificar novos clados enriquecidos com BGC.Para este fim, colocamos os genomas dos micróbios marinhos em uma árvore filogenética bacteriana e arqueal GTDB13 normalizada e sobrepusemos as supostas vias biossintéticas que eles codificam (Fig. 2c).Detectamos facilmente vários clados enriquecidos com BGC (representados por mais de 15 BGCs) em amostras de água do mar (métodos) conhecidos por seu potencial biossintético, como cianobactérias (Synechococcus) e bactérias Proteus, como Tistrella32,33, ou recentemente atraíram a atenção por seu Produtos naturais .como Myxococcota (Sandaracinaceae), Rhodococcus e Planctomycetota34,35,36.Curiosamente, encontramos várias linhagens anteriormente inexploradas nestes clados.Por exemplo, aquelas espécies com o potencial biossintético mais rico nos filos Planctomycetota e Myxococcota pertenciam a ordens e gêneros candidatos não caracterizados, respectivamente (Tabela Suplementar 3).Tomados em conjunto, isto sugere que o OMD fornece acesso a informações filogenéticas anteriormente desconhecidas, incluindo microrganismos, que podem representar novos alvos para a descoberta de enzimas e produtos naturais.
Em seguida, caracterizamos o clado enriquecido com BGC não apenas contando o número máximo de BGCs codificados por seus membros, mas também avaliando a diversidade desses BGCs, o que explica a frequência de diferentes tipos de produtos candidatos naturais (Fig. 2c e métodos )..Descobrimos que as espécies com maior diversidade biossinteticamente foram representadas por MAGs bacterianos especialmente projetados neste estudo.Estas bactérias pertencem ao filo não cultivado Candidatus Eremiobacterota, que permanece em grande parte inexplorado, exceto alguns estudos genômicos37,38.Vale ressaltar que “ca.O gênero Eremiobacterota foi analisado apenas em ambiente terrestre e não é conhecido por incluir quaisquer membros enriquecidos em BGC.Aqui reconstruímos oito MAGs da mesma espécie (identidade de nucleotídeos> 99%) . Propomos, portanto, o nome da espécie “Candidatus Eudoremicrobium malaspinii”, em homenagem à nereida (ninfa do mar), um belo presente na mitologia grega e nas expedições.'Ka.De acordo com a anotação filogenética 13, E. malaspinii não possui parentes previamente conhecidos abaixo do nível de sequência e, portanto, pertence a uma nova família bacteriana que propomos “Ca.E. malaspinii” como espécie-tipo e “Ca.Eudormicrobiaceae” como nome oficial (Informação Suplementar).Breve reconstrução metagenômica de 'Ca.O projeto do genoma de E. malaspinii foi validado por entrada muito baixa, sequenciamento metagenômico de leitura longa e montagem direcionada de uma única amostra (Métodos) como um único cromossomo linear de 9,63 Mb com uma duplicação de 75 kb.como a única ambigüidade remanescente.
Para estabelecer o contexto filogenético desta espécie, procuramos 40 espécies intimamente relacionadas em amostras metagenômicas adicionais enriquecidas com eucarióticos da expedição Tara Ocean através da reconstrução direcionada do genoma.Resumidamente, vinculamos leituras metagenômicas a fragmentos genômicos associados a “Ca.E. malaspinii” e levantou a hipótese de que um aumento na taxa de recrutamento nesta amostra indica a presença de outros parentes (métodos).Como resultado, encontramos 10 MAGs, uma combinação de 19 MAGs representando cinco espécies em três gêneros dentro de uma família recentemente definida (ou seja, “Ca. Eudormicrobiaceae”).Após inspeção manual e controle de qualidade (dados ampliados, Fig. 6 e informações adicionais), constatamos que “Ca.As espécies de Eudormicrobiaceae apresentam genomas maiores (8 Mb) e potencial biossintético mais rico (14 a 22 BGC por espécie) do que outros membros “Ca”.Clado Eremiobacterota (até 7 BGC) (Fig. 3a-c).
a, Posições filogenéticas dos cinco 'Ca.Espécies de Eudormicrobiaceae apresentaram riqueza de BGC específica para as linhagens marinhas identificadas neste estudo.A árvore filogenética inclui todos os 'Ca.MAG Eremiobacterota e membros de outros filos (números de genoma entre colchetes) fornecidos no GTDB (versão 89) foram usados ​​para antecedentes evolutivos (Métodos).As camadas mais externas representam classificações em nível de família (“Ca. Eudormicrobiaceae” e “Ca. Xenobiaceae”) e em nível de classe (“Ca. Eremiobacteria”).As cinco espécies descritas neste estudo são representadas por códigos alfanuméricos e nomes binomiais propostos (Informações Suplementares).b, ok.As espécies de Eudormicrobiaceae compartilham sete núcleos BGC comuns.A ausência de BGC no clado A2 deveu-se à incompletude do MAG representativo (Tabela Suplementar 3).BGCs são específicos para “Ca.Anfitomicrobium” e “Ca.Amphithomicrobium” (clades A e B) não são mostrados.c, Todos os BGCs codificados como “Ca.Descobriu-se que Eudoremicrobium taraoceanii é expresso em 623 metatranscriptomas retirados dos oceanos de Tara.Círculos sólidos indicam transcrição ativa.Os círculos laranja denotam alterações de dobra transformadas em log2 abaixo e acima da taxa de expressão do gene housekeeping (métodos).d, curvas de abundância relativa (métodos) mostrando 'Ca.As espécies de Eudormicrobiaceae estão distribuídas na maioria das bacias oceânicas e em toda a coluna de água (da superfície até uma profundidade de pelo menos 4.000 m).Com base nessas estimativas, descobrimos que 'Ca.E. malaspinii' representa até 6% das células procarióticas em comunidades pelágicas associadas a grãos de águas profundas.Consideramos que uma espécie estava presente em um local se fosse encontrada em qualquer fração do tamanho de uma determinada camada de profundidade.IO – Oceano Índico, NAO – Atlântico Norte, NPO – Pacífico Norte, RS – Mar Vermelho, SAO – Atlântico Sul, SO – Oceano Antártico, SPO – Pacífico Sul.
Estudando a abundância e distribuição de Ca.Eudormicrobiaceae, que, como constatamos, predomina na maioria das bacias oceânicas, bem como em toda a coluna d'água (Fig. 3d).Localmente, representam 6% da comunidade microbiana marinha, o que os torna uma parte importante do microbioma marinho global.Além disso, encontramos o conteúdo relativo de Ca.As espécies de Eudormicrobiaceae e seus níveis de expressão de BGC foram mais elevados na fração enriquecida eucariótica (Fig. 3c e dados estendidos, Fig. 7), indicando uma possível interação com material particulado, incluindo plâncton.Esta observação tem alguma semelhança com 'Ca.BGCs de Eudoremicrobium que produzem produtos naturais citotóxicos através de vias conhecidas podem exibir comportamento predatório (Informações Suplementares e Dados Expandidos, Figura 8), semelhante a outros predadores que produzem especificamente metabólitos como Myxococcus .Descoberta de Ca.Eudormicrobiaceae em amostras menos disponíveis (oceano profundo) ou eucarióticas em vez de procarióticas podem explicar por que essas bactérias e sua inesperada diversidade de BGC permanecem obscuras no contexto da pesquisa de alimentos naturais.
Em última análise, procurámos validar experimentalmente a promessa do nosso trabalho baseado no microbioma na descoberta de novos caminhos, enzimas e produtos naturais.Entre as diferentes classes de BGCs, sabe-se que a via RiPP codifica uma rica diversidade química e funcional devido a várias modificações pós-traducionais do peptídeo central por enzimas maduras .Então escolhemos dois 'Ca.Os BGCs RiPP da Eudoremicrobium (Figuras 3b e 4a-e) são baseados no mesmo que qualquer BGC conhecido (\(\bar{d}\)MIBiG e \(\bar{d}\)RefSeq acima de 0.2).
a – c, Expressão heteróloga in vitro e ensaios enzimáticos in vitro de um novo (\(\bar{d}\)RefSeq = 0,29) cluster de biossíntese de RiPP específico para espécies de Ca em águas profundas.E. malaspinii' levou à produção de produtos difosforilados.c, modificações identificadas usando MS/MS de alta resolução (HR) (fragmentação indicada pelos íons b e y na estrutura química) e RMN (dados expandidos, Fig. 9).d, este peptídeo fosforilado exibe baixa inibição micromolar da elastase de neutrófilos de mamíferos, que não é encontrada no peptídeo de controle e no peptídeo desidratante (desidratação induzida por remoção química).O experimento foi repetido três vezes com resultados similares.Por exemplo, a expressão heteróloga de um segundo novo cluster de biossíntese de proteínas elucida a função de quatro enzimas maduras que modificam o peptídeo central de 46 aminoácidos.Os resíduos são corados de acordo com o local de modificação previsto por HR-MS/MS, marcação isotópica e análise de RMN (Informação Suplementar).A coloração tracejada indica que a modificação ocorre em qualquer um dos dois resíduos.A figura é uma compilação de numerosas construções heterólogas para mostrar a atividade de todas as enzimas maduras no mesmo núcleo.h, Ilustração de dados de RMN para N-metilação da amida principal.Os resultados completos são mostrados na fig.10 com dados estendidos.i, A posição filogenética da enzima madura do agrupamento de proteínas FkbM entre todos os domínios FkbM encontrados no banco de dados MIBiG 2.0 revela uma enzima desta família com atividade de N-metiltransferase (Informação Suplementar).Diagramas esquemáticos de BGCs (a, e), estruturas peptídicas precursoras (b, f) e supostas estruturas químicas de produtos naturais (c, g) são mostrados.
A primeira via RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) foi encontrada apenas em espécies de águas profundas “Ca.E. malaspinii” e códigos para precursor do peptídeo (Fig. 4a, b).Nesta enzima madura, identificamos um único domínio funcional homólogo ao domínio de desidratação da lantipeptídeo sintase que normalmente catalisa a fosforilação e subsequente remoção de 43 (Informação Suplementar).Portanto, prevemos que a modificação do peptídeo precursor envolve uma desidratação em duas etapas.No entanto, utilizando espectrometria de massa em tandem (MS/MS) e espectroscopia de ressonância magnética nuclear (RMN), identificamos um peptídeo linear polifosforilado (Fig. 4c).Embora inesperado, encontramos várias linhas de evidência para apoiar o seu produto final: dois hospedeiros heterólogos diferentes e nenhuma desidratação em ensaios in vitro, identificação de resíduos chave mutados no local de desidratação catalítica da enzima madura.todos reconstruídos por “Ca”.O genoma de E. malaspinii (dados expandidos, Fig. 9 e informações adicionais) e, finalmente, a atividade biológica do produto fosforilado, mas não da forma desidratada quimicamente sintetizada (Fig. 4d).Na verdade, descobrimos que apresenta baixa atividade inibitória de protease micromolar contra a elastase de neutrófilos, comparável a outros produtos naturais relacionados na faixa de concentração (IC50 = 14,3 μM) 44 , apesar do fato de que o papel ecológico ainda precisa ser elucidado.Com base nestes resultados, propomos nomear a via “fosfeptina”.
O segundo caso é uma via complexa do RiPP específica para 'Ca.O gênero Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) foi previsto para codificar produtos proteicos naturais (Fig. 4e).Estas vias são de particular interesse biotecnológico devido à densidade esperada e variedade de modificações químicas incomuns estabelecidas pelas enzimas codificadas pelas BGCs relativamente curtas .Descobrimos que esta proteína difere das proteínas previamente caracterizadas por não possuir o motivo principal NX5N das policeramidas e a alça de lantionina das landornamidas 46.Para superar as limitações dos padrões de expressão heteróloga comuns, nós os usamos juntamente com um sistema personalizado de Microvirgula aerodenitrificans para caracterizar quatro enzimas de vias maduras (métodos).Usando uma combinação de MS / MS, marcação isotópica e RMN, detectamos essas enzimas maduras no núcleo de 46 aminoácidos do peptídeo (Fig. 4f, g, dados expandidos, Figs. 10-12 e informações adicionais).Entre as enzimas maduras, caracterizamos o primeiro aparecimento de um membro da família FkbM O-metiltransferase 47 na via RiPP e descobrimos inesperadamente que esta enzima madura introduz a N-metilação da estrutura principal (Fig. 4h, i e informações adicionais).Embora esta modificação seja conhecida em produtos naturais NRP48, a N-metilação enzimática de ligações amida é uma reação complexa, mas biotecnologicamente significativa, que até agora tem sido de interesse para a família RiPP de borosinos.Especificidade 50,51.A identificação desta atividade em outras famílias de enzimas e RiPP poderá abrir novas aplicações e ampliar a diversidade funcional das proteínas 52 e sua diversidade química.Com base nas modificações identificadas e no comprimento incomum da estrutura do produto proposto, propomos um nome de via “pythonamida”.
A descoberta de uma enzimologia inesperada em uma família de enzimas funcionalmente caracterizadas ilustra a promessa da genômica ambiental para novas descobertas e também ilustra a capacidade limitada de inferência funcional baseada apenas na homologia de sequência.Assim, juntamente com relatos de RiPPs polifosforilados bioativos não canônicos, nossos resultados demonstram um valor crítico, mas intensivo em recursos, para os esforços da biologia sintética para descobrir completamente a riqueza funcional, a diversidade e as estruturas incomuns dos compostos bioquímicos.
Aqui demonstramos a gama de potencial biossintético codificado por micróbios e seu contexto genômico no microbioma marinho global, facilitando pesquisas futuras ao disponibilizar o recurso resultante para a comunidade científica (https://microbiomics.io/ocean/).Descobrimos que grande parte da sua novidade filogenética e funcional só pode ser obtida através da reconstrução de MAGs e SAGs, especialmente em comunidades microbianas subutilizadas que poderiam orientar futuros esforços de bioprospecção.Embora vamos nos concentrar aqui em 'Ca.Eudormicrobiaceae” como uma linhagem especialmente “talentosa” biossinteticamente, muitos dos BGCs previstos na microbiota não descoberta provavelmente codificam enzimas anteriormente não descritas que produzem compostos com ações ambientalmente e/ou biotecnologicamente significativas.
Conjuntos de dados metagenômicos dos principais estudos oceanográficos e de séries temporais com profundidade de sequenciamento suficiente foram incluídos para maximizar a cobertura das comunidades microbianas marinhas globais em bacias oceânicas, camadas profundas e ao longo do tempo.Esses conjuntos de dados (Tabela Suplementar 1 e Figura 1) incluem metagenômica de amostras coletadas nos oceanos de Tara (enriquecido com vírus, n = 190; enriquecido com procarióticos, n = 180) e a expedição BioGEOTRACES (n = 480).Série Temporal Oceânica Havaiana (HOT, n = 68), Série Temporal Bermuda-Atlântico (BATS, n = 62)21 e Expedição Malaspina (n = 58)23.As leituras de sequenciamento de todos os fragmentos metagenômicos foram filtradas quanto à qualidade usando BBMap (v.38.71) removendo adaptadores de sequenciamento de leituras, removendo leituras mapeadas para sequências de controle de qualidade (genomas PhiX) e usando trimq=14, maq=20 descarta baixa qualidade de leitura, maxns = 0 e minlength = 45. As análises subsequentes foram executadas ou mescladas com leituras de CQ, se especificado (bbmerge.sh minoverlap=16).As leituras de CQ foram normalizadas (alvo bbnorm.sh = 40, profundidade da mente = 0) antes da construção usando metaSPAdes (v.3.11.1 ou v.3.12, se necessário)53.Os contigs de andaime resultantes (doravante denominados andaimes) foram finalmente filtrados por comprimento (≥1 kb).
As 1.038 amostras metagenômicas foram divididas em grupos e, para cada grupo de amostras, as leituras de controle de qualidade metagenômica de todas as amostras foram combinadas com os colchetes de cada amostra separadamente, resultando no seguinte número de leituras de grupo entre colchetes entre pares: Tara Marine Viruses – Enriched (190x190), Procariotos Enriquecidos (180x180), BioGEOTRACES, HOT e BATS (610x610) e Malaspina (58x58).O mapeamento foi feito usando Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54, que permite que as leituras sejam combinadas com locais secundários (usando o sinalizador -a).Os alinhamentos foram filtrados para ter pelo menos 45 bases de comprimento, ter ≥97% de identidade e abranger ≥80% de leituras.Os arquivos BAM resultantes foram processados ​​usando o script jgi_summarize_bam_contig_profundidades para MetaBAT2 (v.2.12.1)55 para fornecer cobertura intra e interamostras para cada grupo.Finalmente, os colchetes foram agrupados para aumentar a sensibilidade executando MetaBAT2 individualmente em todas as amostras com –minContig 2000 e –maxEdges 500. Usamos MetaBAT2 em vez de um boxer conjunto porque ele foi demonstrado em testes independentes como o boxeador único mais eficaz.e 10 a 50 vezes mais rápido que outros boxeadores comumente usados57.Para testar o efeito das correlações de abundância, uma subamostra de metagenômica selecionada aleatoriamente (10 para cada um dos dois conjuntos de dados Tara Ocean, 10 para BioGEOTRACES, 5 para cada série temporal e 5 para Malaspina) utilizou adicionalmente apenas amostras.As amostras internas são agrupadas para obter informações de cobertura.(Informações adicionais).
Genomas (externos) adicionais foram incluídos na análise subsequente, nomeadamente 830 MAGs selecionados manualmente de um subconjunto do conjunto de dados Tara Oceans26, 5.287 SAGs do conjunto de dados GORG20 e dados do banco de dados MAR (MarDB v. 4) de 1.707 REFs isolados e 682 SAGs) 27. Para o conjunto de dados MarDB, os genomas são selecionados com base nos metadados disponíveis se o tipo de amostra corresponder à seguinte expressão regular: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [Eu|i] isolado'.
A qualidade de cada recipiente metagenômico e genomas externos foi avaliada usando CheckM (v.1.0.13) e Lineage Workflow da Anvi'o (v.5.5.0)58,59.Se CheckM ou Anvi'o relatar ≥50% de integridade/completude e ≤10% de contaminação/redundância, salve células metagenômicas e genomas externos para análise posterior.Essas pontuações foram então combinadas em completude média (mcpl) e contaminação média (mctn) para classificar a qualidade do genoma de acordo com critérios comunitários60 da seguinte forma: alta qualidade: mcpl ≥ 90% e mctn ≤ 5%;boa qualidade: mcpl ≥ 70%, mctn ≤ 10%, qualidade média: mcpl ≥ 50% e mctn ≤ 10%, qualidade razoável: mcpl ≤ 90% ou mctn ≥ 10%.Os genomas filtrados foram então correlacionados com índices de qualidade (Q e Q') da seguinte forma: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (variabilidade de deformação)/100 + 0,5 x log[N50] .(implementado em dRep61).
Para permitir a análise comparativa entre diferentes fontes de dados e tipos de genoma (MAG, SAG e REF), 34.799 genomas foram desreferenciados com base na identidade média de nucleotídeos (ANI) em todo o genoma usando dRep (v.2.5.4).Repete)61 ​​com limites de ANI de 95%28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) e genes marcadores de cópia única usando SpecI63 fornecendo agrupamento de genoma em nível de espécie.Um genoma representativo foi selecionado para cada cluster dRep de acordo com o índice máximo de qualidade (Q') definido acima, que foi considerado representativo da espécie.
Para avaliar a velocidade de mapeamento, o BWA (v.0.7.17-r1188, -a) foi usado para mapear todos os 1.038 conjuntos de leituras metagenômicas com 34.799 genomas contidos no OMD.Leituras com controle de qualidade foram mapeadas no modo single-ended e os alinhamentos resultantes foram filtrados para reter apenas alinhamentos ≥45 pb de comprimento.e identidade ≥95%.A proporção de exibição para cada amostra é a porcentagem de leituras restantes após a filtração dividida pelo número total de leituras de controle de qualidade.Usando a mesma abordagem, cada um dos 1.038 metagenomas foi reduzido para 5 milhões de inserções (dados expandidos, Fig. 1c) e combinados com GORG SAG em OMD e em todos os GEM16.A quantidade de MAGs recuperados da água do mar no catálogo GEM16 foi determinada por consultas de palavras-chave de fontes metagenômicas, selecionando amostras de água do mar (por exemplo, em oposição a sedimentos marinhos).Especificamente, selecionamos “aquático” como “categoria_de ecossistema”, “marinho” como “tipo de ecossistema” e filtramos “habitat” como “oceano profundo”, “marinho”, “oceânico marítimo”, “marinho pelágico”, “água marinha”, “Oceano”, “Água do Mar”, “Água do Mar Superficial”, “Água do Mar Superficial”.Isso resultou em 5.903 MAGs (734 de alta qualidade) distribuídos por 1.823 OTUs (visualizações aqui).
Os genomas procarióticos foram anotados taxonomicamente usando GTDB-Tk (v.1.0.2)64 com parâmetros padrão direcionados ao GTDB r89 versão 13. Anvi'o foi usado para identificar genomas eucarióticos com base na predição e recuperação de domínio ≥50% e redundância ≤ 10%.A anotação taxonômica de uma espécie é definida como um de seus genomas representativos.Com exceção dos eucariotos (148 MAG), cada genoma foi primeiramente anotado funcionalmente usando prokka (v.1.14.5)65, nomeando genes completos, definindo parâmetros “archaea” ou “bactérias” conforme necessário, o que também é relatado para não- codificando genes.e regiões CRISPR, entre outras características genômicas.Anote genes previstos identificando genes marcadores universais de cópia única (uscMG) usando fetchMG (v.1.2)66, atribua grupos ortólogos e consulte usando emapper (v.2.0.1)67 com base em eggNOG (v.5.0)68.Banco de dados KEGG (publicado em 10 de fevereiro de 2020) 69. A última etapa foi realizada combinando proteínas com o banco de dados KEGG usando DIAMOND (v.0.9.30)70 com uma consulta e cobertura de tópico ≥70%.Os resultados foram filtrados posteriormente de acordo com o NCBI Prokaryotic Genome Annotation Pipeline71 com base na taxa de bits ≥ 50% da taxa de bits máxima esperada (link em si).Sequências genéticas também foram usadas como entrada para identificar BGCs no genoma usando antiSMASH (v.5.1.0)72 com parâmetros padrão e diferentes explosões de cluster.Todos os genomas e anotações foram compilados no OMD juntamente com metadados contextuais disponíveis na web (//microbiomics.io/ocean/).
Semelhante aos métodos descritos anteriormente12,22, usamos CD-HIT (v.4.8.1) para agrupar> 56,6 milhões de genes codificadores de proteínas de genomas bacterianos e arqueais de OMD em 95% de identidade e genes mais curtos (cobertura de 90%)73 até >17,7 milhões de clusters de genes.A sequência mais longa foi escolhida como gene representativo para cada agrupamento de genes.Os 1.038 metagenomas foram então combinados com> 17,7 milhões de membros do cluster BWA (-a) e os arquivos BAM resultantes foram filtrados para reter apenas alinhamentos com ≥95% de identidade e ≥45 alinhamentos de base.A abundância de genes normalizados por comprimento foi calculada contando primeiro as inserções do melhor alinhamento único e depois, para inserções mapeadas difusas, adicionando contagens fracionárias aos genes alvo correspondentes proporcionais ao seu número de inserções únicas.
Os genomas do OMD expandido (com MAGs adicionais de “Ca. Eudormicrobiaceae”, veja abaixo) foram adicionados ao banco de dados da ferramenta de análise metagenômica mOTUs74 (v.2.5.1) para criar um banco de dados de referência estendido de mOTU.Apenas seis genomas de cópia única (23.528 genomas) sobreviveram em dez uscMGs.A expansão do banco de dados resultou em 4.494 agrupamentos adicionais em nível de espécie.1.038 metagenomas foram analisados ​​usando parâmetros mOTU padrão (v.2).Um total de 989 genomas contidos em 644 clusters mOTU (95% REF, 5% SAG e 99,9% pertencentes ao MarDB) não foram detectados pelo perfil mOTU.Isto reflecte várias fontes adicionais de isolamento marinho dos genomas do MarDB (a maioria dos genomas não detectados estão associados a organismos isolados de sedimentos, hospedeiros marinhos, etc.).Para continuar focando no ambiente de oceano aberto neste estudo, nós os excluímos da análise a jusante, a menos que tenham sido detectados ou incluídos no banco de dados mOTU estendido criado neste estudo.
Todos os BGCs de MAG, SAG e REF em OMD (ver acima) foram combinados com BGCs identificados em todos os andaimes metagenômicos (antiSMASH v.5.0, parâmetros padrão) e caracterizados usando BiG-SLICE (v.1.1) (domínio PFAM)75.Com base nessas características, calculamos todas as distâncias de cosseno entre BGCs e as agrupamos (links médios) em GCF e GCC usando limites de distância de 0,2 e 0,8, respectivamente.Esses limites são uma adaptação dos limites usados ​​anteriormente usando a distância euclidiana juntamente com a distância do cosseno, o que alivia alguns dos erros na estratégia original de agrupamento BiG-SLICE (Informação Suplementar).
Os BGCs foram então filtrados para reter apenas ≥5 kb codificados em andaimes para reduzir o risco de fragmentação como descrito anteriormente e para excluir REFs e SAGs do MarDB não encontrados em 1038 metagenomas (ver acima).Isto resultou num total de 39.055 BGCs codificadas pelo genoma OMD, com 14.106 adicionais identificados em fragmentos metagenómicos (ou seja, não combinados em MAGs).Esses BGCs “metagenômicos” foram usados ​​para estimar a proporção do potencial de biossíntese do microbioma marinho não capturado no banco de dados (Informação Suplementar).Cada BGC foi caracterizado funcionalmente de acordo com tipos de produtos preditivos definidos por categorias de produtos anti-SMASH ou mais grosseiras definidas no BiG-SCAPE76.Para evitar viés de amostragem na quantificação (composição taxonômica e funcional do GCC/GCF, distância do GCF e do GCC aos bancos de dados de referência e abundância metagenômica do GCF), mantendo apenas o BGC mais longo por GCF para cada espécie, 39.055 BGCs foram ainda desduplicados, resultando em um total de 17.689 BGC.
A novidade do GCC e do GCF foi avaliada com base na distância entre o banco de dados calculado (banco de dados RefSeq no BiG-FAM)29 e o BGC verificado experimentalmente (MIBIG 2.0)30.Para cada um dos 17.689 BGCs representativos, escolhemos a menor distância do cosseno ao respectivo banco de dados.Estas distâncias mínimas são então calculadas em média (média) de acordo com o GCF ou GCC, conforme apropriado.Um GCF é considerado novo se a distância até a base de dados for maior que 0,2, o que corresponde a uma separação ideal entre o GCF (médio) e a referência.Para o GCC, escolhemos 0,4, que é o dobro do limite definido pelo GCF, para garantir um relacionamento de longo prazo com os links.
A abundância metagenômica de BGC foi estimada como a abundância média de seus genes biossintéticos (conforme determinado pelo anti-SMASH) disponíveis a partir de perfis em nível de gene.A abundância metagenômica de cada GCF ou GCC foi então calculada como a soma dos BGCs representativos (de 17.689).Esses mapas de abundância foram subsequentemente normalizados para a composição celular usando a contagem mOTU por amostra, que também foi responsável pelos esforços de sequenciamento (dados expandidos, Fig. 1d).A prevalência de GCF ou GCC foi calculada como a porcentagem de amostras com abundância > 0.
A distância euclidiana entre amostras foi calculada a partir do perfil GCF normalizado.Essas distâncias foram reduzidas em tamanho usando UMAP77 e os embeddings resultantes foram usados ​​para agrupamento não supervisionado baseado em densidade usando HDBSCAN78.O número mínimo ideal de pontos para um cluster (e, portanto, o número de clusters) usado pelo HDBSCAN é determinado pela maximização da probabilidade cumulativa de adesão ao cluster.Os clusters identificados (e uma subamostra aleatória balanceada desses clusters para levar em conta o viés na análise de variância multivariada permutacional (PERMANOVA)) foram testados quanto à significância contra distâncias euclidianas não reduzidas usando PERMANOVA.O tamanho médio do genoma das amostras foi calculado com base na abundância relativa de mOTU e no tamanho estimado do genoma dos membros dos genomas.Em particular, o tamanho médio do genoma de cada mOTU foi estimado como a média dos tamanhos do genoma dos seus membros corrigidos para integridade (após filtragem) (por exemplo, um genoma 75% completo com um comprimento de 3 Mb tem um tamanho ajustado de 4 MB).para genomas médios com integridade ≥70%.O tamanho médio do genoma para cada amostra foi então calculado como a soma dos tamanhos do genoma mOTU ponderados pela abundância relativa.
Um conjunto filtrado de BGCs codificados pelo genoma no OMD é mostrado em árvores GTDB bacterianas e arqueais (em estruturas ≥5 kb, excluindo REF e SAG MarDB não encontrados em 1038 metagenomas, veja acima) e suas categorias de produtos previstas com base na filogenética posição do genoma (ver acima).Primeiro reduzimos os dados por espécie, usando o genoma com mais BGCs naquela espécie como representativo.Para visualização, os representantes foram divididos em grupos de árvores e, novamente, para cada clado celular, o genoma contendo o maior número de BGCs foi selecionado como representante.As espécies enriquecidas com BGC (pelo menos um genoma com> 15 BGCs) foram posteriormente analisadas calculando o Índice de Diversidade de Shannon para os tipos de produtos codificados nesses BGCs.Se todos os tipos de produtos previstos forem iguais, os híbridos químicos e outros BGCs complexos (conforme previsto pelo anti-SMAH) são considerados pertencentes ao mesmo tipo de produto, independentemente da sua ordem no cluster (por exemplo, proteína-bacteriocina e fusão bacteriocina-proteoproteína). corpo).híbrido).
DNA restante (estimado em 6 ng) da amostra Malaspina MP1648, correspondente à amostra biológica SAMN05421555 e compatível com o conjunto de leitura metagenômica Illumina SRR3962772 para leitura curta, processado de acordo com o protocolo de sequenciamento PacBio com entrada ultrabaixa para usar amplificação de amostra de gDNA do kit PacBio SMRTbell kit (100-980-000) e kit de preparação de modelo SMRTbell Express 2.0 (100-938-900).Resumidamente, o DNA restante foi cortado, reparado e purificado (esferas ProNex) usando Covaris (g-TUBE, 52104).O DNA purificado é então submetido à preparação da biblioteca, amplificação, purificação (esferas ProNex) e seleção de tamanho (> 6 kb, Blue Pippin) antes de uma etapa final de purificação (esferas ProNex) e sequenciamento na plataforma Sequel II.
Reconstrução dos dois primeiros ca.Para MAG Eremiobacterota, identificamos seis ANIs adicionais> 99% (estes estão incluídos na Figura 3), que foram inicialmente filtrados com base em pontuações de contaminação (posteriormente identificados como duplicações genéticas, veja abaixo).Também encontramos uma bandeja rotulada “Ca”.Eremiobacterota” de vários estudos23 e os usou junto com oito MAGs do nosso estudo como referência para leituras metagenômicas de 633 amostras eucarióticas enriquecidas (> 0,8 µm) usando BWA (v.0.7.17) Ref -r1188, – um sinalizador) para amostragem reduzida mapeamento (5 milhões de leituras).Com base em mapas específicos de enriquecimento (filtrados por 95% de identidade de alinhamento e 80% de cobertura de leitura), 10 metagenomas (cobertura esperada ≥5×) foram selecionados para montagem e 49 metagenomas adicionais (cobertura esperada ≥1×) para correlação de conteúdo.Usando os mesmos parâmetros acima, essas amostras foram armazenadas e 10 'Ca's adicionais foram adicionados.MAG Eremiobacterota foi restaurado.Estes 16 MAGs (sem contar os dois já existentes na base de dados) elevam o número total de genomas na OMD expandida para 34.815.Os MAGs recebem classificações taxonômicas com base em sua similaridade genômica e posição no GTDB.18 MAGs foram desreplicados usando dRep em 5 espécies (ANI intraespecífico> 99%) e 3 gêneros (ANI intragenérico 85% a 94%) dentro da mesma família .Os representantes das espécies foram selecionados manualmente com base na integridade, contaminação e N50.A nomenclatura sugerida é fornecida nas Informações Suplementares.
Avalie a integridade e contaminação de 'Ca.MAG Eremiobacterota, avaliamos a presença de uscMG, bem como conjuntos de genes marcadores de cópia única específicos de linhagem e domínio usados ​​por CheckM e Anvi'o.A identificação de 2 duplicatas de 40 uscMGs foi confirmada por reconstrução filogenética (veja abaixo) para descartar qualquer contaminação potencial (isto corresponde a 5% com base nestes 40 genes marcadores).Um estudo adicional de cinco MAGs representativos 'Ca.O baixo nível de contaminantes nesses genomas reconstruídos foi confirmado para espécies de Eremiobacterota usando a interface interativa Anvi'o baseada em correlações de abundância e composição de sequências (Informação Suplementar) .
Para análise filogenômica, selecionamos cinco MAGs representativos “Ca”.Eudormicrobiaceae”, todas as espécies “Ca.O genoma de Eremiobacterota e membros de outros filos (incluindo UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria e Planctomycetota) está disponível no GTDB (r89)13.Todos esses genomas foram anotados conforme descrito anteriormente para extração de genes marcadores de cópia única e anotação BGC.Os genomas do GTDB foram conservados de acordo com os critérios de integridade e contaminação acima.A análise filogenética foi realizada utilizando o fluxo de trabalho Anvi'o Phylogenetics59.A árvore foi construída usando IQTREE (v.2.0.3) (opções padrão e -bb 1000)80 em um alinhamento de 39 proteínas ribossômicas em tandem identificadas por Anvi'o (MUSCLE, v.3.8.1551)81.Suas posições foram reduzidas.para cobrir pelo menos 50% do genoma82 e Planctomycecota foi usado como grupo externo baseado na topologia de árvore GTDB.Uma árvore de 40 uscMGs foi construída usando as mesmas ferramentas e parâmetros.
Usamos Traitar (v.1.1.2) com parâmetros padrão (fenótipo, de nucleotídeos)83 para prever características microbianas comuns.Exploramos um estilo de vida predatório potencial com base em um índice predatório previamente desenvolvido84 que depende do conteúdo de um gene codificador de proteínas no genoma.Especificamente, usamos DIAMOND para comparar proteínas no genoma com o banco de dados OrthoMCL (v.4)85 usando as opções –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 AND contar os genes correspondentes a os genes marcadores para predadores e não predadores.O índice é a diferença entre o número de marcações predatórias e não predatórias.Como controle adicional, também analisamos o genoma “Ca”.O fator Entotheonella TSY118 é baseado em sua associação com Ca.Eudoremicrobium (grande tamanho do genoma e potencial biossintético).Em seguida, testamos ligações potenciais entre genes marcadores predadores e não predadores e o potencial biossintético do Ca.Eudormicrobiaceae” e descobriu que não mais do que um gene (de qualquer tipo de gene marcador, ou seja, gene predador/não predador) se sobrepõe ao BGC, sugerindo que o BGC não confunde os sinais de predação.Anotação genômica adicional de replicons embaralhados foi realizada usando TXSSCAN (v.1.0.2) para examinar especificamente o sistema de secreção, pili e flagelos86.
Cinco 'Ca's representativos foram mapeados mapeando 623 metatranscriptomas das frações de enriquecimento procarióticas e eucarióticas dos oceanos de Tara (usando BWA, v.0.7.17-r1188, -a flag).Genoma de Eudormicrobiaceae.Os arquivos BAM foram processados ​​com FeatureCounts (v.2.0.1)88 após 80% de cobertura de leitura e 95% de filtragem de identidade (com opções featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Conta o número de inserções por gene.Os mapas gerados foram normalizados para comprimento do gene e abundância do gene marcador mOTU (contagem de inserção média normalizada por comprimento para genes com contagem de inserção> 0) e transformados em log para 22,74 para obter a expressão relativa por célula de cada nível de gene, o que também explica o variabilidade de amostra para amostra durante o sequenciamento.Tais proporções permitem análises comparativas, mitigando problemas de composição ao utilizar dados de abundância relativa.Apenas amostras com> 5 dos 10 genes marcadores mOTU foram consideradas para análise posterior para permitir a detecção de uma porção suficientemente grande do genoma.
O perfil normalizado do transcriptoma de 'Ca.E. taraoceanii foi submetido à redução de dimensionalidade usando UMAP e a representação resultante foi usada para agrupamento não supervisionado usando HDBSCAN (ver acima) para determinar o status da expressão.PERMANOVA testa a significância das diferenças entre clusters identificados no espaço de distância original (não reduzido).A expressão diferencial entre essas condições foi testada em todo o genoma (ver acima) e 201 vias KEGG foram identificadas em 6 grupos funcionais, a saber: BGC, sistema de secreção e genes flagelares de TXSSCAN, enzimas de degradação (protease e peptidases) e genes predatórios e não- genes predatórios.marcadores de índice predatório.Para cada amostra, calculamos a expressão mediana normalizada para cada classe (observe que a própria expressão de BGC é calculada como a expressão mediana de genes biossintéticos para esse BGC) e testamos a significância entre os estados (teste de Kruskal-Wallis ajustado para FDR).
Os genes sintéticos foram adquiridos à GenScript e os iniciadores de PCR foram adquiridos à Microsynth.A polimerase de fusão da Thermo Fisher Scientific foi utilizada para amplificação do DNA.Plasmídeos NucleoSpin, gel NucleoSpin e kit de purificação de PCR da Macherey-Nagel foram utilizados para purificação de DNA.As enzimas de restrição e a DNA ligase de T4 foram adquiridas da New England Biolabs.Outros produtos químicos além do isopropil-β-d-1-tiogalactopiranosídeo (IPTG) (Biosynth) e 1,4-ditiotreitol (DTT, AppliChem) foram adquiridos da Sigma-Aldrich e utilizados sem purificação adicional.Os antibióticos cloranfenicol (Cm), dicloridrato de espectinomicina (Sm), ampicilina (Amp), gentamicina (Gt) e carbenicilina (Cbn) foram adquiridos da AppliChem.Os componentes dos meios Bacto Tryptone e Bacto Yeast Extract foram adquiridos à BD Biosciences.A tripsina para sequenciamento foi adquirida da Promega.
As sequências genéticas foram extraídas do BGC 75.1 previsto pelo anti-SMASH.E. malaspinii (informações complementares).
Os genes embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4) e embAM (incluindo regiões intergênicas) foram sequenciados como construções sintéticas em pUC57 (AmpR) com e sem códons otimizados para expressão em E quando.O gene embA foi subclonado no primeiro sítio de clonagem múltipla (MCS1) de pACYCDuet-1 (CmR) e pCDFDuet-1 (SmR) com sítios de clivagem BamHI e HindIII.Os genes embM e embMopt (otimizados por códon) foram subclonados em MCS1 pCDFDuet-1 (SmR) com BamHI e HindIII e colocados no segundo sítio de clonagem múltipla de pCDFDuet-1 (SmR) e pRSFDuet-1 (KanR) (MCS2) com NdeI/ChoI.A cassete embAM foi subclonada em pCDFDuet1 (SmR) com locais de clivagem BamHI e HindIII.O gene orf3 / embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) foi construído por PCR de extensão de sobreposição usando primers EmbI_OE_F_NdeI e EmbI_OE_R_XhoI, digerido com NdeI / XhoI e ligado em pCDFDuet-1-EmbM (MCS1) usando as mesmas enzimas de restrição (Suplementar mesa).6).A digestão e ligação com enzimas de restrição foram realizadas de acordo com o protocolo do fabricante (New England Biolabs).

 


Horário da postagem: 14 de março de 2023