Þakka þér fyrir að heimsækja Nature.com.Þú ert að nota vafraútgáfu með takmarkaðan CSS stuðning.Til að fá bestu upplifunina mælum við með því að þú notir uppfærðan vafra (eða slökkva á eindrægnistillingu í Internet Explorer).Að auki, til að tryggja áframhaldandi stuðning, sýnum við síðuna án stíla og JavaScript.
Rennistikur sem sýna þrjár greinar á hverri glæru.Notaðu til baka og næsta hnappa til að fara í gegnum glærurnar, eða rennibrautarhnappana í lokin til að fara í gegnum hverja glæru.
Ítarleg vörulýsing
304 Ryðfrítt stál soðið spóluðu rör/slöngur
1. Tæknilýsing: Ryðfrítt stál spólu rör / slöngur
2. Gerð: soðið eða óaðfinnanlegt
3. Staðall: ASTM A269, ASTM A249
4. Ryðfrítt stál spólu rör OD: 6mm til 25,4MM
5. Lengd: 600-3500MM eða samkvæmt kröfu viðskiptavinarins.
6. Veggþykkt: 0,2mm til 2,0mm.
7. Umburðarlyndi: OD: +/-0,01mm;Þykkt: +/-0,01%.
8. Stærð spólu innra gata: 500MM-1500MM (hægt að stilla í samræmi við kröfur viðskiptavina)
9. Spóluhæð: 200MM-400MM (hægt að stilla í samræmi við kröfur viðskiptavina)
10. Yfirborð: Björt eða glæður
11. Efni: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, álfelgur 625, 825, 2205, 2507 o.fl.
12. Pökkun: ofinn pokar í tréhylki, trébretti, tréskafti, eða samkvæmt kröfu viðskiptavinarins
13. Próf: efnaþáttur, ávöxtunarþol, togþol, hörkumæling
14. Ábyrgð: Skoðun þriðja aðila (til dæmis :SGS TV ) osfrv.
15. Umsókn: Skreyting, húsgögn, olíuflutningar, varmaskipti, handriðsgerð, pappírsgerð, bifreið, matvælavinnsla, læknisfræði o.fl.
Öll efnasamsetning og eðlisfræðilegir eiginleikar ryðfríu stáli eins og hér að neðan:
Efni | ASTM A269 Efnasamsetning % Hámark | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | NB | Nb | Ti | |
TP304 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 18.0-20.0 | 8,0-11,0 | ^ | ^ | ^ . | ^ |
TP304L | 0,035 | 2.00 | 0,045 | 0,030 | 1.00 | 18.0-20.0 | 8,0-12,0 | ^ | ^ | ^ | ^ |
TP316 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 16.0-18.0 | 10.0-14.0 | 2.00-3.00 | ^ | ^ | ^ |
TP316L | 0,035 D | 2.00 | 0,045 | 0,030 | 1.00 | 16.0-18.0 | 10.0-15.0 | 2.00-3.00 | ^ | ^ | ^ |
TP321 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 17.0-19.0 | 9.0-12.0 | ^ | ^ | ^ | 5C -0,70 |
TP347 | 0,08 | 2.00 | 0,045 | 0,030 | 1.00 | 17.0-19.0 | 9.0-12.0 | 10C -1,10 | ^ |
Efni | Hitameðferð | Hitastig F (C) Mín. | hörku | |
Brinell | Rockwell | |||
TP304 | Lausn | 1900 (1040) | 192HBW/200HV | 90HRB |
TP304L | Lausn | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316 | Lausn | 1900(1040) | 192HBW/200HV | 90HRB |
TP316L | Lausn | 1900(1040) | 192HBW/200HV | 90HRB |
TP321 | Lausn | 1900(1040) F | 192HBW/200HV | 90HRB |
TP347 | Lausn | 1900(1040) | 192HBW/200HV | 90HRB |
OD, tommur | OD umburðarlyndi tommur (mm) | WT umburðarlyndi % | Lengd vikmörk tommu (mm) | |
+ | - | |||
≤ 1/2 | ± 0,005 ( 0,13 ) | ± 15 | 1/8 (3.2) | 0 |
> 1/2 ~1 1/2 | ± 0,005(0,13) | ± 10 | 1/8 (3,2) | 0 |
> 1 1/2 ~< 3 1/2 | ± 0,010(0,25) | ± 10 | 3/16 (4,8) | 0 |
> 3 1/2 ~< 5 1/2 | ± 0,015(0,38) | ± 10 | 3/16 (4,8) | 0 |
> 5 1/2 ~< 8 | ± 0,030(0,76) | ± 10 | 3/16 (4,8) | 0 |
8~< 12 | ± 0,040(1,01) | ± 10 | 3/16 (4,8) | 0 |
12~< 14 | ± 0,050(1,26) | ± 10 | 3/16 (4,8) | 0 |
Náttúruleg örverusamfélög eru fjölbreytileg og efnafræðilega fjölbreytt.Auk vanrannsakaðra lífverahópa1, hefur þessi fjölbreytileiki einnig mikla möguleika til að uppgötva vistfræðilega og líftæknilega mikilvæg ensím og lífefnafræðileg efnasambönd2,3.Hins vegar er enn áskorun að rannsaka þennan fjölbreytileika til að ákvarða erfðafræðilegar leiðir sem búa til slík efnasambönd og binda þau við viðkomandi hýsil.Lífmyndunarmöguleikar örvera í úthafinu eru enn að mestu óþekktir vegna takmarkana á greiningu gagna um upplausn heils erfðamengis á heimsvísu.Hér könnum við fjölbreytileika og fjölbreytileika líftilbúna genaþyrpinga í hafinu með því að samþætta um 10.000 örveruerfðamengi úr ræktuðum frumum og stakfrumur með meira en 25.000 nýuppgerðum drögum úr yfir 1.000 sjósýnum.Þessar tilraunir hafa borið kennsl á um 40.000 meinta, aðallega nýja lífgerða genaþyrpinga, sem sumir hafa fundist í áður grunlausum söfnunarhópum.Í þessum stofnum greindum við ætterni auðgað í líftilbúnum genaþyrpingum („Candidatus Eudormicrobiaceae“) sem tilheyrðu óræktuðum bakteríuhópi og innihélt nokkrar af líffræðilega fjölbreyttustu örverum í þessu umhverfi.Þar af höfum við einkennt fosfatasa-peptíð og pýtónamíð ferla, greint dæmi um óvenjulega lífvirka uppbyggingu efnasambanda og ensímfræði, í sömu röð.Að lokum sýnir þessi rannsókn hvernig aðferðir byggðar á örverum geta gert kleift að rannsaka áður ólýst ensím og náttúruleg matvæli í illa skilinni örveru og umhverfi.
Örverur knýja áfram lífefnafræðilegar hringrásir á heimsvísu, viðhalda fæðuvefjum og halda plöntum og dýrum heilbrigðum5.Gífurlegur fjölbreytileiki þeirra í efnaskiptum, efnaskiptum og virkni felur í sér mikla möguleika á uppgötvun nýrra taxa1, ensíma og lífefnafræðilegra efnasambanda, þar á meðal náttúruafurða6.Í vistfræðilegum samfélögum veita þessar sameindir örverum margvíslega lífeðlisfræðilega og vistfræðilega virkni, allt frá samskiptum til samkeppni 2, 7.Auk upprunalegrar virkni þeirra eru þessar náttúruvörur og erfðafræðilega kóðaðar framleiðsluleiðir þeirra dæmi um líftækni og lækningalega notkun2,3.Að bera kennsl á slíkar leiðir og tengingar hefur verið mjög auðveldað með rannsóknum á ræktuðum örverum.Hins vegar hafa flokkunarfræðilegar rannsóknir á náttúrulegu umhverfi sýnt að langflestar örverur hafa ekki verið ræktaðar8.Þessi menningarlega hlutdrægni takmarkar getu okkar til að nýta hagnýtan fjölbreytileika sem er umritaður af mörgum örverum4,9.
Til að sigrast á þessum takmörkunum hafa tækniframfarir undanfarinn áratug gert vísindamönnum kleift að raða beint (þ.e. án undangenginnar ræktunar) örveru-DNA-bútum úr heilum samfélögum (metagenomics) eða stakum frumum.Hæfni til að setja saman þessi brot í stærri erfðamengisbrot og endurgera mörg metagenomically samansett erfðamengi (MAGs) eða stakmagnað erfðamengi (SAGs), í sömu röð, opnar mikilvægt tækifæri fyrir taxómiðlægar rannsóknir á örverunni (þ.e. örverusamfélögum og örverulífinu).leggja nýjar brautir.eigið erfðaefni í tilteknu umhverfi) 10,11,12.Reyndar hafa nýlegar rannsóknir stækkað til muna fjölbreytileika örverufjölbreytileika á jörðinni1, 13 og hafa leitt í ljós mikið af starfrænum fjölbreytileika í einstökum örverusamfélögum sem áður hafa ekki verið fjallað um ræktaða örveruviðmiðunarerfðamengi (REFs)14.Hæfni til að setja ófundinn virknifjölbreytni í samhengi við erfðamengi hýsilsins (þ.e. upplausn erfðamengis) er mikilvæg til að spá fyrir um enn óeinkenndar örverulínur sem væntanlega kóða nýjar náttúrulegar vörur15,16 eða til að rekja slík efnasambönd aftur til upprunalegs framleiðanda þeirra17.Til dæmis hefur sameinuð metagenomic og einfrumu erfðagreiningaraðferð leitt til auðkenningar á Candidatus Entotheonella, hópi efnaskiptaríkra svampatengdra baktería, sem framleiðendur margs konar lyfjamöguleika18.Hins vegar, þrátt fyrir nýlegar tilraunir til erfðafræðilegrar könnunar á fjölbreyttum örverusamfélögum, vantar 16,19 meira en tvo þriðju af alþjóðlegum metagenomic gögnum fyrir stærsta haf jarðar af vistkerfum16,20 enn.Almennt séð er líffræðilegur möguleiki sjávarörverunnar og möguleiki hennar sem geymsla nýrra ensíma- og náttúruafurða enn að mestu vankönnuð.
Til að kanna nýmyndunarmöguleika sjávarörvera á heimsvísu, söfnuðum við fyrst saman erfðamengi sjávarörvera sem fengust með því að nota ræktunarháðar og óræktaðar aðferðir til að búa til umfangsmikinn gagnagrunn um sýklafræði og genavirkni.Athugun á þessum gagnagrunni leiddi í ljós margs konar líftilbúna genaþyrpinga (BGCs), sem flestir tilheyra enn óeinkennum genaþyrpingum (GCF) fjölskyldum.Að auki greindum við óþekkta bakteríufjölskyldu sem sýnir mesta þekkta fjölbreytileika BGCs í úthafinu til þessa.Við völdum tvær ríbósóma nýmyndun og post-translationally modified peptíð (RiPP) leiðir til sannprófunar á tilraunum byggðar á erfðafræðilegum mun þeirra frá núverandi leiðum.Virka einkenni þessara ferla hefur leitt í ljós óvænt dæmi um ensímfræði sem og byggingarfræðilega óvenjuleg efnasambönd með próteasahamlandi virkni.
Í fyrstu var stefnt að því að búa til alþjóðlega gagnaauðlind fyrir erfðamengigreiningu, með áherslu á bakteríu- og fornleifahluta þess.Í þessu skyni söfnuðum við saman frummyndafræðilegum gögnum og 1038 sjósýnum frá 215 sýnatökustöðum á heimsvísu (breiddarsvið = 141,6°) og nokkrum djúpum lögum (frá 1 til 5600 m dýpi, sem þekja uppsjávar-, jarðsjávar- og hyldýpissvæðin).Bakgrunnur21,22,23 (Mynd 1a, aukin gögn, mynd 1a og viðbótartafla 1).Auk þess að veita víðtæka landfræðilega umfang, gerðu þessi sértæku síuðu sýni okkur kleift að bera saman ýmsa þætti sjávarörverunnar, þar á meðal veiruríkar (<0,2 µm), dreifkjörnungaríkar (0,2–3 µm), agnaríkar (0,8 µm) ).–20 µm) og vírusþurrðar (>0,2 µm) nýlendur.
a, Alls 1038 erfðamengi (metagenomics) af örverusamfélögum sjávar safnað frá 215 stöðum á heimsvísu (62°S til 79°N og 179°V til 179°E .).Kortaflísar © Esri.Heimildir: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ og Esri.b, þessi metagenom voru notuð til að endurbyggja MAGs (aðferðir og viðbótarupplýsingar), sem eru mismunandi að magni og gæðum (aðferðir) í gagnapakkanum (merkt með lit).Endurgerðu MAGs voru bætt við almenningi aðgengileg (ytri) erfðamengi, þar á meðal handunnið MAG26, SAG27 og REF.27 Settu saman OMD.c, samanborið við fyrri skýrslur sem eingöngu eru byggðar á SAG (GORG)20 eða MAG (GEM)16, bætir OMD erfðafræðilega eiginleika sjávarörverusamfélaga (metagenomic leskortlagningarhraði; aðferð) um tvisvar til þrisvar sinnum með samkvæmari framsetningu í dýpt og breiddargráðu..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD flokkun í tegundaþyrpingastig (95% meðalkjarnakennd) auðkennir samtals u.þ.b. 8300 tegundir, þar af meira en helmingur sem ekki hefur áður verið skilgreindur samkvæmt flokkunarfræðilegum skýringum með því að nota GTDB (útgáfa 89) e, flokkun tegunda eftir erfðamengisgerð sýndi að MAG, SAG og REF fylla hvert annað vel með því að endurspegla fjölbreytileika lífvera. örveru sjávar.Sérstaklega voru 55%, 26% og 11% tegundanna sértækar fyrir MAG, SAG og REF, í sömu röð.BATS, Bermúda Atlantic Time Series;GEM, erfðamengi örveru jarðar;GORG, alþjóðlegt viðmiðunarerfðamengi hafsins;HOT, Hawaiian Ocean tímaröð.
Með því að nota þetta gagnasafn endurgerðum við samtals 26.293 MAG, aðallega bakteríur og fornleifar (mynd 1b og stækkuð gögn, mynd 1b).Við bjuggum til þessar MAG úr samsetningum úr aðskildum frekar en sameinuðum metagenomic sýnum til að koma í veg fyrir hrun náttúrulegrar breytileika á milli sýna frá mismunandi stöðum eða tímapunktum (aðferðum).Að auki flokkuðum við erfðafræðilega brot út frá algengi fylgni þeirra yfir fjölda sýna (frá 58 til 610 sýnum, fer eftir könnun; aðferð).Við komumst að því að þetta er tímafrekt en mikilvægt skref24 sem var sleppt í nokkrum stórum MAG16, 19, 25 endurbyggingarverkum og bætir verulega magn (2,7-falt að meðaltali) og gæði (+20% að meðaltali) erfðamengi.endurgerð út frá frumstofni sjávar sem rannsakað er hér (útvíkkuð gögn, mynd 2a og viðbótarupplýsingar).Á heildina litið leiddi þessi viðleitni til 4,5-faldrar aukningar á sjávarörverum MAG (6-földun ef aðeins hágæða MAG eru talin) samanborið við umfangsmesta MAG auðlind sem til er í dag16 (Aðferðir).Þetta nýstofnaða MAG sett var síðan sameinað 830 handvöldum MAG26, 5969 SAG27 og 1707 REF.Tuttugu og sjö tegundir sjávarbaktería og forndýra mynduðu samsett safn 34.799 erfðamengi (mynd 1b).
Við metum síðan nýstofnaða auðlindina til að bæta getu hennar til að tákna sjávarörverusamfélög og meta áhrif þess að samþætta mismunandi erfðamengigerðir.Að meðaltali komumst við að því að það nær yfir um það bil 40-60% af metagenomic gögnum sjávar (Mynd 1c), tvisvar til þrisvar sinnum meira en fyrri skýrslur sem eingöngu eru MAG, bæði á dýpt og breiddargráðu More serial 16 eða SAG20.Að auki, til að mæla flokkunarfræðilegan fjölbreytileika á kerfisbundinn hátt í rótgrónum söfnum, gerðum við athugasemdir við öll erfðamengi með því að nota GTDB verkfærakistuna (aðferðir) og notuðum að meðaltali 95% núkleótíðauðkenni alls erfðamengisins.28 til að bera kennsl á 8.304 tegundaþyrpingar (tegundir).Tveir þriðju hlutar þessara tegunda (þar á meðal nýjar klæðar) höfðu ekki áður birst í GTDB, þar af 2790 sem fundust með því að nota MAG sem endurbyggt var í þessari rannsókn (mynd 1d).Að auki komumst við að því að mismunandi gerðir af erfðamengi eru mjög fyllingar: 55%, 26% og 11% tegunda eru eingöngu samsett úr MAG, SAG og REF, í sömu röð (Mynd 1e).Að auki náði MAG yfir allar 49 tegundir sem finnast í vatnssúlunni, en SAG og REF voru aðeins fulltrúar fyrir 18 og 11 þeirra, í sömu röð.Hins vegar táknar SAG betur fjölbreytileika algengustu klæða (útvíkkuð gögn, mynd 3a), eins og Pelagic Bacteriales (SAR11), þar sem SAG nær yfir tæplega 1300 tegundir og MAG aðeins 390 tegundir.Athyglisvert er að REF skarast sjaldan við MAG eða SAG á tegundastigi og voru >95% af um það bil 1000 erfðamengi sem ekki finnast í frumsýnum í opnu hafinu sem rannsökuð eru hér, aðallega vegna samskipta við aðrar tegundir einangraðra dæmigerðra sjávarsýna (td setlög) .eða gestgjafi).Til að gera það víða aðgengilegt fyrir vísindasamfélagið, er hægt að bera þessa erfðamengisauðlind sjávar, sem inniheldur einnig óflokkað brot (td úr spáðum fögum, erfðafræðilegum eyjum og erfðamengisbrotum sem ekki eru til næg gögn fyrir enduruppbyggingu MAG), saman við flokkunarfræðileg gögn. .Fáðu aðgang að skýringum ásamt genavirkni og samhengisbreytum í Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Við lögðum síðan af stað til að kanna ríkidæmi og nýjung lífgervingarmöguleika í örverum í opnu hafi.Í þessu skyni notuðum við fyrst antiSMASH fyrir öll MAG, SAG og REF sem finnast í 1038 sjávarmetagenomum (aðferðum) til að spá fyrir um samtals 39.055 BGCs.Við flokkuðum þetta síðan í 6907 óþarfa GCF og 151 genaþyrpingahópa (GCCs; viðbótartafla 2 og aðferðir) til að gera grein fyrir eðlislægri offramboði (þ.e. sama BGC er hægt að kóða í mörgum erfðamengi) og metagenomic gögn Brottun á einbeittum BGCs.Ófullnægjandi BGCs jók ekki marktækt, ef einhver (viðbótarupplýsingar), fjölda GCFs og GCCs, í sömu röð, sem innihéldu að minnsta kosti einn ósnortinn BGC meðlim í 44% og 86% tilvika.
Á GCC stigi fundum við mikið úrval af spáð RiPPs og öðrum náttúrulegum vörum (mynd 2a).Meðal þeirra tilheyra til dæmis arýlpólýen, karótenóíð, ektóín og hliðarófórar GCCs með víðtæka dreifingu og mikið magn af frumbreytum sjávar, sem getur bent til víðtækrar aðlögunar örvera að sjávarumhverfinu, þar með talið viðnám gegn hvarfgjörnum súrefnistegundum, oxunar- og osmótísk streita..eða frásog járns (nánari upplýsingar).Þessi starfræni fjölbreytileiki er í andstöðu við nýlega greiningu á um það bil 1,2 milljón BGCs meðal um það bil 190.000 erfðamengi sem eru geymd í NCBI RefSeq gagnagrunninum (BiG-FAM/RefSeq, hér eftir nefnt RefSeq)29, sem sýndi að nonribosomal Synthetase peptíð (NRPS) og polyketide. (PKS) BGCs (viðbótarupplýsingar).Við fundum einnig 44 (29%) GCC sem eru aðeins fjartengd hvaða RefSeq BGC sem er (\(\bar{d}\)RefSeq > 0,4; mynd 2a og aðferðir) og 53 (35%) GCC eingöngu í MAG , sem undirstrikar mögulega til að greina áður ólýst efni í OMD.Í ljósi þess að hver þessara GCCs táknar líklega mjög fjölbreyttar líffræðilegar aðgerðir, greindum við frekar gögn á GCF stigi í viðleitni til að veita ítarlegri flokkun BGCs sem spáð er að myndi kóða fyrir svipaðar náttúrulegar vörur29.Alls 3861 (56%) auðkenndar GCFs skarast ekki við RefSeq og >97% GCFs voru ekki til staðar í MIBiG, einum stærsta gagnagrunni með tilraunafullgildum BGCs (Mynd 2b).Þó að það komi ekki á óvart að uppgötva margar mögulegar nýjar leiðir í aðstæðum sem eru ekki vel táknaðar með viðmiðunarerfðamengi, þá er aðferðin okkar til að afmynda BGCs í GCFs fyrir viðmiðun frá fyrri skýrslum 16 og gerir okkur kleift að leggja fram óhlutdrægt mat á nýjung.Stærstur hluti nýja fjölbreytileikans (3012 GCF eða 78%) samsvarar áætluðum terpenum, RiPP eða öðrum náttúrulegum afurðum, og flestir (1815 GCF eða 47%) eru kóðaðir í óþekktar tegundir vegna lífmyndunarmöguleika þeirra.Ólíkt PKS og NRPS þyrpingum er ólíklegra að þessir þéttu BGCs verði sundurliðaðir meðan á metagenomic samsetningu stendur 31 og leyfa tíma- og auðlindafrekari hagnýtingu á vörum þeirra.
Alls voru 39.055 BGCs flokkaðar í 6.907 GCFs og 151 GCCs.a, framsetning gagna (innri ytri).Stigveldi þyrping BGC vegalengda byggt á GCC, 53 þeirra eru aðeins fastar af MAG.GCC inniheldur BGC frá mismunandi flokkum (ln-umbreytt hlið tíðni) og mismunandi BGC flokkum (hringastærð samsvarar tíðni þess).Fyrir hvern GCC táknar ytra lagið fjölda BGCs, algengi (hlutfall sýna) og fjarlægð (lágmarks BGC kósínusfjarlægð (mín(dMIBiG))) frá BiG-FAM til BGC.GCCs með BGCs nátengd tilraunastaðfestum BGCs (MIBiG) eru auðkennd með örvum.b Þegar GCF var borið saman við spáð (BiG-FAM) og tilraunastaðfest (MIBiG) BGC, fundust 3861 ný (d–>0,2) GCF.Flest (78%) þessara kóða fyrir RiPP, terpena og aðrar hugsanlegar náttúruvörur.c, öll erfðamengi í OMD sem finnast í 1038 sjávarmetagenomum voru sett í GTDB grunntréð til að sýna fylgenfræðilega umfjöllun OMD.Clades án erfðamengis í OMD eru sýnd með gráu.Fjöldi BGCs samsvarar mesta fjölda spáðra BGCs á hvert erfðamengi í tilteknu klæði.Til glöggvunar eru síðustu 15% hnútanna hrunin.Örvar gefa til kynna klæði sem eru rík af BGC (>15 BGC), að undanskildum Mycobacterium, Gordonia (næst á eftir Rhodococcus) og Crocosphaera (næst á eftir Synechococcus).d, óþekkt c.Eremiobacterota sýndi mestan lífgervifræðilegan fjölbreytileika (Shannon vísitala byggt á náttúrulegri vörutegund).Hvert band táknar erfðamengið með flest BGC í tegundinni.T1PKS, PKS gerð I, T2/3PKS, PKS gerð II og gerð III.
Auk auðlegðar og nýbreytni könnum við líflandfræðilega uppbyggingu lífgervingarmöguleika sjávarörverunnar.Flokkun sýna eftir meðalmetagenomic GCF afritafjöldadreifingu (Methods) sýndi að lág breiddargráðu, yfirborðs-, dreifkjörnungarík og vírussnauð samfélög, aðallega frá yfirborði eða dýpri sólbjörtu vatni, voru rík af RiPP og BGC terpenum.Aftur á móti tengdust heimskauts-, djúpsjávar-, veiru- og agnarík samfélög meiri gnægð NRPS og PKS BGC (útvíkkuð gögn, mynd 4 og viðbótarupplýsingar).Að lokum komumst við að því að vel rannsökuð hitabeltis- og uppsjávarsamfélög eru vænlegustu uppsprettur nýrra terpena (Augmented Data Figure).Hæstu möguleikar fyrir PKS, RiPP og aðrar náttúruvörur (Mynd 5a með stækkuðum gögnum).
Til að bæta við rannsókn okkar á nýmyndunarmöguleikum sjávarörvera, ætluðum við að kortleggja sýklafræðilega dreifingu þeirra og bera kennsl á nýjar BGC-auðgaðar klæðar.Í þessu skyni settum við erfðamengi sjávarörvera í eðlilegt GTDB13 bakteríu- og fornfrumutré og lögðum yfir hugsanlegar líffræðilegar leiðir sem þær kóða (mynd 2c).Við höfum auðveldlega greint nokkrar BGC-auðgaðar klæðar (sem táknaðar með yfir 15 BGC) í sjósýnum (aðferðum) sem þekktar eru fyrir líffræðilegan möguleika þeirra, svo sem blágrýtisbakteríur (Synechococcus) og Proteus bakteríur, eins og Tistrella32,33, eða nýlega vakið athygli fyrir þeirra náttúrulegar vörur.eins og Myxococcota (Sandaracinaceae), Rhodococcus og Planctomycetota34,35,36.Athyglisvert er að við fundum nokkrar áður ókannaðar ættir í þessum klæðaflokkum.Til dæmis tilheyrðu þær tegundir sem eru með ríkustu lífmyndunarmöguleikana í phyla Planctomycetota og Myxococcota óeinkennum frambjóðendaflokkum og ættkvíslum, í sömu röð (viðbótartafla 3).Samanlagt bendir þetta til þess að OMD veiti aðgang að áður óþekktum sýklafræðilegum upplýsingum, þar á meðal örverum, sem gætu táknað ný markmið fyrir uppgötvun ensíma og náttúrulegra vara.
Næst auðkenndum við BGC-auðgað klaðið með því að telja ekki aðeins hámarksfjölda BGCs sem meðlimir þess kóðuðu, heldur einnig með því að meta fjölbreytileika þessara BGCs, sem útskýrir tíðni mismunandi tegunda náttúrulegra varaafurða (mynd 2c og aðferðir). )..Við komumst að því að líffræðilega fjölbreyttustu tegundirnar voru táknaðar með sérhönnuðum bakteríu MAG í þessari rannsókn.Þessar bakteríur tilheyra óræktuðu ættkvíslinni Candidatus Eremiobacterota, sem er enn að mestu órannsökuð fyrir utan nokkrar erfðafræðilegar rannsóknir37,38.Það er athyglisvert að „ca.Ættkvíslin Eremiobacterota hefur aðeins verið greind í jarðnesku umhverfi39 og ekki er vitað til þess að þær innihaldi neina meðlimi auðgað í BGC.Hér höfum við endurgert átta MAG af sömu tegund (kirniskennd > 99%) 23. Við leggjum því til tegundarheitið „Candidatus Eudoremicrobium malaspinii“, nefnt eftir Nereid (sjávarnymfa), falleg gjöf í grískri goðafræði og leiðöngrum.'Ka.Samkvæmt phylogenetic athugasemd 13 á E. malaspinii enga áður þekkta ættingja undir röðinni og tilheyrir því nýrri bakteríufjölskyldu sem við leggjum til „Ca.E. malaspinii“ sem tegundartegund og „Ca.Eudormicrobiaceae“ sem opinbert heiti (viðbótarupplýsingar).Stutt metagenomic endurgerð 'Ca.E. malaspinii erfðamengisverkefnið var fullgilt með mjög lágu inntaki, langlestri metagenomic raðgreiningu og markvissri samsetningu á einu sýni (Aðferðir) sem einn 9,63 Mb línulegur litningur með 75 kb tvítekningu.sem eina óljósan sem eftir er.
Til að koma á sýklafræðilegu samhengi þessarar tegundar, leituðum við að 40 náskyldum tegundum í viðbótar heilkjörnungaauðguðu frumsýnasýnum frá Tara Ocean leiðangrinum með markvissri enduruppbyggingu erfðamengisins.Í stuttu máli höfum við tengt metagenomic lestur við erfðafræðilega brot sem tengjast „Ca.E. malaspinii“ og setti fram tilgátu um að aukið nýliðunarhlutfall í þessu úrtaki bendi til nærveru annarra ættingja (aðferðir).Fyrir vikið fundum við 10 MAG, blöndu af 19 MAG sem tákna fimm tegundir í þremur ættkvíslum innan nýskilgreindrar fjölskyldu (þ.e. "Ca. Eudormicrobiaceae").Eftir handvirka skoðun og gæðaeftirlit (útvíkkuð gögn, mynd 6 og viðbótarupplýsingar) komumst við að því að „Ca.Eudormicrobiaceae tegundir sýna stærri erfðamengi (8 Mb) og ríkari lífmyndunarmöguleika (14 til 22 BGC á hverja tegund) en aðrir „Ca“ meðlimir.Clade Eremiobacterota (allt að 7 BGC) (mynd 3a–c).
a, Sýklafræðilegar stöður fimm 'Ca.Tegundir Eudormicrobiaceae sýndu BGC auðlegð sem er sértæk fyrir sjávarlínurnar sem greindar voru í þessari rannsókn.Fræðslutréð inniheldur allt 'Ca.MAG Eremiobacterota og meðlimir annarra ættflokka (erfðafjöldanúmer innan sviga) sem gefnar eru upp í GTDB (útgáfa 89) voru notuð fyrir þróunarbakgrunn (aðferðir).Ystu lögin tákna flokkanir á fjölskyldustigi ("Ca. Eudormicrobiaceae" og "Ca. Xenobiaceae") og á flokksstigi ("Ca. Eremiobacteria").Tegundirnar fimm sem lýst er í þessari rannsókn eru táknaðar með alfanumerískum kóða og fyrirhuguðum tvíliðaheitum (viðbótarupplýsingar).b, ok.Eudormicrobiaceae tegundir deila sjö sameiginlegum BGC kjarna.Fjarvera BGC í A2 klæðinu var vegna þess að fulltrúa MAG var ófullnægjandi (viðbótartafla 3).BGC eru sértæk fyrir "Ca.Amphithomicrobium“ og „Ca.Amphithomicrobium“ (hlífar A og B) eru ekki sýndar.c, Öll BGCs kóðað sem „Ca.Eudoremicrobium taraoceanii kom í ljós í 623 metatrascriptome sem tekin voru úr sjónum í Tara.Heilir hringir gefa til kynna virka umritun.Appelsínugulir hringir tákna log2-umbreyttar fellingarbreytingar fyrir neðan og yfir genatjáningarhraða heimilishalds (aðferðir).d, hlutfallsleg gnægðsferill (aðferðir) sem sýna 'Ca.Tegundir Eudormicrobiaceae eru útbreiddar í flestum hafsvæðum og í allri vatnssúlunni (frá yfirborði að a.m.k. 4000 m dýpi).Byggt á þessum áætlunum komumst við að því að 'Ca.E. malaspinii' stendur fyrir allt að 6% af dreifkjörnungafrumum í djúpsjávarsamfélögum tengdum uppsjávarkornum.Við töldum tegund vera til staðar á staðnum ef hún fannst í einhverju broti af stærð tiltekins dýptarlags.IO – Indlandshaf, NAO – Norður-Atlantshaf, NPO – Norður-Kyrrahaf, RS – Rauðahaf, SAO – Suður-Atlantshaf, SO – Suðurhaf, SPO – Suður Kyrrahaf.
Að rannsaka gnægð og dreifingu Ca.Eudormicrobiaceae, sem, eins og við komumst að, er ríkjandi í flestum hafsvæðum, sem og í allri vatnssúlunni (mynd 3d).Á staðnum eru þau 6% af örverusamfélagi sjávar, sem gerir þau að mikilvægum hluta af alþjóðlegri sjávarörveru.Að auki fundum við hlutfallslegt innihald Ca.Eudormicrobiaceae tegundir og BGC tjáning þeirra var hæst í heilkjörnungaauðgað hlutanum (mynd 3c og útbreidd gögn, mynd 7), sem gefur til kynna mögulega víxlverkun við svifryk, þ.mt svif.Þessi athugun minnir nokkuð á 'Ca.Eudoremicrobium BGCs sem framleiða frumudrepandi náttúruafurðir í gegnum þekkta ferla geta sýnt rándýra hegðun (viðbótarupplýsingar og útvíkkuð gögn, mynd 8), svipað og önnur rándýr sem framleiða sérstaklega umbrotsefni eins og Myxococcus41.Uppgötvun Ca.Eudormicrobiaceae í minna tiltækum (djúpsjávar) eða heilkjörnungasýnum frekar en dreifkjörnungasýnum geta útskýrt hvers vegna þessar bakteríur og óvæntur fjölbreytileiki BGC þeirra er enn óljós í samhengi við náttúrulegar fæðurannsóknir.
Á endanum reyndum við að sannreyna í tilraunaskyni loforð um vinnu okkar sem byggir á örverum við að uppgötva nýjar leiðir, ensím og náttúruvörur.Meðal mismunandi flokka BGCs er vitað að RiPP ferillinn kóðar ríkan efnafræðilegan og hagnýtan fjölbreytileika vegna ýmissa breytinga eftir þýðingu á kjarnapeptíðinu með þroskuðum ensímum42.Svo við völdum tvo 'Ca.Eudoremicrobium' RiPP BGCs (myndir 3b og 4a-e) eru byggðar á því sama og hvaða þekkta BGC (\(\bar{d}\)MIBiG og \(\bar{d}\)RefSeq fyrir ofan 0.2) .
a–c, In vitro ólík tjáning og in vitro ensímgreiningar á nýjum (\(\bar{d}\)RefSeq = 0.29) þyrping RiPP lífmyndunar sem er sértækur fyrir Ca tegundir í djúpsjávarum.E. malaspinii' leiddi til framleiðslu á tvífosfóruðum vörum.c, breytingar auðkenndar með því að nota háupplausn (HR) MS/MS (sundrun auðkennd með b og y jónum í efnafræðilegri uppbyggingu) og NMR (útvíkkuð gögn, mynd 9).d, þetta fosfórýleraða peptíð sýnir litla míkrómóla hömlun á daufkyrningaelastasa spendýra, sem er ekki að finna í viðmiðunarpeptíðinu og þurrkandi peptíðinu (þurrkun af völdum efnafjarlægingar).Tilraunin var endurtekin þrisvar sinnum með svipuðum árangri.Til dæmis skýrir misleit tjáning á annarri skáldsögu \(\bar{d}\)RefSeq = 0.33) þyrping próteinalífmyndunar virkni fjögurra þroskaðra ensíma sem breyta 46 amínósýrukjarnapeptíðinu.Leifar eru litaðar í samræmi við breytingarstað sem spáð er fyrir um með HR-MS/MS, samsætumerkingu og NMR greiningu (viðbótarupplýsingar).Litur með striki gefur til kynna að breytingin eigi sér stað á annarri hvorri af leifunum tveimur.Myndin er samansafn af fjölmörgum ólíkum smíðum til að sýna virkni allra þroskaðra ensíma á sama kjarna.h, mynd af NMR gögnum fyrir burðargrind amíð N-metýleringu.Heildar niðurstöður eru sýndar á mynd.10 með víðtækum gögnum.i, Fræðslufræðileg staða hins þroskaða FkbM próteinklasaensíms meðal allra FkbM léna sem finnast í MIBiG 2.0 gagnagrunninum sýnir ensím af þessari fjölskyldu með N-metýltransferasavirkni (viðbótarupplýsingar).Skýringarmyndir af BGCs (a, e), forvera peptíðbyggingar (b, f) og hugsanlega efnafræðilega uppbyggingu náttúruafurða (c, g) eru sýndar.
Fyrsta RiPP leiðin (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) fannst aðeins í djúpsjávartegundum „Ca.E. malaspinii“ og kóðar fyrir Peptíð-forvera (mynd 4a, b).Í þessu þroskaða ensími höfum við greint eitt starfhæft lén sem er sambærilegt við afvötnunarsvæði lantipeptíðsyntasa sem venjulega hvetur fosfórun og í kjölfarið fjarlægingu 43 (viðbótarupplýsingar).Þess vegna spáum við því að breytingin á forverapeptíðinu feli í sér slíka tveggja þrepa þurrkun.Hins vegar, með því að nota tandem massagreiningu (MS/MS) og kjarnasegulómun litrófsgreiningu (NMR), greindum við fjölfosfórýlerað línulegt peptíð (mynd 4c).Þó að það hafi verið óvænt fundum við nokkrar línur af sönnunargögnum til að styðja að hún sé lokaafurðin: tveir ólíkir ólíkir hýsilar og engin ofþornun í in vitro prófunum, auðkenning á lykilleifum sem stökkbreyttar eru í hvataþornunarstað hins þroskaða ensíms.allt endurbyggt af "Ca".E. malaspinii erfðamengi (útvíkkuð gögn, mynd 9 og viðbótarupplýsingar) og að lokum líffræðileg virkni fosfórýleruðu vörunnar, en ekki efnafræðilega tilbúna þurrkað form (mynd 4d).Reyndar komumst við að því að það sýnir litla míkrómolar próteasa hamlandi virkni gegn daufkyrninga elastasa, sambærilegt við aðrar skyldar náttúrulegar vörur á styrkleikabilinu (IC50 = 14,3 μM) 44, þrátt fyrir að vistfræðilegt hlutverk eigi eftir að skýrast.Byggt á þessum niðurstöðum leggjum við til að leiðin verði nefnd „fosfeptín“.
Annað tilvikið er flókin RiPP leið sem er sértæk fyrir 'Ca.Ættkvíslinni Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) var spáð að umrita náttúrulegar próteinafurðir (mynd 4e).Þessar leiðir hafa sérstakan líftæknilegan áhuga vegna væntanlegs þéttleika og fjölbreytni óvenjulegra efnafræðilegra breytinga sem koma fram með ensímum sem eru kóðaðar af tiltölulega stuttum BGCs45.Við komumst að því að þetta prótein er frábrugðið áður einkenndum próteinum að því leyti að það skortir bæði aðal NX5N mótíf pólýceramíðs og lantíónín lykkju landornamíðs 46 .Til að sigrast á takmörkunum á algengum ólíkum tjáningarmynstri notuðum við þau ásamt sérsniðnu Microvirgula aerodenitrificans kerfi til að einkenna fjögur þroskað ferli ensím (aðferðir).Með því að nota blöndu af MS/MS, samsætumerkingu og NMR, fundum við þessi þroskuðu ensím í 46 amínósýrukjarna peptíðsins (mynd 4f, g, stækkuð gögn, myndir 10-12 og viðbótarupplýsingar).Meðal þroskaðra ensíma, einkenndum við fyrstu birtingu FkbM O-metýltransferasa fjölskyldumeðlims 47 í RiPP ferlinu og komumst óvænt að því að þetta þroskaða ensím kynnir hryggjarlið N-metýleringu (mynd 4h, i og viðbótarupplýsingar).Þrátt fyrir að þessi breyting sé þekkt í náttúrulegum NRP48 vörum er ensím N-metýlering amíðtengja flókin en líftæknilega mikilvæg viðbrögð49 sem hefur hingað til verið áhugaverð fyrir RiPP fjölskyldu bórósína.Sértækni 50,51.Að bera kennsl á þessa virkni í öðrum fjölskyldum ensíma og RiPP gæti opnað fyrir nýjar notkunarmöguleika og aukið starfrænan fjölbreytileika próteina 52 og efnafræðilegan fjölbreytileika þeirra.Byggt á auðkenndum breytingum og óvenjulegri lengd fyrirhugaðrar vöruuppbyggingar, leggjum við til ferilheiti „pythonamide“.
Uppgötvun óvæntrar ensímfræði í hagnýtri ensímafjölskyldu sýnir loforð um erfðafræði umhverfisins fyrir nýjar uppgötvanir, og sýnir einnig takmarkaða getu til virkniályktunar sem byggist á samsvörun raða eingöngu.Þannig, ásamt skýrslum um ekki kanónísk lífvirk fjölfosfórýleruð RiPPs, sýna niðurstöður okkar auðlindafrekt en mikilvægt gildi fyrir tilbúna líffræði viðleitni til að afhjúpa að fullu hagnýtur auðlegð, fjölbreytileika og óvenjulega uppbyggingu lífefnafræðilegra efnasambanda.
Hér sýnum við fram á svið líffræðilegra möguleika sem eru kóðaðar af örverum og erfðafræðilegt samhengi þeirra í alþjóðlegu sjávarörverunni, sem auðveldar framtíðarrannsóknir með því að gera auðlindina sem myndast aðgengileg fyrir vísindasamfélagið (https://microbiomics.io/ocean/).Við komumst að því að mikið af sýklafræðilegri og hagnýtri nýjung þess er aðeins hægt að fá með því að endurbyggja MAGs og SAGs, sérstaklega í vannýttum örverusamfélögum sem gætu leiðbeint framtíðarleit í lífleit.Þó að við munum einbeita okkur hér að 'Ca.Eudormicrobiaceae“ sem ætterni, sérstaklega líffræðilega „hæfileikarík“, mörg af BGCs sem spáð er fyrir í óuppgötvuðu örverulífi kóða líklega áður ólýst ensímfræði sem gefa efnasambönd með umhverfislega og/eða líftæknilega mikilvægar aðgerðir.
Metagenomic gagnasöfn úr helstu haffræði- og tímaröðrannsóknum með nægilega raðdýpt voru innifalin til að hámarka umfang hnattrænna sjávarörverusamfélaga í hafsvæðum, djúpum lögum og með tímanum.Þessi gagnasöfn (aukatafla 1 og mynd 1) innihalda metagenomics úr sýnum sem safnað var í hafinu Tara (veiruauðgað, n=190; dreifkjörnungaauðgað, n=180)12,22 og BioGEOTRACES leiðangrinum (n=480).Hawaiian Oceanic Time Series (HOT, n = 68), Bermuda-Atlantic Time Series (BATS, n = 62)21 og Malaspina Expedition (n = 58)23.Raðgreiningarlestur úr öllum frummyndabrotum voru síaðar með tilliti til gæða með því að nota BBMap (v.38.71) með því að fjarlægja raðunarmillistykki úr lestri, fjarlægja lestur sem var kortlagður á gæðaeftirlitsraðir (PhiX erfðamengi) og nota trimq=14, maq=20 fleygir lélegum lesgæði, maxns = 0 og minlength = 45. Síðari greiningar voru keyrðar eða sameinaðar með QC lesum ef tilgreint er (bbmerge.sh minoverlap=16).QC mælingar voru staðlaðar (bbnorm.sh mark = 40, minddepth = 0) fyrir smíði með því að nota metaSPAdes (v.3.11.1 eða v.3.12 ef þörf krefur)53.Samstæður vinnupalla sem mynduðust (hér eftir nefndur vinnupallar) voru að lokum síaðir eftir lengd (≥1 kb).
1038 metagenomic sýnunum var skipt í hópa, og fyrir hvern hóp sýna voru metagenomic gæðaeftirlit af öllum sýnum pöruð við sviga hvers sýnis fyrir sig, sem leiddi til eftirfarandi fjölda aflestra hópa í parsvigum: Tara Marine Viruses – Enriched (190×190 ), Dreifkjörnunga auðgað (180×180), BioGEOTRACES, HOT og LEÐURLEGUR (610×610) og Malaspina (58×58).Kortlagning var gerð með því að nota Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 sem gerir kleift að passa lestur við aukasíður (með því að nota -a fána).Jafnréttir voru síaðar til að vera að minnsta kosti 45 basar að lengd, hafa ≥97% auðkenni og spanna ≥80% lestur.BAM skrárnar sem urðu til voru unnar með því að nota jgi_summarize_bam_contig_depths forskriftina fyrir MetaBAT2 (v.2.12.1)55 til að veita innan- og millisýnisþekju fyrir hvern hóp.Að lokum voru sviga flokkaðir til að auka næmni með því að keyra MetaBAT2 hvert fyrir sig á öllum sýnum með –minContig 2000 og –maxEdges 500. Við notum MetaBAT2 í stað ensemble boxer vegna þess að það hefur sýnt sig í óháðum prófum að það er áhrifaríkasti einstaki boxerinn.og 10 til 50 sinnum hraðar en aðrir almennt notaðir boxarar57.Til að prófa áhrif fylgni í magni, notaði handahófsvalið undirsýni af metagenomics (10 fyrir hvert Tara Ocean gagnasafna tveggja, 10 fyrir BioGEOTRACES, 5 fyrir hverja tímaröð og 5 fyrir Malaspina) að auki eingöngu sýni.Innri sýni eru flokkuð til að fá upplýsingar um umfjöllun.(Viðbótarupplýsingar).
Viðbótar (ytri) erfðamengi voru innifalin í síðari greiningu, þ.e. 830 handvirkt valin MAG úr undirmengi Tara Oceans26 gagnasafnsins, 5287 SAG úr GORG20 gagnasafninu og gögn úr MAR gagnagrunninum (MarDB v. 4) frá 1707 einangruðum REFs og 682 SAGs) 27. Fyrir MarDB gagnasafnið eru erfðamengi valin út frá tiltækum lýsigögnum ef sýnishornið passar við eftirfarandi reglulega tjáningu: '[S|s]ingle.?[C|c]ell|[C|c]culture| [I|i] einangrað'.
Gæði hvers metagenomic íláts og ytra erfðamengis voru metin með því að nota CheckM (v.1.0.13) og Anvi'o's Lineage Workflow (v.5.5.0)58,59.Ef CheckM eða Anvi'o tilkynnir um ≥50% heilleika/heilleika og ≤10% mengun/offramboð, vistaðu þá frumufrumur og ytri erfðamengi til síðari greiningar.Þessi stig voru síðan sameinuð í meðalheilleika (mcpl) og meðalmengun (mctn) til að flokka gæði erfðamengis samkvæmt samfélagsskilyrðum60 sem hér segir: hágæða: mcpl ≥ 90% og mctn ≤ 5%;góð gæði: mcpl ≥ 70%, mctn ≤ 10%, meðalgæði: mcpl ≥ 50% og mctn ≤ 10%, sanngjörn gæði: mcpl ≤ 90% eða mctn ≥ 10%.Síuð erfðamengi voru síðan tengd við gæðastig (Q og Q') sem hér segir: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (breytileiki stofns)/100 + 0,5 x log[N50] .(útfært í dRep61).
Til að leyfa samanburðargreiningu milli mismunandi gagnagjafa og erfðamengigerða (MAG, SAG og REF), var 34.799 erfðamengi vikið frá á grundvelli erfðamengis-breitt meðalkirniskenndar (ANI) með því að nota dRep (v.2.5.4).Endurtekið)61 með 95% ANI þröskuldum28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) og eintaksmerkjagen sem nota SpecI63 sem veitir erfðamengiþyrping á tegundastigi.Dæmigert erfðamengi var valið fyrir hvern dRep klasa í samræmi við hámarksgæðaskor (Q') sem skilgreint var hér að ofan, sem var talið dæmigert fyrir tegundina.
Til að meta kortlagningarhraðann var BWA (v.0.7.17-r1188, -a) notað til að kortleggja öll 1038 sett af metagenomic lesum með 34.799 erfðamengi sem eru í OMD.Gæðastýrðar aflestrar voru kortlagðar í einhliða stillingu og jöfnunin sem myndaðist voru síuð til að halda aðeins jöfnun ≥45 bp að lengd.og sjálfsmynd ≥95%.Sýningarhlutfallið fyrir hvert sýni er hlutfall aflestra sem eftir eru eftir síun deilt með heildarfjölda gæðaeftirlitslestra.Með því að nota sömu nálgun var hvert af 1038 metagenomunum minnkað í 5 milljón innskot (útvíkkuð gögn, mynd 1c) og passað við GORG SAG í OMD og í öllum GEM16.Magn MAG sem endurheimt var úr sjó í GEM16 vörulistanum var ákvarðað með leitarorðaspurningum um metagenomic heimildir, val á sjósýnum (td öfugt við sjávarsetlög).Nánar tiltekið veljum við „vatn“ sem „vistkerfisflokkur“, „haf“ sem „vistkerfisgerð“ og síum „búsvæði“ sem „djúphaf“, „haf“, „hafshaf“, „uppsjávarhaf“, „sjávarvatn“, „Haf“, „Sjór“, „Yfirborðssjór“, „Yfirborðssjór“.Þetta leiddi til 5903 MAG (734 hágæða) dreift yfir 1823 OTU (skoðanir hér).
Dreifkjörnunga erfðamengi voru flokkuð með því að nota GTDB-Tk (v.1.0.2)64 með sjálfgefnum breytum sem miða að GTDB r89 útgáfu 13. Anvi'o var notað til að bera kennsl á heilkjörnunga erfðamengi byggt á lénsspá og innköllun ≥50% og offramboð ≤ 10%.Flokkunarfræðileg skýring tegundar er skilgreind sem eitt af dæmigerðum erfðamengi hennar.Að undanskildum heilkjörnungum (148 MAG), var hvert erfðamengi fyrst merkt með virkni með því að nota prokka (v.1.14.5)65, þar sem heill gen voru nefnd, skilgreind „archaea“ eða „bakteríur“ breytur eftir þörfum, sem einnig er greint frá fyrir ekki kóða gen.og CRISPR svæði, meðal annarra erfðafræðilegra eiginleika.Skýrðu spáð gen með því að auðkenna alhliða eintaksmerkjagen (uscMG) með því að nota fetchMG (v.1.2)66, úthluta réttvísunarhópum og spyrjast fyrir með því að nota emapper (v.2.0.1)67 byggt á eggNOG (v.5.0)68.KEGG gagnagrunnur (birt 10. febrúar 2020) 69. Síðasta skrefið var gert með því að passa prótein við KEGG gagnagrunninn með því að nota DIAMOND (v.0.9.30)70 með fyrirspurn og umfjöllun um efni sem er ≥70%.Niðurstöður voru síaðar frekar í samræmi við NCBI Prokaryotic Genome Annotation Pipeline71 byggða á bitahraða ≥ 50% af hámarks áætlaðri bitahraða (tengilið sjálft).Genaraðir voru einnig notaðar sem inntak til að bera kennsl á BGC í erfðamenginu með því að nota antiSMASH (v.5.1.0)72 með sjálfgefnum breytum og mismunandi klasasprengingum.Öll erfðamengi og skýringar hafa verið safnað saman í OMD ásamt samhengislýsigögnum sem eru fáanleg á vefnum (https://microbiomics.io/ocean/).
Svipað og áður lýstar aðferðir12,22 notuðum við CD-HIT (v.4.8.1) til að klasa >56,6 milljónir próteinkóða gena úr bakteríum og fornleifa erfðamengi frá OMD í 95% auðkenni og styttri gen (90% þekju)73 upp til >17,7 milljónir genaþyrpinga.Lengsta röðin var valin sem dæmigerð gen fyrir hvern genaklasa.1038 metagenomin voru síðan pöruð við >17,7 milljónir BWA (-a) þyrpingameðlima og BAM skrárnar sem urðu til voru síaðar til að halda aðeins röðun með ≥95% prósent auðkenni og ≥45 grunnlínur.Lengd eðlilegt genamagn var reiknað út með því að telja fyrst innskot úr bestu einstöku röðuninni og síðan, fyrir óskýrt kortlögð innskot, að bæta brotafjölda við samsvarandi markgen í réttu hlutfalli við fjölda einstaka innskots þeirra.
Erfðamengi frá stækkuðu OMD (með viðbótar MAG frá "Ca. Eudormicrobiaceae", sjá hér að neðan) var bætt við mOTUs74 metagenomic greiningar tól gagnagrunninum (v.2.5.1) til að búa til aukinn mOTU viðmiðunargagnagrunn.Aðeins sex eintaks erfðamengi (23.528 erfðamengi) lifðu af tíu uscMG.Stækkun gagnagrunnsins leiddi til 4.494 viðbótarþyrpinga á tegundastigi.1038 metagenom voru greind með sjálfgefnum mOTU breytum (v.2).Alls 989 erfðamengi í 644 mOTU klösum (95% REF, 5% SAG og 99,9% tilheyra MarDB) greindust ekki af mOTU prófílnum.Þetta endurspeglar ýmsar viðbótaruppsprettur sjávareinangrunar MarDB erfðamengisins (flest ógreind erfðamengi eru tengd lífverum sem eru einangraðar úr seti, sjávarhýslum osfrv.).Til að halda áfram að einbeita okkur að umhverfi opins hafs í þessari rannsókn, útilokuðum við þá frá niðurstreymisgreiningunni nema þeir greindust eða voru teknir með í útvíkkaða mOTU gagnagrunninum sem búið var til í þessari rannsókn.
Öll BGCs frá MAG, SAG og REF í OMD (sjá hér að ofan) voru sameinuð með BGCs sem greindust í öllum metagenomic vinnupallum (antiSMASH v.5.0, sjálfgefna breytur) og einkennd með BiG-SLICE (v.1.1) (PFAM domain )75.Byggt á þessum eiginleikum reiknuðum við allar kósínusfjarlægðir milli BGCs og flokkuðum þær (meðaltengsl) í GCF og GCC með því að nota fjarlægðarþröskuld 0,2 og 0,8 í sömu röð.Þessir þröskuldar eru aðlögun þröskulda sem áður voru notuð með því að nota Euclidean distance75 ásamt kósínusfjarlægð, sem dregur úr villunni í upprunalegu BiG-SLICE klasastefnunni (viðbótarupplýsingar).
BGCs voru síðan síuð til að halda aðeins ≥5 kb kóðuð á vinnupallum til að draga úr hættu á sundrun eins og áður hefur verið lýst16 og til að útiloka MarDB REFs og SAGs sem ekki finnast í 1038 metagenomum (sjá hér að ofan).Þetta leiddi til þess að samtals 39.055 BGCs voru kóðuð af OMD erfðamengi, með 14.106 til viðbótar auðkennd á metagenomic brotum (þ.e. ekki sameinuð í MAGs).Þessar „metagenomic“ BGCs voru notaðar til að áætla hlutfall lífmyndunarmöguleika sjávar örvera sem ekki er fangað í gagnagrunninum (viðbótarupplýsingar).Hvert BGC var virknilega einkennt í samræmi við forspárvörutegundir skilgreindar með anti-SMASH eða grófari vöruflokkum skilgreindum í BiG-SCAPE76.Til að koma í veg fyrir hlutdrægni sýnatöku í magngreiningu (flokkunarfræðileg og starfræn samsetning GCC/GCF, fjarlægð GCF og GCC til viðmiðunargagnagrunna og metagenomic gnægð GCF), með því að halda aðeins lengsta BGC á GCF fyrir hverja tegund, voru 39.055 BGCs aftvífölduð frekar, sem skilaði sér í samtals 17.689 BGC.
Nýnæmi GCC og GCF var metið út frá fjarlægðinni milli reiknaðs gagnagrunns (RefSeq gagnagrunnur í BiG-FAM)29 og tilraunastaðfestu (MIBIG 2.0)30 BGC.Fyrir hverja 17.689 fulltrúa BGCs völdum við minnstu kósínusfjarlægð til viðkomandi gagnagrunns.Þessar lágmarksfjarlægðir eru síðan meðaltal (meðaltal) samkvæmt GCF eða GCC, eftir því sem við á.GCF telst nýr ef fjarlægðin til gagnagrunnsins er meiri en 0,2, sem samsvarar ákjósanlegri aðskilnað á milli (meðal) GCF og tilvísunarinnar.Fyrir GCC veljum við 0,4, sem er tvöfalt viðmiðunarmörkin sem skilgreind er af GCF, til að læsa langtímasambandi við tengla.
Metagenomic gnægð BGC var metið sem meðalmagn líffræðilegra gena þess (eins og ákvarðað er af and-SMASH) sem er fáanlegt frá genastigsprófílum.Metagenomic gnægð hvers GCF eða GCC var síðan reiknuð út sem summa dæmigerðra BGCs (af 17.689).Þessar gnægðarkort voru síðan staðlaðar fyrir frumusamsetningu með því að nota mOTU-fjöldann á sýni, sem einnig tók fyrir raðgreiningarviðleitni (útvíkkuð gögn, mynd 1d).Algengi GCF eða GCC var reiknað út sem hlutfall sýna með gnægð > 0.
Evklíðska fjarlægðin milli sýna var reiknuð út frá staðlaða GCF sniðinu.Þessar vegalengdir voru minnkaðar að stærð með því að nota UMAP77 og innfellingarnar sem urðu til voru notaðar fyrir þéttleika byggða þyrping án eftirlits með því að nota HDBSCAN78.Besti lágmarksfjöldi punkta fyrir klasa (og þar af leiðandi fjöldi klasa) sem HDBSCAN notar er ákvarðaður með því að hámarka uppsafnaðar líkur á aðild að klasa.Greindu klasarnir (og tilviljunarkennt jafnvægis undirúrtak þessara klasa til að gera grein fyrir hlutdrægni í margbreytilegri dreifigreiningu (PERMANOVA)) voru prófuð með tilliti til marktektar á móti óminnkuðum evklíðum fjarlægðum með því að nota PERMANOVA.Meðalstærð erfðamengis sýnanna var reiknuð út frá hlutfallslegu magni mOTU og áætlaðri erfðamengisstærð meðlima erfðamenganna.Sérstaklega var meðalerfðamengisstærð hvers mOTU metin sem meðaltal erfðamengisstærða meðlima þess leiðrétt fyrir heilleika (eftir síun) (td 75% heilt erfðamengi með lengd 3 Mb hefur aðlagaða stærð upp á 4 Mb).fyrir miðlungs erfðamengi með heilleika ≥70%.Meðalstærð erfðamengis fyrir hvert sýni var síðan reiknuð út sem summa mOTU erfðamengisstærða vegin með hlutfallslegu magni.
Síuð mengi erfðamengiskóðaðra BGCs í OMD er sýnt í bakteríu- og fornleifa-GTDB-trjám (í ≥5 kb ramma, að undanskildum REF og SAG MarDB sem finnast ekki í 1038 metagenomum, sjá hér að ofan) og spáð vöruflokkum þeirra á grundvelli fylgjenda. stöðu erfðamengisins (sjá hér að ofan).Við minnkuðum fyrst gögnin eftir tegundum og notuðum erfðamengið með flest BGCs í þeirri tegund sem dæmigert.Til að sýna fram á var fulltrúanum frekar skipt í trjáhópa og aftur, fyrir hverja frumuklaða, var erfðamengið sem innihélt mestan fjölda BGCs valið sem fulltrúi.BGC-auðgaðar tegundir (að minnsta kosti eitt erfðamengi með >15 BGCs) voru greindar frekar með því að reikna Shannon Diversity Index fyrir vörutegundirnar sem eru kóðaðar í þessum BGCs.Ef allar spáð vörutegundir eru þær sömu, eru efnablendingar og önnur flókin BGCs (eins og and-SMAH spáð fyrir um) talin tilheyra sömu vörutegund, óháð röð þeirra í klasanum (td prótein-bakteríósín og samruni bakteríusíns og próteópróteins líkami).blendingur).
Eftirstöðvar DNA (áætlað vera 6 ng) úr Malaspina sýni MP1648, sem samsvarar lífsýni SAMN05421555 og passað við Illumina SRR3962772 metagenomic lessett fyrir stuttan lestur, unnið í samræmi við PacBio raðgreiningarreglur með ofurlítið inntak til að nota PacBio sýni gDNA pakka sett (100-980-000) og SMRTbell Express 2.0 sniðmát undirbúningssett (100-938-900).Í stuttu máli var DNA sem eftir var skorið, gert við og hreinsað (ProNex perlur) með því að nota Covaris (g-TUBE, 52104).Hreinsað DNA er síðan undirbúið safn, mögnun, hreinsun (ProNex perlur) og stærðarval (>6 kb, Blue Pippin) fyrir lokahreinsunarskref (ProNex perlur) og raðgreiningu á Sequel II pallinum.
Endurbygging fyrstu tveggja ca.Fyrir MAG Eremiobacterota greindum við sex auka ANI >99% (þessir eru innifaldir á mynd 3), sem voru upphaflega síuð út frá mengunarstigum (síðar auðkennd sem genafrit, sjá hér að neðan).Við fundum líka bakka merktan „Ca“.Eremiobacterota“ úr ýmsum rannsóknum23 og notaði þau ásamt átta MAG úr rannsókninni okkar sem viðmiðun fyrir metagenomic lestur úr 633 heilkjörnungaauðguðu (>0,8 µm) sýnum með því að nota BWA (v.0.7.17) Ref -r1188, – a flag) fyrir niðursýni. kortlagning (5 milljónir lestra).Byggt á auðgunarsértækum kortum (síuð eftir 95% samröðunarauðkenni og 80% lesþekju), voru 10 metagenom (vænt umfang ≥5×) valin til samsetningar og 49 metagenom til viðbótar (vænt umfang ≥1×) fyrir innihaldsfylgni.Með því að nota sömu færibreytur og hér að ofan voru þessi sýni sett í geymslu og 10 „Ca“ til viðbótar bætt við.MAG Eremiobacterota hefur verið endurreist.Þessir 16 MAG (þeir tveir sem þegar eru í gagnagrunninum eru ekki taldir með) færa heildarfjölda erfðamengja í stækkuðu OMD í 34.815.MAG er úthlutað flokkunarfræðilegum röðum út frá erfðafræðilegum líkt og stöðu í GTDB.18 MAG voru afmynduð með því að nota dRep í 5 tegundir (innafsértækur ANI >99%) og 3 ættkvíslir (innrænn ANI 85% til 94%) innan sömu fjölskyldu79.Fulltrúar tegunda voru handvirkt valdir á grundvelli heilleika, mengunar og N50.Tillögur að nafnakerfi er að finna í viðbótarupplýsingunum.
Metið heilleika og mengun 'Ca.MAG Eremiobacterota, við metum nærveru uscMG, sem og ættar- og lénssértæk eintaksmerkja genasett sem CheckM og Anvi'o notuðu.Auðkenningin á 2 afritum af 40 uscMGs var staðfest með enduruppbyggingu (sjá hér að neðan) til að útiloka hugsanlega mengun (þetta samsvarar 5% miðað við þessi 40 merkigen).Viðbótarrannsókn á fimm fulltrúa MAGs 'Ca.Lágt magn mengunarefna í þessum endurgerðu erfðamengi var staðfest fyrir Eremiobacterota tegundir með því að nota gagnvirka Anvi'o viðmótið byggt á gnægð og raðsamsetningu fylgni (viðbótarupplýsingar)59.
Til greiningar á sýklafræði völdum við fimm dæmigerða MAG „Ca“.Eudormicrobiaceae“, allar tegundir „Ca.Erfðamengi Eremiobacterota og meðlima annarra phyla (þar á meðal UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria og Planctomycetota) er fáanlegt frá GTDB (r89)13.Öll þessi erfðamengi voru merkt eins og áður hefur verið lýst fyrir einnafritsmerkja genaútdrátt og BGC skýringu.GTDB erfðamengi voru varðveitt samkvæmt ofangreindum heilleika og mengunarviðmiðum.Fræðslugreining var framkvæmd með því að nota Anvi'o Phylogenetics59 vinnuflæðið.Tréð var smíðað með því að nota IQTREE (v.2.0.3) (sjálfgefin valmöguleikar og -bb 1000)80 á röðun 39 ríbósómala próteina sem Anvi'o (MUSCLE, v.3.8.1551)81 skilgreindi.Stöðum hans var fækkað.til að þekja að minnsta kosti 50% af erfðamenginu82 og Planctomycecota var notað sem úthópur byggður á GTDB trjágrunnfræði.Eitt tré af 40 uscMG var byggt með sömu verkfærum og breytum.
Við notuðum Traitar (v.1.1.2) með sjálfgefnum breytum (svipgerð, frá núkleótíðum)83 til að spá fyrir um algenga örverueiginleika.Við könnuðum hugsanlegan rándýran lífsstíl sem byggist á áður þróaðri rándýravísitölu84 sem er háður innihaldi próteinkóða gena í erfðamenginu.Nánar tiltekið notum við DIAMOND til að bera saman prótein í erfðamenginu við OrthoMCL gagnagrunninn (v.4)85 með því að nota valkostina –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 OG telja genin sem samsvara merkjagenin fyrir rándýr og ekki rándýr.Vísitalan er munurinn á fjölda rándýrra og órándýrra merkinga.Sem viðbótareftirlit greindum við einnig „Ca“ erfðamengið.Entotheonella TSY118 þátturinn er byggður á tengslum hans við Ca.Eudoremicrobium (stór erfðamengisstærð og lífmyndunarmöguleiki).Næst prófuðum við hugsanleg tengsl milli rándýra og rándýra merkja gena og lífmyndunarmöguleika Ca.Eudormicrobiaceae“ og komst að því að ekki meira en eitt gen (frá hvaða tegund merkigena sem er, þ.e. rándýrs-/non-rándýrsgen) skarast við BGC, sem bendir til þess að BGC rugli ekki ránboðsmerkjum.Viðbótar erfðafræðileg skýring á sprændu eftirmyndum var framkvæmd með því að nota TXSSCAN (v.1.0.2) til að kanna sérstaklega seytingarkerfið, pili og flagella86.
Fimm dæmigerð 'Ca' voru kortlögð með því að kortleggja 623 metatrunscriptome frá dreifkjörnunga- og heilkjörnungaauðgunarhlutum Tara-hafanna22,40,87 (með því að nota BWA, v.0.7.17-r1188, -a fána).Eudormicrobiaceae erfðamengi.BAM skrár voru unnar með FeatureCounts (v.2.0.1)88 eftir 80% lestrarumfjöllun og 95% auðkennissíun (með valkostum featureCounts -primary -O -fraction -t CDS,tRNA -F GTF -g ID -p ) Telur fjölda innskots á hvert gen.Kortin sem mynduð voru voru staðlað fyrir genalengd og genamagn merkja mOTU (lengd-normalized meðaltal innsetningar fyrir gena með innsetningarfjölda >0) og log-umbreytt í 22,74 til að fá hlutfallslega tjáningu á hverja frumu hvers genastigs, sem einnig útskýrir breytileiki frá sýni til sýnis meðan á raðgreiningu stendur.Slík hlutföll leyfa samanburðargreiningu og draga úr samsetningarvandamálum þegar notuð eru hlutfallsleg gnægðsgögn.Aðeins sýni með >5 af 10 mOTU merkargenunum voru tekin til greina til frekari greiningar til að hægt væri að greina nógu stóran hluta af erfðamenginu.
Staðlað umskriftarsnið 'Ca.E. taraoceanii var undirgefinn víddarminnkun með því að nota UMAP og framsetningin sem varð til var notuð fyrir þyrping án eftirlits með því að nota HDBSCAN (sjá hér að ofan) til að ákvarða tjáningarstöðu.PERMANOVA prófar þýðingu mismunar milli auðkenndra þyrpinga í upprunalegu (ekki minnkaða) fjarlægðarrými.Mismunandi tjáning á milli þessara skilyrða var prófuð yfir erfðamenginu (sjá hér að ofan) og 201 KEGG ferlar voru auðkenndir í 6 virkum hópum, þ.e.: BGC, seytingarkerfi og flagellar gen frá TXSSCAN, niðurbrotsensími (próteasa og peptíðasar), og rándýr og ó- rándýr gen.rándýr vísitölumerki.Fyrir hvert sýni reiknuðum við út miðgildi staðlaðrar tjáningar fyrir hvern flokk (athugið að BGC tjáning sjálf er reiknuð sem miðgildi tjáningar líffræðilegra gena fyrir það BGC) og prófuð með tilliti til vægis milli ríkja (Kruskal-Wallis próf leiðrétt fyrir FDR).
Tilbúin gen voru keypt frá GenScript og PCR primers voru keyptir frá Microsynth.Phusion pólýmerasi frá Thermo Fisher Scientific var notaður til DNA mögnunar.NucleoSpin plasmíð, NucleoSpin hlaup og PCR hreinsunarsett frá Macherey-Nagel voru notuð við DNA hreinsun.Takmörkunarensím og T4 DNA lígasi voru keyptir frá New England Biolabs.Önnur efni en ísóprópýl-β-d-1-þíógalaktópýranósíð (IPTG) (Biosynth) og 1,4-dithiothreitol (DTT, AppliChem) voru keypt frá Sigma-Aldrich og notuð án frekari hreinsunar.Sýklalyfin klóramfenikól (Cm), spectinomycin díhýdróklóríð (Sm), ampicillin (Amp), gentamicin (Gt) og carbenicillin (Cbn) voru keypt frá AppliChem.Bacto Tryptone og Bacto Yeast Extract efnishlutir voru keyptir frá BD Biosciences.Trypsín til raðgreiningar var keypt frá Promega.
Genaröð voru dregin út úr and-SMASH spáð BGC 75.1.E. malaspinii (Viðbótarupplýsingar).
Genin embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), og embAM (þar á meðal milligena svæði án samsettra gena) voru smíðuð með samsmíðuðum 5 genasvæðum í pUC7 notað til tjáningar í E hvenær.embA genið var undirklónað inn í fyrsta fjölklónunarstaðinn (MCS1) pACYCDuet-1(CmR) og pCDFDuet-1(SmR) með BamHI og HindIII klofningsstöðum.embM og embMopt genin (kódon-bjartsýni) voru undirklónuð inn í MCS1 pCDFDuet-1(SmR) með BamHI og HindIII og sett í annan fjölklónunarstað pCDFDuet-1(SmR) og pRSFDuet-1(KanR) (MCS2) með NdeI/ChoI.embAM snældan var undirklónuð inn í pCDFDuet1(SmR) með BamHI og HindIII klofningsstöðum.Orf3/embI genið (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) var smíðað með PCR skarast framlengingu með því að nota primers EmbI_OE_F_NdeI og EmbI_OE_R_XhoI, melt með NdeI/XhoI, og bundið inn í sama takmarkaða ensímið (MCD-1) óhefðbundið borð).6).Takmörkunarensímmelting og binding var framkvæmd samkvæmt samskiptareglum framleiðanda (New England Biolabs).
Pósttími: 14. mars 2023