banner
Nachrichtenzentrum
Schlank und modern

Untersuchung der viralen dunklen Materie des Pansen-Ökosystems mit einer globalen Virom-Datenbank

Jun 18, 2023

Nature Communications Band 14, Artikelnummer: 5254 (2023) Diesen Artikel zitieren

331 Zugriffe

8 Altmetrisch

Details zu den Metriken

Das vielfältige Pansenvirom kann das Pansenmikrobiom modulieren, ist jedoch noch weitgehend unerforscht. Hier durchsuchen wir 975 veröffentlichte Pansenmetagenome nach Virussequenzen, erstellen eine globale Pansenviromdatenbank (RVD) und analysieren das Pansenvirom auf Diversität, Virus-Wirt-Verbindungen und mögliche Rollen bei der Beeinflussung der Pansenfunktionen. RVD enthält 397.180 virale operative taxonomische Einheiten (vOTUs) auf Artenebene und erhöht die Erkennungsrate von Pansenviren aus Metagenomen im Vergleich zu IMG/VR V3 erheblich. Die meisten der klassifizierten vOTUs gehören zu Caudovirales und unterscheiden sich von denen, die im menschlichen Darm vorkommen. Man geht davon aus, dass das Pansenvirom das Kernmikrobiom des Pansens, einschließlich Faserabbauern und Methanogenen, infiziert, verschiedene zusätzliche Stoffwechselgene trägt und sich daher wahrscheinlich sowohl von oben als auch von unten nach oben auf das Pansenökosystem auswirkt. RVD und die Ergebnisse stellen nützliche Ressourcen und einen Grundrahmen für zukünftige Forschungen dar, um zu untersuchen, wie Viren das Pansen-Ökosystem und die Verdauungsphysiologie beeinflussen können.

Eine Reihe aktueller virusfokussierter metagenomischer Studien hat sehr große virale Genomkataloge und Datenbanken für mehrere Ökosysteme erstellt, darunter Meeresviren1,2, den menschlichen Darm3,4,5 und den Boden6. Sie enthüllten äußerst unterschiedliche Virome, identifizierten zahlreiche metabolische Hilfsgene und warfen ein neues Licht auf die ökologischen Auswirkungen von Viren. Darüber hinaus haben modellsystemorientierte Studien begonnen aufzudecken, wie Viren den Stoffwechsel ihrer prokaryotischen Wirte neu programmieren können, indem sie unterschiedliche Virozellen bilden, die die ökologische Fitness und den Stoffwechsel der Wirte verändern7. Neue Erkenntnisse belegen die möglichen Auswirkungen von Viren auf die Biogeochemie der Ozeane1,8, die menschliche Physiologie4 und Krankheitszustände9. Es liegen keine vergleichbaren Studien zum Pansenvirom oder zur pansenspezifischen Viromdatenbank vor.

Der Pansen beherbergt ein vielfältiges Ökosystem mit mehreren Königreichen, das Bakterien, Archaeen, Pilze, Protozoen und Viren enthält. Insgesamt verdaut und fermentiert das Pansenmikrobiom ansonsten unverdauliche Futtermittel und liefert den Großteil der Energie (in Form von flüchtigen Fettsäuren) und des metabolisierbaren Stickstoffs (in Form von mikrobiellem Protein), die Wiederkäuer zum Wachstum und zur Produktion von Fleisch und Milch benötigen. Es wurden starke Zusammenhänge zwischen Pansenbakterien, Archaeen und Protozoen mit Futtereffizienz, Methan (CH4)-Emissionen und Tiergesundheit dokumentiert10, aber Pansenviren sind ungeachtet ihrer Häufigkeit immer noch kaum verstanden, obwohl virusfokussierte Studien zur Charakterisierung des Pansens beigetragen haben virom11,12. Frühe Studien mittels Elektronenmikroskopie dokumentierten morphologisch unterschiedliche Bakteriophagen und zeigten das Vorherrschen von Schwanzphagen13,14. Frühe kulturabhängige Studien fanden Bakteriophagen, die ein breites Spektrum an Arten oder Stämmen von Pansenbakterien infizieren konnten, darunter die vorherrschenden Arten von Prevotella, Ruminococcus und Streptococcus, und klassifizierten die meisten dieser Phagen anhand ihrer Morphologie in die Familien Myoviridae, Siphoviridae und Podoviridae und Inoviridae (rezensiert von Gilbert und Klieve15). Obwohl diese Studien wertvolle Informationen über Pansenviren lieferten, erlauben die einfachen Morphologien von Phagen keine zuverlässige taxonomische Klassifizierung, und daher erkennt das Internationale Komitee für Taxonomie von Viren (ICTV: https://ictv.global/taxonomy) die Morphologie nicht mehr an. basierende Virenklassifizierung.

Genomik, Metagenomik und Metatranskriptomik sind zu den Haupttechnologien für die Untersuchung von Viromen, einschließlich des Pansenviroms, geworden. Kürzlich durchgeführte kulturabhängige Sequenzierung des gesamten Genoms identifizierte 10 Phagen, die Prevotella ruminicola, Ruminococcus albus, Streptococcus bovis und Butyrivibrio fibrisolvens16,17 infizieren und eine wichtige Rolle bei der Futterverdauung und Fermentation spielen. Diese Phagengenome weisen eine modulare genomische Organisation, konservierte virale Gene und das Potenzial auf, sowohl lytisch als auch lysogen zu sein17. Pansenviren wurden auch anhand von Metagenomen virusähnlicher Partikel (VLPs) untersucht (Übersicht in 11). Allerdings sind Pansenviren in den verwendeten Referenzgenomdatenbanken unterrepräsentiert, was die Identifizierung und Klassifizierung von Pansenviren und die Vorhersage ihres Wirts einschränkt. Beispielsweise wurden Pansenviren mit unterschiedlichen Genotypen gefunden, die meisten von ihnen wurden jedoch aufgrund fehlender Übereinstimmungen mit Referenzvirensequenzen nicht klassifiziert18,19,20. Miller et al.18 fanden in einigen mikrobiellen Genomen und Metagenomen des Pansens geclusterte, regelmäßig beabstandete Short Palindromic Repeat (CRISPR)/CRISPR-assoziierte Protein (Cas)-Elemente, fanden jedoch nur wenige Spacer-Sequenzen, die mit Pansen-Virussequenzen zur Wirtsvorhersage übereinstimmten. Daher war es schwierig, das Pansenvirom zu charakterisieren, insbesondere bei neuartigen Viren.

Neuere Bioinformatik-Tools speziell für die Virusanalyse (z. B. CheckV21, VirSorter222 und VIBRANT23) und zunehmende genomische Ressourcen (z. B. efam24) erleichtern die Virusidentifizierung anhand metagenomischer Sequenzen erheblich, und Organisationsstrategien im Sequenzraum ermöglichen eine skalierbare Virusklassifizierung25 und Taxonomie26. Diese Tools ermöglichten die Entwicklung großer nischenspezifischer Viromdatenbanken1,5 und umfassender globaler Viromstudien27. Mithilfe der metagenomischen Sequenzierung und der oben genannten bioinformatischen Tools identifizierten zwei aktuelle Studien verschiedene Pansenviren und untersuchten ihre Auswirkungen auf die Ernährung28,29. Diese beiden Studien mit kleinen Stichprobengrößen (fünf Rinderochsen29 oder ein Elch28) identifizierten etwa 2000 Viruspopulationen (eindeutige Contigs) eines vielfältigen Pansenviroms und dessen potenzielle Bedeutung für das Pansenökosystem. Angesichts der noch jungen Natur des Feldes überrascht es nicht, dass die Fähigkeit, Wirte dieser Viruspopulationen vorherzusagen, gering war (Wirte wurden nur für 3 Viruspopulationen auf der Phylum-Ebene29 und 113 Viruspopulationen auf der MAG-Ebene vorhergesagt28). Motiviert durch umfassende Viromstudien3,4,5 und unter Nutzung der vielen öffentlich verfügbaren Pansen-Metagenom-Datensätze wollten wir das globale Pansen-Virom analysieren, indem wir 20 TB Sequenzdaten aus fast 1000 Metagenom-Datensätzen verschiedener Wiederkäuer, sowohl domestizierter als auch wilder, über 5 hinweg analysierten Kontinente. Wir haben eine systematisch katalogisierte Pansenvirom-Datenbank (RVD) entwickelt, die fast 400.000 virale operative taxonomische Einheiten (vOTUs) auf Artenebene enthält, haben das zentrale Pansenvirom untersucht, Bakterien, Archaeen und Protozoen vorhergesagt, die die identifizierten Viren wahrscheinlich infizieren werden, und daraus abgeleitet die potenziellen ökologischen Rollen der Pansenviren anhand von Hilfsstoffwechselgenen (AMGs) und antimikrobiellen Resistenzgenen (ARGs), die von den Pansenvirusgenomen getragen werden. Wir haben RVD auch getestet, um festzustellen, ob es die Identifizierung von Viren anhand metagenomischer Sequenzen verbessern kann. Durch die Erweiterung der Vielfalt der in NCBI RefSeq Viral erfassten Pansenviren (um das >12-fache) und IMG/VR V3 und die Verbesserung der Identifizierung viraler Sequenzen auf der Grundlage der Pansenmetagenomik wird RVD als neue Community-Ressource nützlich sein und neue Erkenntnisse liefern für zukünftige Studien zum Pansenvirom und seinen Auswirkungen auf die Futterverdauung, die mikrobielle Proteinsynthese, die Futtereffizienz und die CH4-Emissionen.

Mithilfe modernster bioinformatischer Tools (ergänzende Abbildung 1) haben wir das globale Pansenvirom charakterisiert, indem wir 20 TB Sequenzen analysierten, die aus 975 Pansenmetagenomen (ergänzende Daten 1) abgeleitet wurden, die von 13 Wiederkäuerarten oder verschiedenen Haltungssystemen entnommen wurden in 8 Ländern auf 5 Kontinenten (Abb. 1a, b). Den Empfehlungen eines aktuellen Viromics-Benchmarking-Papiers30 folgend und strengen Kriterien folgend, identifizierten wir 705.380 mutmaßliche virale Contigs mit jeweils >5 kb und gruppierten sie in 411.125 vOTUs. Nach der Validierung mit VIBRANT23 haben wir eine Pansenviromdatenbank (RVD, Download verfügbar unter https://zenodo.org/record/7412085#.ZDsE2XbMK5c) erstellt, die 397.180 vOTUs (ergänzende Abbildung 1) mit 193.327 vOTUs von> 10 kb darstellt. Die Überprüfung mit CheckV21 ergab 4400 vollständige vOTUs, 4396 vOTUs hoher Qualität und 32.942 vOTUs mittlerer Qualität. Die Vollständigkeit und Qualität der RVD-vOTUs wurden wahrscheinlich unterschätzt, da CheckV datenbankabhängig ist und die verwendeten Datenbanken hauptsächlich aus anderen Ökosystemen stammen. Alle vOTUs in RVD erfüllen die MIUViG-Standards (Uncultivated Virus Genome)25.

a Eine globale Heatmap, die die geografische Verteilung der 975 Pansenmetagenome zeigt. b Anzahl der Pansenmetagenome verschiedener Wiederkäuerarten oder Produktionsbetriebe.

Wir konnten 1.857 vOTUs (0,47 % der Gesamtzahl) als zu bestehenden Gattungen gehörend und 32.934 vOTUs (8,3 %) zu bestehenden Familien klassifizieren (Supplementary Data 2). Die meisten der Gattung und Familie zuordenbaren vOTUs (98,4 %) wurden Siphoviridae, Myoviridae oder Podoviridae in der Reihenfolge Caudovirales zugeordnet (Abb. 2a, b), die auch die am häufigsten vorkommenden Familien im menschlichen Darmvirom sind5. Verglichen mit einem phylogenetischen Baum (Abb. 2c) teilten die menschlichen und Pansenvirome nur 14 % der Taxa auf Gattungsebene von Caudovirales (Abb. 2d), was die Divergenz zwischen den beiden Arten von Viromen widerspiegelt. Die verbleibenden vOTUs (91,7 % der Gesamtzahl) konnten keiner bestehenden Gattung oder Familie zugeordnet werden und stellen somit neue Abstammungslinien dar. Darüber hinaus wurden 121 vOTUs (0,03 %) als crAss-ähnliche Viren identifiziert. RVD enthält auch Protozoenviren (oder endogene virale Elemente, EVEs), von denen einige den Phycodnaviridae, Mimiviridae und Retroviridae zugeordnet wurden. Es wurde vorhergesagt, dass einige der Pansenviren Pansenarchaeen (also Archaephagen) infizieren. Obwohl die Metagenome hauptsächlich aus dsDNA bestanden, identifizierten wir auch 109 vOTUs als ssDNA-Viren. Alle wurden der Familie Microviridae zugeordnet. Die Rarefaktionsanalyse (Abb. 2e) ergab, dass noch weitere Pansenviren identifiziert werden müssen.

a Taxonomie auf Familienebene und Anteil der Pansenviren in der Pansenviromdatenbank RVD). Die meisten vOTUs (99,7 %), die bestehenden Gattungen oder Familien zugeordnet wurden, gehörten zur Ordnung der Caudovirales, darunter 121 identifizierte crAss-ähnliche Phagen. Detaillierte taxonomische Zuordnungen einzelner vOTUs werden in den Zusatzdaten 2 dargestellt. b Taxonomie auf Gattungsebene und Anteil der 1.858 vOTUs, die mit vConTACT2 bestehenden Gattungen oder Familien zugeordnet werden könnten. c Ein phylogenetischer Baum von Caudovirales-Viren, der aus 77 verketteten Markergenen besteht, die in 10.203 vOTUs mit einer Vollständigkeit von >50 % der aktuellen Studie und den beiden größten Datenbanken für menschliche Darmvirome (MGV4 und GPD5) identifiziert wurden. Zur besseren Visualisierung wurde für jede vOTU auf Gattungsebene (insgesamt 714) nur eine repräsentative vOTU (die längste und vollständigste) einbezogen. Die Zweige waren farblich gekennzeichnet: grün, die Caudovirales-Linien, die ausschließlich im menschlichen Virom vorkommen; rot, die Abstammungslinien, die ausschließlich im Pansenvirom der aktuellen Studie vorkommen; blau, die Abstammungslinien, die sowohl im Pansen als auch in den menschlichen Viromen vorkommen. Die Lysogenieraten (Anteil) wurden mit VIBRANT berechnet und als innerer Ring angezeigt. Die Anzahl der vOTUs, die jede Abstammungslinie repräsentieren, wurde als Balkendiagramm angezeigt (rot für menschliche Viren und schwarz für menschliche Viren). d Anteil der Abstammungslinien von Caudovirales-Viren, die nur im menschlichen Darm, im Pansen und gemeinsam vorkommen. e Eine Verdünnungskurve der im Pansenvirom identifizierten vOTUs. Der Aufwärtstrend der Verdünnungskurve deutet darauf hin, dass noch mehr Pansenviren auf Artenebene identifiziert werden müssen.

Wir haben RVD auf seinen Nutzen in der Pansenviromanalyse mit fünf Sätzen metagenomischer Sequenzen getestet. Zunächst verglichen wir RVD mit den Datenbanken IMG/VR V3 und NCBI RefSeq Viral unter Verwendung zweier aktueller unabhängiger Sätze von Pansenmetagenomen, die in keiner der drei Datenbanken enthalten waren. In RVD wurden wesentlich mehr Virussequenzen identifiziert als in IMG/VR V3 (ergänzende Abbildung 2a), und keine der metagenomischen Sequenzen konnte NCBI RefSeq Viral zugeordnet werden. Anschließend testeten wir die Abschätzung der Virushäufigkeit bei RVD. Wir fanden keinen signifikanten Unterschied zwischen den fünf Wiederkäuerarten (ergänzende Abbildung 2b), aber eine signifikant höhere Virushäufigkeit wurde in den Pansenmetagenomen sowohl von Ziegen als auch von Milchkühen festgestellt, die an subakuter Pansenazidose (SARA, einer häufigen Stoffwechselstörung bei mit Stärke gefütterten Wiederkäuern) litten -reiche Diäten) (Ergänzende Abb. 2c, d). Mit RVD haben wir auch aktuelle metagenomische Sequenzen von fünf Rinderochsen29 und einem Elch28 erneut analysiert. Aus den Metagenomen des Ochsenpansens identifizierten wir 706 vOTUs, darunter 4 Archaephagen, und erreichten eine taxonomische Klassifizierung auf Gattungsebene, während die Autoren29 ihre Fläschchen-Contigs nur viralen Familien zuordnen konnten und keine Archaephagen identifizieren konnten. Für 113 der vOTUs haben wir die Wirte bis auf Artebene vorhergesagt, während die Autoren für drei ihrer Fläschchencontigs nur Wirte auf Phylumebene vorhersagen konnten. In ähnlicher Weise identifizierten wir mithilfe von RVD 789 vOTUs aus dem Elch-Metagenom28 und konnten für 126 der vOTUs Wirte bis auf Artebene vorhersagen, während in der Originalarbeit Wirte für 113 der viralen Contigs nur auf Stammebene vorhergesagt wurden . Diese Ergebnisse deuten darauf hin, dass RVD die Erkennung, Identifizierung und taxonomische Zuordnung von Pansenviren aus metagenomischen Sequenzen erheblich verbessern und Virus-Wirt-Verknüpfungen besser vorhersagen kann.

Wir haben RVD mit Sequenzen von Massenmetagenomen entwickelt, obwohl in einigen Studien Sequenzen verwendet wurden, die von VLP-angereicherten Metagenomen abgeleitet waren. Daher haben wir RVD für die Analyse von Pansenviromen in Massenmetagenomen im Vergleich zu VLP-angereicherten Metagenomen bewertet. Unter Verwendung der beiden Arten von Pansenmetagenomen, die von denselben fünf Ochsen abgeleitet waren, stellten wir fest, dass VLP-angereicherte Metagenome erwartungsgemäß einen höheren Anteil an Virussequenzen enthielten (ergänzende Abbildung 3a), die beiden Arten von Pansenmetagenomen jedoch vergleichbare Prozentsätze aufwiesen lytische Viren (Ergänzende Abbildung 3b). Die Massenmetagenome wiesen jedoch einen höheren Prozentsatz an vOTUs auf, die in RVD vertreten waren (ergänzende Abbildung 3c). Daher werden VLP-angereicherte Metagenome benötigt, um RVD mit Viren zu erweitern, die in Massenmetagenomen typischerweise unterrepräsentiert sind.

Die Vorhersage des Wirts ist wichtig, um die potenzielle Rolle von Viren in einem Ökosystem zu verstehen. Durch die Vorhersage der wahrscheinlichen Wirte der identifizierten Pansenviren identifizierten wir 2403 Archäophagen und 40.881 Bakteriophagen. Es wurde vorhergesagt, dass die Archaephagen 25 Gattungen von Archaeen infizieren würden, und die Bakteriophagen könnten 1051 Gattungen von Bakterien infizieren, darunter Gattungen mit gut charakterisierten Arten wie Methanobrevibacter (z. B. M. ruminantium, M. millerae) und Fibrobacter (z. B. F. succinogenes). ), Prevotella (z. B. P. bryantii, B. ruminicola, P. multiformis), Ruminococcus (z. B. R. albus, R. callidus, R. flavefaciens) und Streptococcus (z. B. S. equinus) (Ergänzende Daten 3) . Überraschenderweise wurde vorhergesagt, dass ein hoher Anteil von Bakteriophagen (9214 oder 22,5 %) und Archäophagen (396 oder 16,5 %) mehrere Wirtsarten infizieren würden. Darüber hinaus können 3,8 % (1544) dieser Pansenphagen mit breitem Wirtsspektrum Arten über mehrere Bakterienstämme hinweg infizieren (Abb. 3a). Im Vergleich dazu haben nur 0,13 % der menschlichen Darmphagen ein breites Wirtsspektrum3. Das stammübergreifende Wirtsspektrum der Pansenphagen lässt darauf schließen, dass sie das Potenzial haben, den genetischen Austausch über Stammgrenzen hinweg zu vermitteln, was die mikrobielle Anpassung und Evolution erleichtern kann3,31. Achtunddreißig der 52 Einzelzell-amplifizierten Genome (SAGs) von Pansenwimpern, die 19 Wimpertierarten in 13 Gattungen repräsentierten, hatten EVEs vorhergesagt.

a Ein genombasierter phylogenetischer Baum von 1051 Bakteriengattungen, der die vorhergesagten Wirte von 40.881 vOTUs enthielt. Die Wirte wurden abgeleitet, indem (i) die Sequenzen der repräsentativen vOTUs (die längsten mit der höchsten Vollständigkeit) jedes vOTUs mit 22.087 Metagenom-assemblierten Genomen (MAGs) von Pansenbakterien und 242.387 bakteriellen Referenzgenomen von NCBI RefSeq abgeglichen wurden und (ii) Ausrichtung der CRISPR-Spacer-Sequenzen der repräsentativen vOTUs und derjenigen der prokaryotischen Genome und MAGs. Die prokaryotischen Genome und MAGs wurden mithilfe von GTDB-Tk klassifiziert. Der phylogenetische Baum wurde mit den Genomen oder MAGs der abgeleiteten Wirte (in Gattungen gruppiert) und ihren vorhergesagten Phagen erstellt, um die Lysogenierate (%), die Anzahl der Phagen pro Wirtsgattung und die Anzahl der Phagen pro Wirtsgenom/MAG zu untersuchen . Insgesamt verfügen wahrscheinlich 4394 vOTUs über ein Wirtsspektrum über mehrere Gattungen hinweg. Diese Gattungen sind durch orangefarbene Bögen verbunden. Die Ringe entsprechen den Lysogenieraten (Ring 1, berechnet auf Grundlage der VIBRANT-Ergebnisse), der Anzahl der Phagen pro Wirtsgattung (Ring 2), der Anzahl der Phagen pro Wirtsgenom/MAG (Ring 3) und der Bakterienphyla, zu der der Bakterienwirt gehört Gattungen gehören (Ring 4). b, c Gen-Sharing-Netzwerk der vOTU mit vorhergesagtem Wirt, der aus vConTACT2 erhalten und mit Cytoscape visualisiert wurde, wobei die viralen Genome entsprechend der Familienzuordnung (b) und die vorhergesagten Wirte entsprechend der Phyla (c) gefärbt sind. Siehe auch Ergänzende Abbildungen. 1 und 2 für die Wirtszuordnung von Archaeen und Protozoen und Ergänzende Daten 3 für die detaillierten Wirtszuordnungen einzelner vOTU.

Wir haben die lysogene Rate (% der Gesamtmenge), die durchschnittliche Anzahl der Phagen pro Wirtsgattung und die durchschnittliche Anzahl der Phagen pro einzelnem Wirtsgenom für Bakteriophagen (Abb. 3a) und Archäophagen (ergänzende Abb. 4) berechnet. Die Anzahl der Phagen pro Wirtsgenom variierte, wobei die meisten Wirte, die zu Proteobakterien gehörten, <0,1 Phagen pro Wirtsgenom aufwiesen, während die meisten Wirte von Firmicutes_A >1 Phagen pro Wirtsgenom aufwiesen. Der Prozentsatz lysogener Viren variierte zwischen den Wirtsgattungen und war für die meisten Wirtsgattungen niedrig (Abb. 3c). Die meisten Ciliaten-SAGs zeigten mehrere EVEs, darunter alle fünf SAGs von Isotricha sp. YL-2021b und Dasytricha ruminantium zeigten die größte Anzahl (>50) EVEs pro SAG (ergänzende Abbildung 5). Über Viren, die Ciliaten infizieren, ist wenig bekannt, und selbst für Modell-Ciliatenarten (z. B. Tetrahymena thermophila) wurden keine EVEs gemeldet. Kürzlich wurden jedoch EVEs in Entamoeba und Giardia in menschlichen Stuhlmetagenomen gefunden32. Daher sind Pansenwimpern wahrscheinlich Träger von EVEs. Die große Anzahl an EVEs pro Wimpertier-SAG könnte mit der hohen Polyploidie und der enormen Chromosomenzahl in vielen Pansenwimpertieren zusammenhängen (z. B. >10.000 bei Entodinium caudatum33).

Die Sequenzähnlichkeitsanalyse ergab, dass homologe Phagen normalerweise homologe menschliche Darm-MAGs infizieren31. Eine solche Analyse kann jedoch keine Viren mit variablen Evolutionsmodi und -tempos klassifizieren26. Um Virus-Wirt-Verknüpfungen und Genflüsse innerhalb dieser Beziehungen besser vorhersagen zu können, haben wir ein Gen-Sharing-Netzwerk aller Phagen mit einer Wirtsübereinstimmung erstellt und das Netzwerk anhand ihrer Taxonomie (Abb. 3b) und ihrer Wirtsphyla (Abb. 3c) visualisiert ). Die 43.284 vOTUs mit einer Host-Übereinstimmung bildeten 2.764 Cluster auf Gattungsebene, aber nur 218 der Cluster enthielten ein oder mehrere virale Genome aus der NCBI RefSeq Viral-Datenbank. Somit verbesserte RVD die Virus-Wirt-Kopplungsanalyse auf Gattungsebene im Vergleich zu NCBI RefSeq Viral erheblich (um das >12-fache). Basierend auf dem Gen-Sharing-Netzwerk wurden die meisten Pansen-vOTUs in vier Gruppen eingeteilt (Abb. 3b). Die Gruppen I (die größte) und IV (die kleinste) enthielten mehr klassifizierte vOTUs als die Gruppen II und III. Die Gruppen I und IV verfügten über ein breiteres Wirtsspektrum unter den Bakterienstämmen, darunter sowohl grampositive als auch gramnegative Bakterien mit unterschiedlichen Nischen und Kapazitäten, aber nur wenige ihrer Gattungen oder Familien waren im Pansen vorherrschend. Die Gruppen II und III infizierten hauptsächlich Bacteroidota bzw. Methanobacteriota (Abb. 3c), und die meisten Viren dieser beiden Gruppen konnten mit keiner der aktuellen Viromdatenbanken klassifiziert werden; sie stellen somit neue virale Abstammungslinien dar. Das enge Wirtsspektrum (ein einzelner Stamm) der Gruppen II und III unterstützt die Annahme, dass Phagen mit einem hohen Grad an Genteilung im Allgemeinen phylogenetisch verwandte Wirte infizieren.

Indem wir nur die vollständigen viralen Contigs (vMAGs, insgesamt 5912) durchsuchten, fanden wir 286 vMAGs, die mehr als ein AMG trugen (siehe Ergänzende Daten 4 für detaillierte Annotations- und Kurationsergebnisse). Diese AMGs repräsentierten 41 verschiedene Kategorien, darunter 36, die in früheren Studien identifiziert wurden, und 5, die in anderen Viromen nicht identifiziert wurden (Abb. 4a). Die 5 neuen AMG-Kategorien wurden jeweils von mehr als zwei vMAGs getragen. Sie kodieren Enzyme, die an einer Vielzahl von Stoffwechselprozessen beteiligt sind, einschließlich des Stoffwechsels von Nukleotiden, Kohlenhydraten, Vitaminen und Stickstoff.

a Ein Balkendiagramm, das die Kategorien von AMGs und deren Vorkommen (log10) zeigt, die im Pansenvirom identifiziert wurden. Es wurden nur die AMGs angezeigt, die auch in früheren Studien identifiziert wurden, und die AMGs, die in mehr als zwei vMAGs der aktuellen Studie identifiziert wurden (rot hervorgehoben). AMGs wurden aus vMAGs (insgesamt 286) vorhergesagt, die eine Reihe von Kurationen bestanden hatten. Siehe Ergänzende Daten 4 für den detaillierten AMGs-Kurationsprozess, eine vollständige Anmerkung der endgültigen AMG-tragenden vMAGs und eine Anmerkung zur AMG-Funktionskategorie. b Die genomische Organisation zweier viraler Contigs, die eine Cellulase (GH5 oder GH9) tragen, flankiert von zwei viralen Genen auf beiden Seiten. c Eine Carboxymethylcellulose-Agarplatte, die E. coli-Kolonien zeigt, die das geklonte Virus GH5, GH9 oder den Klonierungsvektor ohne exogenes Gen tragen. Die gelben Lichthöfe zeigen die Verdauung von CMC nach der Färbung mit Kongorot an. d Zuckerfreisetzungsrate von E. coli-Bouillonkulturen mit Carboxymethylcellulose nach 24- und 48-stündiger Inkubation bei 37 °C (n = 4). Die Fehlerbalken geben den Standardfehler an. Die Mitte des Fehlerbalkens stellt den Durchschnitt der Replikate dar. e Ein konzeptionelles Modell, das veranschaulicht, wie AMGs es Pansenviren ermöglichen könnten, den Stoffwechsel bestimmter Wirte zu modulieren.

Bemerkenswert ist, dass das am weitesten verbreitete AMG DNMT1 kodierte, eine DNA (Cytosin-5)-Methyltransferase, die Viren vor den antiviralen Restriktions-Modifikationssystemen ihrer Wirte schützt34,35, die in mehr als 100 der vMAGs gefunden wurde. Dies steht im Einklang mit der hohen Prävalenz dieser Art von AMG im Meeresvirom36. Ein solches AMG stellt wahrscheinlich einen Abwehrmechanismus von Pansenviren dar. Einige Viren steigern nicht nur direkt den Nukleotidstoffwechsel des Wirts, um die Virusreplikation zu fördern, sondern nutzen AMGs auch, um die Nährstoffaufnahme durch ihren Wirt zu erleichtern und so indirekt das Überleben des Virus zu verbessern. Interessanterweise standen alle fünf neuen AMGs, die im Pansenvirom gefunden wurden, mit der Nährstoffaufnahme und Biosynthese in Zusammenhang. Insbesondere kodierten mehrere AMGs in den vMAGs für Glykosidhydrolasen (GHs), darunter GH16 und G114, die wichtige Enzyme sind, die an der Verdauung von Futterfasern beteiligt sind, und Asparaginsynthase (Abb. 4a), die die Assimilation von Ammoniak in Asparagin vermittelt. Darüber hinaus fanden wir AMGs im Zusammenhang mit Vitamin B12 (d. h. Cobaltochelatase-CobS-Gen) und der Synthese aromatischer Aminosäuren (d. h. Chorismat-Mutase-Gen). Unter den vMAGs fanden wir keine für Cellulase kodierenden AMGs, aber unter den unvollständigen viralen Contigs wurden zwei für Cellulasen kodierende AMGs gefunden: ein GH5 und ein GH9, die jeweils auf beiden Seiten von viralen Genen flankiert waren (Abb. 4b). Dieses GH9 teilte eine Aminosäureidentität von 79,5 % mit einem GH9 eines Pansen-MAG (GenBank: MBR3901505.1, klassifiziert als nicht kultivierter Ruminococcus), während das GH5 zu 45,9 % mit einem GH5 in einem anderen Pansen-MAG (GenBank: MBR3315497.1, klassifiziert) identisch war als unkultivierte Atopobiaceae). Die Klonierung und Expression beider AMGs in E. coli zeigte, dass sie funktionelle Cellulasen kodieren, die Carboxymethylcellulose hydrolysieren (Abb. 4c, d). Durch die Bereitstellung vielfältiger und einzigartiger AMGs können Pansenviren die Nährstoffaufnahme ihrer Wirte steigern oder wichtige Stoffwechselwege des Wirts neu programmieren.

Von den insgesamt 705.380 viralen Contigs wurde festgestellt, dass 24 ARGs tragen, darunter mehrere virale Contigs, die ARGs tragen, die von mindestens zwei viralen Strukturgenen flankiert werden (Abb. 5b und ergänzende Daten 5). Der Mangel an viralen ARGs bestätigt die geringe Anzahl von ARGs im Phagengenom37. Wir fanden jedoch mehrere wichtige ARG-Klassen, darunter tet(W) und tet(O) (Abb. 5a und ergänzende Abb. 6), die beide weit verbreitet sind und in Pansenmikrobiomen stark exprimiert werden 38, 39, 40. Es wurde gezeigt, dass drei ARG-tragende virale Contigs, die von drei Tieren derselben Herde gewonnen wurden, die gleichen ARGs (van(G) und van(WG)) trugen und nahezu identische genomische Architekturen aufwiesen (Abb. 5b), was auf das Potenzial des Pansens hinweist Viren als Weg der ARG-Übertragung zwischen Tieren. Angesichts der begrenzten Anzahl der identifizierten ARG-kodierenden Phagen, des Mangels an Daten zum Einsatz von Antibiotika in landwirtschaftlichen Betrieben und der Möglichkeit, dass die identifizierten ARGs im Pansenökosystem vorhanden sein könnten, selbst wenn die entsprechenden Antibiotika nicht verwendet werden, sind zukünftige ökologische Studien jedoch erforderlich erforderlich, um die potenzielle Rolle von Viren als Reservoir für ARGs weiter zu untersuchen.

a Die Anzahl der ARG-tragenden Viren und ihre ARG-Klassen, die in den ausgewählten Fläschchen-Contigs identifiziert wurden (24 von 705.380). b Die genomische Organisation von drei repräsentativen ARG-tragenden Virus-Contigs. Diese drei viralen Contigs teilten die gleichen zwei Van-Gene mit sehr ähnlichen Sequenzen und hatten eine nahezu identische genomische Organisation, wurden jedoch in drei verschiedenen metagenomischen Proben gefunden. Die grauen Linien, die die Gene zwischen den Contigs verbinden, zeigen die Blastn-Identität an. Der Contig unten stellt den viralen Contig dar, wobei ARG von viralen Kennzeichengenen flankiert wird. Die repräsentativen viralen Contigs, die andere ARG-Gene tragen, wurden auf der Grundlage des CheckV-Vollständigkeitswerts und der Anzahl der zellulären Gene ausgewählt. Ihre Genomorganisationen sind in der ergänzenden Abbildung 6 dargestellt. Die manuellen Kurationen aller ARG-tragenden Contigs und ihre detaillierten Anmerkungen sind zu finden in Ergänzende Daten 5.

Wir verglichen die Prävalenz der einzelnen vOTUs, die aus den Pansenmetagenomen von 283 Rindern abgeleitet wurden, die mit drei Konzentrationen (niedrig, mittel und hoch) Nahrungskonzentrat gefüttert wurden, um festzustellen, ob ein zentrales Pansenvirom gefunden werden konnte. Ein zentrales Pansenvirom wurde definiert als vOTUs, die bei mindestens 50 % der Tiere gefunden wurden, denen jede Futterkonzentratstufe verabreicht wurde. Wir fanden heraus, dass die meisten vOTUs nur bei einem Tier oder bei mehreren Tieren gefunden wurden, denen die gleiche Konzentration an Kraftfutter verabreicht wurde (Abb. 6a), was auf stark individualisierte Pansenvirome bei diesen Rindern hinweist. Die hohe Variation zwischen den Tieren stimmte mit früheren Ergebnissen überein19. Für jeden Konzentratgehalt wurde ein zentrales Pansenvirom (ungefähr 1 % aller vOTUs) gefunden. Es wurde festgestellt, dass nur 14 vOTUs oder 1,4 % der mit den einzelnen Konzentratstufen verbundenen Kern-vOTUs Kern-vOTUs über alle drei Konzentratstufen hinweg waren (Abb. 6b). In einem anderen Satz von Pansen-Metagenomdaten von Tieren derselben Art, die mit Futter mit unterschiedlichen Konzentratmengen gefüttert wurden, und in einem Satz von Pansen-Metagenomdaten von verschiedenen Tierrassen fanden wir auch weniger vOTUs, die zwischen Tieren über Konzentratmengen oder Rassen hinweg geteilt wurden, im Vergleich zu denen innerhalb derselben bei gleichem Kraftfutterniveau bzw. innerhalb der gleichen Rasse (Abb. 6c, d). Es wurde vorhergesagt, dass das Kernpansenvirom hauptsächlich Arten der Kernpansenbakterien infiziert, insbesondere Arten von Prevotella (Ergänzungsdaten 6). Somit wurde das Kernpansenvirom mit dem Kernpansenmikrobiom verknüpft. Wir identifizierten 121 crAss-ähnliche vOTUs (Supplementary Data 2), aber im Gegensatz zu dem, was im menschlichen Darmvirom gefunden wurde, war keines davon im Pansenkernvirom enthalten. Die kleinen Pansenvirome im Kern spiegelten das stark individualisierte Pansenvirom wider, was mit frühen Pansenviromstudien übereinstimmte, auch wenn sie unterschiedliche Arten von Analysen verwendeten (Pulsfeld-Gelelektrophorese41 oder Sequenzierung von VLP-angereicherten Metagenomen29).

a Anzahl der identifizierten vOTUs bei 283 Rindern, die mit einem von drei unterschiedlichen Konzentrationen an Nahrungskonzentrat gefüttert wurden: niedrig (unter 30 %, n = 84), mittel (30–50 %, n = 80) und hoch (über 50 %, n =). 119) (Balkendiagramm) und die Anzahl der beobachteten vOTUs bei nur einem Tier (individualisiert), mehr als einem Tier bei einem, zwei oder drei Konzentratniveaus (Kreisdiagramm). b Ein Venn-Diagramm, das die Anzahl der vOTUs zeigt, die von mehr als 50 % der Tiere im Futter mit niedrigem (lila), mittlerem (gelb) oder hohem (grün) Kraftfutter geteilt werden. c Die Anzahl der vOTUs, die zwischen Tieren geteilt wurden, die mit gleichen (n = 445) oder unterschiedlichen (n = 416) Konzentrationen an Kraftfutter gefüttert wurden (Daten aus Lit. 80). d Die Anzahl der vOTUs, die zwischen Tieren verschiedener (n = 768) Rassen oder derselben (n = 360) Rasse geteilt werden (Daten aus Lit. 79). Das Fütterungsmanagement ist für alle Proben gleich. Boxplots zeigen den Median (mittlere Linie), das 25. und 75. Perzentil (Box) und das 5. und 95. Perzentil (Whisker) sowie einzelne Beobachtungen (Punkte). Die statistische Signifikanz wurde mithilfe des zweiseitigen nichtparametrischen Wilcoxon-Signed-Rank-Tests getestet. P-Werte unter 0,001 wurden als „***“ angegeben. Detaillierte Informationen zur Kern-vOTU (Taxonomie auf Familienebene und vorhergesagte Wirte) finden Sie in den Zusatzdaten 6.

Wir haben weiter untersucht, ob sich die virale Alpha- oder Beta-Diversität zwischen Tierarten, geografischen Standorten oder Studien (Forschungsprojekten) unterscheidet, und wir haben signifikante Unterschiede zwischen all diesen Kategorien beobachtet (ergänzende Abbildung 7). Die permutationelle multivariate Varianzanalyse (PERMANOVA) zeigte, dass ein viel größerer Anteil der Varianz durch die Studien erklärt wurde als durch Tierarten oder geografische Standorte. Daher sollten Unterschiede zwischen Tierarten und geografischen Standorten mit Vorsicht interpretiert werden, da die Unterschiede durch Unterschiede in der Ernährung und den Fütterungsplänen zwischen den Studien verfälscht werden könnten. Wir untersuchten weiter, was den „Studieneffekt“ durch hierarchische Gruppierung der Studien auf der Grundlage gemeinsamer vOTUs ausgelöst haben könnte. Die Studien wurden hierarchisch in fünf Gruppen eingeteilt, aber keine der Gruppen entsprach einer Tierart, Geographie, Methode der Pansenprobenentnahme oder einem Haltungsregime (ergänzende Abbildung 8). Daher könnten die beobachteten Variationen in den Pansenviromen wahrscheinlich auf die zahlreichen oben genannten Faktoren zurückgeführt werden, insbesondere auf die Ernährung, die tiefgreifende Auswirkungen auf das Pansenmikrobiom haben.

Die enorme Vielfalt und die möglichen ökologischen Auswirkungen von Viren in der Umwelt1,42 und im menschlichen Darm3,4 werden immer besser dokumentiert und anerkannt. Obwohl angenommen wird, dass die Viren im Pansenmikrobiom ebenfalls vielfältig sind und das Pansenmikrobiom und die wichtigsten Pansenfunktionen (z. B. Futterverdauung, Fermentation, mikrobielle Proteinsynthese, Methanemissionen) beeinflussen können, sind sie viel weniger gut charakterisiert und verstanden10,11 . Durch die Analyse der meisten veröffentlichten Pansenmetagenome (fast 1000) haben wir fast 400.000 vOTUs wiederhergestellt und eine globale Pansenviromdatenbank, RVD, erstellt. Diese Datenbank erweitert die aktuellen Kataloge von Pansenviren erheblich und wirft ein neues Licht auf deren Vielfalt und mögliche Auswirkungen auf wichtige Wiederkäuerarten und Tierhaltungssysteme. Die meisten der entdeckten Pansenviren stellen neue Viruslinien dar, da ca. 91 % nicht in bestehende Virusarten, Gattungen oder Familien eingeteilt werden konnten, was mit früheren Virusstudien an Rindern29 und Elchen28 übereinstimmt.

Als spezifische Datenbank für das Pansen-Ökosystem erleichtert und verbessert RVD die Erkennung, Identifizierung und taxonomische Zuordnung von Pansenviren aus metagenomischen Sequenzen erheblich und ermöglicht eine bessere Vorhersage von Virus-Wirt-Verknüpfungen. Es wird eine nützliche Ressource für zukünftige Pansenviromstudien sein. RVD ist jedoch noch lange nicht vollständig, da einige der Pansenviren noch fehlen oder unterrepräsentiert sind, wie die Verdünnungsanalyse zeigt. Insbesondere fehlen mehrere Arten von Viren. Zunächst sollten Viren mit kleineren Genomen (<5 kb), einschließlich ssDNA-Viren, hinzugefügt werden. Da ssDNA-Viren aufgrund von Größenfiltration und DNA-Amplifikation5 in VLP-Metagenomen angereichert sind, wird die virale Metagenomik in Kombination mit einem kleineren viralen Genomgrößen-Cutoff dazu beitragen, Pansenviren mit kleiner Genomgröße und ssDNA-Genom in zukünftigen Studien zu erfassen. Zweitens verfügen RNA-Viren über RNA-Genome. Sofern es sich also nicht um endogene Viruselemente handelt, werden sie selten durch Metagenomik oder virale Metagenomik nachgewiesen. Wie in Ozeanen8,42 und Böden43 gezeigt, sind RNA-Viren wahrscheinlich auch im Pansen-Ökosystem vielfältig und wichtig. Tatsächlich ergab die einzige Pansen-RNA-Virus-Studie, die Metatranskriptomik nutzte, 2466 einzigartige RNA-Virus-Contigs, die neun Virusfamilien zugeordnet wurden44. Eine umfassende Analyse veröffentlichter und zukünftiger Pansenmetatranskriptome wird die Identifizierung von Pansen-RNA-Viren ermöglichen. Drittens haben wir die Mykoviren im RVD nicht im Hinblick auf Identifizierung und Wirtsvorhersage analysiert, da nur wenige Genome von Pansenpilzen verfügbar sind. Da in Zukunft mehr Genome von Pansenpilzen verfügbar werden, können die Mykoviren bei RVD identifiziert und ihre wahrscheinlichen Wirte vorhergesagt werden. Obwohl die Datenbank verbessert werden muss, ist RVD eine nützliche Ressource für die Analyse von Pansenviromen in Massenmetagenomen und VLP-angereicherten Metagenomen, einschließlich bereits veröffentlichter und neuer Datensätze. Darüber hinaus sind diese Daten von entscheidender Bedeutung für die Kontextualisierung neuer Sequenzen für die Virusklassifizierung, Analysen der Alpha- und Beta-Diversität und -Häufigkeit sowie Vorhersagen von Virus-Wirt-Verknüpfungen.

Zusätzlich zur Erkennung, Identifizierung und Klassifizierung ist es wichtig, Wirte bis auf Art- oder Gattungsebene vorherzusagen, um die ökologische Rolle von Viren in jedem Ökosystem, einschließlich des Pansenökosystems, zu verstehen. Wir konnten für viele Archäophagen (>2400) und Bakteriophagen (>40.000) Wirtsvorhersagen bis auf die Artenebene durchführen, und viele der Wirtsarten spielen bekanntermaßen eine wichtige Rolle bei der Futterverdauung, der Fermentation und den Methanemissionen. Fortschritte bei der Vorhersage von Wirten und Virus-Wirt-Verbindungen werden zum Verständnis der ökologischen Rolle von Pansenviren beitragen. Solche Informationen werden besonders nützlich sein, wenn sowohl das Pansenmetagenom als auch das Pansenvirom auf ihre Verbindung mit wichtigen Pansenfunktionen untersucht werden. Von den Pansen-vOTUs mit einer vorhergesagten Wirtsübereinstimmung wurde angenommen, dass 99,5 % Prokaryoten infizieren, die hauptsächlich im Pansen vorkommen, obwohl die meisten verwendeten Referenz-Prokaryotengenome von Prokaryoten in anderen Umgebungen stammten, was die Genauigkeit und niedrige Falsch-Positiv-Rate von demonstriert unsere Host-Vorhersage-Pipeline.

Als Bestätigung früherer Studien zu Viromen im menschlichen Darm3,9,31 haben wir Pansenviren gefunden, die wahrscheinlich mehrere Arten infizieren, sogar Arten in verschiedenen Phyla. Tatsächlich bestätigte eine Kombination aus Long-Read-Assemblierung und Proximity-Ligation, dass ein Pansenvirus 11 verschiedene Bakteriengattungen infizieren konnte40. Interessanterweise könnten im Vergleich zu den Viren im menschlichen Darm mehr Pansenviren ein breiteres Wirtsspektrum haben, was durch den hohen Anteil von Pansen-vOTUs belegt wird, von denen vorhergesagt wird, dass sie mehrere Wirtsarten über phylogenetische Grenzen hinweg, sogar über Stammesgrenzen hinweg, infizieren. Diese Diskrepanz kann auf das vielfältigere Mikrobiom und die physiologischen Bedingungen im Pansen zurückzuführen sein (aufgrund großer Unterschiede in der Tierart/Genetik und Ernährung) als im menschlichen Darm. Tatsächlich könnten alle 32 Phyla von Pansenbakterien, die durch die Referenzgenome repräsentiert werden, von Phagen infiziert werden, während nur 8 Phyla wahrscheinlich Wirte menschlicher Darmphagen waren. Phagen vermitteln den horizontalen Gentransfer durch allgemeine und spezialisierte Transduktion und diversifizieren dadurch das Genrepertoire des Wirts, was zu Heterogenität auf Stammebene45 sowie mikrobieller Anpassung und Evolution3 führt. Die zahlreichen Prophagen, von denen vorhergesagt wird, dass sie verschiedene Wirte über phylogenetische Grenzen hinweg infizieren, weisen auf ihr Potenzial hin, die Wirtsevolution zu erleichtern. Allerdings wurden die Wirte der Pansenviren, wie auch in anderen Studien, ausschließlich auf der Grundlage der DNA-Sequenzähnlichkeit vorhergesagt. Eine experimentelle Validierung ist erforderlich, um die wahren Wirte bestimmter interessierender Pansenviren zu verifizieren, und der in der aktuellen Studie vorhergesagte Wirtsbereich wird für solche Studien hilfreich sein.

Das Pansen-Ökosystem verfügt über ein zentrales Pansen-Mikrobiom, das Arten der vorherrschenden Bakteriengattungen (z. B. Prevotella und Ruminococcus), Archaeen (z. B. Methanobrevibacter) und Protozoen (z. B. Entodinium) enthält und eine wichtige Rolle bei wichtigen Pansenfunktionen spielt. Um festzustellen, ob auch ein zentrales Pansenvirom existiert, haben wir die Viromprofile aller Pansenmikrobiome untersucht. Wir fanden kein Pansenvirom mit „globalem Kern“, sondern identifizierten stattdessen ein stark individualisiertes Pansenvirom. Dies geschah wahrscheinlich, weil die große Anzahl der von uns analysierten Pansenmetagenome von Tieren stammte, die sich in Genetik und Physiologie (verschiedene Arten und Rassen), Ernährung, Haltung (wild vs. domestiziert, grasend vs. nicht grasend) und Geographie unterschieden. Wir fanden ein kleines Kernpansenvirom bei Rindern, die mit Futter mit niedrigem, mittlerem oder hohem Getreideanteil gefüttert wurden. Obwohl die „Größe“ des Pansenkernviroms abhängig von der Homogenität der Nahrung und wahrscheinlich auch von tierspezifischen Faktoren wie Genetik und Alter variiert, infiziert das Pansenkernvirom das Pansenkernmikrobiom, einschließlich häufiger Arten, die im Pansen eine wichtige Rolle spielen Funktionen, wie Arten von Butyrivibrio, Fibrobacter, Prevotella, Ruminococcus und Methanobrevibacter. Einige Arten dieser Gattungen werden tatsächlich durch aus dem Pansen isolierte Bakteriophagen infiziert16,17. Darüber hinaus können Viren sowohl Biofilme durch Prädation und Depolymerasen zerstören46 als auch die Biofilmbildung fördern, indem sie spontan Prophagen induzieren und extrazelluläre DNA als extrazelluläre Matrizen für die Biofilmbildung freisetzen47. Durch die Lyse faserabbauender Bakterien und die Beeinflussung von Biofilmen auf Futterpartikeln beeinflusst das Pansenvirom wahrscheinlich die Futterverdaulichkeit von oben nach unten, wie zuvor für das Pansenvirom von Elchen vorgeschlagen, in dem keine GH-kodierenden AMGs gefunden wurden28. In ähnlicher Weise tragen Pansenphagen durch die Lyse ihrer Wirtszellen und die Erhöhung der Menge an mikrobiellem Protein, das für den Abbau durch proteolytische Bakterien zur Verfügung steht, wahrscheinlich zum intraruminalen Recycling von mikrobiellem Protein bei15, was den Abfluss von mikrobiellem Protein in den Dünndarm und die Stickstoffverwertungseffizienz bei Wiederkäuern verringert48. Daher beeinflusst das Pansenvirom wahrscheinlich auch die Versorgung von Wiederkäuern mit mikrobiellem Protein und damit die Effizienz der Stickstoffverwertung von oben nach unten.

Die Phageninfektion von Bakterien kann zu unterschiedlichen Virozellzuständen führen, die den Stoffwechsel, die Physiologie und die Ökologie des Wirts verändern7. Ein zugrunde liegender Mechanismus ist die Versorgung von Wirten mit AMGs, die an der Nährstoffaufnahme und dem Stoffwechsel der Wirte beteiligt sind. In anderen Ökosystemen wurde festgestellt, dass AMG mehrere wichtige ökologische Prozesse beeinflusst, darunter das globale Kohlenstoffrecycling2, den Stickstoffstoffwechsel im Ozean49 und den Schwefelstoffwechsel in der Umwelt und im menschlichen Darm50. Die 41 AMG-Kategorien, die aus 286 vMAGs identifiziert wurden, darunter 5 neue Kategorien, erweitern das bekannte Repertoire viraler AMGs des Pansenökosystems erheblich über die geringe Anzahl von AMGs hinaus, über die zuvor bei Rindern29 und Elchen28 berichtet wurde. Die Tatsache, dass die meisten Kategorien zuvor in anderen Ökosystemen gefunden wurden, weist auch darauf hin, dass die Rate falscher AMG-Annotationen gering war. Im Gegensatz zu den beiden Studien, die AMGs in den Pansenviromen von Ochsen29 und Elchen28 berichteten, fanden wir Cellulase-kodierende AMGs (GH5 und GH9) und zeigten, dass sie funktionelle Cellulasen kodierten. Angesichts der großen Anzahl unvollständiger viraler Contigs, die keiner AMG-Annotation unterzogen wurden, und der Tatsache, dass noch weitere Viren identifiziert werden müssen, ist das tatsächliche Repertoire viraler AMGs im Pansen wahrscheinlich um Größenordnungen größer als das bisher offenbarte. Dennoch legt die Identifizierung von AMGs, die an der antiviralen Abwehr (z. B. DNMT1), der Polysaccharidverdauung (z. B. GHs), der Ammoniakassimilation (z. B. Asparaginsynthase) und der Aminosäure- und Vitaminbiosynthese (Chorismatmutase und Cobaltochelatase CobS) beteiligt sind, nahe, dass die Pansenvirome können auch die Futterverdaulichkeit und die mikrobielle Proteinsynthese von unten nach oben beeinflussen. Zukünftige Studien sind erforderlich, um festzustellen, wie und in welchem ​​Ausmaß das Pansenvirom die Futterverdaulichkeit und die Effizienz der Stickstoffverwertung beeinflusst.

Im Gegensatz zur Forschung zum menschlichen Darmmikrobiom und Virom, die sich hauptsächlich auf deren Einfluss auf die Gesundheit konzentriert51, konzentriert sich die Forschung zum Pansenmikrobiom und Virom auf deren Zusammenhang mit Futtereffizienz und CH4-Emissionen52. In den meisten metagenomischen Studien werden Pansenbakterien, Methanogene, Protozoen und Pilze analysiert, Pansenviren/Phagen werden jedoch häufig ignoriert, da es an Referenzdatenbanken und robusten bioinformatischen Werkzeugen zur Identifizierung und Klassifizierung viraler Sequenzen aus Pansenmetagenomen mangelt. Wie oben erläutert, können Pansenviren das Pansenmikrobiom, wichtige Pansenfunktionen und die Leistung der Tiere, einschließlich Futtereffizienz und Produktivität (Wachstum und Laktationsleistung), auf vielfältige Weise von oben nach unten und von unten nach oben beeinflussen. Mit RVD kann die zukünftige metagenomische Forschung sowohl das Pansen-Mikrobiom als auch das Pansen-Virom analysieren, um ihre Rolle und Zusammenhänge mit Futtereffizienz und Tierproduktivität besser zu verstehen und neue Verbesserungsansätze zu entwickeln. Darüber hinaus können die lytischen Phagen, von denen vorhergesagt wird, dass sie unerwünschte Pansenmikroben wie Streptococcus-Arten, Pansenmethanogene53 und Protozoen infizieren, sowie ihre Enzyme isoliert und auf ihr Potenzial zur Reduzierung der Pansenazidose, der Methanemissionen und der Stickstoffausscheidung untersucht werden.

Veröffentlichte Pansenmetagenome (n = 975, Zusatzdaten 1) wurden von NCBI SRA heruntergeladen, einer Qualitätskontrolle mit fastp54 unterzogen und dann einzeln mit Megahit (v1.2.1) mit den Standardparametern zusammengestellt. Die erhaltenen Metagenome wurden in 80 Studien veröffentlicht, die 13 Arten oder Haltungssysteme von Wiederkäuern aus 8 Ländern auf 5 Kontinenten abdeckten (Abb. 1). Die Länder, in denen die Metagenome beprobt wurden, sowie die Anzahl der Metagenome wurden auf einer Weltkarte visualisiert, die wir mit dem R-Paket „rworldmap“ erstellt haben.

Nach dem Zusammenbau wurden zunächst vorläufige virale Contigs gemäß der SOP zur Identifizierung viraler Sequenzen identifiziert (https://doi.org/10.17504/protocols.io.bwm5pc86). Kurz gesagt, vorläufige virale Contigs >5 kb wurden mit VirSorter222 (Option: --min-score 0,5) verifiziert, und die Contigs, die das Verifizierungsverfahren bestanden haben, wurden in CheckV21 eingegeben, um Wirtssequenzen, die Prophagen flankieren, abzuschneiden. Wir haben nur virale Contigs >5 kb ausgewählt, da die derzeit verfügbaren Bioinformatik-Tools eine relativ hohe Falsch-Positiv-Rate bei der Identifizierung viraler Contigs <5 kb30 aufweisen. Nur die Contigs, die in die Kategorien Keep1 und Keep2 fallen, wurden als mutmaßliche virale Contigs (insgesamt 708.580) für weitere Analysen beibehalten.

Die viralen Contigs wurden dann gemäß 95 % durchschnittlicher Nukleotididentität (ANI) über 85 % der kürzesten Contigs in vOTUs geclustert, wie unter Verwendung eines benutzerdefinierten Skripts aus dem CheckV-Repository21 vorgeschlagen25. Die resultierenden 411.125 vOTUs wurden mit VIBRANT23 (Option: --virome) weiter verifiziert. Um konservativ zu sein, wurden nur die von VIBRANT und VirSorter2 (397.180) identifizierten vOTUs zum Aufbau von RVD verwendet und für die taxonomische Klassifizierung und Wirtsvorhersage beibehalten. Wir haben uns für die Verwendung von VIBRANT und VirSorter2 zur Virenidentifizierung entschieden, da sie laut einem kürzlich durchgeführten Benchmarking zu den neuesten Tools mit der besten Leistung gehören30. Für die Annotation war keine Pansenvirendatenbank verfügbar, daher haben wir die sauberen Lesevorgänge mit vollständigen Genomen aus NCBI RefSeq Viral (Version 211; heruntergeladen im März 2022) und dem wirtsassoziierten Anteil der IMG/VR V3-Datenbank annotiert27. Die Vollständigkeit der vOTUs wurde mit CheckV21 geschätzt. Mithilfe des RTK55-Pakets in R wurde eine Verdünnungskurve erstellt, um die Abdeckung der Pansenviren zu bewerten.

Wir haben vOTUs >10 kb viralen Taxa auf Gattungsebene zugeordnet, basierend auf einem Gen-Sharing-Netzwerk unter Verwendung von vConTACT226, das NCBI RefSeq Viral (Release 88) als Referenzgenome verwendet. Die vOTUs, die mit den Referenzgenomen einer Virusgattung geclustert werden konnten, wurden dieser Gattung gemäß dem vConTACT2-Workflow zugeordnet. Wir haben die vOTUs, die keiner Virusgattung zugeordnet werden konnten, und diejenigen <10 kb viralen Taxa auf Familienebene zugewiesen, indem wir die Mehrheitsregel verwendet haben, wie zuvor angewendet4. Kurz gesagt, wir haben die ORFs jeder vOTU mit Prodigal56 vorhergesagt und dann die ORF-Sequenzen mit denen von NCBI RefSeq Viral unter Verwendung von BLASTp mit einem Bit-Score von ≥50 abgeglichen. Die vOTUs, die mit den NCBI-RefSeq-Virusgenomen einer Virusfamilie mit >50 % ihrer Proteinsequenzen abgeglichen wurden, wurden dieser Familie zugeordnet. Wir identifizierten crAss-ähnliche Phagen mithilfe von BLASTn gegen 2.478 crAss-ähnliche Phagengenome, die in früheren Studien identifiziert wurden57,58,59, mit einem Schwellenwert von ≥80 % Sequenzidentität entlang ≥50 % der Länge zuvor identifizierter crAss-ähnlicher vOTUs.

Die meisten taxonomisch zuordenbaren vOTUs des Pansenviroms wurden der Ordnung Caudovirales zugeordnet, wie im Fall des menschlichen Darmviroms, und wir verglichen daher die phylogenetische Verteilung der Caudovirales-Viren zwischen dem Pansen und den menschlichen Darmviromen basierend auf verkettetem Protein Phylogenie60. Insbesondere haben wir die HMM-Profile der 77 Markergene von Caudovirales-Viren von VOGDB (http://vogdb.org) heruntergeladen und RVD und die beiden größten Datenbanken für menschliche Darmvirome (MGV5 und GPD3, die sich phylogenetisch ergänzen) durchsucht Markergene mit HMMER v3.1b261. Um einen fairen Vergleich zwischen den Datenbanken zu gewährleisten, wurden nur die vOTUs mit einer Vollständigkeit von >50 % in die Suche einbezogen. Anschließend haben wir jedes der Markergene aus den drei Datenbanken mit MAFFT62 abgeglichen, die Positionen mit >50 % Lücken mit trimAl63 herausgeschnitten, jedes ausgerichtete Markergen verkettet und die Lücke gefüllt, wo ein Markergen fehlte. Nur die verketteten Markergene, die jeweils mehr als 3 Markergene zeigten und in mehr als 5 % aller ausgerichteten Konkatemere gefunden wurden, wurden beibehalten, was zu 10.203 Caudovirales-Markergen-Konkatemeren mit jeweils 13.573 Alignment-Spalten führte. Diese Markergen-Concatemer wurden wie zuvor beschrieben in vOTUs auf Gattungsebene geclustert, wobei ein Benchmarking durchgeführt wurde, um mithilfe von NCBI RefSeq-Virusgenomen eine hohe taxonomische Homogenität zu erreichen. Wir haben mit FastTree v.2.1.9 (Option: -mlacc 2 -slownni -wag)64 einen phylogenetischen Baum von Caudovirales-Viren erstellt und die verketteten Markergene der repräsentativen vOTUs-Sequenzen aller vOTUs auf Gattungsebene mit einer Genomvollständigkeit > 50 abgeglichen % (basierend auf CheckV-Analyse). Der Caudovirales-Baum wurde mit iTOL65 visualisiert. Die als Prophagen identifizierten oder für eine Integrase kodierenden vOTUs wurden als lysogen angesehen. Die lysogene Rate (%) wurde basierend auf den VIBRANT-Ergebnissen als Prozentsatz der lysogenen Viren aller Viren für jede Gattung ihrer wahrscheinlichen Wirte berechnet.

Wir haben die wahrscheinlichen Wirte der Pansenviren mithilfe einer ausrichtungsabhängigen Methode (Ausrichtung von Prophagensequenzen und CRISPR-Spacer-Sequenzen mit Genomdatenbanken von Prokaryoten und Pansenprotozoen) mit hoher Vorhersagegenauigkeit vorhergesagt66. Für die Ausrichtung der Prophagensequenzen haben wir manuell drei Genomdatenbanken kuratiert: eine Datenbank mit 22.095 bakteriellen MAGs und 410 archaealen MAGs, die aus denselben Metagenomen zusammengestellt wurden, die für die Virusanalyse in der aktuellen Studie verwendet wurden, eine Datenbank mit 2.729 prokaryotischen Pansen-MAGs der Cow Pansen-Genomdatenbank V1 .0 (https://www.ebi.ac.uk/metagenomics/genome-catalogues/cow-rumen-v1-0) und eine Datenbank mit 251.167 Referenzgenomen von Prokaryoten von NCBI RefSeq (Version 211; heruntergeladen im März 2022). ). Die oben genannten prokaryotischen MAGs und Referenzgenome wurden gemäß der GTDB-Taxonomie mit GTDB-tk (Option: -classify_wf)67 klassifiziert. Wir haben die Wirte der Mykoviren nicht vorhergesagt, da die meisten Mykoviren RNA-Viren sind und nur wenige Referenzgenome von Pansenpilzen verfügbar sind. Wir haben die repräsentative Virussequenz jeder vOTU mit den oben genannten prokaryotischen Genom-/MAG-Sequenzen abgeglichen, indem wir BLASTn (Option: -task metablast) verwendet haben, um integrierte Prophagenregionen zu identifizieren. Eine Wirtsübereinstimmung wurde aufgerufen, wenn >2.500 bp eines Wirtsgenoms oder MAG mit einer vOTU-Sequenz bei >90 % Sequenzidentität über 75 % der vOTU-Sequenzlänge übereinstimmten4. Wir haben wahrscheinliche Protozoenwirte der Pansenviren vorhergesagt, indem wir die 52 hochwertigen Ciliaten-SAGs68 mithilfe von BLASTn und den oben genannten Kriterien nach EVEs durchsucht haben.

Wir haben auch die wahrscheinlichen Wirte der identifizierten Viren vorhergesagt, indem wir die CRISPR-Spacer-Sequenzen der vOTUs mit den Referenzgenomen und MAGs von Prokaryoten abgeglichen haben. Kurz gesagt, wir identifizierten die CRISPR-Spacersequenzen der Referenzgenome und MAGs mithilfe von MinCED (Option: -minNR 2)69 und richteten dann die identifizierten CRISPR-Spacersequenzen mit den RVD-Sequenzen mithilfe von BLASTn (Option: -dust no) aus. Ein wahrscheinlicher Wirt wurde aufgerufen, wenn der CRISPR-Spacer eines Referenzgenoms oder MAG genau mit einer vOTUs-Sequenz übereinstimmte (100 % Identität und 100 % Abdeckung). Insgesamt haben wir 43.166 vOTUs identifiziert, die eine CRISPR-Spacer-Übereinstimmung aufweisen oder deren virale Sequenzen in die Wirtsgenome integriert sind. Mit den Sequenzen dieser vOTUs haben wir mithilfe von vConTACT2 ein Gen-Sharing-Netzwerk aufgebaut. Nach dem Entfernen doppelter Kanten und Cluster mit <3 Knoten wurde das Netzwerk in Cytoscape 3.7.270 importiert und basierend auf der Taxonomie der Viren und ihrer wahrscheinlichen Wirte mit Anmerkungen versehen.

Um die Infektionsmuster von Pansenviren aufzudecken, haben wir phylogenetische Bäume auf Gattungsebene für die identifizierten Wirte (Archaeen, Bakterien und Ciliaten) erstellt. Für die Stammbäume bakterieller und archaeischer Wirte wurde innerhalb jeder identifizierten Wirtsgattung ein Genom zufällig ausgewählt. Anschließend wurden die 120 Markergene von Bakterien und 122 Markergene von Archaeen in den Genomen der ausgewählten Bakterien und Archaeen mithilfe von GTDB-tk67 abgeglichen. Danach wurden phylogenetische Bäume unter Verwendung der ausgerichteten Markergene und IQ-TREE erstellt (Option: -redo -bb 1000 -m MFP -mset WAG,LG,JTT,Dayhoff -mrate E,I,G,I + G -mfreq FU - wbtl)71 und wurden mit iTOL65 visualisiert. Die lysogenen Raten wurden auf der Grundlage der VIBRANT-Ergebnisse wie oben beschrieben berechnet. Ein Ciliatenbaum wurde von Li et al. erworben. 68 und visualisiert mit iTOL65.

Wir haben die öffentlich zugänglichen metagenomischen Sequenzen von Anderson et al.29 von NCBI SRA heruntergeladen und die Viren mithilfe des oben erwähnten Virusidentifizierungsprotokolls identifiziert. In dieser Studie wurden drei Bibliotheksvorbereitungs- und Sequenzierungsmethoden verwendet (Sequenzierung VLP-angereicherter Pansenmetagenome mit Ion Torrent PGM oder Illumina MiSeq und Sequenzierung großer Pansenmetagenome mit Ion Torrent PGM), und wir verglichen die virale Identifikationsrate (Prozentsatz der identifizierten viralen Contigs). (Gesamtzahl der für die Virusidentifizierung verwendeten Contigs) unter allen drei verschiedenen Methoden. Ein zweiseitiger Wilcoxon-Rangsummentest wurde verwendet, um die Ergebnisse der Virusidentifizierung in R zu vergleichen. Die viralen Contigs aus VLP-angereicherten Metagenomen und Massenmetagenomen wurden separat in vOTUs geclustert, und die resultierenden zwei Sätze von vOTUs wurden mit RVD unter Verwendung von geclustert Clustering-Methode wie oben beschrieben. Der Prozentsatz der lysogenen Virusinfektionen wurde ebenfalls wie oben beschrieben berechnet. Wir haben den Prozentsatz der lysogenen viralen Contigs und das Verhältnis der mit RVD geclusterten vOTUs zwischen dem VLP-angereicherten Metagenom und den Massenmetagenomen mit dem Chi-Quadrat-Test in R verglichen. Um RVD auf seinen Nutzen zur Identifizierung von Viren aus Metagenomen zu testen, die nicht verwendet wurden Während der Entwicklung von RVD haben wir mithilfe von CoverM auch die sauberen Lesevorgänge aus früheren Pansenviromstudien28,29 auf RVD abgebildet (Option: --min-read-percent-identity 0,95, --min-read-aligned-percent 0,75, --min -covered-fraction 0,7; https://github.com/wwood/CoverM) mit der getrimmten Mittelwertmethode, die die durchschnittliche Abdeckung berechnet, nachdem die Regionen mit den obersten 5 % der höchsten und niedrigsten Abdeckung entfernt wurden.

Wir haben auch RVD und die beiden größten Viromdatenbanken NCBI RefSeq Viral und IMG/VR V3 (nur die wirtsassoziierten Viren) auf ihren Nutzen bei der Identifizierung von Pansenviren aus Pansenmetagenomen untersucht. Insbesondere haben wir die Sequenzierungsablesungen von zwei aktuellen Sätzen von Pansenmetagenomen (BioProject PRJNA597489 und PRJNA779163) kartiert, deren Viren in keiner der drei Viromdatenbanken enthalten sind. Anschließend berechneten wir die Kartierungsraten der Virussequenzen mithilfe von CoverM und verglichen die Kartierungsraten zwischen den drei Virom-Datenbanken. Wir haben RVD auch beim Nachweis von Viren in Pansenmetagenomen verschiedener Wiederkäuerarten anhand der Kartierungsrate bewertet. Da bei den Kartierungsraten eine hohe Variabilität festgestellt wurde, verglichen wir nur die Ergebnisse zwischen gesunden Wiederkäuern und denen, die an SARA erkrankt waren. Die Mapping-Raten viraler Reads wurden mithilfe des zweiseitigen nichtparametrischen Kruskal-Wallis-Tests in R. statistisch analysiert.

Wir verwendeten strenge Kriterien, um virale Sequenzen zu extrahieren, aber während der anfänglichen manuellen Kuratierung der viralen Contigs fanden wir einige Contigs, bei denen es sich möglicherweise um genomische Wirtsinseln handelte. Solche Contigs können von Virenidentifizierungstools3 fälschlicherweise als virale Genome identifiziert werden. Darüber hinaus ist es immer noch schwierig, die genauen Grenzen zwischen Wirtsgenomen und Prophagengenomen abzugrenzen21, und alle verbleibenden Wirtsgene können, wenn sie nicht entfernt werden, fälschlicherweise als AMGs identifiziert werden. Daher haben wir eine Reihe von Kurations- und Filterschritten durchgeführt, um vMAGs für die AMG-Identifizierung auszuwählen und so eine falsche AMG-Identifizierung zu minimieren. Zunächst haben wir nur die vMAGs >10 kb (insgesamt 5912) nach AMG-Identifizierung durchsucht, wobei wir die in einem Benchmarking-Papier30 empfohlenen Kriterien verwendet haben. Die ausgewählten vMAGs wurden dann einer AMG-Identifizierung und Genomannotation unter Verwendung von DRAMv72 unterzogen, nachdem sie mit VirSorter2 mit den angewendeten Optionen „—prep-for-dramv“ verarbeitet wurden. Zweitens wurden die AMG-tragenden vMAGs entfernt, wenn sich die AMGs am Ende der vMAGs befanden oder wenn die AMGs nicht sowohl von einem viralen Kennzeichengen als auch einem viralen ähnlichen Gen oder von zwei viralen Kennzeichengenen (Kategorie 1 und Kategorie 2) flankiert waren wie durch DRAMv bestimmt). Drittens wurden die verbleibenden vMAGs basierend auf den im VirSorter2 SOP (https://doi.org/10.17504/protocols.io.bwm5pc86; siehe auch https://github.com/yan1365/RVD/blob) angegebenen Kriterien manuell weiter kuratiert /main/vmags_check_helper/readme.txt). Letztendlich haben wir 1.880 vMAGs erhalten. Um eine falsche Identifizierung weiter zu minimieren, haben wir den genomischen Kontext dieser vMAGs manuell überprüft und festgestellt, dass es sich bei einigen von ihnen immer noch um mögliche genomische Inseln handelte. Daher haben wir die 1880 vMAGs basierend auf den von Sun und Pratama et al. festgelegten Kriterien gefiltert. (unveröffentlichte Daten). Kurz gesagt, vMAGs mit nur Integrasen/Transposasen, Schwanzfasergenen oder anderen nichtviralen Genen wurden entfernt. Die verbleibenden vMAGs wurden erneut gefiltert, um diejenigen zu entfernen, die nicht mindestens eines der viralen Strukturgene aufwiesen (d. h. Kapsidprotein, Portalprotein, Phagenhüllprotein, Grundplatte, Kopfprotein, Schwanzprotein, Virionstrukturprotein und Terminase) und diejenigen, die Gene enthalten, die eine Endonuklease, ein Plasmidstabilitätsprotein, ein Lipopolysaccharid-Biosyntheseenzym, Glykosyltransferase (GT)-Familien 11 und 25, Nukleotidyltransferase, Kohlenhydratkinase oder Nukleotidzucker-Epimerase kodieren. Letztendlich erhielten wir 504 vMAGs, die frei von genomischen Inseln waren. Um unsere Kurationspipeline zu vergleichen, wurden 100 der vMAGs nach dem Zufallsprinzip für eine detaillierte manuelle Kuratierung basierend auf ihrem genomischen Kontext ausgewählt. Den Benchmarking-Ergebnissen zufolge waren wir zuversichtlich, dass wir nur vollständige vMAGs für die AMG-Vorhersage behalten konnten. Detaillierte Ergebnisse jedes Kurationsschritts und eine vollständige Annotation der endgültigen vMAGs sowie die Annotation der identifizierten AMGs sind in den Zusatzdaten 4 dargestellt. Wir haben die im Pansenvirom identifizierten AMGs mit den zuvor identifizierten AMGs aus anderen Viromen verglichen, die in verfügbar sind Von Experten kuratierte AMG-Datenbank (https://github.com/WrightonLabCSU/DRAM/blob/master/data/amg_database.tsv). Für die neu identifizierten AMGs haben wir die Anmerkungen noch einmal überprüft und die Literatur durchsucht, um sicherzustellen, dass es sich tatsächlich um AMGs handelte.

Cellulasen sind für die Futterverdauung im Pansen unerlässlich, und wir haben daher besonderes Augenmerk auf vMAGs gelegt, die Cellulase-kodierende AMGs tragen. Wir fanden keine Cellulase-kodierenden AMGs in den vMAGs und durchsuchten daher alle viralen Contigs in RVD. Nach den oben beschriebenen manuellen Kurationsschritten identifizierten wir zwei virale Contigs, von denen einer ein GH5-Gen und der andere ein GH9-Gen trug. Obwohl diese beiden GH-Gene nicht in vollständigen vMAGs gefunden wurden, war jedes auf beiden Seiten von viralen Genen flankiert, was darauf hinweist, dass sie Teil des viralen Genoms sind. Darüber hinaus ist zu beachten, dass CheckV datenbankabhängig ist und sowohl die Genomdatenbank als auch die von CheckV verwendete HMMs-Datenbank nur sehr geringe Mengen an Pansenviren enthalten. Daher ist es sinnvoll, „unvollständige“ Virus-Contigs in die Identifizierung von AMGs einzubeziehen, insbesondere wenn die identifizierten AMGs sorgfältig durch manuelle Kuratierung überprüft werden.

Die DNA-Sequenzen von GH5 (1155 bp) und GH9 (2564 bp) wurden kommerziell von Synbio Technologies (Monmouth Junction, NJ, USA) synthetisiert. Das GH5-Gen wurde mit BamH1 und Apa1 doppelt verdaut, während das GH9-Gen mit BamH1 und XbaI verdaut wurde. Nach der Gelreinigung wurden die GH5- und GH9-Gene unter Verwendung von pCDNA 3.1 (ThermoFisher Scientific, Waltham, MA, USA) in E. coli DH5α (New England Biolabs, MA, USA) kloniert. Die erfolgreiche Klonierung des GH5- oder GH9-Gens wurde durch Isolierung von Plasmid-DNA aus E. coli-Übernachtkulturen, Doppelverdauung der Plasmid-DNA mit den oben genannten Restriktionsendonukleasen und Agarosegelelektrophorese (1,2 %) bestätigt.

Die Cellulaseaktivität der geklonten GH5- und GH9-Proteine ​​wurde sowohl mit einem Agarplattentest73 als auch mit dem 3,5-Dinitrosalicylsäure (DNS)-Reagenz74 verifiziert. Kurz gesagt, über Nacht wurden E. coli-Kulturen, die kloniertes GH5, GH9 oder den leeren Klonierungsvektor trugen, auf LB-Agarplatten geimpft, die Ampicillin (100 µg/ml) und CMC (0,5 %) enthielten. Nach 48-stündiger Inkubation bei 37 °C wurde jede Platte 30 Minuten lang mit 5 ml 0,2 % Kongo geflutet. Jede Platte wurde dann mit destilliertem Wasser gewaschen und dreimal mit 5 ml 0,5 M Natriumchlorid für 15–20 Minuten zur Farb-/Halo-Entwicklung gespült. Die Kolonien mit großen Lichthöfen wurden mithilfe des DNS-Agenten weiter überprüft. Kurz gesagt, E. coli-Kulturen, die das klonierte GH5, GH9 und kein Insert (leere pCDNA 3.1) trugen, wurden 24 und 48 Stunden lang in LB-Brühe bei 37 °C gezüchtet. Nach 15-minütiger Zentrifugation bei 2000 × g und 4 °C wurden 500 μl Überstand jeder Kultur als Quelle für geklonte GHs mit 500 μl 1 % CMC (in 50 mM Natriumacetatpuffer, pH 5) gemischt. Die Mischung wurde 30 Minuten lang bei 60 °C inkubiert und die Reaktion durch Zugabe von 1,0 ml DNS-Reagenz und 5-minütiges Kochen gestoppt. Die optische Dichte wurde bei 540 nm gemessen, wobei eine E. coli-Kultur leere pCDNA 3.1 als Blindwert trug. Eine Standardkurve wurde mit einer Reihe von Glukosekonzentrationen erstellt. Der DNS-Assay wurde dreifach durchgeführt (sowohl für jede E. coli-Kultur als auch für jeden Glukosestandard).

Die viralen Contigs wurden anhand konservativer Kriterien nach ARGs durchsucht37. Kurz gesagt, wir haben die CARD-Datenbank (v3.0.7)75 heruntergeladen und sie mithilfe von BLASTp mit einem Schwellenwert von 80 % Sequenzidentität und 40 % Alignment-Abdeckung nach ARGs durchsucht, die von den viralen Contigs von RVD getragen werden. Wir haben auch ARGs in RVD mit den NCBI AMRfinder-Tools v.3.8.476 durchsucht, einem hochpräzisen Tool, das eine von Experten kuratierte integrierte Datenbank verwendet. Die identifizierten wahrscheinlich ARG-tragenden Virus-Contigs wurden kuratiert, um echte Virussequenzen beizubehalten, wobei die obige Pipeline zur Identifizierung von AMG-haltigen vMAGs verwendet wurde. Um konservativ zu sein, wurden die viralen Contigs mit ARGs am Ende entfernt, es sei denn, sie grenzten an ein virusbezogenes Gen. Insgesamt wurden 22 ARG-tragende virale Contigs gefunden und einzeln manuell überprüft, um ihren viralen Ursprung anhand der Annotation des Genomkontexts zu bestimmen. Die detaillierte Annotation und manuelle Kuratierung einzelner ARG-tragender Virus-Contigs ist in den Zusatzdaten 5 dargestellt. Die repräsentativen Virus-Contigs, die jeden ARG-Typ tragen, wurden basierend auf der CheckV-Vollständigkeit und der Anzahl der zellulären Gene ausgewählt. Die viralen Contigs mit der höchsten Vollständigkeit und den wenigsten zellulären Genen wurden als repräsentative virale Contigs ausgewählt und ihre genomischen Organisationen wurden einzeln mit easyfig77 dargestellt und manuell mit Anmerkungen versehen.

Wir haben RVD anhand der vOTU-Prävalenz auf das Vorhandensein eines zentralen Pansenviroms untersucht. Wir fanden kein „globales“ Pansenkernvirom in allen 975 Pansenmetagenomen. Wir haben uns daher nur auf 283 Rinder konzentriert, für die Angaben zur Zusammensetzung der Nahrung vorliegen. Diese Rinder wurden basierend auf dem Konzentratgehalt ihrer Ernährung in drei Gruppen eingeteilt: niedrig (unter 30 % Konzentrat), mittel (30–50 % Konzentrat) und hoch (>50 % Konzentrat). Zuerst haben wir die Rohhäufigkeitstabelle in eine binäre Matrix (Anwesenheit oder Abwesenheit) umgewandelt. Anschließend wurde die Prävalenz jedes vOTU in jeder Stichprobe berechnet. Ein vOTU wurde in das Kernpansenvirom aufgenommen, wenn seine Prävalenz 50 % der Prävalenz für jede Konzentratstufe oder alle Rinder überstieg. Basierend auf der Prävalenz wurden die vOTUs in folgende Kategorien eingeteilt: individualisiert (beobachtet in nur einer Probe), ein Konzentratniveau (beobachtet in mehr als einer Probe, aber ausschließlich bei einem einzigen Konzentratniveau), zwei Konzentratniveaus (beobachtet bei Tieren bei zwei Konzentratniveaus) und drei Konzentratstufen (beobachtet in allen drei Konzentratstufen). Die Anzahl der vOTUs, die sich die Kernvirome in den drei Konzentratstufen teilen, wurde mit einem Venn-Diagramm in R visualisiert. Wir untersuchten, ob Tiere mit derselben Ernährung oder derselben Rasse mehr vOTUs gemeinsam haben als Tiere, die mit unterschiedlichen Diäten oder Rassen gefüttert wurden, und zwar unter Verwendung von Teilmengen von Daten von Stewart et al.78 bzw. Li et al.79. Der Kruskal-Wallis-Test wurde verwendet, um die Anzahl gemeinsamer vOTUs in verschiedenen Gruppen in R zu vergleichen.

Die Abdeckung jedes vOTU im RVD in den 975 Pansenmetagenomen wurde weiter untersucht, indem die metagenomischen Sequenzablesungen mithilfe von CoverM mit den oben beschriebenen Parametern auf RVD abgebildet wurden. Basierend auf den Lesekartierungsergebnissen wurde der Virusreichtum pro Milliarde Basenpaare in jedem Metagenom berechnet und wie zuvor beschrieben als Proxy für den Reichtum verwendet4. Mit der Häufigkeitstabelle wurde die Beta-Diversität basierend auf der Bray-Curtis-Unähnlichkeit unter Verwendung des veganen Pakets80 in R berechnet und PERMANOVA wurde mit 999 Permutationen durchgeführt, um Unterschiede zwischen Viromen mit der Adonis-Funktion des veganen Pakets in R zu testen verglichen zwischen verschiedenen Tierarten, Ländern und Studien unter Verwendung des Kruskal-Wallis-Tests in R. Die Ergebnisse wurden mit ggplot2 in R visualisiert. Da in den Alpha- und Beta-Diversitätsergebnissen Variationen von Studie zu Studie zu sehen waren, haben wir getestet, wie Studien könnten mit hierarchischer Clusterbildung basierend auf der Anzahl der von den Studien gemeinsam genutzten vOTUs geclustert werden, wie zuvor beschrieben4. Bei Studien, die mehrere Wiederkäuerarten oder mehrere Produktionssysteme (Milchvieh und Rindfleisch) umfassten, wurde jede Art oder jedes System als separate „Studie“ betrachtet. Für die Analyse wurden nur Studien mit jeweils > 12 Metagenomen herangezogen. Die Anzahl der von zwei Studien gemeinsam genutzten vOTUs wurde für jedes Studienpaar verglichen und die Ergebnisse einer hierarchischen Clusterung unterzogen. Die hierarchischen Clustering-Ergebnisse wurden in R mit dem ComplexHeatmap-Paket81 visualisiert und entsprechend den Metadaten mit Anmerkungen versehen.

Die statistischen Tests wurden in R durchgeführt und waren wie in den vorherigen Abschnitten und in den Abbildungslegenden beschrieben. Die Skripte für die statistische Analyse und Visualisierung sind im GitHub-Repository verfügbar (https://github.com/yan1365/RVD). Zur Vorbestimmung der Stichprobengröße wurde keine statistische Methode verwendet, da in dieser Studie keine neuen Experimente durchgeführt wurden. Die von uns verwendeten Daten stammten aus veröffentlichten Studien und die Behandlungsgruppen wurden auf der Grundlage der von den einzelnen Studien gemeldeten Metadaten bestimmt.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Die in RVD enthaltenen viralen Genome und die zugehörigen Informationen können ohne Einschränkung unter https://zenodo.org/record/7412085#.ZDsE2XbMK5c abgerufen und heruntergeladen werden.

Die benutzerdefinierten Bash-, Python- und R-Skripte, die zum Verarbeiten und Analysieren der Daten und zum Generieren der Zahlen verwendet werden, sind unter https://github.com/yan1365/RVD verfügbar.

Gregory, AC et al. Makro- und Mikrodiversität mariner DNA-Viren von Pol zu Pol. Zelle 177, 1109–1123.e1114 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Roux, S. et al. Ökogenomik und mögliche biogeochemische Auswirkungen global vorkommender Meeresviren. Natur 537, 689–693 (2016).

Artikel CAS PubMed Google Scholar

Camarillo-Guerrero, LF et al. Massive Ausweitung der Bakteriophagenvielfalt im menschlichen Darm. Zelle 184, 1098–1109 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Gregory, AC et al. Die Darmvirom-Datenbank deckt altersabhängige Muster der Viromdiversität im menschlichen Darm auf. Cell Host Microbe 28, 724–740 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Nayfach, S. et al. Metagenomisches Kompendium von 189.680 DNA-Viren aus dem menschlichen Darmmikrobiom. Nat. Mikrobiol. 6, 960–970 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Emerson, JB et al. Wirtsgebundene Bodenvirenökologie entlang eines Permafrost-Taugradienten. Nat. Mikrobiol. 3, 870–880 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Howard-Varona, C. et al. Phagenspezifische metabolische Neuprogrammierung von Virozellen. ISME J. 14, 881–895 (2020).

Artikel PubMed PubMed Central Google Scholar

Dominguez-Huerta, G. et al. Vielfalt und ökologischer Fußabdruck globaler Ozean-RNA-Viren. Wissenschaft 376, 1202–1208 (2022).

Artikel ADS CAS PubMed Google Scholar

Tisza, MJ & Buck, CB Ein Katalog von Zehntausenden Viren aus menschlichen Metagenomen enthüllt verborgene Zusammenhänge mit chronischen Krankheiten. Proz. Natl Acad. Wissenschaft. USA 118, e2023202118 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Huws, SA et al. Bewältigung globaler landwirtschaftlicher Herausforderungen für Wiederkäuer durch Verständnis des Pansen-Mikrobioms: Vergangenheit, Gegenwart und Zukunft. Vorderseite. Mikrobiol. 9, 2161 (2018).

Artikel PubMed PubMed Central Google Scholar

Gilbert, RA et al. Pansenviruspopulationen: Technologische Fortschritte erweitern das aktuelle Verständnis. Vorderseite. Mikrobiol. 11, 450 (2020).

Artikel PubMed PubMed Central Google Scholar

Gilbert, R. & Ouwerkerk, D. Die Genetik von Pansenphagenpopulationen. Verfahren 36, 165 (2019).

Google Scholar

Klieve, AV & Bauchop, T. Morphologische Vielfalt von Pansenbakteriophagen von Schafen und Rindern. Appl. Umgebung. Mikrobiol. 54, 1637–1641 (1988).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Ritchie, A., Robinson, I. & Allison, M. Pansen-Bakteriophage: Übersicht über morphologische Typen. Mikrosk. Elektron. 3, 333–334 (1970).

Google Scholar

Gilbert, RA & Klieve, AV in Pansenmikrobiologie: Von der Evolution zur Revolution 121–141 (Springer, 2015).

Gilbert, RA et al. Zum Verständnis der Phagen-Wirt-Interaktionen im Pansen; vollständige Genomsequenzen lytischer Phagen, die Pansenbakterien infizieren. Vorderseite. Mikrobiol. 8, 2340 (2017).

Artikel PubMed PubMed Central Google Scholar

Friedersdorff, JC et al. Die Isolierung und Genomsequenzierung von fünf neuartigen Bakteriophagen aus dem Pansen, die gegen Butyrivibrio fibrisolvens aktiv sind. Vorderseite. Mikrobiol. 11, 1588 (2020).

Artikel PubMed PubMed Central Google Scholar

Berg Miller, ME et al. Phagen-Bakterien-Beziehungen und CRISPR-Elemente wurden durch eine metagenomische Untersuchung des Pansenmikrobioms aufgedeckt. Umgebung. Mikrobiol. 14, 207–227 (2012).

Artikel CAS PubMed Google Scholar

Ross, EM, Petrovski, S., Moate, PJ & Hayes, BJ Metagenomik von Pansenbakteriophagen von dreizehn laktierenden Milchkühen. BMC Mikrobiol. 13, 242 (2013).

Artikel PubMed PubMed Central Google Scholar

Parmar, NR, Jakhesara, SJ, Mohapatra, A. & Joshi, CG Pansenvirom: eine Bewertung viraler Gemeinschaften und ihrer Funktionen im Pansen eines indischen Büffels. Curr. Wissenschaft. Rev. 111, 919–925 (2016).

Nayfach, S. et al. CheckV bewertet die Qualität und Vollständigkeit von aus Metagenomen zusammengesetzten Virusgenomen. Nat. Biotechnologie. 39, 578–585 (2021).

Artikel CAS PubMed Google Scholar

Guo, J. et al. VirSorter2: ein von Experten geleiteter Multiklassifizierer-Ansatz zum Nachweis verschiedener DNA- und RNA-Viren. Mikrobiom 9, 1–13 (2021).

Artikel Google Scholar

Kieft, K., Zhou, Z. & Anantharaman, K. VIBRANT: Automatisierte Wiederherstellung, Annotation und Kuration mikrobieller Viren und Bewertung der Funktion der Virusgemeinschaft anhand genomischer Sequenzen. Mikrobiom 8, 1–23 (2020).

Artikel Google Scholar

Zayed, AA et al. efam: eine erweiterte, Metaproteom-gestützte HMM-Profildatenbank viraler Proteinfamilien. Bioinformatik 37, 4202–4208 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Roux, S. et al. Mindestinformationen über ein unkultiviertes Virusgenom (MIUViG). Nat. Biotechnologie. 37, 29–37 (2019).

Artikel CAS PubMed Google Scholar

Jang, HB et al. Die taxonomische Zuordnung unkultivierter prokaryontischer Virusgenome wird durch Gen-Sharing-Netzwerke ermöglicht. Nat. Biotechnologie. 37, 632–639 (2019).

Artikel Google Scholar

Roux, S. et al. IMG/VR v3: ein integriertes ökologisches und evolutionäres Framework zur Untersuchung von Genomen nicht kultivierter Viren. Nukleinsäuren Res. 49, D764–D775 (2021).

Artikel CAS PubMed Google Scholar

Sölden, LM et al. Die Kreuzfütterung zwischen den Arten orchestriert den Kohlenstoffabbau im Pansen-Ökosystem. Nat. Mikrobiol. 3, 1274–1284 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Anderson, CL, Sullivan, MB & Fernando, SC Nahrungsenergie treibt die dynamische Reaktion der Virusgemeinschaften im Rinderpansen an. Mikrobiom 5, 155 (2017).

Artikel PubMed PubMed Central Google Scholar

Pratama, AA et al. Erweiterte Standards in der Viromik: In-silico-Bewertung der Identifizierung, Klassifizierung und Kuration von Hilfsmetabolikgenomen des dsDNA-Virusgenoms. PeerJ 9, e11447 (2021).

Artikel PubMed PubMed Central Google Scholar

Marbouty, M., Thierry, A. & Koszul, R. Phagen-Bakterien-Interaktionsnetzwerk des gesunden menschlichen Darms. Vorabdruck unter https://doi.org/10.1101/2020.05.13.093716 (2020).

Kinsella, CM et al. Entamoeba- und Giardia-Parasiten, die als Wirte von CRESS-Viren in Frage kommen. Nat. Komm. 11, 4620 (2020).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Park, T., Wijeratne, S., Meulia, T., Firkins, JL & Yu, Z. Das makronukleäre Genom des anaeroben Wimpertiers Entodinium caudatum offenbart seine biologischen Merkmale, die an die besondere Pansenumgebung angepasst sind. Genomics 113, 1416–1427 (2021).

Artikel CAS PubMed Google Scholar

Hampton, HG, Watson, BN & Fineran, PC Das Wettrüsten zwischen Bakterien und ihren Phagenfeinden. Natur 577, 327–336 (2020).

Artikel ADS CAS PubMed Google Scholar

Murphy, J., Mahony, J., Ainsworth, S., Nauta, A. & van Sinderen, D. Bakteriophagen-Orphan-DNA-Methyltransferasen: Erkenntnisse aus ihrem bakteriellen Ursprung, ihrer Funktion und ihrem Vorkommen. Appl. Umgebung. Mikrobiol. 79, 7547–7555 (2013).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Heyerhoff, B., Engelen, B. & Bunse, C. Hilfsmetabolische Genfunktionen in pelagischen und benthischen Viren der Ostsee. Vorderseite. Mikrobiol. 13, 863620 (2022).

Artikel PubMed PubMed Central Google Scholar

Enault, F. et al. Phagen kodieren selten Antibiotikaresistenzgene: ein warnendes Beispiel für Viromanalysen. ISME J. 11, 237–247 (2017).

Artikel CAS PubMed Google Scholar

Ma, T. et al. Die Expression des Resistoms ist mit den Schlüsselfunktionen und der Stabilität des aktiven Pansenmikrobioms verbunden. Anim. Mikrobiom 4, 1–17 (2022).

Artikel Google Scholar

Xue, M.-Y. et al. Das Pansenresistom von Milchkühen ist individualisiert und die Resistotypen sind mit Melkmerkmalen verbunden. Anim. Mikrobiom 3, 1–17 (2021).

Artikel Google Scholar

Bickhart, DM et al. Zuordnung von Virus- und antimikrobiellen Resistenzgenen zu mikrobiellen Wirten in einer komplexen mikrobiellen Gemeinschaft durch kombinierte Long-Read-Assemblierung und Proximity-Ligation. Genombiol. 20, 1–18 (2019).

Artikel CAS Google Scholar

Swain, RA, Nolan, JV & Klieve, AV Natürliche Variabilität und Tagesschwankungen innerhalb der Bakteriophagenpopulation des Pansens. Appl. Umgebung. Mikrobiol. 62, 994–997 (1996).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Zayed, AA et al. Kryptische und häufig vorkommende Meeresviren am evolutionären Ursprung des RNA-Viroms der Erde. Wissenschaft 376, 156–162 (2022).

Artikel ADS CAS PubMed Google Scholar

Starr, EP, Nuccio, EE, Pett-Ridge, J., Banfield, JF & Firestone, MK Metatranskriptomische Rekonstruktion enthüllt RNA-Viren mit dem Potenzial, den Kohlenstoffkreislauf im Boden zu beeinflussen. Proz. Natl Acad. Wissenschaft. USA 116, 25900–25908 (2019).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Hitch, TC, Edwards, JE & Gilbert, RA Metatranskriptomik deckt Mykovirpopulationen im Pansen von Schafen auf. FEMS Mikrobiol. Lette. 366, fnz161 (2019).

Artikel CAS PubMed Google Scholar

Touchon, M., De Sousa, JAM & Rocha, EP Den Feind umarmen: die Diversifizierung mikrobieller Genrepertoires durch phagenvermittelten horizontalen Gentransfer. Curr. Meinung. Mikrobiol. 38, 66–73 (2017).

Artikel CAS PubMed Google Scholar

Hughes, K., Sutherland, I., Clark, J. & Jones, M. Bakteriophagen und zugehörige Polysaccharid-Depolymerasen – neuartige Werkzeuge zur Untersuchung bakterieller Biofilme. J. Appl. Mikrobiol. 85, 583–590 (1998).

Artikel CAS PubMed Google Scholar

Rice, SA et al. Der Biofilm-Lebenszyklus und die Virulenz von Pseudomonas aeruginosa hängen von einem filamentösen Prophagen ab. ISME J. 3, 271–282 (2009).

Artikel CAS PubMed Google Scholar

Koenig, KM, Newbold, CJ, McIntosh, FM & Rode, LM Auswirkungen von Protozoen auf das bakterielle Stickstoffrecycling im Pansen. J. Anim. Wissenschaft. 78, 2431–2445 (2000).

Artikel CAS PubMed Google Scholar

Gazitua, MC et al. Möglicher virusvermittelter Stickstoffkreislauf in sauerstoffarmen Meeresgewässern. ISME J. 15, 981–998 (2021).

Artikel CAS PubMed Google Scholar

Kieft, K. et al. Ökologie des Hilfsstoffwechsels von anorganischem Schwefel in weit verbreiteten Bakteriophagen. Nat. Komm. 12, 3503 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Wang, D. et al. Charakterisierung mikrobieller Strukturvariationen im Darm als Determinanten des menschlichen Gallensäurestoffwechsels. Cell Host Microbe 29, 1802–1814.e1805 (2021).

Artikel CAS PubMed Google Scholar

Li, F. et al. Die Wirtsgenetik beeinflusst die Pansenmikrobiota und vererbbare Pansenmikrobenmerkmale, die mit der Futtereffizienz bei Rindern verbunden sind. Mikrobiom 7, 1–17 (2019).

Artikel Google Scholar

Altermann, E., Schofield, LR, Ronimus, RS, Beattie, AK & Reilly, K. Hemmung von Pansen-Methanogenen durch ein neuartiges archaeisches lytisches Enzym, das auf maßgeschneiderten Bionanopartikeln angezeigt wird. Vorderseite. Mikrobiol. 9, 2378 (2018).

Artikel PubMed PubMed Central Google Scholar

Chen, S., Zhou, Y., Chen, Y. & Gu, J. fastp: ein ultraschneller All-in-One-FASTQ-Präprozessor. Bioinformatik 34, i884–i890 (2018).

Artikel PubMed PubMed Central Google Scholar

Saary, P., Forslund, K., Bork, P. & Hildebrand, F. RTK: effiziente Verdünnungsanalyse großer Datensätze. Bioinformatik 33, 2594–2595 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Hyatt, D. et al. Prodigal: prokaryotische Generkennung und Identifizierung der Translationsinitiationsstelle. BMC Bioinform. 11, 119 (2010).

Artikel Google Scholar

Yutin, N. et al. Die Analyse von aus Metagenomen zusammengesetzten Virusgenomen aus dem menschlichen Darm zeigt verschiedene mutmaßliche CrAss-ähnliche Phagen mit einzigartigen genomischen Merkmalen. Nat. Komm. 12, 1–11 (2021).

Artikel Google Scholar

Gulyaeva, A. et al. Entdeckung, Diversität und funktionelle Assoziationen von crAss-ähnlichen Phagen in menschlichen Darmmetagenomen aus vier niederländischen Kohorten. Cell Rep. 38, 110204 (2022).

Artikel CAS PubMed Google Scholar

Guerin, E. et al. Biologie und Taxonomie von CrAss-ähnlichen Bakteriophagen, dem am häufigsten vorkommenden Virus im menschlichen Darm. Cell Host Microbe 24, 653.e6–664.e6 (2018).

Artikel Google Scholar

Low, SJ, Džunková, M., Chaumeil, P.-A., Parks, DH & Hugenholtz, P. Auswertung einer verketteten Proteinphylogenie zur Klassifizierung von doppelsträngigen DNA-Viren mit Schwanz, die zur Ordnung Caudovirales gehören. Nat. Mikrobiol. 4, 1306–1315 (2019).

Artikel CAS PubMed Google Scholar

Eddy, SR Beschleunigte Profil-HMM-Suchen. PLoS Comput. Biol. 7, e1002195 (2011).

Artikel ADS MathSciNet CAS PubMed PubMed Central Google Scholar

Katoh, K. & Standley, DM MAFFT Multiple Sequence Alignment Software Version 7: Verbesserungen bei Leistung und Benutzerfreundlichkeit. Mol. Biol. Entwicklung 30, 772–780 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Capella-Gutiérrez, S., Silla-Martínez, JM & Gabaldón, T. trimAl: ein Werkzeug zum automatisierten Alignment-Trimmen in groß angelegten phylogenetischen Analysen. Bioinformatik 25, 1972–1973 (2009).

Artikel PubMed PubMed Central Google Scholar

Price, MN, Dehal, PS & Arkin, AP FastTree 2 – Bäume mit ungefähr maximaler Wahrscheinlichkeit für große Ausrichtungen. PLoS ONE 5, e9490 (2010).

Artikel ADS PubMed PubMed Central Google Scholar

Letunic, I. & Bork, P. Interactive Tree Of Life (iTOL) v4: aktuelle Updates und neue Entwicklungen. Nukleinsäuren Res. 47, W256–W259 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Coclet, C. & Roux, S. Globaler Überblick und große Herausforderungen der Wirtsvorhersagemethoden für nicht kultivierte Phagen. Curr. Meinung. Virol. 49, 117–126 (2021).

Artikel CAS PubMed Google Scholar

Chaumeil, PA, Mussig, AJ, Hugenholtz, P. & Parks, DH GTDB-Tk: ein Toolkit zur Klassifizierung von Genomen mit der Genome Taxonomy Database. Bioinformatik 36, 1925–1927 (2019).

Artikel PubMed PubMed Central Google Scholar

Li, Z. et al. Genomische Einblicke in die Phylogenie und biomasseabbauende Enzyme von Pansenwimpern. ISME J. 16, 2775–2787 (2022).

Artikel CAS PubMed Google Scholar

Bland, C. et al. CRISPR-Erkennungstool (CRT): ein Tool zur automatischen Erkennung gehäufter palindromischer Wiederholungen in regelmäßigen Abständen. BMC Bioinform. 8, 1–8 (2007).

Artikel Google Scholar

Shannon, P. et al. Cytoscape: eine Softwareumgebung für integrierte Modelle biomolekularer Interaktionsnetzwerke. Genomres. 13, 2498–2504 (2003).

Artikel CAS PubMed PubMed Central Google Scholar

Nguyen, L.-T., Schmidt, HA, Von Haeseler, A. & Minh, BQ IQ-TREE: ein schneller und effektiver stochastischer Algorithmus zur Schätzung von Phylogenien mit maximaler Wahrscheinlichkeit. Mol. Biol. Entwicklung 32, 268–274 (2015).

Artikel CAS PubMed Google Scholar

Shaffer, M. et al. DRAM zum Destillieren des mikrobiellen Stoffwechsels, um die Kuration der Mikrobiomfunktion zu automatisieren. Nukleinsäuren Res. 48, 8883–8900 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Danso, B., Ali, SS, Xie, R. & Sun, J. Valorisierung der Weizenstroh- und Bioethanolproduktion durch einen neuartigen Xylanase- und Cellulase-produzierenden Streptomyces-Stamm, der aus der holzfressenden Termite, der Art Microcerotermes, isoliert wurde. Kraftstoff 310, 122333 (2022).

Artikel CAS Google Scholar

Miller, GL Verwendung von Dinitrosalicylsäure-Reagenz zur Bestimmung von reduzierendem Zucker. Anal. Chem. 31, 426–428 (1959).

Artikel CAS Google Scholar

Alcock, BP et al. CARD 2020: Antibiotika-Resistom-Überwachung mit der umfassenden Antibiotika-Resistenz-Datenbank. Nukleinsäuren Res. 48, D517–D525 (2020).

CAS PubMed Google Scholar

Feldgarden, M. et al. Validierung des AMRFinder-Tools und der Resistenzgendatenbank durch Verwendung von Genotyp-Phänotyp-Korrelationen antimikrobieller Resistenzen in einer Sammlung von Isolaten. Antimikrob. Agenten Chemother. 63, e00483–00419 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Sullivan, MJ, Petty, NK & Beatson, SA Easyfig: ein Visualisierer für den Genomvergleich. Bioinformatik 27, 1009–1010 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Stewart, RD et al. Zusammenstellung von 913 mikrobiellen Genomen aus der metagenomischen Sequenzierung des Kuhpansens. Nat. Komm. 9, 1–11 (2018).

Artikel CAS Google Scholar

Li, F., Hitch, TC, Chen, Y., Creevey, CJ & Guan, LL Vergleichende metagenomische und metatranskriptomische Analysen zeigen den Einfluss der Rasse auf das Pansenmikrobiom und seine Zusammenhänge mit der Futtereffizienz bei Rindern. Mikrobiom 7, 1–21 (2019).

Artikel Google Scholar

Oksanen, J. et al. Das vegane Paket. Gemeinschaftsecol. Paket 10, 719 (2007).

Google Scholar

Gu, Z., Eils, R. & Schlesner, M. Komplexe Heatmaps offenbaren Muster und Korrelationen in mehrdimensionalen Genomdaten. Bioinformatik 32, 2847–2849 (2016).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Die Autoren bedanken sich für die Finanzierung dieses Projekts durch das USDA National Institute of Food and Agriculture (Preisnummer: 2021-67015-33393).

Abteilung für Tierwissenschaften, Ohio State University, Columbus, OH, USA

Ming Yan, Sripoorna Somasundaram und Zhongtang Yu

Zentrum für Mikrobiomwissenschaft, Ohio State University, Columbus, OH, USA

Ming Yan, Akbar Adjie Pratama, Sripoorna Somasundaram, Matthew B. Sullivan und Zhongtang Yu

Abteilung für Mikrobiologie, Ohio State University, Columbus, OH, USA

Akbar Adjie Pratama und Matthew B. Sullivan

Hochschule für Tierwissenschaften und -technologie, Northwest A&F University, Yangling, China

Zongjun Li & Yu Jiang

Abteilung für Bau-, Umwelt- und Geodätische Ingenieurwissenschaften, Ohio State University, Columbus, OH, USA

Matthew B. Sullivan

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

MY und ZY haben die Studie entworfen. MY und AAP führten die bioinformatischen Analysen durch. SS führte die Klonierung und Expression von GH5 und GH9 durch. ZL und YJ trugen zu den bioinformatischen Analysen bei. MY und ZY haben das Manuskript geschrieben. MBS und alle anderen Co-Autoren haben die Entwürfe des Manuskripts redigiert.

Korrespondenz mit Zhongtang Yu.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Nature Communications dankt den anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Eine Peer-Review-Datei ist verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Yan, M., Pratama, AA, Somasundaram, S. et al. Untersuchung der viralen dunklen Materie des Pansen-Ökosystems mit einer globalen Virom-Datenbank. Nat Commun 14, 5254 (2023). https://doi.org/10.1038/s41467-023-41075-2

Zitat herunterladen

Eingegangen: 28. November 2022

Angenommen: 21. August 2023

Veröffentlicht: 29. August 2023

DOI: https://doi.org/10.1038/s41467-023-41075-2

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.