La metagenómica viral utiliza tecnologías metagenómicas para detectar material genómico viral de diversas muestras ambientales y clínicas. [1] [2] Los virus son la entidad biológica más abundante y son extremadamente diversos; sin embargo, solo una pequeña fracción de virus ha sido secuenciada y solo una fracción aún más pequeña ha sido aislada y cultivada. [1] [3] La secuenciación de virus puede ser un desafío porque los virus carecen de un gen marcador universalmente conservado, por lo que los enfoques basados en genes son limitados. [3] [4] La metagenómica se puede utilizar para estudiar y analizar virus no cultivables y ha sido una herramienta importante para comprender la diversidad y abundancia viral y en el descubrimiento de nuevos virus. [1] [5] [6] Por ejemplo, los métodos metagenómicos se han utilizado para describir virus asociados con tumores cancerosos y en ecosistemas terrestres. [7]
Los métodos tradicionales para descubrir, caracterizar y asignar taxonomía viral a los virus se basaban en aislar la partícula viral o su ácido nucleico a partir de muestras. [8] La morfología del virus podía visualizarse mediante microscopía electrónica, pero solo si el virus podía aislarse en un título lo suficientemente alto como para ser detectado. El virus podía cultivarse en líneas celulares eucariotas o bacterias, pero solo si se conocía el tipo de célula huésped apropiado, y el ácido nucleico del virus se detectaría mediante PCR, pero solo si se conocía un cebador de consenso. [8]
La metagenómica no requiere conocimientos previos del genoma viral, ya que no requiere un gen marcador universal ni un diseño de cebador o sonda. [9] Debido a que este método utiliza herramientas de predicción para detectar el contenido viral de una muestra, se puede utilizar para identificar nuevas especies de virus o miembros divergentes de especies conocidas.
Los primeros estudios metagenómicos de virus se llevaron a cabo en muestras oceánicas en 2002. Las secuencias que coincidieron con las secuencias de referencia fueron predominantemente bacteriófagos de ADN bicatenario y virus de algas bicatenarios. [10]
En 2016, el Comité Internacional de Taxonomía de Virus (ICTV) reconoció oficialmente que los genomas virales ensamblados a partir de datos metagenómicos pueden clasificarse utilizando los mismos procedimientos que los virus aislados mediante enfoques de virología clásica. [11]
En el estudio de metagenómica de 2002, los investigadores descubrieron que el 65% de las secuencias de virus de ADN y ARN no tenían coincidencias en las bases de datos de referencia. [10] Este fenómeno de secuencias virales no coincidentes en las bases de datos de referencia de secuencias es frecuente en los estudios de metagenómica viral y se lo conoce como "materia oscura viral". [3] [8] Es causado predominantemente por la falta de secuencias completas del genoma viral de diversas muestras en las bases de datos de referencia y la rápida tasa de evolución viral. [3] [8]
Además de estos desafíos, existen siete clases de virus según el sistema de clasificación de Baltimore, que agrupa a los virus en función de su estructura genómica y su forma de transcripción: hay virus de ADN de doble cadena, virus de ADN de cadena sencilla, virus de ARN de doble cadena y virus de ARN de cadena sencilla. [12] El ARN de cadena sencilla puede ser de sentido positivo o negativo. Estos diferentes tipos de ácidos nucleicos necesitan diferentes enfoques de secuenciación y no existe un marcador genético universal que se conserve para todos los tipos de virus. [3] [4] Los enfoques basados en genes solo pueden dirigirse a grupos específicos de virus (como los virus de ARN que comparten una secuencia conservada de la ARN polimerasa). [3] [4]
En las bases de datos de referencia todavía existe un sesgo hacia los virus de ADN. Las razones más comunes de este sesgo son que los virus de ARN mutan más rápidamente que los virus de ADN, el ADN es más fácil de manipular a partir de muestras mientras que el ARN es inestable y se necesitan más pasos para el análisis metagenómico del ARN (transcripción inversa). [4] [8]
Las secuencias pueden estar contaminadas con las secuencias del organismo huésped, lo que resulta especialmente problemático si se desconoce el organismo huésped del virus. [4] También podría haber contaminación a partir de la extracción de ácidos nucleicos y la PCR. [4]
El análisis metagenómico utiliza la secuenciación shotgun del genoma completo para caracterizar la diversidad microbiana en muestras clínicas y ambientales. Se extrae el ADN y/o ARN total de las muestras y se prepara en una biblioteca de ADN o ARN para la secuenciación. [9] Estos métodos se han utilizado para secuenciar el genoma completo del virus de Epstein-Barr (VEB) y el VHC ; sin embargo, la contaminación de los ácidos nucleicos del huésped puede afectar la sensibilidad al genoma viral objetivo, y la proporción de lecturas relacionadas con la secuencia objetivo suele ser baja. [13] [14]
El sistema IMG/VR y el IMG/VR v.2.0 son las bases de datos de virus públicas interactivas más grandes con más de 760.000 secuencias virales metagenómicas y virus aislados y sirven como punto de partida para el análisis de secuencias de fragmentos virales derivados de muestras metagenómicas. [15] [16]
Si bien la metagenómica y la metatranscriptómica no dirigidas no necesitan un marcador genético, la secuenciación de amplicones sí. Utiliza un gen que está altamente conservado como marcador genético, pero debido a los variados tipos de ácidos nucleicos, el marcador utilizado tiene que ser para grupos específicos de virus. [3] [4] Esto se hace mediante la amplificación por PCR de cebadores que son complementarios a una secuencia de nucleótidos conocida y altamente conservada. [9] Luego, la PCR es seguida por métodos de secuenciación del genoma completo y se ha utilizado para rastrear las epidemias del virus del Ébola , [17] el virus del Zika , [18] y la COVID-19 [19] . La secuenciación de amplicones por PCR es más exitosa para la secuenciación del genoma completo de muestras con bajas concentraciones. Sin embargo, con genomas virales más grandes y la heterogeneidad de los virus de ARN, pueden requerirse múltiples cebadores superpuestos para cubrir la amplificación de todos los genotipos. La secuenciación de amplicones por PCR requiere conocimiento del genoma viral antes de la secuenciación, cebadores apropiados y depende en gran medida de los títulos virales; sin embargo, la secuenciación de amplicones por PCR es un método de evaluación más económico que la secuenciación metagenómica cuando se estudian virus conocidos con genomas relativamente pequeños. [9]
El enriquecimiento de dianas es un método independiente del cultivo que secuencia genomas virales directamente de una muestra utilizando pequeñas sondas de ARN o ADN complementarias a la secuencia de referencia de los patógenos. Las sondas, que pueden unirse a una fase sólida, capturan y extraen secuencias de ADN complementarias en la muestra. [9] La presencia de sondas superpuestas aumenta la tolerancia a los desajustes de cebadores, pero su diseño requiere un alto coste y tiempo, por lo que una respuesta rápida es limitada. La captura de ADN es seguida por un breve ciclo de PCR y una secuenciación shotgun. El éxito de este método depende de las secuencias de referencia disponibles para crear las sondas y no es adecuado para la caracterización de virus nuevos. [9] Este método se ha utilizado para caracterizar virus grandes y pequeños como el VHC , [14] el VHS-1 , [20] y el VHC . [21]
Los métodos de metagenómica viral pueden producir secuencias quiméricas erróneas . [22] [23] Estos pueden incluir artefactos in vitro de la amplificación y artefactos in silico del ensamblaje. [23] Las quimeras se pueden formar entre virus no relacionados, así como entre secuencias virales y eucariotas. [23] La probabilidad de errores se mitiga parcialmente con una mayor profundidad de secuenciación, pero las quimeras aún se pueden formar en áreas de alta cobertura si las lecturas están muy fragmentadas. [22]
Los virus de plantas representan una amenaza global para la producción de cultivos, pero a través de la secuenciación metagenómica y la creación de bases de datos virales, los virus de plantas modificados pueden usarse para ayudar a la inmunidad de las plantas, así como para alterar la apariencia física. [24] Los datos obtenidos sobre los genomas de virus de plantas a partir de la secuenciación metagenómica pueden usarse para crear virus clonados con los que inocular la planta para estudiar los componentes virales y la caracterización biológica de los agentes virales con una mayor reproducibilidad. Las cepas de virus mutantes diseñadas se han utilizado para alterar la coloración y el tamaño de varias plantas ornamentales y promover la salud de los cultivos. [25]
La metagenómica viral contribuye a la clasificación viral sin necesidad de metodologías basadas en cultivos y ha proporcionado amplios conocimientos sobre la diversidad viral en cualquier sistema. La metagenómica se puede utilizar para estudiar los efectos de los virus en un ecosistema determinado y cómo afectan al microbioma, así como para monitorear los virus en un ecosistema para su posible propagación a las poblaciones humanas. [1] Dentro de los ecosistemas, los virus se pueden estudiar para determinar cómo compiten entre sí, así como los efectos virales en las funciones del huésped. La metagenómica viral se ha utilizado para estudiar comunidades virales no cultivables en ecosistemas marinos y terrestres. [7] [26]
La metagenómica viral se utiliza con facilidad para descubrir nuevos virus, con especial atención a los zoonóticos o patógenos para los humanos. Las bases de datos virales obtenidas mediante metagenómica proporcionan métodos de respuesta rápida para determinar infecciones virales, así como para determinar variantes resistentes a fármacos en muestras clínicas. [9] Las contribuciones de la metagenómica viral a la clasificación viral han ayudado a los esfuerzos de vigilancia de pandemias y han hecho que la vigilancia y las pruebas de enfermedades infecciosas sean más asequibles. [27] Dado que la mayoría de las pandemias humanas son de origen zoonótico, la vigilancia metagenómica puede proporcionar una identificación más rápida de nuevos virus y sus reservorios. [28]
Un programa de vigilancia de este tipo es el Proyecto Global Virome (GVP), una iniciativa de investigación colaborativa internacional con sede en el One Health Institute de la Universidad de California, Davis . [29] [30] El GVP tiene como objetivo impulsar la vigilancia de enfermedades infecciosas en todo el mundo mediante el uso de métodos de secuenciación de bajo costo en países de alto riesgo para prevenir brotes de enfermedades y prevenir futuros brotes de virus. [27] [31]
La metagenómica viral se ha utilizado para detectar cánceres relacionados con virus y casos difíciles de diagnosticar en diagnósticos clínicos. [31] Este método se utiliza con mayor frecuencia cuando las pruebas moleculares convencionales y avanzadas no pueden encontrar un agente causal de la enfermedad. La secuenciación metagenómica también se puede utilizar para detectar virus patógenos en muestras clínicas y proporcionar datos en tiempo real sobre la presencia de patógenos en una población. [28]
Los métodos utilizados para la metagenómica viral clínica no están estandarizados, pero la Sociedad Europea de Virología Clínica ha publicado directrices. [32] [33] Se utiliza una mezcla de diferentes plataformas de secuenciación para la metagenómica viral clínica, siendo los más comunes los instrumentos de Illumina y Oxford Nanopore Technologies . También hay varios protocolos diferentes, tanto para el trabajo de laboratorio como para el análisis bioinformático, que están en uso. [34]