Exscalate4Cov (E4C) | |
---|---|
País | unión Europea |
Lanzado | 1 de abril de 2020 [1] |
Cerrado | 30 de septiembre de 2021 [1] |
Fondos | 2 970 875 € [1] |
Estado | Proyecto cerrado |
Sitio web | https://www.exscalate4cov.eu |
Exscalate4Cov fue un consorcio público-privado apoyado por el programa Horizonte Europa de la Unión Europea , cuyo objetivo era aprovechar la informática de alto rendimiento (HPC) como respuesta a la pandemia de coronavirus . El proyecto utilizó un software de diseño de fármacos asistido por ordenador de alto rendimiento y escala extrema para realizar experimentos. [2]
El proyecto Exsclate4Cov, acrónimo de EXaSCale smArt pLatform Against paThogEns for Corona Virus [1] , fue coordinado por Dompé Farmaceutici e involucró a 17 participantes. [1] Fue parte de la financiación de la fundación Horizonte 2020 SOCIETAL CHALLENGES - Salud, cambio demográfico y bienestar [3] .
El proyecto llevó a cabo uno de los mayores experimentos de detección virtual [4] y reposicionamiento de fármacos , [5] identificando una molécula potencialmente eficaz contra el SARS-CoV-2 . [6]
El descubrimiento de fármacos puede ser un proceso largo y costoso, que a menudo lleva años y requiere una inversión financiera sustancial. [7] Las compañías farmacéuticas tienen grandes conjuntos de datos de compuestos químicos , que prueban frente a un objetivo farmacológico , a menudo un receptor proteico . El objetivo es encontrar compuestos que interactúen con los objetivos, lo que conduce a posibles efectos terapéuticos. [8]
Por lo tanto, el proceso de búsqueda de nuevos fármacos suele implicar un cribado de alto rendimiento (HTS, por sus siglas en inglés). El HTS permite la rápida identificación de compuestos activos. [9] Por ejemplo, el cribado virtual se puede utilizar como una etapa temprana del proceso de descubrimiento de fármacos para evaluar las interacciones entre grandes conjuntos de datos de moléculas pequeñas y un objetivo farmacológico, identificando posibles candidatos a fármacos de éxito. Este enfoque ayuda a identificar posibles candidatos a fármacos de éxito al predecir cómo se unirán los diferentes compuestos a la proteína objetivo, lo que permitirá avanzar en la validación experimental. [9]
En un escenario informático urgente , como una pandemia, donde el tiempo para encontrar una solución es crítico, se utiliza el cribado virtual para identificar moléculas de éxito para las últimas etapas del proceso de descubrimiento de fármacos, como la optimización de los candidatos y los ensayos clínicos . [10] El proyecto Exscalate4Cov se inició después del brote de la pandemia de COVID-19. Este proyecto tenía como objetivo aprovechar la potencia computacional de las supercomputadoras de la UE para acelerar el descubrimiento de tratamientos efectivos para el coronavirus. [11] Al utilizar el cribado virtual de alto rendimiento, Exscalate4Cov tenía como objetivo encontrar soluciones más rápidas a la crisis.
El enfoque de Exscalate4Cov implicó analizar miles de millones de compuestos contra diversas proteínas diana del virus SARS-CoV-2 , identificando aquellas con una mayor afinidad de unión con la proteína diana. Los objetivos del proyecto fueron:
El proyecto Exscalate4Cov siguió al proyecto ANTAREX4ZIKA [14] , ambos con el objetivo de aprovechar la HPC para el descubrimiento de fármacos, aunque apuntando a diferentes virus. Mientras que Exscalate4Cov se centró en el virus SARS-CoV-2 responsable de COVID-19, ANTAREX4ZIKA se dedicó a abordar el virus Zika . El proyecto ANTAREX4ZIKA concluyó a fines de 2018 e involucró una campaña de detección virtual en la máquina CINECA Marconi, con un total de 10 PetaFLOPS. [14] El proyecto ANTAREX, [15] que significa AutoTuning and Adaptivity appRoach for Energy Efficient eXascale HPC systems, enfatizó el autoajuste y la eficiencia energética de las aplicaciones HPC, haciéndolas más efectivas en varios escenarios de investigación, incluido el descubrimiento de fármacos.
El consorcio de entidades público-privadas Exscalate4Cov ha sido coordinado por Dompè y en él han participado otras 17 instituciones, desde centros de investigación hasta universidades. [1]
Organización | Tipo | Industria | País |
---|---|---|---|
Dompé Farmacéuticos | Privado | Industria farmacéutica | Italia |
CINECA | Centro público de investigación | Supercomputación | Italia |
Politécnico de Milán | Universidad pública | Investigación científica y tecnológica, educación | Italia |
Universidad de Milán | Universidad pública | Investigación científica y tecnológica, educación | Italia |
Universidad Católica de Lovaina | Universidad pública | Investigación científica y tecnológica, educación | Bélgica |
Instituto Internacional de Biología Molecular y Celular | Centro público de investigación | Centro de investigación | Polonia |
Elettra Sincrotrone Trieste | Organizaciones de investigación | Centro de investigación | Italia |
Sociedad Fraunhofer | Organizaciones de investigación | Centro de investigación | Alemania |
Centro de Supercomputación de Barcelona | Centro público de investigación | Supercomputación | España |
Centro de investigación Jülich | Centro público de investigación | Supercomputación | Alemania |
Universidad de Nápoles Federico II | Universidad pública | Investigación científica y tecnológica, educación | Italia |
Universidad de Cagliari | Universidad pública | Investigación científica y tecnológica, educación | Italia |
SIB Instituto Suizo de Bioinformática | Centro público de investigación | Centro de investigación | Suiza |
Instituto Real de Tecnología KTH | Universidad pública | Investigación científica y tecnológica, educación | Suecia |
Instituto Nacional de Enfermedades Infecciosas Lazzaro Spallanzani | Organizaciones de investigación | Hospital | Italia |
Asociación Big Data | Compañía | Otro | Italia |
Instituto Nacional de Física Nuclear | Centro público de investigación | Centro de investigación | Italia |
Chelonia SA | Compañía | Otro | Suiza |
Las entradas en el nivel de aplicación consisten en ligandos del espacio químico y la proteína objetivo de la campaña de detección virtual, específicamente la proteína de pico en el caso de Exscalate4Cov. [11] Después de una etapa de acoplamiento molecular que genera conformaciones de ligando potenciales, una etapa de puntuación evalúa la fuerza de interacción entre la posición de cada ligando y la proteína. [4] El proceso finalmente produce una clasificación de compuestos exitosos como su resultado, indicando los candidatos más prometedores para una mayor investigación. [4]
A nivel de software, el proyecto utiliza la plataforma de acoplamiento EXSCALATE. [4] [14] LiGen (Ligand Generator) es uno de los componentes principales de la plataforma y se utiliza para realizar simulaciones de acoplamiento y puntuación molecular. LiGen es responsable de generar y evaluar las conformaciones de los ligandos. Otro componente relevante a este mismo nivel es la biblioteca libdpipe , que facilita el escalamiento a través de múltiples nodos y núcleos. [4]
Para aprovechar la potencia computacional que ofrecen los centros HPC, la plataforma de acoplamiento utiliza MPI [16] para escalar múltiples nodos y aceleración CUDA para aprovechar las GPU de las supercomputadoras. La versión CUDA ha experimentado varias optimizaciones, incluidas OpenACC , OpenMP y otras técnicas, [17] [18] [19] para mejorar el rendimiento y la eficiencia.
El experimento principal del proyecto evaluó las interacciones entre 12 proteínas virales del SARS-CoV-2 y 70 mil millones de moléculas de la biblioteca química EXSCALATE [12] . En noviembre de 2020, los miembros del consorcio coordinaron una de las campañas de detección virtual más grandes, aprovechando la potencia computacional combinada de dos supercomputadoras con un total de 81 PFLOPS. [20]
Los superordenadores utilizados son:
La campaña a gran escala utilizó una reserva de 800 nodos Marconi100 y 1500 nodos HP5 durante 60 horas. [4] Se logró un rendimiento promedio de 2400 ligandos por segundo (lig/s) en Marconi100 y 2000 lig/s en HPC5. [4]
Otro aspecto crítico del experimento fue la gestión del almacenamiento de datos. La plataforma aprovechó operaciones de E/S MPI eficientes [16] para manejar cálculos de múltiples nodos. Los datos de entrada requerían 3,3 TB de espacio en formato SMILES . [4] Sin embargo, los datos SMILES debían expandirse en un paso de preprocesamiento que involucraba 100 nodos durante cinco días. [4] De manera similar, el paso de posprocesamiento involucraba 19 nodos durante cinco días.
El resultado final consistió en archivos CSV que contenían puntuaciones para cada ligando de entrada, ocupando 69 TB. [4] El conjunto de datos resultante, que contiene 570 millones de compuestos coincidentes, está disponible de forma gratuita. [4]
El proyecto Exscalate4Cov también llevó a cabo experimentos de reposicionamiento de fármacos . [5] La reutilización de fármacos ofrece un enfoque interesante para abordar necesidades clínicas no satisfechas en caso de urgencia debido a pandemias . Por lo tanto, la reutilización de fármacos existentes con perfiles de seguridad y toxicología establecidos proporciona una ventaja significativa al ahorrar tiempo en la identificación de posibles nuevos tratamientos. [8] Durante las actividades del proyecto europeo Exscalate4Cov, se seleccionó raloxifeno a través de un enfoque combinado de reutilización de fármacos y detección in silico en las proteínas diana del SARS-CoV-2, seguido de una posterior detección in vitro. [4] [5]
Los resultados de la campaña a gran escala del proyecto están disponibles a través de la plataforma MEDIATE (MolEcular DockIng AT homE). [23] El objetivo de MEDIATE [24] es recopilar una biblioteca química de inhibidores del Sars-COV-2. El portal MEDIATE proporciona acceso a un conjunto de moléculas pequeñas que la investigación puede utilizar para iniciar el diseño de fármacos de novo a partir de un conjunto reducido de moléculas.
El raloxifeno es un compuesto químico conocido que se utiliza para tratar la osteoporosis . Como resultado de los experimentos de reposicionamiento de fármacos , el proyecto E4C identificó al raloxifeno como un posible candidato para tratar a pacientes con COVID-19 en etapa temprana, [6] [5] con el objetivo de prevenir la progresión clínica. [25] En octubre de 2020, la AIFA autorizó ensayos clínicos para tratar a pacientes con COVID-19, [26] y actualmente se encuentra en fase de pruebas para su aprobación. [27]
Los experimentos, incluido el descubrimiento del raloxifeno como posible fármaco candidato contra la COVID-19, despertaron un interés significativo en la comunidad científica, como se documenta en varios artículos científicos. [4] [6] [5]
Los resultados del proyecto también despertaron interés nacional en Italia, y fueron destacados en varios artículos periodísticos [28] [29] [30] debido al uso de supercomputadoras italianas durante la pandemia. Además, los resultados de la campaña a gran escala atrajeron la atención de revistas internacionales [31] [32] .