El Proyecto Genoma Humano ( PGH ) fue un proyecto de investigación científica internacional cuyo objetivo era determinar los pares de bases que componen el ADN humano , así como identificar, mapear y secuenciar todos los genes del genoma humano desde un punto de vista tanto físico como funcional. Comenzó en 1990 y se completó en 2003. [1] Sigue siendo el proyecto biológico colaborativo más grande del mundo. [2] La planificación del proyecto comenzó en 1984 por parte del gobierno de los EE. UU . y se lanzó oficialmente en 1990. Se declaró completo el 14 de abril de 2003 e incluyó aproximadamente el 92% del genoma. [3] El nivel de "genoma completo" se logró en mayo de 2021, con solo el 0,3% de las bases cubiertas por problemas potenciales. [4] [5] El ensamblaje final sin espacios se terminó en enero de 2022. [6]
La financiación provino del gobierno de los Estados Unidos a través de los Institutos Nacionales de Salud (NIH), así como de numerosos otros grupos de todo el mundo. Un proyecto paralelo se llevó a cabo fuera del gobierno por la Corporación Celera , o Celera Genomics, que se lanzó formalmente en 1998. La mayor parte de la secuenciación patrocinada por el gobierno se realizó en veinte universidades y centros de investigación en los Estados Unidos , el Reino Unido , Japón , Francia , Alemania y China , [7] trabajando en el Consorcio Internacional de Secuenciación del Genoma Humano (IHGSC).
El Proyecto Genoma Humano originalmente tenía como objetivo mapear el conjunto completo de nucleótidos contenidos en un genoma humano haploide de referencia , del cual hay más de tres mil millones. El genoma de cada individuo es único; el mapeo del genoma humano implicó secuenciar muestras recolectadas de un pequeño número de individuos y luego ensamblar los fragmentos secuenciados para obtener una secuencia completa para cada uno de los 23 pares de cromosomas humanos (22 pares de autosomas y un par de cromosomas sexuales, conocidos como alosomas). Por lo tanto, el genoma humano terminado es un mosaico, que no representa a ningún individuo en particular. Gran parte de la utilidad del proyecto proviene del hecho de que la gran mayoría del genoma humano es el mismo en todos los humanos.
El Proyecto Genoma Humano fue un proyecto financiado con fondos públicos que duró 13 años y que se inició en 1990 con el objetivo de determinar la secuencia de ADN de todo el genoma humano eucromático en un plazo de 13 años. [8] [9] La idea de un proyecto de este tipo se originó en el trabajo de Ronald A. Fisher , a cuyo trabajo también se le atribuye el inicio posterior del proyecto. [10]
En mayo de 1985, Robert Sinsheimer organizó un taller en la Universidad de California, Santa Cruz , para discutir la viabilidad de construir un genoma de referencia sistemático utilizando tecnologías de secuenciación genética. [11] En marzo de 1986, el Taller de Santa Fe fue organizado por Charles DeLisi y David Smith de la Oficina de Salud e Investigación Ambiental (OHER) del Departamento de Energía . [12] Al mismo tiempo, Renato Dulbecco , presidente del Instituto Salk de Estudios Biológicos , propuso por primera vez el concepto de secuenciación del genoma completo en un ensayo en Science . [13] El trabajo publicado, titulado "Un punto de inflexión en la investigación del cáncer: secuenciación del genoma humano", fue abreviado de la propuesta original de usar la secuencia para comprender la base genética del cáncer de mama. [14] James Watson , uno de los descubridores de la forma de doble hélice del ADN en la década de 1950, siguió dos meses después con un taller celebrado en el Laboratorio Cold Spring Harbor. Así, la idea de obtener una secuencia de referencia tuvo tres orígenes independientes: Sinsheimer, Dulbecco y DeLisi. En última instancia, fueron las acciones de DeLisi las que lanzaron el proyecto. [15] [16] [17] [18]
El hecho de que el Taller de Santa Fe estuviera motivado y apoyado por una agencia federal abrió un camino, aunque difícil y tortuoso, [19] para convertir la idea en una política pública en los Estados Unidos. En un memorando al Secretario Adjunto de Investigación Energética Alvin Trivelpiece , el entonces Director de la OHER, Charles DeLisi, esbozó un amplio plan para el proyecto. [20] Esto inició una larga y compleja cadena de eventos que llevaron a la reprogramación aprobada de fondos que permitió a la OHER lanzar el proyecto en 1986 y recomendar la primera partida para el HGP, que estaba en la presentación presupuestaria del Presidente Reagan de 1988, [19] y finalmente fue aprobada por el Congreso. De particular importancia en la aprobación del Congreso fue la defensa del Senador de Nuevo México Pete Domenici , con quien DeLisi se había hecho amigo. [21] Domenici presidió el Comité Senatorial de Energía y Recursos Naturales, así como el Comité de Presupuesto, ambos clave en el proceso presupuestario del DOE. El Congreso agregó una cantidad comparable al presupuesto del NIH, iniciando así la financiación oficial por parte de ambas agencias. [ cita requerida ]
Trivelpiece solicitó y obtuvo la aprobación de la propuesta de DeLisi del subsecretario William Flynn Martin . Este cuadro [22] fue utilizado por Trivelpiece en la primavera de 1986 para informar a Martin y al subsecretario Joseph Salgado sobre su intención de reprogramar $4 millones para iniciar el proyecto con la aprobación de John S. Herrington . [ cita requerida ] Esta reprogramación fue seguida por un presupuesto de partidas presupuestarias de $13 millones en la presentación del presupuesto de 1987 de la administración Reagan al Congreso. [12] Posteriormente fue aprobado por ambas Cámaras. El proyecto estaba planeado para completarse en 15 años. [23]
En 1990, las dos principales agencias de financiación, el DOE y los Institutos Nacionales de Salud , elaboraron un memorando de entendimiento para coordinar los planes y fijar el inicio del Proyecto en 1990. [24] En ese momento, David J. Galas era Director de la renombrada "Oficina de Investigación Biológica y Ambiental" en la Oficina de Ciencia del Departamento de Energía de los EE. UU. y James Watson dirigía el Programa Genoma del NIH. En 1993, Aristides Patrinos sucedió a Galas y Francis Collins sucedió a Watson, asumiendo el papel de Jefe general del Proyecto como Director del Centro Nacional de Investigación del Genoma Humano del NIH (que más tarde se convertiría en el Instituto Nacional de Investigación del Genoma Humano ). En 2000 se anunció un borrador de trabajo del genoma y los artículos que lo describen se publicaron en febrero de 2001. Se publicó un borrador más completo en 2003, y el trabajo de "acabado" del genoma continuó durante más de una década después de eso. [ cita requerida ]
El proyecto, de 3.000 millones de dólares, fue fundado formalmente en 1990 por el Departamento de Energía de Estados Unidos y los Institutos Nacionales de Salud, y se esperaba que durara 15 años. [25] Además de los Estados Unidos, el consorcio internacional estaba formado por genetistas del Reino Unido, Francia, Australia, China y una miríada de otras relaciones espontáneas. [26] El proyecto terminó costando menos de lo esperado, unos 2.700 millones de dólares (equivalentes a unos 5.000 millones de dólares en 2021). [7] [27] [28]
Dos tecnologías hicieron posible el proyecto: el mapeo genético y la secuenciación del ADN . La técnica de mapeo genético del polimorfismo de longitud de fragmentos de restricción (RFLP) surgió de la búsqueda de la ubicación del gen del cáncer de mama por parte de Mark Skolnick de la Universidad de Utah, [29] que comenzó en 1974. [30] Al ver un marcador de ligamiento para el gen, en colaboración con David Botstein , Ray White y Ron Davies concibieron una forma de construir un mapa de ligamiento genético del genoma humano. Esto permitió a los científicos lanzar el esfuerzo más amplio del genoma humano. [31]
Debido a la amplia cooperación internacional y los avances en el campo de la genómica (especialmente en el análisis de secuencias ), así como a los avances paralelos en la tecnología informática, en 2000 se terminó un "borrador" del genoma (anunciado conjuntamente por el presidente estadounidense Bill Clinton y el primer ministro británico Tony Blair el 26 de junio de 2000). [32] [33] Este primer borrador disponible del ensamblaje del genoma fue completado por el Grupo de Bioinformática del Genoma de la Universidad de California en Santa Cruz , dirigido principalmente por el entonces estudiante de posgrado Jim Kent y su asesor David Haussler . [34] La secuenciación en curso condujo al anuncio del genoma esencialmente completo el 14 de abril de 2003, dos años antes de lo planeado. [35] [36] En mayo de 2006, se superó otro hito en el camino hacia la finalización del proyecto cuando se publicó la secuencia del último cromosoma en Nature . [37]
A continuación se enumeran las distintas instituciones, empresas y laboratorios que participaron en el Proyecto Genoma Humano, según el NIH : [7]
No. | Nación | Nombre | Afiliación |
---|---|---|---|
1 | El Instituto Whitehead /Centro de Investigación Genómica del MIT | Instituto Tecnológico de Massachusetts | |
2 | El Instituto Sanger del Wellcome Trust | Bienvenida Trust | |
3 | Centro de secuenciación del genoma de la Facultad de Medicina de la Universidad de Washington | Universidad de Washington en San Luis | |
4 | Instituto Conjunto del Genoma del Departamento de Energía de los Estados Unidos | Departamento de Energía de los Estados Unidos | |
5 | Centro de secuenciación del genoma humano de la Facultad de Medicina de Baylor | Facultad de Medicina de Baylor | |
6 | Centro de Ciencias Genómicas RIKEN | Riken | |
7 | Genoscopio y CNRS UMR-8030 | Comisión Francesa de Energías Alternativas y Energía Atómica | |
8 | Centro de secuenciación GTC | Genome Therapeutics Corporation , cuya división de secuenciación es adquirida por ABI | |
9 | Departamento de Análisis Genómico | Instituto Fritz Lipmann, nombre cambiado de Instituto de Biotecnología Molecular | |
10 | Instituto de Genómica de Beijing /Centro del Genoma Humano | Academia de Ciencias de China | |
11 | Centro de secuenciación multimegabase | Instituto de Biología de Sistemas | |
12 | Centro de Tecnología Genómica de Stanford | Universidad de Stanford | |
13 | Centro del Genoma Humano y Departamento de Genética de Stanford | Facultad de Medicina de la Universidad de Stanford | |
14 | Centro del Genoma de la Universidad de Washington | Universidad de Washington | |
15 | Departamento de Biología Molecular | Facultad de Medicina de la Universidad de Keio | |
16 | Centro Médico de la Universidad de Texas Southwestern en Dallas | Universidad de Texas | |
17 | Centro Avanzado de Tecnología Genómica de la Universidad de Oklahoma | Departamento de Química y Bioquímica, Universidad de Oklahoma | |
18 | Instituto Max Planck de Genética Molecular | Sociedad Max Planck | |
19 | Centro del Genoma Lita Annenberg Hazen | Laboratorio de Cold Spring Harbor | |
20 | GBF/Centro Alemán de Investigación en Biotecnología | Reorganizado y renombrado como Centro Helmholtz para la Investigación de Infecciones |
Cabe destacar que el proyecto no logró secuenciar todo el ADN que se encuentra en las células humanas ; más bien, el objetivo era secuenciar solo las regiones eucromáticas del genoma nuclear, que constituyen el 92,1% del genoma humano. El 7,9% restante existe en regiones heterocromáticas dispersas , como las que se encuentran en los centrómeros y los telómeros . Estas regiones, por su naturaleza, son generalmente más difíciles de secuenciar y, por lo tanto, no se incluyeron como parte de los planes originales del proyecto. [38]
El Proyecto Genoma Humano (PGH) se declaró completado en abril de 2003. Un borrador inicial del genoma humano estaba disponible en junio de 2000 y para febrero de 2001 se había completado y publicado un borrador de trabajo seguido por el mapeo secuencial final del genoma humano el 14 de abril de 2003. Aunque se informó que esto cubría el 99% del genoma humano eucromático con una precisión del 99,99%, una importante evaluación de calidad de la secuencia del genoma humano se publicó el 27 de mayo de 2004, indicando que más del 92% del muestreo excedía la precisión del 99,99%, lo que estaba dentro del objetivo previsto. [39]
En marzo de 2009, el Consorcio de Referencia del Genoma (GRC) publicó una versión más precisa del genoma humano, pero aún quedaban más de 300 lagunas, [40] mientras que en 2015 seguían existiendo 160 de esas lagunas. [41]
Aunque en mayo de 2020 el GRC informó de 79 lagunas "sin resolver", [42] que representan hasta el 5% del genoma humano, [43] meses después, la aplicación de nuevas técnicas de secuenciación de largo alcance y una línea celular derivada de la mola hidatiforme en la que ambas copias de cada cromosoma son idénticas condujeron a la primera secuencia verdaderamente completa de telómero a telómero de un cromosoma humano, el cromosoma X. [44] De manera similar, varios meses después se obtuvo una secuencia completa de extremo a extremo del cromosoma autosómico humano 8. [45]
En 2021, se informó que el consorcio Telomere-to-Telomere (T2T) había llenado todos los huecos excepto cinco en regiones repetitivas del ADN ribosómico. [46] Meses después, esos huecos también se habían cerrado. La secuencia completa no contenía el cromosoma Y , que hace que el embrión se convierta en masculino, al estar ausente en la línea celular que sirvió como fuente del ADN analizado. Aproximadamente el 0,3% de la secuencia completa resultó difícil de comprobar en cuanto a calidad y, por tanto, podría haber contenido errores, [47] que se estaban buscando para su confirmación. [48] En abril de 2022, se publicó formalmente la secuencia completa del cromosoma no Y, lo que proporciona una visión de gran parte del 8% del genoma que dejó fuera el HGP. [49] En diciembre de 2022, un artículo de preimpresión afirmó que se había realizado la secuenciación de las regiones faltantes restantes del cromosoma Y, completando así la secuenciación de los 24 cromosomas humanos. [50] En agosto de 2023 se publicó finalmente esta preimpresión. [51] [52]
La secuenciación del genoma humano tiene beneficios para muchos campos, desde la medicina molecular hasta la evolución humana . El Proyecto Genoma Humano, a través de su secuenciación del ADN, puede ayudar a los investigadores a comprender enfermedades, incluyendo: la genotipificación de virus específicos para dirigir el tratamiento apropiado; la identificación de mutaciones vinculadas a diferentes formas de cáncer ; el diseño de medicamentos y una predicción más precisa de sus efectos; el avance en las ciencias forenses aplicadas; los biocombustibles y otras aplicaciones energéticas; la agricultura , la ganadería , el bioprocesamiento ; la evaluación de riesgos ; la bioarqueología , la antropología y la evolución . La secuencia del ADN se almacena en bases de datos disponibles para cualquier persona en Internet . El Centro Nacional de Información Biotecnológica de los EE. UU. (y organizaciones hermanas en Europa y Japón) albergan la secuencia genética en una base de datos conocida como GenBank , junto con secuencias de genes y proteínas conocidos e hipotéticos. Otras organizaciones, como el UCSC Genome Browser en la Universidad de California, Santa Cruz, [53] y Ensembl [54] presentan datos y anotaciones adicionales y herramientas poderosas para visualizarlos y buscarlos. Se han desarrollado programas informáticos para analizar los datos porque los datos en sí son difíciles de interpretar sin dichos programas. En términos generales, los avances en la tecnología de secuenciación del genoma han seguido la Ley de Moore , un concepto de la informática que establece que los circuitos integrados pueden aumentar en complejidad a un ritmo exponencial. [55] Esto significa que las velocidades a las que se pueden secuenciar genomas completos pueden aumentar a un ritmo similar, como se vio durante el desarrollo del Proyecto Genoma Humano.
El proceso de identificar los límites entre los genes y otras características en una secuencia de ADN en bruto se denomina anotación genómica y pertenece al ámbito de la bioinformática . Aunque los biólogos expertos son los mejores anotadores, su trabajo avanza lentamente y cada vez se utilizan más programas informáticos para satisfacer las demandas de alto rendimiento de los proyectos de secuenciación genómica. A principios de 2008, se introdujo una nueva tecnología conocida como RNA-seq que permitió a los científicos secuenciar directamente el ARN mensajero en las células. Esto sustituyó a los métodos anteriores de anotación, que se basaban en las propiedades inherentes de la secuencia de ADN, por la medición directa, que era mucho más precisa. Hoy en día, la anotación del genoma humano y otros genomas se basa principalmente en la secuenciación profunda de las transcripciones en cada tejido humano mediante RNA-seq. Estos experimentos han revelado que más del 90% de los genes contienen al menos una y, por lo general, varias variantes de empalme alternativo, en las que los exones se combinan de diferentes maneras para producir 2 o más productos génicos a partir del mismo locus. [56]
El genoma publicado por el PGH no representa la secuencia del genoma de cada individuo. Es el mosaico combinado de un pequeño número de donantes anónimos, de ascendencia africana, europea y del este de Asia. El genoma del PGH es una base para futuros trabajos de identificación de diferencias entre individuos. [ cita requerida ] Proyectos posteriores secuenciaron los genomas de múltiples grupos étnicos distintos, aunque a fecha de 2019 todavía hay solo un "genoma de referencia". [57]
Las principales conclusiones del borrador (2001) y de la secuencia completa (2004) del genoma incluyen:
El genoma humano tiene aproximadamente 3.100 millones de pares de bases . [63] El Proyecto Genoma Humano se inició en 1990 con el objetivo de secuenciar e identificar todos los pares de bases en el conjunto de instrucciones genéticas humanas, encontrar las raíces genéticas de las enfermedades y luego desarrollar tratamientos. Se considera un megaproyecto .
El genoma se dividió en fragmentos más pequeños, de aproximadamente 150.000 pares de bases de longitud. [64] Estos fragmentos se ligaron a un tipo de vector conocido como " cromosomas artificiales bacterianos " o BAC, que se derivan de cromosomas bacterianos que han sido modificados genéticamente. Los vectores que contienen los genes se pueden insertar en bacterias donde son copiados por la maquinaria de replicación del ADN bacteriano . Cada uno de estos fragmentos se secuenció por separado como un pequeño proyecto de " escopeta " y luego se ensambló. Los más grandes, de 150.000 pares de bases, se unen para crear cromosomas. Esto se conoce como el enfoque de " escopeta jerárquica ", porque el genoma primero se divide en fragmentos relativamente grandes, que luego se asignan a los cromosomas antes de ser seleccionados para la secuenciación. [65] [66]
La financiación provino del gobierno de los Estados Unidos a través de los Institutos Nacionales de Salud de los Estados Unidos y de una organización benéfica del Reino Unido, el Wellcome Trust , así como de numerosos otros grupos de todo el mundo. La financiación respaldó una serie de grandes centros de secuenciación, incluidos los del Instituto Whitehead , el Instituto Wellcome Sanger (entonces llamado The Sanger Centre) con sede en el Wellcome Genome Campus , la Universidad de Washington en St. Louis y el Baylor College of Medicine . [25] [67]
La Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura (UNESCO) sirvió como un canal importante para la participación de los países en desarrollo en el Proyecto Genoma Humano. [68]
En 1998, el investigador estadounidense Craig Venter y su empresa Celera Genomics lanzaron una misión similar, financiada con fondos privados . Venter era un científico del NIH a principios de los años 1990, cuando se inició el proyecto. El esfuerzo de Celera, de 300 millones de dólares, tenía la intención de avanzar a un ritmo más rápido y a una fracción del costo del proyecto de aproximadamente 3 mil millones de dólares financiado con fondos públicos . Mientras que el proyecto Celera centró sus esfuerzos en la secuenciación de producción y el ensamblaje del genoma humano, el HGP público también financió el mapeo y la secuenciación de los genomas del gusano , la mosca y la levadura , la financiación de bases de datos, el desarrollo de nuevas tecnologías, el apoyo a programas de bioinformática y ética, así como el pulido y la evaluación del ensamblaje del genoma. [69] Tanto el enfoque de Celera como el público gastaron aproximadamente 250 millones de dólares en el esfuerzo de secuenciación de producción. [70] Para el ensamblaje de la secuencia, Celera utilizó mapas disponibles públicamente en GenBank , que Celera era capaz de generar, pero cuya disponibilidad era "beneficiosa" para el proyecto financiado con fondos privados. [59]
Celera utilizó una técnica llamada secuenciación shotgun del genoma completo , empleando secuenciación de extremos por pares , [71] que se había utilizado para secuenciar genomas bacterianos de hasta seis millones de pares de bases de longitud, pero no para nada tan grande como el genoma humano de tres mil millones de pares de bases.
Celera anunció inicialmente que buscaría protección de patentes para "sólo 200-300" genes, pero más tarde modificó esta afirmación para solicitar "protección de propiedad intelectual" para "estructuras importantes completamente caracterizadas" que sumaban entre 100 y 300 genes. La empresa finalmente presentó solicitudes de patente preliminares ("de reserva") para 6.500 genes completos o parciales. Celera también prometió publicar sus hallazgos de acuerdo con los términos de la " Declaración de Bermudas " de 1996, mediante la publicación de nuevos datos anualmente (el HGP publicó sus nuevos datos diariamente), aunque, a diferencia del proyecto financiado con fondos públicos, no permitirían la redistribución gratuita o el uso científico de los datos. Los competidores financiados con fondos públicos se vieron obligados a publicar el primer borrador del genoma humano antes que Celera por esta razón. El 7 de julio de 2000, el Grupo de Bioinformática Genómica de la UCSC publicó un primer borrador de trabajo en la web. La comunidad científica descargó alrededor de 500 GB de información del servidor del genoma de la UCSC en las primeras 24 horas de acceso libre y sin restricciones. [72]
En marzo de 2000, el presidente Clinton , junto con el primer ministro Tony Blair , en una declaración conjunta, instaron a que todos los investigadores que desearan investigar la secuencia tuvieran "acceso sin trabas" a la secuencia del genoma. [73] La declaración hizo que las acciones de Celera cayeran en picado y arrastró al Nasdaq , un sector con una gran presencia en el mercado de la biotecnología . El sector de la biotecnología perdió unos 50.000 millones de dólares en capitalización de mercado en dos días. [ cita requerida ]
Aunque el borrador de trabajo se anunció en junio de 2000, no fue hasta febrero de 2001 que Celera y los científicos del PGH publicaron detalles de sus borradores. Números especiales de Nature (que publicaron el artículo científico del proyecto financiado con fondos públicos ) [59] describieron los métodos utilizados para producir el borrador de la secuencia y ofrecieron análisis de la secuencia. Estos borradores cubrían aproximadamente el 83% del genoma (el 90% de las regiones eucromáticas con 150.000 espacios vacíos y el orden y la orientación de muchos segmentos aún no establecidos). En febrero de 2001, en el momento de las publicaciones conjuntas, los comunicados de prensa anunciaron que ambos grupos habían completado el proyecto. Se anunciaron borradores mejorados en 2003 y 2005, que completan aproximadamente el 92% de la secuencia actual. [ cita requerida ]
En el Consorcio Internacional de Secuenciación del Genoma Humano (IHGSC) , los investigadores recogieron muestras de sangre (femeninas) o de esperma (masculinas) de un gran número de donantes. Sólo unas pocas de las muchas muestras recogidas se procesaron como recursos de ADN. Por tanto, las identidades de los donantes estaban protegidas, de modo que ni los donantes ni los científicos podían saber de quién era el ADN secuenciado. En el proyecto general se utilizaron clones de ADN tomados de muchas bibliotecas diferentes , y la mayoría de esas bibliotecas fueron creadas por Pieter J. de Jong. Gran parte de la secuencia (>70%) del genoma de referencia producido por el PGH público procedía de un único donante masculino anónimo de Buffalo, Nueva York ( nombre en código RP11; "RP" se refiere a Roswell Park Comprehensive Cancer Center ). [74] [75]
Los científicos del HGP utilizaron glóbulos blancos de la sangre de dos donantes masculinos y dos femeninos (seleccionados al azar de entre 20 de cada uno); cada donante produjo una biblioteca de ADN independiente. Una de estas bibliotecas (RP11) se utilizó considerablemente más que las demás, debido a consideraciones de calidad. Un problema técnico menor es que las muestras masculinas contienen poco más de la mitad de ADN de los cromosomas sexuales (un cromosoma X y un cromosoma Y ) en comparación con las muestras femeninas (que contienen dos cromosomas X ). Los otros 22 cromosomas (los autosomas) son los mismos para ambos sexos.
Aunque la fase principal de secuenciación del PGH se ha completado, los estudios de variación del ADN continuaron en el Proyecto Internacional HapMap , cuyo objetivo era identificar patrones de grupos de polimorfismos de un solo nucleótido (SNP) (llamados haplotipos o "haps"). Las muestras de ADN para el HapMap procedían de un total de 270 individuos; gente yoruba en Ibadan , Nigeria ; gente japonesa en Tokio ; chinos han en Pekín ; y el recurso del Centro de Estudio del Polimorfismo Humano (CEPH) francés, que consistía en residentes de los Estados Unidos con ascendencia de Europa occidental y del norte .
En el proyecto privado Celera Genomics, se utilizó ADN de cinco individuos diferentes para la secuenciación. El científico principal de Celera Genomics en ese momento, Craig Venter, reconoció más tarde (en una carta pública a la revista Science ) que su ADN era una de las 21 muestras del conjunto, cinco de las cuales fueron seleccionadas para su uso. [76] [77]
Con la secuencia en mano, el siguiente paso fue identificar las variantes genéticas que aumentan el riesgo de enfermedades comunes como el cáncer y la diabetes. [24] [64]
Se prevé que el conocimiento detallado del genoma humano proporcionará nuevas vías para avances en medicina y biotecnología . Los resultados prácticos claros del proyecto surgieron incluso antes de que el trabajo estuviera terminado. Por ejemplo, varias empresas, como Myriad Genetics , comenzaron a ofrecer formas fáciles de administrar pruebas genéticas que pueden mostrar predisposición a una variedad de enfermedades, incluido el cáncer de mama , los trastornos de la hemostasia , la fibrosis quística , las enfermedades hepáticas y muchas otras. Además, se considera que es probable que las etiologías de los cánceres , la enfermedad de Alzheimer y otras áreas de interés clínico se beneficien de la información del genoma y posiblemente puedan conducir a largo plazo a avances significativos en su manejo. [78] [79]
También existen muchos beneficios tangibles para los biólogos. Por ejemplo, un investigador que esté investigando una determinada forma de cáncer puede haber limitado su búsqueda a un gen en particular. Al visitar la base de datos del genoma humano en la World Wide Web , este investigador puede examinar lo que otros científicos han escrito sobre este gen, incluyendo (potencialmente) la estructura tridimensional de su producto, sus funciones, sus relaciones evolutivas con otros genes humanos, o con genes en ratones, levaduras o moscas de la fruta, posibles mutaciones perjudiciales, interacciones con otros genes, tejidos corporales en los que se activa este gen y enfermedades asociadas con este gen u otros tipos de datos. Además, una comprensión más profunda de los procesos patológicos a nivel de biología molecular puede determinar nuevos procedimientos terapéuticos. Dada la importancia establecida del ADN en la biología molecular y su papel central en la determinación del funcionamiento fundamental de los procesos celulares , es probable que el conocimiento ampliado en esta área facilite avances médicos en numerosas áreas de interés clínico que podrían no haber sido posibles sin ellos. [80]
El análisis de similitudes entre secuencias de ADN de diferentes organismos también está abriendo nuevas vías en el estudio de la evolución . En muchos casos, las cuestiones evolutivas ahora pueden enmarcarse en términos de biología molecular ; de hecho, muchos hitos evolutivos importantes (la aparición del ribosoma y los orgánulos , el desarrollo de embriones con planes corporales, el sistema inmunológico de los vertebrados ) pueden relacionarse con el nivel molecular. Se espera que los datos de este proyecto aclaren muchas preguntas sobre las similitudes y diferencias entre los humanos y sus parientes más cercanos (los primates y, de hecho, los demás mamíferos ). [78] [81]
El proyecto inspiró y allanó el camino para el trabajo genómico en otros campos, como la agricultura. Por ejemplo, al estudiar la composición genética de Tritium aestivum , el trigo panificable más utilizado en el mundo, se ha obtenido una gran comprensión de las formas en que la domesticación ha impactado la evolución de la planta. [82] Se está investigando qué loci son más susceptibles a la manipulación y cómo se refleja esto en términos evolutivos. La secuenciación genética ha permitido abordar estas preguntas por primera vez, ya que se pueden comparar loci específicos en cepas silvestres y domesticadas de la planta. Esto permitirá avances en la modificación genética en el futuro que podrían producir cultivos de trigo más saludables y resistentes a las enfermedades, entre otras cosas.
Al comienzo del Proyecto Genoma Humano, surgieron varias preocupaciones éticas, legales y sociales en relación con la forma en que el conocimiento creciente del genoma humano podría utilizarse para discriminar a las personas . Una de las principales preocupaciones de la mayoría de las personas era el temor de que tanto los empleadores como las compañías de seguros de salud se negaran a contratar a personas o se negaran a proporcionar seguros a las personas debido a un problema de salud indicado por los genes de alguien. [83] En 1996, los Estados Unidos aprobaron la Ley de Portabilidad y Responsabilidad del Seguro Médico (HIPAA), que protege contra la divulgación no autorizada y no consentida de información de salud individualmente identificable a cualquier entidad que no participe activamente en la prestación de servicios de atención médica a un paciente. [84]
Además de identificar los aproximadamente 20.000–25.000 genes del genoma humano (se estima que había entre 80.000 y 140.000 al inicio del proyecto), el Proyecto Genoma Humano también buscó abordar las cuestiones éticas, legales y sociales que se crearon con el inicio del proyecto. [85] Para eso, se fundó el programa de Implicaciones Éticas, Legales y Sociales (ELSI) en 1990. El cinco por ciento del presupuesto anual se asignó para abordar las ELSI que surgieron del proyecto. [25] [86] Este presupuesto comenzó en aproximadamente $1,57 millones en el año 1990, pero aumentó a aproximadamente $18 millones en el año 2014. [87]
Si bien el proyecto puede ofrecer beneficios significativos a la medicina y a la investigación científica, algunos autores han enfatizado la necesidad de abordar las posibles consecuencias sociales del mapeo del genoma humano. El historiador de la ciencia Hans-Jörg Rheinberger escribió que "la perspectiva de 'molecularizar' las enfermedades y su posible cura tendrá un profundo impacto en lo que los pacientes esperan de la ayuda médica y en la percepción de la enfermedad por parte de una nueva generación de médicos". [88]
En julio de 2024, una investigación de Undark Magazine [89] y copublicada con STAT News [90] reveló por primera vez varias faltas éticas por parte de los científicos que encabezaban el Proyecto Genoma Humano. La principal de ellas fue el uso de aproximadamente el 75 por ciento del ADN de un solo donante en la construcción del genoma de referencia, a pesar de los formularios de consentimiento informado, proporcionados a cada uno de los 20 donantes anónimos participantes, que indicaban que no se utilizaría más del 10 por ciento del ADN de ningún donante. Aproximadamente el 10 por ciento del genoma de referencia pertenecía a uno de los científicos principales del proyecto, Pieter De Jong. [89]
{{cite web}}
: CS1 maint: copia archivada como título ( enlace )... sacó a la luz unas 1200 familias de proteínas. Sólo 94 familias de proteínas, o el 7%, parecen ser específicas de los vertebrados.
relación con la atención sanitaria y con el Proyecto Genoma Humano financiado con fondos federales.