El Proyecto Internacional HapMap fue una organización que tuvo como objetivo desarrollar un mapa de haplotipos ( HapMap ) del genoma humano , para describir los patrones comunes de variación genética humana . HapMap se utiliza para encontrar variantes genéticas que afectan la salud, la enfermedad y las respuestas a medicamentos y factores ambientales. La información producida por el proyecto se pone a disposición de forma gratuita para la investigación.
El Proyecto Internacional HapMap es una colaboración entre investigadores de centros académicos, grupos de investigación biomédica sin fines de lucro y empresas privadas en Canadá , China (incluido Hong Kong ), Japón , Nigeria , el Reino Unido y los Estados Unidos . Comenzó oficialmente con una reunión del 27 al 29 de octubre de 2002 y se esperaba que durara unos tres años. Comprende tres fases; los datos completos obtenidos en la Fase I se publicaron el 27 de octubre de 2005. [1] El análisis del conjunto de datos de la Fase II se publicó en octubre de 2007. [2] El conjunto de datos de la Fase III se publicó en la primavera de 2009 y la publicación que presenta los resultados finales se publicó en septiembre de 2010. [3]
A diferencia de las enfermedades mendelianas más raras , las combinaciones de diferentes genes y el medio ambiente juegan un papel en el desarrollo y la progresión de enfermedades comunes (como diabetes , cáncer , enfermedades cardíacas , accidentes cerebrovasculares , depresión y asma ), o en la respuesta individual a agentes farmacológicos . [4] Para encontrar los factores genéticos involucrados en estas enfermedades, en principio se podría hacer un estudio de asociación de todo el genoma : obtener la secuencia genética completa de varios individuos, algunos con la enfermedad y otros sin ella, y luego buscar diferencias entre los dos conjuntos de genomas. En ese momento, este enfoque no era factible debido al costo de la secuenciación completa del genoma . El proyecto HapMap propuso un atajo.
Aunque dos personas no relacionadas comparten aproximadamente el 99,5% de su secuencia de ADN , sus genomas difieren en ubicaciones de nucleótidos específicas. Estos sitios se conocen como polimorfismos de un solo nucleótido (SNP), y cada una de las posibles formas genéticas resultantes se denomina alelo . [5] El proyecto HapMap se centra únicamente en los SNP comunes, aquellos en los que cada alelo se presenta en al menos el 1% de la población.
Cada persona tiene dos copias de todos los cromosomas , excepto los cromosomas sexuales en los varones . Para cada SNP, la combinación de alelos que tiene una persona se denomina genotipo . La genotipificación se refiere a descubrir qué genotipo tiene una persona en un sitio particular. El proyecto HapMap eligió una muestra de 269 individuos y seleccionó varios millones de SNP bien definidos, genotipificó a los individuos para estos SNP y publicó los resultados. [6]
Los alelos de los SNP cercanos en un solo cromosoma están correlacionados. Específicamente, si se conoce el alelo de un SNP para un individuo dado, a menudo se pueden predecir los alelos de los SNP cercanos, un proceso conocido como imputación de genotipo . [7] Esto se debe a que cada SNP surgió en la historia evolutiva como una única mutación puntual , y luego se transmitió en el cromosoma rodeado de otras mutaciones puntuales anteriores. Los SNP que están separados por una gran distancia en el cromosoma normalmente no están muy bien correlacionados, porque la recombinación ocurre en cada generación y mezcla las secuencias de alelos de los dos cromosomas. Una secuencia de alelos consecutivos en un cromosoma particular se conoce como haplotipo . [8]
Para encontrar los factores genéticos implicados en una enfermedad en particular, se puede proceder de la siguiente manera. Primero se identifica una región de interés en el genoma, posiblemente de estudios de herencia anteriores. En esta región se localiza un conjunto de SNP de etiqueta a partir de los datos de HapMap; estos son SNP que están muy bien correlacionados con todos los demás SNP de la región. Con estos, se puede utilizar la imputación de genotipo para determinar (imputar) los otros SNP y, por lo tanto, todo el haplotipo con alta confianza. A continuación, se determina el genotipo para estos SNP de etiqueta en varios individuos, algunos con la enfermedad y otros sin ella. Al comparar los dos grupos, se determinan las posibles ubicaciones y los haplotipos que están involucrados en la enfermedad.
Los haplotipos son generalmente compartidos entre poblaciones, pero su frecuencia puede variar ampliamente. Se seleccionaron cuatro poblaciones para su inclusión en el HapMap: 30 tríos de adultos y ambos padres Yoruba de Ibadan , Nigeria (YRI), 30 tríos de residentes de Utah de ascendencia del norte y oeste de Europa (CEU), 44 individuos japoneses no relacionados de Tokio , Japón (JPT) y 45 individuos chinos Han no relacionados de Beijing , China (CHB). Aunque los haplotipos revelados a partir de estas poblaciones deberían ser útiles para estudiar muchas otras poblaciones, actualmente se están realizando estudios paralelos para examinar la utilidad de incluir poblaciones adicionales en el proyecto.
Todas las muestras se recogieron mediante un proceso de participación comunitaria con el consentimiento informado correspondiente. El proceso de participación comunitaria se diseñó para identificar y tratar de responder a las preocupaciones culturales específicas y brindar a las comunidades participantes aportes para el consentimiento informado y los procesos de recolección de muestras. [9]
En la fase III, se han reunido 11 grupos de ascendencia global: ASW (ascendencia africana en el suroeste de EE. UU.); CEU (residentes de Utah con ascendencia del norte y oeste de Europa de la colección CEPH); CHB (chinos han en Pekín, China); CHD (chinos en el área metropolitana de Denver, Colorado); GIH (indios gujarati en Houston, Texas); JPT (japoneses en Tokio, Japón); LWK (luhya en Webuye, Kenia); MEX (ascendencia mexicana en Los Ángeles, California); MKK (maasai en kinyawa, Kenia); TSI (toscanos en Italia); YRI (yoruba en Ibadan, Nigeria). [10]
Fase | IDENTIFICACIÓN | Lugar | Población | Detalle |
---|---|---|---|---|
Yo/yo | CEU | Residentes de Utah con ascendencia del norte y oeste de Europa de la colección del CEPH | Detalle | |
Yo/yo | BCC | Chinos Han en Pekín , China | Detalle | |
Yo/yo | JPT | Japoneses en Tokio , Japón | Detalle | |
Yo/yo | YRI | Yoruba en Ibadan , Nigeria | Detalle | |
III | Guerra antisubmarina | Ascendencia africana en el suroeste de Estados Unidos | Detalle | |
III | Enfermedad coronaria | Chino en el área metropolitana de Denver , Colorado , Estados Unidos | Detalle | |
III | GIH | Indios gujarati en Houston , Texas , Estados Unidos | Detalle | |
III | VOLANTE | Luhya en Webuye , Kenia | Detalle | |
III | MKK | Maasai en kinyawa, Kenia | Detalle | |
III | MXL | Ascendencia mexicana en Los Ángeles , CA , Estados Unidos | Detalle | |
III | ETI | Toscana en Italia | Detalle |
También se han creado tres paneles combinados que permiten una mejor identificación de los SNP en grupos fuera de las nueve muestras homogéneas: CEU+TSI (panel combinado de residentes de Utah con ascendencia de Europa del Norte y del Oeste de la colección CEPH y toscanos en Italia); JPT+CHB (panel combinado de japoneses en Tokio, Japón y chinos han en Pekín, China) y JPT+CHB+CHD (panel combinado de japoneses en Tokio, Japón, chinos han en Pekín, China y chinos en el área metropolitana de Denver, Colorado). CEU+TSI, por ejemplo, es un mejor modelo de individuos británicos del Reino Unido que CEU solo. [10]
En los años 90 era caro secuenciar los genomas completos de los pacientes, por lo que los Institutos Nacionales de Salud adoptaron la idea de un "atajo", que consistía en examinar sólo los sitios del genoma en los que muchas personas tienen una unidad de ADN variante. La teoría detrás del atajo era que, dado que las enfermedades principales son comunes, también lo serían las variantes genéticas que las causaban. La selección natural mantiene el genoma humano libre de variantes que dañan la salud antes de que los niños crezcan, sostenía la teoría, pero falla contra las variantes que atacan más tarde en la vida, lo que permite que se vuelvan bastante comunes (en 2002, los Institutos Nacionales de Salud iniciaron un proyecto de 138 millones de dólares llamado HapMap para catalogar las variantes comunes en los genomas de Europa, Asia oriental y África). [11]
En la Fase I, se genotipificó un SNP común cada 5000 bases. En total, se genotipificaron más de un millón de SNP. La genotipificación se llevó a cabo en 10 centros utilizando cinco tecnologías de genotipificación diferentes. La calidad de la genotipificación se evaluó utilizando muestras duplicadas o relacionadas y realizando controles de calidad periódicos en los que los centros tuvieron que genotipar conjuntos comunes de SNP.
El equipo canadiense estuvo dirigido por Thomas J. Hudson en la Universidad McGill de Montreal y se centró en los cromosomas 2 y 4p. El equipo chino estuvo dirigido por Huanming Yang en Pekín y Shanghái , y Lap-Chee Tsui en Hong Kong , y se centró en los cromosomas 3, 8p y 21. El equipo japonés estuvo dirigido por Yusuke Nakamura en la Universidad de Tokio y se centró en los cromosomas 5, 11, 14, 15, 16, 17 y 19. El equipo británico estuvo dirigido por David R. Bentley en el Instituto Sanger y se centró en los cromosomas 1, 6, 10, 13 y 20. Había cuatro centros de genotipado de Estados Unidos: un equipo dirigido por Mark Chee y Arnold Oliphant en Illumina Inc. en San Diego (estudiando los cromosomas 8q, 9, 18q, 22 y X), un equipo dirigido por David Altshuler y Mark Daly en el Instituto Broad en Cambridge, EE. UU. (cromosomas 4q, 7q, 18p, Y y mitocondria ), un equipo dirigido por Richard Gibbs en el Baylor College of Medicine en Houston (cromosoma 12), y un equipo dirigido por Pui-Yan Kwok en la Universidad de California, San Francisco (cromosoma 7p).
Para obtener suficientes SNP para crear el Mapa, el Consorcio financió un gran proyecto de resecuenciación para descubrir millones de SNP adicionales. Estos se enviaron a la base de datos pública dbSNP . Como resultado, en agosto de 2006, la base de datos incluía más de diez millones de SNP, y se sabía que más del 40% de ellos eran polimórficos . En comparación, al comienzo del proyecto, se identificaron menos de 3 millones de SNP, y no se sabía que más del 10% de ellos fueran polimórficos.
Durante la Fase II, David R. Cox, Kelly A. Frazer y otros en Perlegen Sciences genotipificaron más de dos millones de SNP adicionales en todo el genoma y la empresa Affymetrix genotipificó otros 500.000 .
Todos los datos generados por el proyecto, incluyendo frecuencias de SNP, genotipos y haplotipos , se colocaron en el dominio público y están disponibles para su descarga. [12] Este sitio web también contiene un navegador de genoma que permite encontrar SNP en cualquier región de interés, sus frecuencias alélicas y su asociación con SNP cercanos. También se proporciona una herramienta que puede determinar SNP de etiqueta para una región de interés dada. También se puede acceder a estos datos directamente desde el programa Haploview ampliamente utilizado.
{{cite journal}}
: CS1 maint: nombres numéricos: lista de autores ( enlace )