qué es el genoma humano

6
E l 26 de junio de 2000 se anunció la secuencia- ción casi completa (al 99%) y el ensamblaje del genoma humano por parte de la compa- ñía de biotecnología Celera. Al mismo tiem- po, el Proyecto Genoma Humano (Human Genome Project, HGP), un consorcio internacional financiado públicamente y dirigido por Francis Collins anunció la terminación del scaffold o armazón del genoma al 85% y su secuenciación parcial. Este hecho corona los es- fuerzos de más de diez años del consorcio y de aproxi- madamente dos años de Celera, compañía presidida por J. Craig Venter. En febrero de 2001 las revistas Na- ture y Science publicaron los resultados de estos grupos, así como el primer análisis del genoma humano. Las noticias, que si bien por esperadas no fueron menos importantes, me hicieron pensar inmedia- tamente en dos incidentes: la famosa frase de Neil Armstrong: “éste es un pequeño paso para un ser hu- mano, pero un paso gigantesco para la humanidad” y la opinión muchas veces vertida por el científico es- tadunidense James Watson, ga- nador del Premio Nobel por dilu- cidar, junto con Francis Crick, la estructura del ácido desoxirribo- nucleico o ADN, en el sentido de que se requerían urgentemente formas rápidas de secuenciación del ADN para poder leer todo el genoma humano, al menos antes de que él muriese. Armstrong se refería a la conquista de la Luna por el hombre, pero el hecho de conocer el libro de toda nuestra informa- ción genética —que ahora tenemos que interpretar y entender— es tan o más monumental que aquel he- cho, si bien no se anunció al mundo de manera tan espectacular. Y sí, el deseo de James Watson se cum- plió, pues estuvo presente durante el anuncio del 26 de junio. A través de la historia, el hombre siempre ha tra- tado de estudiarse y entenderse a sí mismo cada vez mejor y con mayor detalle, así como a su medio am- biente. En este sentido, la secuenciación del genoma humano es un paso más en tal dirección, comparable al trabajo de los anatomistas que disecaban cadáveres humanos para describir, estudiar y entender el funcio- namiento de nuestro organismo. De la misma manera como se describieron el corazón, los pulmones, el sistema circulatorio, etc. —a la mente vienen los in- comparables estudios y dibujos anatómicos de Leonar- do da Vinci y de Miguel Ángel Buonarroti—, ahora El genoma humano 6 enero-marzo 2002 Las proteínas protegen, empaquetan y regulan la actividad biológica del ADN. Los humanos tenemos 46 cromosomas en cada célula, orga- nizados en 23 pares. Recibimos 23 cromoso- mas de nuestra madre y 23 de nuestro padre. Juan R. Riesgo Qué es el genoma humano

Upload: eduardozetina

Post on 29-Sep-2015

2 views

Category:

Documents


1 download

DESCRIPTION

El 26 de junio de 2000 se anunció la secuenciación casi completa (al 99%) y el ensamblaje del genoma humano por parte de la compañía de biotecnología Celera. Al mismo tiempo, el Proyecto Genoma Humano (Human Genome Project, HGP), un consorcio internacional financiado públicamente y dirigido por Francis Collins anunció la terminación del scaffold o armazón del genoma al 85% y su secuenciación parcial. Este hecho corona los esfuerzos de más de diez años del consorcio y de aproximadamente dos años de Celera, compañía presidida por J. Craig Venter. En febrero de 2001 las revistas Nature y Science publicaron los resultados de estos grupos, así como el primer análisis del genoma humano.

TRANSCRIPT

  • El 26 de junio de 2000 se anunci la secuencia-cin casi completa (al 99%) y el ensamblajedel genoma humano por parte de la compa-a de biotecnologa Celera. Al mismo tiem-

    po, el Proyecto Genoma Humano (Human GenomeProject, HGP), un consorcio internacional financiadopblicamente y dirigido por Francis Collins anunci laterminacin del scaffold o armazn del genoma al 85%y su secuenciacin parcial. Este hecho corona los es-fuerzos de ms de diez aos del consorcio y de aproxi-madamente dos aos de Celera, compaa presididapor J. Craig Venter. En febrero de 2001 las revistas Na-ture y Science publicaron los resultados de estos grupos,as como el primer anlisis del genoma humano.

    Las noticias, que si bien por esperadas no fueronmenos importantes, me hicieron pensar inmedia-tamente en dos incidentes: la famosa frase de NeilArmstrong: ste es un pequeo paso para un ser hu-mano, pero un paso gigantesco para la humanidad yla opinin muchas veces vertida por el cientfico es-

    tadunidense James Watson, ga-nador del Premio Nobel por dilu-cidar, junto con Francis Crick, laestructura del cido desoxirribo-nucleico o ADN, en el sentido deque se requeran urgentementeformas rpidas de secuenciacindel ADN para poder leer todo elgenoma humano, al menos antesde que l muriese. Armstrong se

    refera a la conquista de la Luna por el hombre, peroel hecho de conocer el libro de toda nuestra informa-cin gentica que ahora tenemos que interpretar yentender es tan o ms monumental que aquel he-cho, si bien no se anunci al mundo de manera tanespectacular. Y s, el deseo de James Watson se cum-pli, pues estuvo presente durante el anuncio del 26de junio.

    A travs de la historia, el hombre siempre ha tra-tado de estudiarse y entenderse a s mismo cada vezmejor y con mayor detalle, as como a su medio am-biente. En este sentido, la secuenciacin del genomahumano es un paso ms en tal direccin, comparableal trabajo de los anatomistas que disecaban cadvereshumanos para describir, estudiar y entender el funcio-namiento de nuestro organismo. De la misma maneracomo se describieron el corazn, los pulmones, el sistema circulatorio, etc. a la mente vienen los in-comparables estudios y dibujos anatmicos de Leonar-do da Vinci y de Miguel ngel Buonarroti, ahora

    El genoma humano

    6 ciencia enero-marzo 2002

    Las protenas protegen, empaquetan y regulanla actividad biolgica del ADN. Los humanostenemos 46 cromosomas en cada clula, orga-nizados en 23 pares. Recibimos 23 cromoso-mas de nuestra madre y 23 de nuestro padre.

    Juan R. Riesgo

    Qu es el genoma humano

  • se ha terminado de leer el libro de todas nuestras ins-trucciones genticas. Es en este afn humanista y enla naturaleza inquisitiva que tanto caracterizan a nues-tra especie en el que se inscribe este nuevo paso.

    Qu es el genoma humano? Es una especie de va-demcum, de enciclopedia de toda la informacin ge-ntica que poseemos como especie. Tal vez podamoshacer un smil con la construccin y el funcionamien-to de una casa que seramos nosotros. Para poder cons-truir pisos y techos, levantar paredes, hacer instala-ciones elctricas y sanitarias se requiere informacinsobre los materiales, y sobre su disponibilidad, y en al-gunos casos sobre la manera de elaborarlos a partir dematerias primas; igualmente necesarios son la formade hacer la mezcla de cemento para pegar los ladrillos,el modo de hacer aplanados con yeso, conocer de pin-turas y el modo de aplicarlas; adems, hay que tenerconocimientos de fsica, de qumica, de hidrulica, dediseo, etc. Toda esta informacin existe en libros, ycontinuando nuestra metfora, debemos usarla en elentorno natural en donde se est construyendo la ca-sa: utilizar los materiales locales, ajustarse al terrenoen donde se piensa edificar y, siguiendo ciertas nor-mas, establecer una especie de dilogo con el medioambiente de donde nos proveemos de materiales y endonde estamos construyendo, para poder llevar a buentrmino el proyecto. En esta metfora, el genoma ocu-para el lugar de los libros y textos que nos indicarancmo llevar a cabo la construccin.

    Estos textos estn escritos en un idioma: el idiomade los genes, y tienen su sustrato fsico en una sustan-cia qumica: el ADN. El sustrato fsico equivaldra alpapel y a la tinta de los libros y de los textos. El ADNes una molcula muy larga y delgada formada por doshebras o ejes entrelazados que forman una doble hli-ce. Estas hebras estn formadas por subunidades repetidas de manera lineal, llamadas nucletidos,constituidos a su vez por tres partes: una base nitroge-nada, un azcar de cinco carbonos, llamado desoxirri-bosa, y un grupo fosfato. Las bases nitrogenadaspueden ser de dos clases, purinas y pirimidinas, deacuerdo con su estructura qumica, y existen dos tiposdentro de cada clase: adenina y guanina, para las puri-nas, y citosina y timina, para las pirimidinas (Figura 1).As, cada nucletido est conformado por una de las

    cuatro posibles bases nitrogenadas (abreviadas A, G, Cy T, respectivamente), junto con una molcula de de-soxirribosa y un grupo fosfato invariantes (Figura 2).Dado que slo son las bases nitrogenadas las que pue-den variar, en el lenguaje del ADN slo existen cuatroletras: A, G, C y T.

    Los nucletidos se entrelazan entre s por mediode los grupos fosfato y las desoxirribosas, de modo tal

    Qu es el genoma?

    enero-marzo 2002 ciencia

    Figura 1. Molculas componentes del ADN. Lamolcula del ADN est compuesta por variostipos de molculas que se unen entre s pormedio de distintos tipos de enlaces qumicos.Las molculas componentes incluyen basespricas (adenina y guanina), bases pirimdicas(citosina y timina), el azcar desoxirribosa, de la que toma su nombre el ADN, y el cidofosfrico.

    7

  • que forman una especie de hilo que tiene en un mis-mo lado todas las bases nitrogenadas, como en un co-llar de abalorios. Las bases nitrogenadas estn por unlado unidas al armazn de grupos fosfato y desoxirri-

    bosas, y por el otro estn libres para interactuar. Doshebras constituidas as y enlazadas entre s por unio-nes qumicas dbiles, llamadas puentes de hidrgeno,que unen los extremos libres de las bases nitrogena-

    das, constituyen una molcula de ADN(Figura 3). La unin de las bases por me-dio de puentes de hidrgeno se realiza dela siguiente manera: siempre se une unapurina con una pirimidina, de modo talque la adenina se une siempre con la timi-na y la guanina con la citosina (A con T yG con C). No se pueden unir de otro mo-do porque la adenina y la timina formanentre s dos puentes de hidrgeno, mien-tras que la citosina y la guanina formantres (Figura 3).

    Es esta caracterstica de las bases nitro-genadas de los nucletidos, de unirse for-mando parejas invariantes, lo que le da ala molcula de ADN una propiedad muy

    El genoma humano

    8 ciencia enero-marzo 2002

    Figura 2. Estructura de nucletidos y polinu-cletidos. Una base prica o pirimdica se une aun azcar y a un fosfato para formar un nucle-tido. Aqu se muestra la estructura de un nu-cletido de purina que contiene adenina y unode pirimidina que contiene uracilo. Los nucle-tidos en la molcula del ADN se unen entre s a travs de sus fosfatos y sus azcares (deso-xirribosas) mediante un tipo especial de enlacequmico denominado enlace fosfodister.

    Figura 3. Interacciones entre nucletidos en elADN. En cada una de las dos hebras del ADN los nucletidos se unen entre s por medio deuniones fosfodister que forman el esqueletode la hebra y del cual protruyen las bases p-ricas y pirimdicas hacia el centro de la molcu-la. Ntese que las dos hebras del ADN interac-cionan entre s de manera tal que la base pricade una hebra interacciona con la base pirim-dica de la otra, establecindose entre ellaspuentes de hidrgeno que unen tomos de ox-geno con tomos de nitrgeno, y que las cade-nas de nucletidos tienen polaridades opuestas.

  • Qu es el genoma?

    9enero-marzo 2002 ciencia

    importante: cada hebra de las dos que la conforman puede servir demolde para la elaboracin de la otra (Figura 4). De esta manera las he-bras que conforman una molcula de ADN son complementarias. Esdecir, al conocer el orden en que los nucletidos se han enlazado enuna hebra (por ejemplo, GAATTC) podemos conocer exactamentecul ser el ordenamiento de los nucletidos de la otra hebra (ennuestro ejemplo, CTTAAG). Esta propiedad de la estructura de lamolcula de ADN sirve muy bien para duplicar la informacin gen-tica, pues al separarse por medio de enzimas las dos hebras que laconstituyen, cada una sirve de molde para la elaboracin de otra he-bra, de donde al final se obtienen dos molculas de ADN idnticas,cada una con una hebra que sirvi de molde y con otra que se forma partir de la primera. Esto es precisamente lo que ocurre con todo elADN de las clulas cada vez que se dividen, y as se explica que cadauna de las dos clulas hijas tenga la misma informacin gentica quela clula original.

    El ADN de nuestras clulas se encuentra dentro de una estructurallamada ncleo. Las dos hebras de la molcula de ADN se van retor-ciendo sobre s mismas para formar una doble hlice (Figura 4). sta esla estructura caracterstica del ADN que describieron James Watson yFrancis Crick. Dentro del ncleo, sin embargo, estas dobles hlices deADN estn rodeadas de protenas. Juntos, el ADN y las protenas aso-ciadas, conforman una estructura que se llama cromosoma (hay dosexcepciones a lo anterior: existe tambin ADN no nuclear con algu-nos organelos celulares como las mitocondrias y los cloroplastos, yexisten tambin molculas de ADN de pequeo tamao que normal-mente son circulares y que pueden estar en el citoplasma o en el n-cleo de las clulas, pero que no forman parte de los cromosomas; estasmolculas de ADN se denominan episomas o plsmidos).

    Las protenas protegen, empaquetan y regulan la actividad biol-gica del ADN. Los humanos tenemos 46 cromosomas en cada una de nuestras clulas, organizados en 23 pares. Recibimos 23 cromoso-mas de nuestra madre y 23 de nuestro padre. Durante la formacin delas clulas especializadas de la reproduccin, los gametos, es decir, loscromosomas de esas clulas, sufren un proceso llamado meiosis, quetiene por resultado la reduccin de la cantidad de cromosomas. Yamaduros, los gametos slo contienen la mitad de la cantidad normalde cromosomas; es decir, para nuestra especie, 23 cromosomas. Alunirse los dos gametos, el femenino y el masculino, se reconstituye elnmero normal de cromosomas, 23 pares o 46 cromosomas. Por tanto,cada clula de nuestro cuerpo tiene dos copias de cada cromosoma, odos juegos completos de todos nuestros genes, o genoma: uno que he-redamos de nuestro padre y otro que heredamos de nuestra madre.

    El orden en el que se han enlazado los nucletidos que conformanlas hebras del ADN constituye la informacin gentica. Es decir, la

    Figura 4. Estructura del ADN. Obsrveseque el ADN est constituido por doshebras de nucletidos que forman unadoble hlice. En cada una de estas he-bras los nucletidos, definidos por labase que poseen, siguen una secuenciadeterminada en la que se codifican lascaractersticas fenotpicas de la especieen cuestin.

  • secuencia que se obtiene de ir leyendo cada nucle-tido de acuerdo con su lugar en la hebra de igualmodo que al leer nosotros una palabra vemos en qulugar est cada una de las letras que la conformannos va a decir qu tipo de mensaje est codificado.Por supuesto, la informacin que contenga una se-cuencia como GAATTC no ser la misma que la quecontenga otra secuencia como TATAGC, aunqueambas sean del mismo tamao y utilicen las mismasletras, de igual manera que CARO no es lo mismoque ROCA. Todo el genoma humano (el conjunto detodos los genes que poseemos como especie) est co-dificado en las molculas de ADN que poseemos en cada una de nuestras clulas.Estas molculas son tan largas y delgadas que si las estirramos y

    pusiramos una a continuacin de otra,todas las molculas de ADN de una denuestras clulas mediran cerca de dos metros de lon-gitud. Tomando en cuenta que un ncleo promedioslo mide de dos a tres micras de longitud (una micraes la milsima parte de un milmetro), es claro que lagran cantidad de ADN que poseemos se encuentramuy bien empaquetada en los ncleos celulares. Aho-ra sabemos que el genoma humano tiene aproximada-mente 3 mil millones de nucletidos, que llenaranaproximadamente 500 directorios telefnicos de 500pginas cada uno, o un solo DVD (video disco digi-tal), repartidos en 23 cromosomas. Estos 23 cromoso-mas representan un genoma (nosotros tenemos doscopias en cada una de nuestras clulas, excepto en losgametos), y un genoma medira estirado aproximada-

    mente un metro. Esto es justamente lo que estn ter-minando de elaborar el Proyecto Genoma Humano yla compaa Celera: conocer y ensamblar toda estasecuencia correctamente. Es como tener una oracingigantesca de 3 mil millones de letras. Embebidasdentro de esta secuencia se encuentran palabras quecodifican para todos nuestros genes. A su vez, cadagen que poseemos puede codificar finalmente parauna protena o para otro tipo de cido nucleico, lla-mado cido ribonucleico, o ARN, que es de cadenasencilla. Estos resultados se publicaron en el otoo delao 2000. Finalmente tenemos los libros, volviendo anuestra metfora de la construccin, que contienentodas las instrucciones para hacer la casa. Es decir, te-nemos el libro que especifica a nuestra especie. Aho-

    ra es necesario entender e interpretar este libro.Hagamos algunas aclaraciones acerca de la sin-

    taxis del idioma del ADN: la secuencia es con-tinua, como una gargantuesca oracin que nosdejara sin aliento muchsimo antes del final,

    y dentro de ella, embebidos, y frecuentementesegmentados, se encuentran los genes. Si hacemos unacomparacin con las letras del alfabeto, podramosproponer que un segmento del genoma se vera as:

    actdbacieghiiiiROgtfdvbgfsabnammmnulokahuiypacCAmkolkijhjaauaaahkn

    Dentro de esta secuencia estn en maysculascuatro letras: RO y CA, que unidas haran la palabraROCA. Pero cmo saber que lo que codifica esa se-cuencia es ROCA y no otra cosa? (Las maysculas lashe puesto para facilitar la comprensin.)

    Existen signos de puntuacin: por ejemplo, la co-rrida de cuatro es (iiii) que estn justo antes de ROsignificara que las letras que siguen son importantesporque son parte de una palabra (gen), y que esta pa-labra inicia justo a continuacin de la ltima i. Estapalabra contina sin interrupcin hasta encontrar gt,que indica que la palabra est segmentada (de nuevo,para simplificar las cosas, he dividido la palabra en s-labas), y que se debe seguir leyendo hasta encontrarac, que vendra a significar que justo despus de ac sehalla el siguiente segmento de la palabra, CA. Las se-ales gt y ac en este contexto significan que debemos

    El genoma humano

    10 ciencia enero-marzo 2002

  • Qu es el genoma?

    11enero-marzo 2002 ciencia

    unir RO con CA para formar la palabra, y que debe-mos desechar la secuencia mk, que significara que sees el final de la palabra. sta es parte de la informa-cin, pero tambin dentro de la secuencia hay otrosmensajes: se especifica cundo debe leerse ROCA, endnde debe leerse y quines deben leer ROCA. Es de-cir, no todas las clulas del cuerpo expresan todos losgenes que tenemos. Por ejemplo, una neurona no ex-presa el gen que codifica para la queratina, que es laprotena mayoritaria del pelo, as como una clulapilosa no expresa las protenas que sirven para fabri-car los mensajeros que utilizan las neuronas para co-municarse entre s. Adems, los genes no necesaria-mente se expresan todo el tiempo, sino que muchasveces slo lo hacen durante cierta etapa del desarro-llo: el feto humano en desarrollo dentro de la madreexpresa una hemoglobina distinta de la que expresacuando ya ha nacido. La hemoglobina fetal es msafn al oxgeno que la hemoglobina que se sintetizadespus, y que tambin produce la madre, lo que po-sibilita que el oxgeno pase de la hemoglobina de lamadre a la del feto. Todas estas seales de controltambin se encuentran embebidas en la secuencia, ypueden localizarse antes (por ejemplo: baci), en me-dio, es decir, entre las seales gt y ac, o despus, es de-cir despus de las letras mk de nuestro ejemplo.

    Estas seales de control se conocen de maneraparcial, de modo que an no es posible tener el nme-ro exacto de nuestros genes porque an no los hemoslocalizado a todos dentro de esta gigantesca oracin.Por supuesto, lo primero que se necesita es tener la secuencia completa (oracin) para poder despusanalizarla. Lo que estamos terminando de descubrir esprecisamente la secuencia del genoma, la oracincompleta. Tenemos el diccionario y los instructivos,pero no conocemos todas las palabras. El siguiente paso es someter esa secuencia a diversos algoritmoscomputacionales capaces de reconocer las palabrasembebidas en la secuencia, as como los cdigos decontrol, algo que ciertamente representa otro esfuer-zo monumental. De hecho, una rama de la biologa yde la informtica, la bioinformtica, se dedica a estu-diar esos aspectos de los genes: disear programas decmputo que sean capaces de descubrir las palabrasembebidas en la oracin. La bioinformtica tambin

    tuvo un papel muy revelante en la secuenciacin del genoma: para poder leerlo todo, se tuvo que partiral genoma en partes muy pequeas, que se podan se-cuenciar, para luego almacenar la informacin, y fi-nalmente, como en un rompecabezas, colocar todoslos fragmentos de secuencia en el lugar adecuado. Sedice que ensamblar el genoma humano es el rompe-cabezas ms complejo que ha resuelto la especie hu-mana hasta hoy da, un reto que hace empequeecerel famoso nudo gordiano o el laberinto de Minos.

    El 15 de febrero de 2001 se dio a conocer pblica-mente los resultados de este esfuerzo de secuenciacin.El genoma humano se compone aproximadamente de3 mil 200 millones de pares de bases. Segn estudiosde bioinformtica como los esbozados antes, se creeque tenemos entre 30 y 40 mil genes. Sin embargo,dada la experiencia en predecir genes a partir de la se-cuencia en el genoma de la mosca de la fruta, Droso-phila melanogaster, es posible que el nmero total degenes aumente entre 10 y 20%, es decir, hasta cercade 50 mil genes; pero esto es as porque los algoritmosque se utilizan hoy en da para predecir genes a partirde la secuencia no son perfectos, y dan una subesti-macin del nmero real.

    Si hacemos una comparacin con alguien que em-pieza a aprender otro idioma, diramos que sabemosya muchas palabras y que conocemos algunos de sususos (cules son algunos de los cdigos de control,cundo se usan, bajo qu circunstancias y por qui-nes), pero desconocemos muchas otras, de maneraque el cuadro que tenemos ahora es parcial. Slo tenemos un dominio parcial del idioma; somos unalumno adelantado en la escuela de idiomas, pero elaprendizaje an no termina.

    Juan R. Riesgo es licenciado en biologa por la UNAM, maestroy doctor en esa ciencia por la Universidad de Yale, y posdocto-rado en la Universidad de Zurich. Pertenece al Sistema Nacionalde Investigadores. Desde 1998 se desempea como investigadoren el Centro de Neurobiologa de la UNAM, en Quertaro, cuyotema central es el estudio de la va de sealizacin de la cina-sa de Jun y la transduccin olfatoria y visual de la mosca de lafruta, Drosophila melanogaster, en la que se emplea una mezclade biologa molecular, celular, gentica, bioqumica, fisiologa ybiologa conductual para identificar y caracterizar los diversosgenes que componen las cadenas transductoras.