Antes de abordar en detalle la descripción de las técnicas del ADN recombinante, es oportuno destacar algunas informaciones –genoma, genes y familias de genes– que permitirán comprender mejor la utilidad de esta metodología para el descubrimiento de enfermedades genéticas humanas.
- Genoma humano y genes
En los artículos precedentes ya hemos descrito de qué manera se transmite la información genética del ADN al ARN, y de este último a las proteínas. Sabemos además que el genoma humano haploide está constituido por 3 x 10 elevado a 9 pares de nucleótidos: de éstos, un 30% aproximadamente es ADN repetitivo, es decir, constituido por secuencias de bases que se repiten muchas veces; mientras que el 70% (unos 2 x 10 elevado a 9 pares) está constituido por ADN de secuencia única, presente una sola vez en el genoma. Solamente el 10% de este último ADN, equivalente a 2 x 10 elevado a 8 pares de bases, se transcribe en ARN mensajero que abandona el núcleo para ser traducido en el citoplasma. Si se calcula que la longitud media de una molécula de ARN mensajero, capaz de codificar una proteína, es de 1.500 nucleótidos (2 x 10 elevado a 8 / 1.500 = 130.000), resulta que el genoma humano debería contener unas 130.000 unidades independientes, es decir, 130.000 genes estructurales. Pero muchos genes estructurales se repiten muchas veces en el genoma humano; en consecuencia, se cree que la cantidad de proteínas humanas codificadas por el genoma oscila entre las 30.000 y las 100.000. Éste es, por tanto, el número estimado de genes repartidos entre los 24 cromosomas humanos (22 autosomas y 2 heterocromosomas, X e Y). Las dimensiones de los genes pueden variar entre unos pocos centenares de bases de ADN hasta más de un millón.
Hemos visto en los artículos anteriores que los genes eucariotas se organizan de manera que las secuencias que codifican aminoácidos, los exones, están intercaladas con secuencias que no se traducen, llamadas intrones, de las que se desconoce todavía su función. Tomemos como ejemplo el gen de la hemoglobina del hombre adulto. Como ya se ha dicho, la hemoglobina es un tetrámero, es decir, una proteína compuesta por cuatro subunidades iguales dos a dos: dos cadenas alfa y dos cadenas beta: los genes de las cadenas alfa y los de la beta están situados en cromosomas distintos: las primeras cadenas se cartografían en el cromosoma 16, y las segundas en el cromosoma 11.
El gen correspondiente a la cadena alfa está formado por 800 pares de bases, mientras que el de la cadena beta tiene una longitud casi doble de la anterior; contra lo que cabría esperar, sin embargo, las proteínas producidas por los genes de ambos tipos poseen similar longitud: las cadenas alfa están formadas por 141 aminoácidos, y las beta, por 146. Ello es así por la distinta dimensión, en los dos genes, de los intrones, que se transcriben en el ARN mensajero pero son cortados y retirados (spliced) antes de que aquél se traduzca en proteínas.
- Las familias de genes
A veces, genes con funciones similares se encuentran situados en cromosomas próximos unos a otros: se dice que los genes de este tipo están organizados en familias. Este es el caso de la familia de genes de la hemoglobina. Al comienzo de este artículo se ha dicho que aproximadamente el 30% del ADN genómico lo integran secuencias repetidas cuya función se está estudiando todavía. Entre éstas, las más comunes son las llamadas secuencias Alu, formadas por unos 300 pares de bases que se repiten muchas veces en el genoma humano.