Genetische Variation (Mensch)
Zu den bekanntesten Ergebnissen des Humangenomprojekts gehört, dass Menschen, gleich ob nahe verwandt oder von verschiedenen Regionen oder Erdteilen, etwa 99,9 Prozent ihres Erbguts gemeinsam haben – selbst zu den nächsten Verwandten des Menschen, den Schimpansen beträgt die Gemeinsamkeit wohl noch mehr als 98,5 Prozent.[1] Durch die enorme Größe des Genoms (abgeschätzt etwa 3 Milliarden Basenpaare) ist der verbleibende variable Anteil – er entspricht grob abgeschätzt etwa einer heterozygoten Position pro 1.300 Basenpaaren[2] – aber immer noch beträchtlich. Das menschliche Genom umfasst nach heutiger Kenntnis mehr als 10 Millionen Polymorphismen mit einem Anteil von höher als 1 Prozent an der Gesamtpopulation[3] und ständig werden neue entdeckt. Zwei zufällig ausgewählte, nicht nahe verwandte Menschen unterscheiden sich dadurch in Millionen von Basenpaaren, abgeschätzt jeder von uns in etwa vier Millionen Basenpaaren von einem zufällig ausgewählten anderen Menschen.[4]
Diese genetische Variation ist verantwortlich für den erblichen Anteil der gesamten phänotypischen Variation, die zwischen verschiedenen Menschen besteht; sie berührt damit Merkmale und Merkmalskomplexe wie Körpergröße, Hautfarbe, Anfälligkeit für verschiedene Krankheiten und möglicherweise auch psychische Faktoren.
Hintergrund
Das menschliche Erbgut umfasst etwa 21.000 proteincodierende Gene,[2] sie entsprechen etwa 1,5 Prozent des Genoms. Doch unterliegen mindestens etwa drei (bis zu acht) Prozent der Basenpaare einer negativen (bereinigenden) Selektion, das bedeutet Mutationen sind hier seltener, als zufallsbedingt zu erwarten wäre.[5] Der Anteil bedeutsamer Sequenzen abseits proteincodierender Abschnitte ist also umfangreicher als jener der proteincodierenden Gene. Solche bedeutsamen nichtcodierenden DNA-Abschnitte dienen hauptsächlich der Genregulation, ihre Sequenzen stellen insbesondere sogenannte Cis-Elemente dar oder werden in regulatorische RNA umgeschrieben. Ein weiterer großer Anteil des Genoms wird von mobilen genetischen Elementen oder Transposons eingenommen; anders als früher gedacht, sind diese nicht alle nur genetischer „Müll“, sondern übernehmen zum Teil regulatorische Aufgaben und spielen eine Rolle bei evolutionären Neuerungen der Genexpression. Der Rest des Genoms besitzt, soweit heute bekannt, keine vergleichbare Funktion, vielfach handelt es sich um ständig wiederholte kurze Sequenzen (repetitive DNA), vermutlich ohne Informationsgehalt.
Durch Mutationen erzeugte Variation in proteincodierenden Genen und allen regulatorisch wirksamen Anteilen, nicht, wie lange Zeit angenommen, in den codierenden Genen allein, tragen damit zur Merkmalsvariation des Menschen bei. Genetische Variation (Polymorphismen) in den übrigen Abschnitten besitzt vermutlich in der Regel keine besonderen Auswirkungen. Ihre Erforschung kann aber z. B. für die Analyse von Verwandtschaftsbeziehungen hilfreich sein (Genetische Genealogie); auch die Technik des sog. genetischen Fingerabdrucks beruht auf solcher Variation nichtcodierender Abschnitte, die nicht der Selektion unterliegen. Für diese Verfahren werden auch Variationen der repetitiven DNA betrachtet, so genannte Mikrosatelliten. Diese werden im Folgenden nicht weiter betrachtet.
Ebenfalls erst seit weniger als 20 Jahren ist bekannt, dass unter Umständen auch erbliche Variationen abseits der DNA-Sequenz bei der Merkmalsausprägung zu beachten sind; dies wird Epigenetik genannt.
Alle Unterschiede zwischen Individuen, die weder genetischer noch epigenetischer Natur sind, müssen demnach durch Umwelteinflüsse erklärt werden. Der durch sie bedingte Anteil an der Variationsbreite wird Umweltvariation genannt.
Typen der genetischen Variation
Variation im menschlichen Genom betrifft verschiedene Genloci in unterschiedlichem Ausmaß. Einige Abschnitte variieren niemals, vermutlich deshalb, weil hier entstehende Varianten fast immer letale Auswirkungen haben. Man spricht hier von „konservierten“ Genen bzw. Genabschnitten. Wenige Bereiche sind hoch variabel zwischen verschiedenen Individuen.
Dabei sind geerbte Varianten zu unterscheiden von solchen Variationen, die „de novo“ durch spontane Mutation in einem Individuum neu entstehen; diese können Keimzellen betreffen oder Zellen des übrigen Körpergewebes. Von wesentlicher Bedeutung ist hier der Unterschied zwischen erblichen, in der Keimbahn verankerten Variationen und den nicht ererbten, im Körpergewebe (somatisch) neu entstandenen. Letztere können sich auf die Entstehung zahlreicher Krankheiten, zum Beispiel Krebs, auswirken; sie werden aber nicht an künftige Generationen vererbt.
SNPs
Die häufigsten und am besten verstandenen Variationen des menschlichen Genoms betreffen den Austausch einer einzelnen Base, dies wird als Einzelnukleotid-Polymorphismus, in der Regel abgekürzt als SNP (ausgesprochen als „snip“), bezeichnet. Aufgrund der Redundanz des genetischen Codes können SNPs ohne Konsequenz („stumm“) sein, wenn das aus der Mutation resultierende Basentriplett für dieselbe Aminosäure codiert wie das ursprüngliche. Andernfalls wird meist eine einzelne Aminosäure eines Proteins ausgetauscht, seltener resultieren komplexere Veränderungen, zum Beispiel, wenn ein Stopcodon neu entsteht. Betreffen SNPs die Keimbahn, werden sie vererbt. Obwohl naturgemäß zahlreiche sehr seltene SNPs existieren, die zum Beispiel auf eine kurz zurückliegende Mutation zurückgehen, sind Millionen von SNPs im Genom in vielen Populationen sehr weit verbreitet. Dieser Polymorphismus besteht entweder, weil die entsprechende Variante evolutiv neutral (oder beinahe neutral) ist, d. h. kaum der Selektion unterliegt, weil ausgleichende Selektion (engl.: balancing selection) die Verschiedenheit aktiv erhält und fördert, oder weil in unterschiedlichen Regionen jeweils unterschiedliche Varianten, zum Beispiel wegen anderer vorherrschender Krankheitserreger oder eines anderen Klimas, selektiv vorteilhaft sind. Durch Forschungsvorhaben wie z. B. das 1000-Genome-Projekt oder HapMap liegen heute umfangreiche Datenbanken über im menschlichen Genom verbreitete SNPs vor. Weil SNPs in Familien über mehrere Generationen vererbt werden, bilden sie die Grundlage für die Genetische Genealogie; vereinfacht gesagt sind zwei Menschen umso näher verwandt, je mehr SNPs sie gemeinsam haben.
Indels
Eine weitere verbreitete Quelle der genetischen Variation betreffen kurze Einfügungen (Insertionen) und Auslassungen (Deletionen) kurzer DNA-Abschnitte, die zum Beispiel durch Fehler und Ungenauigkeiten bei der DNA-Replikation entstehen können. Wegen der oftmals vergleichbaren Auswirkungen werden beide Variationen oft zu einer Klasse vereinigt, die dann Indels genannt wird.
CNVs
Bei weitem seltener als SNPs und Indels, aber doch viel häufiger als zeitweise angenommen, existieren umfangreichere und komplexere Variationen im menschlichen Genom. Diese werden meist unter copy number variation, abgekürzt CNV, deutsch „Kopienzahlvariation“, zusammengefasst.[6] CNVs können Tausende, selten sogar Millionen von Basenpaaren lang sein, sie sind mit den vor allem für SNPs optimierten normalen Techniken schwer zu entdecken. Am häufigsten treten Veränderungen in der Kopienzahl eines Gens auf, die durch die veränderte Transkriptionsrate durch Veränderung der Dosis eines Genprodukts Veränderungen des Phänotyps bewirken können; seltener kommt es zu komplexen Veränderungen mit strukturellen Auswirkungen. Etwa 5 Prozent aller Gene liegen im Genom schon normalerweise in zwei oder mehr Kopien vor, die Anzahl der Genkopien bei diesen kann besonders leicht variieren, da es hier besonders leicht zu Verschiebungen des Kopierrasters aufgrund nicht homologer Paarungen kommen kann. CNVs betreffen möglicherweise aber sogar mehr als 10 Prozent des gesamten menschlichen Genoms.
Die bereits seit langem bekannten Veränderungen der Anzahl ganzer Chromosomen, die Erkrankungen wie das Down-Syndrom oder das Turner-Syndrom bewirken, stellen besonders ausgeprägte, allerdings nicht die Keimbahn betreffende CNVs dar.
Der Haplotyp
Im diploiden Genom eines Menschen gibt es jedes Gen – mit Ausnahme einiger auf den Geschlechtschromosomen – in zwei Ausfertigungen: eines auf dem vom Vater und eines auf dem von der Mutter ererbten Chromosom. Diese Gene müssen nicht identisch sein und können in Genvarianten auftreten. Liegen die beiden Gene in unterschiedlichen Allelen vor, ist der Zusammenhang zum Phänotyp nicht eindeutig und oft verwickelt. Manchmal wird eines der Allele auch epigenetisch maskiert (stummgeschaltet), sodass der Phänotyp vollständig von dem anderen bestimmt wird.
Auch für die Vererbung von Genvarianten ist es nicht gleichgültig, wie sie auf den Chromosomen angeordnet sind. Liegen zwei Varianten auf demselben Chromosom, ist es aufgrund der Natur des Verdoppelungsvorgangs sehr viel wahrscheinlicher, dass sie gemeinsam vererbt werden und dann auch in der nächsten Generation gemeinsam auftreten. Wird der Phänotyp gerade durch die Kombination in besonderer Weise geprägt, kann dies die Frequenz des Allels dann enorm beeinflussen. Die Allelausprägung jeweils eines Chromosoms wird deshalb mit einem besonderen Fachwort als Haplotyp bezeichnet. Die Allele eines Haplotyps werden gemeinsam vererbt, außer wenn durch Crossing-over während der geschlechtlichen Fortpflanzung (während der Meiose) Abschnitte gegeneinander ausgetauscht werden.
Koppelung und Koppelungsungleichgewicht
Da Gene auf demselben Chromosom häufiger gemeinsam vererbt werden, erscheinen sie bei einer statistischen Analyse miteinander gekoppelt (engl: linkage). In klassischen genetischen Studien zu Erbkrankheiten kann durch Kopplungsanalyse der Ort und Erbgang krankheitsverursachender Gene aufgeklärt werden, der ansonsten durch die Größe des Genoms kaum auffindbar wäre. Dies gelingt am besten mit durch ein einzelnes Gen mit großem Effekt verursachten Krankheiten, deren Erbgang den Mendelschen Regeln folgt.
Ist ein Allel eines Haplotyps (in einer bestimmten Umwelt) stark von der Selektion begünstigt, wird nicht nur, wie zu erwarten wäre, dieses Allel selbst in künftigen Generationen häufiger, sondern auch andere (neutrale oder sogar negative) Allele, die sich zufällig auf demselben Chromosom in räumlicher Nähe dazu befinden. In gleicher Weise können Allele, die nur in Kombination einen positiven oder negativen Effekt besitzen, je nach Koppelung verstärkt oder vermindert selektiert worden sein. Dieser Zusammenhang wird umso seltener durch Crossing-over aufgebrochen werden, je weniger Zeit seit der Entstehung des Allels vergangen ist, und je näher benachbart die gekoppelten Allele auf dem Chromosomenstrang liegen (da Crossing-over zwischen ihnen dadurch unwahrscheinlicher wird). Durch die Koppelung sind einzelne Allele häufiger als nach dem Zufall zu erwarten gemeinsam vorhanden, auch ein neutrales Allel kann dadurch quasi huckepack im Genom häufiger werden. Dieser Zusammenhang wird Koppelungsungleichgewicht, oder häufiger nach dem Englischen „linkage disequilibrium“ genannt (heute wird der Term linkage disequilibrium allerdings, davon abgekoppelt, für alle nicht-zufälligen Beziehungen von Allelen verwendet[7]). Durch linkage disequilibrium konservierte Genensembles sind zum Beispiel bei der Analyse von Erbkrankheiten, die durch zahlreiche Gene mit geringem Effekt (die für sich betrachtet die Wahrscheinlichkeit der Krankheit nur um wenige Prozent beeinflussen), wichtig.[8] Dabei macht man sich zunutze, dass das (unbekannte) krankheitsfördernde Allel im linkage disequilibrium mit einem bereits bekannten SNP sein könnte, so dass eine Korrelation zwischen SNP und Krankheit auch dann zu beobachten wäre, wenn das SNP-Allel selbst überhaupt nichts mit der Erkrankung zu tun hat. Zu diesem Zweck sind standardisierte Sonden, sog. SNP-Chips, entwickelt worden.
Ein weiteres Einsatzfeld für linkage disequilibrium ist die Analyse des Ursprungs menschlicher Populationen und von Wanderungsbewegungen.
Variation zwischen Individuen und zwischen Populationen
Nach einem gängigen Maß, Wrights Index FST, kann man überschlägig geschätzt etwa 15 Prozent der Varianz im menschlichen Erbgut auf Unterschiede zwischen Populationen, die restlichen 85 Prozent auf Unterschiede von Individuen innerhalb dieser Populationen zurückführen.[9] Aus diesem seit Jahrzehnten bekannten und durch die modernen Ergebnisse bestätigten Wert ist geschlossen worden, die Unterschiede zwischen Populationen (oder dem damals noch vorherrschenden Sprachgebrauch folgend: Rassen) seien so gering, dass sie zu vernachlässigen seien,[10] dieser Schluss ist aber keineswegs zwingend.[11] Unterschiede in der genetischen Struktur zwischen Populationen können genutzt werden, um die Ausbreitung des Menschen über den Globus zu rekonstruieren. Sie sind aber möglicherweise auch bedeutsam bei der medikamentösen Behandlung von Krankheiten.
Wie kommen Unterschiede zwischen Populationen zustande?
Dass unterschiedliche Menschengruppen unterschiedliche Allele ihrer Gene tragen, ist überwiegend einfach eine Folge des Zufalls, in Zusammenhang mit Genen als Gendrift bezeichnet. Unterschiedliche Nachkommenzahlen von Eltern mit zufälligen genetischen Unterschieden führen dazu, dass an einigen Orten bestimmte Allele zufällig verloren gehen, an anderen Orten andere. Diese Unterschiede gleichen sich nur dann ständig wieder aus, wenn die Paarungshäufigkeit innerhalb der Population zufällig verteilt ist (Panmixie), der homogenisierende Einfluss auf eine Einzelpopulation wird dann als Genfluss bezeichnet. Untersuchungen menschlicher Populationen haben gezeigt, dass Menschen ihre Partner fast ausschließlich aus einem engen Radius (in traditionellen Gesellschaften wenige Kilometer) um ihren Geburtsort wählen. Daraus ergibt sich eine Populationsstruktur, bei der zwar Merkmale mehr oder weniger kontinuierlich variieren, bei Vergleich über etwas größere Distanzen aber merkliche Unterschiede entstehen, die gegen den homogenisierenden Einfluss des Genflusses Bestand haben, aber ohne dass an irgendeiner Stelle eine scharfe Trennungslinie zu ziehen wäre. Populationsmodelle mit solchen Eigenschaften werden als „Isolation durch Distanz“ beschrieben (auch dieses Konzept geht auf das Werk von Sewall Wright zurück[12]). Werden nur Menschen aus weit entfernten Regionen miteinander verglichen, wird die klinale Natur der Variation leicht verkannt.[13]
Nur für sehr wenige Merkmalsvariationen wurde ein adaptiver Wert ermittelt, zum Beispiel die Hautfarbe. Menschen, die in kälteren Klimaten leben, sind außerdem im Verhältnis schwerer, ihre Gliedmaßen (vor allem der distale Abschnitt) sind kürzer, während bei der Körpergröße insgesamt kein Trend besteht.[14] Die Tendenz zu kürzeren Extremitäten in kälterem Klima folgt der aufgrund von Beobachtungen an zahlreichen Tierarten aufgestellten Allen'schen Regel. Ein weiteres, bekannt gewordenes Beispiel ist die Laktosetoleranz bei Europäern und Nordasiaten, die mit der Abstammung von Viehzüchtern erklärt wird und sich offensichtlich erst vor wenigen Tausend Jahren in den Populationen durchsetzte.[15] Ein weiteres berühmt gewordenes Beispiel ist das Sichelzellenanämie-Allel, das (heterozygoten) Trägern höhere Resistenz gegenüber Malaria verleiht und deshalb, trotz der schweren Erbkrankheit im homozygoten Fall, sich in stark von Malaria betroffenen Gebieten in hohen Anteilen der Population findet (Balancierter Polymorphismus).
Variation aufgrund der Abstammungsgeschichte
Die gegenwärtige genetische Variation spiegelt zudem die Geschichte von Migration und Bevölkerungswachstum wider. Wenn Populationen, z. B. durch Auswanderung, aus anderen Populationen hervorgehen, indem eine kleine Gruppe in einen neuen Lebensraum vorstößt (wie z. B. die Polynesier bei ihren Bootsfahrten zu den pazifischen Inseln), ist zu erwarten, dass in dieser Gruppe nicht alle Allele der Ausgangspopulation vertreten sein werden. Wird diese Population dann im neuen Lebensraum wieder zahlreicher, ist ihre Variation trotzdem merklich geringer als diejenige der Ausgangspopulation (auch wenn durch Neumutation nach und nach die Zahl der Allele wieder höher werden wird). Dies wird als der Gründereffekt bezeichnet. In gleicher Weise wirkt sich ein drastischer Bevölkerungsschwund aus, den nur eine kleine Gruppe überlebt. Auch wenn die Population später wieder ihre Ausgangsgröße erreicht, ist ihre Variation dauerhaft vermindert; dies wird als Genetischer Flaschenhals umschrieben.
Populationsgenetiker haben Individuen aus zahlreichen Populationen und Völkern auf der ganzen Erde genetisch verglichen, die bei ihnen vorhandenen SNPs, Mikrosatelliten und anderen Variationen kartiert, gezählt und verglichen, um auf dieser Basis die Ausbreitung rekonstruieren zu können. Es zeigt sich, dass die höchste genetische Variabilität in Afrika zu finden ist (dies gilt auch phänotypisch, z. B. für die klassische anthropologische Technik der Schädelvermessung[16]). Die Populationen der anderen Kontinente besitzen (von wenigen neuen Allelen abgesehen) nur einen bestimmten Ausschnitt des afrikanischen Spektrums. Die Daten lassen sich gut mit einer Serie von Gründereffekten nach der Auswanderung aus einer afrikanischen Urheimat erklären.[17] Gruppiert man die Sequenzen nach Ähnlichkeiten, sind die aus dem Nahen Osten den Afrikanern am ähnlichsten, gefolgt von Europäern, Süd- und Zentralasien und Ostasien, am weitesten unterscheiden sich die Bewohner Papuas und Melanesiens sowie die indigenen Amerikaner. Auch wenn die Ähnlichkeit benachbarter Völker zum Teil sicherlich auf Vermischung oder Hybridisierung zurückzuführen ist, lässt sich dieses Muster sehr überzeugend als Abbild einer Wanderungsbewegung mit dem Ursprung Afrika interpretieren,[18] was ältere Studien auf Basis weniger Gene und der Verwandtschaft von Sprachen, sowie von Parasiten des Menschen, klar bestätigt.[19] Die beobachtbare Variation ist dabei fast in ihrer Gänze zufallsgetrieben, d. h. durch genetische Drift erklärbar. Hypothesen über eine unterschiedliche Evolutionsgeschwindigkeit zwischen „Rassen“, die von rassistischen Vertretern der Neuen Rechten bis heute vertreten werden[20], haben in den Daten keinerlei Grundlage.
Auch innerhalb von Regionen lässt sich die Verwandtschaft von menschlichen Populationen mit denselben Methoden aufklären. Neben zahlreichen europäischen Studien wurden zum Beispiel die Bewohner der pazifischen Inseln in einer großen Studie analysiert.[21] Dabei wurde nicht nur der Unterschied zwischen Melanesiern und Polynesiern bestätigt, es zeigte sich auch, dass die Bewohner des Landesinneren der großen Inseln untereinander genetisch sehr verschieden sind (wobei jede Gemeinschaft unter sich relativ wenig Variabilität aufwies). Die Bewohner der Küstenregionen derselben Inseln sind untereinander viel näher miteinander verwandt. Dies zeigt nicht nur, dass beide Gruppen die Inseln unabhängig voneinander erreichten, sondern auch, dass der offene Ozean offensichtlich eine geringere Barriere für Wanderungen darstellte als die schroffen Gebirge des Landesinneren.
Die erwähnten Daten erlauben die Rekonstruktion eines Verzweigungsmusters, liefern aber in dieser Form weder Werte für die Datierung der Wanderung noch über die (effektive) Populationsgröße der beteiligten Gruppen. Analysen der Daten daraufhin sind recht verwickelt und die Resultate uneinheitlich und von den verwendeten (auch statistischen) Methoden abhängig.[22][23] Schon aus der Tatsache, dass die Variation des menschlichen Genoms beim Vergleich zwischen Arten vergleichsweise klein ist (sie ist kaum halb so groß wie diejenige von Schimpanse und Gorilla, trotz weitaus größerem Areal und Populationsgröße), kann auf einen relativ kurz zurückliegenden Ursprung aller heutigen menschlichen Populationen geschlossen werden.
Obwohl in einigen Fällen die Inzidenz von Krankheiten an die geographische Herkunft gekoppelt ist, gilt die Kenntnis der ethnischen Abstammung (z. B. der Hautfarbe) bei der Diagnose und Behandlung von Krankheiten als wenig bedeutsam[24], nicht zuletzt insbesondere in Immigrantengesellschaften wie den USA, wo Menschen afrikanischer Herkunft (nach Selbstauskunft klassifiziert) schon im Durchschnitt mehr als 20 Prozent „europäischer“ SNPs tragen. Zumindest bei der Erforschung der genetischen Ursachen von Krankheiten reicht es nicht aus, Studien an einer limitierten, homogenen Gruppe Europäer oder Europäischstämmiger als Repräsentanz für die Menschheit zu betrachten.[25] In medizinischen Studien sowie der Forensik ist es in den USA weithin üblich, die „Rasse“ (race) der Studienteilnehmer (z. B. neben dem Geschlecht und dem Alter) anzugeben, z. B. eingeteilt in Weiße, Schwarze, Hispanier (Südamerikaner), Asiaten und Indianer. Andere Einteilungskriterien differenzieren die Weißen noch weiter.[26]
Einfluss archaischer Menschen
Seit dem Jahr 2010 ist bekannt, dass ein Teil der genetischen Variation beim modernen Menschen zusätzlich durch das Einkreuzen (Introgression genannt) von Genen archaischer, ausgestorbener Stammlinien des Menschen in den menschlichen Genpool herrührt. Ein solcher Genfluss ist erst nachweisbar, seit aus fossilen Knochen DNA extrahiert und sequenziert werden kann, so dass das archaische und das moderne Erbgut direkt miteinander verglichen werden können. Moderne Europäer tragen demnach 1 bis 4 Prozent Allele des Neanderthalers[27]. Und ein anderer Vormensch, der Denisova-Mensch, bisher nur von einem Fingerknochen aus einer Höhle im Altai-Gebirge bekannt, hat zum Genom zahlreicher Menschengruppen beigetragen, am meisten mit 4 bis 6 Prozent zu dem der Melanesier[28]. Herausfinden lässt sich dies einerseits durch Vergleich mit nicht von der Introgression betroffenen Menschen-Populationen, vor allem Afrikanern. Daneben existieren raffinierte Methoden, bei denen zum Beispiel die Verteilung der Allele auf die Chromosomen statistisch analysiert werden.[29]
Anwendungen
Suche nach krankheitsauslösenden Genen
Wesentlicher Antrieb zur Erforschung der genetischen Variation des Menschen ist heute die Suche nach Genen und Genvarianten, die Volkskrankheiten wie Krebs, Diabetes, verschiedene Autoimmunerkrankungen oder Herz-Kreislauf-Erkrankungen hervorrufen oder fördern, oder die sich auf die Wirkung von Medikamenten gegen diese Krankheiten auswirken. Die öffentliche und private Forschung, die insgesamt Hunderte Millionen Euro benötigt hat, wird durch den erhofften medizinischen Nutzen angetrieben, weitere Erkenntnisse sind eher Beiprodukte. Bereits vor dem Humangenomprojekt war dabei klar, dass es sich nicht um wenige, allein krankheitsauslösende Gene handeln kann – ansonsten hätte man sie mittels Kopplungsanalyse bereits finden müssen (eine Übersicht über entsprechende Gene und Krankheiten gibt die Datenbank OMIM). Der bisherige Erfolg dieser Studien war allerdings durchwachsen.[30]
Die Methode, mit der man die für Erkrankungen wesentlichen Allele herauszufinden hofft, sind Genom-weite Assoziationsstudien (abgekürzt GWAS). Dabei dienen die kartierten, in menschlichen Populationen weit verbreiteten SNPs, die bereits bekannt und in Datenbanken zugänglich sind, als Marker bei der Suche nach krankheitsfördernden Allelen. Die Hoffnung dabei ist, dass diese linkage disequilibrium mit einigen dieser Marker aufweisen. Nach dem Grad der Koppelung ist es im Prinzip möglich, wenn man entsprechende Kandidaten gefunden hat, ihre Lage auf einem Chromosom einzugrenzen (da linkage disequilibrium ja mit räumlicher Nähe auf dem Basenstrang ansteigen sollte). SNPs, bei denen eine Koppelung eines Marker-SNP zu einem interessanten, komplexeren Merkmal (in der Regel einer Krankheit) gefunden wurden, werden ebenfalls in einer Datenbank gespeichert und dokumentiert, die das (amerikanische) National Human Genome Research Institute führt.[31] Inzwischen sind einige Tausend solcher Verknüpfungen gefunden worden. Steht ein identifiziertes Allel in statistisch signifikantem Zusammenhang mit einer Krankheit, ist in der Regel davon auszugehen, dass der entsprechende Genlocus an der Entstehung der Krankheit irgendwie beteiligt ist. In der Praxis sind etliche Loci gleich mit mehreren Krankheiten verknüpft (Pleiotropie).
Die bisherigen Studien[30] zeigen, dass für gängige Erkrankungen jeweils einige Hundert Loci mit Genvarianten identifiziert werden konnten, die mit Häufigkeit der Erkrankung korrelieren. Jedes einzelne trägt typischerweise aber nur 1 bis 1,5 Prozent zum Krankheitsrisiko bei, alle zusammengenommen etwa 20 bis 30 Prozent. Bei der Volkskrankheit Diabetes tragen alle bisher identifizierten SNPs zusammengenommen kaum 10 Prozent zum erblichen Krankheitsrisiko bei, ihre Kenntnis ist (verglichen mit anderen Faktoren, die zudem viel leichter und billiger zu ermitteln sind) für die klinische Anwendung wertlos[32] – wenn sie auch zahlreiche neue Anhaltspunkte zur Erforschung der Krankheit liefern. Zusätzlich ist bei diesen Forschungsergebnissen das methodische Risiko, zufällige Korrelationen fälschlich für statistisch signifikante Ergebnisse zu halten, extrem hoch.[33][34]
Für die Diskrepanz der Ergebnisse klassischer Erblichkeitsanalysen, die oft einen erheblichen erblichen Anteil an Krankheitsrisiken nahelegen, und den wenigen durch GWAS tatsächlich festzumachenden Allelen gibt es verschiedene Erklärungsmöglichkeiten[35]
- Infinitesimalmodell: Die Erblichkeit wird durch das Zusammenspiel hunderter, oder gar Tausender, Allele bestimmt, von denen jedes einzelne typischerweise weit weniger als ein Prozent beiträgt. Erhöhtes Risiko ist dann durch das zufällige Zusammentreffen vieler Hundert ungünstiger Allele erklärbar.
- „Seltene Allele“-Modell: Die Erblichkeit ergibt sich aus Allelen, die für sich betrachtet jeweils einen großen Effekt besitzen und das Risiko substantiell erhöhen. Nur ist jedes dieser Allele so selten, dass es nur bei einem Bruchteil der Patienten von oft weniger als einem Prozent auftritt. Für jede Krankheit könnte es Hunderte oder Tausende verschiedene solcher seltenen Allele mit großem Effekt geben, von denen alle durch ihre Seltenheit bei Analyse des Risikos der Gesamtbevölkerung keinen signifikanten Einfluss ergeben.
- Modell der erweiterten Erblichkeit: An der Vererbung von Krankheitsrisiken sind nicht nur Gene beteiligt. Neben vererbten epigenetischen Faktoren (z. B. Muster der DNA-Methylierung) spielen auch Wechselwirkungen zwischen Genen (Epistase) und zwischen Genen und Umwelt eine wesentliche Rolle.
Für und gegen jedes der Modelle gibt es empirische Belege. Wahrscheinlich spielen alle drei eine, im jeweiligen Einzelfall jeweils unterschiedliche, Rolle.
Ein Massentest (Screening) auf krankheitsassoziierte Allele, oder eine medizinische Analyse des eigenen Genoms, hat aus heutiger Sicht daher keinen besonderen Nutzen. Aus dem gleichen Grund sind aber Befürchtungen grundlos, Dritte (z. B. Versicherungen) könnten aus der Kenntnis des individuellen Genoms, die sie irgendwie erlangt haben, signifikante Krankheitsrisiken auslesen (von einigen recht seltenen Erbkrankheiten abgesehen). Kenntnis krankheitsfördernder Loci kann allerdings vielleicht zukünftig die Suche nach neuen Medikamenten entscheidend voranbringen.
Fallbeispiel: Hautfarbe
Die menschliche Hautfarbe gehört zu den auffälligsten genetisch bedingten Unterschieden zwischen einzelnen Menschen und menschlichen Populationen. Früher wurde, wesentlich auf Basis der Hautfarbe, die Menschheit in Menschenrassen eingeteilt. Außerdem ist die Pigmentierung der Haut ein wesentlicher Faktor bei der Entstehung von Krankheiten wie zum Beispiel Hautkrebs.[36] Ausschließlich bei Europäern treten zusätzlich Variationen in der Haarfarbe und Augenfarbe auf, deren genetische Basis zu der der Hautfarbe nahezu identisch ist.[37]
Obwohl andere Faktoren an der Farbentstehung beteiligt sind, ist die Variation der Hautfarbe bei Menschen fast ausschließlich auf Unterschiede in der Anzahl und Verteilung der Melanosomen, letztlich auf den Gehalt des Pigments Melanin zurückführbar, wobei der Gesamtgehalt weitaus wichtiger ist als das Verhältnis der beiden auftretenden Formen Phäomelanin und Eumelanin zueinander.[38] Hautfarbe ist ein klassisches polygenisches Merkmal, an dessen Ausprägung zahlreiche Gene beteiligt sind. Die vor allem aus der Untersuchung von Menschen mit Albinismus abgeleitete Idee, Varianten des Schlüsselenzyms Tyrosinase könnten die Variation erklären, hat sich nicht bestätigt. Auf Grundlage von genomweiten Assoziationsstudien (GWAS) sind aber inzwischen zahlreiche Gene identifiziert worden, bei denen unterschiedliche Allele, in der Regel nur durch Punktmutationen (SNPs) voneinander unterschieden, den größten Teil der Merkmalsvariation erklären können.
Gut nachgewiesen ist der Einfluss des Gens MC1R, das einen G-Protein-gekoppelten Rezeptor codiert.[39][37] Ein Allel dieses Gens findet sich auffallend gehäuft bei Menschen mit sehr hellem Hauttyp und roten Haaren (während es, anders als fast alle anderen betreffenden Gene, nichts zur Augenfarbe beiträgt). Von großer Bedeutung sind auch SNPs des Gens SLC24A5, zu diesem Gen homologe Gene sind als verantwortlich für helle Fell- oder Körperfarben bei einigen Tierarten (z. B. Agouti) identifiziert worden. Zahlreiche weitere Gene, zum Beispiel OCA2, MIM, HERC2, ASIP, IRF4, SLC24A4 und viele andere konnten durch GWAS mit Ausprägungen der Hautfarbe korreliert werden, ohne dass ihre Rolle bei der Regulation in jedem Falle verstanden wäre,[39][40] jedes Jahr werden neue entdeckt. Dabei besitzt kein einzelnes Gen einen entscheidenden Einfluss, zu hellerem oder dunklerem Hauttyp disponierende Allele können durch den Einfluss anderer Gene mit gegensätzlichem Effekt immer überlagert sein.
Hautfarbe gehört zu den wenigen Merkmalen, bei denen beim Menschen eine positive Selektion nachgewiesen werden kann.[41] Die Hautfarbe variiert mit der geografischen Breite, je näher am Äquator Menschen leben, desto dunkler ist ihre Haut. Als wesentlich wird ein Zusammenspiel zwischen Schutzfunktion gegen Zellschäden durch UV-Strahlung (begünstigt dunkle Haut bei intensiver Sonneneinstrahlung) und Vitamin-D-Synthese durch Sonnenlicht in der Haut[42] (begünstigt helle Haut bei geringer Sonneneinstrahlung) angesehen, weitere Faktoren wie die größere Anfälligkeit dunkler Haut gegenüber Erfrierungen spielen vermutlich eine Rolle.[38] Obwohl nicht völlig gesichert ist, welche Hautfarbe die ursprüngliche ist (Schimpansen haben helle Haut, die vom schwarzen Fell verdeckt wird), ist es am wahrscheinlichsten, dass die hellen Varianten auf Mutationen zurückgehen, die in nach Norden wandernden Menschenpopulationen bei der Ausbreitung der Menschheit von Afrika aus fixiert worden sind. Die helle Hautfarbe der Europäer und Nordasiaten (diese ist bei objektiver Messung gleich, die „gelbe Rasse“ eine Fiktion chauvinistischer Europäer) ist dabei konvergent auf unabhängiger genetischer Basis entstanden.
Zwillingsforschung
Unter gewissen Bedingungen lässt sich der genetische Anteil an der Variation anhand von phänotypischen Ähnlichkeiten zwischen Verwandten (z. B. Zwillinge) schätzen. Die Methode der Zwillingsforschung besteht darin, die Ähnlichkeiten von eineiigen und zweieiigen Zwillingen zu analysieren. Eineiige Zwillinge sind genetisch identisch, während zweieiige Zwillinge etwa die Hälfte ihrer Gene gemeinsam haben. Beide teilen sich dieselbe Schwangerschaft, und die meisten Zwillinge wachsen in derselben Familie auf. Will man nun herausfinden, inwiefern Körpergröße genetisch beeinflusst ist, kann man die Variation der Körpergröße bei eineiigen Zwillingen mit der bei zweieiigen Zwillingen vergleichen. Mithilfe der Populationsgenetik lässt sich danach die Heritabilität schätzen. Studien haben so ergeben, dass in den meisten Populationen etwas mehr als die Hälfte der Variation bei Körpergröße durch die genetische Verwandtschaft zwischen Eltern und Kindern erklärbar ist.[43]
Literatur
- C. G. Nicholas Mascie-Taylor, Akira Yasukouchi, Stanley Ulijaszek (Hrsg.): Human Variation. From the Laboratory to the Field (= Society for the Study of Human Biology. Symposium Series. Vol. 49). CRC Press, Boca Raton FL u. a. 2010, ISBN 978-1-4200-8471-9.
- Julian C. Knight: Human Genetic Diversity. Functional Consequences for Health and Disease. Oxford University Press, Oxford u. a. 2009, ISBN 978-0-19-922770-9.
- Robert Boyd, Joan B. Silk: How Humans Evolved. 4th edition. Norton, New York NY u. a. 2006, ISBN 0-393-92628-1.
Einzelnachweise
- The Chimpanzee Sequencingand Analysis Consortium (2005): Initial sequence of the chimpanzee genome and comparison with the human genome. Nature 437: 69–87. doi:10.1038/nature04072
- Eric S. Lander (2011): Initial Impact of the Sequencing of the Human Genome. Nature 470: 187–197. doi:10.1038/nature09792
- David B. Goldstein & Gianpiero L. Cavalleri (2005): Understanding human diversity. Nature 437: 1241-1242.
- Kelly A. Frazer, Sarah S. Murray, Nicholas J. Schork, Eric J. Topol (2009): Human genetic variation and its contribution to complex traits. Nature Reviews Genetics 10: 241-251. doi:10.1038/nrg2554
- The ENCODE Project Consortium (2012): An integrated encyclopedia of DNA elements in the human genome. Nature 489: 57-74 doi:10.1038/nature11247
- Pawel Stankiewicz & James R. Lupski (2019): Structural Variation in the Human Genome and its Role in Disease. Annual Review of Medicine 61: 437–455. doi:10.1146/annurev-med-100708-204735
- Montgomery Slatkin (2008): Linkage disequilibrium — understanding the evolutionary past and mapping the medical future. Nature Reviews Genetics 9: 477-489.
- Kristin G. Ardlie, Leonid Kruglyak, Mark Seielstad (2002): Patterns of linkage disequilibrium in the human genome. Natur Reviews Genetics 3: 299-310. doi:10.1038/nrg777
- Guido Barbujani & Vincenza Colonna (2010): Human genome diversity: frequently asked questions. Trends in Genetics 26: 285–295. doi:10.1016/j.tig.2010.04.002
- Richard Lewontin (1972): The apportionment of human diversity. In: T. Dobzhansky, M.K. Hecht, W.C. Steere (editors): Evolutionary Biology 6. Appleton-Century-Crofts, New York. pp. 381–398.
- A.W.F. Edwards (2003): Human genetic diversity: Lewontin’s fallacy. BioEssays 25: 798–801.
- S. Wright (1942): Isolation by distance. Genetics 28: 114-138.
- David Serre & Svante Pääbo (2004): Evidence for Gradients of Human Genetic Diversity Within and Among Continents. Genome Research 14: 1679-1685. doi:10.1101/gr.2529604
- Christopher Ruff (2002): Variation in human body size and shape. Annual Revue of Anthropology 31: 211–232 doi:10.1146/annurev.anthro.31.040402.085407
- J. Burger, M. Kirchner, B. Bramanti, W. Haak, M.G. Thomas (2007): Absence of the lactase-persistence-associated allele in early Neolithic Europeans. Proceedings of the National Academy of Sciences USA 104 (10): 3736–3741 doi:10.1073/pnas.0607187104
- Andrea Manica, Bill Amos, François Balloux, Tsunehiko Hanihara (2007): The effect of ancient population bottlenecks on human phenotypic variation. Nature 448(7151): 346–348. doi:10.1038/nature05951
- Jun Z. Li, Devin M. Absher, Hua Tang, Audrey M. Southwick, Amanda M. Casto, Sohini Ramachandran, Howard M. Cann, Gregory S. Barsh, Marcus Feldman, Luigi L. Cavalli-Sforza, Richard M. Myers (2008): Worldwide Human Relationships Inferred from Genome-Wide Patterns of Variation. Science 319: 1100-1104. doi:10.1126/science.1153717
- Chaolong Wang, Sebastian Zöllner, Noah A. Rosenberg (2012): A Quantitative Comparison of the Similarity between Genes and Geography in Worldwide Human Populations. PloS Genetics 8(8): e1002886. doi:10.1371/journal.pgen.1002886
- L. Luca Cavalli-Sforza & Marcus W. Feldman (2003): The application of molecular genetic approaches to the study of human evolution. Nature Genetics 33: 266-275. doi:10.1038/ng1113
- Andreas Vonderach (2008): Die Europäer, die anderen und die asymmetrische Evolution. Sezession 26: 10-14.
- Jonathan S. Friedlaender, Francoise R. Friedlaender, Floyd A. Reed, Kenneth K. Kidd, Judith R. Kidd, Geoffrey K. Chambers, Rodney A. Lea, Jun-Hun Loo, George Koki, Jason A. Hodgson, D. Andrew Merriwether, James L. Weber (2008): The Genetic Structure of Pacific Islanders. PLoS Genetics 4 (1): e19 doi:10.1371/journal.pgen.0040019
- Alan R. Templeton (2005): Haplotype trees and modern human origin. Yearbook of Physical Anthropology 48: 33-59.
- Heng Li & Richard Durbin (2012): Inference of Human Population History From Whole Genome Sequence of A Single Individual. Nature 475(7357): 493–496. doi:10.1038/nature10231
- Charles N. Rotimi & Lynn B. Jorde (2010): Ancestry and Disease in the Age of Genomic Medicine. New England Journal of Medicine 363: 1551-1558.
- Morris W. Foster & Richard R. Sharp (2004): Beyond race: towards a whole-genome perspective on human populations and genetic variation. Nature Reviews Genetics 5: 790-796. doi:10.1038/nrg1452
- Norman B. Anderson, Rodolfo A. Bulatao, Barney Cohen, Ethnicity National Research Council (US) Panel on Race: Racial and Ethnic Identification, Official Classifications, and Health Disparities. In: Critical Perspectives on Racial and Ethnic Differences in Health in Late Life. National Academies Press (US), 2004 (nih.gov [abgerufen am 23. Dezember 2023]).
- Richard E. Green et al. (2010): A Draft Sequence of the Neandertal Genome. Science 328: 710-722. doi:10.1126/science.1188021
- David Reich et al. (2010): Genetic history of an archaic hominin group from Denisova Cave in Siberia. Nature 468: 1053-1060. doi:10.1038/nature09710
- erläutert in Vitor Sousa & Jody Hey (2013): Understanding the origin of species with genome-scale data: modelling gene flow. Nature Reviews Genetics 14: 404–414. doi:10.1038/nrg3446
- Peter M. Visscher, Matthew A. Brown, Mark I. McCarthy, Jian Yang (2012): Five Years of GWAS Discovery. American Journal of Human Genetics 90(1): 7-24. doi:10.1016/j.ajhg.2011.11.029
- Catalog of Published Genome-Wide Association Studies
- Liana K. Billings & Jose C. Florez (2012): The genetics of type 2 diabetes: what have we learned from GWAS? Annals of the New York Academy of Sciences 1212: 59-77. doi:10.1111/j.1749-6632.2010.05838.x
- Joel N Hirschhorn, Kirk Lohmueller, Edward Byrne, Kurt Hirschhorn (2002): A comprehensive review of genetic association studies. Genetics in Medicine 4: 45–61. doi:10.1097/00125817-200203000-00002
- John P.A. Ioannidis (2005): Why most published research findings are false. PLoS Medicine 2(8): e124. doi:10.1371/journal.pmed.0020124
- Greg Gibson (2012): Rare and common variants: twenty arguments. Nature Reviews Genetics Vol. 13: 135-145. doi:10.1038/nrg3118
- Dominique Scherer & Rajiv Kumar (2010): Genetics of pigmentation in skin cancer — A review. Mutation research/ Reviews in mutation research Volume 705, Issue 2: 141–153. doi:10.1016/j.mrrev.2010.06.002
- Jonathan L. Rees (2003): Genetics of hair and skin color. Annual Revue of Genetics 37: 67–90 doi:10.1146/annurev.genet.37.110801.143233
- A.K. Kalla (2007): Human Skin Colour, Its Genetics, Variation and Adaptation: A Review. Anthropologist Special Issue No. 3: 209-214. PDF
- Richard A. Sturm (2009): Molecular genetics of human pigmentation diversity. Human Molecular Genetics Vol. 18, Review Issue 1 R9–R17. doi:10.1093/hmg/ddp003
- Leonie C. Jacobs, Andreas Wollstein, Oscar Lao, Albert Hofman, Caroline C. Klaver, Andre G. Uitterlinden, Tamar Nijsten, Manfred Kayser, Fan Liu (2012): Comprehensive candidate gene study highlights UGT1A and BNC2 as new genes determining continuous skin color variation in Europeans. Human Genetics Volume 132, Issue 2: 147-158. doi:10.1007/s00439-012-1232-9
- Pardis C. Sabeti, Patrick Varilly, Ben Fry, Jason Lohmueller, Elizabeth Hostetter, Chris Cotsapas, Xiaohui Xie, Elizabeth H. Byrne, Steven A. McCarroll, Rachelle Gaudet, Stephen F. Schaffner, Eric S. Lander & The International HapMap Consortium (2007): Genome-wide detection and characterization of positive selection in human populations. Nature Volume 449: 913-919 doi:10.1038/nature06250
- Ze’ev Hochberg & Alan R Templeton (2010): Evolutionary perspective in skin color, vitamin D and its receptor. Hormones 9(4): 307-311.
- Boyd & Silk, S. 419–420.