Ekspansja ta pozostawiła czytelny ślad w naszym DNA. Aby określić stopień pokrewieństwa między grupami, genetycy wykorzystują drobne różnice w budowie DNA, zwane polimorfizmami (dotyczą one szczególnie sekwencji par zasad, czyli podstawowych cegiełek, z których składa się DNA). Większość takich polimorfizmów występuje poza genami, czyli odcinkami kodującymi informacje niezbędne do syntezy białek (cząsteczek stanowiących dużą część naszego ciała, odpowiedzialnych za reakcje chemiczne podtrzymujące życie). W związku z tym zróżnicowanie ma charakter neutralny, czyli nie wpływa bezpośrednio na poszczególne cechy. Pewne polimorfizmy występują jednak także w genach i mogą powodować indywidualne zróżnicowanie określonych cech oraz choroby genetyczne. Sekwencjonując ludzki genom (poznając pełny skład jądrowego DNA), naukowcy wykryli miliony polimorfizmów. Ich rozkład w poszczególnych populacjach odzwierciedla historię tychże populacji i wpływ doboru naturalnego
Idealny do rozróżniania grup byłby taki polimorfizm, który występuje u wszystkich członków danej grupy, a we wszystkich innych jest nieobecny. Ale podstawowe grupy ludzkie oddzieliły się od siebie stosunkowo niedawno i zanadto między sobą mieszały, by mogły istnieć tego rodzaju różnice. Polimorfizmy występujące na całym świecie z określoną częstością można jednak wykorzystać do przybliżonego podziału ludzi na grupy. Użyteczna klasa polimorfizmów związana jest z sekwencjami Alu krótkimi odcinkami DNA o zbliżonej budowie. Alu od czasu do czasu ulega replikacji, a powstające w ten sposób kopie zajmują losowo nowe miejsce w pierwotnym lub innym chromosomie, nie wpływając jednak zazwyczaj na funkcjonowanie pobliskich genów. Każde takie włączenie sekwencji Alu do genomu jest niepowtarzalne. Kiedy dodatkowy jej egzemplarz zostanie wbudowany w genom, może pozostać w tym samym miejscu setki lub tysiące lat, przenoszony na potomstwo. Tak więc jeśli u dwóch osób sekwencja Alu występuje dokładnie w tym samym miejscu w genomie, musiały one mieć wspólnego przodka, po którym odziedziczyły ten konkretny odcinek DNA.
Zespól, do którego należał jeden z nas (Bamshad) oraz naukowcy z University of Utah: Lynn B. Jorde, Stephen Wooding i W. Scott Watkins, a także Mark A. Batzer z Louisiana State University, przebadał 100 różnych polimorfizmów Alu u 565 osób urodzonych w subsaharyjskiej Afryce, Azji i Europie. Najpierw określiliśmy, które ze 100 odcinków Alu występują u poszczególnych osób. Następnie usunęliśmy z danych wszelkie informacje o tożsamości (takie jak pochodzenie i przynależność etniczna) i podzieliliśmy uczestników, posiłkując się wyłącznie informacją genetyczną. WYNIKIEM ANALIZY było wyróżnienie czterech grup. Kiedy sięgnęliśmy do danych o tożsamości, by się przekonać, czy przypisanie do danej grupy koreluje z potocznymi określeniami rasy lub przynależności etnicznej, odkryliśmy, że w dwóch grupach znaleźli się wyłącznie przedstawiciele subsaharyjskiej Afryki, przy czym jedna z nich składa się niemal bez wyjątku z Pigmejów Mbuti. W skład pozostałych dwóch grup weszli odpowiednio badani z Europy i Azji Wschodniej.
Odkryliśmy, że 60 polimorfizmów Alu wystarcza do określenia kontynentu, z którego pochodzi dana osoba, z dokładnością 90%. Aby uzyskać dokładność bliską 100%, należało użyć około 100 Alu. Inne badania dały podobne wyniki. Noah A. Rosenberg i Jonathan K. Pritchard, genetycy pracujący dawniej w laboratorium Marcusa W. Feldmana ze Stanford University, zbadali występowanie około 375 polimorfizmów będących tandemowo powtórzonymi sekwencjami DNA u ponad 1000 osób z 52 grup etnicznych w Afryce, Azji, Europie i obu Amerykach. Porównując częstość występowania tych polimorfizmów, podzielili uczestników badania na pięć grup osób, których przodkowie pochodzili zwykle z obszarów rozdzielonych przez oceany, pustynie lub łańcuchy górskie. Byli to odpowiednio mieszkańcy subsaharyjskiej Afryki, Europy i Azji na zachód od Himalajów, Azji Wschodniej, Nowej Gwinei i Melanezji oraz amerykańscy Indianie. W obrębie każdego z tych regionów dało się zdefiniować podgrupy odpowiadające zwykle tożsamości etnicznej podawanej przez samych uczestników.