Locityper: Das verborgene Erbgut entschlüsseln

Ein Großteil dessen, was jeden Menschen genetisch einzigartig macht, liegt nicht in einzelnen DNA-„Buchstaben“, sondern in großen, komplexen Unterschieden in unseren Genen – den sogenannten strukturellen Varianten. Diese Unterschiede – etwa wiederholte, fehlende oder umgeordnete DNA-Abschnitte – sind entscheidend, um zu verstehen, wie Gene Krankheiten beeinflussen.

Doch herkömmliche DNA-Analyseverfahren, die überwiegend auf kurzen Sequenzabschnitten basieren, können diese komplexen Regionen oft nicht korrekt interpretieren. Dadurch bleiben Hunderte medizinisch relevanter Gene „im Dunkeln“ – außerhalb der Reichweite derzeitiger genetischer Testverfahren.

Das Forschungsteam um Tim Prodanov und Tobias Marschall (Center for Digital Medicine, Heinrich-Heine-Universität Düsseldorf) gemeinsam mit Elizabeth Plender und Evan Eichler (Department of Genome Sciences, University of Washington), Guiscard Seebohm (Institut für Genetik von Herzerkrankungen) und mir, Sven Meuth(Klinik für Neurologie, Universitätsklinikum Düsseldorf), hat L̲o̲c̲i̲t̲y̲p̲e̲r̲ entwickelt – eine neue computergestützte Methode, die genetische Variationen in schwer analysierbaren Genregionen präzise identifiziert, indem sie sowohl Kurz- als auch Langzeit-DNA-Sequenzierungen nutzt.

Anstatt nach einzelnen Varianten zu suchen, vergleicht Locityper die DNA-Sequenzen einer Person direkt mit einer Bibliothek bekannter vollständiger Genversionen – sogenannter Haplotypen – aus dem menschlichen Pangenom. Anschließend wird statistisch bestimmt, welche zwei Haplotypen die Daten der Person am besten erklären – im Prinzip also der genetische „Fingerabdruck“ für jedes komplexe Gen gefunden.

Über Hunderte schwieriger Gene hinweg konnte Locityper bis zu 95 % der Gen-Sequenzen korrekt rekonstruieren, die in herkömmlichen Analysepipelines übersehen wurden – eine nahezu neunfache Verbesserung. Dabei arbeitet das Verfahren sowohl mit Illumina-Kurzreads als auch mit neuen Langread-Technologien gleich zuverlässig und ist mit einer Laufzeit von etwa einer Stunde pro Genom schnell genug, um in groß angelegten Biobank-Projekten mit Tausenden Genomen eingesetzt zu werden.

L̲o̲c̲i̲t̲y̲p̲e̲r̲ ermöglicht die präzise Genotypisierung wichtiger immunrelevanter Gene wie HLA und KIR sowie weiterer komplexer Genfamilien (z. B. Muzin- und Fc-Rezeptor-Gene), die bei Infektionen, Autoimmunerkrankungen und Krebs eine Rolle spielen.

Da Locityper effizient mit Standard-Sequenzierungsdaten arbeitet, eröffnet es den Zugang zu bislang unzugänglichen Bereichen des Genoms in großen Bevölkerungsstudien wie der UK Biobank oder All-of-Us – und hilft, neue Zusammenhänge zwischen Genen und Krankheiten zu entdecken, die bisher verborgen geblieben sind.

Locityper: Unlocking the Hidden Parts of Our Genome
Most of what makes each person genetically unique lies not just in single DNA “letters” but in large, complex differences in our genes called structural variants. These differences – such as repeated, missing, or rearranged pieces of DNA – are crucial for understanding how genes influence disease. However, standard DNA analysis tools, which rely mostly on short snippets of genetic data, often fail to interpret these complicated regions correctly. As a result, hundreds of medically important genes remain “in the dark,” beyond the reach of current genetic testing.
The research team around Tim Prodanov and Tobias Marschall (Center for Digital Medicine, Heinrich Heine University) together with Elizabeth Plender and Evan Eichler (Department of Genome sciences, University of Washington), Guiscard Seebohm (Institute for Genetics of Heart Diseases) and myself, Sven Meuth (Department of Neurology, University of Düsseldorf) has developed L̲o̲c̲i̲t̲y̲p̲e̲r̲, a new computational method that accurately identifies genetic variation in these hard-to-analyze regions using both short- and long-read DNA sequencing. Instead of looking for individual variants, Locityper compares a person’s DNA reads directly to a library of known full-length gene versions, called haplotypes, assembled from the human pangenome. It then statistically determines which two haplotypes best explain the person’s data – essentially finding the genetic “fingerprint” for each challenging gene.
Across hundreds of difficult genes, Locityper correctly reconstructed up to 95% of gene sequences that conventional pipelines missed – an almost 9-fold improvement. It performs equally well with Illumina short reads and newer long-read technologies, while running fast enough (≈1 hour per genome) to be applied to biobank-scale projects involving thousands of genomes.

L̲o̲c̲i̲t̲y̲p̲e̲r̲ enables accurate genotyping of key immune-related genes like HLA and KIR, as well as other complex families (e.g., mucin and Fc receptor genes) implicated in infection, autoimmunity, and cancer. Because it works efficiently with standard sequencing data, Locityper opens the door to exploring previously inaccessible parts of the genome in population studies such as the UK Biobank or All-of-Us, helping uncover new links between genes and disease that have so far remained invisible.

L̲o̲c̲i̲t̲y̲p̲e̲r̲ enables accurate genotyping of key immune-related genes like HLA and KIR, as well as other complex families (e.g., mucin and Fc receptor genes) implicated in infection, autoimmunity, and cancer. Because it works efficiently with standard sequencing data, Locityper opens the door to exploring previously inaccessible parts of the genome in population studies such as the UK Biobank or All-of-Us, helping uncover new links between genes and disease that have so far remained invisible.
In short: Locityper shines a light on the “dark genome,” turning once-intractable regions into valuable data for medical genetics and personalized medicine.

Reference: Prodanov T, Plender EG, Seebohm G, Meuth SG, Eichler EE, Marschall T. Locityper enables targeted genotyping of complex polymorphic genes. Nat Genet. Published online October 17, 2025. doi:10.1038/s41588-025-02362-4