cc_bySchmid, KarlChang, Che-Wei2025-10-172025-10-172025https://hohpublica.uni-hohenheim.de/handle/123456789/1807410.60848/13005Understanding genetic variation underlying local adaptation is essential for improving crop resilience to address challenges posed by climate change. Barley (Hordeum vulgare L. ssp. vulgare), one of the most important crops, is suitable for studying local adaptation due to its remarkable adaptability. This PhD dissertation investigated adaptive genetic variation in exotic barley germplasm, including wild barley (Hordeum vulgare ssp. spontaneum) and barley landraces, from diverse environments and explored strategies to improve the use of genebank accessions for harnessing valuable genetic variants. In the first study, local adaptation in wild barley populations from the Southern Lev- ant was explored using landscape genomics approaches, combining genomic data with the climatic and soil properties of geographical origins. Through redundancy analysis (RDA), we found spatial autocorrelation explained 45% of genomic variation, and environmental factors accounted for 15%. Adaptive signatures were identified in the pericentromeric regions by the population-genetics-based scans and genome- environment association (GEA) scans, but they mostly disappeared when the population structure was considered. Our findings overall highlighted the role of nonselective forces in shaping the genetic variation of wild barley even in divergent environments. The second study addressed challenges in passport data quality control for large- scale samples, such as germplasm collections in genebanks. The R package GGoutlieR was developed in this work to tackle the shortcomings of traditional manual data cleaning. It efficiently detects and visualizes samples with unusual geo-genetic patterns by characterizing geography-genotype associations with distance-based statis- tics via K-nearest neighbors and calculating empirical p-values accordingly. By stream- lining data cleaning and quality control, GGoutlieR supports more reliable landscape genomics studies, which is crucial for studying loci involved in local adaptation. The third study explored the use of neural networks to predict geographical origins for genebank accessions lacking passport data, enabling their integration into genome- environment association (GEA) analyses. Neural network models demonstrated high prediction accuracy in cross-validation. Incorporating imputed environmental data (N = 11,032) into GEA, using barley flowering time genes as benchmarks, revealed complementary detection of genomic regions near flowering time genes compared to regular GEA (N = 1,626). Furthermore, simulations of polygenic local adaptation in selfing species showed that GEA power is insensitive to large sample sizes. These findings suggest that GEA with imputed environmental data can be a complementary approach for uncovering novel adaptive loci that might remain undetected in conventional GEA, rather than improving the statistical power of GEA. Overall, this dissertation contributes to understanding the adaptive genetic variation in barley and expanding methodologies in landscape genomics, providing a direction for the future development of GEA approaches to better support allele mining for prebreeding to enhance crop resilience.Ein besseres Verständnis der genetischen Variation, die der lokalen Anpassung zugrunde liegt, ist von entscheidender Bedeutung für die Verbesserung der Widerstandsfähigkeit von Kulturpflanzen, um den Herausforderungen des Klimawandels zu begegnen. Gerste (Hordeum vulgare L. ssp. vulgare), eine der wichtigsten Nutzpflanzen, eignet sich aufgrund ihrer bemerkenswerten Anpassungsfähigkeit für die Untersuchung der lokalen Anpassung. Diese Dissertation untersuchte die adaptive genetische Variation in exotischem Gerstenkeimplasma, einschließlich Wildgerste (Hordeum vulgare ssp. spontaneum) und Gerstenlandrassen, aus verschiedenen natürlichen Lebensräumen und erforschte Strategien zur Verbesserung der Nutzung von Genbankkeimplasma zur Nutzbarmachung wertvoller genetischer Varianten. In der ersten Studie wurde die lokale Anpassung von Wildgerstenpopulationen aus der südlichen Levante mit Hilfe von landschaftsgenomischen Ansätzen untersucht, wobei genomische Daten mit den Klima- und Bodeneigenschaften des geografischen Herkunftsgebietes kombiniert wurden. Mit Hilfe einer Redundanzanalyse (RDA) konnten wir feststellen, dass die räumliche Autokorrelation 45 % der genomischen Variation erklärte, während Umweltfaktoren für 15 % verantwortlich waren. Adaptive Signaturen wurden in den perizentromerischen Regionen durch populationsgenetische Scans und Genom-Umwelt-Assoziations-Scans (GEA) identifiziert; diese verschwanden aber größtenteils, wenn die Populationsstruktur mitberücksichtigt wurde. Unsere Ergebnisse unterstrichen insgesamt die Rolle nicht-selektiver Kräfte bei der Gestaltung der genetischen Variation von Wildgerste selbst in sehr unterschiedlichen natürlichen Lebensräumen. Die zweite Studie befasste sich mit den Herausforderungen im Umgang mit der Genauigkeit von Passdaten bei Proben von großem Umfang, wie z. B. Keimplasmasammlungen in Genbanken. Das R-Paket GGoutlieR wurde in der vorliegenden Arbeit entwickelt, um die Schwächen der traditionellen manuellen Datenbereinigung zu beheben. Es erkennt und visualisiert effizient Proben mit ungewöhnlichen geo- genetischen Mustern, indem es geografisch-genotypische Assoziationen mit distanzbasierten Statistiken über K-nearest neighbors charakterisiert und entsprechend empirische p- Werte berechnet. Durch die Vereinfachung der Datenbereinigung und Qualitätskontrolle unterstützt GGoutlieR zuverlässigere landschaftsgenomische Studien, was für die Untersuchung von Loci, die an der lokalen Anpassung beteiligt sind, von entscheidender Bedeutung ist. Die dritte Studie untersuchte die Verwendung neuronaler Netze zur Vorhersage der geografischen Herkunft von Genbank-Zugängen, für die keine Passdaten vorliegen, und ermöglichte so deren Integration in Genom-Umwelt-Assoziationsanalysen (GEA). Neuronale Netzwerkmodelle zeigten bei der Kreuzvalidierung eine hohe Vorhersagegenauigkeit. Die Einbeziehung von imputierten Umweltdaten (N = 11,032) in die GEA unter Verwendung von Gerstenblütezeitgenen als Benchmarks ergab eine ergänzende Erkennung von genomischen Regionen in der Nähe von Blütezeitgenen im Vergleich zur regulären GEA (N = 1,626). Darüber hinaus zeigten Simulationen der polygenen lokalen Anpassung bei sich selbst vermehrenden Arten, dass die GEA-Leistung unempfindlich gegenüber großen Stichproben ist. Diese Ergebnisse deuten darauf hin, dass GEA mit imputierten Umweltdaten ein ergänzender Ansatz zur Aufdeckung neuartiger adaptiver Loci sein kann, die bei herkömmlicher GEA unentdeckt bleiben könnten, und weniger dazu dient, die statistische Leistung von GEA zu verbessern. Insgesamt trägt diese Dissertation zum Verständnis der adaptiven genetischen Variation in Gerste sowie zur Erweiterung der Methoden der Landschaftsgenomik bei. Sie gibt eine Richtung für die künftige Entwicklung von GEA-Ansätzen vor, um das Allel-Mining vor der Züchtung besser zu unterstützen, mit dem Ziel, die Widerstandsfähigkeit von Pflanzen zu verbessern.eng630Exploring adaptive genetic variation in exotic barley germplasm with landscape genomicsDoctoralThesis1938671163