A new version of this entry is available:

Loading...
Thumbnail Image
Doctoral Thesis
2024

Detailed genomic analysis of correlation and causality between milk production and health traits in German Holstein cattle using high-dimensional genomic data and novel statistical methods

Abstract (English)

Adverse side effects of high milk production on animal health have been mentioned frequently. They are compromising animal welfare, the farmers` economy, and the ecological footprint as well as the social acceptance of milk production. Consequently, many countries started to include functional traits into their breeding goal a few decades ago. The intention is thereby to avoid putative undesirable side effects of high production and to improve the cows` health in the long term through genetic gain. Indeed, positive genetic trends for various functional and health traits have been described in the literature. At the same time, the genetic trend of milk production traits remained positive. In general, sustainable genetic gain requires an appropriate weight of the individual traits in the selection index and a comprehensive understanding of the traits` genetic architecture and their interrelationship. This can be facilitated by recent innovations that enable the widespread availability of whole genome sequence (WGS) data. WGS data contains genomic information about millions of SNPs, derived either from sequencing or from imputing lower density SNP chip data to sequence level. Using external information about these sequence variants in genomic analyses, e.g., concerning their function during transcription and translation, has been shown to reveal additional knowledge about biological and molecular mechanisms shaping complex traits. Hence, applying external information to estimate genetic correlations might help to dissect the traits` interrelationship in more detail. Additionally, going beyond global genetic correlations, this is, reflecting the shared genetic effect throughout the genome, to the local scale, this is, the genetic sharing in specific genomic regions, would be an alternative to provide novel knowledge about the extent and direction of the shared genetic effect and its localization in the genome. The expected information is desired to understand and to avoid potential detrimental effects of selection decisions on animal health. Moreover, moving away from correlation towards causation would enable to predict the impact of management decisions and external interventions. The aim of this thesis was to scrutinize the genetic connection between health and milk production traits in dairy cattle using a large sample of 34,497 German Holstein cows with pedigree, 50K SNP chip, and imputed WGS data consisting of ~17 million variants. To this end, standard quantitative genetic analyses were augmented by a set of novel approaches to detect genomic regions with a substantial genetic effect on several traits and to investigate causal associations. Chapter one applied the 50K chip data to estimate additive genetic and dominance variance components for the milk production and health traits. This was done since substantial nonadditive genetic effects for functional traits have been mentioned in the literature, whereas little is known about these effects for the health traits examined in this thesis. It was demonstrated that the contribution of the dominance variance to the phenotypic variance was rather small for all traits. However, regarding the health traits, the contribution of the dominance variance to the genetic variance was almost as high as, and sometimes even higher than the contribution of the additive genetic variance. In addition, significant inbreeding depression was found for the milk production traits. Chapter two consisted of three steps. First, pedigree-based heritabilities of and global genetic correlations between milk production and health traits were estimated. Most heritabilities of the health traits and their genetic correlations with the milk production traits were low, whereby the genetic correlations were in an unfavorable direction. Next, genome-wide association studies (GWAS) were performed for each trait utilizing the 50K chip data to generate summary statistics. The summary statistics are required as input data for the last step that applied a tool to detect shared genomic regions. Genomic regions simultaneously affecting milk production and health traits were identified for each trait combination, of which some also had a sign in the favorable direction. This chapter confirmed the advantage of scrutinizing global genetic correlations down to the local scale. Chapter three utilized the 50K chip as well as the imputed WGS data. The latter was thereby divided into 27 subsets depending on the variants` functional and evolutionary annotation, e.g., as gene expression quantitative trait loci or selection signature. Heritabilities of and genetic correlations between milk yield and several health traits were estimated for the 50K chip and each of the 27 subsets. The results indicate that the 50K chip appears to be sufficient to explain the genetic variance of the investigated traits, whereas it seems to underestimate their genetic covariance. Furthermore, the importance of alternative splicing for the (co-)variation of quantitative traits and the important role of the negative energy balance causing the unfavorable side effects of high production on animal health has been confirmed. Chapter four was a Mendelian randomization (MR) analysis. Here, the causal effect of milk yield on a set of health traits was examined using a method that is based on summary statistics. In this chapter, the summary statistics were generated using the imputed WGS data. Unfavorable causal effects of milk yield on most health traits were identified that were strongest for mastitis and digital phlegmon. This indicates potential detrimental consequences for these traits with increasing milk yields, owed to selection decisions or inappropriately chosen weights in the selection index. The general discussion is addressing the negative side effects of high production on animal health with special focus on the negative energy balance. Moreover, including feed efficiency and resilience indicator traits into the breeding goal is discussed with respect to the results reported in the previous chapters. Besides, additional information about the methodology of MR analyses and the results of a MR analysis investigating the causal effect of protein and fat yield on the health traits are presented and debated. The general discussion ends with practical implications of the results regarding hologenomic selection strategies and strategies including functional information in genomic prediction.

Abstract (German)

Nachteilige Effekte einer hohen Milchleistung auf die Tiergesundheit sind in der Literatur vielfach beschrieben. Diese negativen Effekte beeinträchtigen das Tierwohl, die wirtschaftliche Situation der Landwirte, den ökologischen Fußabdruck und zudem die gesellschaftliche Akzeptanz der Tierhaltung. Aus diesen Gründen haben viele Zuchtorganisationen vor einigen Dekaden begonnen, funktionale Merkmale in ihr Zuchtziel einzubauen. Möglichen negativen Auswirkungen eines hohen Leistungsniveaus soll hierdurch vorgebeugt und die Gesundheit der Kühe langfristig durch Zuchtfortschritt verbessert werden. Einige Studien haben positive genetische Trends für verschiedene funktionale Merkmale beschrieben, wobei auch der genetische Trend der Milchleistung nach wie vor positiv war. Grundsätzlich bedarf es für einen nachhaltigen Zuchtfortschritt vorrangig einer angemessenen Gewichtung der einzelnen Merkmale im Selektionsindex. Darüber hinaus ist ein umfassendes Verständnis der genetischen Architektur der einzelnen Merkmale und ihrer Beziehungen untereinander notwendig. Dies kann dadurch erleichtert werden, dass neuste technologische Fortschritte eine weite Verfügbarkeit von Genomsequenzdaten ermöglichen. Genomsequenzdaten beinhalten genomische Information über Millionen von SNPs, die entweder direkt sequenziert oder von weniger dichten Genotypisierungschips auf Sequenzdichte imputiert werden. Des Weiteren verschaffen genomische Analysen, die funktionelle Information über die Rolle dieser Sequenzvarianten während der Transkription und der Translation beinhalten, neue Einblicke in biologische und molekulare Merkmalsmechanismen. Eine Verwendung funktioneller Information bei der Analyse komplexer Merkmalszusammenhänge könnte dazu dienen, mehr über deren grundlegende Architektur in Erfahrung zu bringen. Eine Alternative hierzu wäre, globale genetische Korrelationen, die den gemeinsamen genetischen Effekt im gesamten Genom widerspiegeln, auf lokaler Ebene, also in spezifischen genomischen Regionen, zu untersuchen, um neues Wissen über das Ausmaß, die Richtung und die Lokalisation des gemeinsamen genetischen Effekts im Genom zu erfahren. Die hierbei erwarteten Informationen sind von Vorteil, um nachteilige Auswirkungen von Selektionsentscheidungen auf die Tiergesundheit zu verstehen und diesen vorzubeugen. Darüber hinaus könnte es helfen, die Auswirkungen von Managemententscheidungen und externen Maßnahmen besser abzuschätzen, wenn Kausalzusammenhänge anstelle von klassischen genetischen Korrelationen analysiert werden. Das Ziel dieser Arbeit war es, den genetischen Zusammenhang zwischen Gesundheits- und Milchleistungsmerkmalen mit Hilfe eines großen Datensatzes, bestehend aus 34.497 Deutschen Holstein Kühen mit Pedigree-, 50K SNP Chip- und imputierten Genomsequenzdaten, zu untersuchen. Hierzu wurden standardmäßige quantitativ-genetische Analysen durch neue Ansätze ergänzt, die darauf abzielen genomische Regionen mit einem erheblichen genetischen Effekt auf beide Merkmalskomplexe zu ermitteln und kausale Merkmalszusammenhänge zu untersuchen. In Kapitel eins wurde der 50K Chip Datensatz verwendet, um die additiv-genetische und die Dominanzvarianz der Milchleistungs- und der Gesundheitsmerkmale zu schätzen. Die Idee dahinter war, dass verschiedene Studien nennenswerte nicht-additive Geneffekte für funktionale Merkmale gefunden haben. Für die Gesundheitsmerkmale, mit denen sich diese Arbeit beschäftigt, ist hierfür jedoch wenig bekannt. Es konnte gezeigt werden, dass der Anteil der Dominanzvarianz an der phänotypischen Varianz sowohl für die Milchleistungs- als auch für die Gesundheitsmerkmale eher gering war. Für die Gesundheitsmerkmale lag der Anteil der Dominanzvarianz an der gesamtgenetischen Varianz jedoch in einem nennenswerten Bereich und war mindestens so groß wie der Anteil der additiv-genetischen Varianz. Darüber hinaus wurde eine signifikante Inzuchtdepression für die Milchleistungsmerkmale gefunden. In Kapitel zwei wurden zuerst pedigreebasierte Heritabilitäten und globale genetische Korrelationen zwischen den Milchleistungs- und Gesundheitsmerkmalen geschätzt. Ein Großteil der genetischen Korrelationen und der Heritabilitäten der Gesundheitsmerkmale war im niedrigen Bereich, wobei die genetischen Korrelationen in eine züchterisch unerwünschte Richtung gingen. Im Anschluss daran wurden, unter Verwendung des 50K Chips, genomweite Assoziationsstudien (GWAS) für jedes Merkmal durchgeführt. Die Ausgabedateien hiervon wurden für den nächsten Schritt benötigt, bei dem eine Methode zur Identifizierung genomischer Regionen mit einem signifikanten Effekt auf die Milchleistungs- und auf die Gesundheitsmerkmale angewandt wurde. Für jede Merkmalskombination konnte mindestens eine solche Region gefunden werden, wobei der Effekt für manche Merkmalskombinationen in eine züchterisch wünschenswerte Richtung ging. Dieses Kapitel konnte bestätigen, dass es von Vorteil ist, globale genetische Korrelationen auf die lokale Ebene herunterzubrechen, um einen differenzierteren Einblick in die jeweiligen Merkmalszusammenhänge zu erhalten. Kapitel drei verwendete sowohl den 50K Chip als auch den imputierten Sequenzdatensatz. Letzterer wurde abhängig von der funktionellen und evolutionären Annotation der Sequenzvarianten, bspw. als quantitativer Genort in der Genexpression oder als Selektionssignatur, in 27 kleinere Datensätze aufgeteilt. Heritabilitäten für und genetische Korrelationen zwischen der Milchmenge und den Gesundheitsmerkmalen wurden für den 50K Chip und jeden der 27 kleineren Datensätze geschätzt. Die Ergebnisse weisen darauf hin, dass der 50K Chip ausreicht, um die genetische Varianz der untersuchten Merkmale abzubilden, die genetische Kovarianz jedoch zu unterschätzen scheint. Darüber hinaus bestätigt dieses Kapitel die Bedeutung des alternativen Spleißens für die (Ko-)Varianz quantitativer Merkmale, sowie die der negativen Energiebilanz für die nachteiligen Auswirkungen einer hohen Milchleistung auf die Tiergesundheit. In Kapitel vier wurde eine Mendelsche Randomisierungsanalyse (MR-Analyse) durchgeführt, um die kausalen Zusammenhänge zwischen der Milchmenge und den Gesundheitsmerkmalen zu untersuchen. Die hierbei angewandte Methode beruht auf den Ausgabedateien von GWAS, die in diesem Kapitel unter Verwendung des imputierten Sequenzdatensatzes generiert wurden. Es wurde ein unerwünschter kausaler Effekt der Milchmenge auf nahezu alle Gesundheitsmerkmale gefunden, der für Mastitis und Panaritium am stärksten war. Insgesamt deutet dies auf mögliche nachteilige Konsequenzen einer steigenden Milchleistung für diese Merkmale aufgrund von Selektionsentscheidungen oder einer ungeeigneten Gewichtung der einzelnen Merkmale im Selektionsindex hin. Die generelle Diskussion beschäftigt sich zunächst mit den unerwünschten Auswirkungen einer hohen Milchleistung auf die Tiergesundheit, wobei ein spezieller Fokus auf der negativen Energiebilanz liegt. Darüber hinaus wird, unter Berücksichtigung der Ergebnisse der vorherigen Kapitel, die Aufnahme von Futtereffizienzmerkmalen und Resilienzindikatoren in das Zuchtziel diskutiert. Zusätzliche Informationen über die Methodik von MR-Analysen werden erörtert und die Ergebnisse einer MR-Analyse, die die kausalen Auswirkungen der Protein- und Fettmenge auf die Gesundheitsmerkmale untersucht hat, gezeigt und diskutiert. Die Diskussion endet mit potenziellen Anwendungsmöglichkeiten der Ergebnisse, bezogen auf hologenomische Selektionsstrategien und Ansätze, die funktionelle Information in die genomische Zuchtwertschätzung miteinbeziehen.

File is subject to an embargo until

This is a correction to:

A correction to this entry is available:

This is a new version of:

Notes

Publication license

Publication series

Published in

Faculty
Faculty of Agricultural Sciences
Institute
Institute of Animal Science

Examination date

2024-07-22

Edition / version

Citation

DOI

ISSN

ISBN

Language
English

Publisher

Publisher place

Classification (DDC)
630 Agriculture

Original object

Free keywords

Standardized keywords (GND)

BibTeX

@phdthesis{Schneider2024, url = {https://hohpublica.uni-hohenheim.de/handle/123456789/16060}, author = {Schneider, Helen Hiam}, title = {Detailed Genomic Analysis of Correlation and Causality between Milk Production and Health Traits in German Holstein Cattle using High-Dimensional Genomic Data and Novel Statistical Methods}, year = {2024}, }