Estimation i Stokastiske Modeller for Populationsgenetik

Specialeforsvar ved Mads Súndby Palle

Titel: Estimation i Stokastiske Modeller for Populationsgenetik

Abstract: Maksimum likelihood estimation for populationsgenetisk data er kompliseret selv for relativt små datasæt. I specialet introduceres en MCMC-algoritme med et syntetisk likelihood-skridt som i Simon Woods artikel til at estimere mutationsrate og fejlrater i genetisk data. Først introduceres populations-genetiske modeller og modellerne relateres til data fra et brystkræft- og DNA-sekventeringsstudie udført af Wang et al. Den primære populations-genetiske model i specialet er "infinite sites"-modellen. Dernæst undersøges hvordan den syntetiske likelihood kan bruges til drage inferens i populations-genetiske modeller. Herefter implementeres en Metropolis-Hastings MCMC-algoritme med et syntetisk likelihood skridt for at estimere mutationsrate, "false discovery"-rate og "allelic drop-out"-rate. Algoritmen testes i et simulation-studie og på genetisk brystkræft data. Algoritmen med den syntetiske likelihoodmetode er tung at køre, men metoden giver mulighed for en intuitiv brug af velkendte og etablerede populationsgenetiske resultater

 

 Vejleder:  Carsten Wiuf
Censor:     Asger Hobolth, Aarhus Universitet