Prosjekt-/diplom-/master-oppgaver tilbudt av Jarle Tufto

I'm currently on sabbatical leave (autumn of 2018 and spring 2019) but will be available to supervise project and masterstudents in the autumn of 2019 and spring 2020.

In general, if any of the projects below interests you, you should contact me, either via email (jarle.tufto) or via Skype and we will discuss further details.

Template model builder

Template model builder (TMB) is a R-package for fitting complex non-linear latent variable models (for example state-space and mixed models) by either maximising the Laplace approximation of the marginal likelihood (the probability of the observed data with latent random effects integrated out) or by using this approximation of the likelihood in further MCMC based methods (as in R-package tmbstan). Template model builder computes the Laplace approximation very efficiently using automatic differentiation and automatic sparsity detection based on a C++ template function computing the joint likelihood of the data and random effects provided by the user. For many models the Laplace approximation work wells, even for non-Guassian likelihoods since most likelihoods become approximately Gaussian unless the sample size is small. A possible project would be to use TMB to fit some form of latent variable model and then study how well the Laplace approximation works. One way to to this would be to compare posterior distribution computed via tmbstan with random effects integrated out with and without the Laplace approximation.

Approximate Bayesian Computation

In various applied settings, the mechanism generating the data is well understood but leads to to a likelihood which cannot easily be computed. MCMC may also be too slow. Simulating data from the model may be easy however. For an example, see this paper. One way to do inference in such cases is to use ABC. In its simplest form, this involves simulating samples from the prior distribution of the parameters, simulating data given these parameter values and accepting those samples for which certain carefully chosen summary statistics are within sufficiently small tolarance limits of the the values computed for the observed data. This can be shown to produce samples from the posterior distribution of the parameters, not given all the data, but given the summary statistics. While this typically leads to loss of some of the information in the data, this avoid the need to compute the exact likelihood. Improvements of the algorithm such as ABC-MCMC leads to more efficient sampling from the posterior.

Evolutionary responses to fluctuating selection

Different species may respond to environmental change through genetic evolution as envisioned by Darwin, plasticity, diversifying bet-hedging, as well as more recently, phenotypic evolution through epigenetic or maternal effects (see e.g. Tufto 2015 and Chevin et. al. 2015 and referenes therein). Understanding what conditions favour these adaptations is important in terms of predicting how biological populations will respond to ongoing anthopogenic global warming. Possible projects could be either theoretical stocastic modelling of the evolutionary responses arising for specific patterns of temporal and possibly spatial environmental variation, or could involve doing statistical inference of the parameters of such models, for example, using state space modelling. You should have some interest in theoretical evolutionary biology or you liked the course in time series modelling.

Romlig eksplisitte fangst-gjenfangstmodeller

Tradisjonelle metoder for estimering av populasjonsstetthet i biologi baserer seg p? at en visst antall n men en ukjent andel p individ i en populasjon merkes. Andelen merkede individ i et gjenfangst-sample kan s? brukes til ? estimere andelen p og hele populasjonsst?rrelsen N. Ved gjentatte gjenfangstsample kan ogs? overlevelsesparameter estimeres. Slike metoder bygger p? antakelsen om at alle individ blander seg fullstendig med hverandre innenfor et ofte vilk?rlig definert studieomr?de.

Uavhengig av dette har fangst-gjenfangstdata v?rt brukt for ? estimere hvor mye individ forflytter seg fra en generasjon til neste (en viktig parameter i forskjellige teoretiske romlige evolusjon?re og ?kologiske modeller).

Ved ? modellere bevegelsene til ulike individ i et sample eksplisitt kan en ved hjelp av MCMC-metoder simultant estimere levetids- og spredningsparametere, populasjonstetthet, samt parametere som karakteriserer attraksjonsegenskapene til hver felle. Et mulig prosjekt vil v?re ? videreutvikle slike estimeringsmetoder.

Estimering av transitive og intransitive dominanshierarkier

Bradley Terry-modellen kan brukes for ? modellere preferanse i valg mellom to alternativer, dominanshierarkier i biologi, eller sannsynlighet for seier eller tap i spill med to deltakere av gangen. Det er ?nskelig ? modellere styrkeparametere til ulike individ/spillere som forklart av egenskaper ved disse individene (kovariater). Dette kan f?re til hierarkier som er intransitive (se her for eksempler). Samtidig er det naturlig ? tenke seg at styrkeparametere til ulike individ/spillere eller residual variasjon som ikke er forklart av kovariater kommer fra en felles fordeling. Dette vil skape avhengighet i dataene. En mulig prosjektoppgave kan v?re ? estimere parametere i en slik hierarkiske modell ved hjelp av Gibbs-sampling e.l.

Probabilistiske flervalgspr?ver

Flervalgspr?ver hvor deltaker krysser av ett av et gitt antall alternativ p? hvert sp?rsm?l gir lite presis informasjon om kunnskapsniv?et til deltaker, spesielt dersom deltaker har lite kunnskap i emnet pr?ven dreier seg om. En alternativ pr?veform vil v?re ? la deltaker oppgi sin grad av tro p? ulike svaralternativer (subjektive sannsynligheter). La sannsynlighetene deltaker oppgir p? de korrekte svaralternativene p? sp?rsm?l 1,2,...,n v?re . Det kan da vises at det er optimalt for deltaker ? oppgi sine subjektive sannsynligheter hvis det i poengsum gis (se f.eks., Bernardo, 1997)

Et mulig prosjekt kan v?re ? gjennomf?re en slik probabilistisk flervalgspr?ve (f.eks. blant medstudenter og ansatte) og unders?ke hvor godt et slikt poengsystem fungerer i forhold til tradisjonelle flervalgspr?ver (b?de i teori og praksis). Siden hver deltaker selv kan beregne sin (subjektivt) forventede poengsum f?r en ved denne pr?veformen ogs? informasjon om hvorvidt hver deltaker har for liten eller for stor tro p? egne evner.

Opprettholdelse av kvantitativ genetisk variasjon gjennom mutasjon-seleksjons balanse

Mange egenskaper kan respondere til kunstig seleksjon hundretalls generasjoner uten at genetisk variasjon (en forutsetning for fortsatt respons) ser ut til ? reduseres nevneverdig. Se f.eks. Barton & Keightley 2002. Ulike modeller har v?rt foresl?tt for ? forklare dette.

Den s?kalte infinitesimal modellen introdusert av R.A. Fisher antar at karakteren vi studerer er p?virket av (uendelig mange) loci og at genvarianter p? hvert loci har sm? (infitesimale) effekter. Da vil endringene i genfrekvenser som f?lge av seleksjon ogs? bli infinitesimale og vedvarende respons blir mulig.

Man antar at genetisk variasjon i s?kalt kvantitative egenskaper opprettholdes gjennom en balanse mellom stabiliserende naturlig seleksjon, mutasjon og genetisk drift (se f.eks. B?rger og Lande, 1994). Hvorvidt dette medf?rer en gentisk arkitektur som kan approksimeres av den infinitesimale modellen er fortsatt et ?pent sp?rsm?l. Bl.a. forutsetter den infinitesimal modellen sm? genetiske effekter og ingen kobling. QTL-studier har vist at gener med relativt store effekter ofte er involvert. Videre, om vi har sterk kobling (kort avstand) mellom enkeltloci vil negativ assosiasjon mellom gener (s?kalt linkage disequilibrium) generert av stabiliserende seleksjon brytes langsomt ned. Hvis slik kobling er viktig vil disse negative kovariansene gj?re at den totale variansen i karakteren som kommer til utrykk potensiellt blir mye mindre enn summen av variansbidragene fra hvert loci, m.a.o. vil mye genetisk variasjon bli "gjemt". Dette vil potensielt kunne forklare vedvarende respons til kunstig seleksjon.

Et prosjekt innenfor dette omr?de kan best? i ? simulere en modell for stabiliserende seleksjon og mutasjon modellert som en "infinite allele" Poisson punktprosess langs kromosomet. En m?lsetning vil da v?re ? studere hva slags genetisk arkitektur som oppst?r, og hva slags respons til kunstig seleksjon en slik genetisk arkitektur gir.

Prosjektet forutsetter gode ferdigheter i programmering i R og C samt interesse for evolusjonbiologi.