Diverse oplysninger:
Projektoplæg: Jeres vejledere er professor Rasmus
W. Petersen og lektor
Jakob G. Rasmussen, som fortæller om datasættet, der skal analyseres,
ved lejlighed.
1) Mandag 5. september 12:30-16:15 i G5-110
Forelæsning: Hurtig gennemgang af Kap. 1 - det meste er kendt fra Mat. 2, men netop derfor kunne det være en god ide at læse Kap. 1 forinden. Grundigere gennemgang af Afsnit 2.1 og 2.2 i en anden rækkefølge end i lærebogen: 31-32_9 (læses som "side 31 til side 32, linie 9 fra neden") og 34_12-36^7 (læses som "side 36, linie 7 fra oven").
Opgaver: 6 og 18 i Kap. 1. Hvis der er tid tilovers regner vi
lidt flere opgaver (fx 13 i Kap. 1).
2) Tirsdag 6. september 12:30-16:15 i G5-112
Forelæsning: Repetition. Så meget vi når af følgende: eksemplet side 36-37 og et tilhørende R-program, 33_7-34_13, 37_11-38^12, 32_8-33_8, Afsnit 2.3 og et R-program for eksemplet side 39-40.
Opgaver: 13 og evt. 7 i Kap. 1; 1 i Kap. 2. Der er extra god
tid til opgaver, idet det oprindeligt var afsat 1 time til
projektoplæg denne dag, så evt. resterende opgaver fra sidst kan
også løses.
3) Mandag 19. september 12:30-16:15
Forelæsning: Repetition. Dernæst 41^15-46_18 fraregnet 42^18-43_15.
Bemærkninger:
Opgaver: 16, 12, 9 og 7 i Kap. 1 (hvis I når så meget).
4) Tirsdag 20. september 12:30-16:15
Forelæsning: Repetition. Dernæst 46_19-49_8 og Appendix A.2, A.4 og A.5 (gennemgået i en anden rækkefølge, hvor vi starter med gamma-fordelingen og definerer de andre fordelinger ud fra gamma-fordelingen). Endelig 49_8-51^8.
Bemærkninger:
Opgaver: Først 2, 3 og 5 i Kap. 2, så evt. manglende opgaver fra Kap. 1.
5) Mandag 26. september 12:30-16:15
Forelæsning: Repetition af a) HDR og CPR, b) en normalfordelt stikprøve med ukendt varians og kendt middelværdi. Så gennemgang af diverse steder i Afsnit 2.9: 52^4-53^16, 54^9-54^14, 54_7-55^6 og 55^15-55^22. Dernæst Afsnit 2.10-2.11, der handler om konjugerede priors og exponentiele familier, hvor vi dog springer "Mixtures of conjugate densities" (side 58-59) over: det anbefales som spændende selvstændig læsning (bl.a. omtales Persi Diaconis; han, der i dag er en førende sandsynlighedsteoretiker, var inden da en anerkendt tryllekunstner).
Bemærkninger:
Opgaver: Kap. 2: 14 (Cauchy fordelingen defineres i
Appendix A.21; antag, at vinklen er uniformt
fordelt på intervallet fra -\pi/2 til \pi/2), 11 og 12.
6) Tirsdag 27. september 12:30-16:15
Forelæsning: Repetition. Så et simpelt eksempel (faktisk en opgave fra et PhD-ingeniørkursus) på simulationsbaseret bayesiansk inferens og løsningen herpå. Dernæst Afsnit 2.12 (normalfordelt stikpøve, hvor både middelværdi og varians er ukendte) og Appendix A.8. Derefter Afsnit 3.1 pånær følgende i Afnsit 3.1: "Odds and log-odds" (p.76); "Highest density regions" (p.76-77); sidste halvdel af "Example" (p.78) vedrørende HDR (vi foretrækker jo i stedet for HDR at benytte centrale posterior intervaller/områder). Afsnit 3.2 springer vi over - selvom nogle trykfejl i dette afsnit er medtaget nedenfor.
Bemærkninger:
Opgaver: Kap. 2: 8 (hvor I gerne må antage, at dimensionen
af \psi(\theta) er e´n samt at \psi(\theta)>0), 13, 15.
7) Mandag 3. oktober 12:30-16:15
Forelæsning: Repetition. Afsnit 3.3-3.4 og Appendix A.13. Dog venter vi til næste gang med prediktion i forbindelse med en Poisson fordelt stikprøve.
Bemærkninger:
Opgaver: Kap. 3: 2 (I får her brug for R for at kunne beregne fraktiler i beta-fordelingen: Start R op, se hvordan I finder "a HTML browser interface to help", find så "An Introduction to R", klik på "Probability distributions", og læs lidt om det; dernæst brug hjælpekommandoen ? i R til at indhente information om beta-fordelingen, dvs skriv "?dbeta" (uden ""; hvorfor dbeta og ikke blot beta?) - i det hele taget prøv nu at bruge R - ved brug af jeres sunde fornuft skulle det ikke være så svært!). Kap. 2: 17 (afsæt god tid til denne opgave, der er den sværeste - I kan igen få brug for R - og se IKKE på Peter Lees løsning, da den er forkert!).
8) Tirsdag 4. oktober 12:30-16:15
Forelæsning: Repetition samt prediktion i forbindelse med en Poisson fordelt stikprøve. Afsnit 3.10 og Appendix A.23-A.24. I Afsnit 3.10 springer vi "Normal variance" (p.105-106) over. Endelig opsummer vi, hvordan priorfordelinger specificeres (se "Læsning på divanen" nedenfor).
Bemærkninger:
Opgaver: To opgaver vedr. den flerdimensionale normalfordeling.
Læsning på divanen: I opfordres til at læse
Afsnit 3.6 i Young & Smith (2005) (se boglisten starten af denne hjemmeside), der består dels af en kort gennemgang af den (historiske) disput mellem klassisk og bayesiansk statistik samt vores dage mere pragmatiske synspunkt, og dels en fornuftig opsummering og diskussion af
priorfordelinger.
9) Mandag 10. oktober 12:30-16:15
Forelæsning: Først øvelser (i grupperummene), hvor I fortsætter med opgaverne fra sidst vedr. den flerdimensionale normalfordeling. Dernæst repetition og gennemgang af opgaverne fra sidst. Så p. 117-118_12, dvs ganske lidt fra lærebogen, hvor de matematiske overvejelser er enkle, men begreberne er mere vanskelige. Jeg vil fortælle ganske mere end der står i bogen, herunder om likelihood ratio testet (der slet ikke er omtalt i bogen). Se også disse noter. Endelig opgaverne angivet nedenfor.
Opgaver: Kap. 3: 7, 9, 18.
10) Tirsdag 11. oktober 12:30-16:15
Forelæsning: Repetition af første halvdel af Afsnit 4.1 samt likelihood ratio testet, dernæst resten af Afsnit 4.1 samt Afsnit 4.2.
Bemærkninger:
Opgaver: Manglende opgaver fra sidst samt især $t$-test for en normalfordelt stikprøve, hvor formålet med denne opgave er dels at fortælle om et vigtigt test og dels at diskutere forskelle og ligheder i klassisk og bayesiansk statistik. Det vil nok være en god ide at starte med denne opgave, da den er vigtig og temmelig lang.
11) Tirsdag 25. oktober 12:30-16:15
Forelæsning: Kort repetition: Bayesiansk "testning" af hypoteser. Dernæst Afsnit 5.1 fraregnet p.140_{14}-142^7; Afsnit 5.2 fraregnet p.144; Afsnit 5.3, hvor I kan springe det om "Patil's approximation" over, og endvidere (kort om) siderne 308-309 samt 329-333; Afsnit 5.4, hvor "The controversy" sikkert er lidt svært at forstå, så bare ta' lidt let på det; og endelig Afsnit 5.5, hvor "Example" p.151 overlades til jer selv at læse, og hvor I kan springe p.151_{1-9} over.
Bemærkninger:
Opgaver: 1) Opgaven om $t$-testet fra sidst og andre manglende opgaver fra tidligere.
12) Mandag 31. oktober 12:30-16:15
Forelæsning: Repetition vedrørende to normalfordelte stikprøver. Dernæst p.160-161_{12} og p.162^{11} (mens det resterende stof p.161-164 overlades til selvstændig læsning for dem, der har lyst) samt endnu engang A.23. Jeg vil desuden fortælle en del mere om den to-dimensionale normalfordeling, som der ikke står noget om i lærebogen.
Bemærkninger:
Opgaver: 1) Lad situationen være som i "Example" p.146 i
Lees bog. Simuler et passende antal iid realisationer fra den
pågældende Behres-Fisher-fordeling og betragt et histogram for
\delta baseret på disse realisationer samt angiv et (approximativt)
90% HDR/centralt posterior interval samt middelværdi og median for
\delta. Sammenlign resultaterne med dem i Lees bog. 2) Kap. 5: 1,
5(b), 12 og evt. 6 (svær men god). 3) Evt. resterende opgaver fra tidligere.
13) Tirsdag 1. november 12:30-16:15
Forelæsning: Repetition samt Afsnit 6.3 fraregnet "Case of known variance" (p.169).
Bemærkninger:
Opgaver: 1) Beskriv niveaukurverne for en todimensional normalfordelingstæthed, når varianserne er lig 5 og korrelationskoefficienten er 0 henholdsvis 1/5 (vink i det sidste tilfælde: benyt spektralsætningen for kovariansmatricen eller præcisionsmatricen, der jo begge er symmetriske positiv definite 2x2 matricer; indse, at en niveaukurve er en ellipse, og angiv centrum, akser og halvakser for denne). Argumenter (mere eller mindre løst) for, at generalt er niveaukurverne ellipser (vink: benyt igen spektralsætningen). Se også
følgende plot baseret på følgende R-kode.
2) Resterende opgaver fra tidligere.
14) Mandag 7. november 12:30-16:15 i A5-006
Forelæsning: Hierakiske modeller (p.221-222^5) suppleret med lidt om ombyttelighed ("exchangeability", se p.234) og især et eksempel på en hierakisk model (Afsnit 5.1 og 5.3 i Gelman et al., se "Diverse oplysninger" ovenfor). Afsnit 1 og 2.1 i "A short diversion into the theory of Markov chains, with a view to Markov chain Monte Carlo methods".
Bemærkninger til Gelman et al.:
Opgaver: Kap. 6: 2, 10. Resterende opgaver fra tidligere.
15) Tirsdag 8. november 12:30-16:15
Forelæsning og opgaver: Repetition: hierakiske modeller samt starten af MCMC-noterne, hvor vi undervejs
løser Exercise 1. Fortsætter med Afsnit 2.2 og videre frem i
MCMC-noterne til og med Exercise 2. Til sidst: evt. resterende opgaver fra sidst.
16) Mandag 14. november 12:30-16:15
Forelæsning og opgaver: Repetition af Afsnit 1-3 samt gennemgang af
Exercise 2 i MCMC-noterne. Dernæst forelæsning
kombineret med opgaver i Afsnit 4 i MCMC-noterne (vi springer Afsnit
5 over). Vedr. opgaverne: Hvis I ikke fik lavet
Metropolis.random.walk i sin tid, så kan den
hentes her.
Trykfejl: I Exercise 5 spørgsmål 2c skal "(approximately)
N(0,1)-distributed" erstattes med "(approximately) normally
distributed with zero mean".
17) Tirsdag 15. november 12:30-16:15
Forelæsning og opgaver: Repetition samt evt. resterende opgaver fra Afsnit 4 i MCMC-noterne, så forelæsning kombineret med opgaver fra Afsnit 6-8 i MCMC-noterne. Vedr. opgaverne: Klik her, hvor I kan læse lidt mere om Monte Carlo metoder og evt. importance sampling (importance sampling omtales i Afsnit 5, som vi springer over).
Bemærkning til Exercise 8:
I forbindelse med Exercise 8 henvises til en Exercise 5 i "Basic methods...": dette er det samme som I downloadede 6. kursusgang. Desuden henvises til "A brief introduction to (simulation based) Bayesian inference" som I bedes hente her og læse selv.
18) Mandag 21. november 12:30-16:15
Forelæsning og opgaver: Repetition, så forelæsning over Afsnit 9. I fællesskab gennemgås starten af Exercise 9, som I så efterfølgende diskuterer og løser i jeres grupperum.
Trykfejl i MCMC-noterne side 21, linie 10 fra neden: I
tælleren skal q_i(y_i|(x_1,...,x_{i-1},x_i,x_{i+1},...,x_k))
erstattes med q_i(x_i|(x_1,...,x_{i-1},y_i,x_{i+1},...,x_k)), og i
nævneren skal q_i(y_i|(x_1,...,x_{i-1},y_i,x_{i+1},...,x_k))
erstattes med q_i(y_i|(x_1,...,x_{i-1},x_i,x_{i+1},...,x_k)).
19) Tirsdag 22. november 12:30-16:15
Forelæsning: Afsnit 10 i MCMC-noterne.
Opgaver: Exercise 10. Det er en længere opgave -
kode for Exercise 8 og Exercise 9 kan hentes
her.
20) Mandag 28. november 12:30-16:15
Forelæsning: Modelkontrol baseret på diverse sider i bogen af Gelman m.fl.
Andet: Hent følgende sider taget fra afsnit 7.2 i Jesper Møller & Rasmus Plenge Waagepetersen: Statistical Inference and Simulation for Spatial Point Processes. De giver en oversigt vedr. teoretiske resultater og begreber for Markov kæder, som er relevante for MCMC-algoritmer. Bl.a. står der noget nyttigt om en central grænseværdi sætning (desuden findes en trykfejlliste her). Måske kan I få glæde af dette ifm. jeres projekt. Overlades til jer som selvstændig (og sikkert lidt vanskelig) læsning. Bemærk venligst, at det er en fejl, at side 125 er kommet med.
Opgaver: Fortsæt med Exercise 10 og diskuter/foretag endvidere en modelkontrol baseret på den posterior prediktive fordeling.
Kode for Exercise 10 kan hentes
her.
Tak for denne gang, god fornøjelse med projektet, samt held og
lykke med jeres eksamen.
FØLGENDE TEKST OPDATERES SENERE