Bayesiansk statistik >
Det bayesianske informationskriterium (BIC) er et indeks, der anvendes i bayesiansk statistik til at vælge mellem to eller flere alternative modeller.
BIC er også kendt som Schwarz-informationskriteriet (abrv. SIC) eller Schwarz-Bayesian-informationskriteriet. Det blev offentliggjort i en artikel fra 1978 af Gideon E. Schwarz og er nært beslægtet med Akaike-informationskriteriet (AIC), som formelt blev offentliggjort i 1974.
Definition af det bayesianske informationskriterium / Schwarz-kriteriet
Det bayesianske informationskriterium (BIC) er defineret som
k log(n)- 2log(L(θ̂))).
Her er n stikprøvestørrelsen; antallet af observationer eller antallet af datapunkter, som du arbejder med. k er antallet af parametre, som din model estimerer, og θ er sættet af alle parametre.
L(θ̂) repræsenterer sandsynligheden for den testede model, givet dine data, når den evalueres ved maksimale sandsynlighedsværdier for θ. Du kan kalde dette sandsynligheden for modellen, givet alt justeret til deres mest gunstige.
En anden måde at forstå L(θ̂) på er, at det er sandsynligheden for at opnå de data, som du har, hvis man antager, at den model, der testes, var en given ting.
Sammenligning af modeller
Sammenligning af modeller med det bayesianske informationskriterium indebærer simpelthen, at man beregner BIC for hver model. Modellen med den laveste BIC anses for at være den bedste, og kan skrives BIC* (eller SIC*, hvis man bruger det navn og den forkortelse).
Vi kan også beregne Δ BIC; forskellen mellem en bestemt model og den “bedste” model med den laveste BIC, og bruge den som et argument mod den anden model. Δ BIC er blot BICmodel – BIC*, hvor BIC* er den bedste model.
Hvis Δ BIC er mindre end 2, betragtes det som ‘knap nok værd at nævne’ som et argument enten for den bedste teori eller mod den alternative teori. Den fordel, den giver vores bedste model, er for lille til at være signifikant. Men hvis Δ BIC er mellem 2 og 6, kan man sige, at beviserne mod den anden model er positive; dvs. vi har et godt argument til fordel for vores “bedste model”. Hvis den er mellem 6 og 10, er beviserne for den bedste model og imod den svagere model stærke. En Δ BIC på over ti betyder, at beviserne til fordel for vores bedste model mod den alternative model er meget stærke.
Eksempel
Sæt, du har et datasæt med 50 observationspunkter, og model 1 estimerer 3 parametre. Model 2 estimerer 4 parametre. Lad os sige, at logaritmen af din maksimale sandsynlighed for model 1 er a; og for model 2 er den 2a. Ved hjælp af formlen k log(n)- 2log(L(θ)):
Beregning af SIC på disse data giver os:
- Model 1: 3log(50) – 2a = 5,1 – 2a
- Model 2: 4log(50) – 4a = 6,8 – 4a
Så ΔBIC er 1,7 – 2a.
Da det bevis, som det bayesianske informationskriterium giver os for model 1, kun vil være “værd at nævne”, hvis 1,7 – 2a > 2, kan vi kun hævde afgørende resultater, hvis -2a > 0,3; det vil sige a < -0,15.
Claeskins, G. & Hkort, N. (2008). Model Selection and Model Averaging (Cambridge Series in Statistical and Probabilistic Mathematics) 1. udgave. Cambridge University Press.
Fabozzi, Focardi, Rachev & Arshanapalli. Det grundlæggende i finansiel økonometri: Værktøjer, koncepter og applikationer inden for kapitalforvaltning. Tillæg E: Kriterium for modelvalg: AIC og BIC. Hentet fra http://onlinelibrary.wiley.com/store/10.1002/9781118856406.app5/asset/app5.pdf;jsessionid=A6726BA5AE1AD2A5AF007FFF78528249.f03t01?v=1&t=je8jr983&s=09eca6efc0573a238457d475d3ac909ec816a699 den 1. marts 2018
Wasserman, Larry. STAT 705 Forelæsningsnoter: Model Selection
Hentet fra http://www.stat.cmu.edu/~larry/=stat705/Lecture16.pdf den 1. marts 2018
Stephanie Glen. “Bayesian Information Criterion (BIC) / Schwarz Criterion” Fra StatisticsHowTo.com: Elementær statistik for resten af os! https://www.statisticshowto.com/bayesian-information-criterion/
——————————————————————————
Har du brug for hjælp til en lektielæsning eller et spørgsmål til en prøve? Med Chegg Study kan du få trin-for-trin-løsninger på dine spørgsmål fra en ekspert på området. Dine første 30 minutter med en Chegg-underviser er gratis!