Bayesiaanse statistiek >
Het Bayesiaans informatiecriterium (BIC) is een index die in de Bayesiaanse statistiek wordt gebruikt om een keuze te maken tussen twee of meer alternatieve modellen.
De BIC is ook bekend als het Schwarz-informatiecriterium (abrv. SIC) of het Schwarz-Bayesiaanse informatiecriterium. Het is gepubliceerd in een paper van Gideon E. Schwarz uit 1978, en is nauw verwant aan het Akaike-informatiecriterium (AIC) dat formeel in 1974 werd gepubliceerd.
Definitie van het Bayesiaanse informatiecriterium / Schwarz-criterium
Het Bayesiaanse informatiecriterium (BIC) is gedefinieerd als
k log(n)- 2log(L(θ̂)).
Hierbij is n de steekproefgrootte; het aantal waarnemingen of het aantal datapunten waarmee je werkt. k is het aantal parameters dat in je model wordt geschat, en θ is de verzameling van alle parameters.
L(θ̂) staat voor de waarschijnlijkheid van het geteste model, gegeven je gegevens, wanneer geëvalueerd bij maximale waarschijnlijkheidswaarden van θ. Je zou dit de waarschijnlijkheid van het model kunnen noemen, gegeven dat alles op zijn gunstigst is afgesteld.
Een andere manier om L(θ̂) te begrijpen is dat het de waarschijnlijkheid is dat je de gegevens krijgt die je hebt, in de veronderstelling dat het geteste model een gegeven was.
Vergelijking van modellen
Vergelijking van modellen met het Bayesiaanse informatiecriterium houdt eenvoudigweg in dat voor elk model de BIC wordt berekend. Het model met de laagste BIC wordt als het beste beschouwd, en kan worden geschreven als BIC* (of SIC* als u die naam en afkorting gebruikt).
We kunnen ook de Δ BIC berekenen; het verschil tussen een bepaald model en het ‘beste’ model met de laagste BIC, en dat als argument tegen het andere model gebruiken. Δ BIC is gewoon BICmodel – BIC*, waarbij BIC* het beste model is.
Als Δ BIC minder dan 2 is, wordt het beschouwd als “nauwelijks het vermelden waard” als een argument voor de beste theorie of tegen de alternatieve theorie. Het voordeel dat dit oplevert voor ons beste model is te klein om significant te zijn. Maar als Δ BIC tussen 2 en 6 ligt, kan men zeggen dat het bewijs tegen het andere model positief is; d.w.z. dat we een goed argument hebben ten voordele van ons “beste model”. Als hij tussen 6 en 10 ligt, is het bewijs voor het beste model en tegen het zwakkere model sterk. Een Δ BIC van meer dan tien betekent dat het bewijs ten gunste van ons beste model tegenover het alternatieve model inderdaad zeer sterk is.
Voorbeeld
Stel dat u een gegevensreeks hebt met 50 waarnemingspunten, en dat model 1 3 parameters schat. Model 2 schat 4 parameters. Laten we zeggen dat de log van uw maximale waarschijnlijkheid voor model 1 a is, en voor model 2 2a. Met behulp van de formule k log(n)- 2log(L(θ)):
Berekening van SIC op deze gegevens geeft ons:
- Model 1: 3log(50) – 2a = 5.1 – 2a
- Model 2: 4log(50) – 4a = 6.8 – 4a
Dus ΔBIC is 1.7 – 2a.
Omdat het bewijs dat het Bayesiaanse Informatiecriterium ons voor model 1 geeft, alleen ‘vermeldenswaardig’ is als 1,7 – 2a > 2 is, kunnen we alleen overtuigende resultaten claimen als -2a > 0,3 is; dat wil zeggen, a < -0,15.
Claeskins, G. & Hkort, N. (2008). Model Selection and Model Averaging (Cambridge Series in Statistical and Probabilistic Mathematics) 1st Edition. Cambridge University Press.
Fabozzi, Focardi, Rachev & Arshanapalli. De grondbeginselen van financiële econometrie: Tools, Concepts, and Asset Management Applications. Bijlage E: Model Selectie Criterium: AIC en BIC. Op 1 maart 2018 ontleend aan http://onlinelibrary.wiley.com/store/10.1002/9781118856406.app5/asset/app5.pdf;jsessionid=A6726BA5AE1AD2A5AF007FFF78528249.f03t01?v=1&t=je8jr983&s=09eca6efc0573a238457d475d3ac909ec816a699
Wasserman, Larry. STAT 705 Collegenota’s: Model Selection
Opgehaald van http://www.stat.cmu.edu/~larry/=stat705/Lecture16.pdf op 1 maart 2018
Stephanie Glen. “Bayesian Information Criterion (BIC) / Schwarz Criterion” Van StatisticsHowTo.com: Elementaire Statistiek voor de rest van ons! https://www.statisticshowto.com/bayesian-information-criterion/
——————————————————————————
Heb je hulp nodig bij een huiswerk- of toetsvraag? Met Chegg Study kunt u stap-voor-stap oplossingen voor uw vragen krijgen van een expert op dit gebied. Uw eerste 30 minuten met een Chegg-leraar zijn gratis!