Statistică bayesiană >
Criteriul informațional bayesian (BIC) este un indice utilizat în statistica bayesiană pentru a alege între două sau mai multe modele alternative.
BIC este cunoscut și sub numele de criteriul informațional Schwarz (abrv. SIC) sau criteriul informațional Schwarz-Bayesian. A fost publicat într-o lucrare din 1978 de Gideon E. Schwarz și este strâns legat de criteriul informațional Akaike (AIC), care a fost publicat oficial în 1974.
Definiția criteriului informațional bayesian / criteriul Schwarz
Criteriul informațional bayesian (BIC) se definește ca
k log(n)- 2log(L(θ̂)).
Aici n este dimensiunea eșantionului; numărul de observații sau numărul de puncte de date cu care lucrați. k este numărul de parametri pe care modelul dumneavoastră îi estimează, iar θ este setul tuturor parametrilor.
L(θ̂) reprezintă verosimilitatea modelului testat, date fiind datele dumneavoastră, atunci când este evaluat la valorile de maximă verosimilitate ale lui θ. Ați putea numi acest lucru probabilitatea modelului având în vedere că totul este aliniat la cele mai favorabile valori ale lor.
O altă modalitate de a înțelege L(θ̂) este că reprezintă probabilitatea de a obține datele pe care le aveți, presupunând că modelul testat este un dat.
Compararea modelelor
Compararea modelelor cu ajutorul criteriului informațional bayesian implică pur și simplu calcularea BIC pentru fiecare model. Modelul cu cel mai mic BIC este considerat cel mai bun și poate fi scris BIC* (sau SIC*, dacă folosiți această denumire și abrevierea).
De asemenea, putem calcula Δ BIC; diferența dintre un anumit model și „cel mai bun” model cu cel mai mic BIC, și să o folosim ca argument împotriva celuilalt model. Δ BIC este doar BICmodel – BIC*, unde BIC* este cel mai bun model.
Dacă Δ BIC este mai mic de 2, se consideră că „abia merită să fie menționat” ca argument fie pentru cea mai bună teorie, fie împotriva celei alternative. Avantajul pe care îl oferă celui mai bun model al nostru este prea mic pentru a fi semnificativ. Dar dacă Δ BIC este între 2 și 6, se poate spune că dovezile împotriva celuilalt model sunt pozitive; adică avem un argument bun în favoarea „celui mai bun model” al nostru. Dacă este între 6 și 10, dovezile în favoarea celui mai bun model și împotriva modelului mai slab sunt puternice. Un Δ BIC mai mare de zece înseamnă că dovezile în favoarea celui mai bun model al nostru față de cel alternativ sunt într-adevăr foarte puternice.
Exemplu
Să presupunem că aveți un set de date cu 50 de puncte de observație, iar modelul 1 estimează 3 parametri. Modelul 2 estimează 4 parametri. Să presupunem că logaritmul verosimilității maxime pentru modelul 1 este a; iar pentru modelul 2 este 2a. Folosind formula k log(n)- 2log(L(θ)):
Calcularea SIC pe aceste date ne dă:
- Modelul 1: 3log(50) – 2a = 5,1 – 2a
- Modelul 2: 4log(50) – 4a = 6,8 – 4a
Deci ΔBIC este 1,7 – 2a.
Din moment ce dovezile pe care ni le oferă criteriul informațional bayesian pentru modelul 1 vor fi „demne de menționat” doar dacă 1,7 – 2a > 2, putem pretinde rezultate concludente doar dacă -2a > 0,3; adică, a < -0,15.
Claeskins, G. & Hkort, N. (2008). Model Selection and Model Averaging (Cambridge Series in Statistical and Probabilistic Mathematics) 1st Edition. Cambridge University Press.
Fabozzi, Focardi, Rachev & Arshanapalli. Bazele econometriei financiare (The Basics of Financial Econometrics): Tools, Concepts, and Asset Management Applications. Anexa E: Criteriul de selecție a modelelor: AIC și BIC. Retrieved from http://onlinelibrary.wiley.com/store/10.1002/9781118856406.app5/asset/app5.pdf;jsessionid=A6726BA5AE1AD2A5AF007FFF78528249.f03t01?v=1&t=je8jr983&s=09eca6efc0573a238457d475d3ac909ec816a699 on March 1, 2018
Wasserman, Larry. STAT 705 Note de curs: Model Selection
Recuperit de la http://www.stat.cmu.edu/~larry/=stat705/Lecture16.pdf la 1 martie 2018
Stephanie Glen. „Bayesian Information Criterion (BIC) / Schwarz Criterion” From StatisticsHowTo.com: Statistică elementară pentru noi toți ceilalți! https://www.statisticshowto.com/bayesian-information-criterion/
——————————————————————————
Nevoie de ajutor cu o temă pentru acasă sau o întrebare de test? Cu Chegg Study, puteți obține soluții pas cu pas la întrebările dvs. de la un expert în domeniu. Primele 30 de minute cu un tutore Chegg sunt gratuite!