Bizalom intervallum. Mi ez és hogyan lehet használni?

képződés

Biztossági intervallum érkezett hozzánk a régióbólstatisztika. Ez egy bizonyos tartomány, amely egy ismeretlen paraméter nagyfokú megbízhatóságának értékelésére szolgál. A legegyszerűbb módja annak, hogy megmagyarázzam ezt a példát.

Tegyük fel, hogy meg kell vizsgálnunk néhányatVéletlenszerű érték, például a kiszolgáló válaszideje az ügyfél kérésére. Minden alkalommal, amikor a felhasználó beír egy adott címre, a szerver válaszol rá különböző sebességgel. Így a vizsgált válaszidő véletlenszerű. Tehát, a megbízhatósági intervallum határozza meg a határokat ezt a paramétert, és akkor lehet érvelni, hogy egy 95% -os valószínűséggel a reakció sebessége a kiszolgáló lesz a tartományban általunk számított.

Vagy tudnia kell, hány emberismert a cég márkanevéről. A konfidencia intervallum kiszámításakor például azt lehet mondani, hogy a valószínűség arányának 95% -ával a fogyasztók aránya, akik ismerik ezt a márkát, 27-34% között mozog.

Ez a kifejezés szorosan kapcsolódik egy ilyen értékhezbizalmi valószínűség. Az a valószínűség, hogy a kívánt paraméter belép a konfidenciaintervallumba. Ebből az érték attól függ, milyen nagy lesz a kívánt tartomány. Minél nagyobb jelentőséggel bír, annál keskenyebb a konfidencia intervallum, és fordítva. Általában 90%, 95% vagy 99% -ban van beállítva. A 95% -os érték a legnépszerűbb.

Ezt a mutatót is befolyásoljaa megfigyelések szórása és a minta mérete. Meghatározása azon a feltevésen alapul, hogy a vizsgált jellemző megfelel a normál forgalmazási törvénynek. Ezt a kijelentést Gauss törvénynek is nevezik. Elmondása szerint a folyamatos véletlen változó minden valószínűségének eloszlását normálisnak nevezik, amit a valószínűségi sűrűség ír le. Ha a normál eloszlás feltételezése hibásnak bizonyult, a becslés helytelen lehet.

Először is kitaláljuk, hogyan kell számolnimegbízhatósági intervallum a matematikai elvárásokhoz. Két lehetséges eset van. A variancia (egy random változó terjedési foka) ismeretes vagy sem. Ha ismert, akkor a megbízhatósági intervallumunkat a következő képlet segítségével számítjuk ki:

xsr - t * σ / (sqrt (n)) <= α <= xcp + t * σ / (sqrt (n)), ahol

α jel,

t egy paraméter a Laplace elosztási táblázatból,

sqrt (n) a teljes mintaméret négyzetgyöke,

σ a variancia négyzetgyöke.

Ha a variancia ismeretlen, akkor kiszámítható, ha ismerjük a kívánt jellemző összes értékét. A következő képletet használjuk erre:

σ2 = x2cp - (xcp) 2, ahol

Az x2cp a tesztelem négyzetének átlagos értéke,

(xcp) 2 a jellemző középértékének négyzete.

A konfidenciaintervallum kiszámítására szolgáló képlet ebben az esetben kis mértékben változik:

xsp-t * s / (sqrt (n)) <= α <= xcp + t * s / (sqrt (n)), ahol

xsr a minta átlaga,

α jel,

t egy olyan paraméter, amelyet a Student t = t (ɣ; n-1) eloszlási táblázata alapján találunk meg,

sqrt (n) a teljes mintaméret négyzetgyöke,

s a variancia négyzetgyöke.

Tekintsük ezt a példát. Tegyük fel, hogy az eredmények a 7 mérések határoztuk átlagos értéke a vizsgált jellemző, ami megegyezik a 30 és minta eltérés egyenlő 36. Meg kell találtuk valószínűséggel 99% -os megbízhatósági intervallum, amely a valódi értéke a mért paraméter.

Először meghatároztuk, hogy mi egyenlő t: t = t (0,99; 7-1) = 3,71. A fenti képletet használjuk:

xsr - t * s / (sqrt (n)) <= α <= xcp + t * s / (sqrt (n))

30 - 3,71 * 36 / (sqrt (7)) <= α <= 30 + 3,71 * 36 / (sqrt (7))

21,587 <= a <= 38,413

Bizalmi intervallum a variancia számáramind az ismert átlag esetén, mind pedig akkor, amikor nincs adat a matematikai várakozásról, és csak a pontatlan félelem nélküli diszperziós becslés értéke ismert. Nem adunk itt képleteket a számításhoz, mivel meglehetősen összetettek, és ha kívánják, mindig megtalálhatók a neten.

Csak azt vesszük észre, hogy kényelmes a megbízhatósági intervallum Excel-programmal vagy hálózati szolgáltatással történő meghatározása, amelyet úgy hívnak.