Interval de încredere

În statistică, un interval de încredere este o formă specială de estimare a unui anumit parametru. Prin această metodă, în locul unei singure valori, se oferă un întreg interval de valori acceptabile pentru parametru, împreună cu probabilitatea ca valoarea reală (necunoscută) a parametrului să se afle în interval. Intervalul de încredere se bazează pe observațiile dintr-un eșantion și, prin urmare, diferă de la un eșantion la altul. Probabilitatea ca parametrul să se afle în interval se numește nivel de încredere. Foarte adesea, acesta este dat sub formă de procent. Intervalul de încredere este întotdeauna indicat împreună cu nivelul de încredere. Oamenii pot vorbi despre "intervalul de încredere de 95%". Punctele finale ale intervalului de încredere sunt denumite limite de încredere. Pentru o anumită procedură de estimare într-o anumită situație, cu cât nivelul de încredere este mai ridicat, cu atât intervalul de încredere va fi mai larg.

Calcularea unui interval de încredere necesită, în general, ipoteze privind natura procesului de estimare - este în primul rând o metodă parametrică. O ipoteză obișnuită este aceea că distribuția populației din care provine eșantionul este normală. Ca atare, intervalele de încredere, așa cum sunt discutate mai jos, nu sunt statistici robuste, deși se pot face modificări pentru a adăuga robustețe.

Semnificația termenului "încredere"

Termenul de încredere are un înțeles similar în statistică, ca și în uzul comun. În uzul comun, o afirmație de încredere de 95% în ceva este considerată în mod normal ca indicând o certitudine virtuală. În statistică, o afirmație de încredere de 95% înseamnă pur și simplu că cercetătorul a văzut un interval posibil dintr-un număr mare de intervale posibile, din care nouăsprezece din douăzeci de intervale conțin adevărata valoare a parametrului.

Exemplu practic

A factory assembly line fills margarine cups to a desired 250g +/- 5g

O mașină umple pahare cu margarină. Pentru acest exemplu, mașina este reglată astfel încât conținutul paharelor să fie de 250 g de margarină. Deoarece mașina nu poate umple fiecare pahar cu exact 250 g, conținutul adăugat în pahare individuale prezintă o anumită variație și este considerat o variabilă aleatoare X. Se presupune că această variație este distribuită normal în jurul mediei dorite de 250 g, cu o abatere standard de 2,5 g. Pentru a determina dacă mașina este calibrată în mod corespunzător, se alege la întâmplare un eșantion de n = 25 de cești de margarină și se cântăresc ceștile. Greutățile de margarină sunt X1, ..., X25, un eșantion aleatoriu din X.

Pentru a ne face o idee despre speranța μ, este suficient să facem o estimare. Estimatorul adecvat este media eșantionului:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. } {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

Eșantionul prezintă greutățile reale x1, ...,x25, cu media:

x ¯ = 1 25 ∑ i = 1 25 x i = 250,2 grame . {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grame}}. } {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

Dacă luăm un alt eșantion de 25 de cești, ne-am putea aștepta cu ușurință să găsim valori de 250,4 sau 251,1 grame. Cu toate acestea, o valoare medie a eșantionului de 280 de grame ar fi extrem de rară dacă conținutul mediu al ceștilor este de fapt apropiat de 250 de grame. Există un întreg interval în jurul valorii observate de 250,2 a mediei eșantionului, în interiorul căruia, dacă media întregii populații ia de fapt o valoare în acest interval, datele observate nu ar fi considerate deosebit de neobișnuite. Un astfel de interval se numește interval de încredere pentru parametrul μ. Cum se calculează un astfel de interval? Punctele finale ale intervalului trebuie să fie calculate din eșantion, deci sunt statistici, funcții ale eșantionului X1, ..., X25 și, prin urmare, variabile aleatoare în sine.

În cazul nostru, putem determina punctele finale considerând că media eșantionului X dintr-un eșantion distribuit normal este, de asemenea, distribuită normal, cu aceeași așteptare μ, dar cu eroarea standard σ/√n = 0,5 (grame). Prin standardizare obținem o variabilă aleatoare

Z = X = ¯ ¯ - μ σ / n = X ¯ - μ 0.5 {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}}} {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

dependentă de parametrul μ care trebuie estimat, dar cu o distribuție normală standard independentă de parametrul μ. Prin urmare, este posibil să se găsească numere -z și z, independente de μ, unde Z se află între ele cu probabilitatea 1 - α, o măsură a gradului de încredere pe care dorim să o avem. Luăm 1 - α = 0,95. Așadar, avem:

P ( - z ≤ Z ≤ Z ≤ z ) = 1 - α = 0,95. {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,} {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

Numărul z rezultă din funcția de distribuție cumulativă:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0,975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0,975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}}. {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

și obținem:

0.95 = 1 - α = P ( - z ≤ Z ≤ Z ≤ z ) = P ( - 1.96 ≤ X ¯ - μ σ / n ≤ 1.96 ) = P ( X ¯ - 1.96 σ n ≤ μ ≤ ≤ X ¯ + 1.96 σ n ) = P ( X ¯ - 1.96 × 0.5 ≤ μ ≤ X ¯ + 1.96 × 0.5 ) = P ( X ¯ - 0.98 ≤ μ ≤ ≤ X ¯ + 0.98 ) . {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\ dreapta)\[6pt]&=P\left({\bar {X}}-1.96\ ori 0.5\leq \mu \leq {\bar {X}}+1.96\ ori 0.5\right)\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}} {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}

Acest lucru poate fi interpretat astfel: cu probabilitatea 0,95 vom găsi un interval de încredere în care vom întâlni parametrul μ între punctele finale stocastice

X ¯ - 0 . 98 {\displaystyle {\bar {X}}-0{.}98\,} {\displaystyle {\bar {X}}-0{.}98\,}

și

X ¯ + 0.98. {\displaystyle {\bar {X}}+0.98.\,} {\displaystyle {\bar {X}}+0.98.\,}

Acest lucru nu înseamnă că există o probabilitate de 0,95 de a întâlni parametrul μ în intervalul calculat. De fiecare dată când măsurătorile sunt repetate, va exista o altă valoare pentru media X a eșantionului. În 95 % din cazuri, μ se va afla între punctele finale calculate pornind de la această medie, dar în 5 % din cazuri nu se va afla. Intervalul de încredere real se calculează prin introducerea ponderilor măsurate în formulă. Intervalul nostru de încredere de 0,95 devine:

( x ¯ - 0.98 ; x ¯ + 0.98 ) = ( 250.2 - 0.98 ; 250.2 + 0.98 ) = ( 249.22 ; 251.18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

Deoarece valoarea dorită 250 a lui μ se încadrează în intervalul de încredere rezultat, nu există niciun motiv pentru a crede că mașina este calibrată greșit.

Intervalul calculat are puncte finale fixe, unde μ poate fi între ele (sau nu). Astfel, acest eveniment are probabilitatea 0 sau 1. Nu putem spune: "cu probabilitatea (1 - α), parametrul μ se află în intervalul de încredere." Știm doar că, prin repetiție, în 100(1 - α) % din cazuri μ se va afla în intervalul calculat. În 100α % din cazuri însă nu se află. Și, din păcate, nu știm în care dintre cazuri se întâmplă acest lucru. De aceea spunem: "cu un nivel de încredere de 100(1 - α) %, μ se află în intervalul de încredere". "

Figura din dreapta prezintă 50 de realizări ale unui interval de încredere pentru o anumită medie a populației μ. Dacă alegem la întâmplare o realizare, probabilitatea este de 95 % să alegem un interval care să conțină parametrul; cu toate acestea, este posibil să avem ghinion și să o fi ales pe cea greșită. Nu vom ști niciodată; suntem blocați cu intervalul nostru.

Segmentele de linie verticală reprezintă 50 de realizări ale unui interval de încredere pentru μ.Zoom
Segmentele de linie verticală reprezintă 50 de realizări ale unui interval de încredere pentru μ.

Întrebări și răspunsuri

Î: Ce este un interval de încredere în statistică?


R: Un interval de încredere este un interval special utilizat pentru a estima un parametru, cum ar fi media populației, oferind un interval de valori acceptabile pentru parametru în loc de o singură valoare.

Î: De ce se utilizează un interval de încredere în loc de o singură valoare?


R: Un interval de încredere este utilizat în locul unei singure valori pentru a ține cont de incertitudinea estimării unui parametru pe baza unui eșantion și pentru a oferi o probabilitate ca valoarea reală a parametrului să se încadreze în interval.

Î: Ce este un nivel de încredere?


R: Un nivel de încredere reprezintă probabilitatea ca parametrul estimat să se încadreze în intervalul de încredere și este adesea exprimat sub formă de procentaj (de exemplu, interval de încredere de 95%).

Î: Ce sunt limitele de încredere?


R: Limitele de încredere sunt punctele finale ale unui interval de încredere, care definesc intervalul de valori acceptabile pentru parametrul care este estimat.

Î: Cum afectează nivelul de încredere intervalul de încredere?


R: Într-o anumită procedură de estimare, cu cât nivelul de încredere este mai ridicat, cu atât intervalul de încredere va fi mai larg.

Î: Ce ipoteze sunt necesare pentru a calcula un interval de încredere?


R: Calcularea unui interval de încredere necesită, în general, ipoteze privind natura procesului de estimare, cum ar fi ipoteza că distribuția populației din care provine eșantionul este normală.

Î: Sunt intervalele de încredere statistici robuste?


R: Intervalele de încredere, așa cum se discută mai jos, nu sunt statistici robuste, deși se pot face ajustări pentru a adăuga robustețe.

AlegsaOnline.com - 2020 / 2023 - License CC3