Eroare standard

Eroarea standard este abaterea standard a distribuției de eșantionare a unei statistici. Termenul poate fi utilizat și pentru o estimare (o presupunere bună) a abaterii standard respective, luată dintr-un eșantion al întregului grup.

Media unei anumite părți a unui grup (numită eșantion) este modalitatea obișnuită de estimare a mediei pentru întregul grup. Adesea este prea greu sau costă prea mulți bani să se măsoare întregul grup. Dar dacă se măsoară un alt eșantion, acesta va avea o medie care este puțin diferită de primul eșantion. Eroarea standard a mediei este o modalitate de a ști cât de aproape este media eșantionului de media întregului grup. Este o modalitate de a ști cât de sigur puteți fi de media eșantionului.

În măsurătorile reale, valoarea reală a deviației standard a mediei pentru întregul grup nu este de obicei cunoscută. Prin urmare, termenul de eroare standard este adesea utilizat pentru a desemna o estimare apropiată de valoarea reală pentru întregul grup. Cu cât există mai multe măsurători într-un eșantion, cu atât mai aproape va fi estimarea de numărul real pentru întregul grup.

Pentru o valoare care este eșantionată cu o eroare distribuită normal și fără distorsiuni, tabelul de mai sus descrie proporția de eșantioane care se încadrează între 0, 1, 2 și 3 deviații standard deasupra și sub valoarea reală.Zoom
Pentru o valoare care este eșantionată cu o eroare distribuită normal și fără distorsiuni, tabelul de mai sus descrie proporția de eșantioane care se încadrează între 0, 1, 2 și 3 deviații standard deasupra și sub valoarea reală.

Cum se găsește eroarea standard a mediei

O modalitate de a afla eroarea standard a mediei este de a avea o mulțime de eșantioane. Mai întâi, se găsește media pentru fiecare eșantion. Apoi se calculează media și abaterea standard a mediilor acestor eșantioane. Abaterea standard pentru toate mediile eșantioanelor reprezintă eroarea standard a mediei. Acest lucru poate necesita multă muncă. Uneori este prea dificil sau costă prea mulți bani pentru a avea o mulțime de eșantioane.

Un alt mod de a afla eroarea standard a mediei este de a utiliza o ecuație care are nevoie de un singur eșantion. Eroarea standard a mediei se estimează de obicei prin abaterea standard pentru un eșantion din întregul grup (abaterea standard a eșantionului) împărțită la rădăcina pătrată a mărimii eșantionului.

S E x ¯ = s n {\displaystyle SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}} {\displaystyle SE_{\bar {x}}\ ={\frac {s}{\sqrt {n}}}}

unde

s este abaterea standard a eșantionului (adică estimarea bazată pe eșantion a abaterii standard a populației) și

n este numărul de măsurători din eșantion.

Cât de mare trebuie să fie eșantionul pentru ca estimarea erorii standard a mediei să fie apropiată de eroarea standard reală a mediei pentru întregul grup? Eșantionul trebuie să cuprindă cel puțin șase măsurători. În acest caz, eroarea standard a mediei pentru eșantion se va situa în limita a 5 % din eroarea standard a mediei în cazul în care întregul grup ar fi fost măsurat.

Corecții pentru unele cazuri

Există o altă ecuație care trebuie utilizată dacă numărul de măsurători este de 5% sau mai mult din întregul grup:

Există ecuații speciale care trebuie utilizate în cazul în care un eșantion are mai puțin de 20 de măsurători.

Uneori, un eșantion provine dintr-un singur loc, chiar dacă întregul grup poate fi dispersat. De asemenea, uneori, un eșantion poate fi realizat într-o perioadă scurtă de timp, în timp ce întregul grup acoperă o perioadă mai lungă. În acest caz, numerele din eșantion nu sunt independente. Atunci se folosesc ecuații speciale pentru a încerca să se corecteze acest lucru.

Utilitate

Un rezultat practic: Se poate deveni mai sigur de o valoare medie dacă se fac mai multe măsurători într-un eșantion. Atunci eroarea standard a mediei va fi mai mică, deoarece abaterea standard este împărțită la un număr mai mare. Cu toate acestea, pentru ca incertitudinea (eroarea standard a mediei) unei valori medii să fie de două ori mai mică, dimensiunea eșantionului (n) trebuie să fie de patru ori mai mare. Acest lucru se datorează faptului că abaterea standard este împărțită la rădăcina pătrată a mărimii eșantionului. Pentru ca incertitudinea să fie de o zecime la fel de mare, dimensiunea eșantionului (n) trebuie să fie de o sută de ori mai mare!

Erorile standard sunt ușor de calculat și sunt utilizate foarte des deoarece:

  • Dacă se cunoaște eroarea standard a mai multor mărimi individuale, atunci eroarea standard a unei funcții a mărimilor poate fi calculată cu ușurință în multe cazuri;
  • În cazul în care distribuția de probabilitate a valorii este cunoscută, aceasta poate fi utilizată pentru a calcula o bună aproximare a unui interval de încredere exact; și
  • În cazul în care distribuția de probabilitate nu este cunoscută, se pot utiliza alte ecuații pentru a estima un interval de încredere
  • Pe măsură ce dimensiunea eșantionului devine foarte mare, principiul teoremei limitei centrale arată că numerele din eșantion se aseamănă foarte mult cu numerele din întregul grup (au o distribuție normală).

Eroare standard relativă

Eroarea standard relativă (RSE) este eroarea standard împărțită la medie. Acest număr este mai mic decât unu. Înmulțind-o cu 100%, se obține un procent din medie. Acest lucru ajută să se arate dacă incertitudinea este importantă sau nu. De exemplu, să luăm în considerare două sondaje privind venitul gospodăriilor care au ca rezultat o medie a eșantionului de 50.000 de dolari. Dacă un sondaj are o eroare standard de 10 000 de dolari, iar celălalt are o eroare standard de 5 000 de dolari, atunci erorile standard relative sunt de 20% și, respectiv, 10%. Sondajul cu eroarea standard relativă mai mică este mai bun, deoarece are o măsurare mai precisă (incertitudinea este mai mică).

De fapt, persoanele care au nevoie să cunoască valorile medii decid adesea cât de mică ar trebui să fie incertitudinea înainte de a decide să utilizeze informația. De exemplu, Centrul Național de Statistică Sanitară din SUA nu raportează o medie dacă eroarea standard relativă depășește 30%. NCHS necesită,[] de asemenea, cel puțin 30 de observații pentru ca o estimare să fie raportată.

Exemplu

De exemplu, în apele din Golful Mexic există multe pești roșii. Pentru a afla cât cântărește, în medie, o sebastă de 42 cm, nu este posibil să se măsoare toate sebtele de 42 cm lungime. În schimb, este posibil să se măsoare o parte dintre ei. Peștii care sunt măsurați efectiv se numesc eșantion. Tabelul prezintă greutățile a două eșantioane de pești roșii, toți cu o lungime de 42 cm. Greutatea medie (medie) a primului eșantion este de 0,741 kg. Greutatea medie (medie) a celui de-al doilea eșantion este de 0,735 kg, puțin diferită de cea a primului eșantion. Fiecare dintre aceste medii este puțin diferită de media care ar rezulta din măsurarea fiecărui pește roșu de 42 cm lungime (ceea ce oricum nu este posibil).

Incertitudinea mediei poate fi utilizată pentru a afla cât de aproape este media eșantioanelor de media care ar rezulta din măsurarea întregului grup. Incertitudinea mediei este estimată ca deviația standard pentru eșantion, împărțită la rădăcina pătrată a numărului de eșantioane minus unu. Tabelul arată că incertitudinile privind mediile pentru cele două eșantioane sunt foarte apropiate una de cealaltă. De asemenea, incertitudinea relativă este incertitudinea în medie împărțită la medie, înmulțită cu 100%. Incertitudinea relativă în acest exemplu este de 2,38% și 2,50% pentru cele două eșantioane.

Cunoscând incertitudinea mediei, se poate ști cât de aproape este media eșantionului de media care ar rezulta din măsurarea întregului grup. Media pentru întregul grup se situează între a) media eșantionului plus incertitudinea mediei și b) media eșantionului minus incertitudinea mediei. În acest exemplu, se preconizează că greutatea medie pentru toate seboretele de 42 cm lungime din Golful Mexic va fi de 0,723-0,759 kg pe baza primului eșantion și de 0,717-0,753 pe baza celui de-al doilea eșantion.

Zoom


Exemplu de sebastă (cunoscută și sub numele de tobă roșie, Sciaenops ocellatus) utilizată în exemplu.Zoom
Exemplu de sebastă (cunoscută și sub numele de tobă roșie, Sciaenops ocellatus) utilizată în exemplu.

Întrebări și răspunsuri

Î: Ce este eroarea standard?


R: Eroarea standard este abaterea standard a distribuției de eșantionare a unei statistici.

Î: Poate fi utilizat termenul de eroare standard pentru o estimare a deviației standard?


R: Da, termenul de eroare standard poate fi utilizat pentru o estimare (presupunere bună) a abaterii standard luată dintr-un eșantion al întregului grup.

Î: Cum se estimează media pentru un întreg grup?


R: Media unei părți a unui grup (numită eșantion) este modalitatea obișnuită de estimare a mediei pentru întregul grup.

Î: De ce este dificil să se măsoare întregul grup?


R: Adesea este prea greu sau prea costisitor să se măsoare întregul grup.

Î: Ce este eroarea standard a mediei și ce determină aceasta?


R: Eroarea standard a mediei este o modalitate de a afla cât de aproape este media eșantionului de media întregului grup. Este o modalitate de a ști cât de sigur se poate fi despre media din eșantion.

Î: Se cunoaște de obicei valoarea reală a abaterii standard a mediei în măsurătorile reale?


R: Nu, valoarea reală a deviației standard a mediei pentru întregul grup nu este, de obicei, cunoscută în măsurătorile reale.

Î: Cum afectează numărul de măsurători dintr-un eșantion acuratețea estimării?


R: Cu cât sunt mai multe măsurători într-un eșantion, cu atât mai aproape va fi estimarea de numărul real pentru întregul grup.

AlegsaOnline.com - 2020 / 2023 - License CC3