Erorile statistice și reziduurile apar deoarece măsurătorile nu sunt niciodată exacte.
Nu este posibil să se facă o măsurare exactă, dar este posibil să se spună cât de precisă este o măsurătoare. Se poate măsura același lucru din nou și din nou și se pot colecta toate datele. Acest lucru ne permite să facem statistici asupra datelor. Ceea ce se înțelege prin erori și reziduuri este diferența dintre valoarea observată sau măsurată și valoarea reală, care este necunoscută.
În cazul în care există o singură variabilă aleatorie, diferența dintre erorile statistice și reziduurile este diferența dintre media populației și media eșantionului (observat). În acest caz, rezidualul este diferența dintre ceea ce spune distribuția de probabilitate și ceea ce a fost măsurat efectiv.
Să presupunem că există un experiment de măsurare a înălțimii bărbaților de 21 de ani dintr-o anumită zonă. Media distribuției este de 1,75 m. Dacă un bărbat ales la întâmplare are o înălțime de 1,80 m, "eroarea (statistică)" este de 0,05 m (5 cm); dacă are o înălțime de 1,70 m, eroarea este de -5 cm.
Pe de altă parte, un reziduu (sau o eroare de ajustare) este o estimare observabilă a erorii statistice neobservabile. Cel mai simplu caz implică un eșantion aleatoriu de n bărbați ale căror înălțimi sunt măsurate. Media eșantionului este utilizată ca o estimare a mediei populației. Atunci avem:
- Diferența dintre înălțimea fiecărui bărbat din eșantion și media neobservabilă a populației este o eroare statistică, iar
- Diferența dintre înălțimea fiecărui om din eșantion și media observabilă a eșantionului este un reziduu.
Suma reziduurilor dintr-un eșantion aleatoriu trebuie să fie zero. Prin urmare, reziduurile nu sunt independente. Suma erorilor statistice în cadrul unui eșantion aleatoriu nu trebuie să fie zero; erorile statistice sunt variabile aleatoare independente dacă indivizii sunt aleși din populație în mod independent.
În concluzie: