Distribuția frecvențelor | o listă a valorilor pe care le ia o variabilă într-un eșantion

În statistică, o distribuție de frecvență este o listă a valorilor pe care le ia o variabilă într-un eșantion. De obicei, este o listă, ordonată în funcție de cantitate. Aceasta va arăta numărul de ori de câte ori apare fiecare valoare. De exemplu, dacă 100 de persoane dau o notă pe o scală Likert în cinci puncte care evaluează acordul lor cu o afirmație pe o scară pe care 1 denotă un acord puternic și 5 un dezacord puternic, distribuția de frecvență a răspunsurilor lor ar putea arăta astfel:

Acest tabel simplu are două dezavantaje. Atunci când o variabilă poate lua valori continue în loc de valori discrete sau când numărul de valori posibile este prea mare, construcția tabelului este dificilă, dacă nu chiar imposibilă. În astfel de cazuri, se utilizează o schemă ușor diferită bazată pe intervalul de valori. De exemplu, dacă luăm în considerare înălțimile elevilor dintr-o clasă, tabelul de frecvențe ar putea arăta ca mai jos.



  Aceasta este piramida demografică a Chinei pentru anul 2005.   Zoom
Aceasta este piramida demografică a Chinei pentru anul 2005.  

Exemplu de distribuție de frecvență (absolută). Aceasta este piramida populației din Angola, pentru anul 2005.  Zoom
Exemplu de distribuție de frecvență (absolută). Aceasta este piramida populației din Angola, pentru anul 2005.  

Aplicații

Gestionarea și operarea pe date tabulate pe frecvență este mult mai simplă decât operarea pe date brute. Există algoritmi simpli pentru a calcula mediana, media (statistică), abaterea standard etc. din aceste tabele.

Testarea statistică a ipotezelor se bazează pe evaluarea diferențelor și similitudinilor dintre distribuțiile de frecvență. Această evaluare implică măsuri de tendință centrală sau medii, cum ar fi media și mediana, și măsuri de variabilitate sau dispersie statistică, cum ar fi abaterea standard sau varianța.

Se spune că o distribuție de frecvențe este înclinată atunci când media și mediana acesteia sunt diferite. Curtoza unei distribuții de frecvențe reprezintă concentrația scorurilor la nivelul mediei, sau cât de ridicată pare distribuția dacă este reprezentată grafic - de exemplu, într-o histogramă. În cazul în care distribuția are un vârf mai mare decât distribuția normală, se spune că este leptokurtică; în cazul în care are un vârf mai mic, se spune că este platicurtică.

Distribuțiile de frecvență sunt, de asemenea, utilizate în analiza de frecvență pentru descifrarea codurilor și se referă la frecvența relativă a literelor în diferite limbi.

  • Schiță
  • Index

Statistici descriptive

Date continue

Centru

  • Mediană
  • Mod

Dispersie

  • Variație
  • Abaterea standard
  • Abaterea medie absolută
  • Coeficientul de variație
  • Procentuală
  • Gama
  • Interval interquartil

Formă

    • Skewness
    • Kurtosis
    • L-momente

Date de numărare

  • Indicele de dispersie

Tabele recapitulative

  • Date grupate
  • Distribuția frecvenței
  • Tabelul de contingență

Dependență

  • Corelația produs-moment Pearson
  • Corelația de rang
  • Corelație parțială
  • Diagramă de dispersie

Grafică

  • Diagramă cu bare
  • Biplot
  • Box plot
  • Diagrama de control
  • Corelograma
  • Graficul ventilatorului
  • Parcela forestieră
  • Histograma
  • Diagramă circulară
  • Parcela Q-Q
  • Graficul de funcționare
  • Diagramă de dispersie
  • Afișaj cu frunze și tulpini
  • Harta radar
  • Parcela de vioară

Colectarea datelor

Proiectarea studiului

  • Populația
  • Statistică
  • Mărimea efectului
  • Puterea statistică
  • Proiectare optimă
  • Determinarea dimensiunii eșantionului
  • Replicare
  • Date lipsă

Metodologia sondajului

    • stratificat
    • cluster

Experimente controlate

  • Controlul științific
  • Experiment randomizat
  • Studiu randomizat controlat
  • Alocarea aleatorie
  • Blocarea
  • Interacțiune
  • Experiment factorial

Modele adaptative

  • Studiu clinic adaptiv
  • Modele de sus și jos
  • Aproximare stocastică

Studii observaționale

  • Studiu transversal
  • Studiu de cohortă
  • Experiment natural
  • Cvasi-experiment

Inferența statistică

Teoria statistică

  • Populația
  • Statistică
  • Distribuția probabilității
  • Distribuția de eșantionare
    • Statistica comenzii
  • Distribuția empirică
    • Estimarea densității
  • Model statistic
    • Specificația modelului
    • Lp spațiu
  • Parametru
    • locație
    • scară
    • formă
  • Familia parametrică
    • Probabilitate (monoton)
    • Familie la scară de localizare
    • Familia exponențială
  • Completitudine
  • Suficiență
  • Funcționalitate statistică
    • Bootstrap
    • U
    • V
  • Decizia optimă
    • funcția de pierdere
  • Eficiență
  • Distanța statistică
    • divergență
  • Asimptotică
  • Robustețe

Inferența frecvențială

Estimarea punctului

  • Ecuații de estimare
    • Probabilitatea maximă
    • Metoda momentelor
    • M-estimator
    • Distanța minimă
  • Estimatori fără deviație
    • Variația minimă de variație medie-nebiată
      • Rao-Blackwellization
      • Teorema Lehmann-Scheffé
    • Mediană nebiată
  • Plug-in

Estimarea intervalului

  • Interval de încredere
  • Pivot
  • Interval de probabilitate
  • Interval de predicție
  • Interval de toleranță
  • Reeșantionare
    • Bootstrap
    • Jackknife

Testarea ipotezelor

  • 1- și 2-cozi
  • Putere
    • Testul cel mai puternic în mod uniform
  • Test de permutare
    • Test de randomizare
  • Comparații multiple

Teste parametrice

  • Raportul de verosimilitate
  • Multiplicator de scor/lagăre
  • Wald

Teste specifice

  • Testul Z (normal)
  • Testul t al lui Student
  • Testul F

Calitatea de potrivire

  • Chi-pătrat
  • Testul G
  • Kolmogorov-Smirnov
  • Anderson-Darling
  • Lilliefors
  • Jarque-Bera
  • Normalitate (Shapiro-Wilk)
  • Testul raportului de verosimilitate
  • Selecția modelului
    • Validare încrucișată
    • AIC
    • BIC

Statistici de rang

  • Semnează
    • Mediana eșantionului
  • Rang semnat (Wilcoxon)
    • Estimatorul Hodges-Lehmann
  • Suma rangurilor (Mann-Whitney)
  • Anova neparametrică
    • 1 cale (Kruskal-Wallis)
    • 2 căi (Friedman)
    • Alternativă comandată (Jonckheere-Terpstra)

Inferența bayesiană

  • Probabilitatea bayesiană
    • anterior
    • posterior
  • Interval credibil
  • Factorul Bayes
  • Estimator bayesian
    • Estimator posterior maxim
  • Corelație
  • Analiza de regresie

Corelație

  • Pearson produs-moment Pearson
  • Corelație parțială
  • Variabila de confuzie
  • Coeficientul de determinare

Analiza de regresie

  • Erori și reziduuri
  • Validarea regresiei
  • Modele cu efecte mixte
  • Modele cu ecuații simultane
  • Spline de regresie adaptivă multivariată (MARS)

Regresie liniară

  • Regresie liniară simplă
  • Cel mai mic pătrat ordinar
  • Model liniar general
  • Regresia bayesiană

Predictori non-standard

  • Regresie neliniară
  • Nonparametric
  • Semiparametrice
  • Isotonic
  • Robust
  • Heteroscedasticitate
  • Homoscedasticitate

Model liniar generalizat

  • Familii exponențiale
  • Regresii logistice (Bernoulli) / binomiale / Poisson

Împărțirea varianței

  • Analiza varianței (ANOVA, anova)
  • Analiza de covarianță
  • ANOVA multivariată
  • Gradele de libertate

Analiză categorială / Multivariată / Seriile de timp / Analiza de supraviețuire

Categorică

  • kappa lui Cohen
  • Tabelul de contingență
  • Model grafic
  • Model log-liniar
  • Testul lui McNemar
  • Statistica Cochran-Mantel-Haenszel

Multivariate

  • Regresie
  • Manova
  • Componente principale
  • Corelație canonică
  • Analiza discriminantă
  • Analiza clusterului
  • Clasificare
  • Model de ecuație structurală
    • Analiza factorială
  • Distribuții multivariate
    • Distribuții eliptice
      • Normal

Seriile de timp

General

  • Descompunere
  • Tendință
  • Staționaritate
  • Ajustarea sezonieră
  • Netezirea exponențială
  • Cointegrarea
  • Ruptură structurală
  • Cauzalitate Granger

Teste specifice

  • Dickey-Fuller
  • Johansen
  • Statistica Q (Ljung-Box)
  • Durbin-Watson
  • Breusch-Godfrey

Domeniul timpului

  • Autocorelația (ACF)
    • parțial (PACF)
  • Corelația încrucișată (XCF)
  • Modelul ARMA
  • Model ARIMA (Box-Jenkins)
  • Heteroskedasticitate condiționată autoregresivă (ARCH)
  • autoregresie vectorială (VAR)

Domeniul de frecvență

  • Estimarea densității spectrale
  • Analiza Fourier
  • Wavelet
  • Probabilitatea Whittle

Supraviețuire

Funcția de supraviețuire

  • Estimatorul Kaplan-Meier (limita produsului)
  • Modele de hazard proporționale
  • Modelul de timp de cedare accelerată (AFT)
  • Primul timp de lovire

Funcția de risc

  • Estimatorul Nelson-Aalen

Test

  • Testul Log-rank

Aplicații

Biostatistică

Statistică inginerească

  • Chemometrics
  • Ingineria metodelor
  • Proiectare probabilistică
  • Controlul procesului / calității
  • Fiabilitate
  • Identificarea sistemului

Statistici sociale

  • Știința actuarială
  • Recensământ
  • Statisticile privind criminalitatea
  • Demografie
  • Econometrie
  • Jurimetrics
  • Conturi naționale
  • Statistici oficiale
  • Statisticile privind populația
  • Psihometrie

Statistici spațiale

  • Cartografie
  • Statistici de mediu
  • Sistem informațional geografic
  • Geostatistică
  • Kriging


 

Întrebări și răspunsuri

Î: Ce este o distribuție de frecvență?


R: O distribuție de frecvență este o listă a valorilor pe care le ia o variabilă într-un eșantion, ordonate în funcție de cantitate. Ea arată de câte ori apare fiecare valoare.

Î: Cum ar putea arăta distribuția de frecvență a răspunsurilor la o scală Likert în cinci puncte?


R: Distribuția de frecvență a răspunsurilor la o scală Likert în cinci puncte ar putea arăta ca un simplu tabel care arată numărul de persoane care au evaluat fiecare punct de pe scală.

Î: Care sunt cele două dezavantaje ale utilizării acestui tip de tabel?


R: Două dezavantaje ale utilizării acestui tip de tabel sunt faptul că poate fi dificil sau chiar imposibil atunci când este vorba de valori continue sau când există prea multe valori posibile.

Î: Cu ce diferă această schemă atunci când se tratează valori continue sau un număr mare de valori posibile?


R: În cazul în care se utilizează valori continue sau un număr mare de valori posibile, se poate folosi o schemă ușor diferită bazată pe un interval de valori.

Î: Cum ar putea arăta tabelul de frecvențe pentru înălțimea elevilor?


R: Tabelul de frecvență pentru înălțimile elevilor ar putea arăta intervale și câți elevi se încadrează în fiecare interval.


Î: Ce informații oferă distribuția de frecvență?


R: Distribuția de frecvență oferă informații despre frecvența cu care anumite variabile apar în eșantioane și despre modul în care acestea sunt distribuite în aceste eșantioane.

AlegsaOnline.com - 2020 / 2023 - License CC3