Coeficientul de corelație de rang

În matematică și statistică, coeficientul de corelație de rang Spearman este o măsură de corelație, numită astfel după creatorul său, Charles Spearman. Este scris pe scurt sub forma literei grecești rho ( ρ {\displaystyle \rho }{\displaystyle \rho } ) sau uneori ca r s {\displaystyle r_{s}}. {\displaystyle r_{s}}. Este un număr care arată cât de strâns sunt legate două seturi de date. Acesta poate fi utilizat numai pentru datele care pot fi puse în ordine, de exemplu, de la cel mai mare la cel mai mic.

Formula generală pentru r s {\displaystyle r_{s}}{\displaystyle r_{s}} este ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}}{n(n^{2}-1)}}}. {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}.

De exemplu, dacă aveți date despre cât de scumpe sunt diferite calculatoare și despre cât de rapide sunt calculatoarele, puteți vedea dacă sunt legate și cât de strâns legate sunt, folosind r s {\displaystyle r_{s}}. {\displaystyle r_{s}}.

Lucrând la asta

Primul pas

Pentru a calcula r s {\displaystyle r_{s}}{\displaystyle r_{s}} trebuie mai întâi să clasificați fiecare bucată de date. Vom folosi exemplul din introducerea despre calculatoare și viteza lor.

Astfel, calculatorul cu cel mai mic preț ar fi pe locul 1. Cel mai mare decât acesta ar avea locul 2. Apoi, se continuă până când toate sunt clasate. Trebuie să faceți acest lucru pentru ambele seturi de date.

PC

Preț ($)

R a n k 1 {\displaystyle Rank_{1}} {\displaystyle Rank_{1}}

Viteză (GHz)

R a n k 2 {\displaystyle Rank_{2}} {\displaystyle Rank_{2}}

A

200

1

1.80

2

B

275

2

1.60

1

C

300

3

2.20

4

D

350

4

2.10

3

E

600

5

4.00

5

Pasul doi

În continuare, trebuie să găsim diferența dintre cele două clasamente. Apoi, se înmulțește diferența cu ea însăși, ceea ce se numește cuadratură. Diferența se numește d {\displaystyle d} {\displaystyle d}, iar numărul pe care îl obțineți când îl ridicați la pătrat pe d {\displaystyle d}{\displaystyle d} se numește d 2 {\displaystyle d^{2}}. {\displaystyle d^{2}}.

R a n k 1 {\displaystyle Rank_{1}} {\displaystyle Rank_{1}}

R a n k 2 {\displaystyle Rank_{2}} {\displaystyle Rank_{2}}

d {\displaystyle d} {\displaystyle d}

d 2 {\displaystyle d^{2}} {\displaystyle d^{2}}

1

2

-1

1

2

1

1

1

3

4

-1

1

4

3

1

1

5

5

0

0

Pasul trei

Numărați câte date avem. Aceste date au ranguri de la 1 la 5, deci avem 5 date. Acest număr se numește n {\displaystyle n}n .

Pasul patru

În cele din urmă, folosiți tot ce am descoperit până acum în această formulă: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}}.

∑ d 2 {\displaystyle \sum d^{2}} {\displaystyle \sum d^{2}}înseamnă că luăm totalul tuturor numerelor care au fost în coloana d 2 {\displaystyle d^{2}}. {\displaystyle d^{2}}. Acest lucru se datorează faptului că ∑ {\displaystyle \sum } {\displaystyle \sum }înseamnă total.

Așadar, ∑ d 2 {\displaystyle \sum d^{2}}{\displaystyle \sum d^{2}} este 1 + 1 + 1 + 1 + 1 {\displaystyle 1+1+1+1+1}{\displaystyle 1+1+1+1}, adică 4. Formula spune că trebuie înmulțit cu 6, ceea ce înseamnă 24.

n ( n 2 - 1 ) {\displaystyle n(n^{2}-1)} {\displaystyle n(n^{2}-1)}este 5 × ( 25 - 1 ) {\displaystyle 5\ ori (25-1)}, {\displaystyle 5\times (25-1)}ceea ce înseamnă 120.

Deci, pentru a afla r s {\displaystyle r_{s}} {\displaystyle r_{s}}, facem pur și simplu 1 - 24 120 = 0,8 {\displaystyle 1-{\cfrac {24}{120}}=0,8}{\displaystyle 1-{\cfrac {24}{120}}=0.8} .

Prin urmare, coeficientul de corelație de rang al lui Spearman este de 0,8 pentru acest set de date.

Ce înseamnă numerele

r s {\displaystyle r_{s}}{\displaystyle r_{s}} oferă întotdeauna un răspuns cuprins între -1 și 1. Numerele dintre ele sunt ca o scară, unde -1 reprezintă o legătură foarte puternică, 0 nu reprezintă nicio legătură, iar 1 reprezintă, de asemenea, o legătură foarte puternică. Diferența dintre 1 și -1 constă în faptul că 1 reprezintă o corelație pozitivă, iar -1 reprezintă o corelație negativă. Un grafic de date cu o valoare r s {\displaystyle r_{s}}{\displaystyle r_{s}} de -1 ar arăta ca graficul prezentat, cu excepția faptului că linia și punctele ar merge de sus în stânga spre jos în dreapta.

De exemplu, pentru datele de mai sus, r s {\displaystyle r_{s}}{\displaystyle r_{s}} a fost de 0,8. Deci, acest lucru înseamnă că există o corelație pozitivă. Deoarece este aproape de 1, înseamnă că legătura este puternică între cele două seturi de date. Așadar, putem spune că aceste două seturi de date sunt legate și cresc împreună. Dacă ar fi fost -0,8, am putea spune că sunt legate și că, pe măsură ce unul dintre ele crește, celălalt scade.

Zoom

Acest grafic de dispersie are o corelație pozitivă. Valoarea r s {\displaystyle r_{s}}{\displaystyle r_{s}} ar trebui să fie aproape de 1 sau 0,9. Linia roșie este o linie de cea mai bună potrivire.

Dacă două numere sunt identice

Uneori, atunci când se clasifică datele, există două sau mai multe numere care sunt identice. Când se întâmplă acest lucru în r s {\displaystyle r_{s}} {\displaystyle r_{s}}se ia media sau media clasamentelor care sunt identice. Acestea se numesc clasamente egale. Pentru a face acest lucru, clasificăm numerele egale ca și cum nu ar fi egale. Apoi, adunăm toate rangurile pe care le-ar avea și le împărțim la câte sunt. De exemplu, să presupunem că am clasifica cât de bine s-au descurcat diferite persoane la un test de ortografie.

Punctajul testului

Clasament

Clasament (cu egalitate)

4

1

1

6

2

2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3}} {\displaystyle {\tfrac {2+3+4}{3}}=3}

6

3

2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3}} {\displaystyle {\tfrac {2+3+4}{3}}=3}

6

4

2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3}} {\displaystyle {\tfrac {2+3+4}{3}}=3}

8

5

5 + 6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5}} {\displaystyle {\tfrac {5+6}{2}}=5.5}

8

6

5 + 6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5}} {\displaystyle {\tfrac {5+6}{2}}=5.5}

Aceste numere sunt utilizate exact în același mod ca și gradele normale.

Pagini conexe

Întrebări și răspunsuri

Î: Ce este coeficientul de corelație de rang al lui Spearman?


R: Coeficientul de corelație de rang Spearman este o măsură de corelație care arată cât de strâns sunt legate două seturi de date. Acesta poate fi utilizat numai pentru datele care pot fi puse în ordine, de exemplu, de la cel mai mare la cel mai mic.

Î: Cine a creat coeficientul de corelație de rang al lui Spearman?


R: Charles Spearman a creat coeficientul de corelație de rang Spearman.

Î: Cum se scrie formula generală pentru coeficientul de corelație de rang Spearman?


R: Formula generală pentru coeficientul de corelație de rang Spearman se scrie ca ρ = 1 - 6∑d2/n(n2-1).

Î: Când ar trebui să folosiți coeficientul de corelație de rang Spearman?


R: Ar trebui să utilizați coeficientul de corelație de rang Spearman atunci când doriți să vedeți cât de strâns sunt legate două seturi de date și dacă sunt legate între ele.

Î: Cu ce tip de date funcționează?


R: Funcționează cu orice tip de date care pot fi puse în ordine, de exemplu, de la cel mai mare la cel mai mic.

Î: Puteți da un exemplu în care ați putea utiliza această măsură?



R: Un exemplu de utilizare a acestei măsuri ar putea fi dacă aveți date despre cât de scumpe sunt diferite calculatoare și date despre cât de rapide sunt calculatoarele, apoi ați putea vedea dacă sunt legate și cât de strâns legate sunt, folosind r_s.

AlegsaOnline.com - 2020 / 2023 - License CC3