Legea lui Zipf

Legea lui Zipf este o lege empirică, formulată cu ajutorul statisticii matematice, numită după numele lingvistului George Kingsley Zipf, care a propus-o pentru prima dată.

Legea lui Zipf afirmă că, având în vedere un eșantion mare de cuvinte utilizate, frecvența oricărui cuvânt este invers proporțională cu rangul său în tabelul de frecvență. Astfel, cuvântul cu numărul n are o frecvență proporțională cu 1/n.

Astfel, cuvântul cel mai frecvent va apărea de aproximativ două ori mai des decât al doilea cuvânt cel mai frecvent, de trei ori mai des decât al treilea cuvânt cel mai frecvent etc. De exemplu, într-un eșantion de cuvinte din limba engleză, cuvântul cel mai frecvent întâlnit, "the", reprezintă aproape 7% din totalul cuvintelor (69.971 din puțin peste 1 milion). Fidel legii lui Zipf, cuvântul de pe locul al doilea, "of", reprezintă puțin peste 3,5% din cuvinte (36.411 apariții), urmat de "and" (28.852). Sunt necesare doar aproximativ 135 de cuvinte pentru a reprezenta jumătate din numărul de cuvinte dintr-un eșantion mare.

Aceeași relație apare în multe alte clasamente, care nu au legătură cu limba, cum ar fi clasamentul populației orașelor din diferite țări, mărimea corporațiilor, clasamentul veniturilor etc. Apariția distribuției în clasamentele orașelor în funcție de populație a fost observată pentru prima dată de Felix Auerbach în 1913.

Nu se știe de ce legea lui Zipf este valabilă pentru majoritatea limbilor.

Întrebări și răspunsuri

Î: Ce este legea lui Zipf?


R: Legea lui Zipf este o lege empirică care afirmă că frecvența unui cuvânt într-un eșantion mare este invers proporțională cu rangul său în tabelul de frecvență.

Î: Cine a propus legea lui Zipf?


R: Legea lui Zipf a fost propusă pentru prima dată de George Kingsley Zipf, un lingvist.

Î: Cum explică legea lui Zipf frecvența cuvintelor într-un eșantion de cuvinte în limba engleză?


R: Conform legii lui Zipf, cel mai frecvent cuvânt dintr-un eșantion de cuvinte englezești apare de aproximativ două ori mai des decât al doilea cuvânt cel mai frecvent, de trei ori mai des decât al treilea cuvânt cel mai frecvent etc. Această tendință continuă pe măsură ce scade rangul cuvântului.

Î: Ce procent din toate cuvintele reprezintă cuvântul cel mai frecvent întâlnit într-un eșantion de cuvinte englezești?


R: Într-un eșantion de cuvinte englezești, cuvântul cel mai frecvent întâlnit ("the") reprezintă aproape 7% din toate cuvintele.

Î: Care este relația dintre numărul de cuvinte necesare pentru a reprezenta jumătate din eșantion și frecvența acestor cuvinte?


R: Conform legii lui Zipf, sunt necesare doar aproximativ 135 de cuvinte pentru a reprezenta jumătate din eșantionul de cuvinte dintr-un eșantion mare.

Î: Ce alte clasamente prezintă legea lui Zipf?


R: Aceeași relație pe care legea lui Zipf o descrie în ceea ce privește frecvența cuvintelor apare și în alte clasamente care nu au legătură cu limba, cum ar fi clasamentul populației orașelor din diferite țări, mărimea corporațiilor și clasamentul veniturilor.

Î: Cine a observat apariția distribuției în clasamentele orașelor în funcție de populație?


R: Apariția distribuției în clasamentul orașelor în funcție de populație a fost observată pentru prima dată de Felix Auerbach în 1913.

AlegsaOnline.com - 2020 / 2023 - License CC3