Legea lui Zipf este o lege empirică, formulată cu ajutorul statisticii matematice, numită după numele lingvistului George Kingsley Zipf, care a propus-o pentru prima dată.

Legea lui Zipf afirmă că, având în vedere un eșantion mare de cuvinte utilizate, frecvența oricărui cuvânt este invers proporțională cu rangul său în tabelul de frecvență. Astfel, cuvântul cu numărul n are o frecvență proporțională cu 1/n.

Astfel, cuvântul cel mai frecvent va apărea de aproximativ două ori mai des decât al doilea cuvânt cel mai frecvent, de trei ori mai des decât al treilea cuvânt cel mai frecvent etc. De exemplu, într-un eșantion de cuvinte din limba engleză, cuvântul cel mai frecvent întâlnit, "the", reprezintă aproape 7% din totalul cuvintelor (69.971 din puțin peste 1 milion). Fidel legii lui Zipf, cuvântul de pe locul al doilea, "of", reprezintă puțin peste 3,5% din cuvinte (36.411 apariții), urmat de "and" (28.852). Sunt necesare doar aproximativ 135 de cuvinte pentru a reprezenta jumătate din numărul de cuvinte dintr-un eșantion mare.

Aceeași relație apare în multe alte clasamente, care nu au legătură cu limba, cum ar fi clasamentul populației orașelor din diferite țări, mărimea corporațiilor, clasamentul veniturilor etc. Apariția distribuției în clasamentele orașelor în funcție de populație a fost observată pentru prima dată de Felix Auerbach în 1913.

Nu se știe de ce legea lui Zipf este valabilă pentru majoritatea limbilor.