Zipfs lag

Zipfs lag , sannolikt, påståendet att frekvenserna f för vissa händelser är omvänt proportionella mot deras rang r . Lagen föreslogs ursprungligen av den amerikanska lingvisten George Kingsley Zipf (1902–50) för frekvensen för användning av olika ord på engelska. denna frekvens ges ungefär av f ( r ) ≅ 0,1 / r . Således förekommer det vanligaste ordet (rang 1) på engelska, vilket är det , ungefär en tiondel av tiden i en typisk text; det näst vanligaste ordet (rang 2), som är av , inträffar ungefär en tjugondel av tiden; och så vidare. Ett annat sätt att titta på detta är att ett rank r- ord förekommer 1 /r gånger så ofta som det vanligaste ordet, så ord 2-ordet förekommer hälften så ofta som ord 1, ord 3-ordet en tredjedel så ofta, rang 4-ordet en fjärdedel så ofta och så vidare. Utöver ungefär rang 1000 bryter lagen helt ner.

Zipfs lag har påstås ha följts för många andra statistik som följer en exponentiell fördelning. 1949 hävdade till exempel Zipf att den största staden i ett land är ungefär dubbelt så stor som den näst största, tre gånger storleken på den tredje största och så vidare. Även om passformen inte är perfekt för språk, befolkningar eller andra uppgifter, är grundidén i Zipfs lag användbar i system för datakomprimering och vid fördelning av resurser av stadsplanerare.

William L. Hosch