Ранговое распределение / кривая Джорджа Ципфа (Зипфа)

Джордж Ципф эмпирически установил, что частота использования N-го наиболее часто используемого слова в естественных языках приблизительно обратно пропорциональна числу N и была описана автором в книге:  Zipf G.R., Human Behavior and the Principle of Least Effort, 1949 

«Он обнаружил, что самое распространённое в английском языке слово («the») используется в десять раз чаще, чем десятое по частоте употребления слово, в 100 раз чаще, чем 100-е по частоте употребления слово, и в 1000 раз чаще, чем 1000-е по частоте употребления слово. Кроме того, было выявлено, что такая же закономерность действует для доли рынка программного обеспечения, безалкогольных напитков, автомобилей, конфет и для частоты обращений к интернет-сайтам. [...] Стало ясно, что в практически в каждой сфере деятельности быть номером один намного лучше, чем номером три или номером десять. Причём распределение вознаграждения отнюдь не равномерно, особенно в нашем опутанном различными сетями мире. А в сети Интернет ставки ещё выше. Рыночная капитализация Priceline, eBay и Amazon достигает 95% совокупной рыночной капитализации всех остальных сфер электронного бизнеса. Вне сомнений, победитель получает очень много».

Сет Годин, Идея-вирус? Эпидемия! Заставьте клиентов работать на ваш сбыт, СПб, «Питер», 2005 г., с. 28.

 

«Смысл этого явления состоит в том, что […] способность участников творчества входить в законченные произведения распределяется по участникам в согласии с законом произведение числа вхождений на ранг участника (на число участников с той же частотой вхождения) величина постоянная: f • r = Const. […] В ранговом списке всех участников творчества, в данном случае слов, как раз и выявляется свойство неравномерного распределения миграционной способности, а с ним и закономерность связи между количеством и качеством в творческой деятельности вообще. […]

Кроме литературных источников Ципф исследовал множество других подозрительных на ранговое распределение явлений - от распределения населения по городам до расположения инструментов на верстаке столяра, книг на столе и стеллаже ученого, повсюду натыкаясь на одну и ту же закономерность.

Независимо от Ципфа близкое распределение было вскрыто Парето при исследовании банковских вкладов, Урквартом при анализе запросов на литературу, Лоткой в анализе авторской продуктивности учёных. Даже боги Олимпа, с точки зрения их нагрузки навыкообразующими и навыкосохраняющими функциями, ведут себя по закону Ципфа.

Усилиями Прайса и его коллег, а позднее усилиями многих науковедов было выяснено, что закон Ципфа имеет прямое отношение к ценообразованию в науке.

Прайс по этому поводу пишет: «Все данные, связанные с распределением таких характеристик, как степень совершенства, полезности, продуктивности, размера подчиняются нескольким неожиданным, но простым закономерностям [...] Является ли точная форма этого распределения логарифмически нормальной или геометрической, или обратно-квадратичной или подчинена закону Ципфа, - это предмет конкретизации для каждой отдельной отрасли. То, что нам известно, состоит в констатации самого факта, что любой из этих законов распределения даёт близкие к эмпирическим результаты в каждой из исследуемых отраслей, и что такое общее для всех отраслей явление есть, видимо, результат действия одного закона». Price D., Regular Patterns in the Organisation of  Science, Organon, 1965, N 2., р. 246».

Петров М.К., Искусство и наука. Пираты Эгейского моря и личность, М., «Российская политическая энциклопедия, 1995 г., с. 153-154.

Кроме этого, Джордж Ципф также установил, что наиболее часто употребляемые слова языка, существующего длительное время, короче остальных. Частое употребление «истёрло» их...