ВУЗ:
Составители:
Рубрика:
вающие количество авторов, публикующих работы по
данной предметной области, с количеством журналов
по этой же области. То же касается количества опуб-
ликованных работ и численности их авторов. Интерес-
ные зависимости можно обнаружить и для распреде-
ления слов по частоте их появления в текстах на
естественном языке, распределения ученых по количеству
опубликованных работ и т. д. Некоторые из этих
явлений будут подробно описаны ниже.
Наиболее известный гиперболический закон Ципфа
относится к статистической обработке текстов. Если
расположить слова определенного текста в порядке
убывания частоты их появления (начиная с наиболее
часто встречающихся), то произведение частоты f (i)
на порядковый номер, ранг r (i) постоянно для любого
данного слова i: f (i)• r(i) = c, c —некоторая постоян-
ная. Для различных классов данных более точное
совпадение с экспериментом дает несколько измененное
уравнение f (i) = с (r (i) — а)
-s
, где а и s — малые
постоянные. Константа а улучшает совпадение для
общеупотребительных слов, имеющих низкий ранг?
а показатель s — для слов, имеющих высокий ранг.
Ципф объяснял свей закон как следствие общего
„принципа наименьшего усилия": наиболее часто
встречающиеся слова любого языка обычно являются
короткими служебными словами, употребление кото-
рых требует наименьших усилий (чем и объясняется
их большая частота). Распределение Ципфа можно
применять в различных областях, не обязательно при-
нимая или отвергая принцип наименьшего усилия.
Графически закон Ципфа изображается кривой, при-
веденной на рис. 64.
Закон Брэдфорда описывает отношение между
количеством журналов и количест-
вом опубликованных в них статей
на ту или иную тему.
Пусть I названий журналов на
данную тему разбиты на k групп,
каждая из которых содержит до
I
1
, I
2
, ... ,I
k
названий, так что все
группы содержат одинаковое ко-
личество статей на данную тему.
Тогда
Рис. 64.Закон Ципфа
188
вающие количество авторов, публикующих работы по
данной предметной области, с количеством журналов
по этой же области. То же касается количества опуб-
ликованных работ и численности их авторов. Интерес-
ные зависимости можно обнаружить и для распреде-
ления слов по частоте их появления в текстах на
естественном языке, распределения ученых по количеству
опубликованных работ и т. д. Некоторые из этих
явлений будут подробно описаны ниже.
Наиболее известный гиперболический закон Ципфа
относится к статистической обработке текстов. Если
расположить слова определенного текста в порядке
убывания частоты их появления (начиная с наиболее
часто встречающихся), то произведение частоты f (i)
на порядковый номер, ранг r (i) постоянно для любого
данного слова i: f (i)• r(i) = c, c —некоторая постоян-
ная. Для различных классов данных более точное
совпадение с экспериментом дает несколько измененное
уравнение f (i) = с (r (i) — а)-s , где а и s — малые
постоянные. Константа а улучшает совпадение для
общеупотребительных слов, имеющих низкий ранг?
а показатель s — для слов, имеющих высокий ранг.
Ципф объяснял свей закон как следствие общего
„принципа наименьшего усилия": наиболее часто
встречающиеся слова любого языка обычно являются
короткими служебными словами, употребление кото-
рых требует наименьших усилий (чем и объясняется
их большая частота). Распределение Ципфа можно
применять в различных областях, не обязательно при-
нимая или отвергая принцип наименьшего усилия.
Графически закон Ципфа изображается кривой, при-
веденной на рис. 64.
Закон Брэдфорда описывает отношение между
количеством журналов и количест-
вом опубликованных в них статей
на ту или иную тему.
Пусть I названий журналов на
данную тему разбиты на k групп,
каждая из которых содержит до
I 1 , I 2 , ... ,I k названий, так что все
группы содержат одинаковое ко-
личество статей на данную тему.
Тогда
Рис. 64.Закон Ципфа
188
Страницы
- « первая
- ‹ предыдущая
- …
- 186
- 187
- 188
- 189
- 190
- …
- следующая ›
- последняя »
