Синергетика и творчество. Браже Р.А. - 66 стр.

UptoLike

Составители: 

Рубрика: 

66
Г л а в а 5
Степенные законы и шумы
Я вдруг услышал словно шум потока;
Который, светлый, падая с высот,
Являя мощность своего истока.
Данте
5.1. Ранг и частота слов в тексте
Дж. К. Ципф в 1949 г. открыл закон, определяющий зависи-
мость частоты повторяемости f какого-либо слова в тексте от его
ранга r:
)78,1ln(
1
)(
Rr
rf
, (5.1)
где Rобщее число различных слов. Под рангом слова понимается
место, которое оно занимает в списке слов данного текста, распо-
ложенных в порядке убывания частоты их употребления.
Ципф получил этот закон, анализируя текст собственной книги
«Человеческое поведение и принцип наименьшего усилия».
Рис. 5.1 иллюстрирует выполнение закона Ципфа для прими-
тивного английского языка (basic English), используемого в средствах
массовой информации, где R = 12000. Конечно, в любом языке суще-
ствуют слова, которых трудно избежать. В английском это the, of, and.
В русскомв, из, и. Даже у хорошего писателя с активным словарем в
R = 100000 слов, примерно четвертую часть текста занимают около
десятка наиболее часто употребляемых слов. У различных писателей
слова эти могут быть разными, частоты их употребления могут отли-
чаться, поэтому анализ произведений по методу Ципфа помогает вы-
явить индивидуальные особенности языка автора, а при необходимо-
сти и само авторство.