ВУЗ:
Составители:
Рубрика:
68
Приложение 8
МЕТОДИКА ОЦЕНКИ ЗАВИСИМОСТИ МЕЖДУ
ЭЛЕМЕНТАМИ СОДЕРЖАНИЯ ТЕКСТА В КОНТЕНТ -АНАЛИЗЕ
Специальным способом математической обработки данных, разрабо-
танным для нужд контент- анализа, является методика Чарлза Осгуда
(Ch. Osgood). Она применяется для анализа зависимости элементов содер -
жания на основе расчета совместной встречаемости различных элементов в
тексте. Процедура данной методики состоит в том, что после подсчета со -
вместной встречаемости конкретных единиц контент- анализа, заполняется
матрица возможных и фактических совместных появлений этих единиц в
тексте:
Категории А В С ... n
A 0,08 0,24
B 0,06 0,12
C 0,38 0,02
...
n
Примечание. В клетках выше диагонали указываются значения возможной вероят -
ности встречаемости элементов Р
АВ
= Р
А
* Р
В
. В клетках ниже диагонали – значения
фактической встречаемости.
Например , единица А встречается в 40% анализируемых сообщений
( Р
А
= 0,4), а единица В – в 20% сообщений ( Р
В
= 0,2), тогда можно ожи-
дать , что по теореме умножения вероятностей совместно эти единицы поя-
вятся с вероятностью 0,08. Это значение записывается в верхнюю от мат -
ричной диагонали строчку. На самом же деле единицы А и В совместно
встречаются только в 6% сообщений (f
АВ
= 0,06). Это число записывается в
нижнюю от диагонали клетку.
Сравнивая фактические и вероятностные величины , определяем, ка-
кие фактические зависимости оказываются неслучайными (f
АВ
> P
АВ
). В
нашем примере совместное появление единиц А и В – случайно, т.к.
0,06 < 0,08.
Затем можно рассчитать уровень значимости неслучайных зависи-
мостей , выделить плеяды взаимосвязанных единиц и т. д.
68 П р ил ож е ние 8 М Е Т О Д И К А О Ц Е Н К И ЗА В И СИ М О СТ И М Е Ж Д У Э Л Е М Е Н Т А М И СО Д Е РЖ А Н И Я Т Е К СТ А В К О Н Т Е Н Т -А Н А Л И ЗЕ Специальны мспособомматематической обр аботки данны х, р азр або- танны м для нуж д контент-анализа, является методика Ч ар лза О сгуда (Ch. Osgood). О напр именяется для анализазависимости элементов содер - ж ания наосновер асчетасовместной встр ечаемости р азличны хэлементов в тексте. П р оцедур аданной методики состоитв том, что послеподсчетасо- вместной встр ечаемости конкр етны х единиц контент-анализа, заполняется матр ицавозмож ны хи факт ичес кихсовместны х появлений этих единиц в тексте: Кате гор ии А В С ... n A 0,08 0,24 B 0,06 0,12 C 0,38 0,02 ... n Прим еча ние. В кл ет кахвы шед иагонал и указы вают с я значения возмож ной вер оя т - нос т и вс т р ечаемос т и эл емент ов Р АВ = Р А * Р В . В кл ет кахниж ед иагонал и – значения факт ичес кой вс т р ечаемос т и. Н апр имер , единицаА встр ечается в 40% анализир уемы х сообщ ений (Р А = 0,4), аединицаВ – в 20% сообщ ений (Р В = 0,2), тогдамож но ож и- дать, что по теор емеумнож ения вер оятностей совместно эти единицы поя- вятся с вер оятностью 0,08. Э то значение записы вается в вер хню ю от мат- р ичной диагонали стр очку. Н асамом ж е деле единицы А и В совместно встр ечаю тся только в 6% сообщ ений (fАВ = 0,06). Э то число записы вается в ниж ню ю отдиагонали клетку. Ср авнивая ф актические и вер оятностны евеличины , опр еделяем, ка- кие ф актические зависимости оказы ваю тся неслучай ны ми (fАВ > PАВ ). В наш ем пр имер е совместное появление единиц А и В – случай но, т.к. 0,06 < 0,08. Затем мож но р ассчитать ур овень значимости неслучай ны х зависи- мостей , вы делить плеяды взаимосвязанны х единиц и т.д.