Количественный анализ биологических данных. Малков П.Ю. - 47 стр.

UptoLike

Составители: 

46
абсолютное сходство между объектами и могут быть полезны для
анализа низкоорганизованных систем, в которых преобладают
внешние ограничения.
Таблица 10
Пример вторичных m × m матриц
m
1
m
2
m
3
m
4
m
1
- 1 -0.99 0.03
m
2
0.10 - -0.99 0.03
m
3
0.30 0.08 - -0.01
m
4
0.51 0.12 0.47 -
В верхней части таблицы приведены значения коэффициентов
корреляции Пирсона, в нижней - коэффициентов сходства Жакка-
ра (I
2
).
Анализ и интерпретация вторичных матриц может занимать
много времени, особенно если в сферу анализа задействовано от-
носительно большое число объектов. Современная биометрия рас-
полагает набором разнообразных методов, позволяющих заметно
упростить анализ вторичных матриц, повысить объективность ана-
лиза и получить качественно новую информацию [Василевич,
1969; Андреев, 1980; Шадрина, 1980; Песенко, 1982; Электрон-
ный , 1999; Гайдышев, 2001; Ефимов, 2003 и др.].
Широко распространенным методом упорядочивания вторичных
матриц является метод дендрограмм. Дендрограмма представля-
ет собой разветвленную древовидную схему, которая позволяет
выделять наиболее сходные из анализируемых множеств, пред-
ставляя их в виде более или менее изолированных групп или, как
их принято называть, кластеров. Существует несколько способов
построения дендрограмм, часть из них достаточно подробно опи-
сана в соответствующей литературе [Шадрина, 1980; Песенко,
1982; Мандель, 1988; Электронный , 1999; Гайдышев, 2001].
Имеется разнообразное программное обеспечение (STATISTICA,
NTSYSpc, BIODIV и др.), позволяющее обрабатывать данные на
компьютере. Рассмотрим наименее сложный способ, получивший
образное название - “ближайшего соседа.
Обратимся к той части таблицы 11, где представлены меры
различия (1 - r), вычисленные по данным первичной матрицы по-
рядка s × m (табл. 9). Заметим, что в качестве анализируемых
объектов здесь выступают строки (но не столбцы) первичной по-
рядка s × m матрицы. Находим наиболее сходные множества, раз-
личие между которыми минимально. В данном примере это s
6
и s
7
(1 r) = 0.01. Эти множества изображаются на графике соседни-
ми точками на одной из осей. Отходящие от точек параллельные
абсолютное сходство между объектами и могут быть полезны для
анализа низкоорганизованных систем, в которых преобладают
внешние ограничения.

                                                  Таблица 10
              Пример вторичных m × m матриц
                m1           m2         m3          m4
 m1              -            1        -0.99       0.03
 m2            0.10           -        -0.99       0.03
 m3            0.30         0.08         -         -0.01
 m4            0.51         0.12       0.47          -
В верхней части таблицы приведены значения коэффициентов
корреляции Пирсона, в нижней - коэффициентов сходства Жакка-
ра (I2).

   Анализ и интерпретация вторичных матриц может занимать
много времени, особенно если в сферу анализа задействовано от-
носительно большое число объектов. Современная биометрия рас-
полагает набором разнообразных методов, позволяющих заметно
упростить анализ вторичных матриц, повысить объективность ана-
лиза и получить качественно новую информацию [Василевич,
1969; Андреев, 1980; Шадрина, 1980; Песенко, 1982; Электрон-
ный …, 1999; Гайдышев, 2001; Ефимов, 2003 и др.].
   Широко распространенным методом упорядочивания вторичных
матриц является метод дендрограмм. Дендрограмма представля-
ет собой разветвленную древовидную схему, которая позволяет
выделять наиболее сходные из анализируемых множеств, пред-
ставляя их в виде более или менее изолированных групп или, как
их принято называть, кластеров. Существует несколько способов
построения дендрограмм, часть из них достаточно подробно опи-
сана в соответствующей литературе [Шадрина, 1980; Песенко,
1982; Мандель, 1988; Электронный …, 1999; Гайдышев, 2001].
Имеется разнообразное программное обеспечение (STATISTICA,
NTSYSpc, BIODIV и др.), позволяющее обрабатывать данные на
компьютере. Рассмотрим наименее сложный способ, получивший
образное название - “ближайшего соседа”.

   Обратимся к той части таблицы 11, где представлены меры
различия (1 - r), вычисленные по данным первичной матрицы по-
рядка s × m (табл. 9). Заметим, что в качестве анализируемых
объектов здесь выступают строки (но не столбцы) первичной по-
рядка s × m матрицы. Находим наиболее сходные множества, раз-
личие между которыми минимально. В данном примере это s6 и s7
(1 – r) = 0.01. Эти множества изображаются на графике соседни-
ми точками на одной из осей. Отходящие от точек параллельные

                              46