Количественный анализ биологических данных. Малков П.Ю. - 46 стр.

UptoLike

Составители: 

45
ное обилие в первой из сравниваемых группировок,
c
- суммарное
обилие во второй группировке,
(
)
kj
nn ,min
- сумма меньших по-
казателей обилия по всем видам, свойственным двум сравнивае-
мым группировкам,
(
)
kj
nn ,max
- сумма наибольших показателей
обилия,
(
)
kj
pp ,min
и
(
)
kj
pp ,max
- сумма наименьших и, соот-
ветственно, наибольших долей видов, в двух сравниваемых груп-
пировках.
Существуют и другие эвристические индексы сходства, обзор и
критический анализ которых можно найти в обстоятельной моно-
графии Ю. А. Песенко [1982]. Однако, как показало эксперимен-
тальное сопоставление, проведенное на обширном материале по
населению птиц южной тайги Западной Сибири, большинство из
предложенных коэффициентов дают близкие как с формальной,
так и с содержательной точки зрения результаты [Шадрина,
1987]. Отметим, что и коэффициент корреляции, и коэффициент
сходства легко могут быть представлены в виде меры различия.
Для этого достаточно соответствующим образом трансформировать
коэффициенты:
)1(
r
r
=
или
)1(
=
, где r’ мера различия,
основанная на коэффициенте корреляции Пирсона, I’ мера раз-
личия, основанная на коэффициенте сходства.
Помимо вышеназванных коэффициентов существует ещё один
относительно широко распространенный тип мер связи - это меры
расстояния (Л
1
-норма, евклидово расстояние, расстояние Чебыше-
ва и др.). Применение мер расстояния для анализа фаунистиче-
ских данных (в широком смысле) подробно обсуждается в
[Песенко, 1982], там же приводятся формулы для их вычисления.
5.5. Вторичные матрицы и автоматическая классификация
Структурный анализ многомерной совокупности (отражением
которой является первичная матрица) целесообразно начинать с
построения вторичных матриц. Вторичная матрица порядка m × m
представляет собой таблицу, в которой содержится
2
)1(
mm
попар-
ных оценок степени корреляции или сходства анализируемых объ-
ектов. В таблице 10 представлено две вторичных m × m матрицы,
вычисленные по данным таблицы 9.
Из рассматриваемого примера хорошо видно, что использован-
ные показатели дают существенно различные результаты. По-
следнее закономерно вытекает из их математических свойств и, во
многом, определяет сферу их применения. Коэффициенты корре-
ляции, оценивая сопряженность варьирования объектов, как пра-
вило, вполне информативны в случае анализа структурированных
систем, в которых превалируют внутренние связи. Коэффициенты
сходства, определяя степень пересечения признаков, оценивают
ное обилие в первой из сравниваемых группировок, c - суммарное
                                                        (   )
обилие во второй группировке, ∑ min n j , nk - сумма меньших по-
казателей обилия по всем видам, свойственным двум сравнивае-
мым группировкам,                 ∑ (        )
                     max n j , nk - сумма наибольших показателей
обилия,   ∑ min ( p   j   , pk   ) и ∑ max( p , p )
                                              j    k
                                                       - сумма наименьших и, соот-
ветственно, наибольших долей видов, в двух сравниваемых груп-
пировках.
   Существуют и другие эвристические индексы сходства, обзор и
критический анализ которых можно найти в обстоятельной моно-
графии Ю. А. Песенко [1982]. Однако, как показало эксперимен-
тальное сопоставление, проведенное на обширном материале по
населению птиц южной тайги Западной Сибири, большинство из
предложенных коэффициентов дают близкие как с формальной,
так и с содержательной точки зрения результаты [Шадрина,
1987]. Отметим, что и коэффициент корреляции, и коэффициент
сходства легко могут быть представлены в виде меры различия.
Для этого достаточно соответствующим образом трансформировать
коэффициенты: r ′ = (1 − r ) или I ′ = (1 − I ) , где r’ – мера различия,
основанная на коэффициенте корреляции Пирсона, I’ – мера раз-
личия, основанная на коэффициенте сходства.
   Помимо вышеназванных коэффициентов существует ещё один
относительно широко распространенный тип мер связи - это меры
расстояния (Л1-норма, евклидово расстояние, расстояние Чебыше-
ва и др.). Применение мер расстояния для анализа фаунистиче-
ских данных (в широком смысле) подробно обсуждается в
[Песенко, 1982], там же приводятся формулы для их вычисления.

5.5. Вторичные матрицы и автоматическая классификация
   Структурный анализ многомерной совокупности (отражением
которой является первичная матрица) целесообразно начинать с
построения вторичных матриц. Вторичная матрица порядка m × m
представляет собой таблицу, в которой содержится m(m − 1) попар-
                                                                       2
ных оценок степени корреляции или сходства анализируемых объ-
ектов. В таблице 10 представлено две вторичных m × m матрицы,
вычисленные по данным таблицы 9.
   Из рассматриваемого примера хорошо видно, что использован-
ные показатели дают существенно различные результаты. По-
следнее закономерно вытекает из их математических свойств и, во
многом, определяет сферу их применения. Коэффициенты корре-
ляции, оценивая сопряженность варьирования объектов, как пра-
вило, вполне информативны в случае анализа структурированных
систем, в которых превалируют внутренние связи. Коэффициенты
сходства, определяя степень пересечения признаков, оценивают
                                              45