ВУЗ:
Составители:
Рубрика:
45
ное обилие в первой из сравниваемых группировок,
c
- суммарное
обилие во второй группировке,
(
)
∑
kj
nn ,min
- сумма меньших по-
казателей обилия по всем видам, свойственным двум сравнивае-
мым группировкам,
(
)
∑
kj
nn ,max
- сумма наибольших показателей
обилия,
(
)
∑
kj
pp ,min
и
(
)
∑
kj
pp ,max
- сумма наименьших и, соот-
ветственно, наибольших долей видов, в двух сравниваемых груп-
пировках.
Существуют и другие эвристические индексы сходства, обзор и
критический анализ которых можно найти в обстоятельной моно-
графии Ю. А. Песенко [1982]. Однако, как показало эксперимен-
тальное сопоставление, проведенное на обширном материале по
населению птиц южной тайги Западной Сибири, большинство из
предложенных коэффициентов дают близкие как с формальной,
так и с содержательной точки зрения результаты [Шадрина,
1987]. Отметим, что и коэффициент корреляции, и коэффициент
сходства легко могут быть представлены в виде меры различия.
Для этого достаточно соответствующим образом трансформировать
коэффициенты:
)1(
r
r
−
=
′
или
)1(
I
I
−
=
′
, где r’ – мера различия,
основанная на коэффициенте корреляции Пирсона, I’ – мера раз-
личия, основанная на коэффициенте сходства.
Помимо вышеназванных коэффициентов существует ещё один
относительно широко распространенный тип мер связи - это меры
расстояния (Л
1
-норма, евклидово расстояние, расстояние Чебыше-
ва и др.). Применение мер расстояния для анализа фаунистиче-
ских данных (в широком смысле) подробно обсуждается в
[Песенко, 1982], там же приводятся формулы для их вычисления.
5.5. Вторичные матрицы и автоматическая классификация
Структурный анализ многомерной совокупности (отражением
которой является первичная матрица) целесообразно начинать с
построения вторичных матриц. Вторичная матрица порядка m × m
представляет собой таблицу, в которой содержится
2
)1(
−
mm
попар-
ных оценок степени корреляции или сходства анализируемых объ-
ектов. В таблице 10 представлено две вторичных m × m матрицы,
вычисленные по данным таблицы 9.
Из рассматриваемого примера хорошо видно, что использован-
ные показатели дают существенно различные результаты. По-
следнее закономерно вытекает из их математических свойств и, во
многом, определяет сферу их применения. Коэффициенты корре-
ляции, оценивая сопряженность варьирования объектов, как пра-
вило, вполне информативны в случае анализа структурированных
систем, в которых превалируют внутренние связи. Коэффициенты
сходства, определяя степень пересечения признаков, оценивают
ное обилие в первой из сравниваемых группировок, c - суммарное ( ) обилие во второй группировке, ∑ min n j , nk - сумма меньших по- казателей обилия по всем видам, свойственным двум сравнивае- мым группировкам, ∑ ( ) max n j , nk - сумма наибольших показателей обилия, ∑ min ( p j , pk ) и ∑ max( p , p ) j k - сумма наименьших и, соот- ветственно, наибольших долей видов, в двух сравниваемых груп- пировках. Существуют и другие эвристические индексы сходства, обзор и критический анализ которых можно найти в обстоятельной моно- графии Ю. А. Песенко [1982]. Однако, как показало эксперимен- тальное сопоставление, проведенное на обширном материале по населению птиц южной тайги Западной Сибири, большинство из предложенных коэффициентов дают близкие как с формальной, так и с содержательной точки зрения результаты [Шадрина, 1987]. Отметим, что и коэффициент корреляции, и коэффициент сходства легко могут быть представлены в виде меры различия. Для этого достаточно соответствующим образом трансформировать коэффициенты: r ′ = (1 − r ) или I ′ = (1 − I ) , где r’ – мера различия, основанная на коэффициенте корреляции Пирсона, I’ – мера раз- личия, основанная на коэффициенте сходства. Помимо вышеназванных коэффициентов существует ещё один относительно широко распространенный тип мер связи - это меры расстояния (Л1-норма, евклидово расстояние, расстояние Чебыше- ва и др.). Применение мер расстояния для анализа фаунистиче- ских данных (в широком смысле) подробно обсуждается в [Песенко, 1982], там же приводятся формулы для их вычисления. 5.5. Вторичные матрицы и автоматическая классификация Структурный анализ многомерной совокупности (отражением которой является первичная матрица) целесообразно начинать с построения вторичных матриц. Вторичная матрица порядка m × m представляет собой таблицу, в которой содержится m(m − 1) попар- 2 ных оценок степени корреляции или сходства анализируемых объ- ектов. В таблице 10 представлено две вторичных m × m матрицы, вычисленные по данным таблицы 9. Из рассматриваемого примера хорошо видно, что использован- ные показатели дают существенно различные результаты. По- следнее закономерно вытекает из их математических свойств и, во многом, определяет сферу их применения. Коэффициенты корре- ляции, оценивая сопряженность варьирования объектов, как пра- вило, вполне информативны в случае анализа структурированных систем, в которых превалируют внутренние связи. Коэффициенты сходства, определяя степень пересечения признаков, оценивают 45
Страницы
- « первая
- ‹ предыдущая
- …
- 44
- 45
- 46
- 47
- 48
- …
- следующая ›
- последняя »