ВУЗ:
Составители:
Рубрика:
45
ное обилие в первой из сравниваемых группировок,
c
- суммарное
обилие во второй группировке,
(
)
∑
kj
nn ,min
- сумма меньших по-
казателей обилия по всем видам, свойственным двум сравнивае-
мым группировкам,
(
)
∑
kj
nn ,max
- сумма наибольших показателей
обилия,
(
)
∑
kj
pp ,min
и
(
)
∑
kj
pp ,max
- сумма наименьших и, соот-
ветственно, наибольших долей видов, в двух сравниваемых груп-
пировках.
Существуют и другие эвристические индексы сходства, обзор и
критический анализ которых можно найти в обстоятельной моно-
графии Ю. А. Песенко [1982]. Однако, как показало эксперимен-
тальное сопоставление, проведенное на обширном материале по
населению птиц южной тайги Западной Сибири, большинство из
предложенных коэффициентов дают близкие как с формальной,
так и с содержательной точки зрения результаты [Шадрина,
1987]. Отметим, что и коэффициент корреляции, и коэффициент
сходства легко могут быть представлены в виде меры различия.
Для этого достаточно соответствующим образом трансформировать
коэффициенты:
)1(
r
r
−
=
′
или
)1(
I
I
−
=
′
, где r’ – мера различия,
основанная на коэффициенте корреляции Пирсона, I’ – мера раз-
личия, основанная на коэффициенте сходства.
Помимо вышеназванных коэффициентов существует ещё один
относительно широко распространенный тип мер связи - это меры
расстояния (Л
1
-норма, евклидово расстояние, расстояние Чебыше-
ва и др.). Применение мер расстояния для анализа фаунистиче-
ских данных (в широком смысле) подробно обсуждается в
[Песенко, 1982], там же приводятся формулы для их вычисления.
5.5. Вторичные матрицы и автоматическая классификация
Структурный анализ многомерной совокупности (отражением
которой является первичная матрица) целесообразно начинать с
построения вторичных матриц. Вторичная матрица порядка m × m
представляет собой таблицу, в которой содержится
2
)1(
−
mm
попар-
ных оценок степени корреляции или сходства анализируемых объ-
ектов. В таблице 10 представлено две вторичных m × m матрицы,
вычисленные по данным таблицы 9.
Из рассматриваемого примера хорошо видно, что использован-
ные показатели дают существенно различные результаты. По-
следнее закономерно вытекает из их математических свойств и, во
многом, определяет сферу их применения. Коэффициенты корре-
ляции, оценивая сопряженность варьирования объектов, как пра-
вило, вполне информативны в случае анализа структурированных
систем, в которых превалируют внутренние связи. Коэффициенты
сходства, определяя степень пересечения признаков, оценивают
ное обилие в первой из сравниваемых группировок, c - суммарное
( )
обилие во второй группировке, ∑ min n j , nk - сумма меньших по-
казателей обилия по всем видам, свойственным двум сравнивае-
мым группировкам, ∑ ( )
max n j , nk - сумма наибольших показателей
обилия, ∑ min ( p j , pk ) и ∑ max( p , p )
j k
- сумма наименьших и, соот-
ветственно, наибольших долей видов, в двух сравниваемых груп-
пировках.
Существуют и другие эвристические индексы сходства, обзор и
критический анализ которых можно найти в обстоятельной моно-
графии Ю. А. Песенко [1982]. Однако, как показало эксперимен-
тальное сопоставление, проведенное на обширном материале по
населению птиц южной тайги Западной Сибири, большинство из
предложенных коэффициентов дают близкие как с формальной,
так и с содержательной точки зрения результаты [Шадрина,
1987]. Отметим, что и коэффициент корреляции, и коэффициент
сходства легко могут быть представлены в виде меры различия.
Для этого достаточно соответствующим образом трансформировать
коэффициенты: r ′ = (1 − r ) или I ′ = (1 − I ) , где r’ – мера различия,
основанная на коэффициенте корреляции Пирсона, I’ – мера раз-
личия, основанная на коэффициенте сходства.
Помимо вышеназванных коэффициентов существует ещё один
относительно широко распространенный тип мер связи - это меры
расстояния (Л1-норма, евклидово расстояние, расстояние Чебыше-
ва и др.). Применение мер расстояния для анализа фаунистиче-
ских данных (в широком смысле) подробно обсуждается в
[Песенко, 1982], там же приводятся формулы для их вычисления.
5.5. Вторичные матрицы и автоматическая классификация
Структурный анализ многомерной совокупности (отражением
которой является первичная матрица) целесообразно начинать с
построения вторичных матриц. Вторичная матрица порядка m × m
представляет собой таблицу, в которой содержится m(m − 1) попар-
2
ных оценок степени корреляции или сходства анализируемых объ-
ектов. В таблице 10 представлено две вторичных m × m матрицы,
вычисленные по данным таблицы 9.
Из рассматриваемого примера хорошо видно, что использован-
ные показатели дают существенно различные результаты. По-
следнее закономерно вытекает из их математических свойств и, во
многом, определяет сферу их применения. Коэффициенты корре-
ляции, оценивая сопряженность варьирования объектов, как пра-
вило, вполне информативны в случае анализа структурированных
систем, в которых превалируют внутренние связи. Коэффициенты
сходства, определяя степень пересечения признаков, оценивают
45
Страницы
- « первая
- ‹ предыдущая
- …
- 44
- 45
- 46
- 47
- 48
- …
- следующая ›
- последняя »
