Количественный анализ биологических данных. Малков П.Ю. - 46 стр.

UptoLike

ВУЗ:

ГАГУ | Горно-Алтайск

Составители:

Малков П.Ю.

Рубрика:

Математическая статистика

ное обилие в первой из сравниваемых группировок,

- суммарное

обилие во второй группировке,

(

)

∑

nn ,min

- сумма меньших по-

казателей обилия по всем видам, свойственным двум сравнивае-

мым группировкам,

(

)

∑

nn ,max

- сумма наибольших показателей

обилия,

(

)

∑

pp ,min

(

)

∑

pp ,max

- сумма наименьших и, соот-

ветственно, наибольших долей видов, в двух сравниваемых груп-

пировках.

Существуют и другие эвристические индексы сходства, обзор и

критический анализ которых можно найти в обстоятельной моно-

графии Ю. А. Песенко [1982]. Однако, как показало эксперимен-

тальное сопоставление, проведенное на обширном материале по

населению птиц южной тайги Западной Сибири, большинство из

предложенных коэффициентов дают близкие как с формальной,

так и с содержательной точки зрения результаты [Шадрина,

1987]. Отметим, что и коэффициент корреляции, и коэффициент

сходства легко могут быть представлены в виде меры различия.

Для этого достаточно соответствующим образом трансформировать

коэффициенты:

)1(

−

′

или

)1(

−

′

, где r’ – мера различия,

основанная на коэффициенте корреляции Пирсона, I’ – мера раз-

личия, основанная на коэффициенте сходства.

Помимо вышеназванных коэффициентов существует ещё один

относительно широко распространенный тип мер связи - это меры

расстояния (Л

-норма, евклидово расстояние, расстояние Чебыше-

ва и др.). Применение мер расстояния для анализа фаунистиче-

ских данных (в широком смысле) подробно обсуждается в

[Песенко, 1982], там же приводятся формулы для их вычисления.

5.5. Вторичные матрицы и автоматическая классификация

Структурный анализ многомерной совокупности (отражением

которой является первичная матрица) целесообразно начинать с

построения вторичных матриц. Вторичная матрица порядка m × m

представляет собой таблицу, в которой содержится

)1(

−

попар-

ных оценок степени корреляции или сходства анализируемых объ-

ектов. В таблице 10 представлено две вторичных m × m матрицы,

вычисленные по данным таблицы 9.

Из рассматриваемого примера хорошо видно, что использован-

ные показатели дают существенно различные результаты. По-

следнее закономерно вытекает из их математических свойств и, во

многом, определяет сферу их применения. Коэффициенты корре-

ляции, оценивая сопряженность варьирования объектов, как пра-

вило, вполне информативны в случае анализа структурированных

систем, в которых превалируют внутренние связи. Коэффициенты

сходства, определяя степень пересечения признаков, оценивают

ное обилие в первой из сравниваемых группировок, c - суммарное
                                                        (   )
обилие во второй группировке, ∑ min n j , nk - сумма меньших по-
казателей обилия по всем видам, свойственным двум сравнивае-
мым группировкам,                 ∑ (        )
                     max n j , nk - сумма наибольших показателей
обилия,   ∑ min ( p   j   , pk   ) и ∑ max( p , p )
                                              j    k
                                                       - сумма наименьших и, соот-
ветственно, наибольших долей видов, в двух сравниваемых груп-
пировках.
   Существуют и другие эвристические индексы сходства, обзор и
критический анализ которых можно найти в обстоятельной моно-
графии Ю. А. Песенко [1982]. Однако, как показало эксперимен-
тальное сопоставление, проведенное на обширном материале по
населению птиц южной тайги Западной Сибири, большинство из
предложенных коэффициентов дают близкие как с формальной,
так и с содержательной точки зрения результаты [Шадрина,
1987]. Отметим, что и коэффициент корреляции, и коэффициент
сходства легко могут быть представлены в виде меры различия.
Для этого достаточно соответствующим образом трансформировать
коэффициенты: r ′ = (1 − r ) или I ′ = (1 − I ) , где r’ – мера различия,
основанная на коэффициенте корреляции Пирсона, I’ – мера раз-
личия, основанная на коэффициенте сходства.
   Помимо вышеназванных коэффициентов существует ещё один
относительно широко распространенный тип мер связи - это меры
расстояния (Л1-норма, евклидово расстояние, расстояние Чебыше-
ва и др.). Применение мер расстояния для анализа фаунистиче-
ских данных (в широком смысле) подробно обсуждается в
[Песенко, 1982], там же приводятся формулы для их вычисления.

5.5. Вторичные матрицы и автоматическая классификация
   Структурный анализ многомерной совокупности (отражением
которой является первичная матрица) целесообразно начинать с
построения вторичных матриц. Вторичная матрица порядка m × m
представляет собой таблицу, в которой содержится m(m − 1) попар-
                                                                       2
ных оценок степени корреляции или сходства анализируемых объ-
ектов. В таблице 10 представлено две вторичных m × m матрицы,
вычисленные по данным таблицы 9.
   Из рассматриваемого примера хорошо видно, что использован-
ные показатели дают существенно различные результаты. По-
следнее закономерно вытекает из их математических свойств и, во
многом, определяет сферу их применения. Коэффициенты корре-
ляции, оценивая сопряженность варьирования объектов, как пра-
вило, вполне информативны в случае анализа структурированных
систем, в которых превалируют внутренние связи. Коэффициенты
сходства, определяя степень пересечения признаков, оценивают
                                              45

Заказать работу

Вы здесь

Количественный анализ биологических данных. Малков П.Ю. - 46 стр.

UptoLike

ВУЗ:

Малков П.Ю.

Математическая статистика

Страницы