Оценка надежности классифицирующих алгоритмов. Гуров С.И. - 16 стр.

UptoLike

Составители: 

{
b
¯p} {
b
¯p} v
m
k
(m m
k
)
m
2
(m 1)
, k = 1, v .
m
100%
p
k
= 0
Θ = (0, 1)
v
Θ Θ
x X
k
r
n
100% 25 6 n 6 200
n = 2000
n < 25
ˆp
w
= m
w
/m, ˆp
r
= ν = m
r
/m
b
¯p
W
Z
S
v1
(¯p)
W ( ¯p, ¯q)f( ¯p |m
1
, m
2
, . . . m
v
) d¯p = R(¯q) ,
b
¯p
W
= arg min
¯q S
v1
(¯x)
R(¯q) .
S
v1
(¯x) = {(x
1
, x
2
, . . . , x
v
) : x
k
> 0, k = 1, v;
P
v
k=1
x
k
= 1} (v 1)
R
v
ïîýòîìó íåñìåù¼ííîé ôóíêöèåé îöåíêè D{b̄
                                       p} äëÿ äèñïåðñèè D{b̄
                                                          p} áóäåò v -è÷íûé âåêòîð
ñ êîìïîíåíòàìè
                             mk (m − mk )
                                          , k = 1, v .
                              m2 (m − 1)
   Äëÿ íàøèõ öåëåé îòíîñèòåëüíûå ÷àñòîòû ìîãóò áûòü ïðèíÿòû â êà÷åñòâå òî÷å÷íûõ
îöåíîê èñêîìûõ âåðîÿòíîñòåé ëèøü â ñëó÷àÿõ áîëüøèõ m. Ýòî ñâÿçàíî ñ òåì, ÷òî â
óñëîâèÿõ ìàëîé âûáîðêè íå âûïîëíÿåòñÿ îñíîâíîå óñëîâèå ïðåäåëüíûõ òåîðåì òåîðèè
âåðîÿòíîñòåé  ñóùåñòâîâàíèå áîëüøîãî ÷èñëà ñëó÷àéíûõ ñîáûòèé. ¾Àñèìïòîòè÷åñêè
õîðîøèå îöåíêè ìîãóò îêàçàòüñÿ ìàëî ïîëåçíûìè äëÿ ïðèëîæåíèé, ïîñêîëüêó ÷èñëî
íàáëþäåíèé âñåãäà îãðàíè÷åíî¿ [24], ¾ïîýòîìó ïðè îöåíèâàíèè ïî êîíå÷íîìó ìàëîìó
÷èñëó íàáîðó äàííûõ àñèìïòîòè÷åñêèå õàðàêòåðèñòèêè ìîãóò ââåñòè â çàáëóæäåíèå¿ [54].
   Ñ äðóãîé ñòîðîíû, òî÷åíûå îöåíêè â âèäå îòíîñèòåëüíûõ ÷àñòîò â çàäà÷àõ
ðàñïîçíàâàíèÿ îáðàçîâ ÷àñòî ñòàíîâÿòñÿ íåïðèåìëåìûìè ñ òî÷êè çðåíèÿ îïûòà è
èíòóèöèè. Íàïðèìåð, êîððåêòíîå ðåøàþùåå ïðàâèëî ìû âûíóæäåíû îöåíèâàòü êàê 100%
áåçîøèáî÷íîå, ÷òî äàæå ïðè áîëüøèõ îáú¼ìàõ ïðåöåäåíòíîé èíôîðìàöèè ïðîòèâîðå÷èò
çäðàâîìó ñìûñëó.
   Îòìåòèì, ÷òî â ïîñëåäíåì ñëó÷àå ïîëó÷åííàÿ îöåíêà äîëæíà áûòü îòâåðãíóòà è
ïî ôîðìàëüíûì ñîîáðàæåíèÿì: çíà÷åíèå pk = 0 íå ïðèíàäëåæèò îáëàñòè èçìåíåíèÿ
ïàðàìåòðà Θ = (0, 1)v . Õîòÿ â áîëüøèíñòâå ñòàòèñòè÷åñêèõ ìîäåëåé îêàçûâàåòñÿ
ïðèåìëåìûì ðàññìàòðèâàòü âìåñòî îáëàñòè Θ åå çàìûêàíèå Θ, íî â íàøåì ñëó÷àå
âêëþ÷àòü â ðàññìîòðåíèå íåâîçìîæíûå èëè äîñòîâåðíûå ñîáûòèÿ âèäà x ∈ Xk íåò íèêàêèõ
îñíîâàíèé.
   Î÷åâèäíî òàêæå, ÷òî îöåíêè ïî ìàëîìó ÷èñëó ïðåöåäåíòîâ ïî ñâîåé ñóòè íå ìîãóò
îáëàäàòü áîëüøîé òî÷íîñòüþ. Äàííîå îáñòîÿòåëüñòâî, íàïðèìåð, îòðàæåíî â [21], ãäå
óêàçàíî, ÷òî ïðîöåíòíàÿ îòíîñèòåëüíàÿ ÷àñòîòà nr 100% ïðè 25 6 n 6 200 äîëæíà
çàïèñûâàòüñÿ áåç çíàêîâ ïîñëå çàïÿòîé (à íà÷èíàÿ ñ n = 2000  ñ äâóìÿ çíàêàìè ïîñëå
çàïÿòîé).  äàëüíåéøåì ìû áóäåì ïðèäåðæèâàòüñÿ äàííîãî ïðàâèëà (èç íåãî, â ÷àñòíîñòè,
ñëåäóåò, ÷òî ïðè n < 25 âûáîðêà ñ÷èòàåòñÿ ìàëîé18 ).

5.1.2 Îäíîìåðíûé ñëó÷àé
Òî÷å÷íûå îöåíêè äëÿ îäíîìåðíîãî ñëó÷àÿ ýëåìåíòàðíî ïîëó÷àþòñÿ èç ïîëó÷åííûõ âûøå
äëÿ ìíîãîìåðíîãî: p̂w = mw /m, p̂r = ν = mr /m.

5.2 Áàéåñîâñêèé ïîäõîä
Áàéåñîâñêèå òî÷å÷íûå îöåíêè b̄   pW ïîëó÷àþòñÿ êàê ðåøåíèÿ çàäà÷è ìèíèìèçàöèè
ôóíêöèîíàëà ñðåäíåãî ðèñêà çàïèñûâàåìîé êàê
                      Z
                         W ( p̄, q̄)f ( p̄ | m1 , m2 , . . . mv ) dp̄ = R(q̄) ,
                          Sv−1 (p̄)


                                      b̄
                                      pW = arg       min         R(q̄) .
                                                 q̄ ∈Sv−1 (x̄)

Çäåñü è äàëåå
                                                                       Pv
    Sv−1 (x̄) = {(x1 , x2 , . . . , xv ) : xk > 0, k = 1, v;              k=1   xk = 1}  (v − 1)-ìåðíûé
     ñèìïëåêñ â ïðîñòðàíñòâå Rv ;
 18 è   òîãäà òîëüêî îäíà öèôðà ÿâëÿåòñÿ çíà÷àùåé?