Оценка надежности классифицирующих алгоритмов. Гуров С.И. - 9 стр.

UptoLike

Составители: 

f(x) F
F F
F (τ) τ
F
F
Z
F
F
F
f
min
Z F = {f
min
} |F | = 1
l
l
l
η
F ν
l
(A)
A P (A)
P {|P (A) ν
l
(A) | > ε } < 2e
2ε
2
l
l
âåðîÿòíîñòåé, ÷òî ÿâëÿåòñÿ áåçóñëîâíûì å¼ äîñòîèíñòâîì.
   Èñïîëüçóÿ òó èëè èíóþ òåîðèþ äëÿ ðåøåíèÿ ÷àñòíîé çàäà÷è ìû âûíóæäåíû
ïðèíèìàòü, ñîîòâåòñòâóþùèì îáðàçîì àäàïòèðóÿ, ïðåäïîëîæåíèÿ, íà êîòîðûõ ýòà òåîðèÿ
áàçèðóåòñÿ. Äëÿ íàøåé çàäà÷è îöåíêè íàäåæíîñòè ð.ï. ýòè ïðåäïîëîæåíèÿ òåîðèè VC
ñóòü:
VC-1. Ãèïîòåçà 1.
VC-2. Êëàññèôèêàòîð f (x) âûáèðàåòñÿ èç ôèêñèðîâàííîãî çàðàíåå ñåìåéñòâà ð.ï. F .
Ñåìåéñòâî F , çàäà¼ò ïîäìíîæåñòâî F ∗ (îáû÷íî ÿâëÿåòñÿ ïàðàìåòðè÷åñêèì è çàïèñûâàåòñÿ
â âèäå F (τ ), ãäå τ âåêòîð ïàðàìåòðîâ). Äëÿ ïîëó÷åíèÿ îöåíîê â òåîðèè VC òðåáóåòñÿ
òàêæå âû÷èñëÿòü ìåðó ðàçíîîáðàçèÿ ïðàâèë, ñîñòàâëÿþùèõ êëàññ F  åãî ¼ìêîñòü.
 ñëó÷àå êîíå÷íîñòè ñåìåéñòâà F ðîëü ¼ìêîñòè èãðàåò åãî ìîùíîñòü.
    Ïðåäñòàâëÿåòñÿ ÿñíûì, ÷òî åñëè èñïîëüçîâàíèå ÃÏ â ôîðìå ¾Ãèïîòåçà 1¿ íå
ìîæåò âûçâàòü ñåðü¼çíûõ âîçðàæåíèé, òî ïðèíÿòèå óñëîâèÿ VC-2 ïðè ðåøåíèè çàäà÷è
ðàñïîçíàâàíèÿ Z äàëåêî íå âñåãäà ÿâëÿåòñÿ îïðàâäàííûì. Ýòî óñëîâèå èìååò ìåñòî,
íàïðèìåð, â ñëó÷àå êîíå÷íîãî ïðèçíàêîâîãî ïðîñòðàíñòâà, ãäå ñåìåéñòâî ð.ï. F âñåãäà
ÿâíî îïðåäåëåíî è êîíå÷íî. Îäíàêî è â ýòèõ ñëó÷àÿõ, êîãäà êëàññ F çàôèêñèðîâàí
ïåðåä ðåøåíèåì çàäà÷è, ÷àñòî íå óäà¼òñÿ âû÷èñëèòü åãî ¼ìêîñòü, ïîñêîëüêó íàõîæäåíèå
å¼ ¾ñâîäèòñÿ ê ãðîìîçäêèì êîìáèíàòîðíûì âû÷èñëåíèÿì, êîòîðûå íå âñåãäà ìîæíî
ïðîâåñòè¿ [32]. Èìååòñÿ òàêæå áîëüøîå ÷èñëî ìåòîäîâ êëàññèôèêàöèè ñ êîíòèíóàëüíûìè
ïðèçíàêàìè (íàïðèìåð, ìåòîä ïîòåíöèàëüíûõ ôóíêöèé â ìàøèííîé ðåàëèçàöèè
[1] èëè àëãåáðàè÷åñêèé ïîäõîä ê ïîñòðîåíèþ êîððåêòíûõ ðàñïîçíàþùèõ àëãîðèòìîâ
[20], [19]), êîãäà êëàññèôèêàòîð êîíñòðóèðóåòñÿ íåïîñðåäñòâåííî â ïðîöåññå ðåøåíèÿ
çàäà÷è è ñåìåéñòâî F çàðàíåå íå ôèêñèðóåòñÿ. Áîëåå òîãî, âñåãäà ìîæíî ñíà÷àëà
îïðåäåëèòü îïòèìàëüíûé â ñìûñëå ìèíèìóìà (2) êëàññèôèêàòîð fmin , à çàòåì çàíîâî
ôîðìàëüíî ðåøèòü çàäà÷ó Z , ïîëàãàÿ F = {fmin } è |F | = 1. Ýòî ñòàâèò ïîä âîïðîñ
ïðèìåíèìîñòü íàèáîëåå èíòåðåñíûõ ðåçóëüòàòîâ òåîðèè VC ê íàøåé çàäà÷å. Êðîìå
òîãî, îöåíêè ïîëó÷åííûå àâòîðàìè òåîðèè [12], [13] â ïîäàâëÿþùåì ÷èñëå ñëó÷àåâ,
ê ñîæàëåíèþ, îêàçûâàþòñÿ íåïðèãîäíûìè äëÿ ïðÿìîãî èñïîëüçîâàíèÿ íà ïðàêòèêå:
çíà÷åíèÿ íàäåæíîñòè ð.ï. ïðè èìåþùèõñÿ îáú¼ìàõ l âûáîðîê ïîëó÷àþòñÿ êðàéíå íèçêèìè
è äëÿ ïîëó÷åíèÿ îöåíîê òðåáóåìîé òî÷íîñòè è äîñòîâåðíîñòè íåîáõîäèìû âåëè÷èíû l
â äåñÿòêè è ñîòíè ðàç ïðåâûøàþùèå äëèíó âûáîðîê, ñ êîòîðûìè îáû÷íî ïðèõîäèòñÿ
èìåòü äåëî. Ìåæäó òåì, îïûò óñïåøíîãî ðåøåíèÿ ñàìûõ ðàçíûõ çàäà÷ ðàñïîçíàâàíèÿ
ñâèäåòåëüñòâóåò î òîì, ÷òî ýòè îöåíêè òðåáóåìûõ äëèí l ñèëüíî çàâûøåíû (à äëÿ
êîýôôèöèåíòà äîâåðèÿ η , ñîîòâåòñòâåííî, çàíèæåíû). Îäíîé èç ïðè÷èí ýòîãî ÿâëÿåòñÿ
íåÿâíîå ïðåäïîëîæåíèå, ÷òî ïðåäúÿâëÿåìîå äëÿ îöåíêè ð.ï. âûáðàíî ñëó÷àéíî èç
ìíîæåñòâà F . Êàê ñëåäñòâèå, äëÿ îöåíêè âåðîÿòíîñòè îòêëîíåíèÿ ÷àñòîòû νl (A) ñîáûòèÿ
A îò åãî âåðîÿòíîñòè P (A) èñïîëüçóþòñÿ îöåíêà Õ¼ôäèíãà [63]
                                                                 2l
                              P { | P (A) − νl (A) | > ε } < 2e−2ε
èëè íåñêîëüêî áîëåå ãðóáàÿ îöåíêà Áåðíøòåéíà, êîòîðûå íå ìîãóò áûòü ðàäèêàëüíî
óñèëåíû. Îáîáùàÿ ñêàçàííîå íåîáõîäèìî ïðèçíàòü, ÷òî äàæå ïðè ïðèíÿòèè óñëîâèÿ
(VC-2) âîïðîñ îáîñíîâàíèÿ êà÷åñòâà àëãîðèòìà ðàñïîçíàâàíèÿ äëÿ íåáîëüøèõ çíà÷åíèé
l îñòà¼òñÿ, îòêðûòûì, à èìåííî ýòîò ñëó÷àé è ïðåäñòàâëÿþò íàèáîëüøèé ïðèêëàäíîé
èíòåðåñ.
   Â ïîñëåäíåå âðåìÿ ([40], [32], [4], [5]10 ) ðàçâèâàåòñÿ áàéåñîâñêèé ïîäõîä ê îöåíêå
êà÷åñòâà ð.ï. (ñì. íèæå ï. 4).  åãî îñíîâå ëåæèò ïðåäïîëîæåíèå, ÷òî èñêîìûé ïàðàìåòð
 10 Äâåïîñëåäíèå ðàáîòû íàèáîëåå áëèçêè ê íàøåé. Çàìåòèì, ÷òî âíà÷àëå ôîðìóëû äëÿ òî÷å÷íîé îöåíêè
âåðîÿòíîñòè îøèáêè ïîëó÷åíû çäåñü áåç ïðèâëå÷åíèÿ óñëîâèÿ VC-1.