Оценка надежности классифицирующих алгоритмов. Гуров С.И. - 4 стр.

UptoLike

Составители: 

{f
(x
i
)}
L
i=1
=
¯
f
(¯x
L
) ¯x
L
f
y Y
f : X Y
x
f(x) f
f(x)
x X
f(x) = f
(x)
ν x X
ν
©
γ
i
= γ(x
i
)
ª
L
i=1
= ¯γ
L
¯x
L
ν
{f
(x
i
)}, f (x
i
)} γ(x
i
) x
1
, x
2
, . . . , x
m
X
X
{f ∗ (xi )}Li=1 = f¯∗ (x̄L ) â òî÷êàõ x̄L . Ôóíêöèÿ f ∗ íàçûâàåòñÿ èñòèííûì êëàññèôèêàòîðîì.
Çàìåòèì, ÷òî y ∈ Y ÿâëÿåòñÿ íîìèíàëüíîé ïåðåìåííîé.
     Ðàññìàòðèâàåòñÿ çàäà÷à êëàññèôèêàöèè ñ íåïåðåñåêàþùèìèñÿ êëàññàìè â
äåòåðìèíèðîâàííîé ïîñòàíîâêå. Êëàññèôèêàòîðîì èëè ðåøàþùèì ïðàâèëîì (ð.ï.)
íàçûâàåòñÿ ëþáàÿ ôóíêöèÿ f : X → Y (õîòÿ íà êëàññ òàêèõ ôóíêöèé íà ïðàêòèêå
íàêëàäûâàþòñÿ òå èëè èíûå îãðàíè÷åíèÿ). Êëàññèôèêàöèÿ îáðàçà x ñîñòîèò â âû÷èñëåíèè
çíà÷åíèÿ f (x). Ìû íå áóäåì ðàçëè÷àòü ôóíêöèþ f è ðåàëèçóþùèé åå àëãîðèòì.
     Ïðè ðåøåíèè çàäà÷ ðàñïîçíàâàíèÿ îáðàçîâ òðåáóåòñÿ ïîñòðîèòü îïòèìàëüíûé â
íåêîòîðîì ñìûñëå êëàññèôèêàòîð f (x), à èìåííî òàêîé, ÷òîáû ïðè ïðåäúÿâëåíèè
ýëåìåíòîâ x èç X â ïðîöåññå êëàññèôèêàöèè íà ïðàêòèêå ðàâåíñòâî

                                         f (x) = f ∗ (x)

(ïðàâèëüíàÿ êëàññèôèêàöèÿ), âûïîëíÿëîñü êàê ìîæíî ÷àùå. Êîëè÷åñòâåííî îöåí¼ííàÿ
ñòåïåíü óâåðåííîñòè ν â ñïðàâåäëèâîñòè äàííîãî ðàâåíñòâà äëÿ ïðîèçâîëüíîãî x ∈ X
íàçûâàåòñÿ íàäåæíîñòüþ êëàññèôèêàöèè. Çàäà÷à îöåíêè íàäåæíîñòè ð.ï. è ñîñòîèò â
îïðåäåëåíèè ν .
   Íà ïðàêòèêå ÷àñòî âñòðå÷àåòñÿ ñèòóàöèÿ, êîãäà äëÿ îöåíêè íàäåæíîñòè ð.ï. â
ðàñïîðÿæåíèè ðàçðàáîò÷èêà èìåþòñÿ ëèøü íàáîðû çíà÷åíèé íà ïðåöåäåíòàõ èñòèííîãî
è ïîñòðîåííîãî êëàññèôèêàòîðîâ è, âîçìîæíî, íåêîòîðàÿ äîïîëíèòåëüíàÿ èíôîðìàöèÿ î
¾âàæíîñòè¿ ñàìèõ ïðåöåäåíòîâ.
   Âàæíîñòü ïðåöåäåíòîâ, ó÷èòûâàþùàÿ èõ çíà÷èìîñòü ñ òî÷êè çðåíèÿ ïîòåðü ïðè
îøèáî÷íîé èõ êëàññèôèêàöèè è/èëè îòðàæàþùàÿ ÷àñòîòó âñòðå÷àåìîñòè àíàëîãè÷íûõ
îáðàçîâ íà ïðàêòèêå îïèñûâàåòñÿ, êàê ïðàâèëî, â âèäå íåîòðèöàòåëüíûõ âåñîâ. Âåêòîð
       ©             ªL
âåñîâ γi = γ(xi ) i=1 = γ̄L ïðåöåäåíòîâ x̄L ìû áóäåì âêëþ÷àòü â ïîíÿòèå
ïðåöåäåíòíîé èíôîðìàöèè âìåñòå ñ ñàìèìè ïðåöåäåíòàìè è óêàçàííûìè íàáîðàìè
çíà÷åíèé êëàññèôèêàòîðà íà íèõ.
   ×àñòî çàêàç÷èêó íåîáõîäèìî èìåòü îáîñíîâàííóþ îöåíêó íàäåæíîñòè ïîëó÷åííîãî
àëãîðèòìà êëàññèôèêàöèè â óñëîâèÿõ íàëè÷èÿ ëèøü äàííîé ïðåöåäåíòíîé èíôîðìàöèè
è íåâîçìîæíîñòè íè å¼ ïîïîëíåíèÿ, íè îðãàíèçàöèè ïðîâåðêè â õîäå ïðàêòè÷åñêîãî
ïðîâåäåíèÿ ïðîöåññà êëàññèôèêàöèè3 .  ýòèõ ñëó÷àÿõ îöåíèâàòü âåëè÷èíó ν ïðèõîäèòüñÿ
ëèøü ïî çíà÷åíèÿì ôóíêöèé {f ∗ (xi )}, f (xi )} è âåñîâ γ(xi ) ïðåöåäåíòîâ x1 , x2 , . . . , xm ,
âõîäÿùèõ â ýêçàìåíàöèîííóþ ïîñëåäîâàòåëüíîñòü. ßñíî, ÷òî òàêàÿ îöåíêà áóäåò
àäåêâàòíîé â òîé èëè èíîé ñòåïåíè, åñëè ñîñòàâ ýêçàìåíàöèîííîé âûáîðêè áóäåò îòðàæàòü
õàðàêòåð ïîÿâëåíèÿ íîâûõ ïðåäúÿâëÿåìûõ äëÿ êëàññèôèêàöèè îáðàçîâ ïðè ïðàêòè÷åñêîì
ïðèìåíåíèè àëãîðèòìà êëàññèôèêàöèè. Çäåñü èìååòñÿ â âèäó, ÷òî îáðàçû èç îäíèõ
ïîäîáëàñòåé X ìîãóò âñòðå÷àòüñÿ ÷àùå, ÷åì èç äðóãèõ, è ñîñòàâ íàáîðà ïðåöåäåíòîâ
äîëæåí îòðàæàòü ýòîò ôàêò.
   Óêàçàííîå    ïðåäïîëîæåíèå      î   ñâîéñòâàõ     îáó÷àþùåé      è    ýêçàìåíàöèîííîé
ïîñëåäîâàòåëüíîñòåé íàçîâåì ãèïîòåçîé ïðåäñòàâèòåëüíîñòè (ÃÏ). Òî÷íåå, ïîä
ÃÏ ìû áóäåì ïîíèìàòü ïðåäïîëîæåíèå î òîì, ÷òî ïðåöåäåíòíàÿ èíôîðìàöèÿ îòðàæàåò
ñâîéñòâà ïðîñòðàíñòâà îáðàçîâ, ñâÿçàííûå ñ îïðåäåë¼ííûì ðàñïðåäåëåíèåì ïîÿâëÿþùèõñÿ
îáðàçîâ ïî ðàçëè÷íûì ïîäîáëàñòÿì X â ïðîöåññå êëàññèôèêàöèè íà ïðàêòèêå.
   Ãèïîòåçà ïðåäñòàâèòåëüíîñòè, ïðèíÿòàÿ â òîé èëè èíîé ôîðìå â ðàìêàõ êîíêðåòíîé
çàäà÷è, âìåñòå ñ ãèïîòåçîé êîìïàêòíîñòè (ÃÊ)4 ÿâëÿåòñÿ îïðåäåëÿþùèì ôàêòîðîì ïðè
  3 Íàïðèìåð,  êîãäà ïîëó÷åíèå íîâîãî ïðåöåäåíòà ñâÿçàíî ñ ïðîâåäåíèåì äîðîãîñòîÿùåãî èññëåäîâàíèÿ
èëè íåâîçìîæíî ïðèíöèïèàëüíî (ðàñïîçíàâàíèå è ïðîãíîçèðîâàíèå ýêîíîìè÷åñêèõ, ñîöèàëüíûõ
ïðîöåññîâ, â ìåäèöèíå, ïîëèòèêå, âîåííîì äåëå è ò.ä.).
  4 ¾Îáðàçàì ñîîòâåòñòâóþò êîìïàêòíûå ìíîæåñòâà â ïðîñòðàíñòâå âûáðàííûõ ñâîéñòâ¿ [1]. Ïî ìíåíèþ