Diszkrimináns elemzés

A diszkriminancia analízis egy módszer a többváltozós eljárás a statisztikák , és arra szolgál, hogy különbséget a két vagy több csoport, amelyek leírása több (szintén változók). Ennek során ellenőrizheti a csoportok jellemzőinek jelentős különbségeit, és azonosíthatja a megfelelő vagy alkalmatlan jellemzőket. RA Fisher először 1936-ban írta le : Többszörös mérések alkalmazása taxonómiai problémákban .

A diszkrimináns elemzést a statisztikákban és a gépi tanulásban használják annak érdekében , hogy a térbeli transzformáció révén a jellemzőket jól ábrázolják, és osztályozóként ( diszkrimináns függvényként ) vagy dimenziócsökkentésként szolgál. A diszkrimináns elemzés kapcsolódik a főkomponens-elemzéshez (PCA), amelynek szintén jó reprezentációs lehetőséget kell találnia, de ezzel szemben figyelembe veszi az adatok osztálybeli hovatartozását.

Probléma

Olyan objektumokat tekintünk, amelyek mindegyike pontosan több hasonló osztály egyikébe tartozik. Ismert, hogy az egyes objektumok melyik osztályba tartoznak. Megfigyelik az egyes objektumok jellemzőit. Ezekből az információkból meg kell találni az osztályok közötti lineáris határokat annak érdekében, hogy később olyan objektumokat lehessen hozzárendelni, amelyek osztálytagsága ismeretlen az egyik osztály számára. A lineáris diszkrimináns elemzés tehát osztályozási módszer .

Példák:

  • A hitelfelvevők pl. B. hitelképesre és nem hitelképesre kell osztani. Amikor egy banki ügyfél hitelt igényel, a bank olyan jellemzők alapján próbálja meghatározni az ügyfél jövőbeni fizetőképességét és fizetési hajlandóságát, mint a jövedelemszint, a hitelkártyák száma, az utolsó munkahelyen töltött munkaviszony időtartama stb.
  • A szupermarketlánc vásárlói besorolhatók márka- és nem névvásárlók közé. Lehetséges jellemzők a teljes éves kiadás ezekben az üzletekben, a márkás termékek aránya a kiadásokban stb.

Legalább egy statisztikai, metrikusan méretezett jellemző figyelhető meg ezen az objektumon . Ezt a tulajdonságot véletlen változóként értelmezik a diszkrimináns elemzés modelljében . Legalább két különböző csoport létezik (populációk, általános populációk ). Az objektum ezen populációk egyikéből származik. Az objektumot egy hozzárendelési szabály, az osztályozási szabály segítségével hozzárendelik ezen alapcsoportok egyikéhez. Az osztályozási szabályt gyakran megkülönböztető függvény adhatja meg .

Osztályozás ismert eloszlási paraméterekkel

A jobb megértés érdekében az eljárást példákkal magyarázzák.

Maximális valószínűség módszer

A hozzárendelés egyik módszere a maximális valószínűség módszer: az objektum ahhoz a csoporthoz van hozzárendelve, amelynek a valószínűsége a legnagyobb.

Egy jellemző - két csoport - egyenlő eltérések

példa

Az óvodának lehetősége van olcsón megvásárolni egy bizonyos fajta szegfűszeg nagyszámú magját. Annak a gyanúnak a feloszlatása érdekében, hogy régi, egymásra borított magról van szó, csíratesztet hajtanak végre. Tehát elvet 1 g magot, és megszámolja, hány ilyen mag csírázik. Tapasztalatból ismert, hogy az 1 g magra jutó csírázó magok száma szinte normálisan oszlik meg . Friss magokkal (I. populáció) átlagosan 80 mag csírázik, a régiekkel (II. Populáció) csak 40 mag.

  • I. populáció: A csírázó friss magok száma eloszlik
  • II. Populáció: A csírázó régi magok száma eloszlik

A csíra minta most

megadás. A grafika azt mutatja, hogy ennél a mintánál az I populáció valószínűsége a legnagyobb. Tehát ezt a csíramintát frissnek minősíti.

A maximális valószínűség módszer

A grafikon azt mutatja, hogy osztályozási szabályként ( döntési szabályként ) is megadhatja:

Rendelje az objektumot az I populációhoz, ha a várható értéktől a legkisebb a távolság , vagy ha
van.

Az eloszlási sűrűségek metszéspontja (at ) tehát megfelel a döntési határnak.

A jellemzők kívánatos eloszlási tulajdonságai

Ugyanazok a szórások

A két csoport jellemzőinek azonos szórással kell rendelkezniük . Különböző eltérésekkel több hozzárendelési lehetőség létezik.

Különböző csoportvariációk

A fenti grafikonon két különböző eltérésű csoport látható. A lapos normális eloszlás nagyobb szórással rendelkezik, mint a keskeny, magas. Látható, hogy az I. csoport varianciája „miként ássa alá” a II. Csoport normális eloszlását. Ha például a minta eredménye lenne, a magokat frissnek kellene minősíteni, mivel az I. csoport valószínűségi sűrűsége nagyobb, mint a II.

A diszkriminanciaanalízis „standard modelljében” ugyanazokat a varianciákat és kovarianciákat feltételezzük.

Nagy csoportok közötti eltérés

A változás között a csoport átlagértékek , a csoportközi variancia , nagynak kell lennie, mert akkor az eloszlások nem keveredik: a szétválasztás a csoportok élesebb.

Rosszabb: Kis eltérés a csoportok között Jobb: Nagy eltérés a csoportok között
Rosszabb: Kis eltérés a csoportok között Jobb: Nagy eltérés a csoportok között
Kis csoporton belüli variancia

A variancia belül egy csoport, az intra- csoport variancia , legkisebbnek kell lennie, amennyire csak lehetséges, akkor az eloszlások nem keverjük össze, az elválasztás jobb.

Rosszabb: Nagy eltérés egy csoportban Jobb: Kis szórás egy csoportban
Rosszabb: Nagy eltérés egy csoportban Jobb: Kis szórás egy csoportban

Több funkció - két csoport - ugyanazok a kovariancia mátrixok

Az érdeklődés tárgyának számos megfigyelhető vonása lehet . Itt véletlenszerű vektort kapunk mint modelleloszlás-struktúrát . Ez a vektor eloszlik a várható értékvektorral és a kovariancia mátrixszal . A konkrét megvalósítás a jellemzővektor , amelynek összetevői tartalmazzák az egyes jellemzőket .

Abban az esetben, két csoport, analóg módon a fenti, a megfigyelt objektum van hozzárendelve a csoport, amelyben az közötti távolság a jellemző vektor , és a várható érték vektor minimális. A Mahalanobis távolságot itt használjuk, részben átalakítva, a távolság méréseként .

példa

Egy nagy vidámparkban meghatározzák a látogatók költekezési szokásait. Különösen az érdekli őket, hogy a látogatók egy park tulajdonában lévő szállodában töltik-e az éjszakát. Minden család teljes költségei (jellemző ) és az ajándéktárgyak költségei (jellegzetes ) 16 óráig tartanak. A marketing menedzsment sok éves tapasztalat alapján tudja, hogy a megfelelő véletlen változók és együttesen megközelítőleg normálisan vannak elosztva a 25 [ 2 ] és a kovariancia [ 2 ] varianciákkal . A szállodai foglalások tekintetében a fogyasztókat költési magatartásuk alapján két I. és II. Csoportba sorolhatjuk, hogy az ismert megoszlási paraméterek a következő táblázatban szerepeljenek:

csoport Teljes kiadás Emléktárgyak kiadása
Várható érték Várható érték Varianciák és
Szállodafoglaló I 70 40 25-én
Nincs szállodafoglaló II 60 20 25-én

Az I. csoportnál a véletlenszerű vektor többváltozós, normálisan eloszlatva a várt értékvektorral

és a kovariancia mátrix

Ugyanez vonatkozik a II. Csoportra is.

A két csoport populációit az alábbi ábra sűrű pontfelhőként jelöli. Az ajándéktárgyakra fordított kiadásokat luxuskiadásoknak nevezik. A rózsaszínű pont az első csoport várható értékét jelenti, a világoskék a II.

A fogyasztók két csoportja

Egy másik család meglátogatta a vidámparkot. Összesen 65 eurót költött 16 óráig és 35 eurót ajándéktárgyakra (zöld pont a grafikán). Készen állna egy szállodai szobára ennek a családnak?

Egy pillantás a grafikára már azt sugallja, hogy a zöld pont és az I. csoport várható értékvektora közötti távolság minimális. Ezért a szálloda vezetése gyanítja, hogy a család szobát fog venni.

A Mahalanobis távolságra

A funkció vektor , hogy a központ I. csoport számítjuk

és a II. csoport központjáig

Több funkció - több csoport - ugyanazok a kovariancia mátrixok

Az elemzés több mint két populáción alapulhat. Itt is, a fentihez hasonlóan, az objektumot hozzárendelik ahhoz a populációhoz, amelyben a jellemző vektor Mahalanobis távolsága a várt értékvektortól minimális.

(Halász) diszkriminatív funkciója

A gyakorlatban nehéz besorolni a Mahalanobis-távolságot minden osztályozandó tulajdonságra. A hozzárendelés lineáris diszkrimináns függvény segítségével könnyebb . A döntési szabály alapján

"Rendelje hozzá az objektumot az I. csoporthoz, ha az objektum és az I. csoport közötti távolság kisebb":

Ezen egyenlőtlenség átalakításával a döntési szabály a diszkrimináns függvény segítségével jön létre :

"Az objektum hozzárendelése az I. csoporthoz, ha az alábbiak érvényesek":
.

A diszkrimináns függvényt két csoport és ugyanazok a kovarianciamátrixok esetében számoljuk ki, mint

A diszkrimináns függvény empirikus megközelítésként is eredményez, ha valaki maximalizálja a csoportok közötti varianciát és minimalizálja a csoportokon belüli varianciát. Ezt a megközelítést Fisher diszkriminatív funkciójának hívják, mert RA Fisher vezette be 1936-ban.

Bayesi diszkrimináns elemzés

Eddig azt a feltételezést tették, hogy a populáció csoportjai azonos méretűek. De ez nem szokás. A csoporthoz való tartozás véletlenszerűnek is tekinthető. Azt a valószínűséget, amellyel egy objektum egy csoporthoz tartozik, a priori valószínűségnek nevezzük . Abban az esetben, csoportok, a lineáris diszkrimináns szabály azon a feltételezésen alapul, hogy a csoport egy többváltozós normális eloszlást egy várható érték és kovariancia mátrix , ami ugyanaz, minden csoportban, vagyis a H. . Ezután a lineáris diszkrimináns elemzésre (LDA) vonatkozó Bayes-szabály olvasható

ahol azt a költséget jelöli, amely akkor merül fel, ha az i csoporthoz tartozó objektumot tévesen hozzárendelik a j csoporthoz.

Ha nem feltételezzük a fenti modellben, hogy a kovarianciamátrixok a csoportokban azonosak, de eltérhetnek, azaz H. , ez Bayes szabálya a másodfokú diszkrimináns elemzéshez (QDA)

A lineáris diszkrimináns elemzéskor a határértékek lineárisak , a másodfokú másodfokúak.

Lásd még: Bayesi osztályozó

Besorolás ismeretlen eloszlási paraméterekre

A mögöttes jellemzők eloszlása ​​legtöbbször ismeretlen lesz. Tehát értékelni kell. Mindkét csoportból úgynevezett tanulási mintát veszünk, amennyiben ill . Ezzel az információval becsülték a várható értékvektorokat és a kovarianciamátrixot . A fenti esethez hasonlóan a Mahalanobis-távolságot vagy a diszkrimináns függvényt alkalmazzuk, a valós paraméterek helyett becsült értékkel.

Feltételezve, hogy a standard modell csoportszerű kovariancia mátrixokkal rendelkezik, a kovariancia mátrixok egyenlőségét először Box M tesztjének segítségével kell megerősíteni .

példa

Vidámparki példa felülről:

A lakosság ma ismeretlen. Minden csoport 16 családját vizsgálták meg alaposabban. Az alábbi értékek eredményezték a mintát:

Családok kiadásai egy vidámparkban
1. csoport 2. csoport
teljes Ajándéktárgyak csoport teljes Ajándéktárgyak csoport
64,78 37.08 1 54,78 17.08 2
67.12 38.44 1 57.12 18.44 2
71.58 44.08 1 61.58 24.08 2
63.66 37.40 1 53.66 17.40 2
53.80 19.00 1 43.80 7.99 2
73.21 41.17 1 63.21 29.10 2
63,95 31.40 1 53,95 11.40 2
78.33 45,92 1 68.33 34.98 2
72.36 38.09 1 62.36 18.09 2
64.51 34.10 1 54.51 14.10 2
66.11 34.97 1 56.11 14,97 2
66.97 36.90 1 56.97 16.90 2
69,72 41.24 1 59,72 21.24 2
64.47 33.81 1 54.47 13.81 2
72,60 19.05 1 62,60 30.02 2
72.69 39.88 1 62.69 19.88 2

Az egyes csoportok átlagát, a teljes átlagot, a kovariancia mátrixokat és az egyesített (összesített) kovarianciát a következőképpen számoltuk:

változó Összevont átlag Azt jelenti
1. csoport 2. csoport
teljes 62.867 67.867 57.867
ajándéktárgy 27,562 35.783 19,342
Összevont kovariancia mátrix
teljes ajándéktárgy
teljes 32.59
ajándéktárgy 30.58 54.01
Kovariancia mátrix az 1. csoport számára
teljes ajándéktárgy
teljes 32.59
ajándéktárgy 25.34 56.90
Kovariancia mátrix a 2. csoport számára
teljes ajándéktárgy
teljes 32.59
ajándéktárgy 35.82 51.11

Ebből kapjuk meg a fenti képlet alapján a diszkrimináns függvényt

.

A besorolási szabály most:

Rendelje az objektumot az I. csoporthoz, ha
van.

A minta értékei osztályozhatók a modell minőségének ellenőrzése érdekében. Az osztályozási mátrix itt adódik

csoport Helyesen van hozzárendelve helytelenül van hozzárendelve
ÉN. 14-én 2
II 13. 3

Most újra meg kell rendezni a megfigyeléssel rendelkező családot .

Az alábbi ábra a tanulási minta szórási diagramját mutatja a csoportos eszközökkel. A zöld pont az objektum helye .

Grafika a DA példához: Ismeretlen paraméterek

A grafika már mutatja, hogy ez az objektum az I. csoporthoz tartozik. A diszkrimináns függvény megadja

Ott

az objektum az I. csoporthoz van hozzárendelve.

További kulcsszavak

irodalom

  • Maurice M. Tatsuoka: Többváltozós elemzés: technikák az oktatási és pszichológiai kutatáshoz. John Wiley & Sons, Inc., New York, 1971, ISBN 0-471-84590-6
  • KV Mardia, JT Kent, JM Bibby: Többváltozós elemzés . New York, 1979
  • Ludwig Fahrmeir, Alfred Hamerle, Gerhard Tutz (szerk.): Többváltozós statisztikai módszerek . New York, 1996
  • Joachim Hartung , Bärbel Elpelt: Többváltozós statisztika . München, Bécs, 1999
  • Backhaus, Klaus; Erichson, Bernd; Plinke, Wulff és mtsai: Többváltozós elemzési módszerek.

web Linkek

Egyéni bizonyíték

  1. Klaus Backhaus, SpringerLink (online szolgáltatás): Többváltozós elemzési módszerek alkalmazásorientált bevezetés . Springer, Berlin 2006, ISBN 978-3-540-29932-5 .
  2. RA Fisher (1936), Többféle mérés alkalmazása taxonómiai problémákban , Annals Eugen., 7. kötet, 179–188., Doi : 10.1111 / j.1469-1809.1936.tb02137.x