Feltáró adatok elemzése
A feltáró adatelemzés (EDA), illetve a feltáró statisztika egyik ága a statisztika . Megvizsgálja és értékeli azokat az adatokat , amelyek kapcsolatairól kevés ismeret áll rendelkezésre. Számos EDA technikát alkalmaznak az adatbányászatban . Statisztikai tanfolyamokon gyakran tanítják őket a statisztikai gondolkodás bevezetéseként.
Ezt a megjelölést John W. Tukey vezette be az 1970-es években. Tukey rámutatott, hogy a statisztikákban túl nagy hangsúlyt fektetnek az adott hipotézisek értékelésére és tesztelésére . Javasolta továbbá az adatok felhasználását a lehetséges hipotézisek megszerzéséhez, amelyeket aztán tesztelnek. Valójában a fogalmak összekeverése a két elemzési típus között, és ugyanazon adatmennyiségre való alkalmazásuk torzítást eredményezhet.
céljait
A feltáró statisztikák céljai:
- Feltételezések (hipotézisek) megfogalmazása a megfigyelt adatok okáról és okáról
- Felmérje a statisztikai következtetések alapjául szolgáló feltételezéseket
- A megfelelő statisztikai eszközök és technikák kiválasztásának támogatása
- Alapot biztosítani a további adatgyűjtésekhez felmérések vagy statisztikai teszttervezés útján
Eljárás
A feltáró statisztikákban alkalmazott alapvető grafikus módszerek a következők:
Az alapvető kvantitatív módszerek a következők:
Különleges eljárások
szoftver
- GeoDa - Ingyenes, felhasználóbarát grafikus felület a feltáró adatelemzés különféle módszereinek alkalmazásához
- Ggobi - Ingyenes interaktív többváltozós vizualizációs szoftver az R linkjével .
- LiveGraph - Nyílt forráskódú keretrendszer az adatok vizualizálásához és a feltáró adatelemzéshez (valós idejű grafikon plottert tartalmaz).
- MANET - Ingyenes Mac Interactive EDA szoftver.
- Mondrian - Ingyenes interaktív szoftver az EDA számára.
- Orange ( Memento 2011. január 10-től az Internet Archívumban ) - Ingyenes komponensalapú szoftver interaktív EDA számára.
- PS Explore
- Visalix - Ingyenes interaktív webalkalmazás adatmegjelenítéshez és feltáró adatelemzéshez.
- openAnalyzer - adatelemző szoftver modulokkal a feltáró adatelemzéshez (ingyenes az egyetemek és a hallgatók számára; az ingyenes verzió 5000 adatkészletre korlátozódik).
- DataLab - a teljes verzió ingyenes kutatási licencként , az ingyenes kiértékelési verzió az adatmátrix méretében korlátozott
- Fathom 2 (dinamikus sztochasztika és adatelemző szoftver) - ingyenes teljes verzió 2018 óta.
irodalom
- Irodalom a feltáró adatok elemzéséről a Német Nemzeti Könyvtár katalógusában
- Hoaglin, DC; Mosteller, F & Tukey, JW (Eds) (1985) Adattáblák, trendek és alakzatok feltárása ISBN 0-471-09776-4
- Hoaglin, DC; Mosteller, F & Tukey, JW (Eds) (1983) A robusztus és feltáró adatelemzés megértése ISBN 0-471-09777-2
- Tukey, JW (1977) Feltáró adatok elemzése ISBN 0-201-07616-0
- Velleman, PF & Hoaglin, DC (1981) Alkalmazások, a feltáró adatok elemzésének alapjai és számítása ISBN 0-87150-409-X
- Wolfgang Polasek: EDA feltáró adatok elemzése. Bevezetés a leíró statisztikákba (2. kiadás). Springer-Verlag, Berlin 1994, ISBN 978-3-540-58394-3
- Siegfried Heiler, Paul Michels: Leíró és feltáró adatok elemzése. Oldenbourg, München 1994, ISBN 3-486-22786-6