dbo:abstract
|
- Egy kettős hipotézisteszt statisztikai ereje nem más, mint az a valószínűség, hogy a teszt helyesen veti el a nullhipotézist, amikor az alternatív hipotézis igaz. A statisztikai erő értéke 0-tól egyig bármennyi lehet, és ahogy az erő emelkedik, úgy csökken a kettes típusú hiba (a nullhipotézis helytelen elvetése) elkövetésének valószínűsége. Ha a kettes típusú hiba elkövetésének valószínűsége β, akkor a hozzá tartozó statisztikai erő 1 – β. Például, ha A kísérletnek a statisztikai ereje 0,7, B kísérletnek pedig 0,95, akkor az A kísérletben magasabb a valószínűsége a kettes típusú hiba elkövetésének, mint B kísérletben, illetve emiatt B kísérlet magasabb reliabilitással is rendelkezik. Úgy is gondolhatunk a statisztikai erőre, mint annak a valószínűségére, hogy elfogadjuk az alternatív hipotézist, amikor az igaz – tehát az eljárás arra való képessége, hogy felismerjen egy hatást, ha az adott hatás valóban létezik. Formálisan megfogalmazva: Statisztikai erő = P(H0 elutasítása | H1 igaz). Amennyiben a H1 csak a H0 tagadása, például: H0 : x = 0, ahol x egy meg nem figyelt paramétere a populációnak, H1 pedig x <> 0, az erő nem kiszámolható, csak ha a valószínűségek ismertek minden lehetséges értékére, amit x paraméter felvehet. Emiatt amikor statisztikai erőről beszélünk, fontos kiemelni, hogy milyen alternatív hipotézis mellett beszélünk róla. Az úgynevezett erő elemzés használható arra, hogy meghatározzuk, a keresett méretű hatást milyen elemszám mellett találjuk meg megfelelő valószínűséggel. Például: „Hányszor kell feldobnom egy érmét, hogy levonhassam a következtetést, hogy cinkelt-e, avagy sem, ha feltesszük, hogy a cinkel érme az esetek 70%-ban fejet mutat?” Az erő elemzés arra is használható, hogy kiszámoljuk a legkisebb hatásméretet, amit még valószínűsíthetőleg (adott statisztikai erővel) felfedezünk egy adott elemszám mellett. Ezek mellett az erő arra is használatos, hogy összehasonlításokat végezzen az ember különböző statisztikai módszerek próbáinak eredményei között, például egy parametrikus és egy nonparametrikus teszt között, melyek ugyanazt a hipotézist tesztelik. (hu)
- Egy kettős hipotézisteszt statisztikai ereje nem más, mint az a valószínűség, hogy a teszt helyesen veti el a nullhipotézist, amikor az alternatív hipotézis igaz. A statisztikai erő értéke 0-tól egyig bármennyi lehet, és ahogy az erő emelkedik, úgy csökken a kettes típusú hiba (a nullhipotézis helytelen elvetése) elkövetésének valószínűsége. Ha a kettes típusú hiba elkövetésének valószínűsége β, akkor a hozzá tartozó statisztikai erő 1 – β. Például, ha A kísérletnek a statisztikai ereje 0,7, B kísérletnek pedig 0,95, akkor az A kísérletben magasabb a valószínűsége a kettes típusú hiba elkövetésének, mint B kísérletben, illetve emiatt B kísérlet magasabb reliabilitással is rendelkezik. Úgy is gondolhatunk a statisztikai erőre, mint annak a valószínűségére, hogy elfogadjuk az alternatív hipotézist, amikor az igaz – tehát az eljárás arra való képessége, hogy felismerjen egy hatást, ha az adott hatás valóban létezik. Formálisan megfogalmazva: Statisztikai erő = P(H0 elutasítása | H1 igaz). Amennyiben a H1 csak a H0 tagadása, például: H0 : x = 0, ahol x egy meg nem figyelt paramétere a populációnak, H1 pedig x <> 0, az erő nem kiszámolható, csak ha a valószínűségek ismertek minden lehetséges értékére, amit x paraméter felvehet. Emiatt amikor statisztikai erőről beszélünk, fontos kiemelni, hogy milyen alternatív hipotézis mellett beszélünk róla. Az úgynevezett erő elemzés használható arra, hogy meghatározzuk, a keresett méretű hatást milyen elemszám mellett találjuk meg megfelelő valószínűséggel. Például: „Hányszor kell feldobnom egy érmét, hogy levonhassam a következtetést, hogy cinkelt-e, avagy sem, ha feltesszük, hogy a cinkel érme az esetek 70%-ban fejet mutat?” Az erő elemzés arra is használható, hogy kiszámoljuk a legkisebb hatásméretet, amit még valószínűsíthetőleg (adott statisztikai erővel) felfedezünk egy adott elemszám mellett. Ezek mellett az erő arra is használatos, hogy összehasonlításokat végezzen az ember különböző statisztikai módszerek próbáinak eredményei között, például egy parametrikus és egy nonparametrikus teszt között, melyek ugyanazt a hipotézist tesztelik. (hu)
|