Studentu t-testa statistika

Studenta t-tests statistikā - hipotēžu pārbaudes metode attiecībā uz nelielu paraugu, kas ņemts no normāli sadalītas populācijas, ja populācijas standartnovirze nav zināma.

1908. gadā William Sealy Gosset, anglis, izdevējs ar pseidonīmu Studenti, izstrādāja t-testu un t-sadalījumu. T sadalījums ir līkņu saime, kurā brīvības pakāpju skaits (neatkarīgo novērojumu skaits izlasē mīnus viens) norāda konkrētu līkni. Palielinoties izlases lielumam (un līdz ar to arī brīvības pakāpēm), t sadalījums tuvojas standarta normālā sadalījuma zvanu formai. Praksē testiem, kuros vidējais paraugs ir lielāks par 30, parasti izmanto normālo sadalījumu.

Parasti parasti formulē nulles hipotēzi, kurā teikts, ka starp novērotā parauga vidējo vērtību un hipotētisko vai noteikto populācijas vidējo lielumu nav efektīvas atšķirības, ti, ka jebkādas izmērītās atšķirības rodas tikai nejaušības dēļ. Piemēram, lauksaimniecības pētījumā nulles hipotēze varētu būt tāda, ka mēslošanas līdzeklim nav bijusi ietekme uz labības ražu, un tiks veikts eksperiments, lai pārbaudītu, vai tas nav palielinājis ražu. Parasti t-tests var būt divpusējs (saukts arī par divpusēju), vienkārši norādot, ka līdzekļi nav ekvivalenti, vai vienpusējs, norādot, vai novērotais vidējais ir lielāks vai mazāks par hipotētisko. Pēc tam aprēķina testa statistiku t. Ja novērotā t-statistika ir ekstrēmāka par kritisko vērtību, ko nosaka atbilstošais atsauces sadalījums, nulles hipotēzi noraida. Piemērots t-statistikas atsauces sadalījums ir t sadalījums. Kritiskā vērtība ir atkarīga no testa nozīmīguma līmeņa (varbūtība kļūdaini noraidīt nulles hipotēzi).

Piemēram, pieņemsim, ka pētnieks vēlas pārbaudīt hipotēzi, ka n = 25 paraugs ar vidējo x = 79 un standartnovirzi s = 10 tika ņemts nejauši no populācijas ar vidējo μ = 75 un nezināmu standartnovirzi. Izmantojot t-statistikas formulu, aprēķinātā t ir vienāda ar 2. Divpusējā testā ar kopēju nozīmīguma līmeni α = 0,05 kritiskās vērtības no t sadalījuma uz 24 brīvības pakāpēm ir –2,064 un 2,064. Aprēķinātais t nepārsniedz šīs vērtības, tāpēc nulles hipotēzi nevar noraidīt ar 95 procentu ticamību. (Uzticamības līmenis ir 1 - α.)

Otrais t sadalījuma pielietojums pārbauda hipotēzi, ka diviem neatkarīgiem izlases paraugiem ir vienāds vidējais. T sadalījumu var izmantot arī, lai konstruētu ticamības intervālus patiesajam vidējam populācijas lielumam (pirmais pielietojums) vai starpībai starp diviem izlases vidējiem rādītājiem (otrais pielietojums). Skatīt arī intervāla novērtējumu.