Ocena statističnih značilnosti naključnih podatkov. Analiza podobnosti porazdelitev. Točkovne statistične ocene

Naj se preuči kvantitativna značilnost splošne populacije. Predpostavimo, da je bilo iz teoretičnih premislekov mogoče ugotoviti, kakšno distribucijo ima značilnost. Težava nastane pri oceni parametrov, ki določajo to porazdelitev. Če je na primer vnaprej znano, da je preučevana značilnost porazdeljena v splošno populacijo po običajnem zakonu, je treba oceniti matematično pričakovanje in standardni odklon, saj ta dva parametra v celoti določata normalno porazdelitev. Če obstaja razlog za domnevo, da ima značilnost Poissonovo porazdelitev, je treba oceniti parameter, po katerem je ta porazdelitev določena. Običajno obstajajo le vzorčni podatki, pridobljeni kot rezultat opazovanj: ,, ...,. Ocenjeni parameter je izražen s temi podatki. Ob upoštevanju ,, ... kot vrednosti neodvisnih naključnih spremenljivk ,, ... lahko rečemo, da iskanje statistične ocene neznanega parametra teoretične porazdelitve pomeni iskanje funkcije opazovanih naključnih spremenljivk, ki daje približno vrednost ocenjenega parametra.

Torej, statistično vrednotenje neznani parameter teoretične porazdelitve se imenuje funkcija opazovanih naključnih spremenljivk. Pokliče se statistična ocena neznanega parametra splošne populacije za eno število točka... Upoštevane so naslednje točkovne ocene: pristransko in nepristransko, učinkovito in dosledno.

Da bi statistične ocene dale dobre približke ocenjenih parametrov, morajo izpolnjevati nekatere zahteve. Navedimo te zahteve. Naj bo statistična ocena neznanega parametra teoretične porazdelitve. Predpostavimo, da je bila najdena ocena za prostornino vzorca. Ponovimo poskus, to pomeni, da iz splošne populacije izvlečemo še en enako velik vzorec in po njegovih podatkih najdemo oceno itd. Dobimo številke ,, ..., ki se bodo med seboj razlikovale. Tako lahko oceno obravnavamo kot naključno spremenljivko, številke ,, ..., - pa kot njene možne vrednosti.

Če ocena daje približno vrednost s presežkom, potem je število, ugotovljeno iz vzorčnih podatkov ( ) bo večja od prave vrednosti. Posledično bo tudi matematično pričakovanje (povprečna vrednost) naključne spremenljivke večje od, tj. Če daje približno vrednost s pomanjkljivostjo, potem.

Tako bi uporaba statistične ocene, katere matematično pričakovanje ni enako ocenjenemu parametru, povzročila sistematične napake. Zato je treba zahtevati, da je matematično pričakovanje ocene enako ocenjenemu parametru. Skladnost odpravlja sistematične napake.

Nepristranski se imenuje statistična ocena, katere matematično pričakovanje je enako ocenjenemu parametru, tj.

Premeščen se imenuje statistična ocena, katere matematično pričakovanje ni enako ocenjenemu parametru.

Vendar je napačno domnevati, da nepristranska ocena vedno daje dober približek ocenjenega parametra. Dejansko so možne vrednosti lahko močno razpršene okoli njihove srednje vrednosti, tj. Varianca količine je lahko pomembna. V tem primeru se lahko izkaže, da je ocena, ugotovljena na primer iz podatkov enega vzorca, zelo oddaljena od svoje srednje vrednosti in s tem od samega ocenjenega parametra. Če bi to upoštevali kot približno vrednost, bi naredili veliko napako. Če zahtevamo, da je odstopanje količine majhno, bo možnost velike napake izključena. Zato se statističnemu vrednotenju nalagajo zahteve glede učinkovitosti.

Učinkovito je statistična ocena, ki ima (za določeno velikost vzorca) najmanjšo možno varianco. Pri obravnavi vzorcev velike velikosti se zahteva po doslednosti statističnih ocen.

Premožni se imenuje statistična ocena, ki se v verjetnosti nagiba k ocenjenemu parametru. Če je na primer varianca nepristranske ocene enaka nič pri, je tudi taka ocena skladna.

Razmislite o vprašanju, katere značilnosti vzorca so najboljše glede na nepristranskost, učinkovitost in doslednost za oceno splošne povprečja in variance.

Naj se preuči diskretna splošna populacija glede na količinsko značilnost. Splošno srednješolsko imenovano aritmetična sredina vrednosti atributa splošne populacije. Lahko se izračuna s pomočjo formul oz , kjer so vrednosti značilnosti splošne populacije prostornine, ustrezne frekvence, in.

Iz neodvisnih opazovanj kvantitativne lastnosti naj iz splošne populacije vzorec prostornine z vrednostmi lastnosti . Selektivno povprečje imenovano aritmetična sredina vzorca. Lahko se izračuna s pomočjo formul oz , kjer so vrednosti značilnosti v vzorčni populaciji prostornine, ustrezne frekvence in.

Če je splošno povprečje neznano in ga je treba oceniti glede na vzorčne podatke, potem se vzorec povprečja vzame kot ocena splošnega povprečja, kar je nepristranska in dosledna ocena. Iz tega sledi, da če bodo za več vzorcev z dovolj veliko velikostjo iz iste splošne populacije najdene vzorčne vrednosti, bodo med seboj približno enake. To je lastnina trajnost vzorčnih sredstev.

Upoštevajte, da če so razlike med obema populacijama enake, potem bližina vzorčnih sredstev do splošne populacije ni odvisna od razmerja velikosti vzorca do celotne velikosti populacije. Odvisno od velikosti vzorca: večja kot je velikost vzorca, manj se povprečje vzorca razlikuje od splošnega.

Da bi označili razpršenost vrednosti kvantitativne značilnosti splošne populacije okoli njene srednje vrednosti, je uvedena zbirna značilnost - splošna varianca. Splošna varianca je aritmetična sredina kvadratov odstopanj vrednosti atributa splošne populacije od njihove srednje vrednosti, ki se izračuna po formulah: , ali .

Za karakterizacijo razpršenosti opazovanih vrednosti količinske značilnosti vzorca okoli njegove srednje vrednosti je uvedena zbirna značilnost - selektivna varianca. Selektivna varianca imenovana aritmetična sredina kvadratov odstopanj opaženih vrednosti atributa od njihove srednje vrednosti, ki se izračuna po formulah: , ali .

Poleg variance je za karakterizacijo razpršenosti vrednosti atributa splošne (vzorčne) populacije okoli njegove srednje vrednosti uporabljena tudi zbirna značilnost - standardni odklon. Splošno srednje kvadratno odstopanje imenovan kvadratni koren splošne variance: Selektivni standardni odklon imenovan kvadratni koren variance vzorca:

Naj bo vzorec prostornine izvzet iz splošne populacije kot rezultat neodvisnih opazovanj kvantitativne značilnosti. Na podlagi vzorčnih podatkov je treba oceniti neznano splošno varianco. Če vzamemo varianco vzorca kot oceno splošne variance, potem bo ta ocena povzročila sistematične napake in dala podcenjeno vrednost splošne variance. To je razloženo z dejstvom, da je varianca vzorca pristranska ocena; z drugimi besedami, matematično pričakovanje variance vzorca ni enako ocenjeni splošni varianti, je pa .

Enostavno je popraviti varianco vzorca, tako da je njegovo matematično pričakovanje enako splošni varianti. Dovolj je, da se to pomnoži z ulomkom. Kot rezultat dobimo popravljeno varianco, ki jo običajno označimo z. Popravljena varianca bo nepristranska ocena splošne variance: .

2. Ocene intervala.

Statistična teorija ocenjevanja parametrov se poleg ocene točk ukvarja tudi z vprašanji intervalne ocene. Problem ocene intervala lahko oblikujemo takole: glede na vzorčne podatke zgradimo številčni interval, glede na katerega lahko z vnaprej izbrano verjetnostjo rečemo, da se ocenjeni parameter nahaja znotraj tega intervala. Intervalna ocena je še posebej potrebna za majhno število opazovanj, kadar je točkovna ocena večinoma naključna, zato ni preveč zanesljiva.

Interval zaupanja kajti parameter se imenuje interval, glede na katerega je mogoče z vnaprej izbrano verjetnostjo, ki je enaka enoti, trditi, da vsebuje neznano vrednost parametra, tj. ... Manjše je število za izbrano verjetnost, natančnejša je ocena neznanega parametra. Nasprotno, če je to število veliko, potem ocena, narejena s tem intervalom, ni zelo primerna za prakso. Ker so konci intervala zaupanja odvisni od elementov vzorca, se vrednosti lahko razlikujejo od vzorca do vzorca. Verjetnost se običajno imenuje raven zaupanja (zanesljivosti). Običajno je zanesljivost ocene določena vnaprej, za vrednost pa se vzame številka blizu ene. Izbira stopnje zaupanja ni matematični problem, ampak je določen s posebnim problemom, ki se reši. Najpogosteje je zanesljivost enaka; ; ...

Dajmo brez izpeljave interval zaupanja za splošno povprečje z znano vrednostjo standardnega odklona, \u200b\u200bpod pogojem, da je naključna spremenljivka (kvantitativna značilnost) običajno porazdeljena:

kjer je vnaprej določeno število blizu enote, vrednosti funkcije pa so podane v Dodatku 2.

Pomen tega razmerja je naslednji: z zanesljivostjo lahko trdimo, da interval zaupanja ( ) zajema neznani parameter, natančnost ocene je. Število se določi iz enakosti, oz. V skladu s tabelo (priloga 2) je najden argument, ki ustreza vrednosti funkcije Laplace, enaki.

Primer 1... Naključna spremenljivka ima normalno porazdelitev z znanim standardnim odklonom. Poiščite intervale zaupanja za oceno neznanega splošnega povprečja na podlagi vzorca, če sta navedena velikost vzorca in zanesljivost ocene.

Sklep. Našli ga bomo. Iz relacije dobimo to. Glede na tabelo (Dodatek 2) najdemo. Poiščite natančnost ocene ... Intervali zaupanja bodo naslednji: ... Na primer, če, potem ima interval zaupanja naslednje meje zaupanja :; ... Tako vrednosti neznanega parametra, skladne z vzorčnimi podatki, zadovoljujejo neenakost .

Interval zaupanja za splošno povprečje normalne porazdelitve lastnosti z neznano vrednostjo standardnega odklona je podan z izrazom .

Iz tega sledi, da lahko z zanesljivostjo trdimo, da je interval zaupanja zajema neznan parameter.

Obstajajo že pripravljene tabele (Dodatek 4), s pomočjo katerih za dano in najdemo verjetnost in obratno za dano in jih lahko najdemo.

2. primer... Kvantitativna značilnost splošne populacije je običajno porazdeljena. Za volumen vzorca sta bila ugotovljena srednja vrednost vzorca in popravljeni standardni odklon. Ocenite neznano splošno povprečje z uporabo intervala zaupanja z zanesljivostjo.

Sklep. Našli ga bomo. Uporabite tabelo (Dodatek 4) za in poiščite :. Poiščimo meje zaupanja:

Torej, z zanesljivostjo je neznani parameter zaprt v intervalu zaupanja.

3. Pojem statistične hipoteze. Splošna formulacija problema preizkušanja hipotez.

Preizkušanje statističnih hipotez je tesno povezano s teorijo ocene parametrov. V naravoslovju, tehnologiji in ekonomiji se pogosto za razjasnitev določenega naključnega dejstva zatekajo k oblikovanju hipotez, ki jih je mogoče statistično preveriti, to je na podlagi rezultatov opazovanj v naključnem vzorcu. Spodaj statistične hipoteze implicirajo se take hipoteze, ki se nanašajo bodisi na tip bodisi na posamezne parametre porazdelitve naključne spremenljivke. Tako je na primer statistična hipoteza, da ima porazdelitev produktivnosti dela delavcev, ki opravljajo enako delo v enakih pogojih, običajen zakon o porazdelitvi. Hipoteza, da se povprečne velikosti delov, izdelanih na istem tipu vzporednih delovnih strojev, med seboj ne razlikujejo, bo tudi statistična.

Imenuje se statistična hipoteza navaden če enolično določa porazdelitev naključne spremenljivke, se sicer imenuje hipoteza zapleteno.Na primer, preprosta hipoteza je predpostavka, da se naključna spremenljivka porazdeli po običajnem zakonu s pričakovanjem nič in varianco ena. Če se domneva, da ima naključna spremenljivka normalno porazdelitev z varianco, ki je enaka enoti, in je matematično pričakovanje število iz segmenta, potem je to težka hipoteza. Drug primer zapletene hipoteze je predpostavka, da zvezna naključna spremenljivka z verjetnostjo zavzame vrednost iz intervala, v tem primeru je porazdelitev naključne spremenljivke lahko kateri koli iz razreda neprekinjenih porazdelitev.

Porazdelitev količine je pogosto znana, zato je treba na vzorcu opazovanja preveriti predpostavke o vrednostih parametrov te porazdelitve. Takšne hipoteze se imenujejo parametrično.

Imenuje se hipoteza, ki jo je treba preizkusiti ničelna hipoteza in je označena z. Skupaj s hipotezo je obravnavana ena od alternativnih (konkurenčnih) hipotez. Na primer, če hipotezo preizkusimo o enakovrednosti parametra določeni dani vrednosti, tj .:, potem lahko eno od naslednjih hipotez obravnavamo kot alternativno hipotezo ::; :; :; :, kjer je dana vrednost ,. Izbira alternativne hipoteze je odvisna od posebne formulacije problema.

Pravilo, po katerem se sprejme odločitev o sprejetju ali zavrnitvi hipoteze, se imenuje merilo ... Ker se odločitev sprejme na podlagi vzorca opazovanja naključne spremenljivke, je treba izbrati ustrezno statistiko, v tem primeru imenovano kriterijska statistika. Pri preizkušanju preproste parametrične hipoteze: kot kriterijska statistika je izbrana ista statistika kot za oceno parametrov.

Statistično preverjanje hipotez temelji na načelu, da se verjetni dogodki štejejo za nemogoče, dogodki, ki so zelo verjetni, pa za zanesljive. To načelo se lahko izvaja na naslednji način. Pred analizo vzorca je določena določena nizka verjetnost, imenovana raven pomembnosti... Naj bo niz vrednosti statističnih podatkov in mora biti taka podskupina, da je, če je hipoteza resnična, verjetnost, da je statistika merila enaka, tj. .

Označimo z vzorčno vrednostjo statistike, izračunano iz vzorca opazovanj. Kriterij je oblikovan na naslednji način: zavrni hipotezo if; sprejeti hipotezo, če. Klicano je merilo, ki temelji na uporabi vnaprej določene stopnje pomembnosti merilo pomembnosti... Pokliče se nabor vseh vrednosti statistik meril, za katere se sprejme odločitev o zavrnitvi hipoteze kritično območje; območje se imenuje območje sprejemanja hipoteze.

Stopnja pomembnosti določa velikost kritičnega območja. Položaj kritičnega območja na nizu statističnih vrednosti je odvisen od formulacije alternativne hipoteze. Na primer, če hipotezo preizkusimo :, alternativna hipoteza pa je formulirana kot: (), se kritično območje nahaja na desnem (levem) "repu" porazdelitve statistike, to je v obliki neenakosti: (), kjer in so tiste vrednosti statistike, ki sprejeti z verjetnostjo, pod pogojem, da je hipoteza resnična. V tem primeru se zahteva merilo enostransko, oziroma desničar in levičar. Če je alternativna hipoteza oblikovana kot :, potem je kritično območje na obeh "repih" porazdelitve, tj. Določeno je z nizom neenakosti in; v tem primeru se zahteva merilo dvostranski.

Na sl. 30 prikazuje lokacijo kritičnega območja za različne alternativne hipoteze. Tu je gostota porazdelitve merilne statistike, če je hipoteza resnična, ali je območje sprejetja hipoteze, .

Tako lahko testiranje parametrične statistične hipoteze s testom pomembnosti razdelimo na naslednje korake:

1) oblikujejo hipoteze, ki jih je mogoče preizkusiti () in alternativno ();

2) določite raven pomembnosti; kot v neskladju z opažanji; če potem hipotezo sprejmemo, torej predpostavimo, da hipoteza ni v nasprotju z rezultati opazovanj.

Običajno se pri izvajanju točk 4 - 7 uporabljajo statistike, katerih kvantile so razvrščene v tabelo: statistika z normalno porazdelitvijo, Študentska statistika, Fisherjeva statistika.

3. primer... Glede na podatke o potnih listih avtomobilskega motorja poraba goriva na 100 km kilometrina je 10 l... Zaradi preoblikovanja motorja naj bi se poraba goriva zmanjšala. Preskusi se izvajajo za preverjanje 25 naključno izbranih avtomobilov z nadgrajenim motorjem z vzorčno povprečno porabo goriva za 100 km kilometrina glede na rezultate preskusov je bila 9,3 l... Predpostavimo, da vzorec porabe goriva dobimo iz normalno porazdeljene populacije s povprečjem in varianco. Pod pogojem, da je hipoteza o kritični regiji za prvotne statistike resnična, tj. Enaka ravni pomembnosti. Poiščite verjetnosti napak prve in druge vrste za merilo s tako kritičnim območjem. ima normalno porazdelitev z enakim matematičnim pričakovanjem in enako varianco. Verjetnost napake druge vrste najdemo po formuli (11.2):

Zato je v skladu s sprejetim merilom 13,6% avtomobilov s porabo goriva 9 l na 100 km prevoženih kilometrov uvrščamo med vozila s porabo goriva 10 l.

4. Teoretične in empirične frekvence. Merila za soglasje.

Empirične frekvence - frekvence, pridobljene kot rezultat izkušenj (opazovanja). Teoretične frekvence izračunamo po formulah. Za običajni zakon o distribuciji jih lahko najdemo na naslednji način:

, (11.3)

Vprašanja statističnega vrednotenja povezujejo v celoto tako problematične vidike matematične statistike, kot so znanstvena metodologija, naključne spremenljivke, statistične porazdelitve itd. Za vsak vzorec so značilne napake zaradi nepopolne pokritosti enot, merilne napake in podobno. Takšne napake v resničnem življenju dajejo vsaki hipotezi (zlasti oblikovani na podlagi ekonomskih zaključkov) naključen, stohastičen značaj. Ne glede na število spremenljivk, ki jih predvidevajo teoretične hipoteze, se domneva, da je mogoče vpliv različnih vrst napak povsem natančno opisati z uporabo samo ene komponente. Ta metodološki pristop nam omogoča, da se omejimo na enodimenzionalno porazdelitev verjetnosti, hkrati pa ocenjujemo več parametrov.

Statistična ocena je ena od dveh vrst statističnih presoj (druga je preizkušanje hipotez). Gre za posebno vrsto metode za presojo numeričnih vrednosti značilnosti (parametrov) porazdelitve splošne populacije po vzorčnih podatkih iz te populacije. Se pravi, z rezultati selektivnega opazovanja poskušamo (z največjo natančnostjo) oceniti vrednosti določenih parametrov, od katerih je odvisna porazdelitev atributa (spremenljivega), ki nas zanima, v splošni populaciji. Ker vzorec vključuje le del enot populacije (včasih zelo majhno število), obstaja nevarnost napake. Kljub zmanjšanju tega tveganja s povečanjem števila opazovalnih enot se še vedno pojavlja pri selektivnem opazovanju. Zato je odločitev, sprejeta na podlagi rezultatov vzorca, verjetnostna. Vendar bi bilo napačno, če bi statistične sodbe obravnavali le z vidika verjetnosti. Ta pristop ni vedno zadosten za oblikovanje pravilnih teoretičnih predpostavk o parametrih splošne populacije. Za podrobnejšo utemeljitev so pogosto potrebne številne dodatne sodbe. Na primer, v čim večjem približku je treba oceniti vrednost povprečnega števila usposobljenih delavcev v podjetjih v regiji. V tem primeru se oceni aritmetična sredina spremenljivke x iz splošne populacije, ki ima normalno porazdelitev. Po prejemu vzorca za ta atribut v znesku p enot, je treba rešiti vprašanje: katero vrednost po vzorčnih podatkih je treba v splošni populaciji najbližje povprečju? Takšnih vrednosti je več, katerih matematično pričakovanje je enako želenemu parametru (ali blizu njega): a) aritmetična sredina; b) moda; c) mediana; d) povprečje, izračunano glede na območje variacije itd.

Z verjetnostnega vidika lahko štejemo, da vsaka od zgornjih količin daje najboljši približek želenemu parametru splošne populacije (x), saj je matematično pričakovanje vsake od teh funkcij (zlasti za velike vzorce) enako splošnemu povprečju. Ta predpostavka je posledica dejstva, da bo z večkratnim ponovitvijo vzorca iz iste splošne populacije pridobljen "povprečen" pravilen rezultat.

Pravilnost "v povprečju" je razložena z enakostjo ponovitev pozitivnih in negativnih odstopanj nastalih napak pri oceni splošnega povprečja, to pomeni, da bo povprečna napaka pri oceni enaka nič.

V praksi je praviloma organiziran en vzorec, zato raziskovalca zanima vprašanje natančnejše ocene želenega parametra na podlagi rezultatov določenega vzorca. Za rešitev takšnega problema so poleg zaključkov, ki izhajajo neposredno iz abstraktnega izračuna verjetnosti, potrebna dodatna pravila za motivacijo najboljšega približevanja ocene želenemu parametru splošne populacije.

Obstaja zadostno število načinov za oceno konstant iz vzorčnih opazovanj. Kateri izmed njih so najboljši pri reševanju določenih raziskovalnih problemov - se ukvarja teorija statistične ocene. Preučuje pogoje, ki jim mora ta ali druga ocena ustrezati, se usmerja k ocenam, ki so v danih okoliščinah bolj zaželene. Teorija ocen kaže na premoč ene ocene nad drugo.

Kot veste, podatki, pridobljeni na podlagi vzorca, v zaključku niso kategorični. Če je bilo na primer ugotovljeno, da je preučenih 100 živalskih glav zdravih 99 za svoje bolezni, potem obstaja možnost, da ena žival, ki je ostala nepregledana, nosi virus domnevne bolezni. Ker je to malo verjetno, se sklene, da bolezen ni prisotna. V večini primerov je ta sklep popolnoma upravičen.

Na podlagi takšnih zaključkov v praksi se eksperimentator (raziskovalec) ne zanaša na zanesljivost informacij, temveč le na njihovo verjetnost.

Druga stran selektivnega opazovanja, kot smo že omenili, rešuje problem najbolj objektivnega določanja stopnje zanesljivosti dobljenih ocen vzorca. Poskušajo zagotoviti čim bolj natančen verjetnostni izraz za rešitev tega problema, torej govorimo o določanju stopnje natančnosti ocene. Tu raziskovalec določi meje možnega neskladja med oceno, pridobljeno iz vzorca, in dejansko vrednostjo njegove vrednosti v splošni populaciji.

Natančnost ocene je posledica načina izračuna glede na vzorčne podatke in način izbire enot za vzorec.

Metoda pridobivanja ocen predvideva kateri koli računski postopek (metoda, pravilo, algebrska formula). To je prednostna naloga teorije statističnega ocenjevanja. Izbirne metode vodijo do vprašanj o tehniki vzorčenja.

Navedeno nam omogoča opredelitev pojma "statistična ocena".

Statistična ocena je približna vrednost želenega parametra splošne populacije, ki je pridobljena iz vzorčnih rezultatov in ponuja možnost sprejemanja utemeljenih odločitev o neznanih parametrih splošne populacije.

Recimo, da je ^ "statistična ocena neznanega parametra ^ teoretične porazdelitve.

Velikost vzorca iz splošne populacije je našla ocene in 2 ^ "" n,

imajo različne pomene. Zato je oceno ^ "mogoče obravnavati kot

naključna spremenljivka in +17 dve, 3 ~ "n - kot njeni možni vrednosti. Kot naključno spremenljivko je zanjo značilna določena funkcija gostote verjetnosti. Ker je ta funkcija posledica rezultata selektivnega opazovanja (eksperimenta), se imenuje porazdelitev vzorca. Takšna funkcija opisuje gostoto verjetnosti za vsako oceno z uporabo določenega števila vzorcev

opazovanja. Če predpostavimo, da je statistična ocena ^ "algebrska funkcija določenega nabora podatkov in bo tak nabor pridobljen med izvajanjem vzorčnega opazovanja, potem v

na splošno bo ocena prejela izraz: ® n \u003d f (Xl.X2, ^ 3, ... X m).

Na koncu vzorčne raziskave ta funkcija ni več splošna ocena, ampak ima določeno vrednost, to pomeni, da postane kvantitativna ocena (število). Z drugimi besedami, iz zgornjega izraza funkcije izhaja, da lahko katerega koli kazalnika, ki označuje rezultate opazovanja vzorca, štejemo za oceno. Vzorčna sredina je ocena splošne srednje vrednosti. Variansa, izračunana iz vzorca, ali vrednost standardnega odklona, \u200b\u200bizračunana iz njega, sta oceni ustreznih značilnosti splošne populacije itd.

Kot smo že omenili, izračun statističnih ocen ne zagotavlja odprave napak. Bistvo je, da slednje ne sme biti sistematično. Njihova prisotnost mora biti naključna. Upoštevajmo metodološko plat te določbe.

Recimo, da ocena ^ "daje netočno vrednost ocene ^ splošne populacije s pomanjkanjem. V tem primeru bo vsaka izračunana vrednost \u003d 1,2,3, ..., n) manjša od dejanske vrednosti $.

Iz tega razloga bo matematično pričakovanje (povprečna vrednost) naključne spremenljivke manjše od pričakovanja, to je (M (^ n. In obratno, če poda oceno s presežkom, potem je matematično pričakovanje

naključni ^ "postane večji od $.

Iz tega sledi, da uporaba statistične ocene, katere matematično pričakovanje ni enako ocenjenemu parametru, vodi do sistematičnih napak, to je do nenaključnih napak, ki izkrivljajo rezultate meritev v eno smer.

Pojavi se naravna zahteva: matematično pričakovanje ocene ^ "mora biti enako parametru, ki se ocenjuje. Skladnost s to zahtevo na splošno ne odpravlja napak, saj so lahko vzorčne vrednosti ocene večje ali manjše od dejanske vrednosti ocene splošne populacije. Vendar se bodo pojavile napake v eni in drugi smeri vrednosti ^ (v skladu s teorijo verjetnosti) z enako frekvenco, zato mora biti skladno s to zahtevo matematično pričakovanje ocene vzorca enako ocenjenemu parametru, izključuje prejem sistematičnih (nenaključnih) napak, to je

M (v) = 6.

Izbira statistične ocene, ki daje najboljši približek ocenjenega parametra, je pomemben problem v teoriji ocenjevanja. Če je znano, da porazdelitev preučevane naključne spremenljivke v splošni populaciji ustreza zakonu normalne porazdelitve, je treba po vzorčnih podatkih oceniti matematično pričakovanje in standardni odklon. To je razloženo z dejstvom, da ti dve značilnosti popolnoma določata temelje, na katerih je zgrajena normalna razporeditev. Če je naključna spremenljivka, ki jo preiskujemo, porazdeljena po Poissonovem zakonu, se oceni parameter ^, saj določa to porazdelitev.

Matematična statistika razlikuje med takimi metodami pridobivanja statističnih ocen iz vzorčnih podatkov: metoda trenutkov, metoda največje verjetnosti.

Pri pridobivanju ocen po metodi trenutkov se trenutki splošne populacije nadomestijo z momenti vzorca (namesto verjetnosti s težo se uporabljajo frekvence).

Da bi statistična ocena dala "najboljši približek" splošni značilnosti, mora imeti številne lastnosti. O njih bomo razpravljali v nadaljevanju.

Zmožnost izbire najboljše ocene je posledica poznavanja njihovih osnovnih lastnosti in sposobnosti razvrščanja ocen po teh lastnostih. V matematični literaturi "lastnosti ocen" včasih imenujejo "zahteve za ocene" ali "merila za ocene." Glavne lastnosti statističnih ocen vključujejo: nepristranskost, učinkovitost, sposobnost, zadostnost.

Če predpostavimo, da vzorec pomeni (~) in varianco vzorca

(Stv) so ocene ustreznih splošnih značilnosti (^), to je njihovo matematično pričakovanje, upoštevamo, da pri velikem številu

vzorčne enote z imenom karakteristike (~) bodo blizu njihovim matematičnim pričakovanjem. Če je število vzorčnih enot majhno, se lahko te značilnosti bistveno razlikujejo od ustreznih matematičnih pričakovanj.

Če povprečje značilnosti vzorca, izbranega kot ocena, ustreza vrednosti splošne značilnosti, se ocena imenuje nepristransko. Dokaz, da je matematično pričakovanje srednje vrednosti vzorca enako splošnemu povprečju (m (x) \u003d x), kaže, da je količina ~ nepristransko splošno

povprečno. Drugače je s selektivno varianco (o). njo

M (ST 2) \u003d - o-2. ...

matematično pričakovanje n, ki ni enako splošnemu

variance. Torej, h je pristranska ocena a. "Da bi odpravili pristranskost in dobili nepristransko oceno, vzorec

varianca se pomnoži s popravkom n - 1 (to izhaja iz tvorbe

c 2 _ 2 str p -1 "n -1

zgornja enačba: n).

Tako je pri majhnem vzorcu varianca:

2 CH, - ~) 2 p E (x in - ~) 2

cr in \u003d x - \u003d -.

n n - 1 p -1

Ulomek (Str - 1) se imenuje Besselov popravek. Besselov matematik je prvi ugotovil, da je vzorčna varianca pristranska ocena splošne variance, in uporabil navedeni popravek za popravek

ocene. Pri majhnih vzorcih se popravek (n - 1) bistveno razlikuje od 1. S povečanjem števila opazovalnih enot se hitro približa 1. Za n<> 50 razlika med ocenami izgine, tj

° ~ "-. Iz zgoraj navedenega sledijo naslednje opredelitve nepristranskih zahtev.

Nepristranski se imenuje statistična ocena, katere matematično pričakovanje za katero koli velikost vzorca je enako vrednosti

parameter splošne populacije, to je m (^) \u003d 9; m (x) \u003d x.

Kategorija "matematična pričakovanja" se preučuje v okviru teorije verjetnosti. To je številčna značilnost naključne spremenljivke. Matematično pričakovanje je približno enako povprečni vrednosti naključne spremenljivke. Matematična pričakovanja diskretne naključne spremenljivke poimenujemo vsoto zmnožkov vseh možnih vrednosti glede na njihove verjetnosti. Recimo, da je bilo izvedenih n študij, v katerih je naključna spremenljivka x je vzel w 1-kratno vrednost w 2-kratno vrednost W in pomnožil vrednost X k. V tem primeru je W 1 + W 2 + W 3 + ... + W k \u003d n. Nato je vsota vseh vrednosti x, enako

x 1 w 1 + x 2 w 2 + x 3 w 3 + ... + x k w k

Aritmetična sredina teh vrednosti bo:

X 1 w 1 + x 2 w 2 + x 3 w 3 + ... + x k w k - w 1 ^ w 2 ^ w 3 ^ ^ w k

p ali 1 p 2 p 3 p 1 str.

Ker je n relativna frekvenca ^ vrednost x ^ P - relativna frekvenca vrednosti x 2 itd., zgornja enačba bo v obliki:

X \u003d X 1 št. 1 + X 2 št. 2 + X 3 št. 3 + ... + X k N\u003e k

Pri velikem številu opazovanj vzorcev je relativna frekvenca približno enaka verjetnosti dogodka, tj

u\u003e 1 \u003d L; ^ 2 \u003d U \u003d ™ k \u003d PK in zato x 2 x 1 p 1 + x 2 p 2 + X 3 g. 3 + ... + X KPK. Potem

x ~ m (x) verjetnostni pomen izračunanega rezultata je, da je matematično pričakovanje približno enako (bolj natančno, večji je vzorec), aritmetična sredina opazovanih vrednosti naključne spremenljivke [M (x -) \u003d ~ 1.

Kriterij nepristranskosti zagotavlja odsotnost sistematičnih napak pri ocenjevanju parametrov splošne populacije.

Upoštevajte, da je ocena vzorca (^) naključna spremenljivka, katere vrednost se lahko med posameznimi vzorci razlikuje. Za mero njegove variacije (disperzije) okoli matematičnega pričakovanja parametra splošne populacije # je značilna varianca σ2 (^).

Naj bo v inIN - - dve nepristranski oceni parametra ^, tj M (v ") \u003d 6 in M \u200b\u200b(d,) \u003d v. Njihova razpršenost v 1 (v -) in v r f -). Z dvema 0 v Artaudu dajte prednost tistemu, ki ima manj razpršenosti okoli ocenjenega parametra. Če je varianca ocene ^ "manjša od variance

ocenjuje Cn, potem se vzame prva ocena, to je ^ ".

Nepristranska ocena ^, ki ima najmanjšo varianco med vsemi možnimi nepristranskimi ocenami parametra ^, izračunana iz vzorcev enake velikosti, se imenuje efektivna ocena. To je druga lastnost (zahteva) statističnih ocen parametrov splošne populacije. Ne smemo pozabiti, da efektivna ocena parametra splošne populacije ob upoštevanju določenega zakona o porazdelitvi ne sovpada z efektivno oceno parametra drugega oddelka.

Pri obravnavi vzorcev velike velikosti bi morale imeti statistične ocene lastnost sposobnosti. Ocenjevanje (imenovano tudi "primerno" ali "ugodno") pomeni, da večja kot je velikost vzorca, večja je verjetnost, da napaka v oceni ne bo presegla nobenega pozitivnega

število E. Ocena 6 parametra ^ se imenuje konsistentna, če upošteva zakon velikih števil, to pomeni, da velja naslednja enakost:

/ wg | r v <Е} = 1.

Kot lahko vidimo, se taka statistična ocena imenuje sposobna, ki se pri n verjetnosti približa ocenjenemu parametru. Z drugimi besedami, to je vrednost kazalnika, pridobljenega iz vzorca in se približuje (sovpada po verjetnosti) zaradi zakona velikih števil, ko se velikost vzorca poveča na svoje matematično pričakovanje. Na primer, če varianca nepristranske ocene teče na nič pri n, je tudi ta ocena skladna, saj ima najmanjšo možno varianco (za določeno velikost vzorca).

Sposobne ocene so:

1) delež značilnosti v vzorcu, to je pogostost kot ocena deleža značilnosti v splošni populaciji;

2) vzorčna sredina kot ocena splošne srednje vrednosti;

3) varianca vzorca kot ocena splošne variance;

4) vzorčni koeficienti asimetrije in kurtoze kot ocena splošnih koeficientov.

Zaradi neznanega razloga v literaturi o matematični statistiki ni vedno mogoče najti opisa četrte lastnosti statističnih ocen - veljavnosti. Ocenjevanje zadostno (ali izčrpna) je ocena, ki zagotavlja (zagotavlja) popolnost zajetja vseh vzorčnih informacij o neznanem parametru splošne populacije. Tako zadostna ocena vključuje vse informacije v vzorcu za preučene statistične značilnosti splošne populacije. Nobena od treh predhodno obravnavanih ocen ne more zagotoviti potrebnih dodatnih informacij o preiskovanem parametru kot zadostna statistična ocena.

Zato je aritmetična sredina vzorca ~ nepristranska ocena aritmetične sredine splošnega x. Faktor nepristranskosti te ocene kaže: če se odvzame veliko število naključnih vzorcev iz splošne populacije, potem je njihova povprečna vrednost *<отличались бы от генеральной средней в большую и меньшую сторону одинаково, то есть, свойство несмещенности хорошей оценки также показывает, что среднее значение бесконечно большого числа выборочных средних равно значению генеральной средней.

V simetričnih distribucijskih serijah je mediana nepristranska ocena splošnega povprečja. In pod pogojem, da je velikost vzorca blizu splošni populaciji (P ~ * N), je lahko mediana v takih serijah in dosledna ocena splošne povprečja. Kar zadeva merilo učinkovitosti glede na mediano kot oceno aritmetične sredine splošne populacije, je mogoče dokazati, da je v vzorcih velikega volumna je srednja kvadratna napaka mediane (Cm) enaka 1,2533 korenske povprečne napake srednje vrednosti vzorca

). Se pravi Stme *. Zato mediana ne more biti učinkovita ocena aritmetične sredine splošne populacije, saj je njena srednja kvadratna napaka večja od srednje kvadratne napake aritmetične sredine vzorca. Poleg tega aritmetična sredina izpolnjuje pogoje nepristranskosti in sposobnosti, zato je najboljša ocena.

Možna je tudi takšna nastavitev. Ali je lahko aritmetična sredina vzorca nepristranska ocena mediane v simetričnih porazdelitvah populacije, za katero srednja in srednja vrednost sovpadata? In ali je vzorec povprečna skladna ocena mediane prebivalstva? V obeh primerih je odgovor pritrdilen. Za mediano populacije (s simetrično porazdelitvijo) je aritmetična sredina vzorca nepristranska in dosledna ocena.

Če se spomnimo na Stme ~ 1.2533. th, pridemo do zaključka: aritmetična sredina vzorca in ne mediana je učinkovitejša ocena mediane preučevane splošne populacije.

Vsaka značilnost v vzorcu ni nujno najboljša ocena ustrezne značilnosti v populaciji. Poznavanje lastnosti ocen omogoča reševanje vprašanja ne samo izbire ocen, temveč tudi njihovega izboljšanja. Kot primer lahko upoštevamo primer, ko izračuni pokažejo, da se vrednosti standardnih odklonov več vzorcev iz ene splošne populacije v vseh primerih izkažejo za manjše od standardnega odklona splošne populacije, velikost razlike pa je posledica velikosti vzorca. Z množenjem vzorčnega standardnega odklona s korekcijskim faktorjem dobimo izboljšano oceno standardnega odklona populacije. Za tak korekcijski faktor se uporablja Besselov popravek

p a jaz p

(P - 1), torej za odpravo pristranskosti se dobijo ocene "P - 1. Takšen numerični izraz kaže, da standardni odklon vzorca, uporabljen kot ocena, daje podcenjeno vrednost parametra splošne populacije.

Kot veste, so statistične značilnosti vzorca groba ocena neznanih parametrov splošne populacije. Sama ocena je lahko v obliki ene številke ali določene točke. Ocena, ki jo določimo z enim številom, se imenuje točkovna ocena. Tako je vzorčna sredina (~) nepristranska in najučinkovitejša točkovna ocena splošnega povprečja (x), varianca vzorca) pa pristranska točkovna ocena splošne

variance (). Če označujemo srednjo napako vzorčne sredine t <> potem lahko točkovno oceno splošnega povprečja zapišemo kot x ± m °. To pomeni, da je ~ ocena splošne srednje vrednosti x z napako, enako m ". Jasno je, da točkovne statistične ocene x in o ne smejo imeti sistematične napake v

ooo ~~ o<в 2

strani precenjevanja ali podcenjevanja ocenjenih parametrov x in. Kot smo že omenili, se imenujejo ocene, ki izpolnjujejo ta pogoj

nepristranski. V čem je napaka parametra m "? To je povprečje številnih specifičnih napak:

Točkovna ocena parametra splošne populacije je v tem, da se med različnimi možnimi vzorčnimi ocenami najprej izbere tista z optimalnimi lastnostmi in nato izračuna vrednost te ocene. Dobljena izračunana vrednost slednjega velja za najboljši približek neznani resnični vrednosti parametra splošne populacije. Dodatni izračuni, povezani z določitvijo morebitne napake pri ocenjevanju, niso vedno obvezni (odvisno od dejanskih ocenjevalnih nalog), vendar se praviloma izvajajo skoraj vedno.

Oglejmo si primere določanja točkovne ocene povprečja preučevanih značilnosti in njihovega deleža v splošni populaciji.

Primer. Pridelki žita na tem območju znašajo 20.000 hektarjev. Z 10-odstotno vzorčno raziskavo polj smo dobili naslednje vzorčne značilnosti: povprečni pridelek - 30 centrov na 1 ha, varianca pridelka - 4, posejana površina visoko rodnih posevkov - 1200 hektarjev.

Kaj vedeti o vrednosti kazalnika povprečnega pridelka žitnih pridelkov v regiji in kolikšna je številčna vrednost kazalnika deleža (specifične teže) visokorodnih pridelkov v celotni preučeni površini zrnja

regija? To pomeni, da je treba oceniti imenovane parametre (x, z) v splošni populaciji. Za izračun ocen imamo:

N \u003d 20.000; - = 20.000 x 0,1 \u003d 2.000; ~ \u003d 30;<т = л / 4; № 2000,

Kot veste, je selektivna aritmetična sredina učinkovita ocena

splošna aritmetična sredina. Tako lahko domnevamo, da

najboljša ocena splošnega parametra (^) je 30. Za določitev stopnje

natančnost ocene je treba najti njeno povprečno (standardno) napako:

ua. n ~ in April 2000 h PPL

t \u003d L - (1--) = - (1--) = 0,04

v n N u2000 2000 ^

Nastala napaka kaže na visoko natančnost ocene. Vrednost m tukaj pomeni, da bi bila pri večkratnem ponavljanju takih vzorcev napaka ocene parametra v povprečju 0,04. Se pravi za bistvom

po ocenah bo povprečni pridelek na okrajnih kmetijah x \u003d 30 - 0,04 centimetra na hektar.

Za pridobitev točkovne ocene kazalnika deleža visoko rodnih žitnih pridelkov na celotni površini žit lahko kot najboljšo oceno vzamemo kazalnik deleža v vzorcu ¥ \u003d 0,6. Tako lahko rečemo, da bo glede na rezultate opazovanja številka 0,6 najboljša ocena kazalca želene strukture. Za natančnejše izračune je treba izračunati povprečno napako te ocene: t in (1 _ p) in 0,6 (1 - 0b) (1 \u003d 0,01

v p N v 2000 2000 in

Kot lahko vidite, je povprečna napaka pri oceni splošne značilnosti 0,01.

Pridobljeni rezultat pomeni, da bi bil vzorec večkrat ponovljen s prostornino 2000 hektarjev žita, povprečna napaka sprejete ocene deleža (specifične teže) visoko rodnih posevkov na območju žitnih poljščin podjetij okrožja pa bi znašala ± 0,01. V tem primeru je P \u003d 0,6 ± 0,01. V odstotkih bo delež visoko rodnih poljščin v celotni površini žit v regiji v povprečju znašal 60 ± I.

Izračuni kažejo, da bo za določen primer najboljša ocena kazalca želene strukture 0,6, povprečna napaka ocenjevanja v eno ali drugo smer pa približno 0,01. Kot lahko vidite, je ocena precej natančna.

Obstaja več znanih metod za točkovno oceno standardnega odklona, \u200b\u200bkadar je vzorec narejen iz splošne populacije enot z normalno porazdelitvijo in je parameter neznan. Preprosta (najlažje izračunana) ocena je obseg variacij (in °) vzorca, pomnožen s korekcijskim faktorjem, vzetim iz standardnih tabel in ki je odvisen od velikosti vzorca (za majhne vzorce). Parameter standardnega odklona v splošni populaciji je mogoče oceniti z uporabo izračunane variance vzorca ob upoštevanju števila stopenj svobode. Kvadratni koren te variance daje vrednost, ki bo uporabljena kot ocena splošnega standardnega odklona).

Z uporabo vrednosti parametra v "izračunaj povprečno napako ocene splošnega povprečja (x") po zgoraj navedeni metodi.

Kot smo že omenili, se v skladu z zahtevo po sposobnosti zaupanje v natančnost določene ocene točke poveča s povečanjem velikosti vzorca. Teoretično stališče je nekoliko težko prikazati na podlagi točkovne ocene. Vpliv velikosti vzorca na natančnost ocene je očiten pri izračunu intervalnih ocen. O njih bomo razpravljali v nadaljevanju.

Tabela 39 prikazuje najpogosteje uporabljene točkovne ocene parametrov splošne populacije.

Tabela 39

Osnovne ocene točk _

Vrednosti ocen, izračunane na različne načine, po velikosti morda ne bodo enake. V zvezi s tem se v praktičnih izračunih ne bi smeli ukvarjati z zaporednim izračunom možnih možnosti, ampak se, opirajoč se na lastnosti različnih ocen, odločite za eno od njih.

Pri majhnem številu opazovalnih enot je ocena točke večinoma naključna, zato ni preveč zanesljiva. Zato se lahko v majhnih vzorcih zelo razlikuje od ocenjene značilnosti splošne populacije. To stanje povzroča velike napake v sklepih, ki veljajo za splošno populacijo na podlagi vzorčnih rezultatov. Zaradi tega se za majhne vzorce uporabljajo intervalne ocene.

V nasprotju s točko oceno interval ocenjuje obseg točk, znotraj katerih naj bo parameter populacije. Poleg tega intervalna ocena kaže na verjetnost in je zato pomembna pri statistični analizi.

Intervalu rečemo ocena, za katero sta značilni dve številki - meji intervala, ki pokriva (pokriva) ocenjeni parameter. Takšna ocena je določen interval, v katerem se z dano verjetnostjo najde želeni parameter. Za središče intervala se vzame ocena vzorčne točke.

Intervalne ocene so torej nadaljnji razvoj točkovne ocene, kadar taka ocena za majhen vzorec ni učinkovita.

Problem ocene intervala v splošni obliki lahko oblikujemo takole: glede na podatke vzorčnega opazovanja je treba zgraditi numerični interval, v zvezi s katerim je mogoče s predhodno izbrano stopnjo verjetnosti trditi, da je parameter, ki se ocenjuje, znotraj tega intervala.

Če vzamemo dovolj veliko število vzorčnih enot, lahko z izrekom Lyapunova dokažemo verjetnost, da napaka vzorčenja ne preseže neke dane vrednosti a, to je

In ~ "*!" A ali I št. "G. YA.

Ta izrek zlasti omogoča oceno napak približno enakovrednosti:

- "P (n in - frekvenca) x "x. n

Če so ^ * 2X3 ..., x ~ neodvisne naključne spremenljivke in n, potem je verjetnost njihove srednje vrednosti (x) v območju od a do 6 in jo lahko določimo z enačbami:

p (a(x (e) 1 e 2 ti,

_in - E (x); _ in - E (x) DE ° a

V tem primeru se verjetnost P imenuje verjetnost zaupanja.

Tako je verjetnost zaupanja (zanesljivost) ocene splošnega parametra na podlagi vzorčne ocene verjetnost, s katero se neenakosti uresničijo:

| ~ X | <а; | и, ориентир | <д

kjer je a mejna napaka ocene glede na povprečje in delež.

Meje, v katerih se lahko s to določeno verjetnostjo nahaja splošna značilnost, imenujemo intervali zaupanja (meje zaupanja). Meje tega intervala se imenujejo meje zaupanja.

Zaupne (ali tolerantne) meje so meje, preko katerih ima določena značilnost zaradi naključnih nihanj nepomembno verjetnost (Л ^ 0,5; р 2<0,01; Л <0,001). Понятие "доверительный интервал" введено Дж.Нейман и К.Пирсоном (1950 г.). Это установленный по выборочным данным интервал, который с заданной вероятностью (доверительной вероятностью) охватывает (покрывает) настоящее, но неизвестно для нас значение параметра. Если уровня доверительной вероятности принять значения 0,95, то эта вероятность свидетельствует о том, что при частых приложениях данного способа (метода) вычислений доверительный интервал примерно в 95% случаев будет покрывать параметр. Доверительный интервал генеральной средней и генеральной доли определяется на основе приведенных выше неравенств, из которых

iz tega sledi, da ~ _A - x - ~ + A; Št. A - g. - št. + A.

V matematični statistiki se zanesljivost parametra oceni z vrednostjo naslednjih treh stopenj verjetnosti (včasih imenovane tudi "pragovi verjetnosti"): L \u003d 0,95; ^ 2 \u003d 0,99; P 3 \u003d 0,999. Verjetnosti, ki jih je bilo odločeno prezreti, tj. in 1 = 0,05 ;; a 2 \u003d 0,01; "3 \u003d 0,001 se imenujejo stopnje pomembnosti ali stopnje pomembnosti. Iz danih stopenj verjetnost P daje zanesljive zaključke 3 \u003d 0,999. Vsaka stopnja zaupanja ustreza določeni vrednosti normaliziranega odstopanja (glej tabelo 27). Če na razpolago ni standardnih tabel vrednosti intervala verjetnosti, lahko to verjetnost z določeno stopnjo približanja izračunamo po formuli:

R (<) = - = ^ = 1 e "~ th in.

Na sliki 11 so osenčeni deli celotne površine, omejeni z normalno krivuljo in osjo abscise, ki ustrezajo vrednosti <= ± 1;<= ± 2; <= и 3 и для которых вероятности равны 0,6287, 0,9545; 0,9973. При точечном оценке рассчитывается, как уже известно, средняя ошибка выборки, при интервальном - предельная.

Glede na načela izbire enot (ponovljene ali brez ponovitve), strukturne formule za izračun vzorčnih napak

se razlikujejo po velikosti popravka (N).

Slika: 11. Normalna krivulja porazdelitve

Tabela 40 prikazuje formule za izračun napak ocen splošnega parametra.

Upoštevajmo poseben primer intervalne ocene parametrov splošne populacije po vzorčnih podatkih opazovanja.

Primer. V vzorčni raziskavi kmetij v okrožju je bilo ugotovljeno, da je povprečna dnevna mlečnost krav (x) 10 kg. Delež čistopasemske živine v celotnem številu živine je 80%. Ugotovljeno je bilo, da je bila napaka vzorčenja s stopnjo zaupanja P \u003d 0,954 0,2 kg; za zasebno čistopasemsko govedo 1%.

Meje, znotraj katerih je lahko splošno povprečje

uspešnost bo 9,8<х <10,2; для генеральной доли скота -79 <Р <81.

Zaključek: z verjetnostjo 0,954 lahko trdimo, da je razlika med selektivno povprečno produktivnostjo krav in skupno produktivnostjo 0,2 kg. Povprečna dnevna mlečnost je 9,8 in 10,2 kg. Delež (specifična teža) čistopasemskega goveda v okrožnih podjetjih se giblje med 79 in 81%, napaka ocene ne presega 1%.

Tabela 40

Izračun točkovnih in intervalnih vzorčnih napak

Pri organiziranju vzorca je pomembno določiti zahtevano velikost (n). Slednje je odvisno od variacije enot anketirane populacije. Večje kot je število, večja mora biti velikost vzorca. Povratne informacije med velikostjo vzorca in njegovo mejno napako. Želja po manjši napaki zahteva povečanje velikosti vzorčne populacije.

Zahtevana velikost vzorca se določi na podlagi formul za mejno napako vzorčenja (e) z dano stopnjo verjetnosti (P). Z matematičnimi transformacijami dobimo formule za izračun velikosti vzorca (tabela 41).

Preglednica 41

Izračun zahtevane velikosti vzorca _

Treba je opozoriti, da vse navedeno v zvezi s statističnimi ocenami temelji na predpostavki, da je vzorčna populacija, katere parametri so uporabljeni v oceni, pridobljena z uporabo izbirne metode (metode), ki zagotavlja verjetnost vzorčenja.

Hkrati pa je treba pri izbiri stopnje zaupanja ocene voditi načelo, da izbira njegove ravni ni matematični problem, ampak je določena s posebnim problemom, ki se reši. V podporo zgornjemu si oglejte primer.

Primer. Recimo, da je v dveh podjetjih verjetnost proizvodnje končnih (visokokakovostnih) izdelkov P \u003d 0,999, to pomeni, da bo verjetnost pridobivanja izdelka z napako a \u003d 0,001. Ali se je mogoče v okviru matematičnih premislekov, ne da bi nas zanimala narava izdelka, odločiti, ali obstaja velika verjetnost pomanjkanja a \u003d 0,001. Recimo, da eno podjetje izdeluje sejalnice, drugo pa letala za predelavo poljščin. Če je za 1000 sejalnic ena okvarjena, je to mogoče dopustiti, ker je pretapljanje 0,1% sejalnic cenejše od obnove tehnološkega procesa. Če je na 1000 letalih eno okvarjeno, bo to nedvomno povzročilo resne posledice med njegovim obratovanjem. Torej, v prvem primeru verjetnost sklenitve zakonske zveze in = 0,001 se lahko sprejme, v drugem primeru pa ne. Iz tega razloga mora izbira verjetnosti zaupanja pri izračunih na splošno in zlasti pri izračunu ocen temeljiti na posebnih pogojih problema.

Glede na naloge študije bo morda treba izračunati eno ali dve meji zaupanja. Če značilnosti problema, ki ga rešujemo, zahtevajo nastavitev samo ene od zgornjih ali spodnjih meja, lahko zagotovimo, da bo verjetnost, s katero je ta meja nastavljena, večja, kot če sta obe meji navedeni za isto vrednost koeficienta zaupanja 1

Naj se meje zaupanja določijo z verjetnostjo P \u003d 0,95, to je,

v 95% primerov splošno povprečje (x) ne bo manjše od nižjega

interval zaupanja х ™ - х "m in ne večji od zgornjega intervala zaupanja

interval Xup - \u003d x + V tem primeru lahko le z verjetnostjo a \u003d 0,05 (ali 5%) povprečje splošnega preseže navedene meje. Ker je porazdelitev X simetrična, je polovica te ravni

verjetnost, to pomeni, da 2,5% pade na primer, ko je x (x ™ druga polovica - v primeru, ko je x ^ x "^ -. Iz tega sledi, da je verjetnost, da je povprečno splošno lahko manjše od vrednost vrha

meja zaupanja Hvei "-, je enaka 0,975 (to je 0,95 +0,025). Zato se ustvarijo pogoji, ko pri dveh mejah zaupanja zanemarimo

x manj kot x "" *., pa tudi večji ali Heerh. Klicanje

samo eno mejo zaupanja, na primer Hver., zanemarjamo samo tiste, ki ~ presegajo to mejo. Za enako vrednost koeficienta zaupanja X se izkaže, da je stopnja pomembnosti a dvakrat manjša.

Če se izračunajo samo značilne vrednosti, ki presegajo

(ali obratno ne presegajo) vrednosti zahtevanega parametra x, interval zaupanja imenujemo enostranski. Če so upoštevane vrednosti na obeh straneh omejene, se interval zaupanja imenuje dvostranski. Iz zgoraj navedenega izhaja, da je treba hipoteze in številna merila, zlasti test X-Student, šteti za enostranski in dvostranski. Zato bo pod dvostransko hipotezo stopnja pomembnosti za isto vrednost X dvakrat večja kot za enostransko. Če želimo pri enostranski hipotezi ohraniti enako stopnjo pomembnosti (in stopnjo zaupanja) kot pri dvostranski, potem je treba vrednost X sprejeti manj. Ta značilnost je bila upoštevana pri sestavljanju standardnih tabel študentskih kriterijev (Dodatek 1).

Znano je, da s praktičnega vidika niso toliko zanimivi intervali zaupanja možne vrednosti splošnega povprečja, temveč tiste največje in najnižje vrednosti, splošno povprečje ne more biti večje ali manjše kot z dano (samozavestno) verjetnostjo. V matematični statistiki jih imenujemo zajamčeni maksimum in zajamčeni minimum povprečja. Označevanje imenovanih parametrov

skoz in x ™ lahko zapišete: XIII ™ \u003d x +; xship \u003d x ~.

Pri izračunu zajamčenih največjih in najnižjih vrednosti splošnega povprečja kot meja enostranskega intervala zaupanja v zgornjih formulah se vrednost 1 jemljemo kot enostransko merilo.

Primer. Za 20 mest vzorčenja je bil določen povprečni donos sladkorne pese 300 n / ha. Ta srednja vrednost vzorca označuje ustrezno

parameter splošne populacije (x) z napako 10 n / ha. Glede na selektivnost ocen je lahko splošni povprečni donos večji ali manjši od vzorčnega povprečja x \u003d 300. Z verjetnostjo P \u003d 0,95 lahko trdimo, da iskani parameter ne bo večji od XW "\u003d 300 +1,73 x10 \u003d 317,3 q / ha.

Vrednost 1 se vzame za število stopenj svobode ^ \u003d 20-1 z enostranskim kritičnim območjem in stopnjo pomembnosti in = 0,05 (Dodatek 1). Torej je z verjetnostjo P \u003d 0,95 zajamčena največja možna raven splošnega povprečnega pridelka ocenjena na 317 n / ha, to pomeni, da v ugodnih pogojih povprečni donos sladkorne pese ne presega te vrednosti.

V nekaterih vejah znanja (na primer v naravoslovju) je teorija ocenjevanja slabša od teorije preverjanja statističnih hipotez. V ekonomiji imajo metode statističnega vrednotenja zelo pomembno vlogo pri preverjanju zanesljivosti rezultatov raziskav, pa tudi pri različnih vrstah praktičnih izračunov. Najprej gre za uporabo točkovne ocene preučevanih statističnih populacij. Izbira najboljše ocene je glavni problem točkovne ocene. Možnost takšne izbire je posledica poznavanja osnovnih lastnosti (zahtev) statističnih ocen.

) problemi matematične statistike.

Recimo, da obstaja parametrična družina verjetnostnih porazdelitev (za poenostavitev bomo upoštevali porazdelitev naključnih spremenljivk in primer enega parametra). Tu je številčni parameter, katerega vrednost ni znana. Oceniti jo je treba na podlagi razpoložljivega vzorca vrednosti, ki jih ustvari ta porazdelitev.

Obstajata dve glavni vrsti ocenjevanja: točkovne ocene in intervali zaupanja.

Ocena točk

Točkovna ocena je vrsta statistične ocene, pri kateri se vrednost neznanega parametra približa ločeni številki. To pomeni, da je treba določiti funkcijo iz vzorca (statistika)

,

katerih vrednost se bo štela za približek neznani pravi vrednosti.

Splošne metode za izdelavo točkovnih ocen parametrov vključujejo: metodo največje verjetnosti, metodo trenutkov, metodo kvantilov.

Spodaj je nekaj lastnosti, ki jih točkovne ocene lahko imajo ali pa tudi ne.

Doslednost

Ena najbolj očitnih zahtev za oceno točke je, da lahko pričakujete razmeroma dober približek resnični vrednosti parametra pri dovolj velikih vzorcih. To pomeni, da se mora ocena približati pravi vrednosti pri. Ta lastnost vrednotenja se imenuje doslednost... Ker govorimo o naključnih spremenljivkah, za katere obstajajo različne vrste konvergence, je to lastnost mogoče natančno oblikovati na različne načine:

Ko se uporablja samo izraz doslednost, potem običajno mislimo na šibko konsistenco, tj. konvergenca v verjetnosti.

Pogoj doslednosti je praktično obvezen za vsa vrednotenja, ki se uporabljajo v praksi. Neveljavne ocene se redko uporabljajo.

Nepristranskost in asimptotična nepristranskost

Pokliče se ocena parametra nepristranski, če je njegovo matematično pričakovanje enako resnični vrednosti ocenjenega parametra:

.

Šibkejše stanje je asimptotska nepristranskost, kar pomeni, da se matematično pričakovanje ocene približa dejanski vrednosti parametra s povečanjem velikosti vzorca:

.

Nepristranskost je priporočljiva lastnost razvrščanja. Vendar pa njegovega pomena ne smemo preceniti. Najpogosteje obstajajo nepristranske ocene parametrov, ki jih nato poskušajo upoštevati samo. Vendar obstajajo nekatere statistične težave, pri katerih nepristranske ocene ne obstajajo. Najbolj znan primer je naslednji: upoštevajte Poissonovo porazdelitev s parametrom in nastavite problem ocene parametra. Dokaže se lahko, da za to težavo ni nepristranske ocene.

Primerjava ocen in učinkovitosti

Za primerjavo različnih ocen istega parametra med seboj se uporablja naslednja metoda: funkcija tveganja, ki meri odstopanje ocene od resnične vrednosti parametra, pri čemer se šteje najboljši, za katerega ima ta funkcija manjšo vrednost.

Najpogosteje se matematična pričakovanja kvadrata odstopanja ocene od resnične vrednosti štejejo za funkcijo tveganja

Za nepristranske ocene je to preprosto varianca.

Obstaja spodnja meja za to funkcijo tveganja, imenovano cramer-Rao neenakost.

Pokličejo se (nepristranske) ocene, za katere je dosežena ta spodnja meja (tj. Z najmanjšo možno varianco) učinkovito... Vendar pa je obstoj učinkovite ocene precej močna zahteva za težavo, kar pa ni vedno tako.

Šibkejše stanje je asimptotična učinkovitost, kar pomeni, da razmerje variance nepristranske ocene do spodnje meje Cramer-Rao teži k enotnosti pri.

Upoštevajte, da v primeru dovolj širokih predpostavk o preučevani porazdelitvi metoda največje verjetnosti daje asimptotično učinkovito oceno parametra in če obstaja učinkovita ocena, potem da učinkovito oceno.

Zadostna statistika

Statistika se imenuje zadostno za parameter, če pogojna porazdelitev vzorca, pod pogojem, da ni odvisna od parametra za vse.

Pomen koncepta zadostne statistike je posledica naslednjega odobritev... Če je zadostna statistika in je nepristranska ocena parametra, potem je pogojno matematično pričakovanje tudi nepristranska ocena parametra in je njegova varianca manjša ali enaka varianti prvotne ocene.

Spomnimo se, da je pogojno matematično pričakovanje naključna spremenljivka, ki je odvisna od. Tako je v razred nepristranskih ocen dovolj, da upoštevamo samo tiste, ki so funkcije zadostne statistike (pod pogojem, da take obstajajo za dani problem).

(Nepristranska) ocena učinkovitega parametra je vedno zadostna statistika.

Lahko rečemo, da zadostna statistika vsebuje vse informacije o ocenjenem parametru, ki jih vsebuje vzorec.

Statistične ocene parametrov splošne populacije. Statistične hipoteze

PREDAVANJE 16

Naj se preuči kvantitativna značilnost splošne populacije. Predpostavimo, da je bilo iz teoretičnih premislekov mogoče ugotoviti, kakšno distribucijo ima neka značilnost. To povzroča problem ocene parametrov, ki določajo to porazdelitev. Če je na primer znano, da je preučevani atribut porazdeljen v splošno populacijo po običajnem zakonu, je treba oceniti (približno najti) matematično pričakovanje in standardni odklon, saj ta dva parametra v celoti določata normalno porazdelitev. Če obstaja razlog za domnevo, da ima značilnost Poissonovo porazdelitev, je treba oceniti parameter, po katerem je ta porazdelitev določena.

Običajno ima razdeljevalec v distribuciji le vzorčne podatke, na primer vrednosti kvantitativne lastnosti, pridobljene kot rezultat opazovanj (v nadaljevanju se šteje, da so opazovanja neodvisna). Skozi te podatke je izražen ovrednoteni parameter.

Kot vrednosti neodvisnih naključnih spremenljivk , lahko rečemo, da iskanje statistične ocene za neznani parameter teoretične porazdelitve pomeni iskanje funkcije opazovanih naključnih spremenljivk, kar daje približno vrednost ocenjenega parametra. Na primer, kot bo prikazano spodaj, se za oceno matematičnega pričakovanja normalne porazdelitve uporablja funkcija (aritmetična sredina opazovanih vrednosti lastnosti):

.

Torej, statistično vrednotenje neznani parameter teoretične porazdelitve imenujemo funkcija opazovanih naključnih spremenljivk. Pokliče se statistična ocena neznanega parametra splošne populacije, zapisana v enem številu točka... Upoštevajte naslednje točkovne ocene: pristransko in nepristransko, učinkovito in dosledno.

Da lahko statistične ocene dajo "dobre" približke ocenjenih parametrov, morajo izpolnjevati nekatere zahteve. Navedimo te zahteve.

Naj bo statistična ocena neznanega parametra teoretične porazdelitve. Predpostavimo, da se pri vzorčenju prostornine najde ocena. Ponovimo poskus, to pomeni, da iz splošne populacije izvlečemo še en enako velik vzorec in na podlagi njegovih podatkov najdemo oceno itd. Če poskus ponovimo večkrat, dobimo številke , ki se na splošno med seboj razlikujejo. Tako lahko oceno štejemo kot naključno spremenljivko in števila - kot možni pomen.

Jasno je, da če bo ocena dala približno vrednost s presežkom, bo vsako število, ki ga najdemo iz vzorčnih podatkov, večje od resnične vrednosti. Posledično bo v tem primeru matematično (povprečje) naključne spremenljivke večje od, tj. Očitno je, če daje približno vrednost s pomanjkanjem, potem.


Zato uporaba statistične ocene, katere matematično pričakovanje ni enako ocenjenemu parametru, vodi do sistematičnih (enoznakovnih) napak. Zato je naravno zahtevati, da je matematično pričakovanje ocene enako parametru, ki se ocenjuje. Čeprav skladnost s to zahtevo na splošno ne bo odpravila napak (nekatere vrednosti so večje in druge manjše od), pa se napake različnih znakov srečujejo enako pogosto. Vendar pa skladnost z zahtevo zagotavlja nezmožnost pridobivanja sistematičnih napak, to pomeni, da odpravlja sistematične napake.

Nepristranski se imenuje statistična ocena (napaka), katere matematično pričakovanje je enako ocenjeni vrednosti za katero koli velikost vzorca, tj.

Premeščen se imenuje statistična ocena, katere matematično pričakovanje ni enako ocenjeni parametri za katero koli velikost vzorca, tj.

Vendar bi bilo napačno domnevati, da nepristranska ocena vedno daje dober približek ocenjenega parametra. Dejansko so možne vrednosti lahko zelo razpršene okoli njihove srednje vrednosti, to pomeni, da je varianca lahko velika. V tem primeru se lahko izkaže, da je ocena, ugotovljena na primer iz podatkov enega vzorca, zelo oddaljena od srednje vrednosti in s tem od samega ocenjenega parametra. Tako bomo, če vzamemo za približno vrednost, naredili veliko napako. Če mora biti varianca majhna, bo možnost velike napake izključena. Iz tega razloga se statistična ocena zahteva po učinkovitosti.

Učinkovito je statistična ocena, ki ima (za določeno velikost vzorca) najmanjšo možno varianco.

Premožni se imenuje statistična ocena, ki se pri verjetnosti nagiba k ocenjenemu parametru, to pomeni, da je enakost enaka:

.

Če je na primer varianca nepristranske ocene enaka nič pri, je tudi taka ocena skladna.

Razmislite o vprašanju, katere značilnosti vzorca so najboljše glede nepristranskosti, učinkovitosti in doslednosti za oceno splošne povprečja in variance.

Naj se preuči diskretna splošna populacija glede na nekatere kvantitativne lastnosti.

Splošno srednješolsko imenovano aritmetična sredina vrednosti atributa splošne populacije. Izračuna se po formuli:

§ - če so vse vrednosti značilnosti splošne populacije obsega različne;

§ - če imajo vrednosti atributa splošne populacije ustrezne frekvence, in. To pomeni, da je splošno povprečje tehtano povprečje vrednosti atributov z utežmi, enakimi ustreznim frekvencam.

Komentiraj: Naj splošna populacija zvezka vsebuje predmete z različnimi vrednostmi atributa. Predstavljajmo si, da je en predmet naključno vzet iz tega niza. Verjetnost, da bo na primer pridobljen objekt z vrednostjo funkcije, je očitno enaka. Vsak drug predmet je mogoče izvleči z enako verjetnostjo. Tako lahko vrednost lastnosti obravnavamo kot naključno spremenljivko, katere možne vrednosti imajo enake verjetnosti enake. V tem primeru ni težko najti matematičnega pričakovanja:

Če torej obravnavano značilnost splošne populacije obravnavamo kot naključno spremenljivko, je matematično pričakovanje značilnosti enako splošnemu povprečju te značilnosti:. Do tega zaključka smo prišli ob upoštevanju, da imajo vsi predmeti splošne populacije različne vrednosti atributa. Enak rezultat bomo dobili, če predpostavimo, da splošna populacija vsebuje več predmetov z isto vrednostjo atributa.

Če povzamemo rezultat, dobljen za splošno populacijo z neprekinjeno porazdelitvijo značilnosti, določimo splošno povprečje kot matematično pričakovanje značilnosti: .

Izvlecite vzorec prostornine za preučevanje splošne populacije glede na količinsko značilnost.

Selektivno povprečje imenovana aritmetična sredina vrednosti značilnosti vzorca. Izračuna se po formuli:

§ - če so vse vrednosti značilnosti vzorčne populacije prostornine različne;

§ - če imajo vrednosti atributa vzorca ustrezne frekvence, in. To pomeni, da je povprečje vzorca tehtano povprečje značilnih vrednosti z utežmi, enakimi ustreznim frekvencam.

Komentiraj: povprečna vrednost vzorca iz enega vzorca je očitno določeno število. Če iz iste splošne populacije izvlečemo druge vzorce enake velikosti, se povprečje vzorca spreminja od vzorca do vzorca. Tako lahko vzorčno sredino štejemo za naključno spremenljivko, zato lahko govorimo o porazdelitvah (teoretičnih in empiričnih) vzorčne sredine in o numeričnih značilnostih te porazdelitve, zlasti o matematičnem pričakovanju in varianti porazdelitve vzorca.

Nadalje, če je splošno povprečje neznano in ga je treba oceniti glede na vzorčne podatke, potem se vzorec povprečja vzame kot ocena splošnega povprečja, kar je nepristranska in dosledna ocena (predlagamo, da to trditev dokažemo neodvisno). Iz zgoraj navedenega izhaja, da če bodo za več vzorcev dovolj velikega obsega iz iste splošne populacije najdene vrednosti vzorcev, bodo med seboj približno enake. To je lastnina trajnost vzorčnih sredstev.

Upoštevajte, da če so variance obeh populacij enake, potem bližina vzorčnih sredin splošni populaciji ni odvisna od razmerja velikosti vzorca do velikosti splošne populacije. Odvisno od velikosti vzorca: večja kot je velikost vzorca, manj se povprečje vzorca razlikuje od splošnega. Na primer, če je bil 1% predmetov izbran iz ene populacije in 4% predmetov iz druge populacije in se je obseg prvega vzorca izkazal za večjega od drugega, potem se bo prva vzorčna sredina razlikovala manj od ustreznega splošnega povprečja kot druga.