Gadījuma datu statistisko raksturlielumu novērtēšana. Sadalījumu līdzības analīze. Punktu statistikas aplēses

Ļaujiet tai izpētīt vispārējās populācijas kvantitatīvo raksturojumu. Pieņemsim, ka pēc teorētiskiem apsvērumiem bija iespējams noteikt, kāda veida iezīmei ir sadalījums. Problēma rodas, novērtējot parametrus, kas nosaka šo sadalījumu. Piemēram, ja iepriekš ir zināms, ka pētītā pazīme ir izplatīta vispārējā populācijā saskaņā ar normālo likumu, tad ir jānovērtē matemātiskā cerība un standartnovirze, jo šie divi parametri pilnībā nosaka normālo sadalījumu. Ja ir pamats domāt, ka pazīmei ir Puasona sadalījums, tad jānovērtē parametrs, ar kuru nosaka šo sadalījumu. Parasti ir tikai paraugu dati, kas iegūti novērojumu rezultātā: ,, ...,. Izmantojot šos datus, tiek izteikts novērtētais parametrs. Ņemot vērā ,, ..., kā neatkarīgo nejaušo mainīgo lielumus ,, ..., mēs varam teikt, ka nezināmā teorētiskā sadalījuma parametra statistiskā novērtējuma atrašana nozīmē atrasto novēroto nejaušo mainīgo funkciju, kas dod aplēstā parametra aptuvenā vērtība.

Tātad, statistiskā novērtēšana nezināmu teorētiskā sadalījuma parametru sauc par novēroto nejaušo mainīgo lielumu funkciju. Tiek saukts nezināmas vispārējās populācijas parametra statistiskais novērtējums ar vienu skaitli punkts... Tiek ņemti vērā šādi punktu aprēķini: neobjektīvs pret objektīvu, efektīvs un konsekvents.

Lai statistikas aplēses ļautu labi aprēķinātos parametrus tuvināt, tām jāatbilst noteiktām prasībām. Norādīsim šīs prasības. Ir teorētiskā sadalījuma nezināmā parametra statistiskā aplēse. Pieņemsim, ka ir atrasts novērtējums parauga tilpumam. Atkārtosim eksperimentu, tas ir, mēs no vispārējās populācijas izvelkam citu tāda paša izmēra paraugu un, pēc tā datiem, atrodam tāmi utt. Iegūstam skaitļus ,, ..., kas atšķirsies no katra cits. Tādējādi novērtējumu var uzskatīt par nejaušu mainīgo, bet skaitļus ,, ..., - par tā iespējamām vērtībām.

Ja tāme dod aptuvenu vērtību ar pārsniegumu, tad skaitlis, kas atrasts no izlases datiem ( ) būs lielāka par patieso vērtību. Līdz ar to arī nejaušā lieluma matemātiskā cerība (vidējā vērtība) būs lielāka par, t.i. Ja tas dod aptuvenu vērtību ar trūkumu, tad.

Tādējādi statistiskas aplēses izmantošana, kuras matemātiskās cerības nav vienādas ar aplēsto parametru, novestu pie sistemātiskām kļūdām. Tāpēc ir jāpieprasa, lai novērtējuma matemātiskā cerība būtu vienāda ar aplēsto parametru. Atbilstība novērš sistemātiskas kļūdas.

Neobjektīvs sauc par statistisko novērtējumu, kura matemātiskā cerība ir vienāda ar aplēsto parametru, t.i.

Pārvietots sauc par statistisko novērtējumu, kura matemātiskās cerības nav vienādas ar aplēsto parametru.

Tomēr ir kļūdaini uzskatīt, ka objektīvs novērtējums vienmēr dod labu aprēķinātā parametra tuvinājumu. Patiešām, iespējamās vērtības var stipri izkaisīt ap to vidējo vērtību, t.i., daudzuma dispersija var būt ievērojama. Šajā gadījumā aprēķins, kas iegūts, piemēram, no vienas izlases datiem, var izrādīties ļoti tālu no tā vidējās vērtības un līdz ar to arī no paša aplēstā parametra. Ņemot to kā aptuvenu vērtību, mēs pieļaujam lielu kļūdu. Ja mēs pieprasām, lai daudzuma dispersija būtu maza, tiks izslēgta iespēja izdarīt lielu kļūdu. Tāpēc statistiskajam novērtējumam tiek noteiktas efektivitātes prasības.

Efektīvs ir statistiskā aplēse, kurai (noteiktam izlases lielumam) ir pēc iespējas mazāka dispersija. Apsverot liela izmēra paraugus, konsekvences prasība tiek uzlikta statistikas aplēsēm.

Turīgs sauc par statistisko novērtējumu, kura varbūtība ir tendence uz aplēsto parametru. Piemēram, ja objektīvās aplēses dispersijas vērtība ir nulle, tad arī šāds novērtējums ir konsekvents.

Apsveriet jautājumu par to, kuras izlases īpašības ir labākās objektivitātes, efektivitātes un konsekvences ziņā, kas novērtē vispārējo vidējo un dispersiju.

Ļaujiet pētīt diskrēto vispārējo populāciju attiecībā uz kvantitatīvo raksturlielumu. Vispārējā sekundārā sauc par vispārējās populācijas atribūta vērtību vidējo aritmētisko. To var aprēķināt, izmantojot formulas vai , kur ir tilpuma vispārējās populācijas raksturlieluma vērtības, atbilstošās frekvences un.

Ļaujiet kvantitatīvās pazīmes neatkarīgu novērojumu rezultātā no vispārējās populācijas iegūt apjoma paraugu ar pazīmes vērtībām . Selektīvs vidējais sauc par parauga vidējo aritmētisko. To var aprēķināt, izmantojot formulas vai , kur iezīmes vērtības tilpuma izlases populācijā ir atbilstošās frekvences un.

Ja vispārējais vidējais lielums nav zināms un ir nepieciešams to novērtēt pēc izlases datiem, tad izlases vidējo vērtību ņem par vispārējā vidējā līmeņa novērtējumu, kas ir objektīvs un konsekvents novērtējums. No tā izriet, ka, ja vairākiem pietiekami liela izmēra paraugiem no vienas un tās pašas vispārējās populācijas tiek atrasti vidējie paraugi, tad tie būs aptuveni vienādi. Šis ir īpašums izlases līdzekļu ilgtspēja.

Ņemiet vērā, ka, ja abu populāciju dispersijas ir vienādas, tad izlases vidējā vērtība tuvāk vispārējai populācijai nav atkarīga no izlases lieluma un kopējās populācijas lieluma attiecības. Tas ir atkarīgs no izlases lieluma: jo lielāks ir izlases lielums, jo mazāk izlases vidējais lielums atšķiras no vispārējā.

Lai raksturotu vispārējās populācijas kvantitatīvā raksturlieluma vērtību izkliedi ap vidējo vērtību, tiek ieviests kopsavilkuma raksturojums - vispārējā dispersija. Vispārējā dispersija Tiek saukts vispārējās populācijas atribūta vērtību noviržu kvadrātu aritmētiskais vidējais lielums no to vidējā, ko aprēķina pēc formulas: vai .

Lai raksturotu parauga kvantitatīvā atribūta novēroto vērtību izkliedi ap vidējo vērtību, tiek ieviests kopsavilkuma raksturojums - selektīva dispersija. Selektīvā dispersija sauc par atribūta novēroto vērtību noviržu kvadrātu aritmētisko vidējo vērtību no to vidējās vērtības, ko aprēķina pēc formulas: vai .

Papildus dispersijai, lai raksturotu vispārējās (izlases) populācijas atribūta vērtību izkliedi ap vidējo vērtību, tiek izmantots kopsavilkuma raksturojums - standartnovirze. Vidējā kvadrāta novirze ko sauc par vispārējās dispersijas kvadrātsakni:. Selektīvā standartnovirze ko sauc par izlases dispersijas kvadrātsakni:

Ļaujiet apjoma paraugu iegūt no vispārējās populācijas kvantitatīvās īpašības neatkarīgu novērojumu rezultātā. Nepieciešams novērtēt nezināmo vispārējo dispersiju, pamatojoties uz izlases datiem. Ja mēs ņemam izlases dispersiju kā vispārējās dispersijas novērtējumu, tad šis novērtējums novedīs pie sistemātiskām kļūdām, dodot par zemu novērtētu vispārējās dispersijas vērtību. To izskaidro fakts, ka izlases dispersija ir tendencioza aplēse; citiem vārdiem sakot, izlases dispersijas matemātiskās cerības nav vienādas ar aplēsto vispārējo dispersiju, bet ir vienādas ar .

Ir viegli izlabot izlases dispersiju tā, lai tās matemātiskā cerība būtu vienāda ar vispārējo dispersiju. Pietiek, lai to reizinātu ar daļu. Rezultātā mēs iegūstam koriģēto dispersiju, ko parasti apzīmē ar. Labotā dispersija būs objektīvs vispārējās dispersijas novērtējums: .

2. Intervāla aplēses.

Parametru novērtēšanas statistiskā teorija līdztekus punktu novērtēšanai nodarbojas ar intervālu novērtēšanas jautājumiem. Intervāla novērtēšanas problēmu var formulēt šādi: saskaņā ar izlases datiem izveidojiet skaitlisku intervālu, attiecībā pret kuru ar iepriekš izvēlētu varbūtību mēs varam teikt, ka novērtētais parametrs atrodas šajā intervālā. Intervāla novērtēšana ir īpaši nepieciešama nelielam novērojumu skaitam, kad punktu novērtējums lielākoties ir nejaušs, tāpēc tas nav pārāk uzticams.

Ticamības intervāls jo parametru sauc par intervālu, attiecībā pret kuru ar iepriekš izvēlētu varbūtību, kas ir tuvu vienībai, ir iespējams apgalvot, ka tajā ir nezināma parametra vērtība, t.i. ... Jo mazāks ir izvēlētās varbūtības skaitlis, jo precīzāks ir nezināmā parametra novērtējums. Un otrādi, ja šis skaitlis ir liels, tad aprēķins, kas veikts, izmantojot šo intervālu, nav ļoti piemērots praksei. Tā kā ticamības intervāla beigas ir atkarīgas no parauga elementiem, vērtības un var mainīties no katra parauga. Varbūtību parasti sauc par ticamības līmeni (ticamību). Parasti tāmes ticamība tiek noteikta iepriekš, un par vērtību tiek ņemts skaitlis, kas ir tuvu vienam. Uzticamības līmeņa izvēle nav matemātiska problēma, bet to nosaka konkrētā atrisinātā problēma. Visbiežāk uzticamība tiek iestatīta vienāda ar; ; ...

Dosim bez atvasinājuma ticamības intervālu vispārējam vidējam rādītājam ar zināmu standartnovirzes vērtību, ja nejaušais mainīgais (kvantitatīvā pazīme) parasti tiek sadalīts:

kur ir iepriekš noteikts skaitlis tuvu vienam, un funkcijas vērtības ir norādītas 2. papildinājumā.

Šo attiecību nozīme ir šāda: ar ticamību var apgalvot, ka ticamības intervāls ( ) aptver nezināmu parametru, novērtējuma precizitāte ir. Skaits tiek noteikts pēc vienlīdzības vai. Saskaņā ar tabulu (2. pielikums) tiek atrasts arguments, kas atbilst Laplasa funkcijas vērtībai, kas vienāda ar.

1. piemērs... Gadījuma mainīgajam ir normāls sadalījums ar zināmu standartnovirzi. Atrodiet ticamības intervālus nezināmā vispārējā vidējā līmeņa noteikšanai no izlases vidējā līmeņa, ja ir norādīts izlases lielums un novērtējuma ticamība.

Lēmums. Mēs to atradīsim. No attiecībām mēs to iegūstam. Saskaņā ar tabulu (2. pielikums) mēs atrodam. Atrodiet aprēķina precizitāti ... Uzticamības intervāli būs šādi: ... Piemēram, ja, tad ticamības intervālam ir šādas ticamības robežas :; ... Tādējādi nezināmā parametra vērtības, kas atbilst izlases datiem, apmierina nevienlīdzību .

Uzticamības intervālu pazīmes normālā sadalījuma vispārējam vidējam skaitlim ar nezināmu standartnovirzes vērtību izsaka izteiksme .

No tā izriet, ka ar ticamību var apgalvot, ka ticamības intervāls aptver nezināmu parametru.

Ir gatavas tabulas (4. pielikums), izmantojot kuras attiecībā uz doto un atrod varbūtību, un otrādi, par doto un var atrast.

2. piemērs... Vispārējās populācijas kvantitatīvais raksturojums tiek sadalīts normāli. Parauga tilpumam tika atrasts vidējais paraugs un koriģētā standartnovirze. Novērtējiet nezināmo vispārējo vidējo līmeni, izmantojot ticamības intervālu ar ticamību.

Lēmums. Mēs to atradīsim. Izmantojot tabulu (4. pielikums), atrodiet: Atradīsim ticamības robežas:

Tātad ar ticamību nezināmais parametrs ir iekļauts ticamības intervālā.

3. Statistiskās hipotēzes jēdziens. Hipotēžu pārbaudes problēmas vispārīgs formulējums.

Statistisko hipotēžu pārbaude ir cieši saistīta ar parametru novērtēšanas teoriju. Dabaszinātnēs, tehnoloģijā, ekonomikā bieži vien, lai noskaidrotu šo vai citu nejaušo faktu, viņi ķeras pie hipotēžu formulēšanas, kuras var pārbaudīt statistiski, tas ir, balstoties uz izlases izlases novērojumu rezultātiem. Zem statistikas hipotēzes netiešas ir tādas hipotēzes, kas attiecas vai nu uz nejaušā mainīgā lieluma sadalījuma veidu, vai uz atsevišķiem parametriem. Tā, piemēram, statistiskā hipotēze ir tāda, ka darba ražīguma sadalījumam strādājošajiem, kas veic to pašu darbu vienādos apstākļos, ir normāls sadalījuma likums. Arī hipotēze, ka viena un tā paša veida paralēlu darba mašīnu ražoto detaļu vidējie izmēri savā starpā neatšķiras, būs statistiska.

Tiek saukta statistiskā hipotēze vienkāršs ja tas unikāli nosaka nejaušā mainīgā sadalījumu, pretējā gadījumā tiek saukta hipotēze sarežģīti.Piemēram, vienkārša hipotēze ir pieņēmums, ka nejaušais mainīgais parasti tiek sadalīts ar nulles cerību un dispersiju, kas ir vienāda ar vienu. Ja tiek pieņemts, ka nejaušam mainīgajam ir normāls sadalījums ar dispersiju, kas vienāda ar vienu, un matemātiskā cerība ir skaitlis no segmenta, tad šī ir grūta hipotēze. Vēl viens sarežģītas hipotēzes piemērs ir pieņēmums, ka nepārtraukts nejaušs mainīgais ar varbūtību ņem vērtību no intervāla, tādā gadījumā nejaušā mainīgā lieluma sadalījums var būt jebkura no nepārtraukto sadalījumu klases.

Daudzuma sadalījums bieži ir zināms, un no novērojumu izlases ir jāpārbauda pieņēmumi par šī sadalījuma parametru vērtībām. Šādas hipotēzes sauc parametrisks.

Tiek saukta pārbaudāmā hipotēze nulles hipotēze un to apzīmē ar. Kopā ar hipotēzi tiek apsvērta viena no alternatīvām (konkurējošām) hipotēzēm. Piemēram, ja tiek pārbaudīta hipotēze par parametra vienādību ar noteiktu vērtību, ti:, tad par alternatīvu hipotēzi var uzskatīt kādu no šīm hipotēzēm ::; :; :; :, kur ir dota vērtība ,. Alternatīvas hipotēzes izvēli nosaka konkrētais problēmas formulējums.

Tiek saukts noteikums, ar kuru tiek pieņemts lēmums pieņemt vai noraidīt hipotēzi kritērijs ... Tā kā lēmums tiek pieņemts, pamatojoties uz nejauša mainīgā lieluma novērojumu izlasi, ir jāizvēlas atbilstoša statistika, ko šajā gadījumā sauc par kritēriju par statistiku. Pārbaudot vienkāršu parametru hipotēzi: kā kritērija statistiku tiek izvēlēta tā pati statistika, kas parametru novērtēšanai.

Statistiskās hipotēzes pārbaude balstās uz principu, ka maz ticamus notikumus uzskata par neiespējamiem un notikumus, kas ir ticamāki, uzskata par ticamiem. Šo principu var īstenot šādi. Pirms izlases analīzes tiek noteikta noteikta neliela varbūtība, ko sauc nozīmīguma līmenis... Ļaujiet būt statistikas vērtību kopai un būt tādai apakškopai, ka, ja hipotēze ir patiesa, statistikas kritērija varbūtība ir vienāda ar, t.i. .

Apzīmēsim ar statistikas izlases vērtību, kas aprēķināta no novērojumu izlases. Kritērijs tiek formulēts šādi: noraidīt hipotēzi, ja; pieņem hipotēzi, ja. Tiek saukts kritērijs, kas pamatojas uz iepriekš noteikta nozīmīguma līmeņa izmantošanu nozīmīguma kritērijs... Tiek saukts visu kritēriju statistikas vērtību kopums, par kuru tiek pieņemts lēmums noraidīt hipotēzi kritiskā zona; teritoriju sauc pieņemšanas zona hipotēzes.

Nozīmības līmenis nosaka kritiskās zonas lielumu. Kritiskā reģiona pozīcija statistisko vērtību kopā ir atkarīga no alternatīvās hipotēzes formulējuma. Piemēram, ja hipotēze tiek pārbaudīta: un alternatīvā hipotēze tiek formulēta šādi: (), tad kritiskais reģions atrodas statistikas sadalījuma labajā (kreisajā) “astē”, tas ir, tā forma ir nevienlīdzība: (), kur un kur ir statistikas vērtības, kuras tiek pieņemtas attiecīgi ar varbūtību un ar nosacījumu, ka hipotēze ir patiesa. Šajā gadījumā tiek saukts kritērijs vienpusējs, attiecīgi labo un kreiso. Ja alternatīvu hipotēzi formulē šādi:, tad kritiskais reģions atrodas uz abām sadalījuma "astēm", ti, to nosaka nevienlīdzību kopa un; šajā gadījumā tiek saukts kritērijs divpusējs.

Att. 30 parāda kritiskā reģiona atrašanās vietu dažādām alternatīvām hipotēzēm. Šeit ir kritērija statistikas sadalījuma blīvums ar nosacījumu, ka hipotēze ir patiesa, ir hipotēzes pieņemšanas zona, .

Tādējādi parametru statistiskās hipotēzes pārbaudi, izmantojot nozīmīguma testu, var sadalīt šādās darbībās:

1) formulē pārbaudāmas () un alternatīvas () hipotēzes;

2) piešķir nozīmīguma līmeni; kā neatbilst novērojumiem; ja, tad pieņem hipotēzi, tas ir, pieņem, ka hipotēze nav pretrunā ar novērojumu rezultātiem.

Parasti, veicot 4. - 7. punktu, tiek izmantota statistika, kuras kvantiles ir tabulētas: statistika ar normālu sadalījumu, Studenta statistika, Fišera statistika.

3. piemērs... Saskaņā ar automašīnas dzinēja pases datiem degvielas patēriņš uz 100 km nobraukums ir 10 l... Paredzams, ka motora pārveidošanas rezultātā samazināsies degvielas patēriņš. Pārbaudes tiek veiktas pārbaudes 25 no nejauši izvēlētām automašīnām ar modernizētu motoru ar vidējo degvielas patēriņa paraugu 2005 100 km nobraukums pēc testa rezultātiem bija 9,3 l... Pieņemsim, ka degvielas patēriņa paraugu iegūst no normāli sadalītas populācijas ar vidējo un dispersiju. Ar nosacījumu, ka sākotnējās statistikas kritiskā reģiona hipotēze ir patiesa, t.i., vienāda ar nozīmības līmeni. Atrodiet pirmā un otrā veida kļūdu varbūtību kritērijam ar tik kritisko apgabalu. ir normāls sadalījums ar vienādu matemātisko gaidu un dispersiju. Otrā veida kļūdas varbūtību nosaka formula (11.2):

Tāpēc saskaņā ar pieņemto kritēriju 13,6% automašīnu ar degvielas patēriņu 9 l ieslēgts 100 km nobraukums tiek klasificēti kā transportlīdzekļi ar degvielas patēriņu 10 l.

4. Teorētiskās un empīriskās frekvences. Piekrišanas kritēriji.

Empīriskās frekvences - pieredzes (novērošanas) rezultātā iegūtas frekvences. Teorētiskās frekvences tiek aprēķināti, izmantojot formulas. Normāla izplatīšanas likumam tos var atrast šādi:

, (11.3)

Statistikas novērtēšanas jautājumi sasaista vienā veselumā tādus matemātiskās statistikas problemātiskos aspektus kā zinātniskā metodoloģija, nejaušie mainīgie, statistiskie sadalījumi utt. Jebkuru izlasi raksturo kļūdas, kas saistītas ar vienību nepilnīgu pārklājumu, mērījumu kļūdas un tamlīdzīgi. Šādas kļūdas reālajā dzīvē piešķir katrai hipotēzei (it īpaši tai, kas formulēta, pamatojoties uz ekonomiskiem secinājumiem) nejaušu, stohastisku raksturu. Neskatoties uz teorētisko hipotēžu paredzēto mainīgo skaitu, tiek pieņemts, ka dažāda veida kļūdu ietekmi var precīzi aprakstīt, izmantojot tikai vienu komponentu. Šī metodiskā pieeja ļauj mums aprobežoties ar viendimensiju varbūtības sadalījumu, vienlaikus novērtējot vairākus parametrus.

Statistiskā novērtēšana ir viens no diviem statistisko vērtējumu veidiem (otrais ir hipotēzes pārbaude). Tā ir īpaša veida metode, lai spriestu par vispārējās populācijas sadalījuma raksturlielumu (parametru) skaitliskajām vērtībām pēc šīs populācijas izlases datiem. Tas ir, ņemot vērā selektīvās novērošanas rezultātus, mēs cenšamies (ar vislielāko precizitāti) novērtēt noteiktu parametru vērtības, no kurām ir atkarīgs mūs interesējošās pazīmes (maināmās) sadalījums kopumā populācija. Tā kā izlasē ir tikai daļa no kopas vienībām (dažreiz ļoti mazs skaits), pastāv kļūdu risks. Neskatoties uz šī riska samazināšanos, palielinoties novērošanas vienību skaitam, tas joprojām notiek ar selektīvu novērošanu. Tādējādi lēmumam, kas pieņemts, pamatojoties uz izlases rezultātiem, ir varbūtības raksturs. Bet būtu nepareizi uzskatīt statistikas spriedumus tikai par varbūtību. Šī pieeja ne vienmēr ir pietiekama, lai izveidotu pareizus teorētiskus pieņēmumus par vispārējās populācijas parametriem. Lai sniegtu dziļāku pamatojumu, bieži nepieciešami vairāki papildu spriedumi. Piemēram, ir nepieciešams pēc iespējas tuvāk novērtēt vidējā kvalificēto darbinieku skaitu reģiona uzņēmumos. Šajā gadījumā tiek aprēķināts mainīgā lieluma x vidējais aritmētiskais no vispārējās populācijas, kuram ir normāls sadalījums. Saņēmis parauga paraugu šim atribūtam p vienībām, ir jāatrisina jautājums: kāda vērtība pēc izlases datiem jāuzskata par vistuvāko vidējam rādītājam vispārējā populācijā? Ir vairākas šādas vērtības, kuru matemātiskā cerība ir vienāda ar vēlamo parametru (vai tuvu tam): a) vidējais aritmētiskais; b) mode; c) mediāna; d) vidējais, ko aprēķina pēc variāciju diapazona utt.

No varbūtības viedokļa katru no iepriekš minētajiem lielumiem var uzskatīt par vislabāko tuvinājumu vēlamajam vispārējās populācijas parametram (x), jo katras no šīm funkcijām matemātiskā cerība (īpaši lieliem paraugiem) ir vienāda ar vidējais rādītājs. Šis pieņēmums ir saistīts ar faktu, ka, atkārtoti atkārtojot paraugu no tās pašas vispārējās populācijas, tiks iegūts "vidējs" pareizs rezultāts.

Pareizību "vidēji" izskaidro iegūto kļūdu pozitīvo un negatīvo noviržu atkārtojumu vienādība vispārējā vidējā vērtējumā, tas ir, vidējā kļūda vērtējumā būs nulle.

Praktiskos apstākļos parasti tiek organizēts viens paraugs, tāpēc pētnieku interesē jautājums par vēlama parametra precīzāku novērtēšanu, pamatojoties uz konkrētā parauga rezultātiem. Lai atrisinātu šādu problēmu, papildus secinājumiem, kas izriet tieši no abstraktā varbūtību aprēķina, ir nepieciešami papildu noteikumi, lai motivētu vislabāko tāmes tuvināšanu vēlamajam vispārējās populācijas parametram.

Pastāv pietiekams skaits veidu, kā novērtēt konstantes no izlases novērojumiem. Kuras no tām vislabāk risina specifiskas pētījuma problēmas - tiek aplūkota statistiskās novērtēšanas teorija. Tas pārbauda nosacījumus, kuriem jāpilda šis vai cits novērtējums, orientējas uz vērtējumiem, kas konkrētajos apstākļos ir vēlamāki. Vērtējumu teorija norāda uz viena vērtējuma pārākumu pār citu.

Kā jūs zināt, informācija, kas iegūta, pamatojoties uz izlasi, secinājumā nav kategoriska. Ja, piemēram, tika noskaidrots, ka pētītajām 100 dzīvnieku galvām ir veselīgas 99 slimības, tad pastāv iespēja, ka viens dzīvnieks, kurš palika nepārbaudīts, nes iespējamās slimības vīrusu. Tā kā tas ir maz ticams, tiek secināts, ka slimības nav. Vairumā gadījumu šis secinājums ir pilnībā pamatots.

Vadoties no šādiem secinājumiem praksē, eksperimentētājs (pētnieks) paļaujas nevis uz informācijas ticamību, bet tikai uz tās varbūtību.

Selektīvās novērošanas otra puse, kā jau tika atzīmēts, atrisina iegūto izlases novērtējumu ticamības pakāpes objektīvākās noteikšanas problēmu. Viņi mēģina nodrošināt visprecīzāko varbūtības izteiksmi šīs problēmas risināšanai, tas ir, mēs runājam par tāmes precizitātes pakāpes noteikšanu. Šeit pētnieks nosaka iespējamās neatbilstības robežas starp paraugā iegūto novērtējumu un tā vērtības faktisko vērtību vispārējā populācijā.

Novērtējuma precizitāte ir atkarīga no tā, kā to aprēķina saskaņā ar izlases datiem, un metodi vienību atlasei paraugam.

Novērtējumu iegūšanas metode ietver jebkuru skaitļošanas procedūru (metodi, likumu, algebrisko formulu). Tā ir statistikas novērtēšanas teorijas prioritāte. Atlases metodes rada jautājumus par paraugu ņemšanas tehniku.

Iepriekšminētais ļauj mums definēt jēdzienu "statistiskais novērtējums".

Statistiskā novērtēšana ir aptuvenā pieprasītā vispārējās populācijas parametra vērtība, kas iegūta no izlases rezultātiem un nodrošina iespēju pieņemt apzinātus lēmumus par nezināmajiem vispārējās populācijas parametriem.

Pieņemsim, ka ^ "ir teorētiskā sadalījuma nezināmā parametra ^ statistiskais novērtējums.

Izlases lielums no vispārējās populācijas atrada aprēķinus un 2 ^ "" n,

kam ir atšķirīga nozīme. Tāpēc novērtējumu ^ "var uzskatīt par

nejaušs mainīgais, +17 divi, 3 ~ "n - kā tā iespējamās vērtības. Kā izlases mainīgo to raksturo noteikta varbūtības blīvuma funkcija. Tā kā šī funkcija ir saistīta ar selektīva novērojuma (eksperimenta) rezultātu, to sauc par paraugu sadalījums. Šāda funkcija raksturo katras aplēses varbūtības blīvumu, izmantojot noteiktu paraugu skaitu

novērojumi. Ja pieņemam, ka statistiskais novērtējums ^ "ir noteiktas datu kopas algebriska funkcija un šāds kopums tiks iegūts, veicot izlases novērojumu, tad

kopumā tāme saņems izteicienu: ® n \u003d f (Xl.X2, ^ 3, ... X m).

Izlases aptaujas beigās šī funkcija vairs nav vispārējs novērtējums, bet iegūst noteiktu vērtību, tas ir, tas kļūst par kvantitatīvu novērtējumu (skaitli). Citiem vārdiem sakot, no iepriekš minētās funkcijas izteiksmes izriet, ka jebkuru no rādītājiem, kas raksturo izlases novērošanas rezultātus, var uzskatīt par novērtējumu. Izlases vidējais ir vispārējā vidējā novērtējums. No izlases aprēķinātā dispersija vai no tā aprēķinātās standartnovirzes vērtība ir atbilstošās vispārējās populācijas raksturlielumu aplēses utt.

Kā jau minēts, statistisko aprēķinu aprēķins negarantē kļūdu novēršanu. Secinājums ir tāds, ka pēdējam nevajadzētu būt sistemātiskam. Viņu klātbūtnei jābūt nejaušai. Apsvērsim šī noteikuma metodisko pusi.

Pieņemsim, ka aprēķins ^ "sniedz neprecīzu vispārējās populācijas novērtējuma ^ vērtību ar deficītu. Šajā gadījumā katra aprēķinātā vērtība \u003d 1,2,3, ..., n) būs mazāka par faktisko USD vērtību .

Šī iemesla dēļ nejaušā lieluma matemātiskā cerība (vidējā vērtība) būs mazāka nekā, tas ir, (M (^ n. Un gluži pretēji, ja tas dod novērtējumu ar pārsniegumu, tad matemātiskā cerība

nejaušais ^ "kļūst lielāks par $.

No tā izriet, ka statistiskās aplēses izmantošana, kuras matemātiskās cerības nav vienādas ar aprēķināto parametru, noved pie sistemātiskām kļūdām, tas ir, pie nejaušām kļūdām, kas vienā virzienā sagroza mērījumu rezultātus.

Rodas dabiska prasība: novērtējuma matemātiskajam gaidījumam ^ "jābūt vienādam ar novērtējamo parametru. Atbilstība šai prasībai vispār nenovērš kļūdas, jo tāmes izlases vērtības var būt lielākas vai mazākas par faktisko vispārējās populācijas aplēses vērtība. Bet kļūdas vienā un otrā virzienā no ^ vērtībām notiks (saskaņā ar varbūtības teoriju) ar tādu pašu biežumu. Līdz ar to šīs prasības ievērošana, parauga novērtējumam jābūt vienādam ar aplēsto parametru, izslēdzot sistemātiskas (neparastas) kļūdas, tas ir

M (in) = 6.

Statistikas novērtējuma izvēle, kas nodrošina vislabāko novērtējamā parametra tuvinājumu, ir svarīga problēma novērtējuma teorijā. Ja ir zināms, ka pētāmā nejaušā mainīgā lieluma sadalījums vispārējā populācijā atbilst normālā sadalījuma likumam, tad pēc izlases datiem ir jānovērtē matemātiskā cerība un standartnovirze. To izskaidro fakts, ka šie divi raksturlielumi pilnībā nosaka pamatus, uz kuriem balstās normālais sadalījums. Ja izmeklējamais nejaušais mainīgais tiek sadalīts saskaņā ar Puasona likumu, tiek aplēsts parametrs ^, jo tas nosaka šo sadalījumu.

Matemātiskajā statistikā izšķir šādas statistisko novērtējumu iegūšanas metodes no izlases datiem: momentu metode, maksimālās varbūtības metode.

Iegūstot novērtējumus pēc momentu metodes, vispārējās populācijas momentus aizstāj ar izlases momentiem (varbūtību ar svaru vietā tiek izmantotas frekvences).

Lai statistiskā aplēse sniegtu "vislabāko tuvinājumu" vispārīgajam raksturlielumam, tam jābūt ar vairākām īpašībām. Tie tiks apspriesti turpmāk.

Spēja izvēlēties labāko novērtējumu ir saistīta ar zināšanām par to pamatīpašībām un spēju klasificēt tāmes pēc šīm īpašībām. Matemātiskajā literatūrā "novērtējumu īpašības" dažkārt sauc par "prasībām tāmēm" vai "novērtējuma kritērijiem". Statistisko novērtējumu galvenās īpašības ir šādas: objektivitāte, efektivitāte, spēja, pietiekamība.

Ja pieņemam, ka izlases vidējā vērtība (~) un izlases dispersija

(Stv) ir atbilstošo vispārīgo raksturlielumu (^) aplēses, tas ir, to matemātiskās cerības, mēs ņemam vērā, ka ar lielu skaitu

parauga vienības, kuru nosaukumi raksturlielumi (~), tuvinās viņu matemātiskās cerības. Ja izlases vienību skaits ir mazs, šīs īpašības var ievērojami atšķirties no attiecīgajām matemātiskajām cerībām.

Ja par novērtējumu izvēlēto izlases raksturlielumu vidējais lielums atbilst vispārējā raksturlieluma vērtībai, novērtējumu sauc par objektīvu. Pierādījums, ka izlases vidējā matemātiskā cerība ir vienāda ar vispārējo vidējo (m (x) \u003d x), norāda, ka lielums ~ ir objektīvs vispārējs

vidēji. Situācija ir atšķirīga ar selektīvo dispersiju (o). viņu

M (ST2) \u003d - o-2. ...

matemātiskā cerība n, kas nav vienāda ar vispārējo

dispersija. Tātad, h ir tendenciozs a novērtējums. "Lai novērstu neobjektivitāti un iegūtu objektīvu novērtējumu, izlase

dispersija tiek reizināta ar korekciju n - 1 (tas izriet no veidojuma

c 2 _ 2 lpp p -1 "n -1

iepriekšminētais vienādojums: n).

Tādējādi ar nelielu paraugu dispersija ir:

2 CH, - ~) 2 p E (x un - ~) 2

kr \u003d x - \u003d -.

n n - 1 p -1

Daļa (P - 1) sauc par Besela korekciju. Besela matemātiķis pirmais konstatēja, ka izlases dispersija ir tendencioza vispārējās dispersijas aplēse, un koriģēja norādīto korekciju

vērtējumi. Maziem paraugiem korekcija (n - 1) būtiski atšķiras no 1. Palielinoties novērojumu vienību skaitam, tā ātri tuvojas 1. Par n<> 50 pazūd atšķirība starp pakāpēm, tas ir

° ~ "-. No visa iepriekš minētā seko šādas neobjektivitātes prasību definīcijas.

Neobjektīvs tiek saukts par statistisko novērtējumu, kura matemātiskā cerība jebkuram izlases lielumam ir vienāda ar vērtību

vispārējās populācijas parametrs, tas ir, m (^) \u003d 9; m (x) \u003d x.

Kategorija "matemātiskā cerība" tiek pētīta varbūtības teorijas gaitā. Šī ir nejauša mainīgā skaitliskā īpašība. Matemātiskā cerība ir aptuveni vienāda ar nejaušā lieluma vidējo vērtību. Diskrēta nejauša lieluma matemātiskās cerības izsaukt visu iespējamo vērtību reizinājumu pēc varbūtības. Pieņemsim, ka ir veikti n pētījumi, kuros izlases lielums x paņēma w 1 reizes lielāku par w vērtību, kas ir 2 reizes lielāka par W vērtību, un reizina ar vērtību X k. Šajā gadījumā W 1 + W 2 + W 3 + ... + W k \u003d n. Tad visu ņemtās vērtības x, ir vienāds

x 1 w 1 + x 2 w 2 + x 3 w 3 + ... + x k w k

Šo vērtību vidējais aritmētiskais būs:

X 1 w 1 + x 2 w 2 + x 3 w 3 + ... + x k w k - w 1 ^ w 2 ^ w 3 ^ ^ w k

p vai 1 p 2 p 3 p 1 p.

Tā kā n ir relatīvā frekvences ^ vērtība x ^ P - vērtības x 2 utt. relatīvais biežums, iepriekšējais vienādojums būs šāds:

X \u003d X 1 Nr. 1 + X 2 Nr. 2 + X 3 Nr. 3 + ... + X k N\u003e k

Ar lielu izlases novērojumu skaitu relatīvais biežums ir aptuveni vienāds ar notikuma iespējamību, tas ir

u\u003e 1 \u003d L; ^ 2 \u003d U \\ u003d ™ k \u003d Pk un tāpēc x 2 x 1 p 1 + x 2 p 2 + X 3 g. 3 + ... + X KPK. Tad

x ~ m (x) iegūtā aprēķina rezultāta varbūtības nozīme ir tāda, ka matemātiskā cerība ir aptuveni vienāda (jo precīzāka, jo lielāka ir izlase) nejaušā mainīgā lieluma novēroto vērtību aritmētiskais vidējais lielums [M (x -) \u003d ~ 1.

Neobjektivitātes kritērijs garantē sistemātisku kļūdu neesamību vispārējās populācijas parametru novērtēšanā.

Ņemiet vērā, ka izlases tāme (^) ir nejaušs mainīgais, kura vērtība var mainīties no vienas izlases uz otru. Lai novērtētu tā variāciju (izkliedi) ap vispārējās populācijas parametra matemātisko cerību # raksturo dispersija σ2 (^).

Ļaujiet būt unIN - - divi objektīvi parametra ^ novērtējumi, tas ir, M (iekšā ") \u003d 6 un M (d,) \u003d v. To dispersija iekšā 1 (iekš -) un iekšā r f -). Ar diviem 0 Artaudā dodiet priekšroku tam, kuram ir mazāka izkliede ap aplēsto parametru. Ja novērtējuma dispersija ^ "ir mazāka par dispersiju

novērtē Cn, tad tiek ņemts pirmais novērtējums, tas ir, ^ ".

Neobjektīvo novērtējumu ^, kuram ir mazākā dispersija starp visām iespējamām objektīvajām parametra ^ aplēsēm, kas aprēķināta pēc vienāda lieluma izlasēm, sauc par efektīvo novērtējumu. Šis ir otrais īpašums (prasība) vispārējās populācijas parametru statistiskajās aplēsēs. Jāatceras, ka vispārējās populācijas parametra faktiskais novērtējums, ievērojot noteiktu izplatības likumu, nesakrīt ar otrās sadaļas parametra efektīvo novērtējumu.

Apsverot liela izmēra izlases, statistikas aprēķiniem vajadzētu būt spēju īpašībai. Vērtēšana ir spējīga (lietots arī termins “derīgs” vai “norunāts”) nozīmē, ka jo lielāks izlases lielums, jo lielāka iespējamība, ka aplēses kļūda nepārsniegs nevienu nelielu pozitīvu

parametra ^ novērtējums 6 tiek saukts par konsekventu, ja tas ievēro lielu skaitļu likumu, tas ir, ir šāda vienādība:

/ wg | r iekšā <Е} = 1.

Kā redzam, šādu statistisko novērtējumu sauc par spējīgu, kas pie n varbūtības tuvojas aplēstajam parametram. Citiem vārdiem sakot, tā ir rādītāja vērtība, kas iegūta no izlases un tuvojas (varbūtībai sakrītot) lielu skaitļu likuma dēļ, kad izlases lielums palielinās līdz tā matemātiskajām cerībām. Piemēram, ja objektīvā novērtējuma dispersija pie n ir nulle, tad arī šis novērtējums ir konsekvents, jo tam ir mazākā iespējamā dispersija (noteiktam izlases lielumam).

Spēj novērtēt:

1) iezīmes īpatsvars izlasē, tas ir, biežums kā iezīmes īpatsvara novērtējums vispārējā populācijā;

2) izlases vidējais rādītājs kā vispārējā vidējā novērtējums;

3) izlases dispersija kā vispārējās dispersijas novērtējums;

4) paraugu asimetrijas un kurtozes koeficientus kā vispārējo koeficientu novērtējumu.

Matemātiskās statistikas literatūrā nez kāpēc ne vienmēr ir iespējams atrast statistikas novērtējumu ceturtās īpašības - derīguma - aprakstu. Novērtējums pietiekams (vai izsmeļošs) ir novērtējums, kas nodrošina (nodrošina) visas izlases informācijas aptveramības pilnīgumu par nezināmu vispārējās populācijas parametru. Tādējādi pietiekams novērtējums ietver visu izlasē iekļauto informāciju par pētītajiem vispārējās populācijas statistiskajiem raksturlielumiem. Neviens no trim iepriekš apsvērtajiem novērtējumiem nevar sniegt nepieciešamo papildu informāciju par pētāmo parametru kā pietiekamu statistisko novērtējumu.

Līdz ar to izlases ~ vidējais aritmētiskais ir objektīvais vispārējā x aritmētiskā vidējā novērtējums. Šīs aplēses neobjektivitātes faktors parāda: ja no vispārējās populācijas tiek ņemts liels skaits izlases paraugu, tad to vidējais *<отличались бы от генеральной средней в большую и меньшую сторону одинаково, то есть, свойство несмещенности хорошей оценки также показывает, что среднее значение бесконечно большого числа выборочных средних равно значению генеральной средней.

Simetriskās sadalījuma sērijās mediāna ir objektīvs novērtējums par vispārējo vidējo rādītāju. Ar nosacījumu, ka izlases lielums ir tuvu vispārējai populācijai (P ~ * N), mediāna var būt šādās rindās un konsekventi novērtēt vispārējo vidējo vērtību. Attiecībā uz efektivitātes kritēriju attiecībā pret mediānu kā aplēsi no vispārējās populācijas vidējā aritmētiskā, var pierādīt, ka paraugos lielā apjomā vidējā kvadrāta kļūda (Stme) ir vienāda ar 1,2533 vidējās vidējās kvadrātiskās kļūdas

). Tas ir, Stme *. Tāpēc mediāna nevar būt efektīvs vispārējās populācijas vidējā aritmētiskā novērtējums, jo tā vidējā kvadrātiskā kļūda ir lielāka nekā izlases vidējās aritmētiskās vidējās kvadrātiskās kļūdas. Turklāt vidējais aritmētiskais atbilst objektivitātes un spēju nosacījumiem, un tāpēc tas ir labākais vērtējums.

Šāds iestatījums ir arī iespējams. Vai parauga vidējais aritmētiskais var būt objektīvs vidējās vērtības novērtējums populācijas simetriskos sadalījumos, kuriem vidējās un vidējās vērtības sakrīt? Vai izlases vidējā vērtība ir konsekventa populācijas vidējā aplēse? Abos gadījumos atbilde ir jā. Populācijas mediānai (ar simetrisku sadalījumu) izlases vidējais aritmētiskais ir objektīvs un konsekvents novērtējums.

Atceroties, ka Stme ~ 1.2533st th, mēs nonākam pie secinājuma: izlases vidējais aritmētiskais, nevis mediāns ir efektīvāks pētāmās vispārējās populācijas mediānas novērtējums.

Katrs izlasē iekļautais raksturlielums ne vienmēr ir labākais atbilstošā raksturojuma novērtējums populācijā. Zināšanas par tāmes īpašībām ļauj atrisināt problēmu ne tikai izvēlēties tāmes, bet arī uzlabot tās. Kā piemēru mēs varam aplūkot gadījumu, kad aprēķini rāda, ka vairāku paraugu no vienas vispārējās populācijas standarta noviržu vērtības visos gadījumos izrādās mazākas par vispārējās populācijas standartnovirzi un atšķirība ir saistīta ar izlases lielumu. Reizinot izlases standartnovirzi ar korekcijas koeficientu, iegūstam uzlabotu populācijas standartnovirzes novērtējumu. Šādam korekcijas koeficientam izmanto Besela korekciju

p a es p

(P - 1), tas ir, lai novērstu neobjektivitāti, tiek iegūti aprēķini "P - 1. Šāda skaitliskā izteiksme parāda, ka parauga standarta novirze, ko izmanto kā novērtējumu, dod par zemu novērtētu vispārējās populācijas parametra vērtību.

Kā jūs zināt, izlases statistiskie raksturlielumi ir aptuvens vispārējās populācijas nezināmo parametru novērtējums. Pats vērtējums var būt viens skaitlis vai konkrēts punkts. Novērtējumu, ko nosaka viens skaitlis, sauc par punktu novērtējumu. Tādējādi izlases vidējais lielums (~) ir objektīvs un visefektīvākais vispārējā vidējā līmeņa (x) punktu novērtējums, un izlases dispersija) ir vispārējās

dispersija (). Ja apzīmēsim vidējās izlases vidējo kļūdu t <> tad vispārējā vidējā punktu novērtējumu var uzrakstīt kā x ± m °. Tas nozīmē, ka ~ ir vispārējā vidējā x novērtējums ar kļūdu, kas vienāda ar m ". Ir skaidrs, ka punktu x un o statistiskajam novērtējumam nevajadzētu būt sistemātiskai kļūdai

ooo ~~ o<в 2

aplēsto parametru x un. pārvērtēšanas vai nepietiekamas novērtēšanas puse. Kā minēts iepriekš, tiek sauktas aplēses, kas atbilst šim nosacījumam

objektīvs. Kāda ir parametra m kļūda? Tas ir daudzu specifisko kļūdu vidējais rādītājs:

Vispārējās populācijas parametra punktu novērtējums sastāv no tā, ka no dažādām iespējamām izlases aplēsēm vispirms tiek izvēlēts tas, kuram ir optimālās īpašības, un pēc tam tiek aprēķināta šīs tāmes vērtība. Iegūtā pēdējās aprēķinātā vērtība tiek uzskatīta par labāko tuvinājumu vispārējās populācijas parametra nezināmajai patiesajai vērtībai. Papildu aprēķini, kas saistīti ar iespējamās novērtēšanas kļūdas noteikšanu, ne vienmēr ir obligāti (atkarībā no vērtēšanas uzdevumu virishuvannya), bet parasti tie tiek veikti gandrīz vienmēr.

Apskatīsim piemērus, kā noteikt punktu novērtējumu vidēji pētītajām pazīmēm un to daļai kopējā populācijā.

Piemērs. Teritorijas graudaugi ir 20 000 hektāru. Veicot 10% lauku apsekojumu, tika iegūti šādi izlases raksturlielumi: vidējā raža - 30 centneri uz 1 ha, ražas dispersija - 4, augstražīgo kultūru sējumu platība - 1200 hektāri.

Kas jāzina par graudaugu vidējās ražas rādītāja vērtību reģionā un kura ir augstražīgo kultūru īpatsvara (īpatnējā svara) rādītāja skaitliskā vērtība pētītajā graudu platībā

novads? Tas ir, ir jānovērtē nosauktie parametri (x, z) vispārējā populācijā. Lai aprēķinātu aprēķinus, mums ir:

N \u003d 20 000; - = 20000 x 0,1 \u003d 2000; ~ \u003d 30;<т = л / 4; № 2000,

Kā jūs zināt, selektīvais vidējais aritmētiskais ir efektīvs novērtējums

vidējais aritmētiskais. Tādējādi var pieņemt, ka

vislabākais vispārējā parametra (^) novērtējums ir 30. Lai noteiktu pakāpi

tāmes precizitātei jāatrod tās vidējā (standarta) kļūda:

ua. n ~ un 2000. gada aprīlis h PPL

t \u003d L - (1--) = - (1--) = 0,04

v n N u2000 2000 ^

Rezultātā iegūtā kļūdas vērtība norāda uz augstu novērtējuma precizitāti. M vērtība šeit nozīmē, ka, atkārtojot šādus paraugus, parametra novērtēšanas kļūda vidēji būtu 0,04. Tas ir, aiz punkta

aplēsēs vidējā raža rajona saimniecībās būs x \u003d 30 - 0,04 centneri no hektāra.

Lai iegūtu labības graudaugu ražas īpatsvara rādītāja punktu novērtējumu graudaugu kopējā platībā, par labāko novērtējumu var ņemt parauga daļas rādītāju ¥ \u003d 0,6. Tādējādi mēs varam teikt, ka saskaņā ar novērojumu rezultātiem skaitlis 0,6 būs vislabākais vēlamās struktūras rādītāja novērtējums. Precizējot aprēķinus, jāaprēķina šīs aplēses vidējā kļūda: t un (1 _ p) un 0,6 (1 - 0,b) (1 \u003d 0,01

v p N v 2000 2000 un

Kā redzat, vidējā kļūda, novērtējot vispārīgo raksturlielumu, ir 0,01.

Iegūtais rezultāts nozīmē, ka, ja paraugu atkārtoja daudzas reizes ar tilpumu 2000 hektāri graudu, vidējā kļūda, pieņemot augstvērtīgo kultūru īpatsvara (īpatnējā svara) aprēķināto daļu graudaugu kultūru platībā rajona uzņēmumi būtu ± 0,01. Šajā gadījumā P \u003d 0,6 ± 0,01. Procentuālā izteiksmē ražas ar augstu ražību īpatsvars kopējā graudaugu platībā reģionā būs vidēji 60 ± I.

Aprēķini rāda, ka konkrētam gadījumam vislabākais vēlamās struktūras indeksa novērtējums būs skaitlis 0,6, un vidējā novērtēšanas kļūda vienā vai otrā virzienā būs aptuveni vienāda ar 0,01. Kā redzat, tāme ir diezgan precīza.

Ir vairākas zināmas metodes standarta novirzes punktu novērtēšanai gadījumos, kad izlase tiek veidota no vienību kopas ar normālu sadalījumu un parametrs nav zināms. Vienkāršs (visvieglāk aprēķināmais) novērtējums ir izlases variāciju diapazons (un °), reizināts ar korekcijas koeficientu, kas ņemts no standarta tabulām un kas ir atkarīgs no izlases lieluma (maziem paraugiem). Standarta novirzes parametru vispārējā populācijā var novērtēt, izmantojot aprēķināto izlases dispersiju, ņemot vērā brīvības pakāpju skaitu. Šīs dispersijas kvadrātsakne dod vērtību, kas tiks izmantota kā vispārējās standartnovirzes novērtējums).

Izmantojot parametra vērtību sadaļā "Aprēķiniet vispārējā vidējā (x") novērtējuma vidējo kļūdu ar iepriekš aprakstīto metodi.

Kā norādīts iepriekš, saskaņā ar spēju prasību, palielinoties izlases lielumam, ticamība konkrēta punkta novērtējuma precizitātei palielinās. Ir nedaudz grūti pierādīt šo teorētisko nostāju, izmantojot piemēru punktu novērtējumu. Izlases lieluma ietekme uz novērtējuma precizitāti ir acīmredzama, aprēķinot intervāla aplēses. Tie tiks apspriesti turpmāk.

39. tabulā parādīti visbiežāk izmantotie vispārējās populācijas parametru punktu aprēķini.

39. tabula

Pamata punktu aplēses _

Dažādos veidos aprēķināto aprēķinu vērtības pēc lieluma var nebūt vienādas. Šajā sakarā praktiskajos aprēķinos nevajadzētu nodarboties ar iespējamo iespēju secīgu aprēķināšanu, bet, paļaujoties uz dažādu novērtējumu īpašībām, izvēlēties vienu no tiem.

Ar nelielu novērojumu vienību skaitu punktu novērtējums lielākoties ir nejaušs, tāpēc nav ļoti uzticams. Tāpēc mazos paraugos tas var ļoti atšķirties no vispārējās populācijas aplēstās īpašības. Šī situācija noved pie rupjām kļūdām secinājumos, kas attiecas uz vispārējo populāciju, pamatojoties uz izlases rezultātiem. Šī iemesla dēļ maziem paraugiem tiek izmantoti intervālu aprēķini.

Atšķirībā no punktu novērtējuma, intervāla novērtējums dod punktu diapazonu, kurā jāatrodas populācijas parametram. Turklāt intervāla novērtējums norāda varbūtību, un tāpēc tas ir svarīgi statistiskajā analīzē.

Intervālu sauc par tāmi, kuru raksturo divi skaitļi - intervāla robežas, kas aptver (aptver) aplēsto parametru. Šāds novērtējums ir noteikts intervāls, kurā ar noteiktu varbūtību tiek atrasts vēlamais parametrs. Parauga punktu novērtējums tiek ņemts par intervāla centru.

Tādējādi intervālu aplēses ir turpmāka punktu novērtēšanas attīstība, ja šāda aplēse ir neefektīva mazam izlases lielumam.

Intervālu novērtēšanas problēmu vispārīgā formā var formulēt šādi: saskaņā ar izlases novērošanas datiem ir jāveido skaitliskais intervāls, attiecībā uz kuru var apgalvot ar iepriekš izvēlēto varbūtības līmeni, ka novērtējamais parametrs atrodas šajā intervālā.

Ja mēs ņemam pietiekami lielu izlases vienību skaitu, tad, izmantojot Ljapunova teorēmu, mēs varam pierādīt varbūtību, ka izlases kļūda nepārsniedz noteiktu doto vērtību a, tas ir,

Un ~ "*!" A vai I Nr. "G. YA.

Šī teorēma jo īpaši ļauj novērtēt aptuveno vienādību kļūdas:

- "P (n un - frekvence) x "x. n

Ja ^ * 2X3 ..., x ir ~ neatkarīgi nejauši mainīgie un n, tad to vidējā (x) varbūtība ir diapazonā no a līdz 6 un to var noteikt pēc vienādojumiem:

p (a(x e) 1 e 2 šie,

_un - E (x); _ in - E (x) DE ° a

Šajā gadījumā varbūtību P sauc par ticamības varbūtību.

Tādējādi vispārējā parametra novērtējuma ticamības varbūtība (ticamība), pamatojoties uz izlases tāmi, ir varbūtība, ar kādu tiek realizētas nevienlīdzības:

| ~ X | <а; | и, ориентир | <д

kur a ir robežvērtība pēc vidējā un proporcijas.

Robežas, kurās ar šo doto varbūtību var atrasties vispārīgais raksturlielums, sauc par ticamības intervāliem (ticamības robežām). Un šī intervāla robežas sauc par uzticības robežām.

Uzticības (vai tolerantās) robežas ir robežas, kuras pārsniedzot noteiktajam raksturlielumam nejaušu svārstību dēļ ir nenozīmīga varbūtība (L ^ 0,5; p 2<0,01; Л <0,001). Понятие "доверительный интервал" введено Дж.Нейман и К.Пирсоном (1950 г.). Это установленный по выборочным данным интервал, который с заданной вероятностью (доверительной вероятностью) охватывает (покрывает) настоящее, но неизвестно для нас значение параметра. Если уровня доверительной вероятности принять значения 0,95, то эта вероятность свидетельствует о том, что при частых приложениях данного способа (метода) вычислений доверительный интервал примерно в 95% случаев будет покрывать параметр. Доверительный интервал генеральной средней и генеральной доли определяется на основе приведенных выше неравенств, из которых

no tā izriet, ka ~ _A - x - ~ + A; Nr. _A - g. - Nr. + A.

Matemātiskajā statistikā parametra ticamību novērtē ar šādu trīs varbūtības līmeņu (dažreiz sauktu par "varbūtības sliekšņiem") vērtību: L \u003d 0,95; ^ 2 \u003d 0,99; P 3 \u003d 0,999. Varbūtības, par kurām tika nolemts ignorēt, tas ir un 1 = 0,05 ;; a2 \u003d 0,01; "3 \u003d 0,001 sauc par nozīmības līmeņiem jeb nozīmīguma līmeņiem. No dotajiem līmeņiem ticamus secinājumus sniedz varbūtība P 3 \u003d 0,999. Katrs ticamības līmenis atbilst noteiktai normalizētās novirzes vērtībai (sk. 27. tabulu). Ja mūsu rīcībā nav standarta varbūtības intervāla vērtību tabulu, šo varbūtību var aprēķināt ar noteiktu tuvināšanas pakāpi pēc formulas:

R (<) = - = ^ = 1 e "~ th un.

11. attēlā kopējā laukuma ēnotās daļas, ko ierobežo normālā līkne un abscisu ass, atbilst vērtībai <= ± 1;<= ± 2; <= и 3 и для которых вероятности равны 0,6287, 0,9545; 0,9973. При точечном оценке рассчитывается, как уже известно, средняя ошибка выборки, при интервальном - предельная.

Atkarībā no vienību izvēles principiem (atkārtoti vai bez atkārtotiem), strukturālās formulas izlases kļūdu aprēķināšanai

atšķiras pēc korekcijas lieluma (N).

Attēls: 11. Normāla sadalījuma līkne

40. tabulā ir parādītas formulas vispārējā parametra aplēses kļūdu aprēķināšanai.

Apskatīsim konkrētu vispārējās populācijas parametru intervālu novērtēšanas gadījumu pēc izlases novērojumu datiem.

Piemērs. Rajona saimniecību izlases veida aptaujā tika konstatēts, ka vidējais dienas govju izslaukums (x) ir 10 kg. Tīras šķirnes mājlopu īpatsvars kopējā mājlopu skaitā ir 80%. Tika konstatēts, ka izlases kļūda ar ticamības līmeni P \u003d 0,954 ir 0,2 kg; privātiem tīršķirnes liellopiem 1%.

Tādējādi robežas, kurās var atrasties vidējais rādītājs

sniegums būs 9,8<х <10,2; для генеральной доли скота -79 <Р <81.

Secinājums: ar varbūtību 0,954 var apgalvot, ka atšķirība starp govju selektīvo vidējo produktivitāti un kopējo produktivitāti ir 0,2 kg. Vidējais dienas izslaukums ir 9,8 un 10,2 kg. Šķirnes liellopu īpatsvars (īpatnējais svars) rajona uzņēmumos ir robežās no 79 līdz 81%, novērtēšanas kļūda nepārsniedz 1%.

40. tabula

Punktu un intervālu paraugu ņemšanas kļūdu aprēķināšana

Organizējot izlasi, ir svarīgi noteikt nepieciešamo izmēru (n). Pēdējais ir atkarīgs no aptaujāto iedzīvotāju vienību variācijas. Jo lielāks skaits, jo lielākam jābūt parauga lielumam. Atsauksmes starp izlases lielumu un tās robežkļūdu. Vēlmei iegūt mazāku kļūdu ir nepieciešams palielināt izlases kopu.

Nepieciešamo izlases lielumu nosaka, pamatojoties uz formulu izlases robežkļūdai (e) ar noteiktu varbūtības līmeni (P). Ar matemātisko pārveidojumu palīdzību tiek iegūtas formulas parauga lieluma aprēķināšanai (41. tabula).

41. tabula

Nepieciešamā parauga lieluma aprēķins _

Jāatzīmē, ka viss, kas norādīts saistībā ar statistikas aplēsēm, ir balstīts uz pieņēmumu, ka izlases kopa, kuras parametri tiek izmantoti aplēsē, iegūta, izmantojot atlases metodi (metodi), kas nodrošina izlases varbūtības.

Tajā pašā laikā, izvēloties novērtējuma ticamības līmeni, jāvadās pēc principa, ka tā līmeņa izvēle nav matemātiska problēma, bet to nosaka konkrētā atrisinātā problēma. Lai atbalstītu iepriekš minēto, apsveriet piemēru.

Piemērs. Pieņemsim, ka divos uzņēmumos gatavo (augstas kvalitātes) produktu izlaišanas varbūtība ir P \u003d 0,999, tas ir, produkta ar defektu iegūšanas varbūtība būs a \u003d 0,001. Vai matemātisko apsvērumu ietvaros, neinteresējoties par produkta būtību, ir iespējams izlemt jautājumu par to, vai pastāv liela iztrūkuma varbūtība a \u003d 0,001. Pieņemsim, ka viens uzņēmums ražo sējmašīnas, bet otrs ražo lidmašīnas kultūraugu pārstrādei. Ja 1000 sējmašīnām ir viens bojāts, tad to var pieļaut, jo 0,1% sējmašīnu pārkausēšana ir lētāka nekā tehnoloģiskā procesa atjaunošana. Ja 1000 lidmašīnās ir viens bojāts, tas neapšaubāmi izraisīs nopietnas sekas tā darbības laikā. Tātad pirmajā gadījumā laulības noslēgšanas varbūtība un = Var pieņemt 0,001, otrajā gadījumā tā nav. Šī iemesla dēļ ticamības līmeņa izvēlei aprēķinos kopumā un jo īpaši aprēķinu aprēķinos būtu jābalstās uz konkrētiem problēmas apstākļiem.

Atkarībā no pētījuma mērķiem var būt nepieciešams aprēķināt vienu vai divas ticamības robežas. Ja risināmās problēmas iezīmēm ir jāiestata tikai viena no augšējām vai apakšējām robežām, varat pārliecināties, ka varbūtība, ar kādu šī robeža tiek noteikta, būs lielāka nekā tad, ja abas robežas ir norādītas vienādai ticamības koeficienta vērtībai. 1

Ļaujiet noteikt ticamības robežas ar varbūtību P \u003d 0,95, tas ir,

95% gadījumu kopējais vidējais rādītājs (x) nebūs mazāks par zemāko

ticamības intervāls х ™ - х "m un ne vairāk kā augšējais ticamības intervāls

intervāls Xup - \u003d x + Šajā gadījumā tikai ar varbūtību a \u003d 0,05 (vai 5%) vidējais ģenerālis var pārsniegt norādītās robežas. Tā kā X sadalījums ir simetrisks, tad puse no šī līmeņa

varbūtība, tas ir, 2,5% kritīs gadījumam, kad x (x ™ ir otrā puse - gadījumā, ja x ^ x "^ -. No tā izriet, ka varbūtība, ka vidējais vispārējais var būt mazāks par tops

hvei ticamības robeža "-, ir vienāda ar 0,975 (tas ir, 0,95 +0,025). Tāpēc tiek radīti apstākļi, kad pie divām ticamības robežām mēs neievērojam

x kā mazāks par x "" *., kā arī lielāks vai Heerh. Zvanīšana

tikai vienu ticamības robežu, piemēram, Hver., mēs ignorējam tikai tos, kas pārsniedz šo robežu. Tajā pašā ticamības koeficienta X vērtībā nozīmīguma līmenis a šeit izrādās divas reizes mazāks.

Ja tiek aprēķinātas tikai raksturīgās vērtības, kas pārsniedz

(vai otrādi nepārsniedz) nepieciešamā parametra x vērtību, ticamības intervālu sauc par vienpusēju. Ja aplūkotās vērtības ir ierobežotas abās pusēs, ticamības intervālu sauc par divpusēju. No iepriekš minētā izriet, ka hipotēzes un vairāki kritēriji, jo īpaši X-Studenta tests, jāuzskata par vienpusēju un divpusēju. Tāpēc saskaņā ar divpusēju hipotēzi nozīmības līmenis tai pašai X vērtībai būs divreiz lielāks nekā vienpusējam. Ja mēs ar vienpusēju hipotēzi vēlamies atstāt tādu pašu nozīmīguma līmeni (un ticamības varbūtības līmeni) kā ar divpusēju hipotēzi, tad X vērtība jāņem mazāk. Šī funkcija tika ņemta vērā, sastādot Studenta kritēriju standarta tabulas (1. pielikums).

Ir zināms, ka no praktiskā viedokļa interesē ne tik daudz kā vispārējās vidējās vērtības iespējamās vērtības ticamības intervāli, bet gan maksimālās un minimālās vērtības, kopējais vidējais lielums nevar būt lielāks vai mazāks nekā ar dota (ticamības) varbūtība. Matemātiskajā statistikā tos sauc par garantēto maksimumu un garantēto vidējā minimumu. Nosaukto parametru apzīmēšana

attiecīgi caur un x ™, jūs varat rakstīt: XIII ™ \u003d x +; xship \u003d x ~.

Aprēķinot vispārējā vidējā līmeņa garantētās maksimālās un minimālās vērtības, kā vienpusējās ticamības intervāla robežas iepriekš minētajās formulās, vērtība 1 tiek uzskatīts par vienpusēju kritēriju.

Piemērs. 20 paraugu ņemšanas vietām tika noteikta cukurbiešu vidējā raža 300 n / ha. Šis vidējais paraugs raksturo atbilstošo

vispārējās populācijas parametrs (x) ar kļūdu 10 n / ha. Saskaņā ar aplēšu selektivitāti vispārējā vidējā raža var būt vai nu lielāka, vai mazāka par vidējo izlases x \u003d 300. Ar varbūtību P \u003d 0,95 var apgalvot, ka meklētais parametrs nebūs lielāks par XW "\u003d 300 +1,73 x10 \u003d 317,3 q / ha.

Vērtība 1 tiek ņemta par brīvības pakāpju skaitu ^ \u003d 20-1 ar vienpusēju kritisko apgabalu un nozīmīguma līmeni un = 0,05 (1. pielikums). Tātad ar varbūtību P \u003d 0,95 garantētais maksimālais iespējamais vispārējās vidējās ražas līmenis tiek lēsts 317 n / ha, tas ir, labvēlīgos apstākļos cukurbiešu vidējā raža nepārsniedz šo vērtību.

Dažās zināšanu nozarēs (piemēram, dabaszinātnēs) novērtēšanas teorija ir zemāka par statistisko hipotēžu pārbaudes teoriju. Ekonomikā statistikas novērtēšanas metodēm ir ļoti liela nozīme gan pētījumu rezultātu ticamības pārbaudē, gan dažāda veida praktiskos aprēķinos. Pirmkārt, tas attiecas uz pētīto statistisko populāciju punktu novērtējuma izmantošanu. Vislabākās tāmes izvēle ir galvenā novērtējuma problēma. Šādas izvēles iespēja ir saistīta ar zināšanām par statistisko novērtējumu pamatīpašībām (prasībām).

) matemātiskās statistikas problēmas.

Pieņemsim, ka pastāv varbūtību sadalījumu parametru saime (vienkāršības labad mēs apsvērsim nejaušo mainīgo sadalījumu un viena parametra gadījumu). Šeit ir skaitliskais parametrs, kura vērtība nav zināma. Tas ir jānovērtē, izmantojot pieejamo vērtību izlasi, ko rada šis sadalījums.

Ir divi galvenie novērtējumu veidi: punktu aplēses un ticamības intervāli.

Punktu novērtējums

Punktu novērtējums ir statistiskās aplēses veids, kurā nezināma parametra vērtību tuvina atsevišķs skaitlis. Tas ir, no izlases ir jānorāda funkcija (statistika)

,

kuras vērtība tiks uzskatīta par tuvinājumu nezināmajai patiesajai vērtībai.

Parametru punktu novērtējumu konstruēšanas vispārīgās metodes ietver: maksimālās varbūtības metode, momentu metode, kvantu metode.

Zemāk ir norādītas dažas īpašības, kurām punktu vērtējumi var būt vai var nebūt.

Konsekvence

Viena no visredzamākajām prasībām punktu novērtējumam ir tāda, ka pietiekami lieliem izlases lielumiem var sagaidīt samērā labu aptuvenu parametra patieso vērtību. Tas nozīmē, ka tāmei vajadzētu saplūst ar patieso vērtību. Šo vērtēšanas īpašību sauc konsekvence... Tā kā mēs runājam par nejaušiem mainīgajiem, kuriem ir dažādi konverģences veidi, šo īpašību var precīzi formulēt dažādos veidos:

Kad tiek izmantots tikai šis termins konsekvence, tad parasti mēs domājam vāju konsistenci, t.i. konverģence varbūtībā.

Konsekvences nosacījums ir praktiski obligāts visiem praksē izmantotajiem novērtējumiem. Nederīgas aplēses tiek izmantotas reti.

Neobjektivitāte un asimptotiska objektivitāte

Tiek izsaukts parametru novērtējums objektīvs, ja tā matemātiskā cerība ir vienāda ar aplēstā parametra patieso vērtību:

.

Vājāks stāvoklis ir asimptotiska objektivitāte, kas nozīmē, ka tāmes matemātiskās cerības saplūst ar parametra patieso vērtību, palielinoties izlases lielumam:

.

Ieteicamais vērtēšanas īpašums ir neobjektivitāte. Tomēr tā nozīmi nevajadzētu pārvērtēt. Visbiežāk pastāv objektīvi parametru aprēķini, un tad viņi mēģina ņemt vērā tikai tos. Tomēr var būt dažas statistikas problēmas, kurās objektīvi aprēķini nepastāv. Visslavenākais piemērs ir šāds: apsveriet Puasona sadalījumu ar parametru un iestatiet parametra novērtēšanas problēmu. Var pierādīt, ka šai problēmai nav objektīvas aplēses.

Vērtējumu un efektivitātes salīdzinājums

Lai salīdzinātu viena un tā paša parametra dažādos aprēķinus, tiek izmantota šāda metode: riska funkcija, kas mēra novērtējuma novirzi no parametra patiesās vērtības, un tiek uzskatīts labākais, kuram šī funkcija ir mazāka.

Visbiežāk aprēķina novirzes no patiesās vērtības kvadrāta matemātiskās cerības tiek uzskatītas par riska funkciju

Neobjektīviem aprēķiniem tā ir vienkārši dispersija.

Šai riska funkcijai ir zemāka robeža, ko sauc krāmera-Rao nevienlīdzība.

Tiek saukti (neobjektīvi) aprēķini, kuriem šī apakšējā robeža ir sasniegta (t.i., ar minimālo iespējamo dispersiju) efektīvs... Tomēr efektīvas aplēses esamība ir diezgan stingra prasība problēmai, kas ne vienmēr notiek.

Stāvoklis ir vājāks asimptotiskā efektivitāte, kas nozīmē, ka objektīvās aplēses dispersijas attiecība pret zemāko Cramer-Rao robežu mēdz būt vienota pie.

Ņemiet vērā, ka, ņemot vērā pietiekami plašus pieņēmumus par pētāmo sadalījumu, maksimālās varbūtības metode dod parametra asimptotiski efektīvu novērtējumu, un, ja ir efektīvs novērtējums, tad tas dod efektīvu novērtējumu.

Pietiekama statistika

Tiek saukta statistika pietiekams parametram, ja izlases nosacītais sadalījums ar nosacījumu, ka tas nav atkarīgs no parametra visiem.

Pietiekamas statistikas jēdziena nozīme ir saistīta ar sekojošo apstiprinājums... Ja ir pietiekama statistika un tā ir objektīvs parametru novērtējums, tad nosacītā matemātiskā cerība ir arī objektīvs parametru novērtējums, un tā dispersija ir mazāka vai vienāda ar sākotnējās aplēses dispersiju.

Atgādināsim, ka nosacītā matemātiskā cerība ir nejaušs mainīgais, kura funkcija ir. Tādējādi objektīvo novērtējumu klasē ir pietiekami ņemt vērā tikai tos, kas ir pietiekamas statistikas funkcijas (ja vien tādas pastāv konkrētajai problēmai).

(Neobjektīvais) efektīvā parametra novērtējums vienmēr ir pietiekama statistika.

Mēs varam teikt, ka pietiekamā statistika satur visu informāciju par novērtējamo parametru, kas ir iekļauta izlasē.

Statistikas aprēķini par vispārējās populācijas parametriem. Statistiskās hipotēzes

16. LEKCIJA

Ļaujiet tai izpētīt vispārējās populācijas kvantitatīvo raksturojumu. Pieņemsim, ka pēc teorētiskiem apsvērumiem bija iespējams noteikt, kāda veida iezīmei ir sadalījums. Tas rada problēmu novērtēt parametrus, kas nosaka šo sadalījumu. Piemēram, ja ir zināms, ka pētītais atribūts ir izplatīts vispārējā populācijā saskaņā ar normālo likumu, tad ir jānovērtē (aptuveni jāatrod) matemātiskā cerība un standartnovirze, jo šie divi parametri pilnībā nosaka normālo sadalījumu. Ja ir pamats uzskatīt, ka pazīmei ir Puasona sadalījums, ir jānovērtē parametrs, pēc kura nosaka šo sadalījumu.

Parasti sadalījumā pētniekam ir tikai datu paraugi, piemēram, novērojumu rezultātā iegūtās kvantitatīvās pazīmes vērtības (turpmāk pieņem, ka novērojumi ir neatkarīgi). Aprēķinātais parametrs tiek izteikts, izmantojot šos datus.

Uzskatot par neatkarīgu nejaušo mainīgo lielumiem , mēs varam teikt, ka statistiskā novērtējuma atrašana nezināmajam teorētiskā sadalījuma parametram nozīmē atrasto novēroto nejaušo mainīgo funkciju, kas dod aptuveno aplēstā parametra vērtību. Piemēram, kā parādīts turpmāk, lai aprēķinātu normālā sadalījuma matemātisko cerību, tiek izmantota funkcija (pazīmes novēroto vērtību vidējais aritmētiskais):

.

Tātad, statistiskā novērtēšana nezināmu teorētiskā sadalījuma parametru sauc par novēroto nejaušo mainīgo lielumu funkciju. Tiek saukts vispārējā populācijas nezināmā parametra statistiskais novērtējums, kas rakstīts ar vienu skaitli punkts... Apsveriet šādus punktu aprēķinus: neobjektīvs un objektīvs, efektīvs un konsekvents.

Lai statistikas aplēses sniegtu aplēsto parametru „labu” tuvinājumu, tām jāatbilst noteiktām prasībām. Norādīsim šīs prasības.

Ir teorētiskā sadalījuma nezināmā parametra statistiskā aplēse. Pieņemsim, ka, aprēķinot tilpumu, tiek atrasts novērtējums. Atkārtosim eksperimentu, tas ir, mēs no vispārējās populācijas iegūstam citu tāda paša lieluma izlasi un, pamatojoties uz tā datiem, atrodam tāmi utt. Daudzkārt atkārtojot eksperimentu, mēs iegūstam skaitļus , kas, vispārīgi runājot, atšķirsies viens no otra. Tādējādi novērtējumu var uzskatīt par nejaušu mainīgo un skaitļus - kā tā iespējamās nozīmes.

Ir skaidrs, ka, ja aprēķins dod aptuvenu vērtību ar pārsniegumu, tad katrs skaitlis, kas atrasts no izlases datiem, būs lielāks par patieso vērtību. Līdz ar to šajā gadījumā nejaušā lieluma matemātiskais (vidējais) būs lielāks par, tas ir. Acīmredzot, ja tas dod aptuvenu vērtību ar trūkumu, tad.


Tāpēc, izmantojot statistisko novērtējumu, kura matemātiskās cerības nav vienādas ar aplēsto parametru, rodas sistemātiskas (viencipara) kļūdas. Šī iemesla dēļ ir dabiski pieprasīt, lai tāmes matemātiskā cerība būtu vienāda ar novērtējamo parametru. Lai gan šīs prasības ievērošana kopumā kļūdas nenovērsīs (dažas vērtības ir lielākas un citas mazākas), dažādu zīmju kļūdas sastapsies vienlīdz bieži. Tomēr prasības izpilde garantē neiespējamību iegūt sistemātiskas kļūdas, tas ir, novērš sistemātiskas kļūdas.

Neobjektīvs sauc par statistisko novērtējumu (kļūdu), kura matemātiskā cerība ir vienāda ar aprēķināto parametru jebkuram izlases lielumam, tas ir.

Pārvietots sauc par statistisko novērtējumu, kura matemātiskās cerības nav vienādas ar aprēķināto parametru jebkuram izlases lielumam, tas ir.

Tomēr būtu kļūdaini uzskatīt, ka objektīvs novērtējums vienmēr dod labu aptuveno novērtējamā parametra tuvinājumu. Patiešām, iespējamās vērtības var būt ļoti izkaisītas ap to vidējo, tas ir, dispersija var būt ievērojama. Šajā gadījumā novērtējums, kas iegūts, piemēram, no vienas izlases datiem, var izrādīties ļoti tālu no vidējās vērtības un līdz ar to arī no paša aplēstā parametra. Tādējādi, ņemot vērā aptuveno vērtību, mēs pieļausim lielu kļūdu. Ja tiek prasīts, lai dispersija būtu maza, tiks izslēgta liela kļūdas iespējamība. Šī iemesla dēļ statistiskajam novērtējumam tiek uzlikta efektivitātes prasība.

Efektīvs ir statistiska aplēse, kurai (noteiktam izlases lielumam) ir mazākā iespējamā dispersija.

Turīgs sauc par statistisko novērtējumu, kura varbūtība ir tendence uz aplēsto parametru, tas ir, vienādība ir patiesa:

.

Piemēram, ja objektīvās aplēses dispersijas vērtība ir nulle, tad arī šāds novērtējums ir konsekvents.

Apsveriet jautājumu par to, kuras izlases īpašības ir vislabākās objektivitātes, efektivitātes un konsekvences ziņā, lai novērtētu vispārējo vidējo un dispersiju.

Ļaujiet pētīt diskrēto vispārējo populāciju attiecībā uz kādu kvantitatīvo raksturlielumu.

Vispārējā sekundārā sauc par vispārējās populācijas atribūta vērtību vidējo aritmētisko. To aprēķina pēc formulas:

§ - ja visas apjoma vispārējās populācijas raksturlieluma vērtības ir atšķirīgas;

§ - ja vispārējās populācijas atribūta vērtībām ir atbilstošas \u200b\u200bfrekvences, un. Tas ir, vispārējais vidējais ir raksturīgo vērtību vidējais svērtais svars, kas vienāds ar atbilstošajām frekvencēm.

Komentēt: Ļaujiet kopējā apjoma populācijā saturēt objektus ar atšķirīgām atribūta vērtībām. Iedomāsimies, ka viens objekts no šīs kolekcijas tiek ņemts nejauši. Varbūtība, ka tiks izgūts, piemēram, objekts ar objekta vērtību, acīmredzami ir. Jebkuru citu objektu var iegūt ar tādu pašu varbūtību. Tādējādi pazīmes vērtību var uzskatīt par nejaušu mainīgo, kura iespējamām vērtībām ir vienādas varbūtības, vienādas. Šajā gadījumā nav grūti atrast matemātisko cerību:

Tātad, ja mēs uzskatām vispārējās populācijas aptaujāto pazīmi par nejaušu mainīgo, tad pazīmes matemātiskās cerības ir vienādas ar šīs pazīmes vispārējo vidējo rādītāju: Mēs ieguvām šo secinājumu, pieņemot, ka visiem vispārējās populācijas objektiem ir dažādas atribūta vērtības. Tas pats rezultāts tiks iegūts, ja pieņemsim, ka vispārējā populācijā ir vairāki objekti ar vienādu atribūta vērtību.

Apkopojot iegūto rezultātu vispārējai populācijai ar nepārtrauktu raksturlieluma sadalījumu, mēs definējam vispārējo vidējo rādītāju kā raksturlieluma matemātisko cerību: .

Ļaujiet iegūt tilpuma paraugu, lai pētītu vispārējo populāciju attiecībā uz kvantitatīvo atribūtu.

Selektīvs vidējais sauc par izlases atribūta vērtību vidējo aritmētisko. To aprēķina pēc formulas:

§ - ja visas apjoma izlases populācijas raksturlieluma vērtības ir atšķirīgas;

§ - ja parauga atribūta vērtībām ir atbilstošas \u200b\u200bfrekvences, un. Tas ir, vidējais izlases lielums ir raksturīgo vērtību vidējais svērtais svars, kas vienāds ar atbilstošajām frekvencēm.

Komentēt: no viena parauga atrastais vidējais parauga lielums acīmredzami ir noteikts skaitlis. Ja no vienas un tās pašas vispārējās populācijas mēs iegūstam citus vienāda lieluma paraugus, tad izlases vidējais lielums mainīsies no parauga uz citu. Tādējādi izlases vidējo vērtību var uzskatīt par nejaušu mainīgo, un tāpēc mēs varam runāt par izlases vidējā sadalījumu (teorētisko un empīrisko) un par šī sadalījuma skaitliskajiem raksturlielumiem, jo \u200b\u200bīpaši par matemātisko cerību un izlases sadalījums.

Turklāt, ja vispārējais vidējais lielums nav zināms un ir nepieciešams to novērtēt pēc izlases datiem, tad izlases vidējo vērtību ņem par vispārējā vidējā novērtējumu, kas ir objektīvs un konsekvents novērtējums (mēs iesakām šo apgalvojumu pierādīt neatkarīgi ). No iepriekš minētā izriet, ka, ja izlases vidējie rezultāti tiek atrasti vairākiem pietiekami liela tilpuma paraugiem no vienas un tās pašas vispārējās populācijas, tad tie būs aptuveni vienādi. Šis ir īpašums izlases līdzekļu ilgtspēja.

Ņemiet vērā, ka, ja abu populāciju dispersijas ir vienādas, tad izlases vidējā vērtība tuvāk vispārējai populācijai nav atkarīga no izlases lieluma un vispārējās populācijas lieluma attiecības. Tas ir atkarīgs no izlases lieluma: jo lielāks ir izlases lielums, jo mazāk izlases vidējais lielums atšķiras no vispārējā. Piemēram, ja 1% objektu tika izvēlēti no vienas populācijas un 4% objektu tika atlasīti no citas populācijas, un pirmās izlases apjoms izrādījās lielāks nekā otrais, tad pirmās izlases vidējais lielums atšķirsies mazāk nekā atbilstošo vispārējo vidējo rādītāju nekā otro.