Αξιολόγηση των στατιστικών χαρακτηριστικών τυχαίων δεδομένων. Ανάλυση της ομοιότητας των διανομών. Στατιστικές αξιολογήσεις σημείων

Ας πάρουμε για να εξερευνήσετε το ποσοτικό σημάδι του γενικού πληθυσμού. Ας υποθέσουμε ότι από τις θεωρητικές εκτιμήσεις ήταν δυνατόν να διαπιστωθεί ποια διανομή είναι ένα σημάδι. Το καθήκον της εκτίμησης των παραμέτρων που καθορίζεται από αυτή τη διανομή. Για παράδειγμα, εάν γνωρίζετε ότι το χαρακτηριστικό που μελετήθηκε διανέμεται στον γενικό πληθυσμό σύμφωνα με το κανονικό νόμο, είναι απαραίτητο να εκτιμηθεί η μαθηματική προσδοκία και η τυπική απόκλιση, αφού αυτές οι δύο παραμέτρους καθορίζουν πλήρως την κανονική κατανομή. Εάν υπάρχει λόγος να πιστεύουμε ότι το χαρακτηριστικό έχει τη διανομή του Poisson, τότε είναι απαραίτητο να εκτιμηθεί η παράμετρος που προσδιορίζεται αυτή η κατανομή. Συνήθως υπάρχουν μόνο δεδομένα δειγματοληψίας που λαμβάνονται ως αποτέλεσμα των παρατηρήσεων: ,, ... ,. Μέσω αυτών των δεδομένων και εκφράστε την εκτιμώμενη παράμετρο. Λαμβάνοντας υπόψη, ..., όπως και οι αξίες των ανεξάρτητων τυχαίων μεταβλητών, ..., μπορούν να ειπωθούν ότι μπορεί να βρεθεί ότι σημαίνει να βρούμε μια λειτουργία από τις παρατηρούμενες τυχαίες μεταβλητές, οι οποίες δίδουν κατά προσέγγιση αξία του εκτιμώμενου παράμετρος.

Ετσι, Στατιστική αξιολόγηση Η άγνωστη παράμετρος της θεωρητικής κατανομής ονομάζεται λειτουργία από τις παρατηρούμενες τυχαίες μεταβλητές. Η στατιστική αξιολόγηση της άγνωστης παραμέτρου του γενικού πληθυσμού καλείται σε έναν αριθμό που ονομάζεται Λαιμός. Οι ακόλουθες εκτιμήσεις σημείων συζητούνται παρακάτω: Αντιστάθμιση και ασταθής, αποτελεσματική και πλούσια.

Προκειμένου οι στατιστικές εκτιμήσεις να δώσουν καλές προσεγγίσεις στις εκτιμώμενες παραμέτρους, πρέπει να πληρούν ορισμένες απαιτήσεις. Καθορίζουμε αυτές τις απαιτήσεις. Αφήστε να υπάρξει στατιστική αξιολόγηση μιας άγνωστης παραμέτρου της θεωρητικής κατανομής. Ας υποθέσουμε ότι η βαθμολογία βρίσκεται στην ένταση του δείγματος. Θα επαναλάβουμε την εμπειρία, δηλαδή, η εξόρυξη του γενικού συστοιχιού τους είναι ένα άλλο δείγμα του ίδιου όγκου και σύμφωνα με τα δεδομένα του θα βρούμε μια αξιολόγηση κ.λπ. λαμβάνουμε τον αριθμό, ..., το οποίο θα είναι διαφορετικό. Έτσι, η εκτίμηση μπορεί να θεωρηθεί ως τυχαίο ποσό και τον αριθμό, ..., - ως πιθανές τιμές.

Εάν η εκτίμηση δίνει μια κατά προσέγγιση τιμή με περίσσεια, τότε ο αριθμός που βρίσκεται σύμφωνα με τα δεδομένα δείγματος ( ) Θα υπάρξει πιο αληθινή έννοια. Κατά συνέπεια, η μαθηματική προσδοκία (μέση τιμή) μιας τυχαίας μεταβλητής θα είναι μεγαλύτερη από, δηλ. Εάν δίνει μια κατά προσέγγιση αξία με το μειονέκτημα, τότε.

Έτσι, η χρήση μιας στατιστικής αξιολόγησης, η μαθηματική προσδοκία των οποίων δεν είναι ίση με την εκτιμώμενη παράμετρο, θα οδηγούσε σε συστηματικά σφάλματα. Ως εκ τούτου, είναι απαραίτητο να απαιτηθεί η μαθηματική προσδοκία της αξιολόγησης να είναι ίση με την παράμετρο. Η συμμόρφωση με την απαίτηση εξαλείφει τα συστηματικά σφάλματα.

Καταλαβαίνουν Καλέστε μια στατιστική αξιολόγηση, η μαθηματική προσδοκία των οποίων ισούται με την εκτιμώμενη παράμετρο, δηλ.

Εκτοπισμένος Καλέστε μια στατιστική αξιολόγηση, η μαθηματική προσδοκία δεν είναι ίση με την εκτιμώμενη παράμετρο.

Ωστόσο, είναι λάθος να υποθέσουμε ότι η ασταθής εκτίμηση παρέχει πάντα μια καλή προσέγγιση της εκτιμώμενης παραμέτρου. Πράγματι, οι πιθανές τιμές μπορούν να διασκορπιστούν έντονα γύρω από τη μέση τιμή του, δηλ. Η διακύμανση του μεγέθους μπορεί να είναι σημαντική. Στην περίπτωση αυτή, η αξιολόγηση που βρίσκεται σύμφωνα με ένα δείγμα, για παράδειγμα, μπορεί να είναι πολύ απομακρυσμένη από τη μέση τιμή και επομένως, από την πιο εκτιμώμενη παράμετρο. Λαμβάνοντας ως κατά προσέγγιση αξία, θα επιτρέψουμε ένα μεγάλο λάθος. Εάν χρειάζεστε μια μικρή διασπορά να είναι μικρή, τότε η δυνατότητα να επιτρέπεται σε μεγάλο σφάλμα. Επομένως, η στατιστική αξιολόγηση παρέχει απαιτήσεις απόδοσης.

Αποτελεσματικός Καλούν μια στατιστική αξιολόγηση, η οποία (για μια δεδομένη δειγματοληψία) έχει τη μικρότερη δυνατή διασπορά. Όταν εξετάζουμε τα δείγματα μεγάλου ποσού στις στατιστικές εκτιμήσεις, γίνεται απαίτηση.

Πλούσιος Καλέστε μια στατιστική αξιολόγηση, η οποία, όταν προσπαθεί για πιθανότητα για την εκτιμώμενη παράμετρο. Για παράδειγμα, εάν η διασπορά μιας μη καθοριστικής εκτίμησης προσπαθεί να μηδενική, μια τέτοια αξιολόγηση είναι επίσης πλούσια.

Εξετάστε το ζήτημα της οποίας τα επιλεκτικά χαρακτηριστικά είναι τα καλύτερα υπό την έννοια της μη ικανότητας, της αποτελεσματικότητας και της συνέπειας αξιολογεί το γενικό όριο και τη διασπορά.

Αφήστε το διακριτό γενικό σύνολο σε σχέση με το ποσοτικό χαρακτηριστικό να μελετηθεί. Γενική μέση Ονομάζεται μέσες αριθμητικές αξίες του σημείου του γενικού πληθυσμού. Μπορεί να υπολογιστεί από φόρμουλες ή , όπου - οι αξίες του σημείου του γενικού πληθυσμού του όγκου - τις αντίστοιχες συχνότητες, και.

Ας υποθέσουμε από τον γενικό πληθυσμό ως αποτέλεσμα ανεξάρτητων παρατηρήσεων σχετικά με την ποσοτική βάση, το δείγμα του όγκου με τις τιμές του χαρακτηριστικού . Επιλεκτικός μέσος όρος Καλέστε το μέσο αριθμητικό επιλεκτικό αδρανές. Μπορεί να υπολογιστεί από φόρμουλες ή , όπου - οι τιμές του χαρακτηριστικού στις υποβολές του όγκου - τις αντίστοιχες συχνότητες, και.

Εάν ο γενικός είναι άγνωστος είναι άγνωστος και απαιτείται να το αξιολογηθεί σύμφωνα με τα δεδομένα δείγματος, τότε ως εκτίμηση της γενικής μέσης, το επιλεκτικό μέσο λαμβάνεται, το οποίο δεν σχετίζεται και μια πλούσια αξιολόγηση. Επομένως, εάν πολλά δείγματα είναι αρκετά μεγάλα, από τον ίδιο γενικό πληθυσμό, θα βρεθούν επιλεκτικοί μέσοι όροι, τότε θα είναι περίπου ίσοι μεταξύ τους. Αυτό αποτελείται από ένα ακίνητο. Αειφορία του μέσου δείγματος.

Σημειώστε ότι εάν η διασπορά δύο συσσωματωμάτων είναι η ίδια, τότε η εγγύτητα του μέσου δείγματος στο γενικά δεν εξαρτάται από την αναλογία του μεγέθους δείγματος με τον όγκο του γενικού πληθυσμού. Εξαρτάται από το μέγεθος του δείγματος: το μέγεθος του δείγματος περισσότερο, ο λιγότερο επιλεκτικός μέσος όρος διαφέρει από το γενικό.

Προκειμένου να χαρακτηριστεί η σκέδαση των τιμών του ποσοτικού χαρακτηριστικού του γενικού πληθυσμού γύρω από τη μέση τιμή του, εισάγεται το συνοπτικό χαρακτηριστικό - η γενική διασπορά. Γενική διασπορά Ονομάζεται τα μέσα αριθμητικά τετράγωνα των αποκλίσεων των αξιών ενός σημείου γενικού πληθυσμού από τη μέση αξία τους, η οποία υπολογίζεται από τους τύπους: , ή .

Προκειμένου να χαρακτηριστεί η σκέδαση των παρατηρούμενων τιμών του ποσοτικού χαρακτηριστικού του δείγματος γύρω από τη μέση τιμή του, εισάγεται συνοπτικό χαρακτηριστικό - μια ελευόμενη διασπορά. Επιλεκτική διασπορά Ονομάζεται τα μέσα αριθμητικά τετράγωνα των αποκλίσεων των παρατηρούμενων τιμών του χαρακτηριστικού από τη μέση τιμή τους, η οποία υπολογίζεται από τους τύπους: , ή .

Εκτός από τη διασπορά, να χαρακτηρίσει τη διασπορά των τιμών του χαρακτηριστικού του γενικού (επιλεκτικού) που τίθεται γύρω από τη μέση τιμή του, χρησιμοποιεί συνοπτικό χαρακτηριστικό - μια μέση τετραγωνική απόκλιση. Γενική δευτερεύουσα τετραγωνική απόκλιση Καλέστε μια τετραγωνική ρίζα από τη γενική διασπορά :. Επιλεκτική μεσαία τετραγωνική απόκλιση Καλέστε την τετραγωνική ρίζα από την επιλεκτική διασπορά:

Ας υποθέσουμε από τον γενικό πληθυσμό ως αποτέλεσμα ανεξάρτητων παρατηρήσεων σχετικά με την ποσοτική βάση, το δείγμα του όγκου ανακτάται. Που απαιτούνται σύμφωνα με τα δεδομένα δείγματος για την αξιολόγηση της άγνωστης γενικής διασποράς. Εάν λάβετε μια εκλεκτική διασπορά ως εκτίμηση της γενικής διασποράς, τότε η αξιολόγηση αυτή θα οδηγήσει σε συστηματικά σφάλματα, δίνοντας μια υποτιμημένη αξία της γενικής διασποράς. Αυτό εξηγείται από το γεγονός ότι η επιλεκτική διασπορά είναι μια εκτοπισμένη βαθμολογία. Με άλλα λόγια, η μαθηματική προσδοκία της διασποράς δείγματος δεν είναι ίση με την εκτιμώμενη γενική διασπορά, αλλά εξίσου .

Είναι εύκολο να διορθωθεί η επιλεκτική διασπορά έτσι ώστε η μαθηματική του προσδοκία να είναι ίση με τη γενική διασπορά. Αρκεί να πολλαπλασιάσει το κλάσμα. Ως αποτέλεσμα, λαμβάνουμε μια διορθωμένη διασπορά, η οποία συνήθως δηλώνεται. Η διορθωμένη διασπορά θα είναι μια άκαυστη εκτίμηση της γενικής διασποράς: .

2. Εκτιμήσεις διαστήματος.

Μαζί με την εκτίμηση του σημείου, η στατιστική θεωρία της εκτίμησης των παραμέτρων ασχολείται με την εκτίμηση του διαστήματος. Το πρόβλημα της εκτίμησης του διαστήματος μπορεί να διαμορφωθεί ως εξής: Σύμφωνα με τα δεδομένα δείγματος, μπορεί να κατασκευαστεί με προκαθορισμένη πιθανότητα με προκαθορισμένη πιθανότητα ότι η παράμετρος εκτιμάται εντός αυτού του διαστήματος. Η εκτίμηση του διαστήματος είναι ιδιαίτερα απαραίτητη με ένα μικρό αριθμό παρατηρήσεων όταν η εκτίμηση σημείων είναι κατά κύριο λόγο τυχαία, λίγο αξιόπιστη.

Εμπιστευτικό διάστημα Για μια παράμετρο, ένα τέτοιο διάστημα ονομάζεται σε σχέση με το οποίο είναι δυνατόν με μια προκαθορισμένη πιθανότητα κοντά σε ένα, να υποστηρίξει ότι περιέχει μια άγνωστη τιμή της παραμέτρου, δηλ. . Όσο μικρότερος είναι ο αριθμός για την επιλεγμένη πιθανότητα, τόσο ακριβέστερα η αξιολόγηση της άγνωστης παραμέτρου. Αντίθετα, αν αυτό είναι ένας μεγάλος αριθμός, τότε η αξιολόγηση που έγινε με αυτό το διάστημα είναι λίγο κατάλληλο για πρακτική. Δεδομένου ότι τα άκρα του διαστήματος εμπιστοσύνης εξαρτώνται από τα στοιχεία του δείγματος, οι τιμές μπορούν επίσης να αλλάξουν από το δείγμα δείγματος. Η πιθανότητα ονομάζεται εμπιστοσύνη πιθανότητα (αξιοπιστία). Συνήθως, η αξιοπιστία της αξιολόγησης ορίζεται εκ των προτέρων και ο αριθμός κοντά στο ένα είναι όπως λαμβάνεται όπως λαμβάνουν. Η επιλογή μιας εμπιστοσύνης πιθανότητας δεν είναι μια μαθηματική εργασία, αλλά καθορίζεται από ένα συγκεκριμένο πρόβλημα που επιλύεται. Πιο συχνά καθορισμένη αξιοπιστία ίση με? ? .

Παρουσιάζουμε χωρίς την παραγωγή του διαστήματος εμπιστοσύνης για τον γενικό μέσο όρο με γνωστό νόημα της μέσης τετραγωνικής απόκλισης, υπό την προϋπόθεση ότι η τυχαία τιμή (ποσοτική) κατανέμεται κανονικά:

Όπου - ο καθορισμένος αριθμός κοντά σε μία και οι τιμές της λειτουργίας δίδονται στο προσάρτημα 2.

Η έννοια αυτής της αναλογίας έχει ως εξής: με αξιοπιστία μπορεί να υποστηριχθεί ότι το διάστημα εμπιστοσύνης ( ) Καλύπτει μια άγνωστη παράμετρο, η ακρίβεια αξιολόγησης είναι ίση. Ο αριθμός καθορίζεται από την ισότητα, ή. Ο πίνακας (προσάρτημα2) βρει ένα επιχείρημα στο οποίο αντιστοιχεί η τιμή της λειτουργίας LAPLE.

Παράδειγμα 1.. Η τυχαία τιμή έχει μια κανονική κατανομή με μια γνωστή μέση τετραγωνική απόκλιση. Βρείτε διαστήματα εμπιστοσύνης για να αξιολογήσετε τον άγνωστο γενικό μέσο όρο με τον επιλεκτικό μέσο όρο εάν το μέγεθος των δειγμάτων και η αξιοπιστία της αξιολόγησης καθορίζεται.

Απόφαση. Θα βρούμε. Από τον λόγο το έχουμε αυτό. Πίνακας (προσάρτημα 2) Βρίσκουμε. Βρείτε ακρίβεια της αξιολόγησης . Τα διαστήματα εμπιστοσύνης θα είναι τα εξής: . Για παράδειγμα, εάν, το διάστημα εμπιστοσύνης έχει τα ακόλουθα σύνορα εμπιστοσύνης: . Έτσι, οι τιμές μιας άγνωστης παραμέτρου, σύμφωνα με τα δεδομένα δείγματος, ικανοποιούν την ανισότητα .

Το διάστημα εμπιστοσύνης για τη γενική συντονιστική κανονική κατανομή του χαρακτηριστικού σε άγνωστη τιμή της μέσης τετραγωνικής απόκλισης ορίζεται από την έκφραση .

Από εδώ προκύπτει ότι με αξιοπιστία μπορεί να υποστηριχθεί ότι το διάστημα εμπιστοσύνης καλύπτει μια άγνωστη παράμετρο.

Υπάρχουν έτοιμα τραπέζια (προσάρτημα 4), χρησιμοποιώντας τα οποία, σύμφωνα με τα καθορισμένα και να βρουν την πιθανότητα και την πλάτη, στο καθορισμένο και μπορεί να βρεθεί.

Παράδειγμα 2.. Το ποσοτικό σημάδι του γενικού πληθυσμού κατανέμεται κανονικά. Με ένταση δείγματος βρέθηκε μέσο δείγματος και διορθωμένη απόκλιση RMS. Αξιολογήστε τον άγνωστο μέσο μέσο όρο με τη βοήθεια ενός διαστήματος εμπιστοσύνης με αξιοπιστία.

Απόφαση. Θα βρούμε. Χρησιμοποιώντας τον πίνακα (προσάρτημα 4) και βρείτε :. Βρίσκουμε τα σύνορα εμπιστοσύνης:

Έτσι, με αξιοπιστία, μια άγνωστη παράμετρος περικλείεται σε ένα διάστημα εμπιστοσύνης.

3. Η έννοια της στατιστικής υπόθεσης. Γενική διατύπωση του έργου των υποθέσεων δοκιμών.

Ο έλεγχος των στατιστικών υποθέσεων σχετίζεται στενά με τη θεωρία των παραμέτρων εκτίμησης. Στη φυσική επιστήμη, η τεχνική, η οικονομία καταφεύγεται συχνά στην δήλωση υποθέσεων που μπορούν να ελεγχθούν στατιστικά, δηλαδή, με βάση τα αποτελέσματα των παρατηρήσεων σε ένα τυχαίο δείγμα. Υπό Στατιστική υπόθεση Υπάρχουν τέτοιες υποθέσεις που σχετίζονται ή με τη μορφή ή για να διαχωριστούν παραμέτρους της κατανομής της τυχαίας μεταβλητής. Για παράδειγμα, η στατιστική είναι μια υπόθεση ότι η κατανομή των εργαζομένων στην παραγωγικότητα της εργασίας που εκτελούν την ίδια εργασία υπό τους ίδιους όρους, έχει έναν κανονικό νόμο περί διανομής. Το στατιστικό θα είναι επίσης μια υπόθεση ότι οι μέσες διαστάσεις των τμημάτων που παράγονται στον ίδιο τύπο, παράλληλα με τις μηχανές εργασίας, δεν διαφέρουν μεταξύ τους.

Η στατιστική υπόθεση καλείται πεδιάδα Εάν καθορίζει σίγουρα την κατανομή μιας τυχαίας μεταβλητής, διαφορετικά η υπόθεση καλείται Συγκρότημα.Για παράδειγμα, μια απλή υπόθεση είναι η υπόθεση ότι η τυχαία ποικιλία κατανέμεται ανάλογα με έναν κανονικό νόμο με μια μαθηματική προσδοκία ίση με το μηδέν και μια διασπορά ίση με μία. Εάν υποδηλώνει ότι μια τυχαία τιμή έχει μια κανονική κατανομή με διασπορά ισούται με μία και η μαθηματική προσδοκία είναι ένας αριθμός τμήματος, τότε αυτή είναι μια περίπλοκη υπόθεση. Ένα άλλο παράδειγμα της υπόθεσης είναι η υπόθεση ότι μια συνεχή τυχαία τιμή με πιθανότητα λαμβάνει μια τιμή από το διάστημα, στην περίπτωση αυτή η κατανομή μιας τυχαίας μεταβλητής μπορεί να είναι οποιαδήποτε από τις τάξεις συνεχών διανομών.

Συχνά η κατανομή μεγέθους είναι γνωστή και στο δείγμα των παρατηρήσεων, είναι απαραίτητο να ελεγχθούν οι υποθέσεις σχετικά με την τιμή των παραμέτρων αυτής της κατανομής. Αυτή η υπόθεση ονομάζεται Παραμετρικός.

Η επαληθευμένη υπόθεση καλείται Μηδενική υπόθεση και δηλώνεται. Μαζί με την υπόθεση, θεωρούμε μία από τις εναλλακτικές (ανταγωνιστικές) υποθέσεις. Για παράδειγμα, εάν μια υπόθεση ελέγχεται στην ισότητα της παραμέτρου σε κάποια καθορισμένη τιμή, δηλ.:, Στη συνέχεια, ως εναλλακτική υπόθεση, μπορεί να προβληθεί μία από τις ακόλουθες υποθέσεις ::. : : :, όπου - η καθορισμένη τιμή ,. Η επιλογή της εναλλακτικής gtpotheses καθορίζεται από το συγκεκριμένο σκεύασμα της εργασίας.

Ο κανόνας για τον οποίο λαμβάνεται η απόφαση να αποδεχθεί ή να απορρίψει την υπόθεση Κριτήριο . Δεδομένου ότι η απόφαση γίνεται βάσει της δειγματοληψίας των παρατηρήσεων μιας τυχαίας μεταβλητής, είναι απαραίτητο να επιλέξουν τα κατάλληλα στατιστικά στοιχεία, που ονομάζονται τα στατιστικά στοιχεία του κριτηρίου στην προκειμένη περίπτωση. Κατά τον έλεγχο μιας απλής παραμετρικής υποθέσεως: ως στατιστικά στοιχεία, το κριτήριο επιλέγεται τα ίδια στατιστικά στοιχεία για την αξιολόγηση της παραμέτρου.

Ο έλεγχος της στατιστικής υπόθεσης βασίζεται κατ 'αρχήν, σύμφωνα με την οποία τα απίθανο γεγονότα θεωρούνται αδύνατα και γεγονότα που έχουν μεγαλύτερη πιθανότητα είναι αξιόπιστες. Αυτή η αρχή μπορεί να εφαρμοστεί ως εξής. Πριν από την ανάλυση του δείγματος, κάποια μικρή πιθανότητα που ονομάζεται Επίπεδο σπουδαιότητας. Ας είναι το σύνολο των αξιών στατιστικής, A - ένα τέτοιο υποσύνολο που, με την επιφύλαξη της αλήθειας της υπόθεσης, η πιθανότητα στατιστικών στοιχείων κριτηρίων είναι ίσα, δηλ. .

Δηλώνει με την επιλεκτική βάση στατιστικής που υπολογίζεται από το δείγμα των παρατηρήσεων. Το κριτήριο διατυπώνεται ως εξής: απορρίψτε την υπόθεση εάν; Πάρτε μια υπόθεση εάν. Κριτήριο που βασίζεται στη χρήση προκαθορισμένου επιπέδου σημασίας που ονομάζεται Κριτήριο σημασίας. Το σύνολο όλων των τιμών των στατιστικών του κριτηρίου, στην οποία λαμβάνεται η απόφαση για την απόρριψη της υπόθεσης, ονομάζεται Κρίσιμη περιοχή? Η περιοχή ονομάζεται Έκταση υποθέσεις.

Το επίπεδο σημασίας καθορίζει το μέγεθος της κρίσιμης περιοχής. Η θέση της κρίσιμης περιοχής στο σύνολο των τιμών στατιστικών εξαρτάται από τη διατύπωση μιας εναλλακτικής υπόθεσης. Για παράδειγμα, αν η υπόθεση ελέγχεται:, και η εναλλακτική υπόθεση πλημμυρίζεται ως: (), η κρίσιμη περιοχή τοποθετείται στην δεξιά (αριστερά) "ουρά" της διανομής στατιστικών στοιχείων, δηλαδή έχει τη μορφή ανισότητας: () έχει τη μορφή ανισότητας: () έχει τη μορφή ανισότητας: () , όπου και είναι αυτές οι αξίες των στατιστικών που γίνονται αποδεκτές με πιθανότητες, αντίστοιχα και υπό την προϋπόθεση ότι η υπόθεση είναι σωστή. Στην περίπτωση αυτή, το κριτήριο καλείται μονόπλευρη, αντίστοιχα, δεξιά και αριστερά. Εάν μια εναλλακτική υπόθεση διαμορφώνεται ως:, η κρίσιμη περιοχή τοποθετείται τόσο στις "ουρές" της κατανομής, δηλ., Που καθορίζεται από τον συνδυασμό ανισοτήτων και, Στην περίπτωση αυτή, το κριτήριο καλείται διμερής.

Στο ΣΧ. 30 δείχνει τη θέση της κρίσιμης περιοχής για διάφορες εναλλακτικές υποθέσεις. Εδώ είναι η πυκνότητα της κατανομής των στατιστικών του κριτηρίου, υπό την προϋπόθεση ότι η υπόθεση είναι αληθής, - ο τομέας υιοθέτησης της υπόθεσης, .

Έτσι, ο έλεγχος της παραμετρικής στατιστικής υπόθεσης με τη βοήθεια του κριτηρίου σημασίας μπορεί να χωριστεί στα ακόλουθα βήματα:

1) διαμορφώνουν επαληθεύσιμες () και εναλλακτικές () υποθέσεις.

2) να ορίσει το επίπεδο σημασίας. Όπως δεν συμβαδίζει με τα αποτελέσματα των παρατηρήσεων. Εάν, στη συνέχεια, πάρτε την υπόθεση, δηλ. Θεωρείται ότι η υπόθεση δεν έρχεται σε αντίθεση με τα αποτελέσματα των παρατηρήσεων.

Συνήθως, κατά την εκτέλεση αντικειμένων σελ. 4 - 7 Χρήσεις στατιστικά στοιχεία, οι ποσότητες ποσοτήτων καταγράφονται: στατιστικά στοιχεία με κανονική διανομή, Statistics Student, Fisher στατιστικές.

Παράδειγμα 3.. Σύμφωνα με τα δεδομένα διαβατηρίου της κατανάλωσης καυσίμου κινητήρα αυτοκινήτων 100 χλμ Χιλιόμετρα 10 L.. Ως αποτέλεσμα, ο σχεδιασμός του κινητήρα αναμένεται ότι η κατανάλωση καυσίμου θα μειωθεί. Οι δοκιμές διατηρούνται για επαλήθευση 25 Τυχαία επιλεγμένα αυτοκίνητα με εκσυγχρονισμένο κινητήρα και επιλεκτικά δευτερεύοντα έξοδα καυσίμων 100 χλμ Τα χιλιόμετρα με βάση τα αποτελέσματα των δοκιμών ανήλθαν σε 9.3 L.. Ας υποθέσουμε ότι το δείγμα κατανάλωσης καυσίμου λαμβάνεται από έναν κανονικά κατανεμημένο γενικό πληθυσμό με μέσο όρο και διασπορά. Υπό την προϋπόθεση ότι η υπόθεση της κρίσιμης περιοχής για τα αρχικά στατιστικά στοιχεία είναι έγκυρη, δηλαδή, ισούται με το επίπεδο σπουδαιότητας. Βρείτε τις πιθανότητες σφαλμάτων του πρώτου και του δεύτερου είδους για το κριτήριο με μια τέτοια κρίσιμη περιοχή. Έχει μια κανονική κατανομή με μια μαθηματική προσδοκία ίση με τη διασπορά ίση με. Η πιθανότητα σφάλματος του δεύτερου είδους θα διαπιστώσει από τον τύπο (11.2):

Κατά συνέπεια, σύμφωνα με το αποδεκτό κριτήριο του 13,6% των αυτοκινήτων που έχουν κατανάλωση καυσίμου 9 L. στο 100 χλμ Χιλιόμετρα, ταξινομημένα ως αυτοκίνητα που έχουν κατανάλωση καυσίμου 10 L..

4. Θεωρητικές και εμπειρικές συχνότητες. Κριτήρια συγκατάθεσης.

Εμπειρικές συχνότητες - συχνότητες που προκύπτουν από την εμπειρία (παρατήρηση). Θεωρητικές συχνότητες Μειώθηκε από τους τύπους. Για τον κανονικό νόμο διανομής, μπορούν να βρεθούν ως εξής:

, (11.3)

Τα θέματα στατιστικής αξιολόγησης συνδέονται με τέτοιες προβληματικές πτυχές των μαθηματικών στατιστικών, ως επιστημονικής μεθοδολογίας, τυχαίες μεταβλητές, στατιστικές διανομές κ.λπ. Για οποιοδήποτε δείγμα, σφάλματα που προκαλούνται από την ελλιπή κάλυψη των μονάδων, τα σφάλματα μέτρησης και τους παρόμοιους λόγους. Τέτοια σφάλματα στην πραγματική ζωή δίνουν κάθε υπόθεση (ιδίως, διατυπώνονται με βάση τα οικονομικά συμπεράσματα) τυχαία, στοχαστικό χαρακτήρα. Ανεξάρτητα από τον αριθμό των μεταβλητών που προβλέπονται από τις θεωρητικές υποθέσεις, θεωρείται ότι η επίδραση διαφόρων τύπων σφαλμάτων μπορεί να περιγραφεί αρκετά με ακρίβεια χρησιμοποιώντας μόνο ένα συστατικό. Μια τέτοια μεθοδολογική προσέγγιση σάς επιτρέπει να περιορίσετε την μονοδιάστατη κατανομή των πιθανοτήτων, ενώ αξιολογείτε αρκετές παραμέτρους.

Στατιστική αξιολόγηση - Αυτός είναι ένας από τους δύο τύπους στατιστικής κρίσης (έλεγχος δευτέρου τύπου - υποθέσεις). Πρόκειται για ένα ειδικό είδος απόφασης σχετικά με τις αριθμητικές αξίες των χαρακτηριστικών (παραμέτρους) της κατανομής του γενικού πληθυσμού σύμφωνα με τα δεδομένα δείγματος από αυτό το σύνολο. Δηλαδή, με τα αποτελέσματα της επιλεκτικής παρατήρησης, προσπαθούμε να εκτιμήσουμε (με τη μεγαλύτερη ακρίβεια) τις αξίες ορισμένων παραμέτρων, στις οποίες η κατανομή του χαρακτηριστικού (αντικατάσταση), η οποία μας ενδιαφέρει, στον γενικό πληθυσμό. Δεδομένου ότι το δείγμα περιλαμβάνει μόνο ένα μέρος των γενικών μονάδων πληθυσμού (μερικές φορές ένας πολύ μικρός αριθμός από αυτούς), υπάρχει κίνδυνος να επιτρέψει ένα σφάλμα. Παρά τη μείωση αυτού του κινδύνου με αύξηση του αριθμού των μονάδων παρατήρησης, εξακολουθεί να λαμβάνει χώρα σε επιλεκτική παρατήρηση. Από εδώ, η απόφαση που ελήφθη σύμφωνα με τα αποτελέσματα του δείγματος παρέχει πιθανοτική φύση. Αλλά θα ήταν λανθασμένο να εξετάζουμε τις στατιστικές κρίσεις μόνο από τις θέσεις πιθανότητας. Μια τέτοια προσέγγιση δεν είναι πάντοτε επαρκή για την κατασκευή των σωστών θεωρητικών υποθέσεων σχετικά με τις παραμέτρους του γενικού πληθυσμού. Συχνά χρειάζεστε έναν άλλο αριθμό πρόσθετων κρίσεων που θα παρέχουν μια βαθύτερη λογική. Για παράδειγμα, πρέπει να αξιολογήσετε με μια μεγάλη προσέγγιση του μέσου αριθμού ειδικευμένων εργαζομένων στις επιχειρήσεις της περιοχής. Στην περίπτωση αυτή, εκτιμάται η μέση αριθμητική μεταβλητή X από τον γενικό πληθυσμό, το οποίο έχει κανονική κατανομή. Έχοντας λάβει ένα δείγμα σε αυτό το χαρακτηριστικό στο ποσό Π Μονάδες, είναι απαραίτητο να επιλυθεί η ερώτηση: Ποιο μέγεθος σύμφωνα με τα δείγματα δεδομένα πρέπει να λαμβάνονται ως πλησιέστερα στον μέσο όρο στον γενικό πληθυσμό; Τέτοιες τιμές, η μαθηματική προσδοκία των οποίων είναι ίση με την επιθυμητή παράμετρο (ή κοντά του), μπορεί να φέρει αρκετούς: α) τη μέση αριθμητική. β) Μόδα; γ) διάμεσος · δ) Ο μέσος όρος, υπολογιζόμενος στο πεδίο της παραλλαγής κ.λπ.

Από πιθανότητα προβολής, κάθε μία από τις προαναφερθείσες τιμές μπορεί να θεωρηθεί ότι θα δώσει την καλύτερη προσέγγιση στην επιθυμητή παράμετρο του γενικού πληθυσμού (x), από τη μαθηματική προσδοκία καθεμιάς από αυτές τις λειτουργίες (ειδικά για μεγάλα δείγματα ) είναι ίση με τον γενικό μέσο όρο. Καθορίζεται από μια τέτοια υπόθεση ότι με επανειλημμένα επαναλαμβανόμενο δείγμα από το ίδιο γενικό σύνολο, το "κατά μέσο όρο" είναι το σωστό αποτέλεσμα.

Η ορθότητα του "μέσου όρου" εξηγείται από την ισότητα επαναλήψεων θετικών και αρνητικών αποκλίσεων των εκτιμώμενων σφαλμάτων της γενικής μέσης εκτίμησης, δηλαδή, το μέσο σφάλμα εκτίμησης θα είναι μηδέν.

Σε πρακτικές συνθήκες, κατά κανόνα, οργανώνουν ένα δείγμα, οπότε ο ερευνητής ενδιαφέρεται για το ζήτημα μιας ακριβέστερης αξιολόγησης της επιθυμητής παραμέτρου που βασίζεται στα αποτελέσματα ενός συγκεκριμένου δείγματος. Για την επίλυση μιας τέτοιας εργασίας, εκτός από τα συμπεράσματα που προκύπτουν απευθείας από τον αφηρημένο υπολογισμό της πιθανότητας, απαιτούνται πρόσθετοι κανόνες για την παρακίνηση της βέλτιστης προσέγγισης της αξιολόγησης στην επιθυμητή παράμετρο του γενικού πληθυσμού.

Υπάρχει επαρκής αριθμός τρόπων για την αξιολόγηση των σταθερών σε επιλεκτικές παρατηρήσεις. Ποιο από αυτά είναι το καλύτερο στην επίλυση συγκεκριμένων στόχων της μελέτης - η θεωρία της στατιστικής εκτίμησης είναι προσλαμβάνεται. Εξετάζει τις προϋποθέσεις που πρέπει να υπακούονται από μία ή άλλη αξιολόγηση, τα δρομολόγια στις εκτιμήσεις είναι προτιμότερες από αυτές τις συνθήκες. Η θεωρία των εκτιμήσεων υποδεικνύει την ανωτερότητα μιας αξιολόγησης σε σύγκριση με το άλλο.

Όπως γνωρίζετε, οι πληροφορίες που λαμβάνονται βάσει του δείγματος δεν είναι κατηγορηματικές στο συμπέρασμα. Εάν, για παράδειγμα, 100 κεφαλές ζώων που μελετήθηκαν από τις υγιείς ασθένειες τους ήταν 99, τότε υπάρχει πιθανότητα ένα ζώο που παραμένει ανεξερεύνητο με ακρίβεια τη μεταφορά του ιού της προβλεπόμενης ασθένειας. Δεδομένου ότι είναι απίθανο, υπάρχει ένα συμπέρασμα σχετικά με την απουσία αυτής της ασθένειας. Στις περισσότερες περιπτώσεις, το συμπέρασμα αυτό είναι πλήρως δικαιολογημένο.

Καθηγαίνουν από αυτά τα συμπεράσματα στην πρακτική δραστηριότητα, ο πειραματιστής (ερευνητής) βασίζεται στην αξιοπιστία των πληροφοριών, αλλά μόνο για την πιθανότητά του.

Η άλλη πλευρά της παρατήρησης του δείγματος, όπως ήδη σημειώθηκε, επιλύει το καθήκον ίσως πιο αντικειμενικός προσδιορισμός του βαθμού αξιοπιστίας των ληφθεισών αξιολογήσεων δειγμάτων. Η λύση σε αυτή την εργασία προσπαθεί να παράσχει όσο το δυνατόν μεγαλύτερη πιθανοτική έκφραση, δηλαδή για τον καθορισμό του βαθμού ακρίβειας της αξιολόγησης. Εδώ, ο ερευνητής καθορίζει τα όρια μιας πιθανής απόκλισης μεταξύ της εκτίμησης που λαμβάνεται κατά τη διάρκεια του δείγματος και την έγκυρη αξία της αξίας της στον γενικό πληθυσμό.

Η ακρίβεια της αξιολόγησης οφείλεται στη μέθοδο του υπολογισμού του σύμφωνα με τα δεδομένα δείγματος και τη μέθοδο επιλογής μονάδων στο επιλεκτικό σύνολο.

Η μέθοδος λήψης εκτιμήσεων περιλαμβάνει οποιαδήποτε υπολογιστική διαδικασία (μέθοδος, κανόνας, αλγεβρικός τύπος). Αυτή είναι η προτεραιότητα της θεωρίας στατιστικής αξιολόγησης. Οι μέθοδοι επιλογής οδηγούν στην εφαρμογή των δειγματοληπτικών τεχνικών έρευνας.

Το παραπάνω μας επιτρέπει να ορίσουμε την έννοια της "στατιστικής αξιολόγησης".

Στατιστική αξιολόγηση - Πρόκειται για μια κατά προσέγγιση αξία της επιθυμητής ρύθμισης του γενικού πληθυσμού, η οποία λαμβάνεται από τα αποτελέσματα του δείγματος και παρέχει τη δυνατότητα υιοθέτησης ενημερωμένων αποφάσεων σχετικά με τις άγνωστες παραμέτρους του γενικού πληθυσμού.

Ας υποθέσουμε ότι ^ "- η στατιστική αξιολόγηση της άγνωστης παραμέτρου ^ θεωρητική κατανομή. Με επανειλημμένα εφαρμόστηκε το ίδιο

Το μέγεθος του δείγματος από τον γενικό πληθυσμό βρέθηκε εκτιμήσεις και 2 ^ "" p,

έχοντας διαφορετικές έννοιες. Επομένως, η εκτίμηση ^ "μπορεί να θεωρηθεί ως

Τυχαία τιμή και +17 δύο, 3 ~ "P - ως πιθανές τιμές. Ως τυχαία τιμή, χαρακτηρίζεται από μια ορισμένη λειτουργία πυκνότητας πιθανότητας. Δεδομένου ότι αυτή η λειτουργία οφείλεται στο αποτέλεσμα της επιλεκτικής παρατήρησης (πειράματος), είναι που ονομάζεται Επιλεκτική διανομή. Αυτή η λειτουργία περιγράφει την πυκνότητα πιθανότητας για κάθε μία από τις εκτιμήσεις χρησιμοποιώντας έναν συγκεκριμένο αριθμό επιλεκτικών

παρατηρήσεις. Υποθέτοντας ότι, η στατιστική αξιολόγηση ^, "είναι μια αλγεβρική λειτουργία από ένα ορισμένο σύνολο δεδομένων και ένα τέτοιο σύνολο θα ληφθεί στην εφαρμογή της επιλεκτικής παρατήρησης, στη συνέχεια

Ως γενική μορφή, η βαθμολογία θα εκφράζεται: ® n \u003d f (xl.x2, ^ 3, ... x t).

Στο τέλος της εξέτασης του δείγματος, αυτή η λειτουργία δεν αποτελεί πλέον μια εκτίμηση της γενικής μορφής και παίρνει - μια συγκεκριμένη αξία, δηλαδή, γίνεται ποσοτική αξιολόγηση (αριθμός). Με άλλα λόγια, από την παραπάνω έκφραση προκύπτει ότι οποιοσδήποτε από τους δείκτες που χαρακτηρίζουν τα αποτελέσματα της επιλεκτικής παρατήρησης μπορεί να θεωρηθεί αξιολόγηση. Ο επιλεκτικός μέσος όρος είναι μια εκτίμηση της γενικής μέσης. Υπολογίζεται επί της διασποράς δείγματος ή υπολογίζεται από αυτήν την τιμή της μέσης τετραγωνικής απόκλισης είναι εκτιμήσεις των αντίστοιχων χαρακτηριστικών του γενικού πληθυσμού κ.λπ.

Όπως ήδη σημειώθηκε, ο υπολογισμός των στατιστικών αξιολογήσεων δεν εγγυάται το αποκλεισμό σφαλμάτων. Η ουσία έγκειται στο γεγονός ότι το τελευταίο δεν πρέπει να είναι συστηματικό. Η παρουσία τους πρέπει να είναι τυχαία. Εξετάστε τη μεθοδολογική πλευρά αυτής της θέσης.

Ας υποθέσουμε ότι η αξιολόγηση ^ "δίνει μια ανακριβή αξία της εκτίμησης του γενικού πληθυσμού με μειονέκτημα. Σε αυτή την περίπτωση, κάθε υπολογισμένη τιμή \u003d 1,2,3, ..., η) θα είναι μικρότερη από την έγκυρη τιμή της τιμής των $.

Για το λόγο αυτό, η μαθηματική προσδοκία (μέση τιμή) μιας τυχαίας μεταβλητής θα είναι μικρότερη από ό, τι, δηλαδή (m (^ p και, αντίθετα, αν δίνει υπερβολική αξιολόγηση, τότε η μαθηματική προσδοκία

Τυχαία ^ "θα γίνει περισσότερο από $.

Συνεπώς, η χρήση μιας στατιστικής εκτίμησης, η μαθηματική προσδοκία των οποίων δεν είναι ίση με την εκτιμώμενη παράμετρο, οδηγεί σε συστηματικά σφάλματα, δηλαδή σε μη τυχαία λάθη που περιβάλλεται η μέτρηση έχει ως αποτέλεσμα μία κατεύθυνση.

Μια φυσική απαίτηση προκύπτει: η μαθηματική προσδοκία της εκτίμησης ^ "πρέπει να ισούται με την εκτιμώμενη παράμετρο. Η συμμόρφωση με την απαίτηση αυτή δεν εξαλείφει τα σφάλματα γενικά, καθώς οι επιλεκτικές τιμές της αξιολόγησης μπορεί να είναι μεγαλύτερες ή μικρότερες από τις έγκυρες αξία της εκτίμησης του γενικού πληθυσμού. Αλλά θα υπάρξουν σφάλματα με την άλλη πλευρά από τις τιμές ^ (σύμφωνα με τη θεωρία πιθανοτήτων) με την ίδια συχνότητα. Συνεπώς, η συμμόρφωση με την απαίτηση αυτή, η μαθηματική προσδοκία της εκτίμησης του δείγματος πρέπει να είναι ίση με την εκτιμώμενη παράμετρο, εξαλείφει την παραλαβή των συστηματικών (μη τυχαίων) σφαλμάτων, δηλαδή

Μ. (σε) = 6.

Η επιλογή μιας στατιστικής αξιολόγησης που δίνει την καλύτερη προσέγγιση της εκτιμώμενης παραμέτρου αποτελεί σημαντικό έργο στη θεωρία της εκτίμησης. Εάν είναι γνωστό ότι η κατανομή της τυχαίας μεταβλητής βάσει του γενικού πληθυσμού συμμορφώνεται με το νόμο της κανονικής κατανομής, στη συνέχεια, σύμφωνα με τα επιλεκτικά δεδομένα, είναι απαραίτητο να εκτιμηθεί η μαθηματική προσδοκία και η μέση τετραγωνική απόκλιση. Εξηγείται από το γεγονός ότι τα δύο χαρακτηριστικά που αναφέρθηκαν πλήρως προσδιορίζουν τα θεμέλια στα οποία κατασκευάστηκε μια κανονική κατανομή. Εάν η υποκείμενη τυχαία τιμή κατανέμεται σύμφωνα με το νόμο του Poisson, η παράμετρος ^ αξιολογείται, δεδομένου ότι καθορίζει αυτή τη διανομή.

Οι μαθηματικές στατιστικές διακρίνουν τέτοιες μεθόδους για την απόκτηση στατιστικών εκτιμήσεων σύμφωνα με τα επιλεκτικά δεδομένα: η μέθοδος των στιγμών, η μέγιστη μέθοδος της πίστης.

Μετά την παραλαβή των εκτιμήσεων με τη μέθοδο των στιγμών, οι στιγμές του γενικού πληθυσμού αντικαθίστανται από τις στιγμές του επιλεκτικού συσσωματώματος (αντί των πιθανοτήτων, τις συχνότητες να χρησιμοποιούν συχνότητες).

Προκειμένου η στατιστική αξιολόγηση να δώσει την "καλύτερη προσέγγιση" στο γενικό χαρακτηριστικό, θα πρέπει να έχει ορισμένες ιδιότητες. Αυτό θα συζητηθεί παρακάτω.

Η δυνατότητα επιλογής της καλύτερης εκτίμησης οφείλεται στη γνώση των βασικών ιδιοτήτων τους και της δυνατότητας ταξινόμησης των εκτιμήσεων σε αυτές τις ιδιότητες. Στη μαθηματική λογοτεχνία "ιδιότητες των εκτιμήσεων", ονομάζεται μερικές φορές "απαιτήσεις για εκτιμήσεις" ή "αξιολόγηση κριτηρίων". Στις βασικές ιδιότητες των στατιστικών αξιολογήσεων περιλαμβάνουν: ασυνέπεια, αποτελεσματικότητα, ικανότητα, επάρκεια.

Αν δεχτούμε αυτή την επιλεκτική μέση (~) και επιλεκτική διασπορά

(St) είναι εκτιμήσεις των αντίστοιχων γενικών χαρακτηριστικών (^), δηλαδή, η μαθηματική τους προσδοκία, λαμβάνουμε υπόψη ότι με μεγάλους αριθμούς

Οι μονάδες δειγματοληψίας ονομάζονται χαρακτηριστικά (~) θα προσεγγιστούν από τις μαθηματικές τους προσδοκίες. Εάν ο αριθμός των μονάδων δειγματοληψίας είναι μικρός, αυτά τα χαρακτηριστικά μπορούν να διαφέρουν σημαντικά από τις αντίστοιχες μαθηματικές προσδοκίες.

Εάν η μέση τιμή των χαρακτηριστικών του δείγματος που επιλέγεται ως εκτίμηση αντιστοιχεί στην αξία των καλύτερων χαρακτηριστικών, η αξιολόγηση ονομάζεται απίστευτη. Απόδειξη ότι η μαθηματική προσδοκία του επιλεκτικού μέσου όρου είναι ίση με τη γενική κατάσταση (m (x) \u003d x), υποδεικνύει ότι η τιμή είναι ~ δεν σχετίζεται

Μεσαίου. Διαφορετικά, συμβαίνει με την εκλογική διασπορά (O). αυτήν

M (art 2) \u003d - O-2. .

η μαθηματική προσδοκία n δεν είναι ίση με γενική

Διασπορά. Έτσι, το H είναι μια προκατειλημμένη εκτίμηση Α ». Να εξαλείψει ένα συστηματικό σφάλμα και να πάρει μια μη συνδεδεμένη βαθμολογία, επιλεκτική

Η διασπορά πολλαπλασιάζεται με τη διόρθωση του P-1 (προκύπτει από την εκπαίδευση

σε 2 _ 2 p Π -1 "P -1.

Την παραπάνω εξίσωση: P).

Έτσι, με μερικά δείγμα, η διασπορά είναι ίση με:

2 TSH, - ~) 2 Π ΜΙ. (x και - ~) 2

sG B. \u003d X - \u003d -.

p p - 1 P -1.

Κλάσμα - 1) Τροποποίηση του Bessel. Ο μαθηματικός Bessel διαπίστωσε ότι η επιλεκτική διασπορά είναι μια εκτοπισμένη εκτίμηση της γενικής διασποράς και εφαρμόζεται η καθορισμένη διόρθωση για προσαρμογή

ακροαματικότητα. Για μικρά δείγματα, η διόρθωση (P-1) διαφέρει σημαντικά από το 1. με αύξηση του αριθμού των μονάδων παρατήρησης, προσεγγίζει γρήγορα 1. Πότε<> 50 Η διαφορά μεταξύ των εκτιμήσεων εξαφανίζεται, δηλαδή

° "-. Χωρίς τα παραπάνω, οι ακόλουθοι ορισμοί της ροής αξιώσεων μη ικανοτήτων.

Καταλαβαίνουν Καλέστε μια στατιστική αξιολόγηση, η μαθηματική προσδοκία του οποίου με οποιοδήποτε μέγεθος δείγματος είναι ίσο με την τιμή

Η παράμετρος του γενικού συστήματος, δηλαδή, m (^) \u003d 9; m (x) \u003d x.

Η κατηγορία "Μαθηματική αναμονή" μελετάται κατά τη διάρκεια της θεωρίας πιθανοτήτων. Αυτό είναι το αριθμητικό χαρακτηριστικό μιας τυχαίας μεταβλητής. Η μαθηματική προσδοκία είναι περίπου ίση με τη μέση τιμή της τυχαίας μεταβλητής. Μαθηματικές προσδοκίες μιας διακριτής τυχαίας μεταβλητής Καλέστε το ποσό όλων των πιθανών τιμών του για τις πιθανότητες τους. Ας υποθέσουμε ότι γίνεται σε μελέτες στις οποίες μια τυχαία τιμή Η. Αποδεκτής sh 1 φορές την τιμή του W 2 φορές την τιμή των w και φορές την τιμή του x k. ταυτόχρονα, w 1 + w 2 + w 3 + ... + wk \u003d p. Στη συνέχεια, το άθροισμα όλων των τιμών Υιοθετώ x, ίσο

x 1 W 1 + x 2 W 2 + x 3 W 3 + ... + x να sh

Η μέση αριθμητική αυτών των τιμών θα είναι:

X 1 W 1 + x 2 W 2 + x 3 W 3 + ... + x να sh to - w 1 ^ sh 2 ^ sh 3 ^ sh

Π ή 1 p 2 p 3 p 1 p.

Δεδομένου ότι n - σχετική συχνότητα ^ τιμή Η. ^ Π - σχετική συχνότητα της τιμής x 2, κλπ., Η παραπάνω εξίσωση θα λάβει τη φόρμα:

X \u003d X 1 № 1 + x 2 № 2 + x 3 № 3 + ... + x σε n\u003e

Με μεγάλο αριθμό επιλεκτικών παρατηρήσεων, η σχετική συχνότητα είναι περίπου ίση με την πιθανότητα του γεγονότος, δηλαδή

και\u003e 1 \u003d l; ^ 2 \u003d sh \u003d ™ \u200b\u200bk \u003d rk και επομένως x 2 χ 1 p 1 + x 2 p 2 + x 3 g. 3 + ... + x krk. Επειτα

x ~ Μ. (x) Η πιθανοτική έννοια του προκύπτοντος αποτελέσματος υπολογισμού είναι ότι η μαθηματική προσδοκία είναι περίπου ίση (όσο ακριβέστερα, τόσο περισσότερο δείγμα) των μέσων αριθμητικών παρατηρούμενων τιμών της τυχαίας μεταβλητής [m (x -) \u003d ~ ~ 1.

Το κριτήριο της αναπηρίας εγγυάται την έλλειψη συστηματικών σφαλμάτων στην αξιολόγηση των παραμέτρων του γενικού πληθυσμού.

Σημειώστε ότι η βαθμολογία δείγματος (^) είναι μια τυχαία τιμή, η τιμή του οποίου μπορεί να ποικίλει από ένα δείγμα στο άλλο. Η έκταση των παραλλαγών (διασποράς) γύρω από τη μαθηματική προσδοκία της γενικής παραμέτρου του πληθυσμού # χαρακτηρίζει τη διασπορά του ST2 (^).

Ας είναι σε καιΣΕ - - δύο απίστευτες εκτιμήσεις της παραμέτρου ^, δηλαδή M (Β. ") \u003d 6 και m (d,) \u003d c. Διασπορές αυτών σε 1 (σε -) και σε ΣΟΛ. ΦΑ. -). Από τα δύο αυτά τα NOCs στο ARTO για να δώσουν προτίμηση σε ένα που έχει λιγότερη διασπορά γύρω από την εκτιμώμενη παράμετρο. Εάν η διασπορά αξιολόγησης ^ "λιγότερη διασπορά

Αξιολογήσεις SP, τότε για την αξιολόγηση και είναι αποδεκτή πρώτη, δηλαδή, ^ ".

Η αμετάβλητη αξιολόγηση ^, η οποία έχει μικρότερη διασπορά μεταξύ όλων των πιθανών απαρτητικών εκτιμήσεων της παραμέτρου ^, που υπολογίζεται από τα δείγματα του ίδιου τόμου, ονομάζεται αποτελεσματική αξιολόγηση. Αυτή είναι η δεύτερη ιδιοκτησία (απαίτηση) των στατιστικών εκτιμήσεων των παραμέτρων του γενικού πληθυσμού. Είναι απαραίτητο να θυμόμαστε ότι η αποτελεσματική αξιολόγηση της παραμέτρου του γενικού πληθυσμού μειωμένη στον καθορισμένο νόμο περί διανομής δεν συμπίπτει με την αποτελεσματική εκτίμηση της παραμέτρου του δεύτερου τμήματος.

Όταν εξετάζετε δείγματα μεγάλου όγκου, οι στατιστικές εκτιμήσεις θα πρέπει να έχουν ιδιότητα ικανότητας. Η αξιολόγηση είναι ικανή (ο όρος "κατάλληλος" ή "συντονισμένος") σημαίνει επίσης ότι το μεγαλύτερο μέγεθος του δείγματος, τόσο μεγαλύτερη είναι η πιθανότητα να μην υπερβαίνει το σφάλμα αξιολόγησης πόσο μικρό θετικό

Αριθμοί Ε. Αξιολόγηση 6 Η παράμετρος ^ ονομάζεται πλούσιος εάν υπόκειται στον νόμο μεγάλων αριθμών, δηλαδή, εκτελείται η ακόλουθη ισότητα:

/ Shg | ΣΟΛ. ΒΒ. <Е} = 1.

Όπως βλέπουμε, ικανή να καλέσει μια τέτοια στατιστική αξιολόγηση, η οποία στο Ρ προσεγγίζει την πιθανότητα της εκτιμώμενης παραμέτρου. Με άλλα λόγια, αυτή η τιμή του δείκτη που λαμβάνεται με δείγμα και η προσέγγιση (συμπίπτει σε πιθανότητα) ως αποτέλεσμα του νόμου μεγάλου αριθμού με αύξηση του μεγέθους του δείγματος στην προσδοκία του. Για παράδειγμα, εάν η διασπορά μιας ασταθής εκτίμησης προσπαθεί να μηδενική, αυτή η αξιολόγηση είναι επίσης πλούσια, καθώς έχει τη μικρότερη δυνατή διασπορά (με ένα δεδομένο μέγεθος δείγματος).

Οι ικανές εκτιμήσεις είναι:

1) το ποσοστό του σημείου του επιλεκτικού αδρανούς, δηλαδή τη συχνότητα ως αξιολόγηση του λοβού του χαρακτηριστικού στο γενικό πληθυσμό.

2) επιλεκτικός μέσος όρος ως εκτίμηση του γενικού μέσου όρου ·

3) επιλεκτική διασπορά ως αξιολόγηση της γενικής διασποράς ·

4) Επιλεκτικοί συντελεστές ασυμμετρίας και υπερβολών ως αξιολόγηση των γενικών συντελεστών.

Στη βιβλιογραφία για τις μαθηματικές στατιστικές, για κάποιο λόγο, δεν είναι πάντοτε δυνατό να αντιμετωπιστεί μια περιγραφή της τέταρτης ιδιοκτησίας των στατιστικών εκτιμήσεων - Toostate. Εκτίμηση επαρκής (ή εξαντλητική) είναι μια αξιολόγηση που οδηγεί (παρέχει) την πληρότητα της κάλυψης όλων των πληροφοριών δείγματος σχετικά με την άγνωστη παράμετρο του γενικού πληθυσμού. Έτσι, μια επαρκής εκτίμηση περιλαμβάνει όλες τις πληροφορίες που περιέχονται στο δείγμα στα μελετημένα στατιστικά χαρακτηριστικά του γενικού πληθυσμού. Κανένας από τις προηγουμένως εξεταζόμενες εκτιμήσεις που εξετάζονται δεν μπορεί να παράσχει τις απαραίτητες πρόσθετες πληροφορίες σχετικά με την υπό εξέταση παράμετρο, ως επαρκή στατιστική αξιολόγηση.

Συνεπώς, η μέση αριθμητική επιλεκτική ~ είναι μια μη μορφοποιημένη εκτίμηση του μέσου αριθμητικού γενικού. Ο παράγοντας της αναπηρίας αυτής της αξιολόγησης δείχνει: εάν με τον γενικό πληθυσμό να πάρει μεγάλο αριθμό τυχαίων δειγμάτων, τότε ο μέσος όρος τους *<отличались бы от генеральной средней в большую и меньшую сторону одинаково, то есть, свойство несмещенности хорошей оценки также показывает, что среднее значение бесконечно большого числа выборочных средних равно значению генеральной средней.

Στις συμμετρικές σειρές της διάμεσης διανομής, η γενική μέση εκτίμηση είναι ένας δείκτης. Και υπό την προϋπόθεση ότι ο αριθμός των επιλεκτικών συσσωματωμάτων πλησιάζει το Γενικό (P ~ * N), ο διάμεσος μπορεί να είναι σε τέτοιες σειρές και μια πλούσια αξιολόγηση των γενικών σπόρων. Αφορά επίσης το κριτήριο για την αποτελεσματικότητα σε σχέση με το διάμεσο ως εκτίμηση του Το μέσο αριθμητικό γενικό σύνολο, μπορείτε να αποδείξετε ότι σε δείγματα μεγάλου μέσου μέσου μέσου μέσου όγκου (STME) είναι 1.2533 του μέσου τετραγωνικού σφάλματος του επιλεκτικού μέσου

). Δηλαδή, STME *. Ως εκ τούτου, ο διάμεσος δεν μπορεί να είναι μια αποτελεσματική εκτίμηση του μέσου αριθμητικού γενικού συσσωματωμένου, δεδομένου ότι το μέσο τετραγωνικό σφάλμα είναι μεγαλύτερο από το μέσο τετραγωνικό σφάλμα της μέσης αριθμητικής δειγματοληψίας. Επιπλέον, η μέση αριθμητική ικανοποιεί τους όρους αποτυχίας και ικανότητας και, κατά συνέπεια, είναι η καλύτερη αξιολόγηση.

Αυτή η ρύθμιση είναι δυνατή. Ίσως το μέσο αριθμητικό δείγμα να είναι μια απίστευτη διάμεση αξιολόγηση σε συμμετρικά σύνολα αδρανών, για τα οποία οι τιμές του μέσου και του μέσου συμπίπτουν; Και θα υπάρξει ένα επιλεκτικό μέσο μιας πλούσιας αξιολόγησης του μέσου μέσου του γενικού πληθυσμού; Και στις δύο περιπτώσεις, η απάντηση θα είναι θετική. Για τον διάμεσο του γενικού συσσωματωμένου συσσωματωμένου (με συμμετρική κατανομή), το μέσο αριθμητικό δείγμα είναι μη μη καθορισμένο και συμφωνηθεί.

Θυμηθείτε ότι το STME ~ 1.2533, καταλήγουμε στο συμπέρασμα: το μέσο αριθμητικό δείγμα και όχι μια μέση, μια πιο αποτελεσματική αξιολόγηση του μέσου μέσου του γενικού πληθυσμού υπό μελέτη.

Κάθε χαρακτηριστικό του δείγματος δεν είναι απαραίτητα μια καλύτερη εκτίμηση του αντίστοιχου χαρακτηριστικού του γενικού πληθυσμού. Η γνώση των ακινήτων των εκτιμήσεων σας επιτρέπει να λύσετε το ζήτημα όχι μόνο της επιλογής των εκτιμήσεων, αλλά και τις βελτιώσεις τους. Για παράδειγμα, είναι δυνατόν να εξεταστεί η περίπτωση κατά τον υπολογισμό δείχνουν ότι οι τιμές των μέσων τετραγωνικών αποκλίσεων πολλών δειγμάτων από ένα γενικό σύνολο σε όλες τις περιπτώσεις είναι μικρότερες από τη μέση τετραγωνική απόκλιση του γενικού πληθυσμού και την αξία του Η διαφορά οφείλεται στο μέγεθος του δείγματος. Πολλαπλασιάζοντας την τιμή της μέσης τετραγωνικής απόκλισης του δείγματος στον συντελεστή διόρθωσης, λαμβάνουμε μια βελτιωμένη εκτίμηση της μέσης τετραγωνικής απόκλισης του γενικού πληθυσμού. Για έναν τέτοιο συντελεστή διόρθωσης Χρησιμοποιήστε την τροπολογία Bessel

Π Ένα i. Π

(P-1), δηλαδή να εξαλείψει την εκτόπιση της αξιολόγησης - 1. Η αριθμητική έκφραση δείχνει ότι η μέση τροποποιητική απόκλιση δειγματοληψίας χρησιμοποιείται ως αξιολόγηση, δίνει μια υποεκτίμηση της γενικής παραμέτρου του πληθυσμού.

Όπως είναι γνωστό, τα στατιστικά χαρακτηριστικά του επιλεκτικού αδρανούς είναι κατά προσέγγιση εκτιμήσεις των άγνωστων παραμέτρων του γενικού πληθυσμού. Η ίδια η αξιολόγηση μπορεί να έχει τη μορφή ενός αριθμού ή οποιουδήποτε συγκεκριμένου σημείου. Μια αξιολόγηση που καθορίζεται από έναν αριθμό ονομάζεται σημείο. Έτσι, ο επιλεκτικός μέσος όρος (~) είναι μια απίστευτη και πιο αποτελεσματική εκτίμηση σημείων του γενικού μέσου (x) και η επιλεκτική διασπορά) είναι μια εκτομή εκτοπισμένης σημείων του γενικού

διασπορά (). Εάν ορίσετε το μέσο σφάλμα του δείγματος μέσου Τ. <> Η πραγματική εκτίμηση του γενικού μέσου όρου μπορεί να γραφτεί με τη μορφή Χ ± t °. Αυτό σημαίνει ότι ~ - μια εκτίμηση του γενικού μέσου όρου με ένα σφάλμα ίσο με ". Είναι σαφές ότι οι στατιστικές εκτιμήσεις του σημείου X και O δεν πρέπει να έχουν συστηματικό σφάλμα στο

ooo ~~ Ο.<в 2

Την πλευρά της υπερεκτίμησης ή υποτιμήσεως των εκτιμώμενων παραμέτρων Χ και. Όπως αναφέρθηκε προηγουμένως, οι αξιολογήσεις που ικανοποιούν την κατάσταση καλούνται

ασταθής. Ποιο είναι το σφάλμα της παραμέτρου t "; Αυτός είναι ο μέσος όρος μιας ποικιλίας συγκεκριμένων σφαλμάτων:

Η εκτίμηση σημείων της παραμέτρου του γενικού πληθυσμού είναι ότι με διαφορετικές πιθανές εκτιμήσεις δείγματος, εκλέγεται αρχικά που έχει τις βέλτιστες ιδιότητες και στη συνέχεια υπολογίζεται η αξία αυτής της αξιολόγησης. Η προκύπτουσα υπολογισμένη τιμή του τελευταίου θεωρείται ως η καλύτερη προσέγγιση στην άγνωστη πραγματική αξία της παραμέτρου του γενικού πληθυσμού. Οι πρόσθετοι υπολογισμοί που σχετίζονται με τον ορισμό ενός πιθανού σφάλματος της αξιολόγησης δεν είναι πάντοτε υποχρεωτικές (ανάλογα με την παρθένο παρθένο), αλλά, κατά κανόνα, πραγματοποιούνται σχεδόν πάντα.

Εξετάστε τα παραδείγματα καθορισμού της εκτίμησης σημείων για το μέσο όρο που μελετήθηκαν και για τις μετοχές τους στον γενικό πληθυσμό.

Παράδειγμα. Ombols των καλλιεργειών σιτηρών της περιοχής είναι 20000 εκτάρια. Με 10% επιλεκτική επιθεώρηση των πεδίων, ελήφθησαν τέτοια επιλεκτικά χαρακτηριστικά: η μέση απόδοση - 30 C με I ha, η διασπορά απόδοσης - 4, η περιοχή των καλλιεργειών καλλιεργειών υψηλής απόδοσης - 1200 εκταρίων.

Τι να γνωρίζετε για το μέγεθος της μέσης απόδοσης των καλλιεργειών σιτηρών στην περιοχή και η αριθμητική σημασία του δείκτη του μεριδίου (ειδική βαρύτητα) των καλλιεργειών υψηλής απόδοσης στη συνολική έκταση των σιτηρών υπό μελέτη

Περιοχή? Δηλαδή, είναι απαραίτητο να αξιολογηθούν οι ονομασμένες παραμέτρους (X, D) στον γενικό πληθυσμό. Για να υπολογίσετε τις εκτιμήσεις, έχουμε:

N \u003d 20.000; - = 20000 x 0,1 \u003d 2000; ~ \u003d 30;<т = л / 4; № 2000,

Όπως γνωρίζετε, η επιλεκτική μέση αριθμητική είναι μια αποτελεσματική αξιολόγηση.

Γενική μεσαία αριθμητική. Έτσι, μπορεί να το ληφθεί

Η καλύτερη εκτίμηση της γενικής παραμέτρου (^) είναι 30. Για να προσδιορίσετε το βαθμό

Ακρίβεια αξιολόγησης Είναι απαραίτητο να βρείτε το μέσο (τυπικό) σφάλμα:

Ια. P ~ i. Απρίλιος 2000 h ppl

t \u003d L. - (1--) = - (1--) = 0,04

v. n. και2000 2000 ^

Το προκύπτον μέγεθος του σφάλματος υποδεικνύει μεγάλη ακρίβεια της αξιολόγησης. Η αξία του T εδώ σημαίνει ότι με επαναλαμβανόμενη επανάληψη τέτοιων δειγμάτων, το σφάλμα της εκτίμησης παραμέτρων θα ήταν κατά μέσο όρο 0,04. Αυτό είναι για το σημείο

Αξιολόγηση, η μέση απόδοση στις εκμεταλλεύσεις της περιοχής θα είναι x \u003d 30 - 0,04 c με το i ha.

Προκειμένου να επιτευχθεί ένα σημείο εκτίμησης του δείκτη των μετοχών των υψηλών αποδεκτών καλλιεργειών σιτηρών στην συνολική περιοχή σιτηρών για την καλύτερη αξιολόγηση, μπορεί να ληφθεί ένα κλάσμα μεριδίου στο δείγμα ¥ \u003d 0,6. Έτσι, μπορεί να ειπωθεί ότι, σύμφωνα με τα αποτελέσματα των παρατηρήσεων, η καλύτερη εκτίμηση του επιθυμητού δείκτη της δομής θα είναι ο αριθμός 0,6. Με τον καθορισμό των υπολογισμών, θα πρέπει να υπολογίσετε το μέσο σφάλμα αυτής της αξιολόγησης: Τ. και (1 _ n) και 0,6 (1 - 0.b) (1 \u003d 0,01

v. Π N v. 2000 2000 αλλά

Όπως βλέπουμε, η μέση εκτίμηση εκτίμησης σφάλματος είναι 0,01.

Το προκύπτον αποτέλεσμα σημαίνει ότι εάν επαναληφθεί για να επαναλάβει το δείγμα με όγκο 2000 εκταρίων σιτηρών, το μέσο σφάλμα της υιοθετημένης αξιολόγησης του μεριδίου (ειδική βαρύτητα) των καλλιεργειών υψηλής απόδοσης στην περιοχή των καλλιεργειών σιτηρών του Οι επιχειρήσεις περιοχής θα είναι ± 0,01. Σε αυτή την περίπτωση, p \u003d 0,6 ± 0,01. Σε ποσοστιαίες όρους, το ποσοστό των καλλιεργειών υψηλής απόδοσης στη συνολική έκταση της περιοχής σιτηρών θα είναι κατά μέσο όρο 60 ± Ι.

Οι υπολογισμοί δείχνουν ότι για μια συγκεκριμένη περίπτωση, η υψηλότερη εκτίμηση του επιθυμητού δείκτη της δομής θα είναι ο αριθμός 0,6 και το μέσο σφάλμα της εκτίμησης προς μία ή την άλλη θα είναι περίπου ίση με 0,01. Όπως μπορείτε να δείτε, η αξιολόγηση είναι αρκετά ακριβής.

Αρκετοί τρόποι εκτίμησης σημείων για τη μέση τετραγωνική απόκλιση είναι γνωστές σε περιπτώσεις όπου το δείγμα διεξήχθη από τον γενικό πληθυσμό μονάδων με μια κανονική κατανομή και την παράμετρο σε άγνωστη. Απλός (ο ευκολότερος υπολογισμός) εκτίμηση είναι το πεδίο της παραλλαγής (και °) του δείγματος, πολλαπλασιασμένο με τον διορθωτικό παράγοντα, που λαμβάνεται σύμφωνα με τους τυποποιημένους πίνακες και ο οποίος εξαρτάται από το μέγεθος του δείγματος (για μικρά δείγματα). Η μέση παράμετρος τετραγωνικής απόκλισης στον γενικό πληθυσμό μπορεί να εκτιμηθεί χρησιμοποιώντας την υπολογισμένη επιλεκτική διασπορά, λαμβάνοντας υπόψη τον αριθμό των βαθμών ελευθερίας. Το τετράγωνο ρίζας από αυτή τη διασπορά δίνει την αξία που θα χρησιμοποιηθεί ως αξιολόγηση της γενικής μέσου όρου απόκλισης).

Χρησιμοποιώντας την τιμή της παραμέτρου στο "Υπολογίστε το μέσο σφάλμα της εκτίμησης της μεθόδου γενικού μέσου (X") που συζητήθηκε παραπάνω.

Όπως αναφέρθηκε προηγουμένως, σύμφωνα με την απαίτηση της ικανότητας εμπιστοσύνης στην ακρίβεια μιας ή άλλης αξιολόγησης σημείων αυξάνεται με αύξηση του μεγέθους του δείγματος. Επιδείξτε αυτή τη θεωρητική θέση στο παράδειγμα μιας εκτίμησης σημείων είναι κάπως δύσκολη. Η επίδραση της δειγματοληψίας στην ακρίβεια της αξιολόγησης είναι προφανής κατά τον υπολογισμό των εκτιμήσεων του διαστήματος. Αυτό θα συζητηθεί παρακάτω.

Ο Πίνακας 39 δείχνει τις πιο συχνά χρησιμοποιούμενες εκτιμήσεις σημείων για τις παραμέτρους του γενικού πληθυσμού.

Πίνακας 39.

Βασικές εκτιμήσεις σημείων _

Οι τιμές των εκτιμήσεων που υπολογίζονται με διαφορετικούς τρόπους ενδέχεται να είναι άνισοι σε μέγεθος. Από την άποψη αυτή, σε πρακτικούς υπολογισμούς, θα πρέπει να ασχολείται με συνεπή υπολογισμό πιθανών επιλογών, αλλά με βάση τις ιδιότητες των διαφόρων εκτιμήσεων, να επιλέξει ένα από αυτά.

Με ένα μικρό αριθμό μονάδων παρατήρησης, η εκτίμηση σημείων είναι κατά κύριο λόγο τύχη, επομένως, ελάχιστα αξιόπιστη. Επομένως, σε μικρά δείγματα, μπορεί να είναι πολύ διαφορετική από τα εκτιμώμενα χαρακτηριστικά του γενικού πληθυσμού. Μια τέτοια κατάσταση οδηγεί σε ακατέργαστα σφάλματα στα συμπεράσματα που ισχύουν για τον γενικό πληθυσμό σύμφωνα με τα αποτελέσματα του δείγματος. Για το λόγο αυτό, με δείγματα μικρής έντασης, χρησιμοποιούν εκτιμήσεις διαστήματος.

Σε αντίθεση με την εκτίμηση του διαστήματος σημείων δίνει μια σειρά από σημεία εντός των οποίων η παράμετρος του γενικού πληθυσμού πρέπει να είναι. Επιπλέον, η πιθανότητα αναφέρεται στην αξιολόγηση του διαστήματος και, ως εκ τούτου, είναι σημαντικό στη στατιστική ανάλυση.

Το διάστημα ονομάζεται εκτίμηση που χαρακτηρίζεται από δύο αριθμούς - τα όρια του διαστήματος που καλύπτει (καλύπτει) την εκτιμώμενη παράμετρο. Μια τέτοια αξιολόγηση είναι κάποιο διάστημα, στο οποίο μια δεδομένη πιθανότητα είναι η επιθυμητή παράμετρος. Το κέντρο του διαστήματος λαμβάνεται από εκτίμηση επιλεκτικού σημείου.

Έτσι, οι εκτιμήσεις του διαστήματος είναι η περαιτέρω ανάπτυξη της εκτίμησης των σημείων, όταν μια τέτοια αξιολόγηση σε ένα μικρό μέγεθος δείγματος είναι αναποτελεσματικό.

Το καθήκον της εκτίμησης διαστήματος γενικά μπορεί να διατυπωθεί ως εξής: Σύμφωνα με την επιλεκτική παρατήρηση, είναι απαραίτητο να οικοδομηθεί ένα αριθμητικό διάστημα, για το οποίο μπορεί να υποστηριχθεί το προηγούμενο επιλεγμένο επίπεδο πιθανότητας ότι εντός αυτού του διαστήματος είναι μια εκτιμώμενη παράμετρος.

Εάν πάρετε ένα επαρκώς μεγάλο αριθμό μονάδων δειγματοληψίας, στη συνέχεια, χρησιμοποιώντας το θεώρημα Lyapunov, μπορείτε να αποδείξετε την πιθανότητα ότι το σφάλμα δειγματοληψίας δεν θα υπερβεί κάποια δεδομένη τιμή Α, δηλαδή

Και "*!" Και ή και № "G. Ya.

Συγκεκριμένα, αυτό το θεωρητικό καθιστά δυνατή την αξιολόγηση των σφαλμάτων των κατά προσέγγιση ισοτιμιών:

- "P (p και - Συχνότητα) x "x. N

Εάν ^ * 2xz ..., X - ~ Ανεξάρτητες τυχαίες μεταβλητές και η, τότε η πιθανότητα του μέσου όρου τους (x) είναι στην περιοχή από Α έως 6 και μπορούν να προσδιοριστούν από τις εξισώσεις:

p (Α.(Η. (μι) 1 E 2. αυτά τα

_αλλά - E (x); _ V - E (x) DE ° A

Η πιθανότητα P ταυτόχρονα ονομάζεται εμπιστοσύνη πιθανότητα.

Έτσι, η πιθανότητα εμπιστοσύνης (αξιοπιστία) της εκτίμησης της γενικής παραμέτρου στην επιλεκτική αξιολόγηση ονομάζεται πιθανότητα με την οποία πραγματοποιούνται ανισότητες:

| ~ Η. | <а; | и, ориентир | <д

όπου ένα είναι το όριο σφάλματος της εκτίμησης, ανάλογα με τον μέσο όρο και μερίδιο.

Τα όρια στα οποία αυτή η δεδομένη πιθανότητα μπορεί να είναι το γενικό χαρακτηριστικό, ονομάζονται εμπιστευτικά διαστήματα (τα σύνορα εμπιστοσύνης). Και τα όρια αυτού του διαστήματος ονομάστηκαν τα όρια της εμπιστοσύνης.

Τα συντρόφιμα (ή τα ανεκτικά) σύνορα είναι σύνορα, παραγωγή πέρα \u200b\u200bαπό το οποίο αυτό το χαρακτηριστικό λόγω τυχαίων ταλαντώσεων έχει ελαφρά πιθανότητα (L ^ 0,5, P 2<0,01; Л <0,001). Понятие "доверительный интервал" введено Дж.Нейман и К.Пирсоном (1950 г.). Это установленный по выборочным данным интервал, который с заданной вероятностью (доверительной вероятностью) охватывает (покрывает) настоящее, но неизвестно для нас значение параметра. Если уровня доверительной вероятности принять значения 0,95, то эта вероятность свидетельствует о том, что при частых приложениях данного способа (метода) вычислений доверительный интервал примерно в 95% случаев будет покрывать параметр. Доверительный интервал генеральной средней и генеральной доли определяется на основе приведенных выше неравенств, из которых

Ακολουθεί ότι ~ _a - x - ~ + a; № _A - G. - № + Α.

Στα μαθηματικά στατιστικά στοιχεία, η αξιοπιστία μιας ή άλλης παραμέτρου εκτιμάται με την τιμή των τριών ακόλουθων επιπέδων πιθανότητας (μερικές φορές ονομάζεται "κατώτατα όρια πιθανότητας"): L \u003d 0.95; ^ 2 \u003d 0.99; p 3 \u003d 0.9999. Οι πιθανότητες που επιλύονται να παραμελήσει, δηλαδή, αλλά 1 = 0,05 ;; Α 2 \u003d 0,01. "3 \u003d 0.001 καλείται επίπεδο σημασίας, ή επίπεδα σημαντικότητας. Από τα παραπάνω επίπεδα, τα αξιόπιστα συμπεράσματα εξασφαλίζουν την πιθανότητα p 3 \u003d 0,9999. Κάθε επίπεδο πιθανότητας εμπιστοσύνης αντιστοιχεί σε μια ορισμένη τιμή της κανονικοποιημένης απόκλισης (βλ. Πίνακα 27). Εάν δεν υπάρχουν κανονικές τιμές διαστήματος πιθανότητας στη διάθεση των τυποποιημένων πινάκων, τότε αυτή η πιθανότητα μπορεί να υπολογιστεί με ένα ορισμένο βαθμό προσέγγισης από τον τύπο:

R<) = - = ^ = 1 e "~ ~ και.

Στο Σχήμα 11, τα τμήματα της συνολικής έκτασης που οριοθετούνται από μια κανονική καμπύλη και έναν άξονα τετμημένης που αντιστοιχούν στην τιμή είναι σκιασμένες <= ± 1;<= ± 2; <= и 3 и для которых вероятности равны 0,6287, 0,9545; 0,9973. При точечном оценке рассчитывается, как уже известно, средняя ошибка выборки, при интервальном - предельная.

Ανάλογα με τις αρχές της επιλογής των μονάδων (επαναλαμβανόμενες ή χωρίς επαναλαμβανόμενες), δομικές φόρμουλες για τον υπολογισμό των σφαλμάτων δειγματοληψίας

ποικίλλουν στο μέγεθος της τροπολογίας (η).

Σύκο. 11. Καμπύλη της κανονικής κατανομής των πιθανοτήτων

Ο Πίνακας 40 δείχνει τους τύπους υπολογισμού για σφάλματα εκτιμήσεων της γενικής παραμέτρου.

Εξετάστε μια συγκεκριμένη περίπτωση της αξιολόγησης του διαστήματος των παραμέτρων του γενικού πληθυσμού σύμφωνα με τα δεδομένα επιλεκτικής παρατήρησης.

Παράδειγμα. Στην δειγματοληψία των αγροκτικών της περιοχής, διαπιστώθηκε ότι η μέση ημερήσια σκόνη των αγελάδων (Χ) είναι 10 κιλά. Το ποσοστό των καθαρόαιμων βοοειδών στον συνολικό αριθμό ζωικού κεφαλαίου είναι 80%. Το σφάλμα δειγματοληψίας με την πιθανότητα εμπιστοσύνης p \u003d 0,954 ήταν ίση με 0,2 kg. Για ιδιωτικά καθαρόαιμα βοοειδή 1%.

Έτσι, τα όρια στα οποία μπορεί να τοποθετηθεί ο γενικός μέσος όρος

Η απόδοση, θα είναι 9,8<х <10,2; для генеральной доли скота -79 <Р <81.

Συμπέρασμα: Με πιθανότητα 0,954, μπορεί να υποστηριχθεί ότι η διαφορά μεταξύ της πρώτης παραγωγικότητας των αγελάδων και της γενικής παραγωγικότητας είναι 0,2 kg. Το μέσο ημερήσιο όριο είναι 9,8 και 10,2 kg. Το μερίδιο (ειδικό βάρος) των καθαρόαιμων βοοειδών στις επιχειρήσεις της περιοχής κυμαίνεται από 79 έως 81%, το σφάλμα εκτίμησης δεν υπερβαίνει το 1%.

Πίνακας 40.

Υπολογισμός σφαλμάτων δειγματοληψίας σημείων και διαστήματος

Κατά την οργάνωση ενός δείγματος, είναι σημαντικό να προσδιοριστεί ο απαραίτητος αριθμός (P). Το τελευταίο εξαρτάται από την παραλλαγή του ενωμένου συνόλου. Όσο περισσότερο οι κνησμός, τόσο μεγαλύτερος πρέπει να είναι ο αριθμός των δειγμάτων. Ανάδραση μεταξύ του αριθμού της δειγματοληψίας και του ορίου του σφάλματος. Η επιθυμία να πάρει ένα μικρότερο σφάλμα απαιτεί αύξηση του αριθμού των επιλεκτικών συσσωματώματος.

Ο απαιτούμενος αριθμός δειγματοληψίας καθορίζεται με βάση τους τύπους του σφάλματος επιλογής (D) με ένα καθορισμένο επίπεδο πιθανότητας (P). Οι μαθηματικοί μετασχηματιστές λαμβάνονται τύποι για τον υπολογισμό του μεγέθους του δείγματος (Πίνακας 41).

Πίνακας 41.

Υπολογισμός του απαιτούμενου αριθμού δειγματοληψίας _

Πρέπει να σημειωθεί ότι όλες οι στατιστικές αξιολογήσεις βασίζονται στην υπόθεση ότι το επιλεκτικό σύνολο των οποίων χρησιμοποιείται στην αξιολόγηση που λαμβάνεται χρησιμοποιώντας τη μέθοδο (μέθοδος) της επιλογής, η οποία εξασφαλίζει τις πιθανότητες του δείγματος.

Ταυτόχρονα, η επιλογή μιας πιθανότητας εμπιστοσύνης αξιολόγησης, θα πρέπει να καθοδηγείται από την αρχή ότι η επιλογή του επιπέδου της δεν είναι μαθηματικά καθήκοντα, αλλά καθορίζεται από το πρόβλημα που λυθεί ειδικά. Στην επιβεβαίωση, εξετάστε το παράδειγμα.

Παράδειγμα. Ας υποθέσουμε ότι, σε δύο επιχειρήσεις, η πιθανότητα παραγωγής τελικών προϊόντων (υψηλής ποιότητας) είναι ίση με p \u003d 0,9999, δηλαδή, η πιθανότητα απόκτησης του γάμου των προϊόντων θα είναι A \u003d 0,001. Είναι δυνατόν στο πλαίσιο των μαθηματικών εκτιμήσεων, που δεν ενδιαφέρεται για τη φύση του προϊόντος, για την επίλυση του ζητήματος αν η έλλειψη Α \u003d 0,001 έχει μεγάλη πιθανότητα. Ας υποθέσουμε ότι μια επιχείρηση παράγει ένα σπόρο και το δεύτερο είναι αεροσκάφος για τη θεραπεία καλλιεργειών. Εάν ένα ελαττωματικό θα συμβεί σε 1000 σπόροι, τότε μπορείτε να το αντισταθμίσετε, επειδή η τήξη του 0,1% των σπορατών είναι φθηνότερη από την ανοικοδόμηση της τεχνολογικής διαδικασίας. Εάν ένα ελαττωματικό, αυτό σίγουρα θα οδηγήσει σε σοβαρές συνέπειες κατά τη διάρκεια της λειτουργίας του. Έτσι, στην πρώτη περίπτωση, η πιθανότητα απόκτησης γάμου αλλά = 0,001 μπορούν να γίνουν δεκτά στη δεύτερη περίπτωση - όχι. Για το λόγο αυτό, η επιλογή μιας αξιοπιστίας πιθανότητας στους υπολογισμούς γενικά και κατά τον υπολογισμό των εκτιμήσεων, ειδικότερα, θα πρέπει να πραγματοποιηθεί με βάση τις ειδικές συνθήκες του προβλήματος.

Ανάλογα με τα καθήκοντα της μελέτης, μπορεί να χρειαστεί να υπολογίσετε ένα ή δύο σύνορα εμπιστοσύνης. Εάν τα χαρακτηριστικά του επιλυθέντος προβλήματος απαιτούν μόνο ένα από τα όρια, το πάνω ή το χαμηλότερο, μπορείτε να βεβαιωθείτε ότι η πιθανότητα με την οποία έχει ρυθμιστεί αυτό το όριο θα είναι υψηλότερο από ό, τι όταν καθορίζει τα δύο όρια για την ίδια τιμή συντελεστή εμπιστοσύνης 1

Αφήστε τα σύνορα εμπιστοσύνης να είναι εγκατεστημένα με την πιθανότητα p \u003d 0,95, δηλαδή,

Σε 95% των περιπτώσεων, το γενικό δευτεροταγές (x) δεν θα είναι μικρότερο από το χαμηλότερο

Εμπιστευτικό διάστημα X ™ - X "M και δεν υπάρχει πλέον ανώτερη εμπιστοσύνη

Το διάστημα χαλκού είναι \u003d X + στην περίπτωση αυτή, μόνο με πιθανότητα Α \u003d 0,05 (ή 5%), ο μέσος γενικός μπορεί να εξέρχεται από τα καθορισμένα όρια. Δεδομένου ότι η κατανομή του x είναι συμμετρική, τότε το ήμισυ αυτού του επιπέδου

Οι πιθανότητες, δηλαδή, το 2,5% θα σε περίπτωση που το Χ (X ™ είναι το δεύτερο εξάμηνο, το X ^ X "^ -. Από αυτό προκύπτει ότι η πιθανότητα ο μέσος γενικός μπορεί να είναι μικρότερος από την κορυφή της αξίας

Τα εμπιστευτικά σύνορα των διαφημίσεων "-, ίσο με 0,975 (δηλαδή 0,95 +0.025). Ως εκ τούτου, οι συνθήκες δημιουργούνται όταν παραμελούμε με δύο συνόψει εμπιστοσύνης

Το νόημα x είναι μικρότερο από το x "". Και μεγάλο ή στο Heer. Κλήση

Μόνο ένα περίγραμμα εμπιστοσύνης, για παράδειγμα, το συμβούλιο, παραμελούμε μόνο εκείνες που υπερβαίνουν αυτά τα σύνορα. Για την ίδια αξία του συντελεστή εμπιστοσύνης X, το επίπεδο σημασίας και εδώ αποδεικνύεται ότι είναι δύο φορές λιγότερο.

Εάν υπολογίζεται μόνο το σημείο που υπερβαίνει

(Ή αντίστροφα δεν υπερβαίνει) Οι τιμές της επιθυμητής παραμέτρου X, το διάστημα εμπιστοσύνης ονομάζεται μονόπλευρη. Εάν οι εξεταζόμενες τιμές είναι περιορισμένες και στις δύο πλευρές, το διάστημα εμπιστοσύνης ονομάζεται διμερές. Από τα ανωτέρω, προκύπτει ότι οι υποθέσεις και ορισμένα κριτήρια, ιδίως το κριτήριο του φοιτητή, πρέπει να θεωρηθούν μονόπλευρες και διμερείς. Ως εκ τούτου, με διμερή υπόθεση, το επίπεδο σημασίας για την ίδια τιμή του Χ θα είναι διπλάσια όσο μονόπλευρη. Αν θέλουμε να αφήσουν το ίδιο επίπεδο σημασίας (και το επίπεδο της πρεσβείας εμπιστοσύνης), όπως με μια υπόθεση διπλής όψης, τότε η τιμή του Χ πρέπει να ληφθεί λιγότερη. Αυτή η λειτουργία λαμβάνεται υπόψη κατά την κατάρτιση τυποποιημένων πινάκων των κριτηρίων X-Student (προσάρτημα 1).

Είναι γνωστό ότι από την πρακτική πλευρά, είναι πιο συχνά ενδιαφέρον όχι τόσο διαστήματα εμπιστοσύνης της πιθανής αξίας του γενικού μέσου όρου, πόσοι είναι οι μέγιστες και ελάχιστες τιμές, περισσότερο ή λιγότερο από τα οποία, με μια δεδομένη (αξιόπιστη) πιθανότητα , δεν μπορεί. Στα μαθηματικά στατιστικά στοιχεία, ονομάζονται εγγυημένοι μέγιστο και εγγυημένο ελάχιστο μέσο όρο. Περιγράφοντας αυτές τις παραμέτρους

Συνεπώς, μέσω και X ™, μπορείτε να γράψετε: HS ™ \u003d x +; Υψηλότερη \u003d x ~.

Κατά τον υπολογισμό των εγγυημένων μέγιστων και ελάχιστων τιμών του γενικού μέσου, καθώς τα όρια του μονομερούς διαστήματος εμπιστοσύνης στις παραπάνω φόρμουλες, η τιμή 1 Θεωρείται ως ένα κριτήριο μονόπλευρο.

Παράδειγμα. Σε 20 τμήματα εγκαταστάθηκε η μέση απόδοση ζαχαρότευτλων 300 N / ha. Αυτός ο επιλεκτικός μέσος χαρακτήρας χαρακτηρίζει την αντίστοιχη

Η παράμετρος του γενικού πληθυσμού (x) με σφάλμα 10 n / ha. Σύμφωνα με την επιλεκτικότητα των εκτιμήσεων, η γενική μέση απόδοση μπορεί να είναι και περισσότερο και λιγότερο επιλεκτικός μέσος όρος Χ \u003d 300. Με την πιθανότητα p \u003d 0,95, μπορεί να υποστηριχθεί ότι η επιθυμητή παράμετρος δεν θα είναι περισσότερο HS "\u003d 300 +1.73 x10 \u003d 317,3 C / ha.

Η τιμή του 1 λαμβάνεται για τον αριθμό των βαθμών της ελευθερίας ^ \u003d 20-1 με μια μονομερή κρίσιμη περιοχή και το επίπεδο σημασίας αλλά = 0,05 (προσάρτημα 1). Έτσι, με την πιθανότητα p \u003d 0,95, το μέγιστο δυνατό επίπεδο γενικής μέσης απόδοσης υπολογίζεται σε 317 n / ha, δηλαδή, υπό ευνοϊκές συνθήκες, η μέση απόδοση των ζαχαρότευτλων δεν υπερβαίνει την καθορισμένη τιμή.

Σε ορισμένους κλάδους της γνώσης (για παράδειγμα, στις φυσικές επιστήμες), η θεωρία της αξιολόγησης είναι κατώτερη από τη θεωρία της επαλήθευσης των στατιστικών υποθέσεων. Στην οικονομική επιστήμη, οι μέθοδοι στατιστικής αξιολόγησης διαδραματίζουν πολύ σημαντικό ρόλο στην επαλήθευση της αξιοπιστίας των ερευνητικών αποτελεσμάτων, καθώς και σε διάφορους τύπους πρακτικών υπολογισμών. Πρώτα απ 'όλα, αφορά τη χρήση σημείων αξιολόγησης των μελετητικών στατιστικών μεγεθών. Η επιλογή μπορεί να είναι καλύτερη αξιολόγηση - το κύριο πρόβλημα της εκτίμησης σημείων. Η δυνατότητα αυτής της επιλογής οφείλεται στη γνώση των βασικών ιδιοτήτων (απαιτήσεις) των στατιστικών αξιολογήσεων.

) Καθήκοντα μαθηματικών στατιστικών.

Ας υποθέσουμε ότι υπάρχει μια παραμετρική οικογένεια διανομής πιθανοτήτων (για απλότητα, θεωρούμε τη διανομή τυχαίων μεταβλητών και την περίπτωση μιας παραμέτρου). Εδώ είναι μια αριθμητική παράμετρος, η τιμή του οποίου είναι άγνωστη. Απαιτείται να εκτιμηθεί σύμφωνα με το υπάρχον δείγμα τιμών που παράγονται από αυτή τη διανομή.

Διακρίνει δύο κύριους τύπους αξιολόγησης: Εκτιμήσεις σημείων και Διαστήματα εμπιστοσύνης.

Εκτίμηση

Η εκτίμηση σημείων είναι μια μορφή στατιστικής εκτίμησης στην οποία η αξία μιας άγνωστης παραμέτρου πλησιάζει ξεχωριστό αριθμό. Δηλαδή, πρέπει να καθορίσετε τη λειτουργία από το δείγμα (στατιστικά στοιχεία)

,

Η αξία της οποίας θα θεωρηθεί ως προσέγγιση σε μια άγνωστη πραγματική αξία.

Οι γενικές μέθοδοι για τις εκτιμήσεις του κτιρίου περιλαμβάνουν: τη μέθοδο της μέγιστης αλήθειας, τη μέθοδο των στιγμών, τη μέθοδο των ποσοτικών.

Παρακάτω υπάρχουν ορισμένες ιδιότητες που μπορεί να έχουν ή να μην διαθέτουν εκτιμήσεις σημείων.

Πλούτος

Μία από τις πιο προφανείς απαιτήσεις αξιολόγησης σημείων είναι να περιμένουμε επαρκώς καλή προσέγγιση στην πραγματική αξία της παραμέτρου σε επαρκώς μεγάλες τιμές του όγκου δειγματοληψίας. Αυτό σημαίνει ότι η αξιολόγηση θα πρέπει να συγκλίνει προς την πραγματική έννοια. Αυτή είναι μια ιδιότητα αξιολόγησης και καλείται Πλούτος. Δεδομένου ότι μιλάμε για τυχαίες ποσότητες για τις οποίες υπάρχουν διάφοροι τύποι σύγκλισης, τότε αυτή η ιδιοκτησία μπορεί να διαμορφωθεί με ακρίβεια με διαφορετικούς τρόπους:

Όταν χρησιμοποιείτε έναν όρο Πλούτος, συνήθως αναφέρεται αδύναμη βιωσιμότητα, δηλ. σύγκλιση πιθανότητας.

Η προϋπόθεση της συνέπειας είναι πρακτικά υποχρεωτική για όλες τις αξιολογήσεις που χρησιμοποιούνται στην πράξη. Οι αφερέγγυες αξιολογήσεις χρησιμοποιούνται εξαιρετικά σπάνια.

Ανοσία και ασυμπτωτική αποτυχία

Η βαθμολογία παραμέτρων καλείται ΚαταλαβαίνουνΕάν η μαθηματική προσδοκία του είναι ίση με την πραγματική αξία της εκτιμώμενης παραμέτρου:

.

Η ασθενέστερη κατάσταση είναι Ασυμπτωτική αποτυχίαΑυτό σημαίνει ότι η μαθηματική προσδοκία της αξιολόγησης συγκλίνει στην πραγματική τιμή της παραμέτρου με την αύξηση της δειγματοληψίας:

.

Η αναπηρία είναι η συνιστώμενη ιδιότητα των εκτιμήσεων. Ωστόσο, δεν πρέπει να υπερισχύεται υπερβολικά από τη σημασία του. Τις περισσότερες φορές, οι μη καθορισμένες εκτιμήσεις των παραμέτρων υπάρχουν και στη συνέχεια προσπαθούν να εξετάσουν μόνο τους. Ωστόσο, ενδέχεται να υπάρχουν τέτοιες στατιστικές εργασίες στις οποίες δεν υπάρχουν μη μορφοποιημένες αξιολογήσεις. Το πιο διάσημο παράδειγμα είναι το εξής: Εξετάστε τη διανομή του Poisson με την παράμετρο και παραδώστε το καθήκον της εκτίμησης της παραμέτρου. Μπορεί να αποδειχθεί ότι δεν υπάρχει ασταθής αξιολόγηση για αυτό το έργο.

Σύγκριση των εκτιμήσεων και της αποτελεσματικότητας

Για τη σύγκριση μεταξύ διαφορετικών εκτιμήσεων της ίδιας παραμέτρου, χρησιμοποιείται η ακόλουθη μέθοδος: Επιλέξτε μερικά Λειτουργία κινδύνουη οποία μετρά την εκτροπή της εκτίμησης από την πραγματική αξία της παραμέτρου και το καλύτερο θεωρούν το ένα για το οποίο η λειτουργία αυτή διαρκεί μικρότερη τιμή.

Τις περισσότερες φορές, η μαθηματική προσδοκία της πλατείας των αποκλίσεων αποτίμησης από την αληθινή έννοια θεωρείται ως λειτουργία κινδύνου.

Για μη συνδεδεμένες εκτιμήσεις, είναι απλώς μια διασπορά.

Υπάρχει ένα χαμηλότερο όριο σε αυτή τη λειτουργία κινδύνου που ονομάζεται Ανισότητα του Kramer-Rao.

(Ασταθές) εκτιμήσεις για τις οποίες επιτυγχάνεται αυτό το κατώτατο όριο (δηλ. Έχοντας την ελάχιστη δυνατή διασπορά) Αποτελεσματικός. Ωστόσο, η ύπαρξη αποτελεσματικής αξιολόγησης είναι μια αρκετά ισχυρή απαίτηση για το έργο που απέχει πολύ από πάντα.

Η κατάσταση είναι ασθενέστερη Ασυμπτωτική απόδοσηΑυτό σημαίνει ότι η αναλογία της διασποράς της μη μορφής εκτίμησης στο κατώτερο όριο του Kramera-Rao τείνει σε μια μονάδα στο.

Σημειώστε ότι με επαρκώς ευρείες υποθέσεις σχετικά με την υπό μελέτη διανομής, η μέγιστη μέθοδος αλήθειας δίνει μια ασυμπτωτικά αποτελεσματική εκτίμηση της παραμέτρου και εάν υπάρχει μια αποτελεσματική αξιολόγηση - τότε δίνει μια αποτελεσματική αξιολόγηση.

Επαρκή στατιστικά στοιχεία

Οι στατιστικές ονομάζονται επαρκής Για μια παράμετρο, εάν η υπό όρους κατανομή του δείγματος παρέχεται ότι δεν εξαρτάται από την παράμετρο για όλους.

Η σημασία της έννοιας των επαρκών στατιστικών καθορίζεται από τα ακόλουθα Εγκριση. Εάν υπάρχουν επαρκή στατιστικά στοιχεία, η Α είναι μια αδικαιολόγητη αξιολόγηση της παραμέτρου, τότε η πιθανή μαθηματική προσδοκία είναι επίσης μια απίστευτη εκτίμηση της παραμέτρου και η διασπορά της είναι μικρότερη ή ίση με τη διασπορά της αρχικής αξιολόγησης.

Θυμηθείτε ότι η πιθανή μαθηματική προσδοκία είναι μια τυχαία τιμή που είναι μια λειτουργία από. Έτσι, στην κατηγορία των μη σχετιζόμενων εκτιμήσεων, αρκεί να εξεταστούν μόνο εκείνα που είναι λειτουργίες από επαρκή στατιστικά στοιχεία (υπό την προϋπόθεση ότι υπάρχει τέτοιο έργο).

(Απίστευτη) Η αποτελεσματική εκτίμηση παραμέτρων είναι πάντα επαρκή στατιστικά στοιχεία.

Μπορεί να ειπωθεί ότι επαρκή στατιστικά στοιχεία περιέχουν όλες τις πληροφορίες σχετικά με την εκτιμώμενη παράμετρο, η οποία περιέχεται στο δείγμα.

Στατιστικές εκτιμήσεις των παραμέτρων του γενικού πληθυσμού. Στατιστική υπόθεση

Διάλεξη 16.

Ας πάρουμε για να εξερευνήσετε το ποσοτικό σημάδι του γενικού πληθυσμού. Ας υποθέσουμε ότι από τις θεωρητικές εκτιμήσεις ήταν δυνατόν να διαπιστωθεί ποια διανομή είναι ένα σημάδι. Από εδώ υπάρχει ένα καθήκον της εκτίμησης των παραμέτρων που καθορίζουν αυτή τη διανομή. Για παράδειγμα, εάν είναι γνωστό ότι το σπουδαίο σημάδι διανέμεται στον γενικό πληθυσμό σύμφωνα με το κανονικό νόμο, τότε είναι απαραίτητο να αξιολογηθεί η μαθηματική προσδοκία και η τυπική απόκλιση, αφού αυτές οι δύο παράμετροι καθορίζουν πλήρως την κανονική κατανομή. Εάν υπάρχει λόγος να πιστεύουμε ότι το σημάδι έχει τη διανομή του Poisson, τότε είναι απαραίτητο να υπολογιστεί η παράμετρος που προσδιορίζεται αυτή η κατανομή.

Συνήθως, στη διανομή, ο ερευνητής έχει μόνο δεδομένα δειγματοληψίας, για παράδειγμα, οι τιμές του ποσοτικού χαρακτηριστικού που λαμβάνονται ως αποτέλεσμα των παρατηρήσεων (εδώ και στη συνέχεια παρατηρήσεις είναι ανεξάρτητες). Μέσω αυτών των δεδομένων και εκφράστε την εκτιμώμενη παράμετρο.

Λαμβάνοντας υπόψη τον τρόπο με τον οποίο οι αξίες των ανεξάρτητων τυχαίων μεταβλητών , Μπορεί να ειπωθεί ότι είναι δυνατόν να βρεθεί μια στατιστική εκτίμηση της άγνωστης παραμέτρου των θεωρητικών μέσων διανομής για να βρούμε μια λειτουργία από τις παρατηρούμενες τυχαίες μεταβλητές, οι οποίες δίδουν κατά προσέγγιση τιμή της εκτιμώμενης παραμέτρου. Για παράδειγμα, όπως θα εμφανίζεται παρακάτω, χρησιμοποιείται μια λειτουργία για την αξιολόγηση της μαθηματικής προσδοκίας της κανονικής κατανομής (οι μέσες αριθμητικές παρατηρούμενες τιμές):

.

Ετσι, Στατιστική αξιολόγηση Η άγνωστη παράμετρος της θεωρητικής κατανομής ονομάζεται λειτουργία από τις παρατηρούμενες τυχαίες μεταβλητές. Η στατιστική αξιολόγηση της άγνωστης παραμέτρου του γενικού πληθυσμού που καταγράφεται από έναν αριθμό καλείται Λαιμός. Εξετάστε τις ακόλουθες εκτιμήσεις σημείων: εκτοπισμένο και ασταθές, αποτελεσματικό και πλούσιο.

Προκειμένου οι στατιστικές εκτιμήσεις να δώσουν "καλές" προσεγγίσεις των εκτιμώμενων παραμέτρων, πρέπει να πληρούν ορισμένες απαιτήσεις. Καθορίζουμε αυτές τις απαιτήσεις.

Αφήστε να υπάρξει στατιστική αξιολόγηση μιας άγνωστης παραμέτρου της θεωρητικής κατανομής. Ας υποθέσουμε ότι όταν ο όγκος δειγματοληφθεί, βρέθηκε αξιολόγηση. Επαναλαμβάνουμε την εμπειρία, δηλαδή το απόσπασμα από τον γενικό πληθυσμό, ένα άλλο δείγμα του ίδιου όγκου και από τα δεδομένα της θα βρει αξιολόγηση κ.λπ. Επαναλαμβανόμενη εμπειρία επανειλημμένα, παίρνουμε τον αριθμό η οποία, γενικά, θα διαφέρει μεταξύ τους. Έτσι, η εκτίμηση μπορεί να θεωρηθεί ως τυχαίο ποσό, και - όσο το δυνατόν τις αξίες του.

Είναι σαφές ότι εάν η εκτίμηση δίνει μια κατά προσέγγιση τιμή με μια περίσσεια, κάθε αριθμός που βρίσκεται σύμφωνα με τα δεδομένα δείγματος θα είναι πιο αληθής. Επομένως, στην περίπτωση αυτή, η μαθηματική (μέση τιμή) της τυχαίας μεταβλητής θα είναι μεγαλύτερη από, δηλαδή. Προφανώς, αν δίνει μια κατά προσέγγιση αξία με ένα μειονέκτημα, τότε.


Ως εκ τούτου, η χρήση μιας στατιστικής αξιολόγησης, η μαθηματική προσδοκία του οποίου δεν είναι ίση με την εκτιμώμενη παράμετρο, οδηγεί σε συστηματικά (ένα σημάδι) σφάλματα. Για το λόγο αυτό, είναι φυσικό να απαιτηθεί η μαθηματική προσδοκία της αξιολόγησης να είναι ίσος με την παράμετρος. Αν και η προσκόλληση αυτής της απαίτησης, γενικά, δεν θα εξαλείψει τα σφάλματα (ορισμένες τιμές είναι περισσότερο, ενώ άλλες είναι μικρότερες από), τα σφάλματα των διαφόρων χαρακτήρων θα καλυφθούν όσο συχνά θα ικανοποιηθούν. Ωστόσο, η συμμόρφωση με την απαίτηση εγγυάται την αδυναμία απόκτησης συστηματικών σφαλμάτων, δηλαδή εξαλείφει τα συστηματικά σφάλματα.

Καταλαβαίνουν Κλήση στατιστικής αξιολόγησης (σφάλμα), η μαθηματική προσδοκία των οποίων ισούται με την εκτιμώμενη παράμετρο με οποιοδήποτε μέγεθος του δείγματος, δηλαδή.

Μετατοπίστηκε Καλέστε μια στατιστική αξιολόγηση, η μαθηματική προσδοκία των οποίων δεν είναι ίση με την εκτιμώμενη παράμετρο σε οποιοδήποτε μέγεθος δείγματος, δηλαδή.

Ωστόσο, θα ήταν λανθασμένο να υποθέσουμε ότι μια απίστευτη εκτίμηση παρέχει πάντα μια καλή προσέγγιση της εκτιμώμενης παραμέτρου. Πράγματι, οι πιθανές τιμές μπορούν να διασκορπιστούν έντονα γύρω από τη μέση τιμή τους, δηλαδή η διασπορά μπορεί να είναι σημαντική. Στην περίπτωση αυτή, η αξιολόγηση βρίσκεται σύμφωνα με το ίδιο δείγμα, για παράδειγμα, μπορεί να είναι πολύ απομακρυσμένο από τη μέση τιμή, πράγμα που σημαίνει ότι της πιο εκτιμώμενης παραμέτρου. Έτσι, η αποδοχή ως προσεγγισμένη αξία, θα παραδεχτούμε ένα μεγάλο λάθος. Εάν χρειάζεστε τη διασπορά να είναι μικρή, η ικανότητα να επιτρέπεται σε ένα μεγάλο λάθος θα αποκλειστεί. Για το λόγο αυτό, η στατιστική αξιολόγηση καθιστά την απαίτηση αποτελεσματικότητας.

Αποτελεσματικός Καλούν μια στατιστική αξιολόγηση, η οποία (με ένα δεδομένο όγκο δείγματος) έχει τη μικρότερη δυνατή διασπορά.

Πλούσιος Καλούν μια στατιστική αξιολόγηση, η οποία, όταν προσπαθεί πιθανότητα για την εκτιμώμενη παράμετρο, δηλαδή η ισότητα είναι αληθής:

.

Για παράδειγμα, εάν η διασπορά μιας ασταθής εκτίμησης προσπαθεί να μηδενική, μια τέτοια αξιολόγηση είναι επίσης πλούσια.

Εξετάστε το ζήτημα της οποίας το επιλεκτικό χαρακτηριστικό είναι καλύτερο κατά την έννοια της ασυνέπειας, της αποτελεσματικότητας και της συνέπειας να αξιολογεί τη γενική δευτεροβάθμια και διασπορά.

Αφήστε το διακριτό γενικό σύνολο σε σχέση με μια ορισμένη ποσοτική βάση.

Γενική μέση Ονομάζεται μέσες αριθμητικές αξίες του σημείου του γενικού πληθυσμού. Υπολογίζεται από τον τύπο:

§ - Εάν όλες οι τιμές του σημείου του γενικού πληθυσμού του όγκου είναι διαφορετικές.

§ - Εάν οι τιμές του σημείου του γενικού πληθυσμού έχουν αντίστοιχα συχνότητα, και. Δηλαδή, ο γενικός μέσος όρος είναι οι μέσες σταθμισμένες τιμές του χαρακτηριστικού των βαρών ίσων με τις αντίστοιχες συχνότητες.

Σχόλιο: Ας υποθέσουμε ότι αφήστε το γενικό σύνολο όγκου να περιέχει αντικείμενα με διαφορετικές τιμές της δυνατότητας. Φανταστείτε ότι ένα αντικείμενο εξάγεται από αυτό το σύνολο. Η πιθανότητα να εξάγεται ένα αντικείμενο με ένα σημάδι ενός χαρακτηριστικού, για παράδειγμα, είναι προφανώς ίση με. Με την ίδια πιθανότητα, οποιοδήποτε άλλο αντικείμενο μπορεί να ανακτηθεί. Έτσι, η τιμή χαρακτήρα μπορεί να θεωρηθεί ως τυχαία ποσότητα, οι πιθανές τιμές των οποίων έχουν τις ίδιες πιθανότητες ίση με. Δεν είναι δύσκολο, σε αυτή την περίπτωση, να βρείτε μια μαθηματική προσδοκία:

Έτσι, αν εξετάσουμε το ερευνημένο σημάδι του γενικού πληθυσμού ως τυχαίο ποσό, τότε η μαθηματική προσδοκία του χαρακτηριστικού είναι ίση με τη γενική μέση αυτού του χαρακτηριστικού :. Λάβαμε αυτό το συμπέρασμα, πιστεύοντας ότι όλα τα αντικείμενα του γενικού πληθυσμού έχουν διαφορετικά σημάδια. Το ίδιο αποτέλεσμα θα επιτευχθεί, αν υποθέσουμε ότι το γενικό σετ περιέχει πολλά αντικείμενα με το ίδιο σημάδι.

Συνοψίζοντας το αποτέλεσμα που προκύπτει στον γενικό συνδυασμό με τη συνεχή κατανομή του χαρακτηριστικού, ορίζουμε τον γενικό μέσο όρο ως μια μαθηματική λειτουργία αναμονής: .

Ας υποθέσουμε ότι μπορείτε να μελετήσετε το γενικό σύνολο σε σχέση με το ποσοτικό χαρακτηριστικό, ανακτάται ένα δείγμα όγκου.

Επιλεκτικός μέσος όρος Καλέστε τις μέσες αριθμητικές τιμές του σημείου του σετ δείγματος. Υπολογίζεται από τον τύπο:

§ - Εάν όλες οι τιμές του χαρακτηριστικού ορίου όγκου είναι διαφορετικές.

§ - Εάν οι τιμές των χαρακτηριστικών του συνόλου δείγματος είναι αντίστοιχα συχνότητες, και. Δηλαδή, ο επιλεκτικός μέσος όρος είναι οι μέσες σταθμισμένες τιμές του χαρακτηριστικού με βάρη ίσα με τις αντίστοιχες συχνότητες.

Σχόλιο: Επιλεκτικός μέσος όρος που βρίσκεται σύμφωνα με ένα δείγμα είναι προφανώς ένας συγκεκριμένος αριθμός. Εάν εξάγετε άλλα δείγματα του ίδιου όγκου από το ίδιο γενικό αδρανές, τότε ο επιλεκτικός μέσος όρος θα αλλάξει από δείγμα δείγματος. Έτσι, ο επιλεκτικός μέσος όρος μπορεί να θεωρηθεί ως τυχαίος αριθμός και ως εκ τούτου μπορούμε να μιλήσουμε για τις κατανομές (θεωρητικό και εμπειρικό) μέσο δείγματος και τα αριθμητικά χαρακτηριστικά αυτής της κατανομής, ιδίως σχετικά με την προσδοκία και τη διασπορά της κατανομής του δείγματος .

Περαιτέρω, εάν ο στρατηγός είναι άγνωστος είναι άγνωστος και υποχρεούται να το αξιολογήσει σύμφωνα με τα δεδομένα δείγματος, τότε ως αξιολόγηση του γενικού μέσου, ο επιλεκτικός μέσος όρος λαμβάνεται ως ασταθής και πλούσια αξιολόγηση (προσφέρουμε αυτή τη δήλωση για να αποδείξουμε τον εαυτό σας ). Από τα παραπάνω προκύπτει ότι, εάν σε διάφορα δείγματα υπάρχει επαρκώς μεγάλη ποσότητα ενός και ο ίδιος γενικός πληθυσμός, θα βρεθούν επιλεκτικοί μέσοι όροι, θα είναι περίπου ίσοι μεταξύ τους. Αυτό αποτελείται από ένα ακίνητο. Αειφορία του μέσου δείγματος.

Πρέπει να σημειωθεί ότι εάν η διασπορά δύο σετ είναι η ίδια, τότε η εγγύτητα του δείγματος μέσου στο γενικά δεν εξαρτάται από τον λόγο του μεγέθους του δείγματος στον όγκο του γενικού πληθυσμού. Εξαρτάται από το μέγεθος του δείγματος: ο όγκος του δείγματος περισσότερο, ο λιγότερο επιλεκτικός μέσος όρος διαφέρει από το γενικό. Για παράδειγμα, εάν το 1% των αντικειμένων επιλέχθηκε από ένα ενιαίο σετ και το 4% των αντικειμένων επιλέχθηκε από ένα άλλο σετ και ο όγκος του πρώτου δείγματος αποδείχθηκε ότι ήταν μεγάλος από το δεύτερο, τότε ο πρώτος επιλεκτικός μέσος όρος θα διαφέρει λιγότερο από τον αντίστοιχο γενικό μέσο όρο από το δεύτερο.