Τι είναι η στατιστική αξιολόγηση. Ανάλυση της ομοιότητας των κατανομών. Σημειακή εκτίμηση των παραμέτρων κατανομής

Ας απαιτηθεί η μελέτη των ποσοτικών χαρακτηριστικών του γενικού πληθυσμού. Ας υποθέσουμε ότι από θεωρητικές εκτιμήσεις ήταν δυνατό να καθοριστεί τι είδους διανομή έχει ένα χαρακτηριστικό. Το πρόβλημα προκύπτει από την εκτίμηση των παραμέτρων που καθορίζουν αυτήν την κατανομή. Για παράδειγμα, εάν είναι γνωστό εκ των προτέρων ότι το μελετημένο χαρακτηριστικό κατανέμεται στον γενικό πληθυσμό σύμφωνα με τον κανονικό νόμο, τότε είναι απαραίτητο να εκτιμηθεί η μαθηματική προσδοκία και η τυπική απόκλιση, καθώς αυτές οι δύο παράμετροι καθορίζουν πλήρως την κανονική κατανομή. Εάν υπάρχει λόγος να πιστεύουμε ότι το χαρακτηριστικό έχει κατανομή Poisson, τότε είναι απαραίτητο να εκτιμηθεί η παράμετρος με την οποία προσδιορίζεται αυτή η κατανομή. Συνήθως υπάρχουν μόνο δείγματα δεδομένων που λαμβάνονται ως αποτέλεσμα παρατηρήσεων: ,, ...,. Μέσω αυτών των δεδομένων εκφράζεται η εκτιμώμενη παράμετρος. Λαμβάνοντας υπόψη το ..., ως τις τιμές των ανεξάρτητων τυχαίων μεταβλητών, ... δίνει μια κατά προσέγγιση τιμή της εκτιμώμενης παραμέτρου.

Ετσι, στατιστική αξιολόγησηάγνωστη παράμετρος της θεωρητικής κατανομής ονομάζεται συνάρτηση των παρατηρούμενων τυχαίων μεταβλητών. Καλείται μια στατιστική εκτίμηση της άγνωστης παραμέτρου του γενικού πληθυσμού κατά έναν αριθμό σημείο... Λαμβάνονται υπόψη οι ακόλουθες εκτιμήσεις σημείων: προκατειλημμένες και αμερόληπτες, αποτελεσματικές και συνεπείς.

Προκειμένου οι στατιστικές εκτιμήσεις να παρέχουν καλές προσεγγίσεις των εκτιμώμενων παραμέτρων, πρέπει να πληρούν ορισμένες απαιτήσεις. Ας υποδείξουμε αυτές τις απαιτήσεις. Ας υπάρχει μια στατιστική εκτίμηση της άγνωστης παραμέτρου της θεωρητικής κατανομής. Ας υποθέσουμε ότι έχει βρεθεί μια εκτίμηση για ένα δείγμα όγκου. Ας επαναλάβουμε το πείραμα, δηλαδή βγάζουμε από τον γενικό πληθυσμό ένα άλλο δείγμα του ίδιου μεγέθους και, σύμφωνα με τα δεδομένα του, βρίσκουμε μια εκτίμηση κλπ. Λαμβάνουμε αριθμούς ,, ..., που θα είναι διαφορετικοί από κάθε έναν άλλα. Έτσι, η εκτίμηση μπορεί να θεωρηθεί ως τυχαία μεταβλητή και οι αριθμοί ,, ..., - ως πιθανές τιμές.

Εάν η εκτίμηση δίνει μια κατά προσέγγιση τιμή με περίσσεια, τότε ο αριθμός που βρέθηκε από τα δείγματα δεδομένων ( ) θα είναι μεγαλύτερη από την πραγματική τιμή. Κατά συνέπεια, η μαθηματική προσδοκία (μέση τιμή) της τυχαίας μεταβλητής θα είναι επίσης μεγαλύτερη από, δηλ. Εάν δίνει μια κατά προσέγγιση τιμή με μειονέκτημα, τότε.

Έτσι, η χρήση μιας στατιστικής εκτίμησης, η μαθηματική προσδοκία της οποίας δεν είναι ίση με την εκτιμώμενη παράμετρο, θα οδηγούσε σε συστηματικά σφάλματα. Επομένως, είναι απαραίτητο να απαιτηθεί η μαθηματική προσδοκία της εκτίμησης να είναι ίση με την εκτιμώμενη παράμετρο. Η συμμόρφωση εξαλείφει τα συστηματικά σφάλματα.

Αμερόληπτοςονομάζεται στατιστική εκτίμηση, η μαθηματική προσδοκία της οποίας είναι ίση με την εκτιμώμενη παράμετρο, δηλ.

Εκτοπισμένοςονομάζεται στατιστική εκτίμηση, η μαθηματική προσδοκία της οποίας δεν είναι ίση με την εκτιμώμενη παράμετρο.

Ωστόσο, είναι λάθος να υποθέσουμε ότι μια αμερόληπτη εκτίμηση δίνει πάντα μια καλή προσέγγιση της εκτιμώμενης παραμέτρου. Πράγματι, οι πιθανές τιμές μπορούν να διασκορπιστούν έντονα γύρω από τη μέση τιμή τους, δηλαδή η διακύμανση της ποσότητας μπορεί να είναι σημαντική. Σε αυτήν την περίπτωση, η εκτίμηση που βρέθηκε από τα δεδομένα ενός δείγματος, για παράδειγμα, μπορεί να αποδειχθεί πολύ μακριά από τη μέση τιμή του, και επομένως από την ίδια την εκτιμώμενη παράμετρο. Λαμβάνοντας αυτό ως μια κατά προσέγγιση τιμή, θα κάναμε ένα μεγάλο λάθος. Εάν απαιτούμε η διακύμανση της ποσότητας να είναι μικρή, τότε αποκλείεται η πιθανότητα να κάνουμε μεγάλο σφάλμα. Ως εκ τούτου, επιβάλλονται απαιτήσεις αποδοτικότητας στη στατιστική αξιολόγηση.

Αποτελεσματικόςείναι μια στατιστική εκτίμηση που (για ένα δεδομένο μέγεθος δείγματος) έχει τη μικρότερη δυνατή διακύμανση. Κατά την εξέταση δειγμάτων μεγάλου μεγέθους, η απαίτηση συνέπειας επιβάλλεται στις στατιστικές εκτιμήσεις.

Πλούσιοςονομάζεται στατιστική εκτίμηση, η οποία τείνει κατά πιθανότητα στην εκτιμώμενη παράμετρο. Για παράδειγμα, εάν η διακύμανση της αμερόληπτης εκτίμησης τείνει στο μηδέν στο, τότε μια τέτοια εκτίμηση αποδεικνύεται συνεπής.

Εξετάστε το ερώτημα ποια χαρακτηριστικά δείγματος είναι τα καλύτερα όσον αφορά την αμεροληψία, την αποτελεσματικότητα και τη συνέπεια στην εκτίμηση του γενικού μέσου όρου και της διακύμανσης.

Ας μελετηθεί ο διακριτός γενικός πληθυσμός σε σχέση με ένα ποσοτικό χαρακτηριστικό. Γενική δευτεροβάθμιαονομάζεται αριθμητικός μέσος όρος των τιμών του χαρακτηριστικού του γενικού πληθυσμού. Μπορεί να υπολογιστεί χρησιμοποιώντας τους τύπους ή , όπου είναι οι τιμές του χαρακτηριστικού του γενικού πληθυσμού του όγκου, είναι οι αντίστοιχες συχνότητες και.

Αφήστε από τον γενικό πληθυσμό, ως αποτέλεσμα ανεξάρτητων παρατηρήσεων ενός ποσοτικού χαρακτηριστικού, ένα δείγμα όγκου με τις τιμές του χαρακτηριστικού εξάγεται . Επιλεκτικός μέσος όροςονομάζεται αριθμητικός μέσος όρος του δείγματος. Μπορεί να υπολογιστεί χρησιμοποιώντας τους τύπους ή , όπου είναι οι τιμές του χαρακτηριστικού στο δείγμα πληθυσμού του όγκου, είναι οι αντίστοιχες συχνότητες, και.

Εάν ο γενικός μέσος όρος είναι άγνωστος και απαιτείται η εκτίμησή του σύμφωνα με τα δεδομένα του δείγματος, τότε ο μέσος όρος δείγματος λαμβάνεται ως εκτίμηση του γενικού μέσου όρου, ο οποίος είναι μια αμερόληπτη και συνεπής εκτίμηση. Από αυτό προκύπτει ότι εάν βρεθούν μέσα δείγματος για αρκετά δείγματα αρκετά μεγάλου μεγέθους από τον ίδιο γενικό πληθυσμό, τότε θα είναι περίπου ίσα μεταξύ τους. Αυτή είναι η ιδιοκτησία βιωσιμότητα των δειγμάτων.

Σημειώστε ότι εάν οι διακυμάνσεις των δύο πληθυσμών είναι ίδιες, τότε η εγγύτητα των μέσων του δείγματος προς τον γενικό πληθυσμό δεν εξαρτάται από την αναλογία του μεγέθους του δείγματος προς το συνολικό μέγεθος του πληθυσμού. Εξαρτάται από το μέγεθος του δείγματος: όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο μικρότερη είναι η μέση τιμή του δείγματος από τη γενική.

Για να χαρακτηριστεί η διασπορά των τιμών του ποσοτικού χαρακτηριστικού του γενικού πληθυσμού γύρω από τη μέση τιμή του, εισάγεται ένα συνοπτικό χαρακτηριστικό - η γενική διακύμανση. Γενική διακύμανσηονομάζεται αριθμητικός μέσος όρος των τετραγώνων των αποκλίσεων των τιμών του χαρακτηριστικού του γενικού πληθυσμού από τη μέση τιμή τους, η οποία υπολογίζεται από τους τύπους: , ή .

Για να χαρακτηριστεί η διασπορά των παρατηρούμενων τιμών της ποσοτικής ιδιότητας του δείγματος γύρω από τη μέση τιμή του, εισάγεται ένα συνοπτικό χαρακτηριστικό - επιλεκτική διακύμανση. Επιλεκτική διακύμανσηονομάζεται αριθμητικός μέσος όρος των τετραγώνων των αποκλίσεων των παρατηρούμενων τιμών του χαρακτηριστικού από τη μέση τιμή τους, η οποία υπολογίζεται από τους τύπους: , ή .

Εκτός από τη διακύμανση, για να χαρακτηριστεί η διασπορά των τιμών του χαρακτηριστικού του γενικού (δείγματος) πληθυσμού γύρω από τη μέση τιμή του, χρησιμοποιείται ένα συνοπτικό χαρακτηριστικό - η τυπική απόκλιση. Γενική τυπική απόκλισηονομάζεται τετραγωνική ρίζα της γενικής διακύμανσης :. Επιλεγμένη τυπική απόκλισηονομάζεται τετραγωνική ρίζα της διακύμανσης του δείγματος:

Αφήστε ένα δείγμα όγκου να εξαχθεί από τον γενικό πληθυσμό ως αποτέλεσμα ανεξάρτητων παρατηρήσεων ενός ποσοτικού χαρακτηριστικού. Απαιτείται η εκτίμηση της άγνωστης γενικής διακύμανσης με βάση τα δείγματα δεδομένων. Εάν λάβουμε τη διακύμανση του δείγματος ως εκτίμηση της γενικής διακύμανσης, τότε αυτή η εκτίμηση θα οδηγήσει σε συστηματικά σφάλματα, δίνοντας μια υποτιμημένη τιμή της γενικής διακύμανσης. Αυτό εξηγείται από το γεγονός ότι η διακύμανση του δείγματος είναι μια προκατειλημμένη εκτίμηση. Με άλλα λόγια, η μαθηματική προσδοκία της διακύμανσης του δείγματος δεν είναι ίση με την εκτιμώμενη γενική διακύμανση, αλλά είναι ίση με .

Είναι εύκολο να διορθωθεί η διακύμανση του δείγματος έτσι ώστε η μαθηματική προσδοκία του να είναι ίση με τη γενική διακύμανση. Αρκεί αυτό να πολλαπλασιαστεί με κλάσμα. Ως αποτέλεσμα, λαμβάνουμε τη διορθωμένη διακύμανση, η οποία συνήθως συμβολίζεται με. Η διορθωμένη διακύμανση θα είναι η αμερόληπτη εκτίμηση της γενικής διακύμανσης: .

2. Ενδιάμεσες εκτιμήσεις.

Μαζί με την εκτίμηση σημείων, η στατιστική θεωρία της εκτίμησης παραμέτρων ασχολείται με τα ζητήματα της εκτίμησης διαστήματος. Το πρόβλημα της εκτίμησης διαστήματος μπορεί να διατυπωθεί ως εξής: σύμφωνα με τα δεδομένα του δείγματος, κατασκευάστε ένα αριθμητικό διάστημα σε σχέση με το οποίο, με προεπιλεγμένη πιθανότητα, μπορούμε να πούμε ότι η παράμετρος που εκτιμάται είναι μέσα σε αυτό το διάστημα. Η εκτίμηση διαστήματος είναι ιδιαίτερα απαραίτητη για ένα μικρό αριθμό παρατηρήσεων, όταν η εκτίμηση σημείου είναι σε μεγάλο βαθμό τυχαία, επομένως, δεν είναι πολύ αξιόπιστη.

Διάστημα εμπιστοσύνηςγια μια παράμετρο ονομάζεται ένα διάστημα σε σχέση με το οποίο είναι δυνατόν, με μια προεπιλεγμένη πιθανότητα κοντά στο ένα, να ισχυριστεί ότι περιέχει μια άγνωστη τιμή της παραμέτρου, δηλ. ... Όσο μικρότερος είναι ο αριθμός για την επιλεγμένη πιθανότητα, τόσο πιο ακριβής είναι η εκτίμηση της άγνωστης παραμέτρου. Αντιστρόφως, εάν αυτός ο αριθμός είναι μεγάλος, τότε η εκτίμηση που γίνεται χρησιμοποιώντας αυτό το διάστημα δεν έχει μεγάλη χρησιμότητα για εξάσκηση. Δεδομένου ότι τα άκρα του διαστήματος εμπιστοσύνης εξαρτώνται από τα στοιχεία του δείγματος, οι τιμές και μπορούν να αλλάξουν από δείγμα σε δείγμα. Η πιθανότητα συνήθως ονομάζεται επίπεδο εμπιστοσύνης (αξιοπιστία). Συνήθως, η αξιοπιστία της εκτίμησης ορίζεται εκ των προτέρων και ένας αριθμός κοντά στο ένα λαμβάνεται ως τιμή. Η επιλογή του επιπέδου εμπιστοσύνης δεν είναι μαθηματικό πρόβλημα, αλλά καθορίζεται από το συγκεκριμένο πρόβλημα που λύνεται. Τις περισσότερες φορές, η αξιοπιστία ορίζεται ίση με? ? ...

Ας παρουσιάσουμε, χωρίς παράγωγο, το διάστημα εμπιστοσύνης για τον γενικό μέσο όρο με γνωστή τιμή της τυπικής απόκλισης, υπό την προϋπόθεση ότι η τυχαία μεταβλητή (ποσοτικό χαρακτηριστικό) κατανέμεται κανονικά:

όπου είναι ένας προκαθορισμένος αριθμός κοντά στο ένα και οι τιμές της συνάρτησης δίνονται στο προσάρτημα 2.

Το νόημα αυτής της σχέσης είναι το εξής: με αξιοπιστία, μπορεί να υποστηριχθεί ότι το διάστημα εμπιστοσύνης ( ) καλύπτει την άγνωστη παράμετρο, η ακρίβεια της εκτίμησης είναι. Ο αριθμός καθορίζεται από την ισότητα, ή. Σύμφωνα με τον πίνακα (παράρτημα 2), βρίσκεται ένα όρισμα, το οποίο αντιστοιχεί στην τιμή της συνάρτησης Laplace, ίση με.

Παράδειγμα 1... Η τυχαία μεταβλητή έχει κανονική κατανομή με γνωστή τυπική απόκλιση. Βρείτε διαστήματα εμπιστοσύνης για την εκτίμηση του άγνωστου γενικού μέσου όρου από τα μέσα δείγματος, εάν καθοριστεί το μέγεθος του δείγματος και η αξιοπιστία της εκτίμησης.

Λύση. Θα το βρούμε. Από τη σχέση το αποκτούμε. Σύμφωνα με τον πίνακα (Παράρτημα 2) βρίσκουμε. Βρείτε την ακρίβεια της εκτίμησης ... Τα διαστήματα εμπιστοσύνης θα είναι τα εξής: ... Για παράδειγμα, εάν, τότε το διάστημα εμπιστοσύνης έχει τα ακόλουθα όρια εμπιστοσύνης:? ... Έτσι, οι τιμές της άγνωστης παραμέτρου, συνεπείς με τα δείγματα δεδομένων, ικανοποιούν την ανισότητα .

Το διάστημα εμπιστοσύνης για το γενικό μέσο όρο της κανονικής κατανομής του γνωρίσματος με άγνωστη τιμή της τυπικής απόκλισης δίνεται από την έκφραση .

Ως εκ τούτου, προκύπτει ότι με την αξιοπιστία μπορεί να υποστηριχθεί ότι το διάστημα εμπιστοσύνης καλύπτει μια άγνωστη παράμετρο.

Υπάρχουν έτοιμοι πίνακες (Παράρτημα 4), χρησιμοποιώντας τους οποίους, σύμφωνα με το δεδομένο και βρείτε την πιθανότητα, και αντίστροφα, σύμφωνα με το δεδομένο και μπορούν να βρεθούν.

Παράδειγμα 2... Τα ποσοτικά χαρακτηριστικά του γενικού πληθυσμού κατανέμονται κανονικά. Η μέση τιμή του δείγματος και η διορθωμένη τυπική απόκλιση βρέθηκαν για τον όγκο του δείγματος. Εκτιμήστε το άγνωστο γενικό μέσο χρησιμοποιώντας ένα διάστημα εμπιστοσύνης με αξιοπιστία.

Λύση. Θα το βρούμε. Χρησιμοποιώντας τον πίνακα (Παράρτημα 4) και βρείτε :. Ας βρούμε τα όρια εμπιστοσύνης:

Έτσι, με αξιοπιστία, η άγνωστη παράμετρος περικλείεται στο διάστημα εμπιστοσύνης.

3. Η έννοια μιας στατιστικής υπόθεσης. Γενική δήλωση του προβλήματος δοκιμής υποθέσεων.

Ο έλεγχος στατιστικών υποθέσεων σχετίζεται στενά με τη θεωρία εκτίμησης παραμέτρων. Στη φυσική επιστήμη, την τεχνολογία, την οικονομία, συχνά, για να διευκρινίσουν ένα συγκεκριμένο τυχαίο γεγονός, καταφεύγουν στη διατύπωση υποθέσεων που μπορούν να επαληθευτούν στατιστικά, δηλαδή με βάση τα αποτελέσματα των παρατηρήσεων σε ένα τυχαίο δείγμα. Υπό στατιστικές υποθέσειςυπονοούνται τέτοιες υποθέσεις που σχετίζονται είτε με τον τύπο είτε με μεμονωμένες παραμέτρους της κατανομής μιας τυχαίας μεταβλητής. Έτσι, για παράδειγμα, η στατιστική υπόθεση είναι ότι η κατανομή της παραγωγικότητας της εργασίας των εργαζομένων που εκτελούν την ίδια εργασία υπό τις ίδιες συνθήκες έχει έναν κανονικό νόμο κατανομής. Η υπόθεση ότι τα μέσα μεγέθη των εξαρτημάτων που παράγονται στον ίδιο τύπο παράλληλων μηχανών εργασίας δεν διαφέρουν μεταξύ τους θα είναι επίσης στατιστική.

Η στατιστική υπόθεση ονομάζεται απλός, εάν καθορίζει μοναδικά την κατανομή της τυχαίας μεταβλητής, διαφορετικά η υπόθεση καλείται περίπλοκος.Για παράδειγμα, μια απλή υπόθεση είναι η υπόθεση ότι μια τυχαία μεταβλητή κανονικά κατανέμεται με προσδοκία μηδέν και διακύμανση ίση με ένα. Εάν γίνει υπόθεση ότι μια τυχαία μεταβλητή έχει κανονική κατανομή με διακύμανση ίση με μία και η μαθηματική προσδοκία είναι ένας αριθμός από ένα τμήμα, τότε αυτή είναι μια δύσκολη υπόθεση. Ένα άλλο παράδειγμα σύνθετης υπόθεσης είναι η υπόθεση ότι μια συνεχής τυχαία μεταβλητή με πιθανότητα παίρνει μια τιμή από ένα διάστημα, οπότε η κατανομή της τυχαίας μεταβλητής μπορεί να είναι οποιαδήποτε από τις κατηγορίες συνεχών κατανομών.

Η κατανομή της ποσότητας είναι συχνά γνωστή και είναι απαραίτητο να ελέγξουμε τις υποθέσεις σχετικά με τις τιμές των παραμέτρων αυτής της κατανομής από το δείγμα των παρατηρήσεων. Τέτοιες υποθέσεις ονομάζονται παραμετρική.

Η υπόθεση που πρέπει να ελεγχθεί ονομάζεται μηδενική υπόθεσηκαι υποδεικνύεται από Μαζί με την υπόθεση, εξετάζεται μία από τις εναλλακτικές (ανταγωνιστικές) υποθέσεις. Για παράδειγμα, εάν ελεγχθεί η υπόθεση ότι η παράμετρος είναι ίση με κάποια δεδομένη τιμή, δηλαδή :, τότε μία από τις ακόλουθες υποθέσεις μπορεί να θεωρηθεί ως εναλλακτική υπόθεση ::? : : :, πού είναι μια δεδομένη τιμή ,. Η επιλογή μιας εναλλακτικής υπόθεσης καθορίζεται από τη συγκεκριμένη διατύπωση του προβλήματος.

Ο κανόνας με τον οποίο λαμβάνεται η απόφαση για αποδοχή ή απόρριψη μιας υπόθεσης ονομάζεται κριτήριο... Δεδομένου ότι η απόφαση λαμβάνεται με βάση ένα δείγμα παρατηρήσεων μιας τυχαίας μεταβλητής, είναι απαραίτητο να επιλέξετε ένα κατάλληλο στατιστικό, στην περίπτωση αυτή που ονομάζεται στατιστικό κριτήριο. Κατά τον έλεγχο μιας απλής παραμετρικής υπόθεσης: ως στατιστικό κριτήριο, επιλέγεται το ίδιο στατιστικό στοιχείο για την εκτίμηση παραμέτρων.

Ο έλεγχος της στατιστικής υπόθεσης βασίζεται στην αρχή ότι τα απίθανα γεγονότα θεωρούνται αδύνατα και τα γεγονότα που είναι πολύ πιθανά θεωρούνται αξιόπιστα. Αυτή η αρχή μπορεί να εφαρμοστεί ως εξής. Πριν από την ανάλυση του δείγματος, καθορίζεται μια ορισμένη χαμηλή πιθανότητα, που ονομάζεται επίπεδο σημασίας... Ας είναι το σύνολο των τιμών των στατιστικών και να είναι ένα τέτοιο υποσύνολο που, υπό την προϋπόθεση ότι η υπόθεση είναι αληθινή, η πιθανότητα στατιστικών του κριτηρίου να είναι ίση με, δηλ. .

Ας υποδείξουμε με την τιμή δείγματος τις στατιστικές που υπολογίζονται από το δείγμα των παρατηρήσεων. Το κριτήριο διατυπώνεται ως εξής: απορρίψτε την υπόθεση εάν? αποδεχτείτε την υπόθεση εάν. Το κριτήριο που βασίζεται στη χρήση ενός προκαθορισμένου επιπέδου σημασίας ονομάζεται κριτήριο σημασίας... Το σύνολο όλων των τιμών των στατιστικών κριτηρίων για τα οποία λαμβάνεται απόφαση απόρριψης της υπόθεσης ονομάζεται κρίσιμη περιοχή? η περιοχή λέγεται περιοχή αποδοχήςυποθέσεις.

Το επίπεδο σημασίας καθορίζει το μέγεθος της κρίσιμης περιοχής. Η θέση της κρίσιμης περιοχής στο σύνολο των στατιστικών τιμών εξαρτάται από τη διατύπωση της εναλλακτικής υπόθεσης. Για παράδειγμα, εάν η υπόθεση ελέγχεται :, και η εναλλακτική υπόθεση διατυπώνεται ως: (), τότε η κρίσιμη περιοχή βρίσκεται στη δεξιά (αριστερή) «ουρά» της κατανομής των στατιστικών, δηλαδή έχει τη μορφή ανισότητα: (), όπου και είναι εκείνες οι τιμές στατιστικών που γίνονται αποδεκτές με πιθανότητες, αντίστοιχα, και με την προϋπόθεση ότι η υπόθεση είναι αληθής. Σε αυτή την περίπτωση, το κριτήριο ονομάζεται μονομερής, αντίστοιχα δεξιόχειρες και αριστερόχειρες. Εάν μια εναλλακτική υπόθεση διατυπωθεί ως :, τότε η κρίσιμη περιοχή βρίσκεται και στις δύο «ουρές» της κατανομής, δηλαδή, καθορίζεται από το σύνολο των ανισοτήτων και σε αυτή την περίπτωση, το κριτήριο ονομάζεται διμερής.

Στο σχ. 30 δείχνει τη θέση της κρίσιμης περιοχής για διάφορες εναλλακτικές υποθέσεις. Εδώ είναι η πυκνότητα της κατανομής των στατιστικών κριτηρίων, υπό την προϋπόθεση ότι η υπόθεση είναι αληθής, είναι ο τομέας αποδοχής της υπόθεσης, .

Έτσι, ο έλεγχος μιας παραμετρικής στατιστικής υπόθεσης χρησιμοποιώντας ένα τεστ σπουδαιότητας μπορεί να αναλυθεί στα ακόλουθα βήματα:

1) διατυπώστε δοκιμαστικές () και εναλλακτικές () υποθέσεις.

2) εκχωρήστε ένα επίπεδο σπουδαιότητας. ως ασυνεπές με τις παρατηρήσεις? εάν, τότε αποδεχτείτε την υπόθεση, δηλ. υποθέστε ότι η υπόθεση δεν έρχεται σε αντίθεση με τα αποτελέσματα των παρατηρήσεων.

Συνήθως, κατά την εκτέλεση των στοιχείων 4 - 7, χρησιμοποιούνται στατιστικά, τα ποσοτικά των οποίων παρουσιάζονται σε πίνακα: στατιστικά με κανονική κατανομή, στατιστικά μαθητή, στατιστικά στοιχεία Fisher.

Παράδειγμα 3... Σύμφωνα με τα στοιχεία διαβατηρίου ενός κινητήρα αυτοκινήτου, η κατανάλωση καυσίμου ανά 100 χλμτα χιλιόμετρα είναι 10 λίτρα... Ως αποτέλεσμα του επανασχεδιασμού του κινητήρα, η κατανάλωση καυσίμου αναμένεται να μειωθεί. Διεξάγονται δοκιμές για επαλήθευση 25 τυχαία επιλεγμένων αυτοκινήτων με εκσυγχρονισμένο κινητήρα, με μέσο δείγμα κατανάλωσης καυσίμου για 100 χλμχιλιόμετρα σύμφωνα με τα αποτελέσματα της δοκιμής ήταν 9,3 λτ... Ας υποθέσουμε ότι το δείγμα κατανάλωσης καυσίμου λαμβάνεται από έναν κανονικά κατανεμημένο πληθυσμό με μέσο όρο και διακύμανση. Υπό την προϋπόθεση ότι η υπόθεση της κρίσιμης περιοχής για τα αρχικά στατιστικά είναι αληθινή, δηλαδή ίση με το επίπεδο σημασίας. Βρείτε τις πιθανότητες λαθών πρώτου και δεύτερου είδους για ένα κριτήριο με τόσο κρίσιμο τομέα. έχει κανονική κατανομή με μαθηματικές προσδοκίες ίσες και διακυμάνσεις ίσες. Η πιθανότητα σφάλματος του δεύτερου είδους εντοπίζεται από τον τύπο (11.2):

Επομένως, σύμφωνα με το αποδεκτό κριτήριο, το 13,6% των αυτοκινήτων με κατανάλωση καυσίμου 9 λτεπί 100 χλμΤα χιλιόμετρα ταξινομούνται ως οχήματα με κατανάλωση καυσίμου 10 λίτρα.

4. Θεωρητικές και εμπειρικές συχνότητες. Κριτήρια συναίνεσης.

Εμπειρικές συχνότητες- συχνότητες που λαμβάνονται ως αποτέλεσμα εμπειρίας (παρατήρηση). Θεωρητικές συχνότητεςυπολογίζονται χρησιμοποιώντας τους τύπους. Για έναν κανονικό νόμο διανομής, μπορούν να βρεθούν ως εξής:

, (11.3)

Σχέδιο διάλεξης:

    Έννοια αξιολόγησης

    Ιδιότητες Στατιστικών Εκτιμήσεων

    Μέθοδοι εύρεσης εκτιμήσεων σημείων

    Εκτίμηση παραμέτρων διαστήματος

    Διαστήματα εμπιστοσύνης για τη μαθηματική προσδοκία με γνωστή διακύμανση ενός κανονικά κατανεμημένου γενικού πληθυσμού.

    Κατανομή Chi-square και κατανομή t του Student.

    Διάστημα εμπιστοσύνης για τη μαθηματική προσδοκία τυχαίων μεταβλητών που έχουν κανονική κατανομή με άγνωστη διακύμανση.

    Διαστήματα εμπιστοσύνης για την τυπική απόκλιση της κανονικής κατανομής.

Βιβλιογραφία:

    Wentzel, E.S. Θεωρία πιθανοτήτων [Κείμενο] / E.S. Wentzel. - Μ.: Ανώτατο σχολείο, 2006.- 575 σελ.

    Gmurman, V.E. Θεωρία πιθανοτήτων και μαθηματικές στατιστικές [Κείμενο] / V.E. Gmurman. - Μ.: Ανώτατο σχολείο, 2007.- 480 σελ.

    Kremer, N.Sh. Θεωρία πιθανοτήτων και μαθηματικές στατιστικές [Κείμενο] / N.Sh. Kremer- M: UNITI, 2002 .-- 543 σελ.

Α'1. Έννοια αξιολόγησης

Οι κατανομές όπως οι διωνυμικές, εκθετικές, κανονικές, είναι οικογένειες κατανομών που εξαρτώνται από μία ή περισσότερες παραμέτρους. Για παράδειγμα, μια εκθετική κατανομή με πυκνότητα πιθανότητας εξαρτάται από μία παράμετρο λ, την κανονική κατανομή
- από δύο παραμέτρους Μκαι σ. Κατά κανόνα, είναι σαφές από τις συνθήκες του υπό μελέτη προβλήματος για ποια οικογένεια διανομών μιλάμε. Ωστόσο, οι συγκεκριμένες τιμές των παραμέτρων αυτής της κατανομής, οι οποίες περιλαμβάνονται στις εκφράσεις των χαρακτηριστικών διανομής που μας ενδιαφέρουν, παραμένουν άγνωστες. Επομένως, είναι απαραίτητο να γνωρίζουμε τουλάχιστον την κατά προσέγγιση αξία αυτών των ποσοτήτων.

Ας καθοριστεί ο νόμος κατανομής του γενικού πληθυσμού μέχρι τις τιμές των παραμέτρων που περιλαμβάνονται στην κατανομή του
, μερικά από τα οποία μπορεί να είναι γνωστά. Ένα από τα προβλήματα των μαθηματικών στατιστικών είναι να βρεθούν εκτιμήσεις άγνωστων παραμέτρων από ένα δείγμα παρατηρήσεων
από τον γενικό πληθυσμό. Η εκτίμηση άγνωστων παραμέτρων συνίσταται στην κατασκευή μιας συνάρτησης
από ένα τυχαίο δείγμα, έτσι ώστε η τιμή αυτής της συνάρτησης να είναι περίπου ίση με την εκτιμώμενη άγνωστη παράμετρο θ ... Λειτουργία που ονομάζεται στατιστικήπαράμετρος θ .

Το στατιστικό εκτίμηση(στο εξής απλά εκτίμηση) παράμετρος θ η θεωρητική κατανομή ονομάζεται κατά προσέγγιση τιμή της, ανάλογα με τα δεδομένα επιλογής.

Βαθμός είναι μια τυχαία μεταβλητή, επειδή είναι συνάρτηση ανεξάρτητων τυχαίων μεταβλητών
? αν κάνετε διαφορετικό δείγμα, τότε η συνάρτηση, σε γενικές γραμμές, θα λάβει διαφορετική τιμή.

Υπάρχουν δύο τύποι εκτιμήσεων - σημείο και διάστημα.

Σημείοονομάζεται βαθμολογία που καθορίζεται από έναν αριθμό. Με έναν μικρό αριθμό παρατηρήσεων, αυτές οι εκτιμήσεις μπορούν να οδηγήσουν σε μεγάλα λάθη. Για την αποφυγή τους, χρησιμοποιούνται εκτιμήσεις διαστήματος.

Διάστημακαλείται μια εκτίμηση, η οποία καθορίζεται από δύο αριθμούς - τα άκρα του διαστήματος στο οποίο η εκτιμώμενη τιμή περικλείεται με μια δεδομένη πιθανότητα θ .

Σ. 2 Ιδιότητες στατιστικών εκτιμήσεων

Η αξία
λέγονται ακρίβεια της αξιολόγησης... Το λιγότερο
, όσο καλύτερα, τόσο ακριβέστερα καθορίζεται η άγνωστη παράμετρος.

Για την εκτίμηση οποιασδήποτε παραμέτρου επιβάλλονται ορισμένες απαιτήσεις, τις οποίες πρέπει να πληροί για να είναι «κοντά» στην πραγματική τιμή της παραμέτρου, δηλ. να είναι, κατά μία έννοια, μια «καλοήθης» εκτίμηση. Η ποιότητα της αξιολόγησης καθορίζεται ελέγχοντας εάν έχει τις ιδιότητες της αμεροληψίας, της αποτελεσματικότητας και της συνέπειας.

Βαθμός παράμετρος θ που ονομάζεται αμερόληπτος(χωρίς συστηματικά σφάλματα) εάν η μαθηματική προσδοκία της εκτίμησης συμπίπτει με την πραγματική τιμή θ :

. (1)

Εάν η ισότητα (1) δεν ισχύει, τότε η εκτίμηση που ονομάζεται εκτοπισμένος(με συστηματικά λάθη). Αυτή η προκατάληψη μπορεί να οφείλεται σε σφάλματα μέτρησης, σφάλματα καταμέτρησης ή μη τυχαία δειγματοληψία. Τα συστηματικά λάθη οδηγούν σε υπερεκτίμηση ή υποτίμηση.

Για ορισμένα προβλήματα στα μαθηματικά στατιστικά, μπορεί να υπάρχουν αρκετές αμερόληπτες εκτιμήσεις. Συνήθως, προτιμάται αυτό με τη μικρότερη διασπορά (διασπορά).

Βαθμός που ονομάζεται αποτελεσματικόςεάν έχει τη μικρότερη διακύμανση μεταξύ όλων των πιθανών αμερόληπτων εκτιμήσεων της παραμέτρου θ .

Ας είναι ρε() Είναι η ελάχιστη διακύμανση, και
- διακύμανση οποιασδήποτε άλλης αμερόληπτης εκτίμησης παράμετρος θ ... Στη συνέχεια, η αποτελεσματικότητα της εκτίμησης είναι ίσο με

. (2)

Είναι σαφές ότι
... Όσο πιο κοντά
έως 1, όσο πιο αποτελεσματική είναι η εκτίμηση ... Αν
στο
, τότε καλείται η εκτίμηση ασυμπτωτικά αποτελεσματική.

Σχόλιο: Αν το σκορ μετατοπισμένο, τότε η μικρότητα της διακύμανσής του δεν σημαίνει τη μικρότητα του σφάλματος του. Λαμβάνοντας, για παράδειγμα, ως εκτίμηση της παραμέτρου θ κάποιο νούμερο , λαμβάνουμε μια εκτίμηση ακόμη και με μηδενική διακύμανση. Ωστόσο, σε αυτή την περίπτωση, το σφάλμα (σφάλμα)
μπορεί να είναι τόσο μεγάλο όσο θέλετε.

Βαθμός που ονομάζεται πλούσιοςεάν με αύξηση του μεγέθους του δείγματος (
) η εκτίμηση συγκλίνει κατά πάσα πιθανότητα στην ακριβή τιμή της παραμέτρου θ , δηλ. αν για κανενα

. (3)

Συνέπεια της αξιολόγησης παράμετρος θ σημαίνει ότι με την ανάπτυξη νποιότητα εκτίμησης μεγέθους δείγματος βελτιωνεται.

Θεώρημα 1. Το μέσο δείγμα είναι μια αμερόληπτη και συνεπής εκτίμηση της μαθηματικής προσδοκίας.

Θεώρημα 2. Η διορθωμένη διακύμανση δείγματος είναι μια αμερόληπτη και συνεπής εκτίμηση της διακύμανσης.

Θεώρημα 3. Η εμπειρική συνάρτηση κατανομής του δείγματος είναι μια αμερόληπτη και συνεπής εκτίμηση της συνάρτησης κατανομής μιας τυχαίας μεταβλητής.

Ας απαιτηθεί η μελέτη, για παράδειγμα, ενός ποσοτικού χαρακτηριστικού του γενικού πληθυσμού. Ας υποθέσουμε ότι από θεωρητικές εκτιμήσεις ήταν δυνατό να καθοριστεί τι είδους διανομή έχει ένα χαρακτηριστικό. Φυσικά, το πρόβλημα προκύπτει από την εκτίμηση των παραμέτρων που καθορίζουν αυτήν την κατανομή. Για παράδειγμα, εάν είναι γνωστό εκ των προτέρων ότι το χαρακτηριστικό που μελετάται κανονικά κατανέμεται στον γενικό πληθυσμό, τότε είναι απαραίτητο να εκτιμηθεί (να βρεθεί περίπου) η μαθηματική προσδοκία α και η τυπική απόκλιση s, αφού αυτές οι δύο παράμετροι καθορίζουν πλήρως την κανονική κατανομή Το

Συνήθως, ο ερευνητής έχει μόνο τα δείγματα δεδομένων, για παράδειγμα, τις τιμές του ποσοτικού χαρακτηριστικού x 1, x 2, ..., x n, που λαμβάνονται ως αποτέλεσμα n παρατηρήσεων. Μέσω αυτών των δεδομένων εκφράζεται η εκτιμώμενη παράμετρος.

Έστω q * μια στατιστική εκτίμηση της άγνωστης παραμέτρου q της θεωρητικής κατανομής. Διακρίνω αμερόληπτοςκαι εκτοπισμένοςυπολογίζει.

Αμερόληπτοςονομάζεται στατιστική εκτίμηση q *, η μαθηματική προσδοκία της οποίας είναι ίση με την εκτιμώμενη παράμετρο q για οποιοδήποτε μέγεθος δείγματος, δηλαδή

Διαφορετικά, δηλαδή, αν Μ (q *) q, η εκτίμηση καλείται εκτοπισμένος.

Η απαίτηση της αμεροληψίας σημαίνει ότι δεν πρέπει να υπάρχει συστηματική απόκλιση προς την ίδια κατεύθυνση των παρατηρούμενων τιμών από το q.

Υπάρχει επίσης απαίτηση για στατιστική αξιολόγηση αποδοτικότητα, η οποία συνεπάγεται (για ένα δεδομένο μέγεθος δείγματος) τη μικρότερη δυνατή διακύμανση, και στην περίπτωση μεγάλου μεγέθους δείγματος, η απαίτηση συνοχή, δηλαδή, η πρακτική σύμπτωση των παρατηρούμενων τιμών της τυχαίας μεταβλητής με την εκτιμώμενη παράμετρο.

Εάν το στατιστικό υλικό παρουσιάζεται με τη μορφή μεταβλητής σειράς, τότε η μετέπειτα ανάλυσή του πραγματοποιείται, κατά κανόνα, με τη βοήθεια ορισμένων σταθερών τιμών που αντανακλούν επαρκώς πλήρως τους νόμους που είναι εγγενείς στον γενικό πληθυσμό υπό μελέτη.

Αυτές οι σταθερές περιλαμβάνουν μέσες τιμές, μεταξύ των οποίων η πιο σημαντική είναι αριθμητικός μέσος όρος- είναι απλούστερο από άλλα τόσο ως προς την έννοια, όσο και ως προς τις ιδιότητες και ως προς τη μέθοδο λήψης.

Δεδομένου ότι στη μελέτη του γενικού πληθυσμού πραγματοποιείται ένα δείγμα, ονομάζεται η σταθερή τιμή που χαρακτηρίζει το δείγμα δείγμα μέσοκαι υποδεικνύεται από

Μπορεί να αποδειχθεί ότι υπάρχει αμερόληπτη εκτίμησηο αριθμητικός μέσος όρος του χαρακτηριστικού του γενικού πληθυσμού, δηλαδή

Αφήστε ένα σετ να χωριστεί σε μέρη - ομάδα, όχι απαραίτητα το ίδιο σε όγκο. Τότε καλούνται οι αριθμητικές μέσες κατανομές των μελών της ομάδας μέσους όρους ομάδας, και ο αριθμητικός μέσος όρος της κατανομής για το ίδιο χαρακτηριστικό όλου του πληθυσμού είναι γενικός μέσος όρος... Ομάδες ονομάζονται κομματιάζωαν κάθε μέλος του πληθυσμού ανήκει σε μία μόνο ομάδα.

Ο συνολικός μέσος όρος είναι ίσος με τον αριθμητικό μέσο όρο της ομάδας όλων των μη αλληλεπικαλυπτόμενων ομάδων.

Παράδειγμα.Υπολογίστε τον μέσο μισθό των εργαζομένων της επιχείρησης σύμφωνα με τον πίνακα

Λύση.Εξ ορισμού, ο συνολικός μέσος όρος είναι

. (*)

n 1 = 40, n 2 = 50, n 3 = 60

Μέσος μισθός εργαζομένων στο εργαστήριο Νο. 1. Για να το βρούμε, κάναμε τον αριθμητικό μέσο μισθό για ολόκληρο το εργαστήριο: 75, 85, 95 και 105 (cu) Για ευκολία, αυτές οι τιμές μπορούν να μειωθούν κατά πέντε (αυτός είναι ο μεγαλύτερος κοινός διαιρέτης τους): 15, 17, 19, 21. Τα υπόλοιπα είναι ξεκάθαρα από τον τύπο.

Έχοντας πραγματοποιήσει παρόμοιες λειτουργίες, βρίσκουμε ,.

Αντικαθιστώντας τις ληφθείσες τιμές στο (*), παίρνουμε

Οι μέσοι όροι είναι σταθερές τιμές που χαρακτηρίζουν τις κατανομές με έναν συγκεκριμένο τρόπο.Ορισμένες διανομές κρίνονται μόνο με μέσα. Για παράδειγμα, για να συγκρίνουμε τα επίπεδα των μισθών σε διαφορετικούς κλάδους, αρκεί να συγκρίνουμε τους μέσους μισθούς σε αυτούς. Ωστόσο, οι μέσοι όροι δεν μπορούν να χρησιμοποιηθούν για να κριθούν οι διαφορές μεταξύ των επιπέδων μισθών των εργαζομένων με τις υψηλότερες και χαμηλότερες αμοιβές ή των αποκλίσεων από τον μέσο μισθό.

Στα στατιστικά στοιχεία, το πιο ενδιαφέρον είναι η εξάπλωση των τιμών χαρακτηριστικών γύρω από την αριθμητική τους μέση τιμή.Στην πράξη και στις θεωρητικές μελέτες, η διασπορά ενός χαρακτηριστικού χαρακτηρίζεται συχνότερα από διακύμανση και τυπική απόκλιση.

Επιλεκτική διακύμανση D In ονομάζεται αριθμητικός μέσος όρος των τετραγώνων της απόκλισης των παρατηρούμενων τιμών του χαρακτηριστικού από το μέσο τους.

Εάν όλες οι τιμές x 1, x 2, ... x n του μεγέθους δείγματος n είναι διαφορετικές, τότε

. (3)

Εάν οι τιμές του χαρακτηριστικού x 1, x 2, ... x k έχουν συχνότητες n 1, n 2, ... n k, αντίστοιχα, και n 1 + n 2 + ... + n k = n, τότε

. (4)

Εάν υπάρχει ανάγκη ο δείκτης διασποράς να εκφράζεται στις ίδιες μονάδες με τις τιμές χαρακτηριστικών, τότε μπορείτε να χρησιμοποιήσετε το συνοπτικό χαρακτηριστικό - τυπική απόκλιση

Για τον υπολογισμό της διακύμανσης, χρησιμοποιείται συνήθως ο τύπος

Εάν ο πληθυσμός διαιρείται σε μη αλληλεπικαλυπτόμενες ομάδες, τότε μπορούν να εισαχθούν οι έννοιες της ομάδας, της ενδοομάδας, της ενδοομάδας και της γενικής διακύμανσης για τον χαρακτηρισμό τους.

Ομάδαδιακύμανση είναι η διακύμανση της κατανομής των μελών της j -ου ομάδας σε σχέση με το μέσο όρο τους - ο μέσος όρος της ομάδας, δηλαδή

όπου n i είναι η συχνότητα της τιμής x i, είναι ο όγκος της ομάδας j.

Ενδοομάδαη διακύμανση είναι ο αριθμητικός μέσος όρος των αποκλίσεων ομάδων

όπου N j (j = 1, 2,…, m) είναι οι όγκοι των ασύνδετων ομάδων.

Διαομάδαδιακύμανση είναι ο αριθμητικός μέσος όρος των τετραγώνων των αποκλίσεων των μέσων ομάδας όλων των ασύνδετων ομάδων από το συνολικό μέσο όρο, δηλαδή

.

Το Γενικόδιακύμανση είναι η διακύμανση των τιμών του χαρακτηριστικού ολόκληρου του πληθυσμού σε σχέση με το συνολικό μέσο όρο

,

όπου n i είναι η συχνότητα της τιμής x i. - γενικός μέσος όρος; n είναι ο όγκος όλου του πληθυσμού.

Μπορεί να αποδειχθεί ότι η συνολική διακύμανση D είναι ίση με το άθροισμα, δηλ.

Παράδειγμα.Βρείτε τη συνολική διακύμανση ενός πληθυσμού που αποτελείται από τις ακόλουθες δύο ομάδες

Πρώτη ομάδα Δεύτερη ομάδα
x i n i x i n i

Λύση.Βρείτε τα μέσα της ομάδας

Βρείτε τις αποκλίσεις της ομάδας

Βρείτε το συνολικό μέσο όρο

Αναζητείται ολική διακύμανση

Οι εκτιμήσεις που εξετάστηκαν παραπάνω ονομάζονται συνήθως σημείο, αφού αυτές οι εκτιμήσεις είναι καθορισμένες ένας αριθμός... Πότε μικρός όγκοςτο δείγμα χρησιμοποιεί μια εκτίμηση διαστήματος που καθορίζεται από δύο αριθμούςονομάζονται τα άκρα του διαστήματος.

Οι εκτιμήσεις των διαστημάτων μας επιτρέπουν να καθορίσουμε ακρίβεια και αξιοπιστίαακροαματικότητα. Ας εξηγήσουμε το νόημα αυτών των εννοιών. Αφήστε το στατιστικό χαρακτηριστικό q * που βρέθηκε από τα δείγματα δεδομένων να χρησιμεύσει ως εκτίμηση για την άγνωστη παράμετρο q. Είναι σαφές ότι q * όσο ακριβέστερα θα καθοριστεί η παράμετρος q, τόσο μικρότερη είναι η απόλυτη τιμή. Με άλλα λόγια, αν d> 0 και, τότε όσο μικρότερο είναι το d, τόσο πιο ακριβής είναι η εκτίμηση.

Έτσι, ο αριθμός d> 0 χαρακτηρίζει ακρίβειαυπολογίζει. Αλλά από την άλλη πλευρά, οι στατιστικές μέθοδοι δεν επιτρέπουν τον κατηγορηματικό ισχυρισμό ότι η εκτίμηση q * ικανοποιεί την ανισότητα. Εδώ μπορείτε να μιλήσετε μόνο για πιθανότητες gμε το οποίο εκπληρώνεται αυτή η ανισότητα. Αυτή η πιθανότητα g ονομάζεται αξιοπιστία (επίπεδο εμπιστοσύνης)εκτιμήσεις του q με q *.

Επομένως, από όσα ειπώθηκαν προκύπτει ότι

Η σχέση ( *) πρέπει να γίνει κατανοητή ως εξής: η πιθανότητα το διάστημα (q * - d, q * + d) να περιέχει (καλύπτει) την άγνωστη παράμετρο q είναι ίση με g. Το διάστημα (q * - d, q * + d) που καλύπτει μια άγνωστη παράμετρο με δεδομένη αξιοπιστία g ονομάζεται διάστημα εμπιστοσύνης.

Παράδειγμα.Η τυχαία μεταβλητή Χ έχει κανονική κατανομή με γνωστή τυπική απόκλιση s = 3. Βρείτε τα διαστήματα εμπιστοσύνης για την εκτίμηση της άγνωστης μαθηματικής προσδοκίας a από το μέσο δείγμα εάν το μέγεθος του δείγματος είναι n = 36 και η αξιοπιστία της εκτίμησης ορίζεται σε g = 0,95.

Λύση.Σημειώστε ότι εάν η τυχαία μεταβλητή Χ είναι κανονικά κατανεμημένη, τότε η μέση τιμή δείγματος που βρέθηκε από ανεξάρτητες παρατηρήσεις κατανέμεται επίσης κανονικά και οι παράμετροι κατανομής έχουν ως εξής :, (δείτε σελίδα 54).

Απαιτούμε την εκπλήρωση της σχέσης

.

Χρησιμοποιώντας τον τύπο (**) (βλέπε σελίδα 43), αντικαθιστώντας το Χ κατά και s κατά, παίρνουμε

δείγμα κατανομής στατιστικής αξιολόγησης

Μια εκτίμηση είναι μια προσέγγιση των τιμών της επιθυμητής τιμής, που λαμβάνονται με βάση τα αποτελέσματα της παρατήρησης δείγματος. Οι εκτιμήσεις είναι τυχαίες μεταβλητές. Παρέχουν τη δυνατότητα τεκμηριωμένης κρίσης σχετικά με τις άγνωστες παραμέτρους του γενικού πληθυσμού. Ένα παράδειγμα εκτίμησης του γενικού μέσου όρου είναι το μέσο δείγμα της γενικής διακύμανσης - διακύμανση δείγματος κ.λπ.

Προκειμένου να εκτιμηθεί πόσο "καλά" η αξιολόγηση πληροί το αντίστοιχο γενικό χαρακτηριστικό, έχουν αναπτυχθεί 4 κριτήρια: συνέπεια, αμεροληψία, αποτελεσματικότητα και επάρκεια. Αυτή η προσέγγιση βασίζεται στο γεγονός ότι η ποιότητα μιας εκτίμησης δεν καθορίζεται από τις μεμονωμένες τιμές της, αλλά από τα χαρακτηριστικά της κατανομής της ως τυχαίας μεταβλητής.

Με βάση τις διατάξεις της θεωρίας της πιθανότητας, μπορεί να αποδειχθεί ότι από χαρακτηριστικά δείγματος όπως ο αριθμητικός μέσος όρος, ο τρόπος και ο διάμεσος, μόνο ο αριθμητικός μέσος αντιπροσωπεύει μια συνεπή, αμερόληπτη, αποτελεσματική και επαρκή εκτίμηση του γενικού μέσου όρου. Αυτό καθορίζει την προτίμηση που δίνεται στον αριθμητικό μέσο μεταξύ των άλλων χαρακτηριστικών του δείγματος.

Αμεροληψίαη εκτίμηση εκδηλώνεται στο γεγονός ότι η μαθηματική προσδοκία της για οποιοδήποτε μέγεθος δείγματος είναι ίση με την τιμή της εκτιμώμενης παραμέτρου στο γενικό πληθυσμό. Εάν αυτή η απαίτηση δεν πληρείται, τότε η βαθμολογία είναι εκτοπισμένος.

Η προϋπόθεση της αμερόληπτης εκτίμησης στοχεύει στην εξάλειψη συστηματικών σφαλμάτων εκτίμησης.

Κατά την επίλυση προβλημάτων εκτίμησης, χρησιμοποιούν επίσης ασυμπτωτικά αμερόληπτες εκτιμήσεις, για την οποία, με αύξηση του μεγέθους του δείγματος, η μαθηματική προσδοκία τείνει στην εκτιμώμενη παράμετρο του γενικού πληθυσμού.

Συνοχήοι στατιστικές εκτιμήσεις εκδηλώνονται στο γεγονός ότι με την αύξηση του μεγέθους του δείγματος, η εκτίμηση πλησιάζει ολοένα και περισσότερο την πραγματική τιμή της εκτιμώμενης παραμέτρου ή, όπως λένε, η εκτίμηση συγκλίνει κατά πάσα πιθανότητα στην επιθυμητή παράμετρο ή τείνει να η μαθηματική προσδοκία του. Μόνο συνεπείς αξιολογήσεις έχουν πρακτική αξία.

Αυτή είναι η εκτίμηση της αμερόληπτης παραμέτρου που έχει τη μικρότερη διακύμανση για ένα δεδομένο μέγεθος δείγματος. Στην πράξη, η διακύμανση εκτίμησης συνήθως εξομοιώνεται με σφάλμα εκτίμησης.

Οπως και μέτρα αποτελεσματικότητας αξιολόγησηςλάβετε τον λόγο της ελάχιστης δυνατής διακύμανσης προς τη διακύμανση μιας άλλης εκτίμησης.

Μια εκτίμηση που διασφαλίζει την πληρότητα της χρήσης όλων των πληροφοριών που περιέχονται στο δείγμα σχετικά με το άγνωστο χαρακτηριστικό του γενικού πληθυσμού ονομάζεται επαρκής(εξαντλητικός).

Η συμμόρφωση με τις ιδιότητες των στατιστικών εκτιμήσεων που εξετάστηκαν παραπάνω καθιστά δυνατή την εξέταση των χαρακτηριστικών του δείγματος για την αξιολόγηση των παραμέτρων του γενικού πληθυσμού ως την καλύτερη δυνατή.

Το πιο σημαντικό καθήκον των μαθηματικών στατιστικών είναι η απόκτηση των πιο ορθολογικών, «αληθινών» στατιστικών εκτιμήσεων των απαιτούμενων παραμέτρων του γενικού πληθυσμού με βάση δείγματα δεδομένων. Υπάρχουν δύο τύποι στατιστικών συμπερασμάτων: στατιστική αξιολόγηση. δοκιμή στατιστικών υποθέσεων.

Το κύριο καθήκον της λήψης στατιστικών εκτιμήσεων είναι η επιλογή και η τεκμηρίωση των καλύτερων εκτιμήσεων που παρέχουν μια ουσιαστική εκτίμηση των άγνωστων παραμέτρων του γενικού πληθυσμού.

Το πρόβλημα της εκτίμησης άγνωστων παραμέτρων μπορεί να λυθεί με δύο τρόπους:

  • 1. μια άγνωστη παράμετρος χαρακτηρίζεται από έναν αριθμό (τελεία) - χρησιμοποιείται η μέθοδος εκτίμησης σημείου.
  • 2. εκτίμηση διαστήματος, δηλαδή το διάστημα προσδιορίζεται στο οποίο η επιθυμητή παράμετρος μπορεί να εντοπιστεί με κάποια πιθανότητα.

Σημειακή εκτίμησηάγνωστη παράμετρος είναι ότι μια συγκεκριμένη αριθμητική τιμή της εκτίμησης δείγματος λαμβάνεται ως η καλύτερη προσέγγιση με την πραγματική παράμετρο του γενικού πληθυσμού, δηλαδή η άγνωστη παράμετρος του γενικού πληθυσμού εκτιμάται με έναν αριθμό (σημείο) που καθορίζεται από το δείγμα. Με αυτήν την προσέγγιση, υπάρχει πάντα ο κίνδυνος να κάνετε λάθος, επομένως, μια εκτίμηση σημείου θα πρέπει να συμπληρωθεί με έναν δείκτη ενός πιθανού σφάλματος σε ένα ορισμένο επίπεδο πιθανότητας.

Η μέση τετραγωνική απόκλιση λαμβάνεται ως μέσο σφάλμα εκτίμησης.

Στη συνέχεια, η εκτίμηση σημείου του γενικού μέσου όρου μπορεί να αναπαρασταθεί ως διάστημα

πού είναι το δείγμα αριθμητική μέση τιμή.

Κατά την εκτίμηση σημείων, χρησιμοποιούνται διάφορες μέθοδοι για τη λήψη εκτιμήσεων από δείγματα δεδομένων:

  • 1. η μέθοδος των στιγμών, κατά την οποία οι στιγμές του γενικού πληθυσμού αντικαθίστανται από τις στιγμές του δείγματος ·
  • 2. τη μέθοδο των ελάχιστων τετραγώνων.
  • 3. μέθοδος μέγιστης πιθανότητας.

Σε πολλές εργασίες, απαιτείται να βρεθεί όχι μόνο μια αριθμητική εκτίμηση της παραμέτρου του γενικού πληθυσμού, αλλά και να εκτιμηθεί η ακρίβεια και η αξιοπιστία της. Αυτό είναι ιδιαίτερα σημαντικό για δείγματα σχετικά μικρού μεγέθους. Μια γενίκευση της σημειακής εκτίμησης της στατιστικής παραμέτρου είναι η εκτίμηση διαστήματος- εύρεση αριθμητικού διαστήματος που περιέχει την εκτιμώμενη παράμετρο με μια ορισμένη πιθανότητα.

Λόγω του γεγονότος ότι κατά τον προσδιορισμό των γενικών χαρακτηριστικών από τα δείγματα δεδομένων, υπάρχει πάντα κάποιο σφάλμα, είναι πιο πρακτικό να προσδιοριστεί ένα διάστημα που θα επικεντρώνεται στην εκτίμηση του σημείου που βρέθηκε, εντός του οποίου βρίσκεται η πραγματική επιθυμητή τιμή της εκτιμώμενης παραμέτρου του γενικού χαρακτηριστικού με μια συγκεκριμένη πιθανότητα. Αυτό το διάστημα ονομάζεται διάστημα εμπιστοσύνης.

Διάστημα εμπιστοσύνηςείναι ένα αριθμητικό διάστημα που, με δεδομένη πιθανότητα r, καλύπτει την εκτιμώμενη παράμετρο του γενικού πληθυσμού. Αυτή η πιθανότητα ονομάζεται επίπεδο εμπιστοσύνης. Πιθανότητα εμπιστοσύνης d είναι η πιθανότητα που μπορεί να θεωρηθεί επαρκής στο πλαίσιο του προβλήματος που επιλύεται για να κρίνει την αξιοπιστία των χαρακτηριστικών που λαμβάνονται με βάση δειγματοληπτικές παρατηρήσεις. Η αξία

ονομάζονται οι πιθανότητες να γίνει λάθος επίπεδο σημασίας.

Για δείγμα (σημείο) εκτίμηση I * (θήτα) της παραμέτρου ΚΑΙ του γενικού πληθυσμού με ακρίβεια ( οριακό λάθος) D και επίπεδο εμπιστοσύνης g, το διάστημα εμπιστοσύνης καθορίζεται από την ισότητα:

Η πιθανότητα εμπιστοσύνης r καθιστά δυνατή την καθιέρωση όρια εμπιστοσύνηςτυχαία διακύμανση της μελετούμενης παραμέτρου ΚΑΙ για ένα δεδομένο δείγμα.

Οι ακόλουθες τιμές και οι αντίστοιχες τιμές συχνά λαμβάνονται ως επίπεδα εμπιστοσύνης. επίπεδα σπουδαιότητας

Πίνακας 1. - Τα πιο κοινά επίπεδα εμπιστοσύνης και επίπεδα σημασίας

Για παράδειγμα, ένα επίπεδο σημασίας 5% σημαίνει τα εξής: σε 5 από τις 100 περιπτώσεις, υπάρχει κίνδυνος να γίνει λάθος στον προσδιορισμό των χαρακτηριστικών του γενικού πληθυσμού από δείγματα δεδομένων. Or, με άλλα λόγια, σε 95 από τις 100 περιπτώσεις, το γενικό χαρακτηριστικό που αποκαλύπτεται με βάση το δείγμα βρίσκεται εντός του διαστήματος εμπιστοσύνης.

Η κατανομή μιας τυχαίας μεταβλητής (κατανομή του γενικού πληθυσμού) χαρακτηρίζεται συνήθως από έναν αριθμό αριθμητικών χαρακτηριστικών:

  • για την κανονική κατανομή N (a, σ), αυτές είναι η μαθηματική προσδοκία a και η τυπική απόκλιση σ.
  • για ομοιόμορφη κατανομή, R (a, b) είναι τα όρια του διαστήματος στο οποίο παρατηρούνται οι τιμές αυτής της τυχαίας μεταβλητής.
Τέτοια αριθμητικά χαρακτηριστικά, κατά κανόνα, είναι άγνωστα, ονομάζονται πληθυσμιακές παραμέτρους . Εκτίμηση παραμέτρων - το αντίστοιχο αριθμητικό χαρακτηριστικό που υπολογίζεται από το δείγμα. Οι εκτιμήσεις των παραμέτρων του γενικού πληθυσμού χωρίζονται σε δύο κατηγορίες: σημείοκαι διάστημα.

Όταν μια βαθμολογία ορίζεται από έναν αριθμό, καλείται σημειακή εκτίμηση... Η εκτίμηση σημείου, ως συνάρτηση του δείγματος, είναι μια τυχαία μεταβλητή και αλλάζει από δείγμα σε δείγμα όταν επαναλαμβάνεται το πείραμα.
Υπάρχουν απαιτήσεις για αξιολόγηση σημείων που πρέπει να πληρούν για να είναι τουλάχιστον κατά κάποιον τρόπο «καλοήθεις». το αμεροληψία, αποδοτικότητακαι συνοχή.

Διαστημικές εκτιμήσειςκαθορίζονται από δύο αριθμούς - τα άκρα του διαστήματος που καλύπτει την εκτιμώμενη παράμετρο. Σε αντίθεση με τις εκτιμήσεις σημείων, οι οποίες δεν δίνουν μια ιδέα για το πόσο μακριά από αυτές μπορεί να είναι η εκτιμώμενη παράμετρος, οι εκτιμήσεις διαστήματος σάς επιτρέπουν να καθορίσετε την ακρίβεια και την αξιοπιστία των εκτιμήσεων.

Ως σημειακές εκτιμήσεις της μαθηματικής προσδοκίας, διακύμανσης και τυπικής απόκλισης, χρησιμοποιούνται τα χαρακτηριστικά του δείγματος, αντίστοιχα, η μέση τιμή δείγματος, η διακύμανση δείγματος και η τυπική απόκλιση δείγματος.

Ιδιότητα αμερόληπτης εκτίμησης.
Μια επιθυμητή απαίτηση για την αξιολόγηση είναι η απουσία προκατάληψης, δηλαδή E. με επαναλαμβανόμενη χρήση, αντί της παραμέτρου θ της εκτίμησής της, η μέση τιμή του σφάλματος προσέγγισης είναι ίση με μηδέν - αυτό είναι αμερόληπτη εκτίμηση ιδιοκτησίας.

Ορισμός... Μια εκτίμηση ονομάζεται αμερόληπτη εάν η μαθηματική της προσδοκία είναι ίση με την πραγματική τιμή της εκτιμώμενης παραμέτρου:

Η αριθμητική μέση δείγματος είναι μια αμερόληπτη εκτίμηση της μαθηματικής προσδοκίας και της διακύμανσης του δείγματος - προκατειλημμένη εκτίμηση της γενικής διακύμανσης ρε... Η αμερόληπτη εκτίμηση της γενικής διακύμανσης είναι η εκτίμηση

Ιδιότητα συνέπειας αποτίμησης.
Η δεύτερη απαίτηση για μια εκτίμηση - η συνέπεια της - σημαίνει ότι η εκτίμηση βελτιώνεται με την αύξηση του μεγέθους του δείγματος.

Ορισμός... Βαθμός ονομάζεται συνεπής εάν συγκλίνει κατά πάσα πιθανότητα στην εκτιμώμενη παράμετρο θ ως n → ∞.


Σύγκλιση στην πιθανότητα σημαίνει ότι με μεγάλο μέγεθος δείγματος, η πιθανότητα μεγάλων αποκλίσεων της εκτίμησης από την πραγματική τιμή είναι μικρή.

Αποτελεσματική ιδιότητα αξιολόγησης.
Η τρίτη απαίτηση σάς επιτρέπει να επιλέξετε την καλύτερη εκτίμηση από διάφορες εκτιμήσεις της ίδιας παραμέτρου.

Ορισμός... Μια αμερόληπτη εκτίμηση είναι αποτελεσματική εάν έχει τη μικρότερη απόκλιση μεταξύ όλων των αμερόληπτων εκτιμήσεων.

Αυτό σημαίνει ότι η πραγματική εκτίμηση έχει ελάχιστη διασπορά σε σχέση με την πραγματική τιμή της παραμέτρου. Σημειώστε ότι μια αποτελεσματική εκτίμηση δεν υπάρχει πάντα, αλλά η πιο αποτελεσματική μπορεί συνήθως να επιλεγεί από τις δύο εκτιμήσεις, δηλ. με λιγότερη απόκλιση. Για παράδειγμα, για την άγνωστη παράμετρο a του φυσιολογικού γενικού πληθυσμού Ν (a, σ), τόσο η αριθμητική μέση δείγμα όσο και η διάμεση του δείγματος μπορούν να ληφθούν ως αμερόληπτη εκτίμηση. Αλλά η διακύμανση του μέσου δείγματος είναι περίπου 1,6 φορές μεγαλύτερη από τη διακύμανση του αριθμητικού μέσου όρου. Επομένως, μια πιο αποτελεσματική εκτίμηση είναι το δείγμα αριθμητικής μέσης τιμής.

Παράδειγμα # 1. Βρείτε την αμερόληπτη εκτίμηση της διακύμανσης των μετρήσεων κάποιας τυχαίας μεταβλητής από μία συσκευή (χωρίς συστηματικά σφάλματα), τα αποτελέσματα των οποίων (σε mm): 13,15,17.
Λύση. Πίνακας υπολογισμού δεικτών.

Χ| x - x μέσο |(x - x μέσος όρος) 2
13 2 4
15 0 0
17 2 4
45 4 8

Απλή αριθμητική μέση τιμή(αμερόληπτη εκτίμηση της μαθηματικής προσδοκίας)


Διασπορά- χαρακτηρίζει το μέτρο διασποράς γύρω από το μέσο όρο του (το μέτρο της διασποράς, δηλαδή αποκλίσεις από τον μέσο όρο - μεροληπτική εκτίμηση).


Εκτίμηση αμερόληπτης διακύμανσης- συνεπής εκτίμηση της διακύμανσης (η διακύμανση διορθώθηκε).

Παράδειγμα # 2. Βρείτε την αμερόληπτη εκτίμηση της μαθηματικής προσδοκίας μετρήσεων κάποιας τυχαίας μεταβλητής με μία συσκευή (χωρίς συστηματικά σφάλματα), τα αποτελέσματα των οποίων (σε mm): 4,5,8,9,11.
Λύση. m = (4 + 5 + 8 + 9 + 11) / 5 = 7,4

Παράδειγμα Νο. 3. Βρείτε τη διορθωμένη διακύμανση S 2 για ένα δείγμα μεγέθους n = 10 εάν η διακύμανση δείγματος είναι D = 180.
Λύση. S 2 = n * D / (n-1) = 10 * 180 / (10-1) = 200