تقييم الخصائص الإحصائية للبيانات العشوائية. تحليل تشابه التوزيعات. التقييمات الإحصائية نقطة

دعها تأخذ لاستكشاف العلامة الكمية للسكان العامين. لنفترض أنه من الاعتبارات النظرية كان من الممكن تأسيس التوزيع هو علامة. مهمة تقدير المعلمات، والتي تحددها هذا التوزيع. على سبيل المثال، إذا كنت تعرف أن الميزة المدروسة يتم توزيعها في عامة السكان وفقا للقانون الطبيعي، فمن الضروري تقدير التوقع الرياضي والانحراف المعياري، لأن هاتين المعلمين يحددان تماما التوزيع الطبيعي. إذا كان هناك سبب للاعتقاد بأن الميزة لها توزيع Poisson، فمن الضروري تقدير المعلمة التي يتم تحديد هذا التوزيع. عادة ما تكون هناك بيانات أخذ العينات فقط التي تم الحصول عليها نتيجة الملاحظات:، ...،. من خلال هذه البيانات والتعبير عن المعلمة المقدرة. النظر، ...، مثل قيم المتغيرات العشوائية المستقلة، ...، يمكن القول أنه يمكن العثور عليه أنه يعني العثور على وظيفة من المتغيرات العشوائية الملحوظة، مما يعطي قيمة تقريبية المقدرة معامل.

وبالتالي، التقييم الإحصائي تسمى المعلمة غير المعروفة للتوزيع النظري الوظيفة من المتغيرات العشوائية الملاحظة. يسمى التقييم الإحصائي لمعلمة غير معروفة من عامة السكان في عدد واحد يسمى نصف غالونوبعد نناقش تقديرات النقطة التالية أدناه: الإزاحة وغير المستقرة والفعالة والأثرياء.

من أجل التقديرات الإحصائية لإعطاء تقريب جيد للمعايير المقدرة، يجب عليهم إرضاء متطلبات معينة. نحدد هذه المتطلبات. فليكن هناك تقييم إحصائي لمعلمة غير معروفة للتوزيع النظري. افترض أن النتيجة موجودة على حجم العينة. سنكرر الخبرة، وهذا هو، استخراج مجموعهن العام هو عينة أخرى من نفس الحجم وطبقا بياناتها، وسوف نجد تقييم، وما إلى ذلك. نحصل على الرقم، ...، والتي ستكون مختلفة. وبالتالي، يمكن اعتبار التقدير كمبلغ عشوائي، والرقم ،، ...، - كقيم محتملة.

إذا كان التقدير يعطي قيمة تقريبية مع فائض، فإن الرقم الموجود وفقا لبيانات العينة ( ) سيكون هناك معنى صحيح. وبالتالي، فإن التوقع الرياضي (متوسط \u200b\u200bقيمة) متغير عشوائي سيكون أكبر من، أي .. إذا كان يعطي قيمة تقريبية مع العيب، إذن.

وبالتالي، فإن استخدام التقييم الإحصائي، والتوقعات الرياضية التي لا تساوي المعلمة المقدرة، ستؤدي إلى أخطاء منهجية. لذلك، من الضروري أن تتطلب التوقع الرياضي للتقييم لتكون مساوية للمعلمة. الامتثال للمتطلبات يلغي الأخطاء المنهجية.

تفهم اتصل بتقييم إحصائي، والتوقعات الرياضية التي تساوي المعلمة المقدرة، I.E ..

نزح اتصل بتقييم إحصائي، والوقعات الرياضية التي لا تساوي المعلمة المقدرة.

ومع ذلك، فإنه مخطئ أن نفترض أن التقدير غير المستقر دائما يعطي تقريبا جيدا للمعلمة المقدرة. في الواقع، يمكن أن تكون القيم المحتملة منتشرة بقوة حول متوسط \u200b\u200bقدرتها، أي أن تباين الحجم يمكن أن يكون كبيرا. في هذه الحالة، قد يكون التقييم الموجود وفقا لعينة واحدة، على سبيل المثال، بعيد جدا عن متوسط \u200b\u200bقدرته، وبالتالي، من المعلمة الأكثر تقديرات. أخذ كقيمة تقريبية، سوف نسمح خطأ كبير. إذا كنت بحاجة إلى تشتت صغيرا ليكون صغيرا، فسيتم استبعاد القدرة على السماح خطأ كبير. لذلك، يوفر التقييم الإحصائي متطلبات الأداء.

فعال يسمون تقييما إحصائيا، والتي (لأخذ عينات معينة) لديها أصغر تشتت ممكن. عند النظر في عينات كمية كبيرة إلى التقديرات الإحصائية، يتم إجراء شرط.

الأثرياء اتصل بتقييم إحصائي، وهو ما تسعى فيه إلى احتمال المعلمة المقدرة. على سبيل المثال، إذا كان تشتت التقدير غير المركزي يسعى جاهدة من أجل الصفر، فإن مثل هذا التقييم هو أيضا الأثرياء.

النظر في مسألة الخصائص الانتقائية هي الأفضل بمعنى عدم القدرة، والكفاءة والاتساق تقيم الحد العام والتشتت.

دع المحدد المنفصل العام بالنسبة إلى الميزة الكمية يدرس. العام الأوسط ويطلق عليه متوسط \u200b\u200bالقيم الحسابية لعلامة عامة السكان. يمكن حسابها بواسطة الصيغ أو ، أين - قيم علامة عامة السكان في الحجم - الترددات المقابلة، و.

لنفترض من عامة السكان نتيجة الملاحظات المستقلة على الأساس الكمي، وعينة من حجم مع قيم المميزة . متوسط \u200b\u200bانتقائي اتصل بمتوسط \u200b\u200bالإجمالي الانتقائي الحسابي. يمكن حسابها بواسطة الصيغ أو ، حيث - قيم السمة في تقديم حجم - الترددات المقابلة، و.

إذا كان الجنرال غير معروف غير معروف، فمن الضروري تقييمه وفقا لبيانات العينة، ثم تقديرا للوسخل العام، تتم التقاط الوسيلة الانتقائية، والتي لا علاقة لها وتقييم ثري. يتبع ذلك في حالة وجود العديد من العينات كبيرة جدا، من نفس السكان العامين، سيتم العثور على المتوسطات الانتقائية، ثم سوف يساويون تقريبا بعضهم البعض. هذا يتكون من عقار. استدامة عينة متوسطة.

لاحظ أنه إذا كان تشتت مجموعتين هو نفسه، فإن بالقرب من العينة المتوسطة إلى الجنرال لا يعتمد على نسبة حجم العينة إلى حجم السكان العامين. ذلك يعتمد على حجم العينة: حجم العينة أكثر، يختلف متوسط \u200b\u200bأقل انتقائية عن عام.

من أجل وصف نثر قيم الميزة الكمية لعامة السكان حول متوسط \u200b\u200bالقيمة، يتم تقديم المميزات الموجزة - التشتت العام. التشتت العام اتصل بمتوسط \u200b\u200bالمربعات الحسابية من انحرافات قيم علامة عامة على عدد أعمدة من متوسط \u200b\u200bالقيمة، والتي تحسبها الصيغ: ، أو .

من أجل وصف نثر القيم المرصودة من السمة الكمية للعينة حول متوسط \u200b\u200bالقيمة، يتم تقديم خاصية ملخص - تشتت من النظافة. تشتت انتقائي يسمى متوسط \u200b\u200bالمربعات الحسابية من الانحرافات للقيم المرصودة للميزة من متوسط \u200b\u200bالقيمة، والتي تحسبها الصيغ: ، أو .

بالإضافة إلى التشتت، لتوصيف تشتت قيم ميزة عامة (انتقائية) تم تعيينها حول متوسط \u200b\u200bالقيمة، استخدم خاصية ملخص - انحراف مترالي متوسط. الانحراف التربيعي العام العام استدعاء الجذر التربيعي من التشتت العام :. الانحراف التربيعي المتوسط \u200b\u200bالانتقائي استدعاء الجذر التربيعي من التشتت الانتقائي:

افترض من عامة السكان نتيجة الملاحظات المستقلة على الأساس الكمي، يتم استرداد عينة وحدة التخزين. مطلوب وفقا لبيانات العينة لتقييم التشتت العام غير معروف. إذا اتخذت تشتت انتقائيا كتقدير للتشتت العام، فإن هذا التقييم سيؤدي إلى أخطاء منهجية، مما يعطي قيمة قليلة من التشتت العام. يفسر ذلك حقيقة أن التشتت الانتقائي هو تصنيف النازحين؛ بمعنى آخر، فإن التوقع الرياضي لتشتت العينة لا يساوي التشتت العام المقدر، ولكن على قدم المساواة .

من السهل تصحيح التشتت الانتقائي بحيث يكون توقعاته الرياضي يساوي التشتت العام. يكفي أن تضاعف إلى الكسر. نتيجة لذلك، نحصل على تشتت تصحيحا، والتي يتم تشبيهها عادة. سيكون التشتت المصحح تقديرا غير محلل للتشتت العام: .

2. تقديرات الفاصل.

جنبا إلى جنب مع تقدير النقطة، تشارك النظرية الإحصائية لتقدير المعلمات في تقدير الفاصل الزمني. يمكن صياغة مشكلة تقدير الفاصل الزمني على النحو التالي: وفقا لبيانات العينة، يمكن إنشاء احتمال محدد مسبقا مع احتمال محدد مسبقا يتم تقدير المعلمة ضمن هذا الفاصل الزمني. يعد تقدير الفاصل ضروريا بشكل خاص مع عدد قليل من الملاحظات عندما يكون تقدير النقطة عشوائيا إلى حد كبير، وبالتالي موثوقة بقليل.

الفاصل السرية للحصول على معلمة، يتم استدعاء مثل هذه الفاصل الزمني النسبي الذي من الممكن به مع احتمال محدد مسبقا بالقرب من واحد، والجادل أنه يحتوي على قيمة غير معروفة للمعلمة، I.E. وبعد أصغر عدد الاحتمال المحدد، وتقييم المعلمة غير معروف بشكل أكثر دقة. وعلى العكس من ذلك، إذا كان هذا عددا كبيرا، فإن التقييم المصنوع من هذا الفاصل هو مناسب قليلا للممارسة. نظرا لأن انتهاء فترة الثقة تعتمد على عناصر العينة، يمكن أن تتغير القيم أيضا من عينة العينة. يسمى الاحتمال احتمال موثوق به (الموثوقية). عادة، يتم تعريف موثوقية التقييم مقدما، وعدد الاقتراب من المرء يتأخذ أثناء اتخاذها. لا يوجد اختيار احتمال موثوق به مهمة رياضية، ولكن يتم تحديد مشكلة محددة تم حلها. في معظم الأحيان تعيين الموثوقية يساوي؛ ؛ وبعد

نقدم دون إخراج الفاصل الزمني للثقة للمتوسط \u200b\u200bالعام مع معنى معروف للانحراف التربيعي المتوسط، شريطة توزيع القيمة العشوائية (الكمي) بشكل طبيعي:

حيث - الرقم المحدد قريب من واحد، وترد قيم الوظيفة في الملحق 2.

معنى هذه النسبة كما يلي: مع الموثوقية، يمكن القول بأن الفاصل الزمني للثقة ( ) يغطي معلمة غير معروفة، دقة التصنيف متساوية. يتم تحديد الرقم من المساواة أو. يجد الجدول (Appendix2) حجة تتوافق قيمة وظيفة لابلاس.

مثال 1.وبعد تحتوي قيمة عشوائية على توزيع طبيعي مع متوسط \u200b\u200bانحراف من الدرجة الثانية المعروفة. ابحث عن فترات الثقة لتقييم المتوسط \u200b\u200bالعام غير معروف عن طريق متوسط \u200b\u200bانتقائي إذا تم تحديد حجم العينات وموثوقية التقييم.

قرار. سوف نجد. من النسبة نحصل عليه. الجدول (الملحق 2) نجد. البحث عن دقة التقييم وبعد فواصل الثقة ستكون كما يلي: وبعد على سبيل المثال، إذا، فإن الفاصل الزمني الثقة له حدود الثقة التالية: وبعد وبالتالي، فإن قيم معلمة غير معروفة، بما يتفق مع بيانات العينة، تلبية عدم المساواة .

تم تعيين الفاصل الزمني للثقة للتوزيع العادي المعتدل للميزة على قيمة غير معروفة من متوسط \u200b\u200bالانحراف التربيعي بواسطة التعبير .

من هنا يتبع ذلك مع الموثوقية التي يمكن القول بأن الفاصل الزمني الثقة يغطي معلمة غير معروفة.

هناك جداول جاهزة (الملحق 4)، وذلك باستخدام، وفقا للمحدد والعثور على احتمال، والظهر، على المحدد ويمكن العثور عليها.

مثال 2.وبعد يتم توزيع الإشارة الكمية للسكان العام بشكل طبيعي. بواسطة عينة حجم العثور على عينة متوسطة وتصحيح الانحراف RMS. تقييم المتوسط \u200b\u200bالعام غير معروف بمساعدة فاصل ثقة مع الموثوقية.

قرار. سوف نجد. باستخدام الجدول (الملحق 4)، والعثور على :. نجد حدود الثقة:

لذلك، مع الموثوقية، يتم إرفاق معلمة غير معروفة في فاصل الثقة.

3. مفهوم الفرضية الإحصائية. الصياغة العامة لمهمة اختبار الفرضيات.

التحقق من الفرضيات الإحصائية يرتبط ارتباطا وثيقا نظرية المعلمات تقدير. في العلوم الطبيعية، فإن التقنية، وغالبا ما يتم اللجاعة الاقتصاد إلى بيان الفرضيات التي يمكن التحقق منها إحصائيا، أي بناء على نتائج الملاحظات في عينة عشوائية. تحت الفرضية الإحصائية هناك مثل هذه الفرضيات التي تتعلق أو إلى النموذج، أو لفصل معلمات توزيع المتغير العشوائي. على سبيل المثال، الإحصاء هو فرضية أن توزيع عمال إنتاجية العمل يؤديون نفس العمل في نفس الشروط، لديه قانون توزيع طبيعي. ستكون الإحصائية أيضا فرضية مفادها أن متوسط \u200b\u200bأبعاد الأجزاء التي يتم إنتاجها على نفس النوع، بالتوازي مع آلات العمل، لا تختلف فيما بينها.

يسمى الفرضية الإحصائية سهل إذا كان بالتأكيد يحدد توزيع متغير عشوائي، وإلا يتم استدعاء الفرضية معقد.على سبيل المثال، فإن الفرضية البسيطة هي افتراض أن مجموعة متنوعة عشوائية يتم توزيعها وفقا لقانون طبيعي مع توقع رياضي يساوي الصفر، وتشتت تشتت إلى واحد. إذا كان ذلك يقترح أن تكون قيمة عشوائية توزيع طبيعي مع تشتت مساواة واحدة، فإن التوقع الرياضي هو عدد من القطاع، فهذه فرضية معقدة. مثال آخر على الفرضية هو افتراض أن القيمة العشوائية المستمرة مع احتمال تستغرق قيمة من الفاصل الزمني، في هذه الحالة يمكن أن يكون توزيع المتغير العشوائي أي من فئة التوزيعات المستمرة.

غالبا ما يكون توزيع الحجم معروفا، وعلى عينة الملاحظات، من الضروري اختبار الافتراضات حول قيمة معلمات هذا التوزيع. وتسمى هذه الفرضية غير رسمي.

يسمى الفرضية التي تم التحقق منها صفر الفرضية ويتم تشبيهه. جنبا إلى جنب مع الفرضية، فنحن نعتبر واحدة من الفرضيات البديلة (المنافسة). على سبيل المثال، إذا تم التحقق من فرضية على المساواة في المعلمة إلى بعض القيمة المحددة، I.E.:، ثم فرضية بديلة، يمكن عرض أحد الفرضيات التالية ::؛ :؛ :؛ :، أين - القيمة المحددة،. يتم تحديد اختيار GTPothesis البديل حسب الصياغة المحددة للمهمة.

وتسمم القاعدة التي يتعين على القرار قبول أو رفض الفرضية معايير وبعد نظرا لعدم اتخاذ القرار على أساس أخذ العينات من ملاحظات متغير عشوائي، فمن الضروري اختيار الإحصاءات المناسبة، تسمى إحصاءات المعايير في هذه الحالة. عند التحقق من فرضية حديثة بسيطة: كإحصائيات، يتم اختيار المعيار نفس الإحصاءات لتقييم المعلمة.

يعتمد التحقق من الفرضية الإحصائية على مبدأ، وفقا للأحداث غير المرجحة التي تعتبر غير مرئية، والأحداث التي لها احتمال أكبر موثوق بها. يمكن تنفيذ هذا المبدأ على النحو التالي. قبل تحليل العينة، دعا بعض الاحتمالات الصغيرة مستوى الأهميةوبعد اسمحوا أن تكون مجموعة من قيم الإحصاءات، وهي مجموعة فرعية مثل، تخضع لحقيقة الفرضية، احتمالية إحصاءات المعايير مساوية، أي. .

تشير إلى قيمة الإحصائيات الانتقائية التي تحسبها عينة الملاحظات. يتم صياغة المعيار على النحو التالي: رفض الفرضية إذا؛ خذ فرضية إذا. معيار بناء على استخدام مستوى محدد مسبقا من الأهمية يسمى معيار الأهميةوبعد مجموعة من جميع قيم إحصائيات المعيار، والتي يتم بها اتخاذ القرار لرفض الفرضية، منطقة حرجة؛ وتسمى المنطقة اتخذت المنطقة الفرضيات.

يحدد مستوى الأهمية حجم المنطقة الحرجة. يعتمد موقف المجال الحاسم في مجموعة قيم الإحصاء على صياغة فرضية بديلة. على سبيل المثال، إذا تم التحقق من الفرضية:، وفتحت الفرضية البديلة على النحو التالي: ()، يتم وضع المنطقة الحرجة على اليمين (يسار) "الذيل" لتوزيع الإحصاءات، أي له شكل عدم المساواة: () ، أين وهل هذه القيم الإحصائية التي تم قبولها مع الاحتمالات، على التوالي، شريطة أن تكون الفرضية صحيحة. في هذه الحالة، يسمى المعيار من جانب واحد، على التوالي، من جانب اليمين والأيسر. إذا تم وضع فرضية بديلة على النحو التالي:، يتم وضع المنطقة الحرجة على كلا من "ذيول" التوزيع، أي تحديدها حسب مزيج من عدم المساواة و؛ في هذه الحالة، يسمى المعيار ثنائي.

في التين. 30 يوضح موقع المنطقة الحرجة لمختلف الفرضيات البديلة. فيما يلي كثافة توزيع إحصائيات المعيار، شريطة أن تكون الفرضية صحيحة، - مجال اعتماد الفرضية، .

وبالتالي، يمكن تقسيم التحقق من الفرضية الإحصائية الحديثة بمساعدة معيار الأهمية إلى الخطوات التالية:

1) صياغة فرضيات يمكن التحقق منها () والبديل ()؛

2) لتعيين مستوى الأهمية؛ لا يتفق مع نتائج الملاحظات؛ إذا أخذت الفرضية، بعد ذلك، فهي تعتبر أن الفرضية لا تتناقض مع نتائج الملاحظات.

عادة، عند أداء العنصر ص 4 - 7 يستخدم الإحصاءات، يتم جدولة خزانات الكم: إحصائيات مع التوزيع العادي، إحصائيات طالب، إحصاءات فيشر.

مثال 3.وبعد وفقا لبيانات جواز السفر من استهلاك وقود محرك السيارات على 100 كيلومتر الأميال هو 10 لتروبعد نتيجة لذلك، من المتوقع أن ينخفض \u200b\u200bتصميم المحرك لاستهلاك الوقود. تقام الاختبارات للتحقق 25 السيارات المختارة عن طريق الخطأ مع محرك حديث، ونفقات الوقود الثانوية الانتقائية 100 كيلومتر بلغ عدد الكيلومترات بناء على نتائج الاختبار 9.3 لتروبعد لنفترض أن عينة استهلاك الوقود يتم الحصول عليها من عامة أعمدة موزعة عادة مع متوسط \u200b\u200bوتشتت. شريطة أن تكون الفرضية للمنطقة الحرجة للإحصاءات الأولية صالحة، أي أنها تساوي مستوى الأهمية. ابحث عن احتمالات أخطاء النوع الأول والثاني للمعيار مع مثل هذه المنطقة الحرجة. لديها توزيع طبيعي مع توقع رياضي يساوي التشتت يساوي. احتمالية الخطأ من النوع الثاني سيجدون حسب الصيغة (11.2):

وبالتالي، وفقا للمعيار المقبول من 13.6٪ من السيارات التي لها استهلاك الوقود 9 لتر على ال 100 كيلومتر الأميال، المصنفة كسيارات لها استهلاك الوقود 10 لتر.

4. الترددات النظرية والتجريبية. معايير الموافقة.

الترددات التجريبية - الترددات الناتجة عن الخبرة (الملاحظة). الترددات النظرية انخفضت من الصيغ. بالنسبة لقانون التوزيع الطبيعي، يمكن العثور عليها على النحو التالي:

, (11.3)

ترتبط قضايا التقييم الإحصائي بمثل هذه الجوانب الإشكالية للإحصاء الرياضي، كمنهجية علمية، ومتغيرات عشوائية، توزيعات إحصائية، إلخ. لأي عينة، أخطاء ناتجة عن التغطية غير المكتملة للوحدات وأخطاء القياس، والأسباب المشابهة. مثل هذه الأخطاء في الحياة الحقيقية تعطي كل فرضية (على وجه الخصوص، وضعت على أساس الاستنتاجات الاقتصادية) شخصية عشوائية ومتوسطة. بغض النظر عن عدد المتغيرات المنصوص عليها في الفرضيات النظرية، يفترض أن تأثير أنواع مختلفة من الأخطاء يمكن وصفها بدقة باستخدام مكون واحد فقط. يسمح لك هذا النهج المنهجي بالحد من التوزيع المرء الأبعاد للاحتمالات أثناء تقييم العديد من المعلمات.

التقييم الإحصائي - هذا هو واحد من نوعين من الحكم الإحصائي (النوع الثاني - الفرضيات الشيكات). إنه نوع خاص من طريقة الحكم على القيم العددية للخصائص (المعلمات) لتوزيع عامة السكان وفقا لبيانات العينة من هذه المجمل. وهذا هو، وجود نتائج الملاحظة الانتقائية، نحاول تقدير (مع وجود أكبر قدر من الدقة) قيم معلمات معينة، والتي يقوم فيها بتوزيع الميزة (بديل)، والتي تهمنا، في عامة السكان. نظرا لأن العينة تتضمن فقط جزءا من الوحدات السكانية العامة (أحيانا عددا صغيرا جدا)، فهناك خطر للسماح للخطأ. على الرغم من انخفاض هذه المخاطر بزيادة عدد وحدات الملاحظة، فإنه لا يزال يحدث في ملاحظة انتقائية. من هنا، يوفر القرار المتخذ وفقا لنتائج العينة الطبيعة الاحتمالية. لكن سيكون من غير الصحيح النظر في الأحكام الإحصائية فقط من مواقف الاحتمالات. مثل هذا النهج لا يكفي دائما لبناء الافتراضات النظرية الصحيحة فيما يتعلق بمعايير عامة السكان. غالبا ما تحتاج إلى عدد آخر من الأحكام الإضافية التي من شأنها أن توفر الأساس المنطقي أعمق. على سبيل المثال، تحتاج إلى تقييم بتقريب كبير من متوسط \u200b\u200bعدد العمال المؤهلين في مؤسسات المنطقة. في هذه الحالة، فإن متوسط \u200b\u200bالمتغير الحسابي X من عامة السكان، الذي يقدر بتوزيع طبيعي. بعد تلقي عينة في هذه الميزة في المبلغ p الوحدات، من الضروري حل السؤال: ما حجم وفقا لبيانات العينة يجب أن تؤخذ الأقرب إلى المتوسط \u200b\u200bفي عامة السكان؟ مثل هذه القيم، يمكن إحضار التوقع الرياضي الذي يساوي المعلمة المرغوبة (أو بالقرب منها)، عدة: أ) متوسط \u200b\u200bالحساب؛ ب) الأزياء ج) متوسط د) متوسط، محسوب في نطاق الاختلاف، إلخ.

من وجهة نظر احتمالية، يمكن اعتبار كل من القيم المذكورة أعلاه إعطاء أفضل تقريب للمعلمة المرغوبة للسكان العامين (X)، منذ التوقع الرياضي لكل هذه الوظائف (خاصة بالنسبة للعينات الكبيرة ) يساوي المتوسط \u200b\u200bالعام. يتم تحديده بموجب هذا الافتراض أنه مع تكرار عينة مرارا وتكرارا من نفس المجموع العام، "في المتوسط" هو النتيجة الصحيحة.

يتم تفسير صحة "المتوسط" من خلال المساواة في تكرار الانحرافات الإيجابية والسلبية للأخطاء المقدرة من تقدير متوسط \u200b\u200bالمتوسط \u200b\u200bالعام، أي أن متوسط \u200b\u200bالخطأ التقديري سيكون صفر.

في ظروف عملية، كقاعدة عامة، تنظم نموذجا واحدا، لذلك يهتم الباحث بمسألة تقييم أكثر دقة للمعلمة المرغوبة بناء على نتائج عينة معينة. لحل هذه المهمة، باستثناء الاستنتاجات التي تنشأ مباشرة من حساب التجريدي للحصول على الاحتمال، هناك حاجة إلى قواعد إضافية لتحفيز أفضل تقريب التقييم للمعلمة المرغوبة للسكان العامين.

هناك عدد كاف من الطرق لتقييم الثوابت على الملاحظات الانتقائية. أي منهم هو الأفضل في حل أهداف محددة للدراسة - تنخرب نظرية التقدير الإحصائي. يستكشف الشروط التي يجب أن تطيعها من قبل واحد أو آخر من التقييم، مجيئين في التقديرات أكثر تفضيلا في هذه الظروف. تشير نظرية التقديرات إلى تفوق تقييم واحد مقارنة بالآخر.

كما تعلمون، فإن المعلومات التي تم الحصول عليها على أساس العينة ليست قاطعة في الختام. على سبيل المثال، على سبيل المثال، كانت 100 رؤساء حيواني يدرسون من أمراضهم الصحي 99، ثم هناك احتمال أن يكون حيوان واحد لا يزال غير مستكشئ بحمل فيروس المرض المقصود بدقة. نظرا لأنه من غير المرجح أن يكون هناك استنتاج حول عدم وجود هذا المرض. في معظم الحالات، يتم تبرير هذا الاستنتاج بالكامل.

تستند إلى هذه الاستنتاجات في النشاط العملي، ويستند المجرب (الباحث) إلى موثوقية المعلومات، ولكن فقط من أجل احتمالها.

الجانب الآخر من الملاحظة العينة، كما لاحظ بالفعل، يحل مهمة ربما تقدير أكثر موضوعية لدرجة موثوقية تصنيفات العينة المستلمة. يحاول الحل لهذه المهمة توفير أكبر قدر ممكن من التعبير الاحتمالي، وهذا يعني تحديد درجة دقة التقييم. هنا، يحدد الباحث حدود التناقض المحتمل بين التقدير الذي تم الحصول عليه خلال العينة، والقيمة الصحيحة لقيمتها في عامة السكان.

دقة التقييم ترجع إلى طريقة حسابها وفقا لبيانات العينة وطريقة اختيار الوحدات في المجموعة الانتقائية.

تتضمن طريقة الحصول على التقديرات أي إجراءات حسابية (طريقة، قاعدة، صيغة الجبرية). هذه هي أولوية نظرية التقييم الإحصائي. تؤدي طرق الاختيار إلى تنفيذ أساليب البحث العينة.

ما سبق يسمح لنا بتحديد مفهوم "التقييم الإحصائي".

التقييم الإحصائي - هذه قيمة تقريبية للإعداد المطلوب من عامة السكان، والتي يتم الحصول عليها من خلال النتائج العينة ويوفر إمكانية اعتماد قرارات مستنيرة حول المعلمات المجهولة للسكان العامين.

لنفترض أن ^ "- التقييم الإحصائي للمعلمة غير معروف ^ التوزيع النظري. من خلال نفذت مرارا وتكرارا

تم العثور على حجم العينة من عامة السكان تقديرات و 2 ^ "ع،

وجود معاني مختلفة. لذلك، يمكن اعتبار التقدير ^ "

قيمة عشوائية، و +17 اثنين، 3 ~ "P - كقيمها المحتملة. كقيمة عشوائية، تتميز بوظيفة كثافة احتمالية معينة. لأن هذه الوظيفة ترجع إلى نتيجة ملاحظة انتقائية (تجربة)، فهي كذلك اتصل التوزيع الانتقائي. تصف هذه الوظيفة كثافة الاحتمالات لكل تقديرات باستخدام عدد محدد من الانتقائي

الملاحظات. على افتراض أن التقييم الإحصائي ^، "هي وظيفة جبرية من مجموعة معينة من البيانات وسيتم الحصول على مثل هذه المجموعة في تنفيذ الملاحظة الانتقائية، ثم في

كإعداد عام، سيتم التعبير عن النتيجة: ® n \u003d f (xl.x2، ^ 3، ... x t).

في نهاية الفحص العينة، لم تعد هذه الوظيفة تقديرا للنموذج العام، وتأخذ - قيمة محددة، وهذا هو، يصبح تقييم كمي (رقم). وبعبارة أخرى، يتبع من التعبير أعلاه أن أي من المؤشرات التي تميز نتائج الملاحظة الانتقائية يمكن اعتبارها تقييم. المتوسط \u200b\u200bالانتقائي هو تقدير من الوسط العام. تحسب على تشتت العينة أو محسوبة منه قيمة الانحراف التربيعي المتوسط \u200b\u200bهو تقديرات الخصائص المقابلة للسكان العامين، إلخ.

كما لاحظ بالفعل، فإن حساب التقييمات الإحصائية لا يضمن استبعاد الخطأ. يكمن الجوهر في حقيقة أن الأخير لا ينبغي أن يكون منهجي. يجب أن يكون وجودهم عشوائيا. النظر في الجانب المنهجي لهذا المنصب.

افترض أن التقييم ^ "يعطي قيمة غير دقيقة لتقدير عامة السكان بعيب. في هذه الحالة، ستكون كل قيمة محسوبة \u003d 1،2،3، ...، N) أقل من القيمة الصحيحة للقيمة من $.

لهذا السبب، ستكون التوقع الرياضي (متوسط \u200b\u200bقيمة) متغير عشوائي أقل مما كانت عليه، أي، (م (^ p. وعلى العكس من ذلك، إذا كان ذلك يعطي تقييما مفرطا، فإن التوقع الرياضي

عشوائي ^ "سوف تصبح أكثر من $.

ويترتب على ذلك استخدام تقدير إحصائي، لا يساوي التوقع الرياضي الذي لا يساوي المعلمة المقدرة، إلى أخطاء منهجية، أي أخطاء غير عشوائية تتطلب نتائج القياس في اتجاه واحد.

يتظاهر بالمتطلبات الطبيعية: يجب أن يكون التوقع الرياضي لتقدير ^ "" مساويا للمعلمة المقدرة. الامتثال لهذا الشرط لا يلغي الأخطاء بشكل عام، لأن القيم الانتقائية للتقييم قد تكون أكبر من أو أقل من الصالح قيمة تقدير عامة السكان. ولكن سيكون هناك أخطاء في الاتجاه الآخر من القيم ^ (وفقا لنظرية الاحتمالات) بنفس التردد. وبالتالي، ينبغي أن يكون التوقع الرياضي لتقدير العينة التوقعات يساوي المعلمة المقدرة، يلغي استلام الأخطاء المنهجية (غير عشوائية)، وهذا هو

م. (في) = 6.

اختيار التقييم الإحصائي الذي يعطي أفضل تقريب للمعلمة المقدرة هو مهمة مهمة في نظرية التقدير. إذا كان من المعروف أن توزيع المتغير العشوائي تحت السكان العام يتوافق مع قانون التوزيع الطبيعي، فإنه وفقا للبيانات الانتقائية، من الضروري تقدير التوقع الرياضي ومتوسط \u200b\u200bالانحراف التربيعي. يتم تفسيره من خلال حقيقة أن الخصائصين المذكورة تماما تحديد المؤسسات التي تم فيها بناء التوزيع الطبيعي. إذا تم توزيع القيمة العشوائية الأساسية وفقا لقانون Poisson، يتم تقييم المعلمة ^، لأنها تحدد هذا التوزيع.

تميز الإحصاءات الرياضية عن هذه الأساليب للحصول على تقديرات إحصائية وفقا لبيانات انتقائية: طريقة لحظات، الحد الأقصى لطريقة الاعتقاد.

عند استلام التقديرات من خلال طريقة اللحظات، يتم استبدال لحظات عامة السكان لحظات المجموع الانتقائي (بدلا من الاحتمالات، واستخدام الترددات الترددات).

من أجل التقييم الإحصائي لإعطاء "أفضل تقريب" للخاصية العامة، يجب أن يكون لها عدد من العقارات. سيتم مناقشتها أدناه.

إن القدرة على اختيار أفضل تقدير ترجع إلى معرفة خصائصها الأساسية والقدرة على تصنيف التقديرات حول هذه الخصائص. في الأدب الرياضي "خصائص التقديرات"، يطلق عليه أحيانا "متطلبات تقديرات" أو "معايير تقييم". في الخصائص الأساسية للتقييمات الإحصائية تشمل ما يلي: عدم التناقض والكفاءة والقدرة والكتفاء.

إذا قبلنا أن المتوسط \u200b\u200bالانتقائي (~) والتشتت الانتقائي

(ST) هي تقديرات الخصائص العامة المقابلة (^)، أي توقعاتها الرياضية، نأخذ في الاعتبار ذلك بأعداد كبيرة

يتم استدعاء وحدات أخذ العينات الخصائص (~) من قبل توقعاتها الرياضية. إذا كان عدد وحدات أخذ العينات صغيرة، فيمكن أن تختلف هذه الخصائص بشكل كبير عن التوقعات الرياضية المقابلة.

إذا كان متوسط \u200b\u200bقيمة خصائص العينة المحددة كتقدير يتوافق مع قيمة أفضل الخصائص، فإن التقييم يسمى لا يصدق. دليل على أن التوقع الرياضي في المتوسط \u200b\u200bالانتقائي يساوي الوضع العام (M (x) \u003d x)، يشير إلى أن القيمة هي ~ غير مرتبطة

وسط. خلاف ذلك هو الحال مع التشتت الانتخابي (O). ها

م (الفن 2) \u003d - O-2. وبعد

التوقع الرياضي N لا يساوي عام

تشتت. هكذا، H هو تقييم متحيز ". للقضاء على خطأ منهجي والحصول على تصنيف غير منضم، انتقائي

يتضاعف التشتت بتصحيح P - 1 (يتبع من التعليم

في 2 _ 2 ص p -1 "ص.

المعادلة أعلاه: P).

وبالتالي، مع عدد قليل من العينة، فإن التشتت يساوي:

2 TSH، - ~) 2 p هيا (س و - ~) 2

sG B. \u003d x - \u003d -.

p P - 1 ص -1.

جزء - 1) استدعاء تعديل بيسيل. وجد عالم الرياضيات بيسيل أن التشتت الانتقائي هو تقدير نازح للتشتت العامة وتطبيق التصحيح المحدد لضبط

التقييمات. بالنسبة للعينات الصغيرة، يختلف التصحيح (P - 1) بشكل كبير عن 1. بزيادة عدد وحدات المراقبة، فإنها نهج بسرعة 1. متى<> 50 الفرق بين التقديرات يختفي، وهذا هو

° ~ "-. بدون ما ورد أعلاه، تدفق التعريفات التالية لمطالبات غير القدرة.

تفهم استدعاء التقييم الإحصائي، والوسائل الرياضية التي لديها أي حجم عينة تساوي القيمة

المعلمة الإجمالية العامة، أي M (^) \u003d 9؛ م (س) \u003d س.

فئة "الانتظار الرياضي" تدرس في نظر نظرية الاحتمالات. هذه هي السمة العددية لمتغير عشوائي. يتساوى التوقع الرياضي تقريبا بمتوسط \u200b\u200bقيمة المتغير العشوائي. التوقعات الرياضية لمتغير عشوائي منفصل اتصل بمبلغ جميع القيم المحتملة لحتمته. لنفترض أنه مصنوع في الدراسات التي قيمة عشوائية حاء مقبولة W 1 أضعاف قيمة W 2 أضعاف قيمة W والأوقات قيمة X ل س مساوية

x 1 W 1 + X 2 W 2 + X 3 W 3 + ... + س إلى sh ل

سيكون متوسط \u200b\u200bحسابية هذه القيم:

X 1 W 1 + X 2 W 2 + X 3 W 3 + ... + x إلى SH TO - W 1 ^ sh 2 ^ sh 3 ^ ^ sh إلى

p أو 1 ص 2 ص 3 ص 1 ص.

منذ N - التردد النسبي ^ القيمة حاء ^ P - التردد النسبي للقيمة X 2، وما إلى ذلك، سوف تأخذ المعادلة أعلاه النموذج:

س \u003d X 1 № 1 + x 2 № 2 + × 3 № 3 + ... + x to n\u003e

مع عدد كبير من الملاحظات الانتقائية، يكون التردد النسبي مساويا لاحتمال الحدث، وهذا هو

و\u003e 1 \u003d ل؛ ^ 2 \u003d sh \u003d ™ \u200b\u200bk \u003d rk وبالتالي x 2 × 1 p 1 + x 2 p 2 + × 3 غرام. 3 + ... + x krk. ثم

x ~ م. (x) المعنى الاحتمالي نتيجة الحساب الناتجة هو أن التوقع الرياضي متساوي تقريبا (أكثر بدقة، كلما زادت هذه العينة) بمتوسط \u200b\u200bالقيم الحسابية المرصوفة بمتغير عشوائي [M (X -) \u003d ~ 1.

يضمن معيار الإعاقة عدم وجود أخطاء منهجية في تقييم معايير عامة السكان.

لاحظ أن تصنيف العينة (^) هو قيمة عشوائية، والتي يمكن أن تختلف قيمةها من عينة إلى أخرى. يميز مدى اختلافاته (التشتت) حول التوقع الرياضي لمعلمة السكان العام # تشتت St2 (^).

اسمحوا ان في وفي - - اثنين من تقديرات لا يصدق من المعلمة ^، وهذا هو م (ب. ") \u003d 6 و M (D،) \u003d ج. تشتت منهم في 1 (في -) و في G. F. -). من بين اثنين من هذه NOCs في Arto لإعطاء الأفضلية التي لها تشتت أقل حول المعلمة المقدرة. إذا تشتت التقييم ^ "تشتت أقل

تقييمات SP، ثم للتقييم ويتم قبول أولا، وهذا هو، ^ ".

تقييم دون تغيير ^، الذي يحتوي على أصغر تشتت بين جميع التقديرات الممكنة لا يصدق من المعلمة ^، محسوبة من عينات من نفس الحجم، يسمى تقييما فعالا. هذا هو العقار الثاني (المتطلبات) من التقديرات الإحصائية لمعايير عامة السكان. من الضروري أن نتذكر أن التقييم الفعال لمعلمة عامة السكان العامين لا يتزامن إلى قانون التوزيع المحدد لا يتزامن مع التقدير الفعال لمعلمة القسم الثاني.

عند النظر في عينات من حجم كبير، يجب أن يكون التقديرات الإحصائية ملكية قدرة. التقييم قادر (المصطلح "المناسب" أو "المنسق") يعني أيضا أن حجم العينة، كلما زاد احتمال أن تتجاوز خطأ التقييم مقدار إيجابي صغير

الأرقام E. التقييم 6 المعلمة ^ يسمى الأثرياء إذا تخضع لقانون الأرقام الكبيرة، أي المساواة التالية يتم تنفيذها:

/ SHG | G. ب ب. <Е} = 1.

كما نرى، قادرة على الدعوة إلى هذا التقييم الإحصائي، والذي في اقتراب P احتمال المعلمة المقدرة. بمعنى آخر، هذه القيمة للمؤشر التي تم الحصول عليها بواسطة العينة والاقتراب (يتزامن في احتمال) نتيجة لقانون الأرقام الكبيرة بزيادة حجم العينة إلى توقعها. على سبيل المثال، إذا كان التشتت لتقدير غير مستقر يسعى إلى الصفر، فإن هذا التقييم هو أيضا غني أيضا، لأنه يحتوي على أصغر تشتت ممكنا (مع حجم عينة معين).

تقديرات قادرة هي:

1) نسبة العلامة في المجموع الانتقائي، أي التردد كتقييم لبص السمة في عامة السكان؛

2) المتوسط \u200b\u200bالانتقائي كتقييم للمتوسط \u200b\u200bالعام؛

3) تشتت انتقائي كتقييم للتشتت العام؛

4) معاملات انتقائية من عدم التماثل والتجاوزات كتقييم للمعاملات العامة.

في الأدبيات على الإحصاء الرياضي، لسبب ما، ليس من الممكن دائما تحقيق وصف للخصائص الرابعة للتقديرات الإحصائية - TOOSTATE. تقييم كاف (أو شامل) هو تقييم يؤدي (يوفر) اكتمال تغطية جميع معلومات العينة حول المعلمة غير المعروفة للسكان العامين. وبالتالي، يشمل التقدير الكافي جميع المعلومات الواردة في العينة على الخصائص الإحصائية المدروسة للسكان العامين. لا يمكن لأي من التقديرات التي تم استعراضها مسبقا قيد النظر عدم توفر المعلومات الإضافية اللازمة عن المعلمة قيد الدراسة، كتقييم إحصائي كاف.

وبالتالي، فإن متوسط \u200b\u200bالانتقائي الحسابي ~ هو تقدير غير مشتمل على متوسط \u200b\u200bالحساب العام. عامل إعاقة هذا التقييم يظهر: إذا كان لدى عامة السكان عدد كبير من العينات العشوائية، ثم متوسطهم *<отличались бы от генеральной средней в большую и меньшую сторону одинаково, то есть, свойство несмещенности хорошей оценки также показывает, что среднее значение бесконечно большого числа выборочных средних равно значению генеральной средней.

في الصفوف المتماثلة من التوزيع المتوسطة، فإن التقدير المتوسط \u200b\u200bالعام هو عدواني. ووجزت أن عدد التجميع الانتقائي يقترب من الجنرال (P ~ * n)، قد يكون الوسيط في صفوف وتقييم ثريا من SEENNOI العام. كما أنه يتعلق بمعيار فعاليات الفعالية بالنسبة للموسيط متوسط \u200b\u200bالتجميع العام للحساب، يمكنك إثبات أنه في عينات خطأ متوسط \u200b\u200bحجم كبير الحجم (STME) هو 1،2533 من الخطأ المربع المتوسط \u200b\u200bللوسيط الانتقائي

). وهذا هو، STME *. لذلك، لا يمكن أن يكون الوسيط تقديرا فعالا للمجموع العام الحسابي المتوسط، حيث أن متوسط \u200b\u200bالخطأ التربيعي أكبر من متوسط \u200b\u200bالخطأ المربع في متوسط \u200b\u200bأخذ العينات الحسابية. بالإضافة إلى ذلك، يفي متوسط \u200b\u200bالحساب في ظروف الفشل والقدرة، وبالتالي هو أفضل تقييم.

هذا الإعداد ممكن. ربما يكون متوسط \u200b\u200bالعينة الحسابية لتقييم متوسط \u200b\u200bلا يصدق في مجموعات متماثلة من الإجمالي، والتي تتزامن قيم المتوسط \u200b\u200bوالموسيط؟ وهناك وسيلة انتقائية لتقييم ثري لموسطة عامة السكان؟ في كلتا الحالتين، ستكون الإجابة إيجابية. بالنسبة لموسطة الإجمالي العام (مع توزيع متماثل)، فإن متوسط \u200b\u200bالعينة الحسابية غير معاناة ومتفق عليها.

تذكر أن STME ~ 1،2533ST، نستنتج: متوسط \u200b\u200bالعينة الحسابية، وليس الوسيط، تقييم أكثر فعالية لموسطة عامة السكان قيد الدراسة.

إن كل خصائص للعينة ليست بالضرورة تقديرا أفضل للخاصية المقابلة للسكان العامين. إن معرفة خصائص التقديرات تتيح لك حل مسألة ليس فقط اختيار التقديرات، ولكن أيضا تحسيناتها. كمثال، من الممكن النظر في الحالة عندما تظهر الحسابات أن قيم الانحرافات التربيعية المتوسطة للعديد من العينات من مجموعة عامة واحدة في جميع الحالات أقل من متوسط \u200b\u200bالانحراف التربيعي للسكان العامين، وقيمة الفرق يرجع إلى حجم العينة. اضرب قيمة الانحراف التربيعي المتوسط \u200b\u200bللعينة الموجودة في معامل التصحيح، نحصل على تقدير محسن للانحراف التربيعي المتوسط \u200b\u200bللسكان العامين. لمثل هذا معامل التصحيح استخدام بيسيل تعديل

p I. p

(ص - 1)، أي، للقضاء على نزوح التقييم - 1. يظهر التعبير الرقمي أن متوسط \u200b\u200bانحراف أخذ العينات التربيعية يستخدم كتقييم، يعطي قيمة أقل من المعلمة السكانية العامة.

كما هو معروف، فإن الخصائص الإحصائية للمجموعات الانتقائية هي تقديرات تقريبية المعلمات غير المعروفة لعامة السكان. قد يكون التقييم نفسه شكل رقم واحد أو أي نقطة محددة. يسمى التقييم الذي يحدده رقم واحد نقطة. وبالتالي، متوسط \u200b\u200bانتقائي (~) هو تقدير نقطة لا يصدق وأكثر فعالية للنقطة للوسيلة العامة (X)، والتشتت الانتقائي) هو تقدير النقطة النازحة للجنرال

التشتت (). إذا قمت بتعيين خطأ متوسط \u200b\u200bالخطأ T. <> يمكن كتابة التقدير الفعلي للمتوسط \u200b\u200bالعام في شكل X ± t °. هذا يعني أن ~ - تقدير للمتوسط \u200b\u200bالعام مع وجود خطأ يساوي ". من الواضح أن التقديرات الإحصائية النقطة لا ينبغي أن يكون لها خطأ منهجي في

ooo ~~ O.<в 2

جانب المبالغة في المبالغة أو بخس المعايير المقدرة X و. كما ذكرنا سابقا، يتم استدعاء التقييمات التي تلبي الحالة

غير مستقر. ما هو الخطأ في المعلمة T "؟ هذا هو متوسط \u200b\u200bمجموعة متنوعة من الأخطاء المحددة:

إن تقدير النقطة لمعلمة عامة السكان هو أنه مع تقديرات عينة مختلفة محتملة، يتم انتخابه أولا لديه خصائص مثالية، ثم يتم احتساب قيمة هذا التقييم. تعتبر القيمة المحسوبة الناتجة لهذا الأخير أفضل تقريب إلى القيمة الحقيقية غير المعروفة لمعلمة عامة السكان. ليست حسابات إضافية مرتبطة بتعريف خطأ محتمل للتقييم إلزامية دائما (اعتمادا على تقييم العذراء العذراء)، ولكن، كقاعدة عامة، يتم تنفيذها دائما تقريبا.

النظر في أمثلة تحديد تقدير النقطة لمتوسط \u200b\u200bالميزات المدروسة وأسهمهم في عامة السكان.

مثال. أوبولس من محاصيل الحبوب من المنطقة هي 20000 هكتار. مع فحص 10٪ انتقائي للحقول، تم الحصول على هذه الخصائص الانتقائية: العائد المتوسط \u200b\u200b- 30 درجة مئوية مع I HA، تشتت العائد - 4، منطقة محاصيل المحاصيل العالية العالية - 1200 هكتار.

ما يجب أن نعرف عن حجم متوسط \u200b\u200bالعائد لمحاصيل الحبوب في المنطقة والتي هي الأهمية العددية لمؤشر الأسهم (الجاذبية المحددة) للمحاصيل العالية العالية في مجال الحبوب الإجمالية قيد الدراسة

منطقة؟ وهذا يعني أنه من الضروري تقييم المعلمات المسماة (x، د) في عامة السكان. لحساب التقديرات، لدينا:

ن \u003d 20000؛ - = 20000 × 0.1 \u003d 2000؛ ~ \u003d 30؛<т = л / 4; № 2000,

كما تعلمون، فإن متوسط \u200b\u200bالحساب الانتقائي هو تقييم فعال.

الحساب الأوسط العام. وبالتالي، يمكن أن تؤخذ ذلك

أفضل تقدير المعلمة العامة (^) هو 30. لتحديد الدرجة

دقة التقييم من الضروري إيجاد الخطأ الأوسط (المعياري):

i ل. ص ~ I. أبريل 2000 ح شركته تنوي

t \u003d L. - (1--) = - (1--) = 0,04

الخامس. ن. and2000 2000 ^.

يشير الحجم الناتج عن الخطأ إلى دقة كبيرة من التقييم. تعني قيمة T هنا أنه مع التكرار المتكرر لهذه العينات، سيكون الخطأ في تقدير المعلمة في المتوسط \u200b\u200b0.04. هذا هو النقطة

التقييم، سيكون متوسط \u200b\u200bالعائد في مزارع المنطقة X \u003d 30 - 0.04 ج مع أنا ها.

من أجل الحصول على تقدير نقطة لمؤشر أسهم المحاصيل ذات العوائد العالية من الحبوب في إجمالي مساحة الحبوب للحصول على أفضل تقييم، قد تؤخذ جزء صغير من حصة في العينة \u003d 0.6. وبالتالي، يمكن القول أنه وفقا لنتائج الملاحظات، فإن أفضل تقدير للمؤشر المرغوب للهيكل سيكون عدد 0.6. من خلال تحديد الحسابات، يجب عليك حساب خطأ متوسط \u200b\u200bهذا التصنيف: T. و (1 _ n) و 0.6 (1 - 0.B) (1 \u003d 0.01

الخامس. p ن الخامس 2000 2000 لكن

كما نرى، فإن متوسط \u200b\u200bتقدير الخطأ تقدير 0.01.

النتيجة التي تم الحصول عليها تعني أنه إذا تكررت لتكرار العينة بحجم 2000 هكتار من الحبوب، فإن متوسط \u200b\u200bالخطأ في التقييم المعتمد للسهم (جاذبية محددة) للمحاصيل عالية الغلة في مجال محاصيل الحبوب ستكون شركات المنطقة ± 0.01. في هذه الحالة، P \u003d 0.6 ± 0.01. عند النسبة المئوية، ستكون نسبة المحاصيل العالية العالية في مجال إجمالي مساحة الحبوب في المتوسط \u200b\u200b60 ± I.

تظهر الحسابات أنه بالنسبة لحالة محددة، فإن أعلى تقدير للمؤشر المرغوب في الهيكل سيكون عدد 0.6، وسيكون متوسط \u200b\u200bالخطأ في التقدير في اتجاه واحد أو آخر يساوي تقريبا 0.01. كما ترون، فإن التقييم دقيق للغاية.

من المعروف أن عدة طرق لتقدير النقطة المتوسطة الانحراف التربيعي معروفة في الحالات التي تم فيها تنفيذ العينة من عامة السكان من الوحدات ذات التوزيع العادي والمعلمة إلى غير معروفة. بسيطة (الأسهل في الحسابات) تقدير هو نطاق الاختلاف (و °) من العينة، مضروبة في عامل التصحيح، المتخذة وفقا للجدول القياسية والذي يعتمد على حجم العينة (للعينات الصغيرة). يمكن تقدير متوسط \u200b\u200bمعلمة الانحراف التربيعي في عامة السكان باستخدام التشتت الانتقائي المحسوب، مع مراعاة عدد درجات الحرية. يمنح مربع الجذر من هذا التشتت القيمة التي سيتم استخدامها كتقييم للانحراف المتوسط \u200b\u200bالمربع العام).

استخدام قيمة المعلمة في "حساب متوسط \u200b\u200bالخطأ لتقدير طريقة الوسيلة العامة (X") التي تمت مناقشتها أعلاه.

كما ذكرنا سابقا، وفقا لمتطلبات قدرة الثقة في دقة واحدة أو زيادة تقييم النقطة مع زيادة في حجم العينة. إظهار هذا الموقف النظري على مثال تقدير النقطة أمر صعب إلى حد ما. تأثير أخذ العينات على دقة التقييم واضح عند حساب التقديرات الفاصلة. سيتم مناقشتها أدناه.

يوضح الجدول 39 تقديرات النقاط الأكثر استخداما لمعايير عامة السكان.

الجدول 39.

تقديرات النقاط الأساسية _

قد تكون قيم التقديرات المحسوبة بطرق مختلفة غير متكافئة في الحجم. في هذا الصدد، في الحسابات العملية، يجب أن تشارك في حساب ثابت للخيارات المحتملة، ولكن بناء على خصائص التقديرات المختلفة، اختر أحدهم.

مع وجود عدد صغير من وحدات المراقبة، فإن تقدير النقطة هي إلى حد كبير بالصدفة، لذلك، موثوقة بقليل. لذلك، في عينات صغيرة، قد تكون مختلفة تماما عن الخصائص المقدرة للسكان العامين. يؤدي هذا الوضع إلى أخطاء صعبة في الاستنتاجات التي تنطبق على عامة السكان وفقا لنتائج العينة. لهذا السبب، مع عينات من حجم صغير، استخدم تقديرات الفاصل الزمني.

على النقيض من ذلك، فإن تقدير الفاصل الزمني يعطي مجموعة من النقاط التي يجب أن تكون المعلمة السكانية العامة. بالإضافة إلى ذلك، يشار إلى الاحتمال في التقييم الفاصل، وبالتالي، من المهم في التحليل الإحصائي.

يطلق عليه الفاصل التقدير الذي يتميز بأرقام - حدود الفاصل الزمني الذي يغطي (يغطي) المعلمة المقدرة. مثل هذا التقييم هو بعض الفاصل الزمني، حيث احتمال معين هو المعلمة المرغوبة. يتم استلام مركز الفاصل الزمني من خلال تقدير نقطة انتقائية.

وبالتالي، فإن التقديرات الفاصلة هي مزيد من التطوير لتقدير النقطة، عندما يكون هذا التقييم في حجم عينة صغير غير فعال.

يمكن صياغة مهمة التقدير الفاصل بشكل عام على النحو التالي: وفقا لملاحظة انتقائية، فمن الضروري بناء فاصل رقمي، فيما يتعلق بالمستوى المحدد سابقا من الاحتمال يمكن القول أنه ضمن هذا الفاصل هو معلمة تقديرية.

إذا كنت تأخذ عددا كبيرا كبيرا من وحدات أخذ العينات، فعندئذ، فإن استخدام نظرية Lyapunov، يمكنك إثبات احتمال عدم تجاوز خطأ أخذ العينات بعض القيمة المعطاة A، أي

و ~ "*!" و أو "G. يا.

على وجه الخصوص، هذا نظرية يجعل من الممكن تقييم أخطاء المساواة التقريبية:

- "ص (ص و - تردد) x "x. ن

إذا ^ * 2xz ...، X - ~ متغيرات عشوائية مستقلة و N، ثم احتمال متوسطها (X) في النطاق من A إلى 6 ويمكن تحديده بواسطة المعادلات:

ص (أ.(حاء (ه) 1 ه 2. هؤلاء

_لكن - السابق)؛ _ v - e (x) de ° أ

استدعاء احتمالية P في نفس الوقت احتمال موثوق به.

وبالتالي، فإن احتمال الثقة (الموثوقية) من تقدير المعلمة العامة بشأن التقييم الانتقائي يسمى الاحتمال الذي يتم فيه تنفيذ عدم المساواة:

| ~ حاء | <а; | и, ориентир | <д

حيث يوجد خطأ في التقدير، وفقا للمتوسط \u200b\u200bوالمشاركة.

الحدود التي يمكن أن تكون فيها هذا الاحتمالية هي السمة العامة، وتسمى فترات سرية (حدود الثقة). ومسمى حدود هذا الفاصل حدود الثقة.

الثقة (أو المتسامح) الحدود هي حدود، والإخراج الذي يتجاوزه هذه السمة بسبب التذبذبات العشوائية لديه احتمال طفيف (L ^ 0.5؛ P 2<0,01; Л <0,001). Понятие "доверительный интервал" введено Дж.Нейман и К.Пирсоном (1950 г.). Это установленный по выборочным данным интервал, который с заданной вероятностью (доверительной вероятностью) охватывает (покрывает) настоящее, но неизвестно для нас значение параметра. Если уровня доверительной вероятности принять значения 0,95, то эта вероятность свидетельствует о том, что при частых приложениях данного способа (метода) вычислений доверительный интервал примерно в 95% случаев будет покрывать параметр. Доверительный интервал генеральной средней и генеральной доли определяется на основе приведенных выше неравенств, из которых

يتبع ذلك ~ _a - x - ~ + A؛ № _a - g. - № + A.

في الإحصاءات الرياضية، يتم تقدير موثوقية واحدة أو معلمة أخرى بقيمة مستويات الاحتمالات الثلاثة التالية (تسمى أحيانا "عتبات الاحتمالات"): L \u003d 0.95؛ ^ 2 \u003d 0.99؛ ص 3 \u003d 0.9999. الاحتمالات التي تم حلها للإهمال، هذا هو، لكن 1 = 0.05 ؛؛ 2 \u003d 0.01؛ "3 \u003d 0.001 يسمى مستويات الأهمية، أو مستويات المادية. من المستويات المذكورة أعلاه، تستغرق استنتاجات موثوقة احتمالية P 3 \u003d 0.9999. يتوافق كل مستوى من مستوى احتمال الثقة بقيمة معينة من الانحراف الطبيعي (انظر الجدول 27). إذا لم تكن هناك قيم فاصل احتمالية قياسية تحت تصرف الجداول القياسية، فيمكن حساب هذا الاحتمال بدرجة معينة من التقريب من خلال الصيغة:

ص (<) = - = ^ = 1 ه "~ عشر و.

في الشكل 11، هذه الأجزاء من المساحة الإجمالية التي يحدها منحنى عادي ومحور ABSCISSA تتوافق مع القيمة مظللة <= ± 1؛<= ± 2; <= и 3 и для которых вероятности равны 0,6287, 0,9545; 0,9973. При точечном оценке рассчитывается, как уже известно, средняя ошибка выборки, при интервальном - предельная.

اعتمادا على مبادئ اختيار الوحدات (المتكررة أو بدون تكرار)، والصيغ الهيكلية لحساب أخطاء أخذ العينات

تختلف في حجم التعديل (ن).

تين. 11. منحنى التوزيع الطبيعي للاحتمالات

يوضح الجدول 40 صيغ حسابية أخطاء تقديرات المعلمة العامة.

النظر في حالة محددة من التقييم الفاصل لمعلمات عامة السكان وفقا لبيانات المراقبة الانتقائية.

مثال. في الاستطلاع العينة لمزارع المنطقة، وجد أن متوسط \u200b\u200bالمسحوق اليومي للأبقار (X) هو 10 كجم. نسبة الماشية الأصيلة في إجمالي عدد الثروة الحيوانية هي 80٪. خطأ أخذ العينات مع احتمال الثقة P \u003d 0.954 كان يساوي 0.2 كجم؛ بالنسبة للماشية الأصيلة الخاصة 1٪.

وبالتالي، فإن الحدود التي يمكن أن يكون فيها المتوسط \u200b\u200bالعام

الأداء، سيكون 9.8<х <10,2; для генеральной доли скота -79 <Р <81.

الخلاصة: مع احتمال 0.954، يمكن القول بأن الفرق بين متوسط \u200b\u200bإنتاجية الأبقار الإنتاجية والإنتاجية العامة هو 0.2 كجم. متوسط \u200b\u200bالحد اليومي هو 9.8 و 10.2 كجم. يتم تتراوح السهم (الوزن المحدد) من الماشية الأصيلة في مؤسسات المنطقة من 79 إلى 81٪، لا يتجاوز خطأ التقدير 1٪.

الجدول 40.

حساب أخطاء أخذ العينات الفاصل

عند تنظيم عينة، من المهم تحديد الرقم الضروري (P). هذا الأخير يعتمد على اختلاف المجموع الموحد. كلما زاد الأخشيشات، كلما يجب أن يكون عدد العينات. ردود الفعل بين عدد أخذ العينات وخطأ الحد. تتطلب الرغبة في الحصول على خطأ أصغر زيادة في عدد المجموعات الانتقائية.

يتم تحديد العدد المطلوب من العينات على أساس الصيغ لخطأ التحديد (D) مع مستوى احتمال محدد (P). يتم الحصول على التحولات الرياضية الصيغ لحساب حجم العينة (الجدول 41).

الجدول 41.

حساب العدد المطلوب من أخذ العينات _

تجدر الإشارة إلى أن جميع التقييمات الإحصائية تستند إلى افتراض أن المجموعة الانتقائية التي يتم استخدامها في التقييم تم الحصول عليها باستخدام الطريقة (الطريقة) من الاختيار، والتي تضمن احتمالات العينة.

في الوقت نفسه، اختيار احتمال التقييم الثقة، يجب أن يسترشد بمبدأ أن اختيار مستواه ليس مهام رياضية، ولكن يتم تحديده من قبل المشكلة حلها خصيصا. في تأكيد، النظر في المثال.

مثال. لنفترض، عند شركتين، احتمال إنتاج المنتجات النهائية (عالية الجودة) يساوي p \u003d 0.9999، أي، احتمال الحصول على زواج المنتجات سيكون \u003d 0.001. هل من الممكن في إطار الاعتبارات الرياضية، غير مهتم بطبيعة المنتج، لحل مسألة ما إذا كان عدم وجود A \u003d 0.001 لديه احتمال كبير. لنفترض أن مؤسسة واحدة تنتج بذارة، والثاني هو الطائرات لعلاج المحاصيل. إذا حدث عيب واحد على 1000 بذارة، فيمكنك طرحها، لأن الصهر 0.1٪ من البذور أرخص من إعادة بناء العملية التكنولوجية. إذا كان أحدهما معيبا، فسيؤدي ذلك بالتأكيد إلى عواقب وخيمة أثناء تشغيله. لذلك، في الحالة الأولى، احتمال الحصول على الزواج لكن = 0.001 يمكن قبولها في الحالة الثانية - لا. لهذا السبب، ينبغي إجراء اختيار احتمال موثوق به في الحسابات بشكل عام وعند حساب التقديرات، على وجه الخصوص، على أساس الشروط المحددة للمشكلة.

اعتمادا على مهام الدراسة، قد يكون من الضروري حساب حدود واحد أو اثنين من ثقة. إذا كانت ميزات مشكلة حل المحال تتطلب واحدة فقط من الحدود، الجزء العلوي أو السفلي، يمكنك التأكد من أن الاحتمال الذي يتم تعيين هذه الحدود سيكون أعلى من عند تحديد حدود كلا الحدودين لنفس قيمة معامل الثقة 1

دع حدود الثقة مثبتة باحتمال P \u003d 0.95، أي

في 95٪ من الحالات، لن تكون الثانوية العامة (X) أقل من أقل

فاصل السرية X ™ - X "م وليس المزيد من الثقة العليا

الفاصل النحاسي هو \u003d X + في هذه الحالة، فقط مع احتمال \u003d 0.05 (أو 5٪)، يجوز للمتوسط \u200b\u200bالعام الخروج من الحدود المحددة. منذ توزيع X متماثل، ثم نصف هذا المستوى

الاحتمالات، وهذا هو، 2.5٪ سيكون في حالة حدوث × (x ™ هو الشوط الثاني - في حالة، س ^ × "^ -. من هذا، يتبع ذلك الاحتمال الذي يمكن أن يكون متوسط \u200b\u200bالعام أقل من أعلى قيمة

الحدود الثقة للإعلانات التجارية "- تساوي 0.975 (أي، 0.95 +0.025). لذلك، يتم إنشاء الشروط عندما نهمل مع حدود اثنين من الثقة

المعنى X أقل من x "" *. وكبير أو هير. يتصل

حدود ثقة واحدة فقط، على سبيل المثال، نحن نهمل فقط أولئك ~ تجاوزوا هذه الحدود. لنفس قيمة معامل الثقة X، فإن مستوى الأهمية وهنا يتحول إلى مرتين أقل.

إذا تم حساب علامة فقط التي تتجاوز

(أو العكس بالعكس لا يتجاوز) قيم المعلمة المرغوبة X، ويطلق على فاصل الثقة من جانب واحد. إذا كانت القيم قيد النظر محدودة على الجانبين، فإن فترة الثقة تسمى الثنائية. من ما سبق، يتبع أن الفرضيات وعدد من المعايير، لا سيما معيار الطالب X، ينبغي اعتبارها من جانب واحد وثنيون. لذلك، مع فرضية ثنائية، ستكون مستوى الأهمية لنفس قيمة X ضعف حجمها. إذا كنا نريد مغادرة نفس المستوى من الأهمية (ومستوى احتمال الثقة)، كما هو الحال مع فرضية على الوجهين، ثم يجب أن تؤخذ قيمة x أقل. تؤخذ هذه الميزة في الاعتبار في تجميع الجداول القياسية للمعايير X-Student (الملحق 1).

ومن المعروف أنه من الجانب العملي، فمن الأهمية بمكان ليس الكثير من فترات الثقة ذات القيمة المحتملة للمتوسط \u200b\u200bالعام، كم عدد القيم القصوى والحد الأدنى منها، أكثر أو أقل من احتمال معين (موثوق به) ، لا يمكن. في الإحصاءات الرياضية، يطلق عليها الحد الأقصى المضمون ومضمون الحد الأدنى المتوسط. وصف هذه المعلمات

وفقا لذلك، من خلال و X ™، يمكنك الكتابة: HS ™ \u003d X +؛ أعلى \u003d x ~.

عند حساب قيم الحد الأقصى والحد الأدنى للمضمون، كما حدود الفاصل الزمني للثقة من جانب واحد في الصيغ المذكورة أعلاه، القيمة 1 يأخذ كمعيار من جانب واحد.

مثال. في 20 قسم، تم تثبيت متوسط \u200b\u200bالعائد من بنجر السكر 300 ن / هكتار. هذا المتوسط \u200b\u200bالانتقائي يميز المقابلة

معلمة السكان العامين (X) مع خطأ من 10 ن / هكتار. وفقا لانتقائية التقديرات، يمكن أن يكون متوسط \u200b\u200bالعائد العام أكثر وأقل متوسط \u200b\u200bانتقائي X \u003d 300. مع احتمال P \u003d 0.95، يمكن القول بأن المعلمة المرغوبة لن تكون أكثر من الأحوال HS "\u003d 300 +1.73 X10 \u003d 317.3 ج / هكتار.

يتم اتخاذ قيمة 1 لعدد درجات الحرية ^ \u003d 20-1 مع منطقة حرجة من جانب واحد ومستوى الأهمية لكن = 0.05 (الملحق 1). لذلك، مع احتمال P \u003d 0.95، يقدر الحد الأقصى للمستوى المحتمل للمتوسط \u200b\u200bالعام في 317 ن / هكتار، وهذا هو، في ظل ظروف مواتية، لا يتجاوز متوسط \u200b\u200bالعائد من بنجر السكر القيمة المحددة.

في بعض فروع المعرفة (على سبيل المثال، في العلوم الطبيعية)، فإن نظرية التقييم أدنى من نظرية التحقق من الفرضيات الإحصائية. في العلوم الاقتصادية، تلعب أساليب التقييم الإحصائية دورا مهما للغاية في التحقق من موثوقية نتائج البحوث، وكذلك في أنواع مختلفة من الحسابات العملية. بادئ ذي بدء، يتعلق الأمر باستخدام تقييم النقاط للمجاميع الإحصائية المدروسة. يمكن أن يكون الاختيار تقييم أفضل - المشكلة الرئيسية لتقدير النقطة. إن إمكانية هذا الاختيار يرجع إلى معرفة الخصائص الأساسية (المتطلبات) من التقييمات الإحصائية.

) مهام الإحصاءات الرياضية.

لنفترض أن هناك عائلة حديثة من توزيعات الاحتمالات (للبساطة، ونحن نعتبر توزيع المتغيرات العشوائية وحالة معلمة واحدة). فيما يلي معلمة رقمية، قيمةها غير معروفة. يطلب من ذلك تقديره وفقا للعينة الحالية من القيم الناتجة عن هذا التوزيع.

التمييز بين النوعين الرئيسيين من التصنيفات: تقديرات نقطة و فترات الثقة.

تقدير بقعة

يعد تقدير النقطة شكلا من أشكال التقدير الإحصائي الذي يقترب قيمة قيمة المعلمة غير معروفة من رقم منفصل. وهذا هو، يجب عليك تحديد الوظيفة من العينة (الإحصاءات)

,

سيتم اعتبار القيمة التي سيتم اعتبارها تقريبية لقيمة حقيقية غير معروفة.

تشمل الطرق العامة لتقديرات نقاط البناء ما يلي: طريقة الحد الأقصى للحقيقة، طريقة اللحظات، طريقة الكم.

فيما يلي بعض الخصائص التي قد تكون لديها تقديرات نقطة أو لا تملكها.

ثروة

تتمثل إحدى متطلبات تقييم النقاط الأكثر وضوحا في توقع تقريب جيد بما فيه الكفاية بالقيمة الحقيقية للمعلمة بقيم كبيرة بما فيه الكفاية لحجم أخذ العينات. هذا يعني أن التقييم يجب أن يتلقا نحو المعنى الحقيقي. هذه هي خاصية التقييم وتسميتها ثروةوبعد نظرا لأننا نتحدث عن كميات عشوائية تتوفر أنواع مختلفة من التقارب، فيمكن صياغة هذه الخاصية بدقة بطرق مختلفة:

عند استخدام مصطلح ثروة، عادة ما يشير إلى الجدوى الضعيفة، أي تقارب الاحتمالات.

حالة الاتساق إلزامية عمليا لجميع التقييمات المستخدمة في الممارسة العملية. يتم استخدام التقييمات المعسرة للغاية.

الحصانة والفشل المقارب

يسمى تصنيف المعلمة تفهمإذا كان التوقع الرياضي يساوي القيمة الحقيقية للمعلمة المقدرة:

.

حالة أضعف هو فشل مقاربمما يعني أن التوقع الرياضي للتقييم يتقارن إلى القيمة الحقيقية للمعلمة مع أخذ العينات المتزايدة:

.

الإعاقة هي الممتلكات الموصى بها للتقديرات. ومع ذلك، لا ينبغي المبالغة في تقديرها من أهميتها. في أغلب الأحيان، توجد تقديرات غير مثبتة للمعلمات ثم حاول مراعاةها فقط. ومع ذلك، قد تكون هناك مثل هذه المهام الإحصائية التي لا توجد تقييمات غير مفيدة. المثال الأكثر شهرة هو ما يلي: النظر في توزيع POISSON مع المعلمة وتسليم مهمة تقدير المعلمة. يمكن إثبات أنه لا يوجد تقييم غير مستقر لهذه المهمة.

مقارنة التقديرات والكفاءة

للمقارنة بين تقديرات مختلفة من نفس المعلمة، يتم استخدام الطريقة التالية: اختر بعض وظيفة المخاطرمما يقيس انحراف التقدير من القيمة الحقيقية للمعلمة، وأفضل النظر في تلك التي تأخذ هذه الوظيفة قيمة أصغر.

في معظم الأحيان، تعتبر التوقع الرياضي لساحة انحرافات التقييم من المعنى الحقيقي وظيفة مخاطرة.

بالنسبة للتقديرات غير ذات الصلة، فهو مجرد تشتت.

هناك حد أدنى على وظيفة المخاطرة هذه عدم المساواة في كرامر راو.

(غير إكمال) تقديرات التي يتحقق بها هذا الحد الأدنى (أي أن وجود الحد الأدنى من التشتت الممكن) فعالوبعد ومع ذلك، فإن وجود تقييم فعال هو شرط قوي إلى حد ما للمهمة البعيدة عنها دائما.

الشرط أضعف الكفاءة مقاربمما يعني أن نسبة تشتت التقدير غير المشمول للحد الأدنى ل Kramera-Rao يميل إلى وحدة في.

لاحظ أنه مع افتراضات واسعة بما فيه الكفاية حول التوزيع قيد الدراسة، فإن الحد الأقصى لطريقة الصدق تعطي تقديرا فعالا غير متزعجا للمعلمة، وإذا كان هناك تقييم فعال - ثم يعطي تقييما فعالا.

إحصائيات كافية

يتم تسمية الإحصاءات كاف للحصول على معلمة، إذا تم تزويد التوزيع الشرطي للعينة بأنه لا يعتمد على المعلمة للجميع.

تتم تحديد أهمية مفهوم الإحصاءات الكافية من قبل ما يلي موافقةوبعد إذا كانت هناك إحصاءات كافية، فهي تقييما لا أساس لها من المعلمة، فإن التوقعات الرياضية الشرطية هي أيضا تقدير لا يصدق من المعلمة، وتشتيتها أقل أو تساوي تشتت التقييم الأولي.

أذكر أن التوقعات الرياضية الشرطية هي قيمة عشوائية هي وظيفة من. وهكذا، في فئة التقديرات غير المرتبطة، يكفي النظر في تلك الوظائف فقط من الإحصاءات الكافية (شريطة أن تكون هناك مهمة).

(لا يصدق) تقدير المعلمة الفعال فعالة هو دائما إحصاءات كافية.

يمكن القول أن الإحصاءات الكافية تحتوي على جميع المعلومات حول المعلمة المقدرة، والتي تحتوي على العينة.

التقديرات الإحصائية لمعايير عامة السكان. الفرضية الإحصائية

محاضرة 16.

دعها تأخذ لاستكشاف العلامة الكمية للسكان العامين. لنفترض أنه من الاعتبارات النظرية كان من الممكن تأسيس التوزيع هو علامة. من هنا، هناك مهمة تقدير المعلمات التي تحدد هذا التوزيع. على سبيل المثال، إذا كان من المعروف أنه يتم توزيع الإشارة المدروسة في عامة السكان وفقا للقانون الطبيعي، فمن الضروري تقييم التوقع الرياضي (وجدت تقريبا) والانحراف المعياري، لأن هاتين المعلمين يحددان تماما التوزيع الطبيعي. إذا كان هناك سبب للاعتقاد بأن الإشارة لديها توزيع Poisson، فمن الضروري تقدير المعلمة التي يتم تحديد هذا التوزيع.

عادة، في التوزيع، يحتوي الباحث فقط على بيانات أخذ العينات، على سبيل المثال، قيم الميزة الكمية التي تم الحصول عليها نتيجة الملاحظات (هنا ثم يتم افتراض الملاحظات مستقلة). من خلال هذه البيانات والتعبير عن المعلمة المقدرة.

النظر في كيفية قيم المتغيرات العشوائية المستقلة ، يمكن القول أنه من الممكن العثور على تقدير إحصائي لمعلمة غير معروفة وسيلة التوزيع النظري للعثور على وظيفة من المتغيرات العشوائية الملحوظة، والتي تعطي قيمة تقريبية للمعلمة المقدرة. على سبيل المثال، كما سيتضح أدناه، يتم استخدام وظيفة لتقييم التوقع الرياضي للتوزيع العادي (متوسط \u200b\u200bقيم علامة الحسابية الملحومة):

.

وبالتالي، التقييم الإحصائي تسمى المعلمة غير المعروفة للتوزيع النظري الوظيفة من المتغيرات العشوائية الملاحظة. يتم استدعاء التقييم الإحصائي لمعلمة غير معروفة للسكان العام المسجل من رقم واحد نصف غالونوبعد النظر في تقديرات النقطة التالية: النازحين وغير المستقرة والكفاءة والأثرياء.

من أجل التقديرات الإحصائية لإعطاء تقريبية "جيدة" للمعايير المقدرة، يجب أن تلبي متطلبات معينة. نحدد هذه المتطلبات.

فليكن هناك تقييم إحصائي لمعلمة غير معروفة للتوزيع النظري. لنفترض أنه عندما يتم أخذ عينات الصوت، تم العثور على تقييم. نكرر التجربة، أي استخراج من عامة السكان عينة أخرى من نفس الحجم وبياناتها ستجد تقييما، إلخ. تجربة تكرار مرارا وتكرارا، نحصل على الرقم التي، بشكل عام، سوف تختلف فيما بينها. وبالتالي، يمكن اعتبار التقدير كمبلغ عشوائي، و - قدر الإمكان قيمها.

من الواضح أنه إذا كان التقدير يعطي قيمة تقريبية مع فائض، فإن كل رقم موجود وفقا لبيانات العينة سيكون أكثر صحة. لذلك، في هذه الحالة، ستكون القيمة الرياضية (القيمة المتوسطة) للمتغير العشوائي أكبر من ذلك. من الواضح، إذا كان يعطي قيمة تقريبية مع العيب، إذن.


لذلك، يؤدي استخدام التقييم الإحصائي، والتوقعات الرياضية التي لا تساوي المعلمة المقدرة، إلى أخطاء منهجية (علامة واحدة). لهذا السبب، من الطبيعي أن تتطلب التوقع الرياضي للتقييم مساويا للمعلمة. على الرغم من أن الالتزام بهذا الشرط، بشكل عام، لن يلغي الأخطاء (بعض القيم أكثر، في حين أن البعض الآخر أقل من)، سيتم استيفاء أخطاء الأحرف المختلفة بقدر ما في كثير من الأحيان. ومع ذلك، فإن الامتثال للمتطلبات يضمن استحالة الحصول على أخطاء منهجية، وهذا هو، يلغي الأخطاء المنهجية.

تفهم استدعاء التقييم الإحصائي (خطأ)، والتوقعات الرياضية التي تساوي المعلمة المقدرة مع أي حجم للعينة، وهذا هو.

تحول اتصل بتقييم إحصائي، والتوقعات الرياضية التي لا تساوي المعلمة المقدرة في أي حجم عينة، وهذا هو.

ومع ذلك، سيكون من الخاطئا أن نفترض أن تقدير لا يصدق يعطي دائما تقريبا جيدا للمعلمة المقدرة. في الواقع، يمكن أن تكون القيم المحتملة مبعثرة بشدة حول متوسط \u200b\u200bقدرتها، وهذا هو، قد يكون التشتت كبيرا. في هذه الحالة، يتم العثور على التقييم وفقا لنفس العينة، على سبيل المثال، قد يكون بعيد المنال من القيمة المتوسطة، مما يعني أن أكثر المعلمة تقديرية. وبالتالي، قبول كقيمة تقريبية، وسوف نعترف خطأ كبير. إذا كنت بحاجة إلى أن تكون التشتت صغيرة، فسيتم استبعاد القدرة على السماح بخطأ كبير. لهذا السبب، فإن التقييم الإحصائي يجعل متطلبات الفعالية.

فعال يسمونه تقييم إحصائي، والتي (مع حجم عينة معينة) لديه أصغر تشتت ممكن.

الأثرياء يتصلون بتقييم إحصائي، وهو، عندما تسعى جاهدة من أجل احتمال المعلمة المقدرة، أي المساواة صحيحة:

.

على سبيل المثال، إذا كان التشتت لتقدير غير مستقر يسعى إلى الصفر، فإن مثل هذا التقييم هو أيضا ثريا.

النظر في مسألة الخصائص الانتقائية هي الأفضل بمعنى التناقض، والكفاءة والاتساق تقييم الثانوي العام والتشتت.

دع المرتفعة العامة المحددة بالنسبة إلى أساس كمي معين.

العام الأوسط ويطلق عليه متوسط \u200b\u200bالقيم الحسابية لعلامة عامة السكان. يتم حسابها من قبل الصيغة:

§ - إذا كانت جميع قيم علامة السكان العامين مختلفة مختلفة؛

§ - إذا كانت قيم علامة عامة السكان على التكرار على التوالي، و. وهذا يعني أن المتوسط \u200b\u200bالعام هو متوسط \u200b\u200bالقيم المرجحة لخاصية الأوزان يساوي الترددات المقابلة.

تعليق: افترض السماح للمجموعة العامة من وحدة التخزين تحتوي على كائنات ذات قيم مختلفة للميزة. تخيل أنه يتم استخراج كائن واحد من هذا المجموع. احتمال استخلاص كائن به علامة على ميزة، على سبيل المثال، مساويا بوضوح. مع نفس الاحتمال، يمكن استرجاع أي كائن آخر. وبالتالي، يمكن اعتبار قيمة الشخصية بمبلغ عشوائي، والقيم المحتملة لها نفس الاحتمالات تساوي. ليس من الصعب، في هذه الحالة، ابحث عن توقع رياضي:

لذلك، إذا اعتبرنا علامة الاستطلاع على عامة السكان كقيمة عشوائية، فإن التوقع الرياضي للمثيرة يساوي منتصف الميزة العامة لهذه الميزة :. تلقينا هذا الاستنتاج، معتقدين أن جميع الأشياء العامة للسكان لديها علامات مختلفة. سيتم الحصول على نفس النتيجة، إذا افترضنا أن المجموعة العامة تحتوي على العديد من الكائنات بنفس العلامة.

لخص النتيجة الناتجة عن التركيبة العامة مع التوزيع المستمر للقيمة، نحدد المعدل العام كميزة انتظار رياضي: .

افترض أن تدرس المجموعة العامة المتعلقة بالميزة الكمي، يتم استرداد عينة من وحدة التخزين.

متوسط \u200b\u200bانتقائي اتصل بمتوسط \u200b\u200bالقيم الحسابية لعلامة مجموعة العينة. يتم حسابها من قبل الصيغة:

§ - إذا كانت جميع قيم المجموعة المميزة من وحدة التخزين مختلفة؛

§ - إذا كانت قيم خصائص مجموعة العينة هي ترددات على التوالي، و. وهذا هو، المتوسط \u200b\u200bالانتقائي هو متوسط \u200b\u200bالقيم المرجحة للميزة ذات الأوزان تساوي الترددات المقابلة.

تعليق: متوسط \u200b\u200bانتقائي موجود وفقا لعينة واحدة من الواضح أن عدد معين. إذا قمت باستخراج عينات أخرى من نفس الحجم من نفس المجموع العام، فإن المتوسط \u200b\u200bالانتقائي سيتغير من عينة عينة. وبالتالي، يمكن اعتبار المتوسط \u200b\u200bالانتقائي مبلغا عشوائيا، وبالتالي يمكننا التحدث عن التوزيعات (النظري والنظري التجريبي) والخصائص العددية لهذا التوزيع، على وجه الخصوص، حول توقعات curiac وتشتت توزيع العينة وبعد

علاوة على ذلك، إذا كان الجنرال غير معروف غير معروف، فمن الضروري تقييمه وفقا لبيانات العينة، ثم كتقييم للأوسط العام، يتم اتخاذ المتوسط \u200b\u200bالانتقائي كتقييم غير مستقر وأثرياء (نقدم هذا البيان لإثبات نفسك ). يتبعه من أعلاه أنه إذا كان هناك عدد كبير بما فيه الكفاية، فسيتم العثور على متوسط \u200b\u200bعدد كبير من السكان العامين، وسيتم العثور على المتوسطات الانتقائية، فسيكونون تقريبا مساويا لبعضهم البعض. هذا يتكون من عقار. استدامة عينة متوسطة.

تجدر الإشارة إلى أنه إذا كان تشتت مجموعتين هو نفسه، فإن قرب الوسط العينة إلى الجنرال لا يعتمد على نسبة حجم العينة إلى حجم السكان العامين. يعتمد ذلك على حجم العينة: حجم العينة أكثر، وهو متوسط \u200b\u200bأقل انتقائية يختلف عن عام. على سبيل المثال، إذا تم تحديد 1٪ من الكائنات من مجموعة واحدة، وتم تحديد 4٪ من الكائنات من مجموعة أخرى، فقد تحول حجم العينة الأولى إلى أن تكون كبيرة من الثانية، ثم ستتختلف متوسط \u200b\u200bالانتقائي الأول أقل من المتوسط \u200b\u200bالعام المقابل من الثانية.