ما يعطي الثقة الفاصل. طرق التحليل الكمي: تقدير فترات الثقة

دعونا نبني فاصل ثقة في MS EXCEL لتقدير القيمة المتوسطة للتوزيع في الحالة قيمة معروفةتشتت.

بالطبع الاختيار مستوى الثقةيعتمد كليا على المهمة في متناول اليد. وبالتالي ، فإن درجة ثقة الراكب الجوي في موثوقية الطائرة ، بالطبع ، يجب أن تكون أعلى من درجة ثقة المشتري في موثوقية المصباح الكهربائي.

صياغة المهام

لنفترض أن من عدد السكانبعد اتخاذها عينةحجم يفترض أن الانحراف المعياريهذا التوزيع معروف. ضروري على أساس هذا عيناتتقييم المجهول يعني التوزيع(μ،) وبناء المقابل ثنائي فاصل الثقة.

تقدير النقطة

كما هو معروف من الإحصاء(دعنا نسميها X cf) هو تقدير غير متحيز للمتوسطهذه عدد السكانوله التوزيع N (μ ؛ σ 2 / ن).

ملحوظة: ماذا لو كنت بحاجة للبناء فاصل الثقةفي حالة التوزيع ، والتي ليس عادي؟في هذه الحالة ، يأتي الإنقاذ الذي يقول ذلك بما يكفي حجم كبير عيناتن من التوزيع عدم- عادي, توزيع أخذ العينات من الإحصاءات Х avإرادة تقريباتطابق التوزيع الطبيعيمع المعلمات N (μ ؛ σ 2 / ن).

وبالتالي، تقدير النقطة وسط قيم التوزيعلدينا هو متوسط ​​العينة، بمعنى آخر. X cf. الآن دعونا ننشغل فاصل الثقة.

بناء فاصل الثقة

عادة ، بمعرفة التوزيع ومعلماته ، يمكننا حساب احتمال أن يأخذ المتغير العشوائي قيمة من فترة زمنية معينة. والآن لنفعل العكس: أوجد الفترة التي يقع فيها المتغير العشوائي باحتمالية معينة. على سبيل المثال ، من الخصائص التوزيع الطبيعيمن المعروف أنه مع احتمال 95٪ ، يتم توزيع متغير عشوائي القانون العادي، ستقع ضمن الفترة الزمنية تقريبًا +/- 2 من قيمة متوسط(انظر المقال حول). هذا الفاصل الزمني سيكون بمثابة نموذجنا الأولي لـ فاصل الثقة.

لنرى الآن ما إذا كنا نعرف التوزيع , لحساب هذا الفاصل؟ للإجابة على السؤال ، يجب تحديد شكل التوزيع ومعاييره.

نحن نعلم أن شكل التوزيع هو التوزيع الطبيعي(تذكر أننا نتحدث عنه توزيع العينات الإحصاء X cf).

المعلمة μ غير معروفة لنا (تحتاج فقط إلى تقديرها باستخدام فاصل الثقة) ، ولكن لدينا تقديرها X cf ،محسوبة على أساس عينة،التي يمكن استخدامها.

المعلمة الثانية هي العينة تعني الانحراف المعياري سيعرف، فهو يساوي σ / √n.

لأن لا نعرف μ ، ثم سنبني الفاصل الزمني +/- 2 انحرافات معياريةليس من قيمة متوسط، ولكن من تقديرها المعروف X cf. أولئك. عند الحساب فاصل الثقةلن نفترض ذلك X cfسوف تقع في الفترة +/- 2 انحرافات معياريةمن μ مع احتمال 95٪ ، وسنفترض أن الفاصل الزمني هو +/- 2 انحرافات معياريةمن X cfمع احتمال 95٪ سيغطي μ - متوسط ​​السكان عامة ،من أي عينة. هاتان العبارتان متساويتان ، لكن العبارة الثانية تسمح لنا بالبناء فاصل الثقة.

بالإضافة إلى ذلك ، نقوم بتحسين الفاصل الزمني: متغير عشوائي موزع على القانون العادي، مع احتمال 95٪ يقع ضمن النطاق +/- 1.960 انحرافات معيارية،لا +/- 2 انحرافات معيارية. يمكن حساب ذلك باستخدام الصيغة = NORM.ST.OBR ((1 + 0.95) / 2)، سم. نموذج تباعد ورقة الملف.

الآن يمكننا صياغة بيان احتمالي يخدمنا في التكوين فاصل الثقة:
"احتمال أن متوسط ​​عدد السكانيقع من متوسط ​​العينةفي نطاق 1.960 بوصة متوسط ​​الانحرافات المعيارية للعينة "، تساوي 95٪.

قيمة الاحتمال المذكورة في البيان لها اسم خاص ، الذي يرتبط بـمستوى الأهمية α (ألفا) بتعبير بسيط مستوى الثقة =1 . في حالتنا هذه مستوى الأهمية α =1-0,95=0,05 .

الآن ، بناءً على هذا البيان الاحتمالي ، نكتب تعبيرًا للحساب فاصل الثقة:

حيث Zα / 2 اساسي التوزيع الطبيعي(هذه القيمة لمتغير عشوائي ض, ماذا او ما ص(ض>=Zα / 2 ) = α / 2).

ملحوظة: العلوي α / 2-quantileيحدد العرض فاصل الثقةفي انحرافات معيارية متوسط ​​العينة. العلوي α / 2-quantile اساسي التوزيع الطبيعيدائمًا أكبر من 0 ، وهو أمر مريح للغاية.

في حالتنا ، عند α = 0.05 ، العلوي α / 2-quantile يساوي 1.960. لمستويات الأهمية الأخرى α (10٪ ، 1٪) العلوي α / 2-quantile Zα / 2 يمكن حسابها باستخدام الصيغة \ u003d NORM.ST.OBR (1-α / 2) أو ، إذا كانت معروفة مستوى الثقة, = NORM.ST.OBR ((1 + مستوى الثقة) / 2).

عادة عند البناء فترات الثقة لتقدير المتوسطاستخدم فقط α العلوي/2-كميةولا تستخدم α السفلي/2-كمية. هذا ممكن لأن اساسي التوزيع الطبيعيمتماثل حول المحور السيني ( كثافة توزيعهمتماثل حول متوسط ​​، أي 0). لذلك ، ليست هناك حاجة للحساب انخفاض α / 2-quantile(يطلق عليه ببساطة α / 2-كمي)، لأن إنها متساوية α العلوي/2-كميةبعلامة ناقص.

تذكر أنه بغض النظر عن شكل توزيع x ، المتغير العشوائي المقابل X cfوزعت تقريبا بخير N (μ ؛ σ 2 / ن) (انظر مقالة حول). لذلك ، بشكل عام ، فإن التعبير أعلاه عن فاصل الثقةتقريبي فقط. إذا تم توزيع x على القانون العادي N (μ ؛ σ 2 / ن) ، ثم التعبير عن فاصل الثقةانها صحيحة.

حساب فترة الثقة في MS EXCEL

لنحل المشكلة.
وقت استجابة أحد المكونات الإلكترونية لإشارة الإدخال هو خاصية مهمةالأجهزة. يريد المهندس رسم فاصل ثقة لمتوسط ​​وقت الاستجابة بمستوى ثقة 95٪. من الخبرة السابقة ، يعرف المهندس أن الانحراف المعياري لوقت الاستجابة هو 8 مللي ثانية. من المعروف أن المهندس أجرى 25 قياسًا لتقدير وقت الاستجابة ، وكان متوسط ​​القيمة 78 مللي ثانية.

المحلول: المهندس يريد معرفة زمن الاستجابة جهاز الكتروني، لكنه يفهم أن وقت الاستجابة ليس ثابتًا ، ولكنه متغير عشوائي له توزيعه الخاص. لذا فإن أفضل ما يمكن أن يأمل فيه هو تحديد معالم وشكل هذا التوزيع.

لسوء الحظ من حالة المشكلة لا نعرف شكل توزيع وقت الاستجابة (لا يجب أن يكون عادي). ، هذا التوزيع غير معروف أيضًا. فقط هو معروف الانحراف المعياريσ = 8. لذلك ، بينما لا يمكننا حساب الاحتمالات والبناء فاصل الثقة.

ومع ذلك ، على الرغم من أننا لا نعرف التوزيع زمن استجابة منفصلة، نعرف ذلك وفقًا لـ CPT, توزيع العينات متوسط ​​وقت الاستجابةتقريبا عادي(سنفترض أن الشروط CPTيتم تنفيذها ، لأن بحجم عيناتكبير بما يكفي (ن = 25)) .

بالإضافة إلى، المتوسطهذا التوزيع يساوي قيمة متوسطتوزيعات استجابة الوحدة ، أي ميكرومتر. لكن الانحراف المعياريمن هذا التوزيع (σ / n) يمكن حسابه باستخدام الصيغة = 8 / ROOT (25).

ومن المعروف أيضا أن المهندس تلقى تقدير النقطةالمعلمة μ تساوي 78 مللي ثانية (X cf). لذلك ، يمكننا الآن حساب الاحتمالات ، لأن نعرف شكل التوزيع ( عادي) ومعلماتها (Х ср و σ / n).

المهندس يريد أن يعرف القيمة المتوقعةμ لتوزيع وقت الاستجابة. كما هو مذكور أعلاه ، هذا μ يساوي توقع توزيع العينة لمتوسط ​​زمن الاستجابة. إذا استخدمنا التوزيع الطبيعي N (X cf ؛ σ / √n) ، ثم سيكون المطلوب μ في النطاق +/- 2 * σ / n مع احتمال 95٪ تقريبًا.

مستوى الأهميةيساوي 1-0.95 = 0.05.

أخيرًا ، ابحث عن الحد الأيمن والأيسر فاصل الثقة.
الحد الأيسر: = 78-NORM.ST.INR (1-0.05 / 2) * 8 / ROOT (25) = 74,864
الحد الأيمن: = 78 + NORM ST. OBR (1-0.05 / 2) * 8 / ROOT (25) = 81.136

الحد الأيسر: = NORM.INV (0.05 / 2، 78، 8 / SQRT (25))
الحد الأيمن: = NORM.INV (1-0.05 / 2، 78، 8 / SQRT (25))

إجابه: فاصل الثقةفي 95٪ مستوى ثقة و σ=8مللي ثانيةيساوي 78 +/- 3.136 مللي ثانية

في ملف سبيل المثال على ورقة سيجماالمعروف أنشأ نموذجًا للحساب والبناء ثنائي فاصل الثقةعن التعسفي عيناتمع σ و مستوى الأهمية.

دالة CONFIDENCE.NORM ()

إذا كانت القيم عيناتفي النطاق B20: B79 ، لكن مستوى الأهميةيساوي 0.05 ؛ ثم صيغة MS EXCEL:
= متوسط ​​(B20: B79) - الثقة (0.05، σ، العدد (B20: B79))
سيعود الحد الأيسر فاصل الثقة.

يمكن حساب نفس الحد باستخدام الصيغة:
= AVERAGE (B20: B79) -NORM.ST.INV (1-0.05 / 2) * σ / SQRT (COUNT (B20: B79))

ملحوظة: ظهرت وظيفة TRUST.NORM () في MS EXCEL 2010. استخدمت الإصدارات السابقة من MS EXCEL وظيفة TRUST ().

فترات الثقة ( إنجليزي فترات الثقة) أحد أنواع تقديرات الفترات المستخدمة في الإحصاء ، والتي يتم حسابها لمستوى معين من الأهمية. إنها تسمح لنا بإصدار بيان مفاده أن القيمة الحقيقية لمعلمة إحصائية غير معروفة لعامة السكان تقع في نطاق القيم التي تم الحصول عليها مع الاحتمال الذي يتم توفيره بواسطة المستوى المحدد. دلالة إحصائية.

التوزيع الطبيعي

عندما يكون التباين (σ 2) في مجتمع البيانات معروفًا ، يمكن استخدام علامة z لحساب حدود الثقة (نقاط حدود فاصل الثقة). مقارنةً باستخدام توزيع t ، فإن استخدام الدرجة z لن يوفر فاصل ثقة أضيق فحسب ، بل سيوفر أيضًا تقديرات أكثر موثوقية للمتوسط ​​والانحراف المعياري (σ) ، نظرًا لأن الدرجة Z تستند إلى التوزيع الطبيعي.

معادلة

لتحديد نقاط حدود فاصل الثقة ، شريطة أن يكون الانحراف المعياري لمجتمع البيانات معروفًا ، يتم استخدام الصيغة التالية

L = X - Z α / 2 σ
√n

مثال

افترض أن حجم العينة هو 25 ملاحظة ، وأن متوسط ​​العينة هو 15 ، والانحراف المعياري للمجتمع هو 8. بالنسبة لمستوى أهمية α = 5٪ ، فإن الدرجة Z هي Z α / 2 = 1.96. في هذه الحالة ، ستكون الحدود الدنيا والعليا لفاصل الثقة

L = 15 - 1.96 8 = 11,864
√25
L = 15 + 1.96 8 = 18,136
√25

وبالتالي ، يمكننا القول أنه مع وجود احتمال بنسبة 95 ٪ ، فإن التوقع الرياضي لعامة السكان سينخفض ​​في النطاق من 11.864 إلى 18.136.

طرق تضييق فاصل الثقة

لنفترض أن النطاق واسع جدًا لأغراض دراستنا. هناك طريقتان لتقليل نطاق فاصل الثقة.

  1. إنقاص مستوى الدلالة الإحصائية α.
  2. زيادة حجم العينة.

بتقليل مستوى الدلالة الإحصائية إلى α = 10٪ ، نحصل على درجة Z تساوي Z α / 2 = 1.64. في هذه الحالة ، ستكون الحدين الأدنى والأعلى للفاصل الزمني

L = 15 - 1.64 8 = 12,376
√25
L = 15 + 1.64 8 = 17,624
√25

ويمكن كتابة فاصل الثقة نفسه كـ

في هذه الحالة ، يمكننا أن نفترض أنه مع وجود احتمال 90٪ ، فإن التوقع الرياضي لعامة السكان سوف يقع في النطاق.

إذا أردنا الحفاظ على مستوى الدلالة الإحصائية α ، فإن البديل الوحيد هو زيادة حجم العينة. بزيادتها إلى 144 ملاحظة ، نحصل على القيم التالية لحدود الثقة

L = 15 - 1.96 8 = 13,693
√144
L = 15 + 1.96 8 = 16,307
√144

ستبدو فترة الثقة نفسها كما يلي:

وبالتالي ، فإن تضييق فاصل الثقة دون تقليل مستوى الأهمية الإحصائية لا يمكن تحقيقه إلا من خلال زيادة حجم العينة. إذا لم يكن من الممكن زيادة حجم العينة ، فيمكن تحقيق تضييق فاصل الثقة فقط عن طريق تقليل مستوى الأهمية الإحصائية.

بناء فاصل ثقة لتوزيع غير عادي

إذا كان الانحراف المعياري للمجتمع غير معروف أو كان التوزيع غير طبيعي ، فسيتم استخدام توزيع t لإنشاء فاصل ثقة. هذه التقنية أكثر تحفظًا ، والتي يتم التعبير عنها في فترات ثقة أوسع ، مقارنة بالتقنية القائمة على درجة Z.

معادلة

تُستخدم الصيغ التالية لحساب الحدين الأدنى والأعلى لفاصل الثقة بناءً على توزيع t

L = X - tα σ
√n

يعتمد توزيع الطالب أو توزيعه على معلمة واحدة فقط - عدد درجات الحرية ، التي تساوي عدد قيم السمات الفردية (عدد الملاحظات في العينة). يمكن العثور على قيمة اختبار الطالب لعدد معين من درجات الحرية (ن) ومستوى الدلالة الإحصائية α في جداول البحث.

مثال

افترض أن حجم العينة هو 25 قيمة فردية ، وأن متوسط ​​العينة هو 50 ، والانحراف المعياري للعينة هو 28. تحتاج إلى إنشاء فاصل ثقة لمستوى الدلالة الإحصائية α = 5٪.

في حالتنا ، عدد درجات الحرية هو 24 (25-1) ، وبالتالي ، فإن القيمة الجدولية المقابلة لاختبار t للطالب لمستوى الدلالة الإحصائية α = 5٪ هي 2.064. لذلك ، ستكون الحدود الدنيا والعليا لفاصل الثقة

L = 50 - 2.064 28 = 38,442
√25
L = 50 + 2.064 28 = 61,558
√25

ويمكن كتابة الفترة نفسها بالصيغة

وبالتالي ، يمكننا القول أنه مع وجود احتمال بنسبة 95 ٪ ، سيكون التوقع الرياضي لعامة السكان في النطاق.

يتيح لك استخدام توزيع t تضييق فاصل الثقة ، إما عن طريق تقليل الأهمية الإحصائية أو عن طريق زيادة حجم العينة.

بتقليل الدلالة الإحصائية من 95٪ إلى 90٪ في ظروف مثالنا ، نحصل على القيمة الجدولية المقابلة لاختبار t للطالب 1.711.

L = 50 - 1.711 28 = 40,418
√25
L = 50 + 1.711 28 = 59,582
√25

في هذه الحالة ، يمكننا القول أنه مع وجود احتمال بنسبة 90 ٪ ، سيكون التوقع الرياضي لعامة السكان في النطاق.

إذا كنا لا نريد تقليل الأهمية الإحصائية ، فإن البديل الوحيد هو زيادة حجم العينة. لنفترض أنها 64 ملاحظة فردية ، وليست 25 ملاحظة كما في الحالة الأولية للمثال. القيمة الجدولية لاختبار t للطالب لـ 63 درجة حرية (64-1) ومستوى الدلالة الإحصائية α = 5٪ هو 1.998.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1.998 28 = 56,993
√64

يمنحنا هذا الفرصة لتأكيد أنه مع وجود احتمال بنسبة 95 ٪ ، سيكون التوقع الرياضي لعامة السكان في النطاق.

عينات كبيرة

العينات الكبيرة هي عينات من مجموعة البيانات التي تحتوي على أكثر من 100 ملاحظة فردية.وقد أظهرت الدراسات الإحصائية أن العينات الأكبر تميل إلى التوزيع الطبيعي ، حتى لو كان توزيع السكان غير طبيعي. بالإضافة إلى ذلك ، بالنسبة لمثل هذه العينات ، يعطي استخدام نقاط z وتوزيع t نفس النتائج تقريبًا عند إنشاء فترات الثقة. وبالتالي ، بالنسبة للعينات الكبيرة ، من المقبول استخدام علامة z للتوزيع الطبيعي بدلاً من توزيع t.

تلخيص لما سبق

يواصل "كاترين ستايل" نشر دورة كونستانتين كرافشيك حول الإحصائيات الطبية. في مقالتين سابقتين ، تطرق المؤلف إلى شرح مفاهيم مثل و.

كونستانتين كرافشيك

محلل رياضيات. متخصص في مجال البحث الإحصائي في الطب و العلوم الإنسانية

مدينة موسكو

في كثير من الأحيان في المقالات المتعلقة بالتجارب السريرية ، يمكنك العثور على عبارة غامضة: "فاصل الثقة" (95٪ CI أو 95٪ CI - فاصل الثقة). على سبيل المثال ، قد تقول إحدى المقالات: "تم استخدام اختبار t للطالب لتقييم أهمية الاختلافات ، مع حساب فاصل ثقة 95٪."

ما هي قيمة "مجال الثقة 95٪" ولماذا يتم حسابها؟

ما هي فترة الثقة؟ - هذا هو النطاق الذي تقع فيه القيم المتوسطة الحقيقية في المجتمع. وماذا ، هناك متوسطات "غير صحيحة"؟ بمعنى ما ، نعم ، يفعلون ذلك. في شرحنا أنه من المستحيل قياس معامل الاهتمام في جميع السكان ، لذلك فإن الباحثين راضون بعينة محدودة. في هذه العينة (على سبيل المثال ، حسب وزن الجسم) هناك قيمة متوسطة واحدة (وزن معين) ، والتي من خلالها نحكم على متوسط ​​القيمة في عموم السكان. ومع ذلك ، بالكاد معدل الوزنفي عينة (خاصة صغيرة) سيتوافق مع متوسط ​​الوزن لدى عامة السكان. لذلك ، من الأصح حساب واستخدام نطاق متوسط ​​القيم لعامة السكان.

على سبيل المثال ، افترض أن فاصل الثقة 95٪ (95٪ CI) للهيموجلوبين يتراوح بين 110 و 122 جم / لتر. هذا يعني أنه مع وجود احتمال 95٪ ، فإن القيمة المتوسطة الحقيقية للهيموجلوبين في عموم السكان ستكون في النطاق من 110 إلى 122 جم / لتر. بعبارة أخرى ، نحن لا نعرف معدلالهيموغلوبين في عموم السكان ، ولكن يمكننا الإشارة إلى نطاق القيم لهذه الميزة باحتمال 95٪.

ترتبط فترات الثقة بشكل خاص بالاختلاف في الوسائل بين المجموعات ، أو ما يسمى حجم التأثير.

لنفترض أننا قارنا فعالية مستحضرين من الحديد: أحدهما موجود في السوق منذ فترة طويلة والآخر تم تسجيله للتو. بعد مسار العلاج ، تم تقييم تركيز الهيموجلوبين في مجموعات المرضى المدروسة ، وحسب البرنامج الإحصائي لنا أن الفرق بين متوسط ​​قيم المجموعتين مع احتمال 95٪ يقع في النطاق من 1.72 إلى 14.36 جم / لتر (الجدول 1).

فاتورة غير مدفوعة. 1. معيار العينات المستقلة
(تتم مقارنة المجموعات حسب مستوى الهيموجلوبين)

يجب تفسير ذلك على النحو التالي: في جزء من المرضى من عامة السكان الذين يتناولون دواءً جديدًا ، سيكون الهيموجلوبين أعلى في المتوسط ​​بنسبة 1.72 - 14.36 جم / لتر مقارنة بأولئك الذين تناولوا دواءً معروفًا بالفعل.

بعبارة أخرى ، في عموم السكان ، يكون الاختلاف في متوسط ​​قيم الهيموجلوبين في المجموعات مع احتمال 95٪ ضمن هذه الحدود. سيكون الأمر متروكًا للباحث ليقرر ما إذا كان هذا كثيرًا أم قليلاً. الهدف من كل هذا هو أننا لا نعمل بقيمة متوسطة واحدة ، ولكن مع نطاق من القيم ، لذلك ، فإننا نقدر بشكل أكثر موثوقية الفرق في المعلمة بين المجموعات.

في الحزم الإحصائية ، وفقًا لتقدير الباحث ، يمكن للمرء بشكل مستقل تضييق أو توسيع حدود فاصل الثقة. من خلال خفض احتمالات فترة الثقة ، نقوم بتضييق نطاق الوسائل. على سبيل المثال ، عند 90٪ CI ، سيكون نطاق الوسائل (أو الفروق المتوسطة) أضيق من 95٪ CI.

على العكس من ذلك ، تؤدي زيادة الاحتمال إلى 99٪ إلى توسيع نطاق القيم. عند مقارنة المجموعات ، قد يتجاوز الحد الأدنى لـ CI علامة الصفر. على سبيل المثال ، إذا قمنا بتوسيع حدود فاصل الثقة إلى 99٪ ، فإن حدود الفاصل الزمني تتراوح من -1 إلى 16 جم / لتر. هذا يعني أنه في عموم السكان هناك مجموعات ، والفرق بين المتوسطات التي بين السمة المدروسة هو 0 (م = 0).

يمكن استخدام فترات الثقة لاختبار الفرضيات الإحصائية. إذا تجاوز فاصل الثقة القيمة الصفرية ، فإن الفرضية الصفرية ، التي تفترض أن المجموعات لا تختلف في المعلمة المدروسة ، صحيحة. تم وصف مثال أعلاه ، عندما قمنا بتوسيع الحدود إلى 99٪. في مكان ما من عامة السكان ، وجدنا مجموعات لا تختلف بأي شكل من الأشكال.

فاصل الثقة 95٪ في الهيموجلوبين (جم / لتر)


يوضح الشكل 95٪ فاصل الثقة من متوسط ​​فرق الهيموغلوبين بين المجموعتين كخط. يمر الخط بعلامة الصفر ، لذلك يوجد فرق بين متوسط ​​القيم ، صفر، مما يؤكد الفرضية الصفرية بأن المجموعات لا تختلف. يتراوح الفرق بين المجموعات من -2 إلى 5 جم / لتر ، مما يعني أن الهيموجلوبين يمكن أن ينخفض ​​بمقدار 2 جم / لتر أو يزيد بمقدار 5 جم / لتر.

فاصل الثقة - جدا مؤشر مهم. بفضله ، يمكنك معرفة ما إذا كانت الاختلافات في المجموعات ترجع حقًا إلى الاختلاف في الوسيلة أو بسبب عينة كبيرة ، لأنه مع عينة كبيرة ، تكون فرص العثور على الاختلافات أكبر من تلك الصغيرة.

في الممارسة العملية ، قد يبدو مثل هذا. أخذنا عينة من 1000 شخص ، وقمنا بقياس مستوى الهيموجلوبين ووجدنا أن فترة الثقة للفرق في المتوسط ​​تكمن من 1.2 إلى 1.5 جم / لتر. مستوى الدلالة الإحصائية في هذه الحالة ص

نرى أن تركيز الهيموجلوبين زاد ، ولكن بشكل غير محسوس تقريبًا ، لذلك ظهرت الأهمية الإحصائية على وجه التحديد بسبب حجم العينة.

يمكن حساب فترات الثقة ليس فقط للمتوسطات ، ولكن أيضًا للنسب (ونسب المخاطر). على سبيل المثال ، نحن مهتمون بفاصل الثقة لنسب المرضى الذين حققوا مغفرة أثناء تناول الدواء المطور. افترض أن مجال الموثوقية 95٪ للنسب ، أي لنسبة هؤلاء المرضى ، يتراوح بين 0.60 و 0.80. لذلك يمكننا القول أن لدوائنا تأثير علاجي في 60 إلى 80٪ من الحالات.

يعتمد تحليل الأخطاء العشوائية على نظرية الأخطاء العشوائية ، مما يجعل من الممكن ، بضمان معين ، حساب القيمة الفعلية للكمية المقاسة وتقييم الأخطاء المحتملة.

أساس نظرية الأخطاء العشوائية هو الافتراضات التالية:

مع عدد كبير من القياسات ، تحدث أخطاء عشوائية من نفس الحجم ، ولكن بعلامة مختلفة ، في كثير من الأحيان ؛

الأخطاء الكبيرة أقل شيوعًا من الأخطاء الصغيرة (يتناقص احتمال الخطأ مع زيادة قيمته) ؛

مع عدد لا نهائي من القياسات ، فإن القيمة الحقيقية للكمية المقاسة تساوي المتوسط ​​الحسابي لجميع نتائج القياس ؛

يتم وصف ظهور نتيجة قياس أو أخرى كحدث عشوائي بواسطة قانون التوزيع العادي.

في الممارسة العملية ، يتم التمييز بين مجموعة القياسات العامة وعينة.

تحت عامة السكان تتضمن المجموعة الكاملة لقيم القياس الممكنة أو قيم الخطأ المحتملة
.

لعينة من السكان عدد القياسات محدودة ، وفي كل حالة محددة بدقة. يعتقدون أنه إذا
، ثم متوسط ​​قيمة هذه المجموعة من القياسات قريبة بما يكفي من قيمتها الحقيقية.

1. تقدير الفاصل باستخدام احتمالية الثقة

بالنسبة لعينة كبيرة وقانون التوزيع العادي ، فإن خاصية التقييم العامة للقياس هي التباين
ومعامل الاختلاف :

;
. (1.1)

يميز التشتت تجانس القياس. الأعلى
، كلما زاد تشتت القياس.

معامل الاختلاف يميز التباين. الأعلى ، كلما زاد تباين القياسات بالنسبة للقيم المتوسطة.

لتقييم موثوقية نتائج القياس ، يتم تقديم مفاهيم فاصل الثقة واحتمال الثقة في الاعتبار.

موثوق به يسمى الفاصل الزمني القيم , حيث تقع القيمة الحقيقية الكمية المقاسة باحتمالية معينة.

احتمالية الثقة (موثوقية) القياس هو احتمال وقوع القيمة الحقيقية للكمية المقاسة ضمن فاصل ثقة معين ، أي إلى المنطقة
. يتم تحديد هذه القيمة في كسور الوحدة أو بالنسبة المئوية.

,

أين
- وظيفة لابلاس المتكاملة ( الجدول 1.1 )

يتم تعريف دالة لابلاس المتكاملة بالتعبير التالي:

.

الحجة لهذه الوظيفة عامل الضمان :

الجدول 1.1

دالة لابلاس متكاملة

إذا ، على أساس بيانات معينة ، يتم إنشاء احتمال ثقة (غالبًا ما يتم اعتباره
) ، ثم اضبط دقة القياسات (فاصل الثقة
) على أساس النسبة

.

نصف فاصل الثقة هو

, (1.3)

أين
- حجة دالة لابلاس ، إذا
(الجدول 1.1 );

- وظائف الطالب إذا
(الجدول 1.2 ).

وبالتالي ، فإن فاصل الثقة يميز دقة القياس لعينة معينة ، ويميز مستوى الثقة موثوقية القياس.

مثال

منجز
قياسات قوة سطح الطريق للموقع الطريق السريعبمتوسط ​​معامل المرونة
والقيمة المحسوبة للانحراف المعياري
.

ضروري تحديد الدقة المطلوبةقياسات مراحل مختلفةمستوى الثقة
أخذ القيم على الجدول 1.1 .

في هذه الحالة ، على التوالي |

لذلك ، بالنسبة لأداة وطريقة قياس معينة ، تزداد فترة الثقة بحوالي مرات إذا قمت بزيادة فقط على
.

فترات الثقة.

يعتمد حساب فترة الثقة على متوسط ​​خطأ المعلمة المقابلة. فاصل الثقة يظهر ضمن الحدود مع الاحتمال (1-أ) هي القيمة الحقيقية للمعلمة المقدرة. هنا a هو مستوى الأهمية ، (1-a) يسمى أيضًا مستوى الثقة.

في الفصل الأول ، أوضحنا أنه ، على سبيل المثال ، بالنسبة للمتوسط ​​الحسابي ، يقع الوسط الحقيقي للسكان ضمن خطأين متوسطين من المتوسط ​​بنحو 95٪ من الوقت. وبالتالي ، فإن حدود فاصل الثقة 95٪ للمتوسط ​​ستكون من متوسط ​​العينة بمقدار ضعف متوسط ​​الخطأ ، أي نضرب متوسط ​​الخطأ في المتوسط ​​ببعض العوامل التي تعتمد على مستوى الثقة. بالنسبة لمتوسط ​​وفرق المتوسطات ، يتم أخذ معامل الطالب (القيمة الحرجة لمعيار الطالب) ، بالنسبة لحصة الأسهم وفرقها ، القيمة الحرجة لمعيار z. يمكن أن يسمى ناتج المعامل ومتوسط ​​الخطأ الخطأ الهامشي لهذه المعلمة ، أي أقصى ما يمكننا الحصول عليه عند تقييمه.

فاصل الثقة لـ المتوسط ​​الحسابي : .

هنا متوسط ​​العينة ؛

متوسط ​​خطأ الوسط الحسابي ؛

س-الانحراف المعياري للعينة؛

ن

و = ن-1 (معامل الطالب).

فاصل الثقة لـ اختلاف الوسائل الحسابية :

هنا ، هو الفرق بين متوسط ​​العينة ؛

- متوسط ​​الخطأ باختلاف الوسائل الحسابية ؛

ق 1 ، ق 2 -عينة الانحرافات المعيارية

n1 ، n2

القيمة الحرجة لمعيار الطالب لمستوى معين من الأهمية a وعدد درجات الحرية و = ن 1 + ن 2-2 (معامل الطالب).

فاصل الثقة لـ تشارك :

.

هنا د حصة العينة ؛

- خطأ متوسط ​​في المشاركة ؛

ن- حجم العينة (حجم المجموعة) ؛

فاصل الثقة لـ تقاسم الاختلافات :

هنا ، هو الفرق بين الأسهم العينة ؛

هو متوسط ​​الخطأ في الاختلاف بين الوسائل الحسابية ؛

n1 ، n2- أحجام العينة (عدد المجموعات) ؛

القيمة الحرجة للمعيار z عند مستوى أهمية معين a (، ،).

من خلال حساب فترات الثقة للاختلاف في المؤشرات ، فإننا ، أولاً ، نرى مباشرة القيم المحتملة للتأثير ، وليس فقط تقدير النقاط الخاص به. ثانيًا ، يمكننا استخلاص استنتاج حول قبول أو دحض الفرضية الصفرية ، وثالثًا ، يمكننا استخلاص استنتاج حول قوة المعيار.

عند اختبار الفرضيات باستخدام فترات الثقة ، يجب على المرء الالتزام بها القاعدة التالية:

إذا كانت فترة الثقة 100 (1-أ) - نسبة مئوية لفرق المتوسط ​​لا تحتوي على صفر ، فإن الاختلافات تكون ذات دلالة إحصائية عند مستوى الأهمية ؛ على العكس من ذلك ، إذا كان هذا الفاصل الزمني يحتوي على صفر ، فإن الاختلافات ليست ذات دلالة إحصائية.

في الواقع ، إذا كان هذا الفاصل الزمني يحتوي على صفر ، فهذا يعني أن المؤشر المقارن يمكن أن يكون إما أكثر أو أقل في إحدى المجموعات مقارنة بالمجموعة الأخرى ، أي الاختلافات الملحوظة عشوائية.

من خلال المكان الذي يوجد فيه الصفر داخل فاصل الثقة ، يمكن للمرء أن يحكم على قوة المعيار. إذا كان الصفر قريبًا من الحد الأدنى أو الأعلى للفاصل الزمني ، فربما مع وجود عدد أكبر من المجموعات المقارنة ، ستصل الاختلافات إلى دلالة إحصائية. إذا كان الصفر قريبًا من منتصف الفترة الزمنية ، فهذا يعني أن كلا من زيادة المؤشر وانخفاضه المجموعة التجريبية، وربما لا توجد بالفعل أية اختلافات.

أمثلة:

لمقارنة معدل الفتك العملي عند استخدام نوعين مختلفين من التخدير: تم إجراء عملية جراحية لـ 61 شخصًا باستخدام النوع الأول من التخدير ، وتوفي 8 باستخدام النوع الثاني - 67 شخصًا ، وتوفي 10 أشخاص.

د 1 \ u003d 8/61 = 0.131 ؛ د 2 = 10/67 = 0.149 ؛ d1-d2 = - 0.018.

سيكون الفرق في معدل الإبادة بين الطرق المقارنة في النطاق (-0.018 - 0.122 ؛ -0.018 + 0.122) أو (-0.14 ؛ 0.104) مع احتمال 100 (1-a) = 95٪. الفاصل الزمني يحتوي على صفر ، أي فرضية عن نفس معدل الوفيات في اثنين أنواع مختلفةلا يمكن إنكار التخدير.

وبالتالي ، يمكن أن ينخفض ​​معدل الوفيات إلى 14٪ وسيزداد إلى 10.4٪ مع احتمال 95٪ ، أي يقع الصفر تقريبًا في منتصف الفترة الزمنية ، لذلك يمكن القول ، على الأرجح ، أن هاتين الطريقتين لا تختلفان حقًا في الفتك.

في المثال الذي تم النظر فيه سابقًا ، تمت مقارنة متوسط ​​وقت التنصت في أربع مجموعات من الطلاب تختلف في درجات امتحاناتهم. دعنا نحسب فترات الثقة لمتوسط ​​وقت الضغط للطلاب الذين اجتازوا الاختبار لمدة 2 و 5 وفترة الثقة للفرق بين هذه المتوسطات.

تم العثور على معاملات الطالب من جداول توزيع الطلاب (انظر الملحق): بالنسبة للمجموعة الأولى: = t (0.05 ؛ 48) = 2.011 ؛ للمجموعة الثانية: = t (0.05 ؛ 61) = 2.000. وهكذا ، فواصل الثقة للمجموعة الأولى: = (162.19-2.011 * 2.18 ؛ 162.19 + 2.011 * 2.18) = (157.8 ؛ 166.6) ، للمجموعة الثانية (156.55- 2.000 * 1.88 ؛ 156.55 + 2.000 * 1.88) = (152.8 ؛ 160.3). لذلك ، بالنسبة لأولئك الذين اجتازوا الاختبار لمدة 2 ، يتراوح متوسط ​​وقت الضغط من 157.8 مللي ثانية إلى 166.6 مللي ثانية مع احتمال 95٪ ، بالنسبة لأولئك الذين اجتازوا الاختبار لمدة 5 - من 152.8 مللي ثانية إلى 160.3 مللي ثانية باحتمال 95٪ .

يمكنك أيضًا اختبار الفرضية الصفرية باستخدام فترات الثقة للوسيلة وليس فقط للاختلاف في الوسيلة. على سبيل المثال ، كما في حالتنا ، إذا تداخلت فترات الثقة للوسائل ، فلا يمكن رفض الفرضية الصفرية. لرفض فرضية عند مستوى أهمية مختار ، يجب ألا تتداخل فترات الثقة المقابلة.

لنجد فترة الثقة للاختلاف في متوسط ​​وقت الضغط في المجموعات التي اجتازت الاختبار لـ 2 و 5. الفرق في المتوسطات: 162.19 - 156.55 = 5.64. معامل الطالب: \ u003d t (0.05 ؛ 49 + 62-2) \ u003d t (0.05 ؛ 109) = 1.982. ستكون الانحرافات المعيارية للمجموعة مساوية لـ:؛ . نحسب متوسط ​​الخطأ للفرق بين الوسيلة:. فاصل الثقة: \ u003d (5.64-1.982 * 2.87 ؛ 5.64 + 1.982 * 2.87) \ u003d (-0.044 ؛ 11.33).

لذا ، فإن الفرق في متوسط ​​وقت الضغط في المجموعات التي اجتازت الاختبار عند 2 و 5 سيكون في النطاق من -0.044 مللي ثانية إلى 11.33 مللي ثانية. تتضمن هذه الفترة الزمنية صفرًا ، أي يمكن أن يزيد متوسط ​​وقت الضغط لأولئك الذين اجتازوا الاختبار بنتائج ممتازة ويقل مقارنةً بمن اجتازوا الاختبار بشكل غير مرضٍ ، أي لا يمكن رفض الفرضية الصفرية. لكن الصفر قريب جدًا من الحد الأدنى ، فمن المرجح أن ينخفض ​​وقت الضغط بالنسبة للمارة الممتازين. وبالتالي ، يمكننا أن نستنتج أنه لا تزال هناك اختلافات في متوسط ​​وقت النقر بين أولئك الذين مروا بـ 2 و 5 ، ولم نتمكن من اكتشافهم لتغيير معين في متوسط ​​الوقت ، وانتشار متوسط ​​الوقت وأحجام العينة.



قوة الاختبار هي احتمال رفض فرضية صفرية غير صحيحة ، أي العثور على الاختلافات حيث هم حقا.

يتم تحديد قوة الاختبار بناءً على مستوى الأهمية وحجم الاختلافات بين المجموعات وانتشار القيم في المجموعات وحجم العينة.

بالنسبة لاختبار الطالب وتحليل التباين ، يمكنك استخدام مخططات الحساسية.

يمكن استخدام قوة المعيار في التحديد الأولي للعدد المطلوب من المجموعات.

يوضح فاصل الثقة ضمن الحدود التي تكمن فيها القيمة الحقيقية للمعلمة المقدرة في احتمال معين.

بمساعدة فترات الثقة ، يمكنك اختبار الفرضيات الإحصائية واستخلاص النتائج حول حساسية المعايير.

المؤلفات.

جلانتز س - الفصل 6.7.

Rebrova O.Yu. - ص 112 - 114 ، ص 171 - 173 ، ص 234 - 238.

Sidorenko E. V. - ص 32 - 33.

أسئلة للفحص الذاتي للطلاب.

1. ما هي قوة المعيار؟

2. في أي الحالات يكون من الضروري تقييم قوة المعايير؟

3. طرق حساب القوة.

6. كيف تختبر فرضية إحصائية باستخدام فترة الثقة؟

7. ماذا يمكن أن يقال عن قوة المعيار عند حساب فترة الثقة؟

مهام.

ماذا تقرأ