อะไรให้ช่วงความมั่นใจ วิธีการวิเคราะห์เชิงปริมาณ: การประมาณช่วงความเชื่อมั่น

มาสร้างช่วงความเชื่อมั่นใน MS EXCEL เพื่อประเมินค่าเฉลี่ยของการกระจายในกรณี ค่าที่รู้จักการกระจายตัว

แน่นอนทางเลือก ระดับความไว้วางใจขึ้นอยู่กับงานที่ทำอยู่ ดังนั้นระดับความเชื่อมั่นของผู้โดยสารทางอากาศในความน่าเชื่อถือของเครื่องบินจึงควรสูงกว่าระดับความเชื่อมั่นของผู้ซื้อในความน่าเชื่อถือของหลอดไฟ

การกำหนดงาน

สมมุติว่าจาก ประชากรได้ถ่าย ตัวอย่างขนาด น. สันนิษฐานว่า ส่วนเบี่ยงเบนมาตรฐานการกระจายนี้เป็นที่รู้จัก จำเป็นบนพื้นฐานของสิ่งนี้ ตัวอย่างประเมินสิ่งที่ไม่รู้จัก ค่าเฉลี่ยการกระจาย(μ, ) และสร้างที่สอดคล้องกัน ทวิภาคี ช่วงความมั่นใจ.

การประมาณค่าจุด

ตามที่ทราบจาก สถิติ(เรียกมันว่า X cf) เป็น ค่าประมาณที่เป็นกลางของค่าเฉลี่ยนี้ ประชากรและมีการกระจาย N(μ;σ 2 /n)

บันทึก: เกิดอะไรขึ้นถ้าคุณต้องการสร้าง ช่วงความมั่นใจในกรณีการจำหน่ายซึ่ง ไม่ใช่ ปกติ?ในกรณีนี้มากู้ภัยบอกว่าพอแล้ว ขนาดใหญ่ ตัวอย่าง n จากการกระจาย ไม่ใช่ ปกติ, การกระจายตัวอย่างสถิติ Х avจะ ประมาณสอดคล้อง การกระจายแบบปกติด้วยพารามิเตอร์ N(μ;σ 2 /n)

ดังนั้น, ประมาณการจุด กลาง ค่าการกระจายเรามีคือ ค่าเฉลี่ยตัวอย่าง, เช่น. X cf. ตอนนี้เริ่มยุ่งได้แล้ว ช่วงความเชื่อมั่น

การสร้างช่วงความมั่นใจ

โดยปกติ เมื่อทราบการกระจายและพารามิเตอร์ เราสามารถคำนวณความน่าจะเป็นที่ตัวแปรสุ่มจะใช้ค่าจากช่วงเวลาที่กำหนด มาทำสิ่งที่ตรงกันข้ามกัน: หาช่วงเวลาที่ตัวแปรสุ่มตกด้วยความน่าจะเป็นที่กำหนด ตัวอย่างเช่น จากคุณสมบัติ การกระจายแบบปกติเป็นที่ทราบกันว่าด้วยความน่าจะเป็น 95% ตัวแปรสุ่มจะกระจายไปทั่ว กฎหมายปกติ, จะตกอยู่ในช่วงประมาณ +/- 2 จาก ค่ากลาง(ดูบทความเกี่ยวกับ). ช่วงเวลานี้จะทำหน้าที่เป็นต้นแบบของเราสำหรับ ช่วงความมั่นใจ.

ทีนี้มาดูกันว่าเรารู้การกระจายตัวหรือไม่ , เพื่อคำนวณช่วงเวลานี้? เพื่อตอบคำถาม เราต้องระบุรูปแบบของการแจกแจงและพารามิเตอร์ของมัน

เรารู้ว่ารูปแบบการกระจายคือ การกระจายแบบปกติ(จำไว้ว่าเรากำลังพูดถึง การกระจายตัวอย่าง สถิติ X cf).

เราไม่รู้จักพารามิเตอร์ μ (เพียงแค่ต้องประมาณโดยใช้ ช่วงความมั่นใจ) แต่เรามีค่าประมาณของมัน X CF,คำนวณจาก ตัวอย่าง,ซึ่งสามารถนำมาใช้

พารามิเตอร์ที่สองคือ ค่าเฉลี่ยตัวอย่าง ส่วนเบี่ยงเบนมาตรฐาน จะเป็นที่รู้จัก, จะเท่ากับ σ/√n

เพราะ เราไม่รู้ μ จากนั้นเราจะสร้างช่วงเวลา +/- 2 ค่าเบี่ยงเบนมาตรฐานไม่ได้มาจาก ค่ากลางแต่จากการประมาณการที่ทราบกันดีอยู่แล้ว X cf. เหล่านั้น. เมื่อคำนวณ ช่วงความมั่นใจเราจะไม่ถือว่า X cfจะอยู่ในช่วง +/- 2 ค่าเบี่ยงเบนมาตรฐานจาก μ ด้วยความน่าจะเป็น 95% และเราจะถือว่าช่วงเวลาคือ +/- 2 ค่าเบี่ยงเบนมาตรฐานจาก X cfด้วยความน่าจะเป็น 95% จะครอบคลุมμ - ค่าเฉลี่ยของประชากรทั่วไปจากที่ ตัวอย่าง. สองประโยคนี้เทียบเท่ากัน แต่ประโยคที่สองทำให้เราสร้างได้ ช่วงความมั่นใจ.

นอกจากนี้ เราปรับแต่งช่วงเวลา: ตัวแปรสุ่มกระจายไปทั่ว กฎหมายปกติโดยมีความน่าจะเป็น 95% อยู่ในช่วง +/- 1.960 ส่วนเบี่ยงเบนมาตรฐานไม่ใช่ +/- 2 ค่าเบี่ยงเบนมาตรฐาน. สามารถคำนวณได้โดยใช้สูตร \u003d NORM.ST.OBR ((1 + 0.95) / 2), ซม. ไฟล์ตัวอย่าง ระยะห่างแผ่น.

ตอนนี้ เราสามารถกำหนดข้อความความน่าจะเป็นที่จะให้บริการเราในรูปแบบ ช่วงความมั่นใจ:
“ความน่าจะเป็นที่ ค่าเฉลี่ยประชากรตั้งอยู่จาก ค่าเฉลี่ยตัวอย่างภายใน 1.960" ส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่าง"เท่ากับ 95%

ค่าความน่าจะเป็นที่กล่าวถึงในคำสั่งมีชื่อพิเศษ ซึ่งเกี่ยวข้องกับระดับนัยสำคัญ α (อัลฟา) โดยการแสดงออกอย่างง่าย ระดับความไว้วางใจ =1 . ในกรณีของเรา ระดับความสำคัญ α =1-0,95=0,05 .

จากข้อความความน่าจะเป็นนี้ เราเขียนนิพจน์สำหรับการคำนวณ ช่วงความมั่นใจ:

โดยที่ Zα/2 มาตรฐาน การกระจายแบบปกติ(ค่าดังกล่าวของตัวแปรสุ่ม z, อะไร พี(z>=ซ่า/2 )=α/2).

บันทึก: บน α/2-quantileกำหนดความกว้าง ช่วงความมั่นใจใน ค่าเบี่ยงเบนมาตรฐาน ค่าเฉลี่ยตัวอย่าง บน α/2-quantile มาตรฐาน การกระจายแบบปกติมีค่ามากกว่า 0 เสมอ ซึ่งสะดวกมาก

ในกรณีของเรา ที่ α=0.05 บน α/2-quantile เท่ากับ 1.960 สำหรับระดับนัยสำคัญอื่นๆ α (10%; 1%) บน α/2-quantile ซ่า/2 สามารถคำนวณได้โดยใช้สูตร \u003d NORM.ST.OBR (1-α / 2) หรือถ้ารู้ ระดับความไว้วางใจ, =NORM.ST.OBR((1+ระดับความมั่นใจ)/2).

โดยปกติเมื่อสร้าง ช่วงความเชื่อมั่นสำหรับการประมาณค่ากลางใช้เฉพาะ บน α/2-ปริมาณและอย่าใช้ α .ที่ต่ำกว่า/2-ปริมาณ. เป็นไปได้เพราะ มาตรฐาน การกระจายแบบปกติสมมาตรเกี่ยวกับแกน x ( ความหนาแน่นของการกระจายสมมาตรเกี่ยวกับ เฉลี่ย กล่าวคือ 0). จึงไม่ต้องคำนวน α/2-quantile ที่ต่ำกว่า(เรียกง่ายๆว่า α /2-quantile), เพราะ มันเท่ากัน บน α/2-ปริมาณด้วยเครื่องหมายลบ

จำไว้ว่า ไม่ว่ารูปร่างของการแจกแจงของ x จะเป็นอย่างไรก็ตาม ตัวแปรสุ่มที่สอดคล้องกัน X cfแจกจ่าย ประมาณ ก็ได้ N(μ;σ 2 /n) (ดูบทความเกี่ยวกับ) ดังนั้น โดยทั่วไป นิพจน์ข้างต้นสำหรับ ช่วงความมั่นใจเป็นเพียงการประมาณเท่านั้น ถ้า x ถูกกระจายทับ กฎหมายปกติ N(μ;σ 2 /n) จากนั้นนิพจน์สำหรับ ช่วงความมั่นใจถูกต้อง

การคำนวณช่วงความเชื่อมั่นใน MS EXCEL

มาแก้ปัญหากันเถอะ
เวลาตอบสนองของส่วนประกอบอิเล็กทรอนิกส์ต่อสัญญาณอินพุตคือ ลักษณะสำคัญอุปกรณ์ วิศวกรต้องการสร้างช่วงความเชื่อมั่นสำหรับเวลาตอบสนองโดยเฉลี่ยที่ระดับความเชื่อมั่น 95% จากประสบการณ์ที่ผ่านมา วิศวกรรู้ว่าค่าเบี่ยงเบนมาตรฐานของเวลาตอบสนองคือ 8 มิลลิวินาที เป็นที่ทราบกันดีว่าวิศวกรทำการวัด 25 ครั้งเพื่อประมาณเวลาตอบสนอง ค่าเฉลี่ยคือ 78 มิลลิวินาที

สารละลาย: วิศวกรต้องการทราบเวลาตอบสนอง อุปกรณ์อิเล็กทรอนิกส์แต่เขาเข้าใจว่าเวลาตอบสนองไม่คงที่ แต่เป็นตัวแปรสุ่มที่มีการแจกแจงของตัวเอง สิ่งที่ดีที่สุดที่เขาสามารถหวังได้คือการกำหนดพารามิเตอร์และรูปร่างของการแจกแจงนี้

น่าเสียดายที่จากสภาพของปัญหาเราไม่รู้ถึงรูปแบบการกระจายเวลาตอบสนอง (ไม่จำเป็นต้องเป็น ปกติ). การกระจายนี้ยังไม่ทราบ มีแต่เขาเท่านั้นที่รู้จัก ส่วนเบี่ยงเบนมาตรฐานσ=8. ดังนั้นในขณะที่เราไม่สามารถคำนวณความน่าจะเป็นและสร้างได้ ช่วงความมั่นใจ.

อย่างไรก็ตามแม้ว่าเราจะไม่รู้จักการแจกจ่าย เวลา แยกการตอบสนอง, เรารู้ว่าตาม CPT, การกระจายตัวอย่าง เวลาตอบสนองโดยเฉลี่ยอยู่ที่ประมาณ ปกติ(เราจะถือว่าเงื่อนไข CPTจะดำเนินการเพราะ ขนาด ตัวอย่างใหญ่พอ (n=25)) .

นอกจากนี้, เฉลี่ยการกระจายนี้เท่ากับ ค่ากลางการกระจายการตอบสนองของหน่วย เช่น ม. แต่ ส่วนเบี่ยงเบนมาตรฐานของการแจกแจงนี้ (σ/√n) สามารถคำนวณได้โดยใช้สูตร =8/ROOT(25)

เป็นที่รู้กันว่าวิศวกรได้รับ ประมาณการจุดพารามิเตอร์ μ เท่ากับ 78 ms (X cf) ดังนั้น ตอนนี้เราสามารถคำนวณความน่าจะเป็นได้เพราะ เรารู้ว่าแบบฟอร์มการแจกจ่าย ( ปกติ) และพารามิเตอร์ (Х ср และ σ/√n)

วิศวกรต้องการทราบ มูลค่าที่คาดหวังμของการกระจายเวลาตอบสนอง ตามที่ระบุไว้ข้างต้น μ ​​นี้เท่ากับ ความคาดหวังของการกระจายตัวอย่างเวลาตอบสนองโดยเฉลี่ย. ถ้าเราใช้ การกระจายแบบปกติ N(X cf; σ/√n) จากนั้น μ ที่ต้องการจะอยู่ในช่วง +/-2*σ/√n โดยมีความน่าจะเป็นประมาณ 95%

ระดับความสำคัญเท่ากับ 1-0.95=0.05

สุดท้ายให้หาเส้นขอบซ้ายและขวา ช่วงความมั่นใจ.
ขอบซ้าย: \u003d 78-NORM.ST.INR (1-0.05 / 2) * 8 / ROOT (25) = 74,864
ขอบขวา: \u003d 78 + NORM เซนต์ OBR (1-0.05 / 2) * 8 / ROOT (25) \u003d 81.136

ขอบซ้าย: =NORM.INV(0.05/2, 78, 8/SQRT(25))
ขอบขวา: =NORM.INV(1-0.05/2, 78, 8/SQRT(25))

ตอบ: ช่วงความมั่นใจที่ ระดับความมั่นใจ 95% และ σ=8msecเท่ากับ 78+/-3.136ms

ใน ไฟล์ตัวอย่างในชีต Sigmaรู้จักสร้างแบบฟอร์มการคำนวณและก่อสร้าง ทวิภาคี ช่วงความมั่นใจโดยพลการ ตัวอย่างด้วย σ และ ที่กำหนด ระดับความสำคัญ.

ฟังก์ชัน CONFIDENCE.NORM()

ถ้าค่า ตัวอย่างอยู่ในช่วง B20:B79 , แต่ ระดับความสำคัญเท่ากับ 0.05; จากนั้นสูตร MS EXCEL:
=ค่าเฉลี่ย(B20:B79)-ความมั่นใจ(0.05,σ, COUNT(B20:B79))
จะกลับขอบซ้าย ช่วงความมั่นใจ.

ขอบเขตเดียวกันสามารถคำนวณได้โดยใช้สูตร:
=AVERAGE(B20:B79)-NORM.ST.INV(1-0.05/2)*σ/SQRT(COUNT(B20:B79))

บันทึก: ฟังก์ชัน TRUST.NORM() ปรากฏใน MS EXCEL 2010 MS EXCEL เวอร์ชันก่อนหน้าใช้ฟังก์ชัน TRUST()

ช่วงความเชื่อมั่น ( ภาษาอังกฤษ ช่วงความเชื่อมั่น) หนึ่งในประเภทของการประมาณช่วงเวลาที่ใช้ในสถิติ ซึ่งคำนวณตามระดับนัยสำคัญที่กำหนด พวกเขาช่วยให้เราสามารถประกาศว่าค่าที่แท้จริงของพารามิเตอร์ทางสถิติที่ไม่รู้จักของประชากรทั่วไปอยู่ในช่วงค่าที่ได้รับโดยมีความน่าจะเป็นที่กำหนดโดยระดับที่เลือก นัยสำคัญทางสถิติ.

การกระจายแบบปกติ

เมื่อทราบความแปรปรวน (σ 2 ) ของประชากรข้อมูล สามารถใช้คะแนน z เพื่อคำนวณขีดจำกัดความเชื่อมั่น (จุดขอบเขตของช่วงความเชื่อมั่น) เมื่อเทียบกับการใช้การแจกแจงแบบ t การใช้ค่า z-score จะไม่เพียงแต่ให้ช่วงความเชื่อมั่นที่แคบลงเท่านั้น แต่ยังให้ค่าประมาณของค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐาน (σ) ที่เชื่อถือได้มากขึ้น เนื่องจากค่า Z-score อ้างอิงจากการแจกแจงแบบปกติ

สูตร

ในการกำหนดจุดขอบเขตของช่วงความเชื่อมั่น หากทราบค่าเบี่ยงเบนมาตรฐานของประชากรข้อมูล ให้ใช้สูตรต่อไปนี้

L = X - Z α/2 σ
√น

ตัวอย่าง

สมมติว่าขนาดตัวอย่างคือ 25 การสังเกต ค่าเฉลี่ยตัวอย่างคือ 15 และส่วนเบี่ยงเบนมาตรฐานของประชากรคือ 8 สำหรับระดับนัยสำคัญของ α=5% คะแนน Z คือ Z α/2 =1.96 ในกรณีนี้ ขีดจำกัดล่างและบนของช่วงความเชื่อมั่นจะเป็น

L = 15 - 1.96 8 = 11,864
√25
L = 15 + 1.96 8 = 18,136
√25

ดังนั้น เราสามารถระบุได้ว่าด้วยความน่าจะเป็น 95% ความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไปจะอยู่ในช่วงตั้งแต่ 11.864 ถึง 18.136

วิธีการจำกัดช่วงความเชื่อมั่นให้แคบลง

สมมติว่าช่วงกว้างเกินไปสำหรับวัตถุประสงค์ในการศึกษาของเรา มีสองวิธีในการลดช่วงความเชื่อมั่น

  1. ลดระดับนัยสำคัญทางสถิติ α
  2. เพิ่มขนาดตัวอย่าง

การลดระดับนัยสำคัญทางสถิติเป็น α=10% เราจะได้คะแนน Z เท่ากับ Z α/2 =1.64 ในกรณีนี้ ขีดจำกัดล่างและบนของช่วงเวลาจะเป็น

L = 15 - 1.64 8 = 12,376
√25
L = 15 + 1.64 8 = 17,624
√25

และช่วงความมั่นใจนั้นสามารถเขียนได้เป็น

ในกรณีนี้ เราสามารถตั้งสมมติฐานว่าด้วยความน่าจะเป็น 90% ความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไปจะอยู่ในช่วง

หากเราต้องการรักษาระดับนัยสำคัญทางสถิติ α ไว้ ทางเลือกเดียวคือเพิ่มขนาดกลุ่มตัวอย่าง เพิ่มขึ้นเป็น 144 การสังเกต เราได้รับค่าขีดจำกัดความเชื่อมั่นดังต่อไปนี้

L = 15 - 1.96 8 = 13,693
√144
L = 15 + 1.96 8 = 16,307
√144

ช่วงความเชื่อมั่นจะมีลักษณะดังนี้:

ดังนั้น การจำกัดช่วงความเชื่อมั่นให้แคบลงโดยไม่ลดระดับของนัยสำคัญทางสถิติจึงทำได้โดยการเพิ่มขนาดกลุ่มตัวอย่างเท่านั้น หากไม่สามารถเพิ่มขนาดตัวอย่างได้ การลดช่วงความเชื่อมั่นให้แคบลงสามารถทำได้โดยการลดระดับของนัยสำคัญทางสถิติเพียงอย่างเดียว

การสร้างช่วงความเชื่อมั่นสำหรับการแจกแจงไม่ปกติ

หากไม่ทราบค่าเบี่ยงเบนมาตรฐานของประชากรหรือการแจกแจงแบบปกติ การแจกแจงแบบ t จะใช้เพื่อสร้างช่วงความเชื่อมั่น เทคนิคนี้อนุรักษ์นิยมมากกว่า ซึ่งแสดงในช่วงความเชื่อมั่นที่กว้างขึ้น เมื่อเทียบกับเทคนิคที่อิงจากคะแนน Z

สูตร

สูตรต่อไปนี้ใช้ในการคำนวณขีดจำกัดล่างและบนของช่วงความเชื่อมั่นตามการแจกแจงแบบ t

L = X - tα σ
√น

การแจกแจงหรือการแจกแจงแบบ t ของนักเรียนขึ้นอยู่กับพารามิเตอร์เพียงตัวเดียว - จำนวนองศาอิสระซึ่งเท่ากับจำนวนค่าคุณลักษณะแต่ละค่า (จำนวนการสังเกตในตัวอย่าง) ค่าของการทดสอบ t ของนักเรียนสำหรับจำนวนองศาอิสระ (n) ที่กำหนด และระดับของนัยสำคัญทางสถิติ α สามารถพบได้ในตารางค้นหา

ตัวอย่าง

สมมติว่าขนาดตัวอย่างคือ 25 ค่าแต่ละค่า ค่าเฉลี่ยของกลุ่มตัวอย่างคือ 50 และค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างคือ 28 คุณต้องสร้างช่วงความเชื่อมั่นสำหรับระดับนัยสำคัญทางสถิติ α=5%

ในกรณีของเรา จำนวนองศาอิสระคือ 24 (25-1) ดังนั้นค่าตารางที่สอดคล้องกันของการทดสอบ t ของนักเรียนสำหรับระดับนัยสำคัญทางสถิติ α=5% คือ 2.064 ดังนั้นขอบเขตล่างและบนของช่วงความเชื่อมั่นจะเป็น

L = 50 - 2.064 28 = 38,442
√25
L = 50 + 2.064 28 = 61,558
√25

และช่วงนั้นสามารถเขียนเป็น

ดังนั้น เราสามารถระบุได้ว่าด้วยความน่าจะเป็น 95% ความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไปจะอยู่ในช่วง

การใช้การกระจายแบบ t ช่วยให้คุณจำกัดช่วงความเชื่อมั่นให้แคบลง โดยการลดนัยสำคัญทางสถิติหรือโดยการเพิ่มขนาดกลุ่มตัวอย่าง

การลดนัยสำคัญทางสถิติจาก 95% เป็น 90% ในเงื่อนไขของตัวอย่างของเรา เราได้รับค่าตารางที่สอดคล้องกันของการทดสอบ t ของนักเรียน 1.711

L = 50 - 1.711 28 = 40,418
√25
L = 50 + 1.711 28 = 59,582
√25

ในกรณีนี้ เราสามารถพูดได้ว่าด้วยความน่าจะเป็น 90% ความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไปจะอยู่ในช่วง

หากเราไม่ต้องการลดนัยสำคัญทางสถิติ ทางเลือกเดียวคือเพิ่มขนาดกลุ่มตัวอย่าง สมมติว่าเป็นการสังเกตทีละ 64 ครั้ง และไม่ใช่ 25 ครั้งในเงื่อนไขเริ่มต้นของตัวอย่าง ค่าแบบตารางของการทดสอบ t ของนักเรียนสำหรับองศาอิสระ 63 (64-1) และระดับนัยสำคัญทางสถิติ α=5% คือ 1.998

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1.998 28 = 56,993
√64

สิ่งนี้ทำให้เรามีโอกาสที่จะยืนยันว่าด้วยความน่าจะเป็น 95% ความคาดหวังทางคณิตศาสตร์ของประชากรทั่วไปจะอยู่ในช่วง

ตัวอย่างขนาดใหญ่

ตัวอย่างขนาดใหญ่คือตัวอย่างจากประชากรของข้อมูลที่มีการสังเกตเป็นรายบุคคลมากกว่า 100 ครั้ง จากการศึกษาทางสถิติพบว่ากลุ่มตัวอย่างขนาดใหญ่มีแนวโน้มที่จะมีการกระจายตามปกติแม้ว่าการกระจายของประชากรจะไม่ปกติก็ตาม นอกจากนี้ สำหรับตัวอย่างดังกล่าว การใช้ค่า z-score และ t-distribution จะให้ผลลัพธ์ที่ใกล้เคียงกันเมื่อสร้างช่วงความเชื่อมั่น ดังนั้น สำหรับตัวอย่างขนาดใหญ่ สามารถใช้ค่า z-score สำหรับการแจกแจงแบบปกติแทนการแจกแจงแบบ t

สรุป

"Katren-Style" ยังคงเผยแพร่วัฏจักรของ Konstantin Kravchik เกี่ยวกับสถิติทางการแพทย์ ในสองบทความก่อนหน้านี้ ผู้เขียนได้กล่าวถึงคำอธิบายของแนวคิดดังกล่าวว่า และ

คอนสแตนติน คราฟชิก

นักคณิตศาสตร์-นักวิเคราะห์ ผู้เชี่ยวชาญด้านการวิจัยทางสถิติด้านการแพทย์และ มนุษยศาสตร์

เมืองมอสโก

บ่อยครั้งในบทความเกี่ยวกับการทดลองทางคลินิก คุณสามารถหาวลีลึกลับ: "ช่วงความเชื่อมั่น" (95% CI หรือ 95% CI - ช่วงความมั่นใจ) ตัวอย่างเช่น บทความอาจกล่าวว่า "การทดสอบ t ของนักเรียนถูกใช้เพื่อประเมินความสำคัญของความแตกต่าง โดยคำนวณช่วงความเชื่อมั่น 95%"

ค่าของ "ช่วงความมั่นใจ 95%" คืออะไร และทำไมจึงคำนวณ

ช่วงความเชื่อมั่นคืออะไร? - นี่คือช่วงที่ค่าเฉลี่ยที่แท้จริงของประชากรลดลง และอะไรคือค่าเฉลี่ยที่ "ไม่จริง"? ในแง่หนึ่งใช่พวกเขาทำ เราอธิบายว่าเป็นไปไม่ได้ที่จะวัดค่าพารามิเตอร์ของความสนใจในประชากรทั้งหมด ดังนั้นนักวิจัยจึงพอใจกับกลุ่มตัวอย่างที่จำกัด ในตัวอย่างนี้ (เช่น ตามน้ำหนักตัว) มีค่าเฉลี่ยหนึ่งค่า (น้ำหนักค่าหนึ่ง) โดยเราจะใช้ค่าเฉลี่ยในประชากรทั่วไปทั้งหมด อย่างไรก็ตามแทบจะไม่ น้ำหนักเฉลี่ยในตัวอย่าง (โดยเฉพาะกลุ่มเล็ก) จะตรงกับน้ำหนักเฉลี่ยในประชากรทั่วไป ดังนั้นจึงถูกต้องกว่าในการคำนวณและใช้ช่วงค่าเฉลี่ยของประชากรทั่วไป

ตัวอย่างเช่น สมมติว่าช่วงความเชื่อมั่น 95% (95% CI) สำหรับเฮโมโกลบินอยู่ระหว่าง 110 ถึง 122 ก./ลิตร ซึ่งหมายความว่าด้วยความน่าจะเป็น 95 % ค่าเฉลี่ยที่แท้จริงของฮีโมโกลบินในประชากรทั่วไปจะอยู่ในช่วงตั้งแต่ 110 ถึง 122 ก./ลิตร กล่าวอีกนัยหนึ่งเราไม่รู้ เฉลี่ยเฮโมโกลบินในประชากรทั่วไป แต่เราสามารถระบุช่วงของค่าสำหรับคุณลักษณะนี้ด้วยความน่าจะเป็น 95%

ช่วงความเชื่อมั่นมีความเกี่ยวข้องโดยเฉพาะอย่างยิ่งกับความแตกต่างในค่าเฉลี่ยระหว่างกลุ่มหรือสิ่งที่เรียกว่าขนาดผลกระทบ

สมมติว่าเราเปรียบเทียบประสิทธิภาพของการเตรียมธาตุเหล็กสองชนิด: แบบที่ออกสู่ตลาดมาเป็นเวลานานและแบบที่เพิ่งได้รับการจดทะเบียน หลังการรักษามีการประเมินความเข้มข้นของเฮโมโกลบินในกลุ่มผู้ป่วยที่ศึกษาและโปรแกรมทางสถิติคำนวณสำหรับเราว่าความแตกต่างระหว่างค่าเฉลี่ยของทั้งสองกลุ่มที่มีความน่าจะเป็น 95% อยู่ในช่วงตั้งแต่ 1.72 ถึง 14.36 ก./ลิตร (ตารางที่ 1)

แท็บ 1. เกณฑ์สำหรับตัวอย่างอิสระ
(เปรียบเทียบกลุ่มตามระดับฮีโมโกลบิน)

สิ่งนี้ควรตีความดังนี้ ในผู้ป่วยส่วนหนึ่งในกลุ่มประชากรทั่วไปที่ใช้ยาใหม่ ฮีโมโกลบินจะสูงขึ้นโดยเฉลี่ย 1.72–14.36 กรัม/ลิตร เมื่อเทียบกับผู้ที่ใช้ยาที่ทราบอยู่แล้ว

กล่าวอีกนัยหนึ่งในประชากรทั่วไปความแตกต่างในค่าเฉลี่ยของฮีโมโกลบินในกลุ่มที่มีความน่าจะเป็น 95% อยู่ภายในขอบเขตเหล่านี้ อยู่ที่ผู้วิจัยจะตัดสินว่าจะมากหรือน้อย ประเด็นทั้งหมดนี้คือเราไม่ได้ทำงานกับค่าเฉลี่ยหนึ่งค่า แต่ด้วยช่วงของค่า ดังนั้นเราจึงประมาณค่าความแตกต่างในพารามิเตอร์ระหว่างกลุ่มได้อย่างน่าเชื่อถือมากขึ้น

ในแพ็คเกจทางสถิตินั้น ขึ้นอยู่กับดุลยพินิจของผู้วิจัย เราสามารถจำกัดหรือขยายขอบเขตของช่วงความเชื่อมั่นได้อย่างอิสระ การลดความน่าจะเป็นของช่วงความเชื่อมั่นจะทำให้ช่วงของค่าเฉลี่ยแคบลง ตัวอย่างเช่น ที่ 90% CI ช่วงของค่าเฉลี่ย (หรือผลต่างค่าเฉลี่ย) จะแคบกว่าที่ 95% CI

ในทางกลับกัน การเพิ่มความน่าจะเป็นเป็น 99% จะทำให้ช่วงของค่ากว้างขึ้น เมื่อเปรียบเทียบกลุ่ม ขีดจำกัดล่างของ CI อาจข้ามเครื่องหมายศูนย์ ตัวอย่างเช่น หากเราขยายขอบเขตของช่วงความเชื่อมั่นเป็น 99 % ขอบเขตของช่วงจะอยู่ในช่วงตั้งแต่ –1 ถึง 16 ก./ลิตร ซึ่งหมายความว่าในประชากรทั่วไปจะมีกลุ่มต่างๆ ความแตกต่างระหว่างค่าเฉลี่ยระหว่างคุณลักษณะที่ศึกษาคือ 0 (M=0)

สามารถใช้ช่วงความเชื่อมั่นเพื่อทดสอบสมมติฐานทางสถิติได้ หากช่วงความเชื่อมั่นข้ามค่าศูนย์ สมมติฐานว่างซึ่งถือว่ากลุ่มไม่แตกต่างกันในพารามิเตอร์ที่ศึกษาจะเป็นจริง ตัวอย่างที่อธิบายไว้ข้างต้น เมื่อเราขยายขอบเขตเป็น 99% บางแห่งในประชากรทั่วไป เราพบกลุ่มที่ไม่แตกต่างกันเลย

ช่วงความเชื่อมั่น 95% ของความแตกต่างในเฮโมโกลบิน (g/l)


รูปภาพแสดงช่วงความเชื่อมั่น 95% ของความแตกต่างของฮีโมโกลบินเฉลี่ยระหว่างทั้งสองกลุ่มเป็นเส้น เส้นผ่านเครื่องหมายศูนย์ ดังนั้นจึงมีความแตกต่างระหว่างค่าเฉลี่ย ศูนย์ซึ่งยืนยันสมมติฐานว่างว่ากลุ่มต่างๆ ไม่แตกต่างกัน ความแตกต่างระหว่างกลุ่มต่างๆ มีตั้งแต่ -2 ถึง 5 g/l ซึ่งหมายความว่าฮีโมโกลบินสามารถลดลงได้ 2 g/l หรือเพิ่มขึ้น 5 g/l

ช่วงความเชื่อมั่น - มาก ตัวบ่งชี้ที่สำคัญ. ต้องขอบคุณสิ่งนี้ คุณสามารถดูได้ว่าความแตกต่างในกลุ่มนั้นเกิดจากความแตกต่างของค่าเฉลี่ยหรือเนื่องจากกลุ่มตัวอย่างจำนวนมาก เพราะด้วยกลุ่มตัวอย่างจำนวนมาก โอกาสในการค้นหาความแตกต่างมีมากกว่ากลุ่มเล็กๆ

ในทางปฏิบัติอาจมีลักษณะเช่นนี้ เราเก็บตัวอย่างจากคน 1,000 คน วัดระดับฮีโมโกลบิน และพบว่าช่วงความเชื่อมั่นสำหรับความแตกต่างของค่าเฉลี่ยอยู่ระหว่าง 1.2 ถึง 1.5 กรัม/ลิตร ระดับนัยสำคัญทางสถิติในกรณีนี้ p

เราพบว่าความเข้มข้นของเฮโมโกลบินเพิ่มขึ้น แต่แทบจะมองไม่เห็น ดังนั้น นัยสำคัญทางสถิติจึงปรากฏขึ้นอย่างแม่นยำเนื่องจากขนาดกลุ่มตัวอย่าง

ช่วงความเชื่อมั่นสามารถคำนวณได้ไม่เพียงแต่สำหรับค่าเฉลี่ย แต่ยังคำนวณตามสัดส่วน (และอัตราส่วนความเสี่ยง) ตัวอย่างเช่น เราสนใจช่วงความเชื่อมั่นของสัดส่วนของผู้ป่วยที่ได้รับการบรรเทาอาการในขณะที่ใช้ยาที่พัฒนาแล้ว สมมติว่า CI 95% สำหรับสัดส่วน กล่าวคือ สำหรับสัดส่วนของผู้ป่วยดังกล่าว อยู่ในช่วง 0.60–0.80 ดังนั้น เราสามารถพูดได้ว่ายาของเรามีผลการรักษาใน 60 ถึง 80% ของกรณี

การวิเคราะห์ข้อผิดพลาดแบบสุ่มขึ้นอยู่กับทฤษฎีข้อผิดพลาดแบบสุ่ม ซึ่งทำให้สามารถคำนวณมูลค่าที่แท้จริงของปริมาณที่วัดได้และประเมินข้อผิดพลาดที่อาจเกิดขึ้นได้โดยมีการรับประกันที่แน่นอน

พื้นฐานของทฤษฎีข้อผิดพลาดแบบสุ่มคือสมมติฐานต่อไปนี้:

ด้วยการวัดจำนวนมาก ข้อผิดพลาดแบบสุ่มที่มีขนาดเท่ากัน แต่มีเครื่องหมายต่างกัน มักเกิดขึ้นเท่าๆ กัน

ข้อผิดพลาดขนาดใหญ่มักน้อยกว่าข้อผิดพลาดเล็กน้อย (ความน่าจะเป็นของข้อผิดพลาดจะลดลงเมื่อมูลค่าเพิ่มขึ้น)

ด้วยการวัดจำนวนมากอย่างไม่สิ้นสุด ค่าที่แท้จริงของปริมาณที่วัดได้จะเท่ากับค่าเฉลี่ยเลขคณิตของผลการวัดทั้งหมด

ลักษณะของผลการวัดอย่างใดอย่างหนึ่งเป็นเหตุการณ์สุ่มอธิบายโดยกฎการแจกแจงแบบปกติ

ในทางปฏิบัติ จะแยกความแตกต่างระหว่างชุดการวัดทั่วไปและชุดตัวอย่าง

ภายใต้ประชากรทั่วไป บ่งบอกถึงค่าการวัดที่เป็นไปได้ทั้งหมดหรือค่าความผิดพลาดที่เป็นไปได้
.

สำหรับกลุ่มตัวอย่าง จำนวนการวัด จำกัดและในแต่ละกรณีกำหนดไว้อย่างเข้มงวด พวกเขาคิดว่าถ้า
แล้วค่าเฉลี่ยของชุดการวัดนี้ ใกล้เคียงกับมูลค่าที่แท้จริงของมัน

1. การประมาณช่วงเวลาโดยใช้ความน่าจะเป็นของความเชื่อมั่น

สำหรับตัวอย่างขนาดใหญ่และกฎการแจกแจงแบบปกติ ลักษณะการประเมินทั่วไปของการวัดคือความแปรปรวน
และค่าสัมประสิทธิ์การแปรผัน :

;
. (1.1)

การกระจายตัวเป็นตัวกำหนดลักษณะความเป็นเนื้อเดียวกันของการวัด ที่สูงกว่า
การวัดยิ่งกระจัดกระจาย

ค่าสัมประสิทธิ์การแปรผันเป็นตัวกำหนดลักษณะความแปรปรวน ที่สูงกว่า ยิ่งความแปรปรวนของการวัดที่สัมพันธ์กับค่าเฉลี่ยมากขึ้น

ในการประเมินความน่าเชื่อถือของผลการวัด แนวคิดของช่วงความเชื่อมั่นและความน่าจะเป็นของความเชื่อมั่นจะถูกนำมาพิจารณา

ที่เชื่อถือ เรียกว่า ช่วงเวลา ค่า , ที่มูลค่าที่แท้จริงตกลง ปริมาณที่วัดได้ด้วยความน่าจะเป็นที่กำหนด

ความมั่นใจ ความน่าจะเป็น (ความน่าเชื่อถือ) ของการวัดคือความน่าจะเป็นที่ค่าที่แท้จริงของปริมาณที่วัดได้อยู่ในช่วงความเชื่อมั่นที่กำหนด กล่าวคือ สู่โซน
. ค่านี้กำหนดเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์

,

ที่ไหน
- ฟังก์ชันอินทิกรัล Laplace ( ตาราง 1.1 )

ฟังก์ชันอินทิกรัล Laplace ถูกกำหนดโดยนิพจน์ต่อไปนี้:

.

อาร์กิวเมนต์ของฟังก์ชันนี้คือ ปัจจัยรับประกัน :

ตาราง 1.1

ฟังก์ชัน Integral Laplace

หากบนพื้นฐานของข้อมูลบางอย่าง ความน่าจะเป็นของความเชื่อมั่นถูกสร้างขึ้น (มักจะนำไปเป็น
) จากนั้นตั้งค่า ความแม่นยำในการวัด (ช่วงความมั่นใจ
) ตามอัตราส่วน

.

ครึ่งหนึ่งของช่วงความเชื่อมั่นคือ

, (1.3)

ที่ไหน
- อาร์กิวเมนต์ของฟังก์ชัน Laplace if
(ตาราง 1.1 );

- หน้าที่ของนักเรียน if
(ตาราง 1.2 ).

ดังนั้น ช่วงความเชื่อมั่นจะกำหนดลักษณะเฉพาะของความแม่นยำในการวัดของตัวอย่างที่กำหนด และระดับความเชื่อมั่นจะเป็นตัวกำหนดลักษณะความน่าเชื่อถือของการวัด

ตัวอย่าง

เสร็จแล้ว
การวัดความแข็งแรงของพื้นผิวถนนของไซต์ ทางหลวงด้วยโมดูลัสความยืดหยุ่นเฉลี่ย
และค่าที่คำนวณได้ของค่าเบี่ยงเบนมาตรฐาน
.

จำเป็น กำหนดความแม่นยำที่ต้องการวัดสำหรับ ระดับต่างๆระดับความเชื่อมั่น
, เอาค่า บน ตาราง 1.1 .

ในกรณีนี้ ตามลำดับ |

ดังนั้น สำหรับเครื่องมือและวิธีการวัดที่กำหนด ช่วงความเชื่อมั่นจะเพิ่มขึ้นประมาณ ครั้งถ้าคุณเพิ่มขึ้น แค่บน
.

ช่วงความเชื่อมั่น

การคำนวณช่วงความเชื่อมั่นขึ้นอยู่กับข้อผิดพลาดเฉลี่ยของพารามิเตอร์ที่เกี่ยวข้อง ช่วงความเชื่อมั่น แสดงภายในสิ่งที่จำกัดด้วยความน่าจะเป็น (1-a) คือค่าที่แท้จริงของพารามิเตอร์โดยประมาณ นี่คือระดับนัยสำคัญ (1-a) เรียกอีกอย่างว่าระดับความเชื่อมั่น

ในบทแรก เราแสดงให้เห็นว่า ตัวอย่างเช่น สำหรับค่าเฉลี่ยเลขคณิต ค่าเฉลี่ยประชากรจริงอยู่ภายในข้อผิดพลาดเฉลี่ย 2 ค่าของค่าเฉลี่ยประมาณ 95% ของเวลาทั้งหมด ดังนั้น ขอบเขตของช่วงความเชื่อมั่น 95% สำหรับค่าเฉลี่ยจะมาจากค่าเฉลี่ยตัวอย่างเป็นสองเท่าของค่าคลาดเคลื่อนเฉลี่ยของค่าเฉลี่ย กล่าวคือ เราคูณค่าคลาดเคลื่อนเฉลี่ยของค่าเฉลี่ยด้วยปัจจัยบางอย่างที่ขึ้นอยู่กับระดับความเชื่อมั่น สำหรับค่าเฉลี่ยและความแตกต่างของค่าเฉลี่ย ค่าสัมประสิทธิ์ของนักเรียน (ค่าวิกฤตของเกณฑ์ของนักเรียน) จะใช้ค่าวิกฤตของเกณฑ์ z สำหรับส่วนแบ่งและส่วนต่างของหุ้น ผลคูณของสัมประสิทธิ์และข้อผิดพลาดเฉลี่ยสามารถเรียกได้ว่าเป็นข้อผิดพลาดส่วนเพิ่มของพารามิเตอร์นี้เช่น สูงสุดที่เราจะได้รับเมื่อประเมิน

ช่วงความเชื่อมั่นสำหรับ เลขคณิต : .

นี่คือค่าเฉลี่ยตัวอย่าง

ความคลาดเคลื่อนเฉลี่ยของค่าเฉลี่ยเลขคณิต

ส-ส่วนเบี่ยงเบนมาตรฐานตัวอย่าง

ฉ = น-1 (ค่าสัมประสิทธิ์ของนักเรียน).

ช่วงความเชื่อมั่นสำหรับ ความแตกต่างของวิธีการทางคณิตศาสตร์ :

นี่คือความแตกต่างระหว่างค่าเฉลี่ยตัวอย่าง

- ข้อผิดพลาดเฉลี่ยของความแตกต่างของวิธีการทางคณิตศาสตร์

s 1 ,s 2 -ตัวอย่างค่าเบี่ยงเบนมาตรฐาน

n1,n2

ค่าวิกฤตของเกณฑ์ของนักเรียนสำหรับระดับความสำคัญที่กำหนด a และจำนวนองศาอิสระ f=n1 +n2-2 (สัมประสิทธิ์ของนักเรียน).

ช่วงความเชื่อมั่นสำหรับ หุ้น :

.

d คือส่วนแบ่งตัวอย่าง

– ข้อผิดพลาดในการแบ่งปันโดยเฉลี่ย

– ขนาดตัวอย่าง (ขนาดกลุ่ม);

ช่วงความเชื่อมั่นสำหรับ แบ่งปันความแตกต่าง :

นี่คือความแตกต่างระหว่างส่วนแบ่งตัวอย่าง

คือความคลาดเคลื่อนเฉลี่ยของผลต่างระหว่างค่าเฉลี่ยเลขคณิต

n1,n2– ขนาดตัวอย่าง (จำนวนกลุ่ม)

ค่าวิกฤตของเกณฑ์ z ที่ระดับนัยสำคัญที่กำหนด a ( , , )

โดยการคำนวณช่วงความเชื่อมั่นสำหรับความแตกต่างในตัวบ่งชี้ ประการแรก เราจะเห็นค่าที่เป็นไปได้ของผลกระทบโดยตรง ไม่ใช่แค่การประมาณการจุดเท่านั้น ประการที่สอง เราสามารถสรุปเกี่ยวกับการยอมรับหรือการหักล้างของสมมติฐานว่าง และประการที่สาม เราสามารถสรุปเกี่ยวกับอำนาจของเกณฑ์

เมื่อทดสอบสมมติฐานโดยใช้ช่วงความเชื่อมั่น เราต้องปฏิบัติตาม กฎถัดไป:

หากช่วงความเชื่อมั่นร้อยละ 100 (1-a) - เปอร์เซ็นต์ของความแตกต่างเฉลี่ยไม่มีศูนย์ แสดงว่าความแตกต่างมีนัยสำคัญทางสถิติที่ระดับนัยสำคัญ ในทางตรงกันข้าม หากช่วงเวลานี้มีศูนย์ แสดงว่าความแตกต่างนั้นไม่มีนัยสำคัญทางสถิติ

แท้จริงแล้ว หากช่วงเวลานี้มีค่าศูนย์ แสดงว่าตัวบ่งชี้ที่เปรียบเทียบสามารถมีมากหรือน้อยในกลุ่มใดกลุ่มหนึ่งเมื่อเทียบกับอีกกลุ่มหนึ่ง กล่าวคือ ความแตกต่างที่สังเกตได้นั้นเป็นแบบสุ่ม

โดยตำแหน่งที่ศูนย์อยู่ภายในช่วงความเชื่อมั่น เราสามารถตัดสินพลังของเกณฑ์ได้ หากศูนย์อยู่ใกล้กับขีดจำกัดล่างหรือบนของช่วงเวลา อาจมีกลุ่มเปรียบเทียบจำนวนมากขึ้น ความแตกต่างจะมีนัยสำคัญทางสถิติ หากศูนย์อยู่ใกล้ตรงกลางของช่วงเวลา แสดงว่าทั้งการเพิ่มขึ้นและลดลงของตัวบ่งชี้ใน กลุ่มทดลองและคงไม่มีความแตกต่างกันจริงๆ

ตัวอย่าง:

เพื่อเปรียบเทียบอัตราการเสียชีวิตจากการผ่าตัดเมื่อใช้ยาสลบสองประเภทที่แตกต่างกัน: ผู้ป่วย 61 รายได้รับการผ่าตัดโดยใช้การดมยาสลบแบบแรก เสียชีวิต 8 ราย ใช้ครั้งที่สอง 67 ราย เสียชีวิต 10 ราย

d 1 \u003d 8/61 \u003d 0.131; d 2 \u003d 10/67 \u003d 0.149; d1-d2 = - 0.018.

ความแตกต่างของอัตราตายของวิธีที่เปรียบเทียบจะอยู่ในช่วง (-0.018 - 0.122; -0.018 + 0.122) หรือ (-0.14; 0.104) โดยมีความน่าจะเป็น 100(1-a) = 95% ช่วงเวลาประกอบด้วยศูนย์ กล่าวคือ สมมติฐานเกี่ยวกับการตายเดียวกันในสอง ประเภทต่างๆการวางยาสลบไม่สามารถปฏิเสธได้

ดังนั้นการตายสามารถและจะลดลงถึง 14% และเพิ่มขึ้นเป็น 10.4% โดยมีความน่าจะเป็น 95% เช่น ศูนย์นั้นอยู่ตรงกลางของช่วงเวลาโดยประมาณ ดังนั้นจึงสามารถโต้แย้งได้ว่า เป็นไปได้มากว่าวิธีการทั้งสองนี้ไม่ได้มีความแตกต่างกันในด้านความร้ายแรง

ในตัวอย่างที่พิจารณาก่อนหน้านี้ เปรียบเทียบเวลาเฉลี่ยในการแตะของนักเรียนสี่กลุ่มที่แตกต่างกันในคะแนนสอบ มาคำนวณช่วงความเชื่อมั่นของเวลากดเฉลี่ยสำหรับนักเรียนที่สอบผ่านเป็นช่วงที่ 2 และ 5 และช่วงความเชื่อมั่นสำหรับผลต่างระหว่างค่าเฉลี่ยเหล่านี้กัน

ค่าสัมประสิทธิ์ของนักเรียนหาได้จากตารางการแจกแจงของนักเรียน (ดูภาคผนวก): สำหรับกลุ่มแรก: = t(0.05;48) = 2.011; สำหรับกลุ่มที่สอง: = t(0.05;61) = 2.000 ดังนั้น ช่วงความเชื่อมั่นสำหรับกลุ่มแรก: = (162.19-2.011 * 2.18; 162.19 + 2.011 * 2.18) = (157.8; 166.6) สำหรับกลุ่มที่สอง (156.55- 2.000*1.88 ; 156.55+2.000*1.88) = (152.88) ; 160.3). ดังนั้นสำหรับผู้ที่สอบผ่านสำหรับ 2 ช่วงเวลาการกดเฉลี่ยอยู่ในช่วง 157.8 ms ถึง 166.6 ms โดยมีความน่าจะเป็น 95% สำหรับผู้ที่ผ่านการสอบเป็นเวลา 5 - จาก 152.8 ms ถึง 160.3 ms โดยมีความน่าจะเป็น 95% .

คุณยังสามารถทดสอบสมมติฐานว่างโดยใช้ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ย ไม่ใช่แค่สำหรับความแตกต่างของค่าเฉลี่ยเท่านั้น ตัวอย่างเช่น ในกรณีของเรา หากช่วงความเชื่อมั่นของค่าเฉลี่ยคาบเกี่ยวกัน สมมติฐานว่างไม่สามารถปฏิเสธได้ เพื่อที่จะปฏิเสธสมมติฐานที่ระดับนัยสำคัญที่เลือก ช่วงความเชื่อมั่นที่สอดคล้องกันจะต้องไม่ทับซ้อนกัน

หาช่วงความเชื่อมั่นสำหรับความแตกต่างของเวลากดเฉลี่ยในกลุ่มที่สอบผ่านสำหรับ 2 และ 5 ความแตกต่างในค่าเฉลี่ย: 162.19 - 156.55 = 5.64 ค่าสัมประสิทธิ์ของนักเรียน: \u003d t (0.05; 49 + 62-2) \u003d t (0.05; 109) \u003d 1.982 ส่วนเบี่ยงเบนมาตรฐานของกลุ่มจะเท่ากับ: ; . เราคำนวณข้อผิดพลาดเฉลี่ยของความแตกต่างระหว่างวิธีการ: ช่วงความเชื่อมั่น: \u003d (5.64-1.982 * 2.87; 5.64 + 1.982 * 2.87) \u003d (-0.044; 11.33)

ดังนั้น ความแตกต่างของเวลากดเฉลี่ยในกลุ่มที่สอบผ่านที่ 2 และ 5 จะอยู่ในช่วงตั้งแต่ -0.044 ms ถึง 11.33 ms ช่วงเวลานี้รวมศูนย์ กล่าวคือ เวลาเร่งด่วนโดยเฉลี่ยสำหรับผู้ที่สอบผ่านโดยมีผลการเรียนดีเยี่ยมสามารถเพิ่มขึ้นหรือลดลงได้เมื่อเทียบกับผู้ที่สอบผ่านอย่างไม่น่าพอใจ กล่าวคือ สมมติฐานว่างไม่สามารถปฏิเสธได้ แต่ศูนย์อยู่ใกล้กับขีด จำกัด ล่างมาก เวลาในการกดมักจะลดลงสำหรับผู้ส่งบอลที่ยอดเยี่ยม ดังนั้น เราสามารถสรุปได้ว่ายังมีความแตกต่างในเวลาในการคลิกเฉลี่ยระหว่างผู้ที่ผ่านไป 2 และ 5 เราไม่สามารถตรวจพบการเปลี่ยนแปลงในช่วงเวลาเฉลี่ย การแพร่กระจายของเวลาเฉลี่ยและขนาดตัวอย่าง



พลังของการทดสอบคือความน่าจะเป็นที่จะปฏิเสธสมมติฐานว่างที่ไม่ถูกต้อง กล่าวคือ ค้นหาความแตกต่างที่พวกเขาอยู่จริงๆ

พลังของการทดสอบพิจารณาจากระดับนัยสำคัญ ขนาดของความแตกต่างระหว่างกลุ่ม การแพร่กระจายของค่าในกลุ่ม และขนาดกลุ่มตัวอย่าง

สำหรับการทดสอบ t และการวิเคราะห์ความแปรปรวนของนักเรียน สามารถใช้แผนภูมิความไวได้

พลังของเกณฑ์สามารถใช้ในการกำหนดเบื้องต้นของจำนวนกลุ่มที่ต้องการ

ช่วงความเชื่อมั่นจะแสดงภายในสิ่งที่จำกัดค่าที่แท้จริงของพารามิเตอร์ที่ประมาณไว้กับความน่าจะเป็นที่กำหนด

ด้วยความช่วยเหลือของช่วงความมั่นใจ คุณสามารถทดสอบสมมติฐานทางสถิติและสรุปผลเกี่ยวกับความอ่อนไหวของเกณฑ์ได้

วรรณกรรม.

Glantz S. - บทที่ 6.7

Rebrova O.Yu. - หน้า 112-114, หน้า 171-173, หน้า 234-238

Sidorenko E. V. - หน้า 32-33.

คำถามสอบนักเรียนเอง.

1. อำนาจของเกณฑ์คืออะไร?

2. ในกรณีใดบ้างที่จำเป็นต้องประเมินพลังของเกณฑ์?

3. วิธีการคำนวณกำลังไฟฟ้า

6. จะทดสอบสมมติฐานทางสถิติโดยใช้ช่วงความมั่นใจได้อย่างไร?

7. สิ่งที่สามารถพูดเกี่ยวกับพลังของเกณฑ์เมื่อคำนวณช่วงความเชื่อมั่น?

งาน

มีอะไรให้อ่านอีกบ้าง