Hva gir konfidensintervallet. Kvantitative analysemetoder: Estimering av konfidensintervaller

La oss bygge et konfidensintervall i MS EXCEL for å estimere middelverdien av fordelingen i tilfellet kjent verdi spredning.

Selvfølgelig valget nivå av tillit helt avhengig av oppgaven. Dermed bør graden av tillit hos flypassasjeren til påliteligheten til flyet, selvfølgelig, være høyere enn graden av tillit hos kjøperen til lyspærens pålitelighet.

Oppgaveformulering

La oss anta at fra befolkning har tatt prøve størrelse n. Det antas at standardavvik denne fordelingen er kjent. Nødvendig på bakgrunn av dette prøver vurdere det ukjente distribusjonsmiddel(μ, ) og konstruer tilsvarende bilateralt konfidensintervall.

Poengvurdering

Som kjent fra statistikk(la oss kalle det X jfr) er en objektivt estimat av gjennomsnittet dette befolkning og har fordelingen N(μ;σ 2 /n).

Merk: Hva om du trenger å bygge konfidensintervall ved distribusjon, som er ikke normal? I dette tilfellet kommer til unnsetning, som sier at med nok stor størrelse prøver n fra distribusjon ikke- normal, utvalgsfordeling av statistikk Х av vil omtrent tilsvare normal distribusjon med parametere N(μ;σ 2 /n).

Så, punktestimat midten distribusjonsverdier vi har er prøvegjennomsnitt, dvs. X jfr. La oss nå bli opptatt konfidensintervall.

Bygge et konfidensintervall

Vanligvis, når vi kjenner fordelingen og dens parametere, kan vi beregne sannsynligheten for at en tilfeldig variabel vil ta en verdi fra intervallet vi spesifiserte. La oss nå gjøre det motsatte: finn intervallet der den tilfeldige variabelen faller med en gitt sannsynlighet. For eksempel fra eiendommer normal distribusjon det er kjent at med en sannsynlighet på 95 % er en tilfeldig variabel fordelt over normal lov, vil falle inn i intervallet ca +/- 2 fra middelverdi(se artikkel om). Dette intervallet vil fungere som vår prototype for konfidensintervall.

La oss nå se om vi kjenner fordelingen , å beregne dette intervallet? For å svare på spørsmålet må vi spesifisere distribusjonsformen og dens parametere.

Vi vet distribusjonsformen er normal distribusjon(husk at vi snakker om prøvetakingsfordeling statistikk X jfr).

Parameteren μ er ukjent for oss (den må bare estimeres ved å bruke konfidensintervall), men vi har anslaget X jf, beregnet ut fra prøve, som kan brukes.

Den andre parameteren er prøve gjennomsnittlig standardavvik vil bli kjent, den er lik σ/√n.

Fordi vi vet ikke μ, da bygger vi intervallet +/- 2 standardavvik ikke fra middelverdi, men fra dets kjente anslag X jfr. De. ved beregning konfidensintervall det vil vi IKKE anta X jfr vil falle innenfor intervallet +/- 2 standardavvik fra μ med en sannsynlighet på 95 %, og vi vil anta at intervallet er +/- 2 standardavvik fra X jfr med en sannsynlighet på 95 % vil dekke μ - gjennomsnittet av den generelle befolkningen, hvorfra prøve. Disse to påstandene er likeverdige, men den andre påstanden lar oss konstruere konfidensintervall.

I tillegg avgrenser vi intervallet: en tilfeldig variabel fordelt over normal lov, med 95 % sannsynlighet faller innenfor intervallet +/- 1,960 standardavvik, ikke +/- 2 standardavvik. Dette kan beregnes ved hjelp av formelen \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. eksempelfil Arkavstand.

Nå kan vi formulere en sannsynlighetserklæring som vil tjene oss til å danne konfidensintervall:
"Sannsynligheten for at befolkningsmiddel ligger fra prøvegjennomsnitt innenfor 1.960" standardavvik for prøvegjennomsnittet", er lik 95 %.

Sannsynlighetsverdien nevnt i utsagnet har et spesielt navn , som er knyttet til signifikansnivå α (alfa) ved et enkelt uttrykk tillitsnivå =1 . I vårt tilfelle Signifikansnivå α =1-0,95=0,05 .

Nå, basert på denne sannsynlighetserklæringen, skriver vi et uttrykk for beregning konfidensintervall:

hvor Zα/2 standard normal distribusjon(en slik verdi av en tilfeldig variabel z, hva P(z>=Zα/2 )=α/2).

Merk: Øvre α/2-kvantil definerer bredden konfidensintervall i standardavvik prøvegjennomsnitt. Øvre α/2-kvantil standard normal distribusjon er alltid større enn 0, noe som er veldig praktisk.

I vårt tilfelle, ved α=0,05, øvre α/2-kvantil tilsvarer 1,960. For andre signifikansnivåer α (10 %; 1 %) øvre α/2-kvantil Zα/2 kan beregnes ved å bruke formelen \u003d NORM.ST.OBR (1-α / 2) eller, hvis kjent tillitsnivå, =NORM.ST.OBR((1+konfidensnivå)/2).

Vanligvis når man bygger konfidensintervaller for å estimere gjennomsnittet kun bruk øvre α/2-kvantil og ikke bruk lavere α/2-kvantil. Dette er mulig pga standard normal distribusjon symmetrisk om x-aksen ( tettheten av distribusjonen symmetrisk om gjennomsnittlig, dvs. 0). Derfor er det ikke nødvendig å beregne lavere α/2-kvantil(det kalles ganske enkelt α /2-kvantil), fordi det er likt øvre α/2-kvantil med et minustegn.

Husk at, uavhengig av formen på fordelingen av x, den tilsvarende tilfeldige variabelen X jfr distribuert omtrent fint N(μ;σ 2 /n) (se artikkel om). Derfor, generelt, uttrykket ovenfor for konfidensintervall er bare omtrentlig. Hvis x er fordelt over normal lov N(μ;σ 2 /n), deretter uttrykket for konfidensintervall er nøyaktig.

Beregning av konfidensintervall i MS EXCEL

La oss løse problemet.
Responstiden til en elektronisk komponent på et inngangssignal er viktig egenskap enheter. En ingeniør ønsker å plotte et konfidensintervall for gjennomsnittlig responstid på et konfidensnivå på 95 %. Av tidligere erfaring vet ingeniøren at standardavviket for responstiden er 8 ms. Det er kjent at ingeniøren gjorde 25 målinger for å estimere responstiden, gjennomsnittsverdien var 78 ms.

Beslutning: Ingeniør vil vite responstiden elektronisk apparat, men han forstår at responstiden ikke er fast, men en tilfeldig variabel som har sin egen fordeling. Så det beste han kan håpe på er å bestemme parametrene og formen til denne fordelingen.

Ut fra problemets tilstand vet vi dessverre ikke formen for fordelingen av responstiden (det trenger ikke være normal). , denne fordelingen er også ukjent. Bare han er kjent standardavvikσ=8. Derfor, mens vi ikke kan beregne sannsynlighetene og konstruere konfidensintervall.

Men selv om vi ikke kjenner fordelingen tid separat svar, det vet vi iht CPT, prøvetakingsfordeling gjennomsnittlig responstid er ca normal(vi vil anta at betingelsene CPT utføres, fordi størrelsen prøver stor nok (n=25)) .

Dessuten, den gjennomsnittlige denne fordelingen er lik middelverdi enhetsresponsfordelinger, dvs. μ. MEN standardavvik av denne fordelingen (σ/√n) kan beregnes ved å bruke formelen =8/ROOT(25) .

Det er også kjent at ingeniøren mottok punktestimat parameter μ lik 78 ms (X cf). Derfor kan vi nå beregne sannsynlighetene, fordi vi kjenner distribusjonsformen ( normal) og dens parametere (Х ср og σ/√n).

Ingeniøren vil vite det forventet verdiμ av responstidsfordelingen. Som nevnt ovenfor er denne μ lik forventning til utvalgsfordelingen av gjennomsnittlig responstid. Hvis vi bruker normal distribusjon N(X cf; σ/√n), da vil den ønskede μ være i området +/-2*σ/√n med en sannsynlighet på omtrent 95 %.

Signifikansnivå tilsvarer 1-0,95=0,05.

Finn til slutt venstre og høyre kantlinje konfidensintervall.
Venstre kantlinje: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / ROT (25) = 74,864
Høyre kantlinje: \u003d 78 + NORM. ST. OBR (1-0.05 / 2) * 8 / ROT (25) \u003d 81.136

Venstre kantlinje: =NORM.INV(0,05/2; 78; 8/SQRT(25))
Høyre kantlinje: =NORM.INV(1-0,05/2; 78; 8/SQRT(25))

Svar: konfidensintervall95 % konfidensnivå og σ=8msek er lik 78+/-3,136 ms

eksempelfil på ark Sigma kjent laget et skjema for beregning og konstruksjon bilateralt konfidensintervall for vilkårlig prøver med en gitt σ og Signifikansnivå.

CONFIDENCE.NORM()-funksjonen

Hvis verdiene prøver er i området B20:B79 , a Signifikansnivå lik 0,05; deretter MS EXCEL formel:
=GJENNOMSNITT(B20:B79)-CONFIDENCE(0,05;σ; ANTALL(B20:B79))
vil returnere venstre kantlinje konfidensintervall.

Den samme grensen kan beregnes ved å bruke formelen:
=GJENNOMSNITT(B20:B79)-NORM.ST.INV(1-0,05/2)*σ/SQRT(ANTALL(B20:B79))

Merk: TRUST.NORM()-funksjonen dukket opp i MS EXCEL 2010. Tidligere versjoner av MS EXCEL brukte TRUST()-funksjonen.

Konfidensintervaller ( Engelsk Konfidensintervaller) en av typene intervallestimater som brukes i statistikk, som beregnes for et gitt signifikansnivå. De lar oss komme med en uttalelse om at den sanne verdien av en ukjent statistisk parameter for den generelle befolkningen er i det oppnådde verdiområdet med en sannsynlighet gitt av det valgte nivået. Statistisk signifikant.

Normal distribusjon

Når variansen (σ 2 ) til populasjonen av data er kjent, kan en z-score brukes til å beregne konfidensgrenser (grensepunkter for konfidensintervallet). Sammenlignet med å bruke en t-fordeling vil bruk av en z-score ikke bare gi et smalere konfidensintervall, men også gi mer pålitelige estimater av gjennomsnittet og standardavviket (σ), siden Z-skåren er basert på en normalfordeling.

Formel

For å bestemme grensepunktene for konfidensintervallet, forutsatt at standardavviket for datapopulasjonen er kjent, brukes følgende formel

L = X - Z a/2 σ
√n

Eksempel

Anta at utvalgsstørrelsen er 25 observasjoner, utvalgsgjennomsnittet er 15, og populasjonens standardavvik er 8. For et signifikansnivå på α=5 % er Z-skåren Z α/2 =1,96. I dette tilfellet vil den nedre og øvre grensen for konfidensintervallet være

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Dermed kan vi slå fast at med en sannsynlighet på 95 % vil den matematiske forventningen til den generelle befolkningen falle i området fra 11.864 til 18.136.

Metoder for å begrense konfidensintervallet

La oss si at utvalget er for bredt for formålet med vår studie. Det er to måter å redusere konfidensintervallområdet på.

  1. Reduser nivået av statistisk signifikans α.
  2. Øk prøvestørrelsen.

Ved å redusere nivået av statistisk signifikans til α=10 %, får vi en Z-score lik Z α/2 =1,64. I dette tilfellet vil de nedre og øvre grensene for intervallet være

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Og selve konfidensintervallet kan skrives som

I dette tilfellet kan vi anta at med en sannsynlighet på 90 % vil den matematiske forventningen til den generelle befolkningen falle innenfor området.

Hvis vi ønsker å beholde nivået av statistisk signifikans α, så er det eneste alternativet å øke prøvestørrelsen. Øker den til 144 observasjoner, får vi følgende verdier for konfidensgrensene

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Selve konfidensintervallet vil se slik ut:

Derfor er det kun mulig å begrense konfidensintervallet uten å redusere nivået av statistisk signifikans ved å øke utvalgsstørrelsen. Hvis det ikke er mulig å øke utvalgsstørrelsen, kan innsnevringen av konfidensintervallet oppnås utelukkende ved å redusere nivået av statistisk signifikans.

Bygge et konfidensintervall for en ikke-normal fordeling

Hvis standardavviket til populasjonen ikke er kjent eller fordelingen er ikke-normal, brukes t-fordelingen til å konstruere et konfidensintervall. Denne teknikken er mer konservativ, som kommer til uttrykk i bredere konfidensintervaller, sammenlignet med teknikken basert på Z-score.

Formel

Følgende formler brukes til å beregne nedre og øvre grenser for konfidensintervallet basert på t-fordelingen

L = X - tα σ
√n

Studentens fordeling eller t-fordeling avhenger av bare én parameter - antall frihetsgrader, som er lik antall individuelle funksjonsverdier (antall observasjoner i utvalget). Verdien av Elevens t-test for et gitt antall frihetsgrader (n) og nivået av statistisk signifikans α finner du i oppslagstabellene.

Eksempel

Anta at prøvestørrelsen er 25 individuelle verdier, gjennomsnittsverdien av prøven er 50, og standardavviket til prøven er 28. Du må konstruere et konfidensintervall for nivået av statistisk signifikans α=5%.

I vårt tilfelle er antallet frihetsgrader 24 (25-1), derfor er den tilsvarende tabellverdien til Students t-test for nivået av statistisk signifikans α=5 % 2,064. Derfor vil de nedre og øvre grensene for konfidensintervallet være

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

Og selve intervallet kan skrives som

Dermed kan vi slå fast at med en sannsynlighet på 95 % vil den matematiske forventningen til befolkningen generelt ligge i området.

Ved å bruke en t-fordeling kan du begrense konfidensintervallet, enten ved å redusere statistisk signifikans eller ved å øke utvalgsstørrelsen.

Ved å redusere den statistiske signifikansen fra 95 % til 90 % under betingelsene i vårt eksempel, får vi den tilsvarende tabellverdien til Students t-test 1.711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

I dette tilfellet kan vi si at med en sannsynlighet på 90% vil den matematiske forventningen til den generelle befolkningen være i området.

Hvis vi ikke ønsker å redusere statistisk signifikans, så er det eneste alternativet å øke utvalgsstørrelsen. La oss si at det er 64 individuelle observasjoner, og ikke 25 som i starttilstanden til eksemplet. Tabellverdien til Students t-test for 63 frihetsgrader (64-1) og nivået av statistisk signifikans α=5 % er 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Dette gir oss muligheten til å hevde at med en sannsynlighet på 95 % vil den matematiske forventningen til befolkningen generelt være innenfor området.

Store prøver

Store utvalg er utvalg fra en datapopulasjon med mer enn 100 enkeltobservasjoner.Statistiske studier har vist at større utvalg har en tendens til å være normalfordelt, selv om fordelingen av populasjonen ikke er normal. I tillegg, for slike prøver, gir bruk av z-score og t-fordelinger omtrent de samme resultatene når man konstruerer konfidensintervaller. For store utvalg er det altså akseptabelt å bruke en z-score for en normalfordeling i stedet for en t-fordeling.

Oppsummering

«Katren-Style» fortsetter publiseringen av Konstantin Kravchiks serie om medisinsk statistikk. I to tidligere artikler har forfatteren vært inne på forklaringen av slike begreper som og.

Konstantin Kravchik

Matematiker-analytiker. Spesialist innen statistisk forskning innen medisin og humaniora

Moskva by

Svært ofte i artikler om kliniske studier kan du finne en mystisk setning: "konfidensintervall" (95 % CI eller 95 % CI – konfidensintervall). For eksempel kan en artikkel si: "Studentens t-test ble brukt til å vurdere betydningen av forskjeller, med et 95 % konfidensintervall beregnet."

Hva er verdien av "95 % konfidensintervall" og hvorfor beregne det?

Hva er et konfidensintervall? – Dette er området der de sanne middelverdiene i befolkningen faller. Og hva, det er "usanne" gjennomsnitt? På en måte, ja, det gjør de. I forklarte vi at det er umulig å måle parameteren av interesse i hele populasjonen, så forskerne nøyer seg med et begrenset utvalg. I dette utvalget (for eksempel etter kroppsvekt) er det én gjennomsnittsverdi (en viss vekt), som vi bedømmer gjennomsnittsverdien i hele befolkningen generelt etter. Imidlertid neppe gjennomsnittsvekt i et utvalg (spesielt et lite) vil falle sammen med gjennomsnittsvekten i befolkningen generelt. Derfor er det mer riktig å beregne og bruke rekkevidden av gjennomsnittsverdier for den generelle befolkningen.

Anta for eksempel at 95 % konfidensintervall (95 % KI) for hemoglobin er mellom 110 og 122 g/l. Dette betyr at med 95 % sannsynlighet vil den sanne gjennomsnittsverdien for hemoglobin i den generelle befolkningen være i området fra 110 til 122 g/L. Vi vet med andre ord ikke gjennomsnitt hemoglobin i den generelle befolkningen, men vi kan indikere rekkevidden av verdier for denne funksjonen med 95% sannsynlighet.

Konfidensintervaller er spesielt relevante for forskjellen i middel mellom grupper, eller det som kalles effektstørrelsen.

Anta at vi sammenlignet effektiviteten til to jernpreparater: en som har vært på markedet lenge og en som nettopp er registrert. Etter behandlingsforløpet ble konsentrasjonen av hemoglobin i de studerte pasientgruppene vurdert, og det statistiske programmet beregnet for oss at forskjellen mellom gjennomsnittsverdiene til de to gruppene med en sannsynlighet på 95 % er i området fra 1,72 til 14,36 g/l (tabell 1).

Tab. 1. Kriterium for uavhengige utvalg
(gruppene sammenlignes etter hemoglobinnivå)

Dette skal tolkes slik: Hos en del av pasientene i den generelle befolkningen som tar et nytt legemiddel, vil hemoglobin i gjennomsnitt være høyere med 1,72–14,36 g/l enn hos de som tok et allerede kjent legemiddel.

Med andre ord, i den generelle befolkningen er forskjellen i gjennomsnittsverdiene for hemoglobin i grupper med 95% sannsynlighet innenfor disse grensene. Det vil være opp til forskeren å vurdere om dette er mye eller lite. Poenget med alt dette er at vi ikke jobber med én gjennomsnittsverdi, men med en rekke verdier, derfor estimerer vi mer pålitelig forskjellen i en parameter mellom grupper.

I statistiske pakker, etter forskerens skjønn, kan man uavhengig begrense eller utvide grensene for konfidensintervallet. Ved å senke sannsynlighetene for konfidensintervallet, begrenser vi middelområdet. For eksempel, ved 90 % KI vil området for gjennomsnitt (eller gjennomsnittlige forskjeller) være smalere enn ved 95 % KI.

Omvendt, øker sannsynligheten til 99 % utvider verdiområdet. Ved sammenligning av grupper kan den nedre grensen for CI krysse nullmerket. For eksempel, hvis vi utvidet grensene for konfidensintervallet til 99 %, varierte grensene for intervallet fra –1 til 16 g/L. Dette betyr at i den generelle befolkningen er det grupper, hvor forskjellen mellom gjennomsnittene for den studerte egenskapen er 0 (M = 0).

Konfidensintervaller kan brukes til å teste statistiske hypoteser. Hvis konfidensintervallet krysser null, er nullhypotesen, som antar at gruppene ikke er forskjellige i den studerte parameteren, sann. Et eksempel er beskrevet ovenfor, da vi utvidet grensene til 99 %. Et sted i den generelle befolkningen fant vi grupper som ikke var forskjellige på noen måte.

95 % konfidensintervall for forskjell i hemoglobin, (g/l)


Figuren viser 95 % konfidensintervall for gjennomsnittlig hemoglobinforskjell mellom de to gruppene som en linje. Linjen passerer null-merket, derfor er det en forskjell mellom gjennomsnittsverdiene, null, som bekrefter nullhypotesen om at gruppene ikke er forskjellige. Forskjellen mellom gruppene varierer fra -2 til 5 g/l, noe som betyr at hemoglobin enten kan reduseres med 2 g/l eller øke med 5 g/l.

Konfidensintervall - veldig viktig indikator. Takket være den kan du se om forskjellene i gruppene virkelig skyldtes forskjellen i gjennomsnitt eller på grunn av et stort utvalg, for med et stort utvalg er sjansene for å finne forskjeller større enn med et lite.

I praksis kan det se slik ut. Vi tok en prøve på 1000 personer, målte hemoglobinnivået og fant ut at konfidensintervallet for forskjellen i gjennomsnittet ligger fra 1,2 til 1,5 g/L. Nivået av statistisk signifikans i dette tilfellet s

Vi ser at hemoglobinkonsentrasjonen økte, men nesten umerkelig, derfor dukket den statistiske signifikansen opp nettopp på grunn av prøvestørrelsen.

Konfidensintervaller kan beregnes ikke bare for gjennomsnitt, men også for proporsjoner (og risikoforhold). For eksempel er vi interessert i konfidensintervallet for andelen pasienter som oppnådde remisjon mens de tok det utviklede stoffet. Anta at 95 % KI for proporsjoner, dvs. for andelen slike pasienter, er i området 0,60–0,80. Dermed kan vi si at medisinen vår har en terapeutisk effekt i 60 til 80 % av tilfellene.

Analysen av tilfeldige feil er basert på teorien om tilfeldige feil, som gjør det mulig, med en viss garanti, å beregne den faktiske verdien av målt mengde og vurdere mulige feil.

Grunnlaget for teorien om tilfeldige feil er følgende forutsetninger:

med et stort antall målinger forekommer tilfeldige feil av samme størrelse, men med et annet fortegn, like ofte;

store feil er mindre vanlige enn små (sannsynligheten for en feil avtar med en økning i verdien);

med et uendelig stort antall målinger er den sanne verdien av den målte mengden lik det aritmetiske gjennomsnittet av alle måleresultater;

utseendet til et eller annet måleresultat som en tilfeldig hendelse er beskrevet av normalfordelingsloven.

I praksis skilles det mellom et generelt og et prøvesett av målinger.

Under den generelle befolkningen innebære hele settet med mulige måleverdier eller mulige feilverdier
.

For utvalgspopulasjon antall målinger begrenset, og i hvert tilfelle strengt definert. De tror at hvis
, deretter gjennomsnittsverdien av dette settet med målinger nær nok til sin sanne verdi.

1. Intervallestimering ved bruk av konfidenssannsynlighet

For et stort utvalg og en normalfordelingslov er den generelle vurderingskarakteristikken for målingen variansen
og variasjonskoeffisient :

;
. (1.1)

Dispersjon karakteriserer homogeniteten til en måling. Den høyere
, jo større målspredning.

Variasjonskoeffisienten karakteriserer variabilitet. Den høyere , jo større variasjon av målingene i forhold til middelverdiene.

For å vurdere påliteligheten til måleresultatene, tas begrepene konfidensintervall og konfidenssannsynlighet i betraktning.

Klarert kalles intervallet verdier , der den sanne verdien faller målt mengde med en gitt sannsynlighet.

Tillit Sannsynlighet (reliabilitet) av en måling er sannsynligheten for at den sanne verdien av den målte størrelsen faller innenfor et gitt konfidensintervall, dvs. til sonen
. Denne verdien bestemmes i brøkdeler av en enhet eller i prosent.

,

hvor
- integrert Laplace-funksjon ( tabell 1.1 )

Den integrerte Laplace-funksjonen er definert av følgende uttrykk:

.

Argumentet til denne funksjonen er garantifaktor :

Tabell 1.1

Integrert Laplace-funksjon

Hvis det på grunnlag av visse data etableres en konfidenssannsynlighet (ofte tatt for å være
), og sett deretter nøyaktighet av målinger (konfidensintervall
) basert på forholdet

.

Halvparten av konfidensintervallet er

, (1.3)

hvor
- argument for Laplace-funksjonen, if
(tabell 1.1 );

- Elevens funksjoner, hvis
(tabell 1.2 ).

Dermed karakteriserer konfidensintervallet målenøyaktigheten til en gitt prøve, og konfidensnivået karakteriserer målingens pålitelighet.

Eksempel

Ferdig
målinger av styrken til veibanen på stedet hovedvei med en gjennomsnittlig elastisitetsmodul
og den beregnede verdien av standardavviket
.

Nødvendig bestemme den nødvendige nøyaktigheten mål for ulike nivåer selvtillitsnivå
, tar verdiene tabell 1.1 .

I dette tilfellet, henholdsvis |

Derfor, for et gitt måleverktøy og -metode, øker konfidensintervallet med ca ganger hvis du øker bare på
.

Konfidensintervaller.

Beregningen av konfidensintervallet er basert på gjennomsnittsfeilen til den tilsvarende parameteren. Konfidensintervall viser innenfor hvilke grenser med sannsynlighet (1-a) er den sanne verdien av den estimerte parameteren. Her er a signifikansnivået, (1-a) kalles også konfidensnivået.

I det første kapittelet viste vi at for eksempel for det aritmetiske gjennomsnittet, ligger det sanne populasjonsmiddelet innenfor 2 gjennomsnittsfeil av gjennomsnittet omtrent 95 % av tiden. Dermed vil grensene for 95 % konfidensintervallet for gjennomsnittet være fra prøvegjennomsnittet med to ganger gjennomsnittsfeilen til gjennomsnittet, dvs. vi multipliserer middelfeilen til gjennomsnittet med en faktor som avhenger av konfidensnivået. For gjennomsnittet og differansen av middelene tas studentens koeffisient (den kritiske verdien av studentens kriterium), for andelen og differansen til andelene, den kritiske verdien av z-kriteriet. Produktet av koeffisienten og gjennomsnittsfeilen kan kalles marginalfeilen til denne parameteren, dvs. det maksimale vi kan få når vi evaluerer det.

Konfidensintervall for aritmetisk gjennomsnitt : .

Her er prøvegjennomsnittet;

Gjennomsnittlig feil av det aritmetiske gjennomsnittet;

s- prøve standardavvik;

n

f = n-1 (Elevens koeffisient).

Konfidensintervall for forskjell på aritmetiske middelverdier :

Her er forskjellen mellom prøvemidlene;

- den gjennomsnittlige feilen for forskjellen mellom aritmetiske midler;

s 1 , s 2 - prøve standardavvik;

n1,n2

Kritisk verdi av Studentens kriterium for et gitt betydningsnivå a og antall frihetsgrader f=n1 +n2-2 (Elevens koeffisient).

Konfidensintervall for aksjer :

.

Her er d prøveandelen;

– gjennomsnittlig aksjefeil;

n– prøvestørrelse (gruppestørrelse);

Konfidensintervall for dele forskjeller :

Her er forskjellen mellom prøveandelene;

er gjennomsnittsfeilen for forskjellen mellom de aritmetiske middelverdiene;

n1,n2– utvalgsstørrelser (antall grupper);

Den kritiske verdien av kriteriet z ved et gitt signifikansnivå a ( , , ).

Ved å beregne konfidensintervallene for forskjellen i indikatorer, ser vi for det første direkte de mulige verdiene av effekten, og ikke bare punktestimatet. For det andre kan vi trekke en konklusjon om aksept eller tilbakevisning av nullhypotesen, og for det tredje kan vi trekke en konklusjon om kraften til kriteriet.

Når man tester hypoteser ved bruk av konfidensintervaller må man forholde seg til neste regel:

Hvis 100(1-a)-prosent konfidensintervallet til den gjennomsnittlige forskjellen ikke inneholder null, så er forskjellene statistisk signifikante på a signifikansnivået; tvert imot, hvis dette intervallet inneholder null, er ikke forskjellene statistisk signifikante.

Faktisk, hvis dette intervallet inneholder null, betyr det at den sammenlignede indikatoren kan være enten mer eller mindre i en av gruppene sammenlignet med den andre, dvs. de observerte forskjellene er tilfeldige.

Etter stedet der null er plassert innenfor konfidensintervallet, kan man bedømme kraften til kriteriet. Hvis null er nær den nedre eller øvre grensen for intervallet, så kanskje med et større antall sammenlignede grupper, vil forskjellene nå statistisk signifikans. Hvis null er nær midten av intervallet, betyr det at både økning og reduksjon av indikatoren inn forsøksgruppe, og det er vel egentlig ingen forskjeller.

Eksempler:

For å sammenligne operasjonell dødelighet ved bruk av to forskjellige typer anestesi: 61 personer ble operert med den første typen anestesi, 8 døde, ved bruk av den andre - 67 personer, 10 døde.

d 1 \u003d 8/61 \u003d 0,131; d 2 \u003d 10/67 \u003d 0,149; d1-d2 = - 0,018.

Forskjellen i dødelighet for de sammenlignede metodene vil være i området (-0,018 - 0,122; -0,018 + 0,122) eller (-0,14; 0,104) med en sannsynlighet på 100(1-a) = 95%. Intervallet inneholder null, dvs. hypotese om samme dødelighet i to forskjellige typer anestesi kan ikke nektes.

Dermed kan og vil dødeligheten gå ned til 14 % og øke til 10,4 % med en sannsynlighet på 95 %, d.v.s. null er omtrent midt i intervallet, så det kan hevdes at disse to metodene mest sannsynlig ikke er forskjellige i dødelighet.

I eksemplet som ble vurdert tidligere, ble gjennomsnittlig tappetid sammenlignet i fire grupper av studenter som hadde ulik eksamenspoeng. La oss beregne konfidensintervallene for gjennomsnittlig pressetid for studenter som besto eksamen for 2 og 5 og konfidensintervallet for forskjellen mellom disse gjennomsnittene.

Elevens koeffisienter er funnet fra tabellene over Students fordeling (se vedlegg): for den første gruppen: = t(0,05;48) = 2,011; for den andre gruppen: = t(0,05;61) = 2,000. Dermed konfidensintervaller for den første gruppen: = (162.19-2.011 * 2.18; 162.19 + 2.011 * 2.18) = (157.8; 166.6) , for den andre gruppen (156.55- 2.000*1.5.80.05;+12.80.0) ; 160,3). Så, for de som besto eksamen for 2, varierer den gjennomsnittlige pressetiden fra 157,8 ms til 166,6 ms med en sannsynlighet på 95%, for de som besto eksamen for 5 - fra 152,8 ms til 160,3 ms med en sannsynlighet på 95% .

Du kan også teste nullhypotesen ved å bruke konfidensintervaller for middelene, og ikke bare for forskjellen i middelverdiene. For eksempel, som i vårt tilfelle, hvis konfidensintervallene for midlene overlapper, kan nullhypotesen ikke forkastes. For å forkaste en hypotese på et valgt signifikansnivå, må ikke de tilsvarende konfidensintervallene overlappe hverandre.

La oss finne konfidensintervallet for forskjellen i gjennomsnittlig pressetid i gruppene som besto eksamen for 2 og 5. Forskjellen i gjennomsnittene: 162,19 - 156,55 = 5,64. Elevens koeffisient: \u003d t (0,05; 49 + 62-2) \u003d t (0,05; 109) \u003d 1,982. Gruppestandardavvik vil være lik: ; . Vi beregner gjennomsnittsfeilen for differansen mellom gjennomsnittene: . Konfidensintervall: \u003d (5,64-1,982 * 2,87; 5,64 + 1,982 * 2,87) \u003d (-0,044; 11,33).

Så forskjellen i gjennomsnittlig pressetid i gruppene som besto eksamen klokken 2 og 5 vil være i området fra -0,044 ms til 11,33 ms. Dette intervallet inkluderer null, dvs. den gjennomsnittlige pressetiden for de som besto eksamen med utmerket resultat kan både øke og avta sammenlignet med de som har bestått eksamen utilfredsstillende, d.v.s. nullhypotesen kan ikke forkastes. Men null er veldig nær den nedre grensen, presstiden er mye mer sannsynlig å redusere for utmerkede passerere. Dermed kan vi konkludere med at det fortsatt er forskjeller i gjennomsnittlig klikktid mellom de som passerte med 2 og med 5, vi kunne bare ikke oppdage dem for en gitt endring i gjennomsnittlig tid, spredning av gjennomsnittlig tid og utvalgsstørrelser.



Testens kraft er sannsynligheten for å forkaste en feil nullhypotese, dvs. finne forskjeller der de egentlig er.

Kraften til testen bestemmes basert på signifikansnivået, størrelsen på forskjellene mellom grupper, spredningen av verdier i grupper og utvalgsstørrelsen.

For Students t-test og variansanalyse kan du bruke sensitivitetsdiagrammer.

Kraften til kriteriet kan brukes i den foreløpige bestemmelsen av det nødvendige antallet grupper.

Konfidensintervallet viser innenfor hvilke grenser den sanne verdien av den estimerte parameteren ligger med en gitt sannsynlighet.

Ved hjelp av konfidensintervaller kan du teste statistiske hypoteser og trekke konklusjoner om sensitiviteten til kriteriene.

LITTERATUR.

Glantz S. - Kapittel 6.7.

Rebrova O.Yu. - s.112-114, s.171-173, s.234-238.

Sidorenko E. V. - s. 32-33.

Spørsmål til egenundersøkelse av studenter.

1. Hva er kraften i kriteriet?

2. I hvilke tilfeller er det nødvendig å vurdere kriterienes makt?

3. Metoder for å beregne effekt.

6. Hvordan teste en statistisk hypotese ved hjelp av et konfidensintervall?

7. Hva kan sies om kraften til kriteriet ved beregning av konfidensintervallet?

Oppgaver.

Hva annet å lese