tilfeldige variabler. Diskret tilfeldig variabel Matematisk forventning

Definisjon av en tilfeldig variabel. Mange tilfeldige hendelser kan kvantifiseres ved hjelp av tilfeldige variabler.

Tilfeldig er en mengde som får verdier avhengig av en kombinasjon av tilfeldige omstendigheter.

Tilfeldige variabler er: antall pasienter på legekontoret, antall studenter i publikum, antall fødsler i byen, forventet levealder individuell person, hastigheten til et molekyl, lufttemperatur, en feil ved måling av en verdi osv. Hvis du nummererer ballene i en urne på omtrent samme måte som de gjør når du spiller en lottotrekning, vil en vilkårlig fjerning av en ball fra urn vil vise et tall som er en tilfeldig variabel.

Det er diskrete og kontinuerlige tilfeldige variabler.

En tilfeldig variabel kalles diskret hvis den tar et tellbart sett med verdier: antall bokstaver på en vilkårlig side i en bok, energien til et elektron i et atom, antall hår på en persons hode, antall korn i ørene, antall molekyler i et gitt volum av gass, etc.

kontinuerlige tilfeldig verdi tar hvilken som helst verdi innenfor et visst intervall: kroppstemperatur, kornmasse i hveteaks, koordinaten til stedet der kulen traff målet (vi tar kulen som et materiell punkt) osv.

Fordeling av en diskret tilfeldig variabel. En diskret tilfeldig variabel anses som gitt hvis mulige verdier og deres tilsvarende sannsynligheter er indikert. Angi en diskret tilfeldig variabel x, dets mening x 1 x 2,., og sannsynlighetene P(x 1)= p 1, P (x 2)= s 2 etc. Befolkning X og P kalles fordelingen av en diskret tilfeldig variabel(Tabell 1).

Tabell 1

Den tilfeldige variabelen er nummeret til sporten i spillet "Sportlo-10". Totalt antall arter er 49. Angi fordelingen av denne tilfeldige variabelen (tabell 3).

Tabell 3


Betydning 1 = 0 tilsvarer et slikt tilfelle der hendelsen tre ganger på rad MEN skjedde ikke. Sannsynligheten for denne komplekse hendelsen, i henhold til sannsy(2.6), er lik

Betydning jeg= 1 viser til tilfellet hvor hendelse A inntraff i en av de tre rettssakene. Ved formel (2.6) får vi

Siden kl l = 1 to andre komplekse hendelser forekommer også: (A og A og A) og (A og A og A), da er det nødvendig å bruke sannsynlighetsaddisjonsteoremet (2.4) for å få den totale sannsynligheten for l = 1, legger til det forrige uttrykket tre ganger:

Betydning jeg= 2 tilsvarer tilfellet hvor hendelse A inntraff i to av de tre rettssakene. Ved å resonnere likt ovenfor får vi den totale sannsynligheten for dette tilfellet:

1 = 3 hendelse A vises i alle tre forsøkene. Ved å bruke sannsyfinner vi


generell sak Binomialfordelingen bestemmer sannsynligheten for at hendelse A skal inntreffe. l tider kl P tester:

Basert på langtidsobservasjoner estimeres et legeoppkall til et gitt hus med en sannsynlighet på 0,5. Finn sannsynligheten for at det innen seks dager kommer fire oppringninger til legen; P(A)= 0,5, n = 6,1 = 4. T Vi bruker formel (2.10):

Numeriske egenskaper for en diskret tilfeldig variabel. I mange tilfeller, sammen med fordelingen av en tilfeldig variabel eller i stedet for den, kan informasjon om disse mengdene gis av numeriske parametere kalt numeriske kjennetegn ved en tilfeldig variabel. La oss vurdere de vanligste av dem.

Den matematiske forventningen (middelverdien) til en tilfeldig variabel er summen av produktene av alle dens mulige verdier.
på sannsynlighetene for disse verdiene:

La med et stort antall tester P diskret tilfeldig variabel X tar verdier x v x 2,..., x n hhv m 1, m g,..., t s en gang. Middelverdien er

Hvis en P er stor, så de relative frekvensene t 1 /p, t 2 /p,... vil tendere til sannsynlighetene, og gjennomsnittsverdien - til den matematiske forventningen. Det er derfor den matematiske forventningen ofte identifiseres med gjennomsnittsverdien.

Finn den matematiske forventningen til en diskret tilfeldig variabel, som er gitt av tallet på kanten når du kaster en terning (se tabell 2).

Vi bruker formel (2.11):

Finn den matematiske forventningen til en diskret tilfeldig variabel, som bestemmes av sirkulasjonen til "Sportloto" (se tabell 3). I følge formel (2.11) finner vi


Mulige verdier for en diskret tilfeldig variabel er spredt rundt dens matematiske forventning, noen av dem overstiger M(X), del er mindre M(X). Hvordan estimere spredningsgraden til en tilfeldig variabel i forhold til dens middelverdi? Det kan virke som om man for å løse et slikt problem bør beregne avvikene til alle tilfeldige variabler fra dens matematiske forventning X - M(X), og finn deretter den matematiske forventningen (gjennomsnittet) av disse avvikene: M[X - M(X)]. Uten bevis merker vi at denne verdien er lik null, siden avvikene til tilfeldige variabler fra den matematiske forventningen har både positive og negative verdier. Derfor er det tilrådelig å ta hensyn til enten de absolutte verdiene av avvikene M[X - M(X)], eller kvadratene deres M[X - M(X)] 2. Det andre alternativet viser seg å være å foretrekke, så de kommer til konseptet med variansen til en tilfeldig variabel.

Spredningen av en tilfeldig variabel er den matematiske forventningen til det kvadrerte avviket til en tilfeldig variabel fra dens matematiske forventning:


Det betyr at variansen er lik forskjellen mellom den matematiske forventningen til kvadratet til den tilfeldige variabelen X og kvadratet av dens matematiske forventning.

Finn variansen til en tilfeldig variabel, som er gitt av tallet på kanten når du kaster en terning (se tabell 2).

Den matematiske forventningen til denne fordelingen er 3,5. La oss skrive ned kvadratene på avviket til tilfeldige variabler fra den matematiske forventningen: (1 - 3,5) 2 = 6,25; (2 - 3,5) 2 = 2,25; (3 - 3,5) 2 = 0,25; (4 - 3,5) 2 = 0,25; (5 - 3,5) 2 = 2,25; (6 - 3,5) 2 = 6,25. I henhold til formel (2.12), under hensyntagen til (2.11), finner vi spredningen:

Som det følger av (2.12), har variansen dimensjonen til kvadratet av dimensjonen til den tilfeldige variabelen. For å estimere avstanden til en tilfeldig variabel i enheter av samme dimensjon, introduseres konseptet standardavvik, som menes Kvadratrot fra spredning:

Fordeling og kjennetegn ved en kontinuerlig tilfeldig variabel. En kontinuerlig tilfeldig variabel kan ikke spesifiseres av samme distribusjonslov som en diskret. I dette tilfellet, fortsett som følger.

La dP være sannsynligheten for at en kontinuerlig tilfeldig variabel X tar verdier mellom X og X+ dx. Det er åpenbart at Irm er mer intervall dx, jo mer sannsynlig dP: dP ~ dx. I tillegg må sannsynligheten også avhenge av selve den tilfeldige verdien, i nærheten av intervallet, derfor

hvor f(x)- sannsynlighetstetthet, eller sannsynlighetsfordelingsfunksjon. Den viser hvordan sannsynligheten knyttet til intervallet endres. dx tilfeldig variabel, avhengig av verdien av denne variabelen i seg selv:

Ved å integrere uttrykk (2.15) innenfor passende grenser, finner vi sannsynligheten for at den tilfeldige variabelen får en verdi i intervallet (ab):

Normaliseringsbetingelsen for en kontinuerlig tilfeldig variabel har formen

Som man kan se fra (2.19), er denne funksjonen lik sannsynligheten for at den tilfeldige variabelen tar verdier mindre enn X:

For en kontinuerlig tilfeldig variabel skrives den matematiske forventningen og variansen henholdsvis som

Definisjon. En tilfeldig variabel er en slik variabel som, som et resultat av et eksperiment, tar en hvilken som helst verdi fra settet med mulige verdier, og det er umulig å forutsi hvilken før eksperimentet.

Tilfeldige variabler er for eksempel antall poeng som faller ut når en terning kastes, antall apotekbesøkende i løpet av dagen, antall epler på et tre osv.

Tilfeldige variabler er også pasientens temperatur på et tilfeldig valgt tidspunkt på dagen, massen til en tilfeldig valgt tablett av et eller annet medikament, høyden til en tilfeldig valgt student, etc.

O

Men fra et matematisk synspunkt er det en grunnleggende forskjell mellom slike tilfeldige variabler som for eksempel antall apotekbesøkende i løpet av dagen (la oss betegne denne tilfeldige variabelen X 1) og veksten til en tilfeldig valgt student fra en en viss gruppe elever (verdi X 2), er det en grunnleggende forskjell, nemlig: for X 1-verdien kan du liste opp alle mulige verdier (1, 2, 3, 4, 5, 6, .. .), mens for X 2-verdien kan dette ikke gjøres, siden denne verdien, som et resultat av målingen, kan ta hvilken som helst verdi fra segmentet , der

og - henholdsvis minimums- og maksimumshøyden til elevene i gruppen.

Tilfeldige variabler er vanligvis betegnet med store bokstaver i det latinske alfabetet - X, Y, Z, etc., og deres mulige verdier - med de tilsvarende små bokstavene med numeriske indekser. For eksempel er verdiene til en tilfeldig variabel x angitt som følger: x 1, x 2, x 3, etc.

Konseptet med diskrete og kontinuerlige tilfeldige variabler

Definisjon. En tilfeldig variabel kalles diskret hvis settet med alle dens mulige verdier er et endelig eller uendelig, men nødvendigvis tellbart sett med verdier, dvs. et slikt sett, hvis alle elementer (i det minste teoretisk) kan nummereres og skrives ut i riktig rekkefølge.

Definisjon. En tilfeldig variabel kalles kontinuerlig hvis settet med dens mulige verdier er et endelig eller uendelig intervall på den numeriske aksen.

Basert på disse definisjonene er slike tilfeldige variabler oppført ovenfor som antall poeng som faller ut ved terningkast, antall apotekbesøkende i løpet av dagen, antall epler pr. tre, er diskrete tilfeldige variabler, og som pasientens temperatur på et fast tidspunkt på dagen, massen til en tilfeldig valgt tablett av et eller annet medikament, høyden til en tilfeldig valgt student, er kontinuerlige variabler.

Diskrete tilfeldige variabler

La oss ta en nærmere titt diskrete tilfeldige variabler, og som regel vil vi begrense vår vurdering til slike tilfeldige variabler der antallet mulige verdier er begrenset.

Den mest komplette informasjonen om en diskret tilfeldig variabel er gitt av loven om distribusjon av denne variabelen.

Definisjon. Fordelingsloven til en diskret tilfeldig variabel er samsvaret mellom alle mulige verdier av denne tilfeldige variabelen og deres tilsvarende sannsynligheter.

Fordelingsloven til en diskret tilfeldig variabel er ofte spesifisert i form av en to-linjers tabell, hvor den første raden viser alle mulige verdier av denne variabelen (som regel i stigende rekkefølge), og den andre raden viser sannsynlighetene som tilsvarer disse verdiene i tabell 1:

Eksempel 2 Det er ti elevgrupper med henholdsvis 12, 10, 11, 8, 12, 9, 10, 8, 10 og 11 elever. Skriv en fordelingslov for en tilfeldig variabel X, definert som antall elever i en tilfeldig valgt gruppe.

Løsning. De mulige verdiene for den betraktede tilfeldige variabelen X er følgende (i stigende rekkefølge):

8, 9, 10, 11 og 12.

Siden tilfeldig variabel X har en verdi på 8, hvis den tilfeldig valgte gruppen er en gruppe på 8 elever (la oss kalle det hendelse A), er sannsynligheten for at tilfeldig variabel X vil ta på seg verdien
, er lik sannsynligheten for denne tilfeldige hendelsen:
.

Sannsynligheten for en tilfeldig hendelse A i samsvar med den klassiske definisjonen av sannsynlighet er
fordi av 10 grupper har to 8 elever hver.

Derfor, for sannsynligheten for en verdi, får vi:

.

På samme måte kan du finne sannsynlighetene for de gjenværende verdiene til den tilfeldige variabelen X:

som lar oss komponere ønsket distribusjonslov (tabell 2):

Fordelingsloven til en diskret tilfeldig variabel kan også spesifiseres ved å bruke en formel som lar hver mulig verdi av denne variabelen bestemme den tilsvarende sannsynligheten.

Diskrete og kontinuerlige tilfeldige variabler

Som regel, ved produksjon av produkter, påvirkes produksjonsprosessen av mange forskjellige faktorer, som et resultat av at det er en spredning i verdiene til produktkvalitetsindikatorer. Derfor bør kvalitetsindikatorene til produserte produkter eller tjenester betraktes som tilfeldige variabler.

Tilfeldig variabel en slik verdi kalles, som, som et resultat av tester innenfor et visst intervall, kan anta forskjellige tallverdier (ifølge STB GOST R 50779.10 er en tilfeldig variabel en variabel som kan ta på seg en hvilken som helst verdi fra et gitt sett med verdier og som en sannsynlighetsfordeling er assosiert med).

Diskrete tilfeldige variabler kalles de som, som et resultat av tester, bare kan ta separate, isolerte verdier og ikke kan ta verdier mellom dem. For eksempel kan antallet dårlige deler i en batch bare være et positivt heltall 1, 2, 3 osv., men kan ikke være 1,3; 1,7 osv.

Kontinuerlig tilfeldig variabel en slik verdi kalles, som, som et resultat av tester, kan ta alle numeriske verdier fra en kontinuerlig serie av deres mulige verdier innenfor et visst intervall.

For eksempel er de faktiske dimensjonene til maskinerte deler tilfeldige variabler av en kontinuerlig type, siden de kan få en hvilken som helst numerisk verdi innenfor visse grenser.

Mulighetene for tilfeldige variabler for å ta visse numeriske verdier under tester blir evaluert ved hjelp av sannsynligheter.

Settet med verdier av tilfeldige variabler arrangert i stigende rekkefølge med en indikasjon på deres sannsynligheter for hver av verdiene kalles fordeling av tilfeldige variabler (ifølge STB GOST R 50779.10-fordeling er en funksjon som bestemmer sannsynligheten for at en tilfeldig variabel vil få en gitt verdi eller vil tilhøre et gitt sett med verdier).

Fordelingen av en tilfeldig variabel kan presenteres i tabellform, grafisk og ved hjelp av statistiske estimater.

Ved presentasjon av fordelingen av en tilfeldig variabel i tabellform, tilsvarer hvert nummer av produktenheten som studeres (målenummer) verdien av kvalitetsindikatoren for denne produktenheten (måleresultat).

Når du presenterer fordelingen av en tilfeldig variabel i en grafisk form, er en distribusjonsgraf plottet i koordinater, verdien av den tilfeldige variabelen - sannsynligheten (frekvens, frekvens) for verdien av den tilfeldige variabelen.

Figuren under viser grafene over fordelingen av diskrete og kontinuerlige stokastiske variabler.

Figur - Graf over fordelingen av en diskret tilfeldig variabel

Figur - Graf over fordelingen av en kontinuerlig tilfeldig variabel

Det er teoretiske og empiriske fordelinger av tilfeldige variabler. I teoretiske fordelinger utføres evalueringen av mulige verdier av en tilfeldig variabel ved å bruke sannsynligheter, og i empiriske fordelinger ved å bruke frekvenser eller frekvenser oppnådd som et resultat av tester.

Følgelig empirisk fordeling av en tilfeldig variabel er et sett med eksperimentelle verdier, arrangert i stigende rekkefølge, som indikerer frekvensene eller frekvensene for hver av verdiene (ifølge STB GOST R 50779.10 frekvensfordeling er det empiriske forholdet mellom verdiene til en funksjon og dens frekvenser eller dens relative frekvenser).

Bord. Et eksempel på en tabellrepresentasjon av den teoretiske fordelingen av en diskret tilfeldig variabel

Grafisk kan den empiriske fordelingen av en diskret tilfeldig variabel representeres som stolpediagram , dannet av et sett med kolonner med lik bredde, hvis høyder er proporsjonale med frekvensene til diskrete verdier til en tilfeldig variabel.

Figur - Søylediagram over en diskret tilfeldig variabel.

Hvis den tilfeldige variabelen er kontinuerlig, oppstår det noen vanskeligheter med presentasjonen av dens fordeling i form av en tabell eller graf. Derfor, i praksis, når man studerer tilfeldige variabler av en kontinuerlig type, blir de oppnådde verdiene delt inn i like intervaller slik at verdien av intervallet er noe større enn målefeilen for kvantiteten som studeres. Deretter beregnes frekvensene ikke av de faktiske verdiene til den tilfeldige variabelen, men etter intervaller. Derfor vil tabellen over empirisk fordeling av en tilfeldig variabel av kontinuerlig type ha følgende form.

Bord. Empirisk fordeling av en tilfeldig variabel av kontinuerlig type.

Verdiintervall X

Aritmetisk gjennomsnitt

Frekvens f Jeg

Frekvens m Jeg

160,031 - 160,033

160,033 - 160,035

160,035 - 160,037

160,037 - 160,039

160,039 - 160,041

160,041 - 160,043

160,043 - 160,045

160,045 - 160,047

f Jeg = 100

m Jeg = 1

Den empiriske fordelingen av en tilfeldig kontinuerlig variabel kan representeres grafisk som et distribusjonshistogram, en frekvenspolygon eller en kumulativ frekvenspolygon.

Distribusjonshistogram er et sett med rørende rektangler, hvis base er lik intervallene for å dele en kontinuerlig tilfeldig variabel, og arealene er proporsjonale med frekvensene som verdiene til den tilfeldige variabelen faller inn i disse intervallene (ifølge STB GOST R 50779.10 stolpediagram (fordeling) er en grafisk representasjon av frekvensfordelingen for en kvantitativ karakteristikk, dannet av sammenhengende rektangler, hvis basis er intervallene til klassene, og arealene er proporsjonale med frekvensene til disse klassene).

Figur - Histogram over fordelingen av en tilfeldig kontinuerlig variabel.

Frekvens polygon er en brutt linje oppnådd ved å koble sammen punkter hvis abscisser er lik midtpunktene til partisjonsintervallene, og ordinatene er lik de tilsvarende frekvensene.

Figur - Polygon av frekvenser til en tilfeldig kontinuerlig variabel.

Polygon kumulativ frekvenser er en brutt linje oppnådd ved å koble sammen punkter hvis abscisser er lik de øvre grensene for partisjonsintervallene, og hvis ordinater er lik enten kumulative frekvenser eller kumulative frekvenser (kumulative relative frekvenser).

Figur - Polygon av kumulative frekvenser med en tilfeldig kontinuerlig verdi.

I teoretiske beskrivelser av stokastiske variabler av kontinuerlig type brukes fordelingsfunksjonen. Den teoretiske fordelingen av en tilfeldig kontinuerlig variabel kan representeres grafisk som integral, invers integral, differensial distribusjonsfunksjoner og funksjoner intensitet.

La X være en tilfeldig variabel, og x være et reelt tall (med X< х ). Hendelse X< х отвечает вероятность Р(Х < х), которая является функцией F(х), т.е.

P(X< х) = F(х)

F(X) kalles distribusjonsfunksjon sannsynligheter tilfeldig variabel eller integralfordelingsfunksjon.

For en diskret tilfeldig variabel er integralfordelingsfunksjonen F(X) lett å bestemme fra en tabell eller graf.

Således, for eksemplet ovenfor på fordelingen av en diskret tilfeldig variabel (på X< 4):

F(X) = P( X ) = P( X=1) + P( X=2) + P( X=3) = 1/30 + 4/30 +15/30 = 19/30

Grafen til integralfordelingsfunksjonen til en diskret tilfeldig variabel vil se ut som en trinnkurve. Ordinatene til kurven for enhver verdi av X vil representere summen av sannsynlighetene til de tidligere verdiene.

Figur - Integralfordelingsfunksjon av en diskret tilfeldig variabel

Sannsynligheten for at en tilfeldig variabel under testing vil være innenfor grensene til to gitte verdier x 1 og x 2 (x 2 > x 1) er lik økningen av integralfunksjonen i dette området, dvs.

P(x 1 ≤ X ≤ x 2 ) = P(X< х 2 ) - P(X< х 1 ) = F(X 2 ) - F(X 1 )

Hvis vi går til eksemplet ovenfor på fordelingen av en diskret tilfeldig variabel, så for x1 = 2 og x2 = 3:

P(2≤X≤3) = P(X< 3) - Р(Х < 2)= F(Х2) - F(Х1)= 4/30-1/30 = 3/30

For en kontinuerlig tilfeldig variabel vil grafen til integralfordelingsfunksjonen se ut som en monotont økende kurve. I praksis bestemmes de teoretiske distribusjonsfrekvensene ved hjelp av den kumulative fordelingsfunksjonen.

Figur - Kumulativ fordelingsfunksjon

kontinuerlig tilfeldig variabel

Den inverse kumulative fordelingsfunksjonen er lik forskjellen mellom enhet og den kumulative fordelingsfunksjonen.

Distribusjonstetthet (differensialfordelingsfunksjon) tilfeldig variabel kalles den første deriverte av integralfordelingsfunksjonen:

For en analytisk beskrivelse av en kontinuerlig tilfeldig variabel i reliabilitetsteori bruker vi intensitetsfunksjon , lik forholdet mellom og den inverse integralfordelingsfunksjonen:

Figur - Intensitetsfunksjonen til en kontinuerlig tilfeldig variabel.

Emne 3.

Tilfeldige variabler og fordelingsfunksjoner

Konseptet med en tilfeldig variabel.

Konseptet med en tilfeldig variabel

Distribusjonsfunksjon av en tilfeldig variabel, dens egenskaper

Tilfeldige variabler med diskret fordeling

Konseptet med en tilfeldig variabel med en diskret fordeling

Loven for distribusjon av en diskret tilfeldig variabel.

Eksempler på diskrete fordelinger

Tilfeldige variabler med absolutt kontinuerlig fordeling

Konseptet med en tilfeldig variabel med en absolutt kontinuerlig fordeling

Fordelingsloven for en absolutt kontinuerlig tilfeldig variabel. Tetthet, dens egenskaper

Eksempler på absolutt kontinuerlige distribusjoner

Konseptet med en tilfeldig vektor.

Konseptet med en tilfeldig vektor

Uavhengige tilfeldige variabler

Fellesfordeling av tilfeldige variabler

Konseptet med en tilfeldig variabel.

Siden fremveksten av sannsynlighetsteori har hovedoppgaven vært å studere ikke de sannsynlige egenskapene til eksperimenter med tilfeldige utfall, men de numeriske størrelsene knyttet til disse eksperimentene, som det er naturlig å kalle tilfeldige variabler. For eksempel kan vi være interessert ikke i tallpar på de øvre sidene av terningene, men i summen deres; antall suksesser eller fiaskoer før den første suksessen i Bernoulli-ordningen.

Ofte i litteraturen kan du finne variasjoner over temaet for følgende definisjon: Tilfeldig variabel kalt en variabel som, avhengig av utfallet av testen, antar verdier som avhenger av tilfellet.

En tilfeldig variabel er altså en numerisk verdi, hvis verdi avhenger av hva slags (elementært) utfall som skjedde som et resultat av et eksperiment med et tilfeldig utfall. Settet med alle verdier som en tilfeldig variabel kan ta kalles sett med mulige verdier for denne tilfeldige variabelen.

Vi vil gi en mer streng definisjon, siden begrepet en tilfeldig variabel er et av de nøkkelbegrepene som forbinder sannsynlighetsteori med matematisk analyse og danner det konseptuelle grunnlaget for matematisk statistikk.

Definisjon. Tilfeldig variabel er en funksjon X = X(ω) definert på rommet til elementære hendelser Ω som hendelsen (X< х} = {ω: Х(ω) < х} принадлежит σ-алгебре событий A для любого вещественного х.

Tilstand (X< х} єA дает возможность рассматривать вероятности событий {Х < х}, поскольку вероятности определены только на множествах из MEN. I tillegg, gjennom hendelser (X< х}, х є (-∞, ∞) с помощью известных операций над событиями можно выразить сколь угодно сложное событие, связанное со случайной величиной Х. Такое событие также будет принадлежать σ-алгебре событий A и, следовательно, для него определена вероятность.

Kommentar. Dermed er en tilfeldig variabel en funksjon hvis definisjonsdomene er rommet til elementære hendelser Ω, og settet med verdier er et numerisk sett, muligens hele settet med reelle tall R.

σ-algebraen til hendelser A er domenet for definisjon av sannsynlighet, hvis vi betrakter det som en funksjon.

Kommentar . "Begrepet "random variabel" er noe unøyaktig, begrepet "Chance funksjon" ville være mer passende, den uavhengige variabelen er et punkt i rommet av elementære hendelser, dvs. utfallet av et eksperiment eller en sak. (W. Feller "Introduksjon til sannsynlighetsteori", kap. IX)

Tilfeldige variabler er merket med bokstavene i det greske alfabetet:  (xi),  (dette),  eller store bokstaver i det latinske alfabetet X, Y, ... Vi vil skrive verdiene til en tilfeldig variabel som en endelig eller uendelig rekkefølge x 1 ,x 2,, x n,; y 1 , y 2 ,, y n ,

Kommentar . Tidligere introduserte vi begrepet sannsynlighet i forhold til noen hendelser. Nå går vi videre til å snakke om funksjoner. Den mest åpenbare hendelsen som kan assosieres med konseptet med en funksjon er at den tar i bruk en verdi (spesifikk eller tilhørende intervallet)

For å studere de sannsynlige egenskapene til en tilfeldig variabel, er det nødvendig å kjenne regelen som lar deg finne sannsynligheten for at en tilfeldig variabel vil ta en verdi fra en delmengde av verdiene. Enhver slik regel kalles loven om sannsynlighetsfordeling eller fordeling (av sannsynligheter) for en tilfeldig variabel.(ordet "sannsynlighet" er vanligvis utelatt)

Den generelle fordelingsloven som ligger i alle tilfeldige variabler er distribusjonsfunksjon.

Definisjon. Hele settet med sannsynligheter P(X< х}, х є (-∞, ∞) задает distribusjonsloven til tilfeldig variabel X generelt. Ofte, for korthets skyld, kalles loven om distribusjon av en tilfeldig variabel ganske enkelt fordelingen av en tilfeldig variabel.

Definisjon. Funksjon F(x) = P(X< х}, х є (-∞, ∞) называется fordelingsfunksjonen til den tilfeldige variabelen X.

Verdien av fordelingsfunksjonen ved punkt x er lik sannsynligheten for hendelsen (X< х}, то есть события, состоящего из тех и только тех элементарных исходов ω, для которых Х < х.

Det sies vanligvis at verdien av fordelingsfunksjonen i punktet x er lik sannsynligheten for at den tilfeldige variabelen X får en verdi mindre enn x.

Geometrisk betyr dette følgende: F(x) er sannsynligheten for at den tilfeldige variabelen X vil ta på seg verdien representert av punktet på talllinjen til venstre for punktet x.

Kommentar . Fordelingsfunksjonen kalles også integralfunksjon, eller integralloven for distribusjon av en tilfeldig variabel X

Fordelingsfunksjonen har følgende eiendommer:

    0≤ F(x)≤1 (fordi distribusjonsfunksjonen per definisjon er en sannsynlighet)

    F(x 1) ≤ F(x 2) for x 1< x 2 (т.е. F(x) – неубывающая функция)

    lim F(x) = 0 som x → - ∞ , lim F(x) = 1 som x → + ∞

    P (x 1 ≤ X ≤ x 2) = F(x 1) - F(x 2)

    F(x) er en venstre kontinuerlig funksjon, dvs. F(x) = F(x - 0), hvor F(x - 0) = lim F(y) som y → x - 0 (venstre grense)

Kommentar . For å understreke hvilken tilfeldig variabel distribusjonsfunksjonen F(x) tilhører, tildeles denne funksjonen noen ganger et nedsett som angir en bestemt tilfeldig variabel. For eksempel, F X (x) = P (X< х}

Kommentar. I noen publikasjoner er distribusjonsfunksjonen definert som F(x) = P(X ≤ x). En slik definisjon endrer ikke noe i essensen av begrepet fordelingsfunksjon, kun den siste, femte egenskapen endres. Funksjonen i dette tilfellet viser seg å være høyrekontinuerlig.

Digresjon: "Hva er en funksjon?"

La oss få to sett X og Y, og Y er et tallsett. Og la regelen f gis, ifølge hvilken hvert element (punkt) i mengden X er assosiert med (ett og bare ett) element (tall) i mengden Y. Regelen f sammen med mengdene X og Y definerer funksjon f. Notasjonen y=f(x) betyr at regelen f ble brukt på et punkt x i mengden X, og som et resultat fikk vi et punkt y fra mengden Y. X kalles argumentet (uavhengig variabel), og y er verdien (avhengig variabel) til funksjonen f i punktet X. Settet X kalles definisjonsdomenet (innstillingsområde) til funksjonen, de sier at funksjonen er gitt på dette settet, settet Y kalles settet med verdier til funksjonen. Settet X er ikke nødvendigvis et tallsett. Dermed er en tilfeldig variabel en funksjon definert på et ikke-numerisk rom med elementære hendelser.

TILFELDIGE VERDIER

En tilfeldig verdi er en størrelse som som følge av testen vil få én og kun én mulig verdi, og som ikke er kjent på forhånd.

Diskret er en tilfeldig variabel som tar på seg separate, isolerte mulige verdier med visse sannsynligheter.

En kontinuerlig variabel er en tilfeldig variabel som kan ta på seg alle verdier fra et begrenset eller uendelig intervall.

Loven om distribusjon av en diskret tilfeldig variabel er samsvaret mellom de mulige verdiene til en tilfeldig variabel og deres sannsynligheter. Denne loven er gitt i form av en tabell, formel eller graf.

For diskrete tilfeldige variabler er en av de vanligste den såkalte binomiale distribusjonsloven, som Bernoulli-ordningen med gjentakelse av tester fører til. Formel (8) er det analytiske uttrykket for denne loven.

Eksempel 11.

En melding sendes over kommunikasjonskanalen ved hjelp av en kode som består av to tegn. Sannsynligheten for utseendet til den første er 2/3. Tre skilt passerte. Finn distribusjonsloven for forekomstene av det første tegnet.

Løsning.

Etter tilstand n=4, R=2/3, q=1/3. Mulige verdier for antall forekomster av det første tegnet: 0, 1, 2 og 3. Finn sannsynlighetene deres ved å bruke formel (8):

Denne loven kan presenteres i form av en tabell

X
P1/27 1/27 2/9 4/9 8/27

En fordelingsfunksjon er en funksjon som bestemmer sannsynligheten for at en tilfeldig variabel X som et resultat av testen vil ta en verdi mindre enn X, det er

Geometrisk betyr dette at en tilfeldig variabel med en sannsynlighet R vil ta på seg verdien som er representert på den numeriske aksen av punktet til venstre X.

For en kontinuerlig tilfeldig variabel er fordelingsfunksjonen en kontinuerlig stykkevis differensierbar funksjon. Hovedegenskapene er avledet fra definisjonen:

1. Verdiene til distribusjonsfunksjonen tilhører segmentet , dvs.

2. F(x) er en ikke-avtagende funksjon, det vil si hvis

3. Sannsynligheten for at en tilfeldig variabel får en verdi inneholdt i intervallet [ a,b[, er lik økningen av fordelingsfunksjonen på dette intervallet

For en kontinuerlig tilfeldig variabel er sannsynligheten for å akseptere en enkelt verdi null. Derfor for kontinuerlige tilfeldige variabler

Eksempel 12.

Tilfeldig verdi X gitt av distribusjonsfunksjonen

Finn sannsynligheten for at som et resultat av testen X vil ta verdien som tilhører segmentet [-1; 0,5].

Løsning.

Det følger av vilkåret at X er en kontinuerlig tilfeldig variabel som kan ta en verdi fra 0 til 1.

Sannsynlighetstetthet kontinuerlige tilfeldig variabel X kalle den første deriverte av fordelingsfunksjonen

distribusjonsfunksjon F(x) er et av antiderivatene for distribusjonstettheten. Basert på definisjonen av tetthet eller differensialrett distribusjon og dens forhold til distribusjonsfunksjonen, er det enkelt å vise følgende egenskaper:

1. Fordelingstettheten til en kontinuerlig tilfeldig variabel er en ikke-negativ funksjon

2. Sannsynlighet for å treffe en tilfeldig variabel X i intervallet er lik

(16)

3. Fra egenskap 2 får vi et uttrykk for fordelingsfunksjonen

(17)

4. Normaliseringstilstand

(18)

Eksempel 13 diskret verdi X gitt etter tabell

X
R 0,1 0,3 0,4 0,2

Finn fordelingsfunksjonen og bygg dens graf.

Løsning.

1. Hvis , da , siden X kan ikke være mindre enn 2.

I dette tilfellet, i intervallet (-¥, X) det er bare én verdi av den tilfeldige variabelen X (X=2). Derfor

For enhver argumentverdi X funksjoner F(x), tilfredsstiller denne ulikheten, inn i intervallet (-¥, X) treffer to verdier av en tilfeldig variabel ( X=2 og X=3). Fordi hendelsene som X vil akseptere gitte verdier er inkonsekvente (eller X=2 eller X=3), da

4. På samme måte, hvis

Derfor vil distribusjonsfunksjonen se ut

Vi bygger en graf over fordelingsfunksjonen

Ris. 1 - Graf over fordelingsfunksjonen

diskret tilfeldig variabel

Eksempel 14. Målefeilfordelingstetthet

En tilfeldig variabel er en variabel hvis verdi er oppnådd som et resultat av omberegning eller målinger og ikke entydig kan bestemmes av betingelsene for dens forekomst.

Det vil si at en tilfeldig variabel representerer numeriske tilfeldige hendelser.

Tilfeldige variabler er delt inn i to klasser:

Diskrete tilfeldige variabler - verdiene til disse mengdene er naturlige tall, som, som individuelle hendelser, er tildelt frekvenser og sannsynligheter.

Kontinuerlige tilfeldige variabler - kan ta hvilken som helst verdi fra et bestemt intervall (intervall). Gitt at det er et uendelig antall numeriske verdier i intervallet fra X1 til X2, er sannsynligheten for at den tilfeldige variabelen XiЄ(X1,X2) tar en viss verdi uendelig liten. Tatt i betraktning at det er umulig å liste opp alle verdiene av en kontinuerlig tilfeldig variabel, brukes i praksis gjennomsnittsverdien av intervallet (X1,X2).

For diskrete tilfeldige variabler kalles funksjonen y \u003d P (x) fordelingsfunksjonen til den tilfeldige variabelen og har en graf - den kalles fordelingspolygon.

Følgende grupper av numeriske egenskaper skilles ut: posisjonskarakteristikker (matematisk forventning, modus, median, kvantil, etc.), spredning (varians, standardavvik, etc.), karakteristika for distribusjonstetthetsformen (skjevhet, kurtose, etc.) .

Matematisk forventning (gjennomsnittlig verdi ved distribusjon) er et reelt tall, bestemt avhengig av typen SV X ved formelen:


Den matematiske forventningen eksisterer hvis rekken (henholdsvis integralet) på høyre side av formelen konvergerer absolutt. Hvis mX = 0, kalles CV X sentrert (angitt med ).

Egenskaper for matematisk forventning:

hvor C er en konstant;

M = C×M[X];

M = M[X]+M[Y],

for enhver CB X og Y;

M = M[X]×M[Y] + KXY,

der KXY = M er kovariansen til CV-ene til X og Y.

Det første øyeblikket av den kth orden (k = 0, 1, 2, ...) av fordelingen av SV X er et reelt tall bestemt av formelen:

nk=M=

Det sentrale momentet i den k-te rekkefølgen av fordelingen av SV X er tallet bestemt av formelen:

mk = M[(X-mX)k]=

Fra definisjonene av momenter, spesielt, følger det at: n0 = m0 = 1, n1 = mX, m2 = DX = sX2.

SWNT-modusen er det reelle tallet Mo(X) = x*, definert som maksimumspunktet for PR f(x). En modus kan ha en enkelt verdi (unimodal fordeling) eller flere verdier (multimodal fordeling).

Medianen til SWNT er et reelt tall Me(X) = x0 som tilfredsstiller betingelsen: P(X< x0} = P{X ³ x0} или F(x0) = 0,5.

En p-nivå kvantil er et reelt tall tp som tilfredsstiller ligningen: F(tp) = p. Spesielt følger det av definisjonen av medianen at x0 = t0,5.

Variansen til SV X er et ikke-negativt tall D[X] = DX, definert av formelen:

DX = M[(X-mX)2] = M - mX2 =

Spredningen eksisterer hvis rekken (henholdsvis integralet) på høyre side av likheten konvergerer. Dispersjonsegenskaper:

D[C] = 0, hvor C er en konstant;

D = C2×D[X];

variansen endres åpenbart ikke med CB X-bias;

D = D[X] + D[Y] + 2×KXY,

hvor KXY = M - kovarians av CB X og Y;

Et ikke-negativt tall sХ = kalles standardavviket til RV X. Det har dimensjonen til RV X og definerer et standard rms-spredningsintervall, symmetrisk med hensyn til den matematiske forventningen. (Verdien av sX kalles noen ganger standardavviket.) CV X kalles standardisert hvis mX = 0 og sX = 1. Hvis verdien X = const (dvs. X er ikke tilfeldig), så er D[X] = 0.

En indikator på asymmetrien til PR er asymmetrikoeffisienten ("skjevhet") til fordelingen: A = m3/s3X. Indikatoren for kurtosis av PR er koeffisienten av kurtosis ("pointiness") av fordelingen: E = (m4/s4X)-3. Spesielt for en normalfordeling er E = 0.

Et ordnet sett med n tilfeldige variabler (CV) X1, X2, ..., Xn, vurdert sammen i dette eksperimentet, kalles en n-dimensjonal CV eller en tilfeldig vektor og betegnes = (X1, X2, ..., Xn).

Fordelingsfunksjonen (DF) til en n-dimensjonal tilfeldig vektor er en funksjon av n reelle variabler x1, x2, ..., xn, definert som sannsynligheten for felles oppfyllelse av n ulikheter: F(x1, x2, ... xn) = P( X1< x1, X2 < x2,..., Xn < xn}. В частности, для двумерного случайного вектора (X, Y) по определению ФР имеем: F(x, y) = P{X < x, Y < y}. ФР F (х, у) обладает следующими свойствами:

1 0 £ F(x, y) £ 1;

2 F(x, y) - ikke-avtagende funksjon av argumentene;

4.

Eiendom 4 blir ofte referert til som konsistensbetingelsen. Det betyr at DF-ene til de individuelle komponentene i en tilfeldig vektor kan finnes ved å gå til grensen fra fellesfordelingsfunksjonen til disse komponentene. Sannsynligheten for at et tilfeldig punkt på planet (X, Y) faller inn i et rektangel med sider parallelle med koordinataksene kan beregnes ved å bruke DF ved å bruke formelen:

P(x1 £ X< x2, y1 £ Y < y2} = F(x1, y1)+ F(x2, y2)- F(x1, y2)- F(x2, y1).

En todimensjonal tilfeldig vektor (X,Y) kalles en tilfeldig vektor av diskret type (RDV) hvis settet med dens mulige verdier G(x, y) maksimalt kan telles. Dens distribusjonslov kan spesifiseres av en todimensjonal tabell fra listen over mulige verdier av komponentpar ((хi, yi) | (хi, yi) О G(x, y)) og som tilsvarer hvert slikt par. av sannsynligheter pij = P(X = xi, Y = yj ) som tilfredsstiller betingelsen

En todimensjonal tilfeldig vektor (X, Y) kalles en tilfeldig vektor av kontinuerlig type (CBNT) hvis det er en slik ikke-negativ funksjon f(x, y) kalt s(DP) til den tilfeldige vektoren som :

f(x, y) = , deretter F(x, y) = .

PR av sannsynligheter har følgende egenskaper:

f(x, y) 3 0, (x, y) n R2;

er normaliseringstilstanden.

PR av sannsynlighetene til de individuelle komponentene i en tilfeldig vektor uttrykkes som integraler av leddtettheten:

f(x) = f(y) = .

Sannsynligheten for at et tilfeldig punkt faller inn i et vilkårlig kvadratisk område S på planet bestemmes av formelen

P((X, Y) О S)= .

Den betingede stil den tilfeldige komponenten X, forutsatt at komponenten Y har tatt en viss verdi y, er funksjonen f(x/y) til den reelle variabelen x О R: f(x/y) = f(x , y)/f(y) . Tilsvarende bestemmes den betingede sannsynlighetstettheten til den tilfeldige komponenten Y, forutsatt at komponenten X har tatt en viss verdi x: f(y/x) = f(x, y)/f(x). RVs X1, X2, ..., Xn kalles uavhengige (i aggregatet) hvis for hendelser (Xi н Bi), i = 1, 2, ..., n, hvor B1, B2, ... Bn er delmengder av den numeriske rette linjen gjelder følgende likhet: P(X1 Î B1, X2 Î B2, ... Xn Î Bn) = P(X1 Î B1)× P(X2 Î B2)× ... ×P(Xn) Î Bn).

Teorem: XV X1, X2, .... Xn er uavhengige hvis og bare hvis på et hvilket som helst punkt x = (x1, x2, ..., xn) følgende likhet gjelder: F(x1, x2, ..., xn ) = F(x1) × F (x2) × ... × F (xn) (eller f(x1, x2, ..., xn) = f(x1) × f(x2) × ... × f (xn)).

For en todimensjonal tilfeldig vektor (X, Y) introduseres følgende numeriske egenskaper.

Det første rekkefølgemomentet r + s til en tilfeldig vektor (X, Y) er et reelt tall nr,s, definert av formelen:

nr,s = M =

Startmomentet nr,s eksisterer hvis integralet (henholdsvis serien) på høyre side av likheten konvergerer absolutt. Spesielt er nr,0 = M de korresponderende startmomentene til X-komponenten Vektoren med ikke-tilfeldige koordinater (mX, mY) = (n1,0, n0,1) kalles forventningen til den tilfeldige vektoren (X) , Y) eller spredningssenteret.

Det sentrale øyeblikket av orden r + s til en tilfeldig vektor (X, Y) er det reelle tallet mr,s definert av formelen

mr,s = M[(X-mX)r (Y-mY)s] =

Det sentrale momentet mr,s eksisterer hvis integralet (henholdsvis serien) på høyre side av likheten konvergerer absolutt. En vektor med ikke-tilfeldige koordinater (DX, DY) = (m2,0, m0,2) kalles variansen til en tilfeldig vektor.

Det sentrale momentet m1,1 kalles korrelasjonsmomentet (kovarians): KXY = M = M[(X-mX)×(Y-mY)] = M-mX mY.

Korrelasjonskoeffisienten til to tilfeldige X- og Y-komponenter i en tilfeldig vektor er den normaliserte kovariansen

rXY = KXY/(sXsY).

Egenskaper for kovarians (og korrelasjonskoeffisient).

Konseptet med en tilfeldig variabel. Diskrete og kontinuerlige tilfeldige variabler. Sannsynlighetsfordelingsfunksjon og dens egenskaper. Sannsynlighetsfordelingstetthet og dens egenskaper. Numeriske kjennetegn ved tilfeldige variabler: matematisk forventning, spredning og deres egenskaper, standardavvik, modus og median; innledende og sentrale øyeblikk, asymmetri og kurtose. Numeriske karakteristikker av det aritmetiske gjennomsnittet av n uavhengige tilfeldige variabler.

Konseptet med en tilfeldig variabel

Tilfeldig en mengde kalles, som, som et resultat av tester, tar en eller annen (men bare én) mulig verdi, ukjent på forhånd, skiftende fra test til test og avhengig av tilfeldige omstendigheter. I motsetning til en tilfeldig hendelse, som er en kvalitativ egenskap ved et tilfeldig testresultat, karakteriserer en tilfeldig variabel testresultatet kvantitativt. Eksempler på en tilfeldig variabel er størrelsen på et arbeidsstykke, feilen i resultatet av måling av en hvilken som helst parameter for et produkt eller miljø. Blant de tilfeldige variablene man møter i praksis, kan to hovedtyper skilles: diskrete og kontinuerlige.

Diskret er en tilfeldig variabel som antar et begrenset eller uendelig tellbart sett med verdier. For eksempel: frekvensen av treff med tre skudd; antall defekte produkter i en batch på n stykker; antall samtaler som ankommer telefonsentralen i løpet av dagen; antall feil på enhetselementene i en viss tidsperiode når du tester det for pålitelighet; antall skudd før første treff på skiven osv.

kontinuerlige kalles en tilfeldig variabel som kan ta hvilken som helst verdi fra et endelig eller uendelig intervall. Åpenbart er antallet mulige verdier for en kontinuerlig tilfeldig variabel uendelig. For eksempel: en feil ved måling av rekkevidden til radaren; chip oppetid; produksjonsfeil av deler; saltkonsentrasjon i sjøvann osv.

Tilfeldige variabler er vanligvis betegnet med bokstavene X, Y, etc., og deres mulige verdier er x, y, etc. For å spesifisere en tilfeldig variabel er det ikke nok å liste opp alle mulige verdier. Det er også nødvendig å vite hvor ofte en eller annen av verdiene kan vises som et resultat av tester under de samme forholdene, det vil si at det er nødvendig å angi sannsynlighetene for at de skal skje. Settet med alle mulige verdier av en tilfeldig variabel og deres tilsvarende sannsynligheter utgjør fordelingen av en tilfeldig variabel.

Lover for fordeling av en tilfeldig variabel

distribusjonsloven En tilfeldig variabel er en samsvar mellom de mulige verdiene til en tilfeldig variabel og deres tilsvarende sannsynligheter. En tilfeldig variabel sies å følge en gitt distribusjonslov. To tilfeldige variabler kalles uavhengig, hvis distribusjonsloven til en av dem ikke avhenger av hvilke mulige verdier den andre verdien har tatt. Ellers kalles tilfeldige variabler avhengig. Flere tilfeldige variabler kalles gjensidig uavhengig, hvis distribusjonslovene til et hvilket som helst antall av dem ikke avhenger av hvilke mulige verdier de andre mengdene har tatt.

Fordelingsloven til en tilfeldig variabel kan gis i form av en tabell, en fordelingsfunksjon eller en fordelingstetthet. En tabell som inneholder de mulige verdiene til en tilfeldig variabel og de tilsvarende sannsynlighetene er den enkleste formen for å spesifisere distribusjonsloven til en tilfeldig variabel.

\begin(array)(|c|c|c|c|c|c|c|)\hline(X)&x_1&x_2&x_3&\cdots&x_(n-1)&x_n\\\hline(P)&p_1&p_2&p_3&\cdots&p_(n-1) )&p_n\\\hline\end(array)

Tabellspesifikasjonen til fordelingsloven kan bare brukes for en diskret tilfeldig variabel med et begrenset antall mulige verdier. Tabellformen for å spesifisere loven til en tilfeldig variabel kalles også en distribusjonsserie.

For oversiktens skyld er distribusjonsserien presentert grafisk. I en grafisk representasjon i et rektangulært koordinatsystem er alle mulige verdier for en tilfeldig variabel plottet langs abscisseaksen, og de tilsvarende sannsynlighetene er plottet langs ordinataksen. Punkter (x_i,p_i) forbundet med rette linjestykker kalles distribusjonspolygon(Fig. 5). Det bør huskes at tilkoblingen av punktene (x_i,p_i) kun utføres for klarhet, siden i intervallene mellom x_1 og x_2, x_2 og x_3 osv. er det ingen verdier som den tilfeldige variabelen X kan ta, så sannsynlighetene for at den skal forekomme i disse intervallene er null.

Fordelingspolygonet, i likhet med fordelingsserien, er en av formene for å spesifisere fordelingsloven til en diskret tilfeldig variabel. De kan ha forskjellige former, men de deler alle det samme felleseie: summen av ordinatene til toppunktene til fordelingspolygonet, som er summen av sannsynlighetene for alle mulige verdier av en tilfeldig variabel, er alltid lik én. Denne egenskapen følger av det faktum at alle mulige verdier av den tilfeldige variabelen X danner en komplett gruppe av inkompatible hendelser, hvor summen av sannsynlighetene er lik én.

Sannsynlighetsfordelingsfunksjon og dens egenskaper

Fordelingsfunksjonen er den mest generelle formen for å fastsette fordelingsloven. Den brukes til å spesifisere både diskrete og kontinuerlige tilfeldige variabler. Det er vanligvis betegnet F(x) . distribusjonsfunksjon bestemmer sannsynligheten for at en tilfeldig variabel X tar verdier mindre enn et fast reelt tall x , dvs. F(x)=P\(X integrert distribusjonsfunksjon.

Den geometriske tolkningen av fordelingsfunksjonen er veldig enkel. Hvis en tilfeldig variabel betraktes som et tilfeldig punkt X på Ox-aksen (fig. 6), som som et resultat av testen kan ta en eller annen posisjon på aksen, så er fordelingsfunksjonen F(x) sannsynlighet for at det tilfeldige punktet X, som et resultat av testen, faller til venstre punkt x .

For en diskret tilfeldig variabel X som kan ta på seg verdiene, har fordelingsfunksjonen formen

F(x)=\sum\grenser_(x_i
hvor ulikheten x_i

En kontinuerlig tilfeldig variabel har en kontinuerlig distribusjonsfunksjon, grafen til denne funksjonen har form av en jevn kurve (fig. 8).

Vurder de generelle egenskapene til distribusjonsfunksjoner.

Egenskap 1. Fordelingsfunksjonen er ikke-negativ, en funksjon innelukket mellom null og én:

0\leqslant(F(x))\leqslant1

Gyldigheten til denne egenskapen følger av det faktum at fordelingsfunksjonen F(x) er definert som sannsynligheten for en tilfeldig hendelse at X

Egenskap 2. Sannsynligheten for at en tilfeldig variabel faller inn i intervallet [\alpha;\beta) er lik differansen mellom verdiene til fordelingsfunksjonen i enden av dette intervallet, dvs.

P\(\alpha\leqslant(X)<\beta\}=F(\beta)-F(\alpha)

Det følger at sannsynligheten for en enkelt verdi av en kontinuerlig tilfeldig variabel er null.

Egenskap 3. Fordelingsfunksjonen til en stokastisk variabel er en ikke-avtagende funksjon, dvs. F(\beta)\geqslant(F(\alpha)).

Egenskap 4. Ved minus uendelig er fordelingsfunksjonen lik null, og ved pluss uendelig er den lik én, dvs. \lim_(x\to-\infty)F(x)=0 og \lim_(x\to+\infty)F(x)=1.

Eksempel 1. Fordelingsfunksjonen til en kontinuerlig tilfeldig variabel er gitt av uttrykket

F(x)=\begin(cases)0,&x\leqslant1\\a(x-1)^2,&1 0\end(saker).

Finn koeffisient a og plott F(x) . Bestem sannsynligheten for at den tilfeldige variabelen X som et resultat av eksperimentet vil ta en verdi på intervallet.

Løsning. Siden fordelingsfunksjonen til en kontinuerlig tilfeldig variabel X er kontinuerlig, får vi for x=3 a(3-1)^2=1 . Derfor a=\frac(1)(4) . Grafen til funksjonen F(x) er vist i fig. 9.

Basert på den andre egenskapen til distribusjonsfunksjonen har vi

P\(1\leqslant(X)<2\}=F(2)-F(1)=\frac{1}{4}.

Sannsynlighetstetthetsfordeling og dens egenskaper

Fordelingsfunksjonen til en kontinuerlig tilfeldig variabel er dens probabilistiske karakteristikk. Men det har en ulempe, som består i det faktum at det er vanskelig å bedømme arten av fordelingen av en tilfeldig variabel i et lite nabolag til et eller annet punkt på den numeriske aksen. En mer visuell representasjon av arten av fordelingen av en kontinuerlig tilfeldig variabel er gitt av en funksjon kaltn, eller til en tilfeldig variabel.

Distribusjonstetthet f(x) er lik den deriverte av fordelingsfunksjonen F(x) , dvs.

F(x)=F"(x).

Betydningen av fordelingstettheten f(x) er at den indikerer hvor ofte den tilfeldige variabelen X vises i et eller annet nabolag til punktet x når eksperimentene gjentas. Kurven som viser fordelingstettheten f(x) til en tilfeldig variabel kalles distribusjonskurve.

Ta i betraktning fordelingstetthetsegenskaper.

Egenskap 1. Fordelingstettheten er ikke-negativ, dvs.

F(x)\geqslant0.

Egenskap 2. Fordelingsfunksjonen til en stokastisk variabel er lik integralet av tettheten i intervallet fra -\infty til x, dvs.

F(x)=\int\limits_(-\infty)^(x)f(x)\,dx.

Egenskap 3. Sannsynligheten for at en kontinuerlig tilfeldig variabel X treffer segmentet (\alfa;\beta) er lik integralet av distribusjonstettheten tatt over dette segmentet, dvs.

P\(\alpha\leqslant(X)\leqslant\beta\)=\int\limits_(\alpha)^(\beta)f(x)\,dx.

Egenskap 4. Integralet i uendelige grenser for distribusjonstettheten er lik en:

\int\limits_(-\infty)^(+\infty)f(x)\,dx=1.

Eksempel 2. Tilfeldig variabel X er underlagt fordelingsloven med tetthet

F(x)=\begin(cases)0,&x<0\\a\sin{x},&0\pi\end(caser)

Bestem koeffisienten a; bygge en graf over distribusjonstettheten; finn sannsynligheten for å treffe en tilfeldig variabel i området fra 0 til \frac(\pi)(2) bestem fordelingsfunksjonen og bygg dens graf.

\int\limits_(-\infty)^(+\infty)f(x)\,dx=a\int\limits_(0)^(\pi)\sin(x)\,dx=\Bigl.(- a\cos(x))\Bigl|_(0)^(\pi)=2a.

Tar vi hensyn til egenskap 4 for distribusjonstettheten, finner vi a=\frac(1)(2) . Derfor kan distribusjonstettheten uttrykkes som følger:

F(x)=\begin(cases)0,&x<0\\\dfrac{1}{2}\sin{x},&0\pi\end(tilfeller).

Plottet av fordelingstettheten i fig. 10. Ved eiendom 3 har vi

P\!\venstre\(0

For å bestemme fordelingsfunksjonen bruker vi egenskap 2:

F(x)=\frac(1)(2)\int\limits_(0)^(x)\sin(x)\,dx=\Bigl.(\-\frac(1)(2)\cos( x))\Bigl|_(0)^(x)=\frac(1)(2)-\frac(1)(2)\cos(x).

Dermed har vi

F(x)=\begin(cases)0,&x<0\\\dfrac{1}{2}-\dfrac{1}{2}\cos{x},&0\pi\end(tilfeller).

Fordelingsfunksjonsgrafen er vist i fig. elleve

Numeriske kjennetegn ved tilfeldige variabler

Fordelingsloven karakteriserer fullstendig en tilfeldig variabel fra et sannsynlighetssynspunkt. Men når du løser en rekke praktiske problemer, er det ikke nødvendig å vite alle mulige verdier av en tilfeldig variabel og de tilsvarende sannsynlighetene, men det er mer praktisk å bruke noen kvantitative indikatorer. Slike indikatorer kalles tall. kjennetegn ved en tilfeldig variabel. De viktigste er den matematiske forventningen, variansen, øyeblikkene i forskjellige rekkefølger, modus og median.

Den matematiske forventningen kalles noen ganger middelverdien til en tilfeldig variabel. Tenk på en diskret tilfeldig variabel X som tar verdiene x_1,x_2,\ldots,x_n med sannsynligheter hhv p_1, p_2,\ldots,p_n La oss bestemme det aritmetiske gjennomsnittet av verdiene til en tilfeldig variabel, vektet av sannsynlighetene for at de forekommer. Dermed beregner vi gjennomsnittsverdien av en tilfeldig variabel, eller dens matematiske forventning M(X) :

M(X)=\frac(x_1p_1+x_2p_2+\cdots+x_np_n)(p_1+p_2+\cdots+p_n)=\frac(\sum\limits_(i=1)^(n)x_ip_i)(\sum\limits_( i=1)^(n)p_i).

Gitt at \sum\limits_(i=1)^(n)p_i=1 vi får

M(X)=\sum\limits_(i=1)^(n)x_ip_i).~~~~~~~(4.1)

Så, matematisk forventning En diskret tilfeldig variabel er summen av produktene av alle dens mulige verdier og de tilsvarende sannsynlighetene.

For en kontinuerlig tilfeldig variabel, den matematiske forventningen

M(X)=\int\limits_(-\infty)^(\infty)xf(x)\,dx.

Matematisk forventning om en kontinuerlig tilfeldig variabel X , hvis mulige verdier tilhører segmentet,

M(X)=\int\limits_(a)^(b)xf(x)\,dx.~~~~~~~(4.2)

Ved å bruke saF(x) kan den matematiske forventningen til en tilfeldig variabel uttrykkes som følger:

M(X)=\int\limits_(-\infty)^(\infty)x\,d(F(x)).

Forventningsegenskaper

Egenskap 1. Den matematiske forventningen til summen av to tilfeldige variabler er lik summen av deres matematiske forventninger:

M(X+Y)=M(X)+M(Y).

Egenskap 2. Den matematiske forventningen til produktet av to uavhengige tilfeldige variabler er lik produktet av deres matematiske forventninger:

M(XY)=M(X)M(Y).

Egenskap 3. Den matematiske forventningen til en konstant verdi er lik konstanten selv:

M(c)=c.

Egenskap 4. En konstant multiplikator av en tilfeldig variabel kan tas ut av forventningstegnet:

M(cX)=cM(X).

Egenskap 5. Den matematiske forventningen til avviket til en tilfeldig variabel fra dens matematiske forventning er null:

M(X-M(X))=0.

Eksempel 3. Finn den matematiske forventningen til antall defekte produkter i et utvalg på fem produkter, hvis den stokastiske variabelen X (antall defekte produkter) er gitt av en distribusjonsserie.

\begin(array)(|c|c|c|c|c|c|c|)\hline(X)&0&1&2&3&4&5\\\hline(P)&0,\!2373&0,\!3955&0,\!2637&0,\ !0879&0,\!0146&0,\!0010\\\hline\end(array)

Løsning. Ved formel (4.1) finner vi

M(X)=0\cdot0,\!2373+1\cdot0,\!3955+2\cdot0,\!2637+3\cdot0,\!0879+4\cdot0,\!0146+5\cdot0,\ !0010 =1,\!25.

Modus M_0 for en diskret tilfeldig variabel dens mest sannsynlige verdi kalles.

Modus M_0 for en kontinuerlig tilfeldig variabel dens verdi kalles, som tilsvarer den største verdien av distribusjonstettheten. Geometrisk tolkes modusen som abscissen til punktet til fordelingskurvens globale maksimum (fig. 12).

Median M_e av tilfeldig variabel dens verdi kalles for som likhet

P\(X Meg\).

Fra et geometrisk synspunkt er medianen abscissen til punktet der arealet av figuren avgrenset av sannsynlighetsfordelingskurven og abscisseaksen er delt i to (fig. 12). Siden hele området avgrenset av fordelingskurven og x-aksen er lik én, er fordelingsfunksjonen i punktet som tilsvarer medianen 0,5, dvs.

F(M_e)=P\(X

Ved hjelp av varians og standardavvik kan man bedømme spredningen av en tilfeldig variabel rundt den matematiske forventningen. Som et mål på spredning av en tilfeldig variabel brukes den matematiske forventningen til det kvadrerte avviket til en tilfeldig variabel fra dens matematiske forventning, som kalles tilfeldig variabel varians X og angir D[X] :

D[X]=M((X-M(X))^2).

For en diskret tilfeldig variabel er variansen lik summen av produktene av kvadrerte avvik av verdiene til den tilfeldige variabelen fra dens matematiske forventning med de tilsvarende sannsynlighetene:

D[X]=\sum\limits_(i=1)^(n)(x_i-M(X))^2p_i.

For en kontinuerlig tilfeldig variabel hvis distribusjonslov er gitt av sf(x), variansen

D[X]=\int\limits_(-\infty)^(+\infty)(x-M(X))^2f(x)\,dx.

Dimensjonen til variansen er lik kvadratet på dimensjonen til den tilfeldige variabelen og kan derfor ikke tolkes geometrisk. Disse manglene er fratatt standardavviket til en tilfeldig variabel, som beregnes av formelen

\sigma=\sqrt(D[X]).

Egenskaper for spredningen av tilfeldige variabler

Egenskap 1. Variansen av summen av to uavhengige tilfeldige variabler er lik summen av variansene til disse variablene:

D=D[X]+D[Y].

Egenskap 2. Variansen til en tilfeldig variabel er lik forskjellen mellom den matematiske forventningen til kvadratet til den tilfeldige variabelen X og kvadratet av dens matematiske forventning:

D[X]=M(X^2)-(M(X))^2.~~~~~~~(4,3).

Egenskap 3. Spredningen av en konstant verdi er null:

D[c]=0.

Egenskap 4. En konstant faktor av en tilfeldig variabel kan tas ut av varianstegnet ved først å kvadrere det:

D=c^2D[X].

Egenskap 5. Variansen til produktet av to uavhengige tilfeldige variable X og Y bestemmes av formelen

D=D[X]D[Y]+(M(X))^2D[Y]+(M(X))^2D[X].

Eksempel 4. Beregn variansen av antall defekte produkter for distribusjonen av eksempel 3.

Løsning. Per definisjon av varians

En generalisering av de viktigste numeriske egenskapene til en tilfeldig variabel er begrepet momenter til en tilfeldig variabel.

Det første øyeblikket av den q. ordren tilfeldig variabel kalles den matematiske forventningen til verdien X^q:

Det første øyeblikket av den første orden er den matematiske forventningen, og det sentrale momentet i den andre orden er variansen til den tilfeldige variabelen.

Det normaliserte sentrale momentet av den tredje orden tjener som en karakteristikk av skjevheten eller asymmetrien til fordelingen ( asymmetrifaktor):

A_s=\frac(\mu_(()_3))(\sigma^3).

Det normaliserte sentrale momentet av fjerde orden fungerer som en karakteristikk av topp- eller flattoppfordelingen ( overskytende):

E=\frac(\mu_(()_4))(\sigma^4)-3.

Eksempel 5. Tilfeldig variabel X er gitt vedn

F(x)=\begin(cases)0,&x<0;\\ax^2,&02.\end(saker).

Finn koeffisient a , matematisk forventning, varians, skjevhet og kurtose.

Løsning. Arealet avgrenset av distribusjonskurven er numerisk lik

\int\limits_(0)^(2)f(x)\,dx=a\int\limits_(0)^(2)x^2\,dx=\venstre.(a\,\frac(x^ 3)(3))\right|_(0)^(2)=\frac(8)(3)\,a.

Gitt at dette arealet skal være lik én, finner vi a=\frac(3)(8) . Ved å bruke formel (4.2) finner vi den matematiske forventningen:

M(X)=\int\limits_(0)^(2)xf(x)\,dx=\frac(3)(8)\int\limits_(0)^(2)x^3\,dx= \left.(\frac(3)(8)\cdot\frac(x^4)(4))\right|_(0)^(2)=1,\!5.

Dispersjonen bestemmes ved formel (4.3). For å gjøre dette finner vi først den matematiske forventningen til kvadratet til en tilfeldig variabel:

M(X^2)=\int\limits_(0)^(2)x^2f(x)\,dx=\frac(3)(8)\int\limits_(0)^(2)x^4 \,dx=\venstre.(\frac(3)(8)\cdot\frac(x^5)(5))\right|_(0)^(2)=2,\!4.

På denne måten,

\begin(justert)D(X)&=M(X^2)-(M(X))^2=2,\!4-(1,\!5)^2=0,\!15;\ \ \sigma(X)&=\sqrt(D(X))=\sqrt(0,\!15)\approx0,\!3873.\end(justert)

Ved å bruke de første øyeblikkene, beregner vi de sentrale øyeblikkene av tredje og fjerde orden:

\begin(aligned)\nu_1&=M(X)=1,\!5;\quad\nu_2=M(X^2)=2,\!4.\\ \nu_3&=M(X^3)=\ int\limits_0^2(x^3f(x)\,dx)=\frac(3)(8)\int\limits_0^2(x^5\,dx)=\venstre.(\frac(3)( 8)\cdot\frac(x^6)(6))\right|_0^2=4;\\ \nu_4&=M(X^4)=\int\limits_0^2(x^4f(x)\ ,dx)=\frac(3)(8)\int\limits_0^2(x^6\,dx)=\venstre.(\frac(3)(8)\cdot\frac(x^7)(7) ))\right|_0^2\approx6,\!8571;\\ \mu_3&=\nu_3-3\nu_1\nu_2+2\nu_1^3=4-3\cdot1,\!5\cdot2,\!4 +2\cdot(1,\!5)^3=-0,\!05.\\ \mu_4&=\nu_4-4\nu_1\nu_3+6\nu_1^2\nu_2-3\nu_1^4=\ \&=6,\!8571-4\cdot1,\!5\cdot4+6\cdot(1,\!5)^2\cdot2,\!4-3\cdot(1,\!5)^4 =0,\!0696.\\ A_s&=\frac(\mu_3)(\sigma^3)=-\frac(0,\!05)((0,\!3873)^3)=-0,\ !86.\\ E&=\frac(\mu_4)(\sigma^4)-3=\frac(0,\!0696)((0,\!3873)^4)-3=-0,\! 093.\end(justert)

Numeriske karakteristikker av det aritmetiske gjennomsnittet av n uavhengige tilfeldige variabler

La x_1,x_2,\ldots,x_n- verdier av tilfeldig variabel X oppnådd fra n uavhengige forsøk. Den matematiske forventningen til en tilfeldig variabel er lik M(X) , og dens varians er D[X] . Disse verdiene kan betraktes som uavhengige tilfeldige variabler X_1,X_2,\ldots,X_n med de samme matematiske forventningene og variansene:

M(X_i)=M(X); \quad D=D[X],~~i=1,2,\ldots,n.

Det aritmetiske gjennomsnittet av disse tilfeldige variablene

\overline(X)=\sum\limits_(i=1)^(n)\frac(X_i)(n).

Ved å bruke egenskapene til matematisk forventning og spredning av en tilfeldig variabel kan vi skrive:

\begin(aligned)M(\overline(X))&=M\!\left(\frac(1)(n)\sum\limits_(i=1)^(n)X_i\right)=\frac( 1)(n)\sum\limits_(i=1)^(n)M(X_i)=M(X).~~~~~~~(4.4)\\ D[\overline(X)]&= D\!\venstre[\frac(1)(n)\sum\limits_(i=1)^(n)X_i\right]=\frac(1)(n^2)\sum\limits_(i=1 )^(n)D=\frac(D[X])(n).~~~~~~~(4.5)\end(justert)


Gå til neste seksjon
Multivariate tilfeldige variabler
JavaScript er deaktivert i nettleseren din.
ActiveX-kontroller må være aktivert for å kunne gjøre beregninger!