Hva er en tilfeldig variabel. Hvor mange verdier kan en diskret tilfeldig variabel ta

Et av de viktigste grunnleggende begrepene i sannsynlighetsteori er begrepet en tilfeldig variabel.

En tilfeldig variabel er en størrelse som som følge av et eksperiment kan få en eller annen verdi, og det er ikke kjent på forhånd hvilken.

Eksempler på tilfeldige variabler:

1) antall treff med tre skudd;

2) antall anrop mottatt av telefonsentralen per dag;

3) trefffrekvens med 10 skudd.

I alle tre eksemplene kan tilfeldige variabler få separate, isolerte verdier, som kan telles opp på forhånd.

Så i eksempel 1) er disse verdiene:

i eksempel 2):

i eksempel 3)

0; 0,1; 0,2; …; 1,0.

Slike tilfeldige variabler, som kun tar verdier atskilt fra hverandre, som kan telles på forhånd, kalles diskontinuerlige eller diskrete tilfeldige variabler.

Det er tilfeldige variabler av en annen type, for eksempel:

1) abscisse av treffpunktet ved avfyring;

2) feilen med å veie kroppen på en analytisk vekt;

3) hastigheten til flyet på tidspunktet for å nå en gitt høyde;

4) vekten av et hvetekorn tatt tilfeldig.

De mulige verdiene til slike tilfeldige variabler er ikke atskilt fra hverandre; de fyller kontinuerlig et visst gap, som noen ganger har skarpt definerte grenser, og oftere - ubestemte, vage grenser.

Slike tilfeldige variabler, hvis mulige verdier kontinuerlig fyller et visst intervall, kalles kontinuerlige tilfeldige variabler.

Konseptet med en tilfeldig variabel spiller en veldig viktig rolle i sannsynlighetsteori. Hvis den "klassiske" sannsynlighetsteorien hovedsakelig opererte med hendelser, foretrekker den moderne sannsynlighetsteorien, der det er mulig, å operere med tilfeldige variabler.

La oss gi eksempler på metoder for overgang fra hendelser til tilfeldige variabler som er typiske for sannsynlighetsteori.

Et eksperiment utføres, som et resultat av at en hendelse kan eller ikke vises. I stedet for en hendelse kan vi vurdere en tilfeldig variabel , som er lik 1 hvis hendelsen inntreffer, og er lik 0 hvis hendelsen ikke inntreffer. Den tilfeldige variabelen er åpenbart diskontinuerlig; den har to mulige verdier: 0 og 1. Denne tilfeldige variabelen kalles den karakteristiske tilfeldige variabelen for hendelsen. I praksis viser det seg ofte å være mer praktisk å operere med sine karakteristiske tilfeldige variabler i stedet for hendelser. For eksempel, hvis det utføres en serie eksperimenter, hvor forekomsten av hendelsen er mulig i hver av dem, er det totale antallet forekomster av hendelsen lik summen av de karakteristiske tilfeldige variablene for hendelsen i alle eksperimenter. Når du løser mange praktiske problemer, viser bruken av denne teknikken seg å være veldig praktisk.

På den annen side, veldig ofte, for å beregne sannsynligheten for en hendelse, viser det seg å være praktisk å assosiere denne hendelsen med en kontinuerlig tilfeldig variabel (eller et system med kontinuerlige variabler).

La for eksempel koordinatene til et objekt O måles for å konstruere et punkt M som viser dette objektet på et panorama (sveip) av området. Vi er interessert i hendelsen som består i det faktum at feilen R ved posisjonen til punktet M ikke vil overstige den angitte verdien (fig. 2.4.1). La oss betegne tilfeldige feil i måling av objektkoordinater. Åpenbart tilsvarer hendelsen å treffe et tilfeldig punkt M med koordinater innenfor en sirkel med radius sentrert ved punkt O. Med andre ord, for at hendelsen skal inntreffe, må de tilfeldige variablene og tilfredsstille ulikheten

Sannsynligheten for en hendelse er ikke annet enn sannsynligheten for å oppfylle ulikheten (2.4.1). Denne sannsynligheten kan bestemmes hvis egenskapene til tilfeldige variabler er kjent.

En slik organisk sammenheng mellom hendelser og tilfeldige variabler er svært karakteristisk for moderne sannsynlighetsteori, som når det er mulig går over fra «hendelsesskjemaet» til «skjemaet med tilfeldige variabler». Sistnevnte ordning er i sammenligning med førstnevnte et mye mer fleksibelt og universelt apparat for å løse problemer knyttet til tilfeldige fenomener.

Tilfeldig verdi- dette er en størrelse som, som et resultat av erfaring, tar en av de mange verdiene, og utseendet til en eller annen verdi av denne mengden før målingen kan ikke forutsies nøyaktig.

Formell matematisk definisjon følgende: la være et sannsynlighetsrom, så er en tilfeldig variabel en funksjon som er målbar med hensyn til og Borel σ-algebraen på . Den sannsynlige oppførselen til en separat (uavhengig av andre) tilfeldig variabel er fullstendig beskrevet av dens fordeling.

Definisjon [rediger]

Rom med elementære hendelser [rediger]

Rommet av elementære hendelser i tilfelle av å kaste en terning

Hvis en terning kastes, kan toppflaten være en av de seks flatene med et antall prikker fra én til seks. Tapet av ethvert ansikt i dette tilfellet i sannsynlighetsteori kalles elementær begivenhet, det vil si

Settet med alle ansikter danner et rom av elementære hendelser, undergrupper av disse kalles tilfeldige hendelser. I tilfelle av et enkelt terningkast, er eksempler på hendelser

Algebra av hendelser

Et sett med tilfeldige hendelser danner en hendelsesalgebra hvis følgende betingelser er oppfylt:

Hvis den i stedet for den tredje betingelsen tilfredsstiller en annen betingelse: foreningen av en tellbar underfamilie av også tilhører , danner settet med tilfeldige hendelser en σ-algebra av hendelser.

Algebraen av hendelser er et spesialtilfelle av σ-algebraen av sett.

Den minste av alle mulige -algebraer, hvis elementer alle er intervaller på den reelle linjen, kalles Borel σ-algebraen på settet med reelle tall.

Sannsynlighet [rediger]

Hvis hver elementær hendelse er tildelt et nummer som betingelsen er oppfylt for:

da anses det at sannsynlighetene for elementære hendelser er gitt. Sannsynligheten for en hendelse, som en tellbar delmengde av rommet av elementære hendelser, er definert som summen av sannsynlighetene for de elementære hendelsene som tilhører denne hendelsen. Tellingskravet er viktig, for ellers vil summen være udefinert.

Tenk på et eksempel på å bestemme sannsynligheten for ulike tilfeldige hendelser. For eksempel, hvis en hendelse er et tomt sett, er sannsynligheten null:

Hvis hendelsen er rommet for elementære hendelser, er sannsynligheten lik én:

Sannsynligheten for en hendelse (en delmengde av rommet av elementære hendelser) er lik summen av sannsynlighetene for de elementære hendelsene som inkluderer hendelsen under vurdering.

Definisjon av en tilfeldig variabel [rediger]

En tilfeldig variabel er en funksjon som kan måles med hensyn til og en Borel σ-algebra på .

En tilfeldig variabel kan også defineres på en annen ekvivalent måte. En funksjon kalles en tilfeldig variabel hvis for noen reelle tall og et sett med hendelser slik at , tilhører .

Eksempler [rediger]

er lik det aritmetiske gjennomsnittet av alle mottatte verdier.

.

,

det vil si at den matematiske forventningen ikke er definert.

Klassifisering [rediger]

tilfeldige variabler kan ta diskrete, kontinuerlige og diskrete-kontinuerlige verdier. Følgelig er tilfeldige variabler klassifisert i diskrete, kontinuerlige og diskrete-kontinuerlige (blandet).

På testskjemaet kan både en egen tilfeldig variabel (endimensjonal/skalar) og et helt system av endimensjonale innbyrdes beslektede tilfeldige variabler (flerdimensjonal/vektor) defineres.

  • Et eksempel på en blandet tilfeldig variabel er ventetiden ved gjennomkjøring vei i byen i et uregulert kryss.
  • I uendelige skjemaer (diskrete eller kontinuerlige) er det praktisk å beskrive kvantitativt allerede i utgangspunktet elementære utfall. For eksempel antall graderinger av typer ulykker i analysen av trafikkulykker; instrument oppetid for kvalitetskontroll, etc.
  • Numeriske verdier som beskriver resultatene av eksperimenter kan ikke nødvendigvis karakterisere individuelle elementære utfall i testskjemaet, men tilsvarer også noen mer komplekse hendelser.

På den ene siden kan flere numeriske verdier assosieres samtidig med ett testskjema og med individuelle hendelser i det, som må analyseres sammen.

  • For eksempel koordinatene (abscisse, ordinat) til en slags prosjektileksplosjon når man skyter mot et bakkemål; metriske dimensjoner (lengde, bredde, etc.) av delen under kvalitetskontroll; resultatene av en medisinsk undersøkelse (temperatur, trykk, puls, etc.) ved diagnostisering av en pasient; folketellingsdata (etter alder, kjønn, formue osv.).

Siden verdiene til de numeriske egenskapene til testskjemaene i skjemaet tilsvarer noen tilfeldige hendelser (med deres visse sannsynligheter), er disse verdiene i seg selv tilfeldige (med samme sannsynligheter). Derfor kalles slike numeriske egenskaper vanligvis tilfeldige variabler. I dette tilfellet kalles fordelingen av sannsynligheter for verdiene til en tilfeldig variabel loven om distribusjon av en tilfeldig variabel.

Beskrivelsesmetoder[rediger]

Det er mulig å delvis sette en tilfeldig variabel, og dermed beskrive alle dens sannsynlighetsegenskaper som en separat tilfeldig variabel, ved å bruke fordelingsfunksjonen, sannsynlighetstettheten og karakteristisk funksjon, for å bestemme sannsynlighetene for dens mulige verdier. Fordelingsfunksjonen F(x) er sannsynligheten for at verdiene til den tilfeldige variabelen er mindre enn det reelle tallet x. Det følger av denne definisjonen at sannsynligheten for at verdien av en tilfeldig variabel faller inn i intervallet

En tilfeldig variabel, generelt sett, kan ta verdier i ethvert målbart rom. Da kalles det ofte en tilfeldig vektor eller et tilfeldig element. For eksempel,

Se også [rediger]

  • tilfeldig prosess
  • distribusjonsfunksjon
  • Forventet verdi

Notater [rediger]

  1. 1 2 Chernova N. I. Kapittel 1. § 2. Elementær sannsynlighetsteori // Sannsynlighetsteori. - Opplæringen. - Novosibirsk: Novosibirsk-staten. un-t, 2007. - 160 s.
  2. Chernova N. I. Kapittel 3. § 1. Algebra og sigma-algebra av hendelser // Sannsynlighetsteori. - Opplæringen. - Novosibirsk: Novosibirsk-staten. un-t, 2007. - 160 s.
  3. Chernova N. I. KAPITTEL 1 § 2. Elementær sannsynlighetsteori // Sannsynlighetsteori. - Opplæringen. - Novosibirsk: Novosibirsk-staten. un-t, 2007. - 160 s.
  4. 1 2 Chernova N. I. Kapittel 6. Tilfeldige variabler og deres distribusjoner § 1. Tilfeldige variabler // Sannsynlighetsteori. - Opplæringen. - Novosibirsk: Novosibirsk-staten. un-t, 2007. - 160 s.

Litteratur [rediger]

  • Gnedenko B.V. Sannsynlighetsteorikurs. - 8. utg. legge til. og riktig. - M.: Redaksjonell URSS, 2005. - 448 s.
  • Matematisk encyklopedisk ordbok/ Kap. utg. Prokhorov Yu. V. - 2. utg. - M.: "Soviet Encyclopedia", 1998. - 847 s.
  • Tikhonov V.I., Kharisov V.N. Statistisk analyse og syntese av radiotekniske enheter og systemer. - Lærebok for universiteter. - M.: Radio og kommunikasjon, 1991. - 608 s. - ISBN 5-256-00789-0
  • Chernova N. I. Sannsynlighetsteori. - Opplæringen. - Novosibirsk: Novosibirsk-staten. un-t, 2007. - 160 s.

Definisjon. En tilfeldig variabel er en slik variabel som, som et resultat av et eksperiment, tar en hvilken som helst verdi fra settet med mulige verdier, og det er umulig å forutsi hvilken før eksperimentet.

Tilfeldige variabler er for eksempel antall poeng som faller ut når en terning kastes, antall apotekbesøkende i løpet av dagen, antall epler på et tre osv.

Tilfeldige variabler er også pasientens temperatur på et tilfeldig valgt tidspunkt på dagen, massen til en tilfeldig valgt tablett av et eller annet medikament, høyden til en tilfeldig valgt student, etc.

O

Men fra et matematisk synspunkt er det en grunnleggende forskjell mellom slike tilfeldige variabler som for eksempel antall apotekbesøkende i løpet av dagen (la oss betegne denne tilfeldige variabelen X 1) og veksten til en tilfeldig valgt student fra en en viss gruppe elever (verdi X 2), er det en grunnleggende forskjell, nemlig: for X 1-verdien kan du liste opp alle mulige verdier (1, 2, 3, 4, 5, 6, .. .), mens for X 2-verdien kan dette ikke gjøres, siden denne verdien, som et resultat av målingen, kan ta hvilken som helst verdi fra segmentet , der

og - henholdsvis minimums- og maksimumshøyden til elevene i gruppen.

Tilfeldige variabler er vanligvis betegnet med store bokstaver i det latinske alfabetet - X, Y, Z, etc., og deres mulige verdier - med de tilsvarende små bokstavene med numeriske indekser. For eksempel er verdiene til en tilfeldig variabel x angitt som følger: x 1, x 2, x 3, etc.

Konseptet med diskrete og kontinuerlige tilfeldige variabler

Definisjon. En tilfeldig variabel kalles diskret hvis settet med alle dens mulige verdier er et endelig eller uendelig, men nødvendigvis tellbart sett med verdier, dvs. et slikt sett, hvis alle elementer (i det minste teoretisk) kan nummereres og skrives ut i riktig rekkefølge.

Definisjon. En tilfeldig variabel kalles kontinuerlig hvis settet med dens mulige verdier er et endelig eller uendelig intervall på den numeriske aksen.

Basert på disse definisjonene er slike tilfeldige variabler oppført ovenfor som antall poeng som faller ut ved terningkast, antall apotekbesøkende i løpet av dagen, antall epler pr. tre, er diskrete tilfeldige variabler, og som pasientens temperatur på et fast tidspunkt på dagen, massen til en tilfeldig valgt tablett av et eller annet medikament, høyden til en tilfeldig valgt student, er kontinuerlige variabler.

Diskrete tilfeldige variabler

La oss ta en nærmere titt diskrete tilfeldige variabler, og som regel vil vi begrense vår vurdering til slike tilfeldige variabler der antallet mulige verdier er begrenset.

Den mest komplette informasjonen om en diskret tilfeldig variabel er gitt av loven om distribusjon av denne variabelen.

Definisjon. Fordelingsloven til en diskret tilfeldig variabel er samsvaret mellom alle mulige verdier av denne tilfeldige variabelen og deres tilsvarende sannsynligheter.

Fordelingsloven til en diskret tilfeldig variabel er ofte spesifisert i form av en to-linjers tabell, hvor den første raden viser alle mulige verdier av denne variabelen (som regel i stigende rekkefølge), og den andre raden viser sannsynlighetene som tilsvarer disse verdiene i tabell 1:

Eksempel 2 Det er ti elevgrupper med henholdsvis 12, 10, 11, 8, 12, 9, 10, 8, 10 og 11 elever. Skriv en fordelingslov for en tilfeldig variabel X, definert som antall elever i en tilfeldig valgt gruppe.

Løsning. De mulige verdiene for den betraktede tilfeldige variabelen X er følgende (i stigende rekkefølge):

8, 9, 10, 11 og 12.

Siden tilfeldig variabel X har en verdi på 8, hvis den tilfeldig valgte gruppen er en gruppe på 8 elever (la oss kalle det hendelse A), er sannsynligheten for at tilfeldig variabel X vil ta på seg verdien
, er lik sannsynligheten for denne tilfeldige hendelsen:
.

Sannsynligheten for en tilfeldig hendelse A i samsvar med den klassiske definisjonen av sannsynlighet er
fordi av 10 grupper har to 8 elever hver.

Derfor, for sannsynligheten for en verdi, får vi:

.

På samme måte kan du finne sannsynlighetene for de gjenværende verdiene til den tilfeldige variabelen X:

som lar oss komponere ønsket distribusjonslov (tabell 2):

Fordelingsloven til en diskret tilfeldig variabel kan også spesifiseres ved å bruke en formel som lar hver mulig verdi av denne variabelen bestemme den tilsvarende sannsynligheten.

Diskrete og kontinuerlige tilfeldige variabler

Som regel, ved produksjon av produkter, påvirkes produksjonsprosessen av mange forskjellige faktorer, som et resultat av at det er en spredning i verdiene til produktkvalitetsindikatorer. Derfor bør kvalitetsindikatorene til produserte produkter eller tjenester betraktes som tilfeldige variabler.

Tilfeldig variabel en slik verdi kalles, som, som et resultat av tester innenfor et visst intervall, kan anta forskjellige tallverdier (ifølge STB GOST R 50779.10 er en tilfeldig variabel en variabel som kan ta på seg en hvilken som helst verdi fra et gitt sett med verdier og som en sannsynlighetsfordeling er assosiert med).

Diskrete tilfeldige variabler kalles de som, som et resultat av tester, bare kan ta separate, isolerte verdier og ikke kan ta verdier mellom dem. For eksempel kan antallet dårlige deler i en batch bare være et positivt heltall 1, 2, 3 osv., men kan ikke være 1,3; 1,7 osv.

Kontinuerlig tilfeldig variabel en slik verdi kalles, som, som et resultat av tester, kan ta alle numeriske verdier fra en kontinuerlig serie av deres mulige verdier innenfor et visst intervall.

For eksempel er de faktiske dimensjonene til maskinerte deler tilfeldige variabler av en kontinuerlig type, siden de kan få en hvilken som helst numerisk verdi innenfor visse grenser.

Mulighetene for tilfeldige variabler for å ta visse numeriske verdier under tester blir evaluert ved hjelp av sannsynligheter.

Settet med verdier av tilfeldige variabler arrangert i stigende rekkefølge med en indikasjon på deres sannsynligheter for hver av verdiene kalles fordeling av tilfeldige variabler (ifølge STB GOST R 50779.10-fordeling er en funksjon som bestemmer sannsynligheten for at en tilfeldig variabel vil få en gitt verdi eller vil tilhøre et gitt sett med verdier).

Fordelingen av en tilfeldig variabel kan presenteres i tabellform, grafisk og ved hjelp av statistiske estimater.

Ved presentasjon av fordelingen av en tilfeldig variabel i tabellform, tilsvarer hvert nummer av produktenheten som studeres (målenummer) verdien av kvalitetsindikatoren for denne produktenheten (måleresultat).

Når du presenterer fordelingen av en tilfeldig variabel i en grafisk form, er en distribusjonsgraf plottet i koordinater, verdien av den tilfeldige variabelen - sannsynligheten (frekvens, frekvens) for verdien av den tilfeldige variabelen.

Figuren under viser grafene over fordelingen av diskrete og kontinuerlige stokastiske variabler.

Figur - Graf over fordelingen av en diskret tilfeldig variabel

Figur - Graf over fordelingen av en kontinuerlig tilfeldig variabel

Det er teoretiske og empiriske fordelinger av tilfeldige variabler. I teoretiske fordelinger utføres evalueringen av mulige verdier av en tilfeldig variabel ved å bruke sannsynligheter, og i empiriske fordelinger ved å bruke frekvenser eller frekvenser oppnådd som et resultat av tester.

Følgelig empirisk fordeling av en tilfeldig variabel er et sett med eksperimentelle verdier, arrangert i stigende rekkefølge, som indikerer frekvensene eller frekvensene for hver av verdiene (ifølge STB GOST R 50779.10 frekvensfordeling er det empiriske forholdet mellom verdiene til en funksjon og dens frekvenser eller dens relative frekvenser).

Bord. Et eksempel på en tabellrepresentasjon av den teoretiske fordelingen av en diskret tilfeldig variabel

Grafisk kan den empiriske fordelingen av en diskret tilfeldig variabel representeres som stolpediagram , dannet av et sett med kolonner med lik bredde, hvis høyder er proporsjonale med frekvensene til diskrete verdier til en tilfeldig variabel.

Figur - Søylediagram over en diskret tilfeldig variabel.

Hvis den tilfeldige variabelen er kontinuerlig, oppstår det noen vanskeligheter med presentasjonen av dens fordeling i form av en tabell eller graf. Derfor, i praksis, når man studerer tilfeldige variabler av en kontinuerlig type, blir de oppnådde verdiene delt inn i like intervaller slik at verdien av intervallet er noe større enn målefeilen for kvantiteten som studeres. Deretter beregnes frekvensene ikke av de faktiske verdiene til den tilfeldige variabelen, men etter intervaller. Derfor vil tabellen over empirisk fordeling av en tilfeldig variabel av kontinuerlig type ha følgende form.

Bord. Empirisk fordeling av en tilfeldig variabel av kontinuerlig type.

Verdiintervall X

Aritmetisk gjennomsnitt

Frekvens f Jeg

Frekvens m Jeg

160,031 - 160,033

160,033 - 160,035

160,035 - 160,037

160,037 - 160,039

160,039 - 160,041

160,041 - 160,043

160,043 - 160,045

160,045 - 160,047

f Jeg = 100

m Jeg = 1

Den empiriske fordelingen av en tilfeldig kontinuerlig variabel kan representeres grafisk som et distribusjonshistogram, en frekvenspolygon eller en kumulativ frekvenspolygon.

Distribusjonshistogram er et sett med rørende rektangler, hvis base er lik intervallene for å dele en kontinuerlig tilfeldig variabel, og arealene er proporsjonale med frekvensene som verdiene til den tilfeldige variabelen faller inn i disse intervallene (ifølge STB GOST R 50779.10 stolpediagram (fordeling) er en grafisk representasjon av frekvensfordelingen for en kvantitativ karakteristikk, dannet av sammenhengende rektangler, hvis basis er intervallene til klassene, og arealene er proporsjonale med frekvensene til disse klassene).

Figur - Histogram over fordelingen av en tilfeldig kontinuerlig variabel.

Frekvens polygon er en brutt linje oppnådd ved å koble sammen punkter hvis abscisser er lik midtpunktene til partisjonsintervallene, og ordinatene er lik de tilsvarende frekvensene.

Figur - Polygon av frekvenser til en tilfeldig kontinuerlig variabel.

Polygon kumulativ frekvenser er en brutt linje oppnådd ved å koble sammen punkter hvis abscisser er lik de øvre grensene for partisjonsintervallene, og hvis ordinater er lik enten kumulative frekvenser eller kumulative frekvenser (kumulative relative frekvenser).

Figur - Polygon av kumulative frekvenser med en tilfeldig kontinuerlig verdi.

I teoretiske beskrivelser av stokastiske variabler av kontinuerlig type brukes fordelingsfunksjonen. Den teoretiske fordelingen av en tilfeldig kontinuerlig variabel kan representeres grafisk som integral, invers integral, differensial distribusjonsfunksjoner og funksjoner intensitet.

La X være en tilfeldig variabel, og x være et reelt tall (med X< х ). Hendelse X< х отвечает вероятность Р(Х < х), которая является функцией F(х), т.е.

P(X< х) = F(х)

F(X) kalles distribusjonsfunksjon sannsynligheter tilfeldig variabel eller integralfordelingsfunksjon.

For en diskret tilfeldig variabel er integralfordelingsfunksjonen F(X) lett å bestemme fra en tabell eller graf.

Således, for eksemplet ovenfor på fordelingen av en diskret tilfeldig variabel (på X< 4):

F(X) = P( X ) = P( X=1) + P( X=2) + P( X=3) = 1/30 + 4/30 +15/30 = 19/30

Grafen til integralfordelingsfunksjonen til en diskret tilfeldig variabel vil se ut som en trinnkurve. Ordinatene til kurven for enhver verdi av X vil representere summen av sannsynlighetene til de tidligere verdiene.

Figur - Integralfordelingsfunksjon av en diskret tilfeldig variabel

Sannsynligheten for at en tilfeldig variabel under testing vil være innenfor grensene til to gitte verdier x 1 og x 2 (x 2 > x 1) er lik økningen av integralfunksjonen i dette området, dvs.

P(x 1 ≤ X ≤ x 2 ) = P(X< х 2 ) - P(X< х 1 ) = F(X 2 ) - F(X 1 )

Hvis vi går til eksemplet ovenfor på fordelingen av en diskret tilfeldig variabel, så for x1 = 2 og x2 = 3:

P(2≤X≤3) = P(X< 3) - Р(Х < 2)= F(Х2) - F(Х1)= 4/30-1/30 = 3/30

For en kontinuerlig tilfeldig variabel vil grafen til integralfordelingsfunksjonen se ut som en monotont økende kurve. I praksis bestemmes de teoretiske distribusjonsfrekvensene ved hjelp av den kumulative fordelingsfunksjonen.

Figur - Kumulativ fordelingsfunksjon

kontinuerlig tilfeldig variabel

Den inverse kumulative fordelingsfunksjonen er lik forskjellen mellom enhet og den kumulative fordelingsfunksjonen.

Distribusjonstetthet (differensialfordelingsfunksjon) tilfeldig variabel kalles den første deriverte av integralfordelingsfunksjonen:

For en analytisk beskrivelse av en kontinuerlig tilfeldig variabel i reliabilitetsteori bruker vi intensitetsfunksjon , lik forholdet mellom og den inverse integralfordelingsfunksjonen:

Figur - Intensitetsfunksjonen til en kontinuerlig tilfeldig variabel.

Emne 3.

Tilfeldige variabler og fordelingsfunksjoner

Konseptet med en tilfeldig variabel.

Konseptet med en tilfeldig variabel

Distribusjonsfunksjon av en tilfeldig variabel, dens egenskaper

Tilfeldige variabler med diskret fordeling

Konseptet med en tilfeldig variabel med en diskret fordeling

Loven for distribusjon av en diskret tilfeldig variabel.

Eksempler på diskrete fordelinger

Tilfeldige variabler med absolutt kontinuerlig fordeling

Konseptet med en tilfeldig variabel med en absolutt kontinuerlig fordeling

Fordelingsloven for en absolutt kontinuerlig tilfeldig variabel. Tetthet, dens egenskaper

Eksempler på absolutt kontinuerlige distribusjoner

Konseptet med en tilfeldig vektor.

Konseptet med en tilfeldig vektor

Uavhengige tilfeldige variabler

Fellesfordeling av tilfeldige variabler

Konseptet med en tilfeldig variabel.

Siden fremveksten av sannsynlighetsteori har hovedoppgaven vært å studere ikke de sannsynlige egenskapene til eksperimenter med tilfeldige utfall, men de numeriske størrelsene knyttet til disse eksperimentene, som det er naturlig å kalle tilfeldige variabler. For eksempel kan vi være interessert ikke i tallpar på de øvre sidene av terningene, men i summen deres; antall suksesser eller fiaskoer før den første suksessen i Bernoulli-ordningen.

Ofte i litteraturen kan du finne variasjoner over temaet for følgende definisjon: Tilfeldig variabel kalt en variabel som, avhengig av utfallet av testen, antar verdier som avhenger av tilfellet.

En tilfeldig variabel er altså en numerisk verdi, hvis verdi avhenger av hva slags (elementært) utfall som skjedde som et resultat av et eksperiment med et tilfeldig utfall. Settet med alle verdier som en tilfeldig variabel kan ta kalles sett med mulige verdier for denne tilfeldige variabelen.

Vi vil gi en mer streng definisjon, siden begrepet en tilfeldig variabel er et av de nøkkelbegrepene som forbinder sannsynlighetsteori med matematisk analyse og danner det konseptuelle grunnlaget for matematisk statistikk.

Definisjon. Tilfeldig variabel er en funksjon X = X(ω) definert på rommet til elementære hendelser Ω som hendelsen (X< х} = {ω: Х(ω) < х} принадлежит σ-алгебре событий A для любого вещественного х.

Tilstand (X< х} єA дает возможность рассматривать вероятности событий {Х < х}, поскольку вероятности определены только на множествах из MEN. I tillegg, gjennom hendelser (X< х}, х є (-∞, ∞) с помощью известных операций над событиями можно выразить сколь угодно сложное событие, связанное со случайной величиной Х. Такое событие также будет принадлежать σ-алгебре событий A и, следовательно, для него определена вероятность.

Kommentar. Dermed er en tilfeldig variabel en funksjon hvis definisjonsdomene er rommet til elementære hendelser Ω, og settet med verdier er et numerisk sett, muligens hele settet med reelle tall R.

σ-algebraen til hendelser A er domenet for definisjon av sannsynlighet, hvis vi betrakter det som en funksjon.

Kommentar . "Begrepet "random variabel" er noe unøyaktig, begrepet "Chance funksjon" ville være mer passende, den uavhengige variabelen er et punkt i rommet av elementære hendelser, dvs. utfallet av et eksperiment eller en sak. (W. Feller "Introduksjon til sannsynlighetsteori", kap. IX)

Tilfeldige variabler er merket med bokstavene i det greske alfabetet:  (xi),  (dette),  eller store bokstaver i det latinske alfabetet X, Y, ... Vi vil skrive verdiene til en tilfeldig variabel som en endelig eller uendelig rekkefølge x 1 ,x 2,, x n,; y 1 , y 2 ,, y n ,

Kommentar . Tidligere introduserte vi begrepet sannsynlighet i forhold til noen hendelser. Nå går vi videre til å snakke om funksjoner. Den mest åpenbare hendelsen som kan assosieres med konseptet med en funksjon er at den tar i bruk en verdi (spesifikk eller tilhørende intervallet)

For å studere de sannsynlige egenskapene til en tilfeldig variabel, er det nødvendig å kjenne regelen som lar deg finne sannsynligheten for at en tilfeldig variabel vil ta en verdi fra en delmengde av verdiene. Enhver slik regel kalles loven om sannsynlighetsfordeling eller fordeling (av sannsynligheter) for en tilfeldig variabel.(ordet "sannsynlighet" er vanligvis utelatt)

Den generelle fordelingsloven som ligger i alle tilfeldige variabler er distribusjonsfunksjon.

Definisjon. Hele settet med sannsynligheter P(X< х}, х є (-∞, ∞) задает distribusjonsloven til tilfeldig variabel X i generell sak. Ofte, for korthets skyld, kalles loven om distribusjon av en tilfeldig variabel ganske enkelt fordelingen av en tilfeldig variabel.

Definisjon. Funksjon F(x) = P(X< х}, х є (-∞, ∞) называется fordelingsfunksjonen til den tilfeldige variabelen X.

Verdien av fordelingsfunksjonen ved punkt x er lik sannsynligheten for hendelsen (X< х}, то есть события, состоящего из тех и только тех элементарных исходов ω, для которых Х < х.

Det sies vanligvis at verdien av fordelingsfunksjonen i punktet x er lik sannsynligheten for at den tilfeldige variabelen X får en verdi mindre enn x.

Geometrisk betyr dette følgende: F(x) er sannsynligheten for at den tilfeldige variabelen X vil ta på seg verdien representert av punktet på talllinjen til venstre for punktet x.

Kommentar . Fordelingsfunksjonen kalles også integrert funksjon, eller integrert lov fordeling av tilfeldig variabel X

Fordelingsfunksjonen har følgende eiendommer:

    0≤ F(x)≤1 (fordi distribusjonsfunksjonen per definisjon er en sannsynlighet)

    F(x 1) ≤ F(x 2) for x 1< x 2 (т.е. F(x) – неубывающая функция)

    lim F(x) = 0 som x → - ∞ , lim F(x) = 1 som x → + ∞

    P (x 1 ≤ X ≤ x 2) = F(x 1) - F(x 2)

    F(x) er en venstre kontinuerlig funksjon, dvs. F(x) = F(x - 0), hvor F(x - 0) = lim F(y) som y → x - 0 (venstre grense)

Kommentar . For å understreke hvilken tilfeldig variabel distribusjonsfunksjonen F(x) tilhører, tildeles denne funksjonen noen ganger et nedsett som angir en bestemt tilfeldig variabel. For eksempel, F X (x) = P (X< х}

Kommentar. I noen publikasjoner er distribusjonsfunksjonen definert som F(x) = P(X ≤ x). En slik definisjon endrer ikke noe i essensen av begrepet fordelingsfunksjon, kun den siste, femte egenskapen endres. Funksjonen i dette tilfellet viser seg å være høyrekontinuerlig.

Digresjon: "Hva er en funksjon?"

La oss få to sett X og Y, og Y er et tallsett. Og la regelen f gis, ifølge hvilken hvert element (punkt) i mengden X er assosiert med (ett og bare ett) element (tall) i mengden Y. Regelen f sammen med mengdene X og Y definerer funksjon f. Notasjonen y=f(x) betyr at regelen f ble brukt på et punkt x i mengden X, og som et resultat fikk vi et punkt y fra mengden Y. X kalles argumentet (uavhengig variabel), og y er verdien (avhengig variabel) til funksjonen f i punktet X. Settet X kalles definisjonsdomenet (innstillingsområde) til funksjonen, de sier at funksjonen er gitt på dette settet, settet Y kalles settet med verdier til funksjonen. Settet X er ikke nødvendigvis et tallsett. Dermed er en tilfeldig variabel en funksjon definert på et ikke-numerisk rom med elementære hendelser.

TILFELDIGE VERDIER

En tilfeldig verdi er en størrelse som som følge av testen vil få én og kun én mulig verdi, og som ikke er kjent på forhånd.

Diskret er en tilfeldig variabel som tar på seg separate, isolerte mulige verdier med visse sannsynligheter.

En kontinuerlig variabel er en tilfeldig variabel som kan ta på seg alle verdier fra et begrenset eller uendelig intervall.

Loven om distribusjon av en diskret tilfeldig variabel er samsvaret mellom de mulige verdiene til en tilfeldig variabel og deres sannsynligheter. Denne loven er gitt i form av en tabell, formel eller graf.

For diskrete tilfeldige variabler er en av de vanligste den såkalte binomiale distribusjonsloven, som Bernoulli-ordningen med gjentakelse av tester fører til. Formel (8) er det analytiske uttrykket for denne loven.

Eksempel 11.

En melding sendes over kommunikasjonskanalen ved hjelp av en kode som består av to tegn. Sannsynligheten for utseendet til den første er 2/3. Tre skilt passerte. Finn distribusjonsloven for forekomstene av det første tegnet.

Løsning.

Etter tilstand n=4, R=2/3, q=1/3. Mulige verdier for antall forekomster av det første tegnet: 0, 1, 2 og 3. Finn sannsynlighetene deres ved å bruke formel (8):

Denne loven kan presenteres i form av en tabell

X
P1/27 1/27 2/9 4/9 8/27

En fordelingsfunksjon er en funksjon som bestemmer sannsynligheten for at en tilfeldig variabel X som et resultat av testen vil ta en verdi mindre enn X, det er

Geometrisk betyr dette at en tilfeldig variabel med en sannsynlighet R vil ta på seg verdien som er representert på den numeriske aksen av punktet til venstre X.

For en kontinuerlig tilfeldig variabel er fordelingsfunksjonen en kontinuerlig stykkevis differensierbar funksjon. Hovedegenskapene er avledet fra definisjonen:

1. Verdiene til distribusjonsfunksjonen tilhører segmentet , dvs.

2. F(x) er en ikke-avtagende funksjon, det vil si hvis

3. Sannsynligheten for at en tilfeldig variabel får en verdi inneholdt i intervallet [ a,b[, er lik økningen av fordelingsfunksjonen på dette intervallet

For en kontinuerlig tilfeldig variabel er sannsynligheten for å akseptere en enkelt verdi null. Derfor for kontinuerlige tilfeldige variabler

Eksempel 12.

Tilfeldig verdi X gitt av distribusjonsfunksjonen

Finn sannsynligheten for at som et resultat av testen X vil ta verdien som tilhører segmentet [-1; 0,5].

Løsning.

Det følger av vilkåret at X er en kontinuerlig tilfeldig variabel som kan ta en verdi fra 0 til 1.

Sannsynlighetstetthet kontinuerlige tilfeldig variabel X kalle den første deriverte av fordelingsfunksjonen

distribusjonsfunksjon F(x) er et av antiderivatene for distribusjonstettheten. Basert på definisjonen av tetthet eller differensialfordelingsloven og dens sammenheng med fordelingsfunksjonen, er det enkelt å vise følgende egenskaper:

1. Fordelingstettheten til en kontinuerlig tilfeldig variabel er en ikke-negativ funksjon

2. Sannsynlighet for å treffe en tilfeldig variabel X i intervallet er lik

(16)

3. Fra egenskap 2 får vi et uttrykk for fordelingsfunksjonen

(17)

4. Normaliseringstilstand

(18)

Eksempel 13 diskret verdi X gitt etter tabell

X
R 0,1 0,3 0,4 0,2

Finn fordelingsfunksjonen og bygg dens graf.

Løsning.

1. Hvis , da , siden X kan ikke være mindre enn 2.

I dette tilfellet, i intervallet (-¥, X) det er bare én verdi av den tilfeldige variabelen X (X=2). Derfor

For enhver argumentverdi X funksjoner F(x), tilfredsstiller denne ulikheten, inn i intervallet (-¥, X) treffer to verdier av en tilfeldig variabel ( X=2 og X=3). Fordi hendelsene som X vil akseptere gitte verdier er inkonsekvente (eller X=2 eller X=3), da

4. På samme måte, hvis

Derfor vil distribusjonsfunksjonen se ut

Vi bygger en graf over fordelingsfunksjonen

Ris. 1 - Graf over fordelingsfunksjonen

diskret tilfeldig variabel

Eksempel 14. Målefeilfordelingstetthet

LOV OM DISTRIBUSJON OG EGENSKAPER

TILFELDIGE VERDIER

Tilfeldige variabler, deres klassifisering og beskrivelsesmetoder.

En tilfeldig verdi er en størrelse som som følge av et eksperiment kan få en eller annen verdi, men som ikke er kjent på forhånd. For en tilfeldig variabel kan derfor bare verdier spesifiseres, hvorav en nødvendigvis vil ta som et resultat av eksperimentet. Disse verdiene vil bli referert til som mulige verdier for den tilfeldige variabelen. Siden en tilfeldig variabel kvantitativt karakteriserer det tilfeldige resultatet av et eksperiment, kan den betraktes som en kvantitativ karakteristikk av en tilfeldig hendelse.

Tilfeldige variabler er vanligvis merket med store bokstaver i det latinske alfabetet, for eksempel X..Y..Z, og deres mulige verdier med de tilsvarende små bokstavene.

Det er tre typer tilfeldige variabler:

diskret; Kontinuerlige; Blandet.

Diskret en slik tilfeldig variabel kalles, hvor mange mulige verdier danner et tellbart sett. I sin tur er et tellbart sett et sett hvis elementer kan nummereres. Ordet "diskret" kommer fra det latinske discretus, som betyr "diskontinuerlig, bestående av separate deler."

Eksempel 1. En diskret tilfeldig variabel er antall defekte deler X i en batch av nfl. Faktisk er de mulige verdiene til denne tilfeldige variabelen en serie med heltall fra 0 til n.

Eksempel 2. En diskret tilfeldig variabel er antall skudd før første treff på skiven. Her, som i eksempel 1, kan de mulige verdiene nummereres, selv om den mulige verdien i det begrensede tilfellet er et uendelig stort antall.

kontinuerlige kalles en tilfeldig variabel, hvis mulige verdier kontinuerlig fyller et visst intervall av den numeriske aksen, noen ganger kalt eksistensintervallet til denne tilfeldige variabelen. Således, på ethvert begrenset eksistensintervall, er antallet mulige verdier for en kontinuerlig tilfeldig variabel uendelig stort.

Eksempel 3. En kontinuerlig tilfeldig variabel er strømforbruket ved bedriften i en måned.

Eksempel 4. En kontinuerlig tilfeldig variabel er feilen i høydemålingen ved bruk av en høydemåler. La det være kjent fra prinsippet for drift av høydemåleren at feilen ligger i området fra 0 til 2 m. Derfor er intervallet for eksistensen av denne tilfeldige variabelen intervallet fra 0 til 2 m.

Loven for fordeling av tilfeldige variabler.

En tilfeldig variabel anses å være fullstendig spesifisert hvis dens mulige verdier er angitt på den numeriske aksen og distribusjonsloven er etablert.

Loven for fordeling av en tilfeldig variabel kalles en relasjon som etablerer en sammenheng mellom de mulige verdiene til en tilfeldig variabel og de tilsvarende sannsynlighetene.

En tilfeldig variabel sies å være fordelt etter en gitt lov, eller underlagt en gitt distribusjonslov. En rekke sannsynligheter, en fordelingsfunksjon, en sannsynlighetstetthet, en karakteristisk funksjon brukes som fordelingslover.

Fordelingsloven gir en fullstendig sannsynlig beskrivelse av en tilfeldig variabel. I følge distribusjonsloven er det mulig å bedømme før erfaring hvilke mulige verdier av en tilfeldig variabel som vil vises oftere, og hvilke sjeldnere.

For en diskret tilfeldig variabel kan fordelingsloven gis i form av en tabell, analytisk (i form av en formel) og grafisk.

Den enkleste formen for å spesifisere distribusjonsloven til en diskret tilfeldig variabel er en tabell (matrise), som viser i stigende rekkefølge alle mulige verdier av en tilfeldig variabel og deres tilsvarende sannsynligheter, dvs.

En slik tabell kalles en distribusjonsrekke av en diskret tilfeldig variabel. en

Hendelsene X 1 , X 2 ,..., X n , som består i det faktum at den tilfeldige variabelen X, som et resultat av testen, vil ta henholdsvis verdiene x 1 , x 2 , ... x n , er inkonsekvente og de eneste mulige (fordi tabellen viser alle mulige verdier av en tilfeldig variabel), dvs. danne en komplett gruppe. Derfor er summen av sannsynlighetene deres lik 1. Altså for enhver diskret tilfeldig variabel

(Denne enheten er på en eller annen måte fordelt mellom verdiene til den tilfeldige variabelen, derav begrepet "fordeling").

En distribusjonsserie kan vises grafisk hvis verdiene til en tilfeldig variabel er plottet langs abscisseaksen, og deres tilsvarende sannsynligheter langs ordinataksen. Forbindelsen av de oppnådde punktene danner en brutt linje, kalt en polygon eller polygon av sannsynlighetsfordelingen (fig. 1).

Eksempel Det spilles lotteri: en bil verdt 5000 den. enheter, 4 TV-er verdt 250 den. enhet, 5 videospillere verdt 200 den. enheter Totalt selges det 1000 billetter for 7 den. enheter Lag loven om fordeling av nettogevinsten mottatt av lotterideltakeren som kjøpte ett lodd.

Løsning. Mulige verdier for den tilfeldige variabelen X - nettogevinster per lodd - er 0-7 = -7 den. enheter (hvis billetten ikke vant), 200-7 = 193, 250-7 = 243, 5000-7 = 4993 den. enheter (hvis billetten vant henholdsvis videospiller, TV eller bil). Gitt at av 1000 billetter er antallet ikke-vinnere 990, og de indikerte gevinstene er henholdsvis 5, 4 og 1, og ved å bruke den klassiske definisjonen av sannsynlighet, får vi.

En utvidelse av begrepet tilfeldige hendelser, som består i utseendet til visse numeriske verdier som et resultat av et eksperiment, er tilfeldig verdi X.

Definisjon. Tilfeldig de kaller en størrelse som, som et resultat av eksperimentet, tar bare én verdi fra noe av deres helhet og som ikke er kjent på forhånd hvilken.

Tilfeldig verdi, for eksempel, er en rimelig modell for å beskrive geologiske data, tatt i betraktning påvirkningen av ulike faktorer på det fysiske feltet.

I tillegg til resultatet av et separat eksperiment, kan den nøyaktige verdien av en tilfeldig variabel ikke forutsies; man kan bare etablere dens statistiske mønstre, dvs. Bestem sannsynlighetene for verdiene til en tilfeldig variabel. For eksempel målinger fysiske egenskaper steiner er observasjoner av de tilsvarende tilfeldige variablene.

Blant de tilfeldige variablene som en geolog må forholde seg til, kan to hovedtyper skilles: diskret og mengder kontinuerlige.

Definisjon. Diskret En tilfeldig variabel er en som kan ta på seg et begrenset eller uendelig tellbart sett med verdier.

Som typiske eksempler på en diskret tilfeldig variabel kan det være alle resultatene av feltarbeid, alle resultatene av eksperimenter, prøver hentet fra feltet, etc.

Alle mulige verdier av en tilfeldig variabel danner en komplett gruppe hendelser, dvs. , hvor er endelig eller uendelig. Derfor kan man si det tilfeldig verdi generaliserer begrepet en tilfeldig hendelse.

La følgende serie data om den kvantitative sammensetningen av en viss rase oppnås som et resultat av forskning: 4; 3; en; 2; 5; fire; 2; 2; 3; en; 5; fire; 3; 5; 5; 2; 5; 5; 6; 1. Det ble gjennomført totalt 20 tester. For å gjøre det praktisk å jobbe med dataene, ble de transformert: de oppnådde verdiene ble arrangert i stigende rekkefølge og antall forekomster av hver av verdiene ble beregnet. Som et resultat fikk vi (tabell 7.1):

Definisjon. Den stigende distribusjonen av data kalles rangering.

Definisjon. Den observerte verdien av et eller annet tegn på en tilfeldig variabel kalles en variant.

Definisjon. En serie som består av en variant kalles variasjonsserie.

Definisjon. En endring i et eller annet tegn på en tilfeldig variabel kalles variert.

Definisjon. Tallet som viser hvor mange ganger en gitt variant varierer kalles frekvensen og er betegnet med .

Definisjon. Sannsynlighet utseendet til dette alternativet er lik forholdet mellom frekvensen og den totale mengden av variasjonsserien

(1)

Med hensyn til de introduserte definisjonene vil vi omskrive tabell 7.1.

Tabell 7.2. rangert rad
Alternativ 1 2 3 4 5 6
Frekvens 3 4 3 3 6 1
Sannsynlighet 3/20 4/20 3/20 3/20 6/20 1/20

Statistisk analyse eksperimentelle data brukes hovedsakelig diskrete mengder. Tabell 7.3 viser de numeriske hovedkarakteristikkene til disse mengdene, som er av stor praktisk betydning i behandlingen av eksperimentelle data.

Tabell 7.3. Numeriske kjennetegn ved tilfeldige variabler
N p / p Karakteristikk (parameter) for en tilfeldig variabel og dens betegnelse Formel for å finne egenskapene til en tilfeldig variabel Merk
1 Forventet verdi
(2)
Karakteriserer posisjonen til en tilfeldig variabel på tallaksen
2 Mener
(3)
Hvis den tilfeldige variabelen er uavhengig, da
3 Mote Dette er verdien som den største Lik den hyppigst forekommende verdien. Hvis det er flere slike verdier i variasjonsserien, er det ikke bestemt.
4 Median Hvis enda, da Hvis merkelig, da Dette er verdien som er i midten av den rangerte serien.
5 Spredning Karakteriserer den faktiske spredningen av en tilfeldig variabel rundt middelverdien.
7 Variasjonskoeffisienten
(6)
Sammen med spredningen karakteriserer variabiliteten til en tilfeldig variabel
8 Sentrert normalisert avvik