Teorija verovatnoće, slučajne promenljive

Jedan od najznačajnijih pojmova u teoriji verovatnoće je slučajna promenljiva (veličina). Slučajna promenljiva "X" se definiše kao ishod, rezultat statističkog eksperimenta (numerička vrednost) pri čemu promenljiva uzima datu-konkretnu vrednost "x" sa određenom verovatnoćom "p". Osnovna podela slučajnih promenljivih je na diskretne (prekidne) i kontinualne (neprekidne)

Diskretne(prekidne) slučajne promenljive

U ovom slučaju slučajna promenljiva uzima vrednosti iz konačnog skupa vrednosti ili iz beskonačnog (prebrojivog) skupa. Primer takvih skupova su recimo skup vrednosti od 0 do n (n - ceo pozitivan broj) ili skup celih brojeva.

Zakon raspodele verovatnoća slučajne promenljive X predstavlja prikaz vrednosti promenljivih x i odgovrajućih verovatnoća p, odnosno

odnosno, verovatnoća da slučajna promenljiva X uzima vrednost x jednako je p

Zakon raspodele verovatnoća podrazumeva da su zadate sve vrednosti koja slučajna promenljiva može da uzme sa odgovarajućim verovatnoćama. Recimo:

Jasno je da je u tom slučaju suma svih verovatnoća jednaka jedinici, jer zakon raspodele podrazumeva potpun sistem događaja.

Zakon verovatnoće diskretne slučajne promenljive se najčešće prikazauje grafički u obliku poligona raspodele ili trakastog dijagrama

U Mathcad-u se može prikazivati i u sledećim varijantama

Funkcija raspodele F se definiše kao

odnosno kao verovatnoća da slučajna promenljiva uzima vrednost manju od zadate vrednosti x (često se definiše i kao kumulativna funkcija verovatnoće)

Iz prethodnog zakona raspodele ćemo formirati funkciju raspodele, pri čemu moramo uzeti u obzir da je to diskontinualna funcija sa prekidom sa desne strane, odnosno u ovom slučaju je

Odnosno

Kako je funcija prekidna sa desne strane, lako se može zaključiti da je

odnosno za diskretnu slučajnu veličinu je

Tako je u ovom slučaju

dodate vrednosti - zbog prikaza

Funkcija raspodele (u Mathcad-u opcija grafika "step")

Zakoni raspodele i funkcije raspodele se mogu dobiti i preko određenih izraza. Najpoznatije diskretne slučajne promenljive i njihove funkcije su realizovane u Mathcad-u. U spisku funkcija Mathcad-a potražite kategoriju pod imenom "Probability density". Ako pod imenom funkcije vidite da vraća P(X=k) to predstavlja zakon verovatnoće diskretne promenljive. Obratite pažnju da sve funkcije počinju slovom "d" od density.

Prikazaćemo zakon raspodele Binomne raspodeljene slučajne veličine - dbinom (Konsultovati teoriju). Ovde slučajna promenljiva x predstavlja broj realizovanih događaja u n pokušaja i može uzimati vredosti u intervalu [0,n] gde je q verovatnoća realizacije. Zadaćemo vrednosti:

Zakon raspodele je

Prikažimo vektore slučajne veličine x i odgovarajuće verovatnoće (zakon raspodele)

Sada prikažimo grafički zakon raspodele

*Komentar : proverite kako utiču p i n na zakon raspodele.

Funkcija raspodele se dobija u Mathcad-u iz kategorije "Probability Distribution". Treba primetiti da funkcije počinju slovom "p" od probability

Za razliku od prethodnog primera gde se funkcija raspodele definiše kao

u Mathcad-u, a i većini statističkih softverskih paketa se funkcija raspodele definiše kao

Pozivamo datu funkciju

Prikažimo promenljivu i funkciju raspodele

Prikažimo funkciju raspodele grafički

Kako ona predstavlja

takođe možemo prikazati i

dodate vrednost - zbog prikaza

prva vrednost je uvek 0 a poslednja 1

Grafički prikaz

Kontinualne(neprekidne) slučajne promenljive


U ovom slučaju slučajna promenljiva uzima vrednosti iz beskonačnog skupa vrednosti Primer takvog skupa je recimo skup realnih brojeva i kontinualna promenljiva se definiše na intervalu [].

Jedan način da se objasni pojam kontinualne promenljive je taj da se broj mogućih vrednosti diskontinualne drastično poveća. na taj način isprekidana kriva poligona raspodele prelazi u kontinualnu krivu. Ova kriva se kod kontinualnih promenljivih naziva funkcija gustine.

Zakon raspodele je

Može se primetiti da se vrednosti p = P(X=x) sve više smanjuje. Tako je maksimalna vrednost verovatnoće (moda) u ovom slučaju za vrednost

Kako n teži pojedinačne verovatnoće teže nuli tj P(X=x)=0 , pa se za neprekidne slučajne veličine razmatra interval verovatnoće tj

P(x1<X<x2)


Binomna raspodela za veliko n, i p ne blisko 0 i ne blisko 1, se može aproksimirati najznačajnijom kontinualnom raspodelom u teoriji verovatnoće i statistici koja se naziva Gausova ili

Normalna raspodela, N(x,m,s)

Ako znamo da je binomno raspodeljena slučajna promenljiva X uzima celobrojne vrednosti (0,1,2...n) onda je elementarna površina između dve susedne vrednosti slučajne promenljive ime vrednost 1*p(x) tj. praktično jednaka verovatnoći p(x) = P(X=x). Kao što smo rekli ove verovatnoće teže nuli kako n teži beskonačnosti. Za interval između, recimo 70 i 80 se može izračunati verovatnoća kao suma svih verovatnoća (elementarnih površina ispod krive)

=

***

Binomana raspodela za velike vrednosti n se može aproksimirati normalnom raspodelom. Funkcija gustine normalne raspodele se može dobiti funkcijom dnorm(x,m,s). Za aproksimaciju binomne raspodele je

parametar u normalnoj raspodeli - Srednja vrednost

parametar u normalnoj raspodeli - Standardno odstupanje

Kako se diskretna slučajna promenljiva aproksimira kontinualnom, onda se može primeniti pravilo jedne polovine tj.

Diskretna

približno jednako

Tako je funkcija gustine

Interval verovatnoće kod diskretne slučajne veličine u obliku sume verovatnoća zakona raspodele prelazi u određeni integral funkcije gustine kod neprekidne slučajne veličine. Tako se suma *** izračunava kao određeni integral

=

i ima vrednost šrafirane površine ispod krive

Kao i kod diskretne slučajne veličine, definiše se funkcija raspodele F(x) = P(X<x) i za normalnu raspodelu u Mathcad-u se koristi pnorm(x,m,s). Veza funkcije gustine i funkcije raspodele za neprekidnu slučajnu veličinu je:

Za prethodni primer je, recimo

ili

Lako je zaključiti da je za zadati interval [x1,x2]

odnosno, za prethodni primer

=

tako da

predstavlja element verovatnoće između

Tako se proračuni verovatnoće za normalnu, ili neku drugu, kontinualnu raspodelu svodi na upotrebu funkcije raspodele. Za normalnu raspodelu značajnu ulogu ima standardizovana normalna raspodela. Naime ako raspolažemo normalnom raspodelom sa parametrima m i s tj:

X :

tada transformisana slučajna promenljiva

ima takođe normalnu raspodelu sa parametrima 0,1 odnosno

Z :

i naziva se standardizovana (centrirana) normalna raspodela

Ova raspodela se koristila tabelarno i imala ulogu proračuna verovatnoća za bilo koju normalnu raspodelu. Iako u Mathcad-u imamo realizovanu funkciju pnorm(x,m,s) takođe imamo i realizovanu funkciju raspodele standardizovane normalne raspodele kao funkciju cnorm(x).

sa funkcijom gustine

=

Prikažimo grafik funkcije gustine standardizovane normalne raspodele i analognu površinu za posmatrani slučaj

i analogna šrafirana površina ispod krive funkcije gustine standardizovane normalne raspodele

Čest problem je zadavanje verovatnoće a potrebno je odrediti odgovarajuće vrednosti slučajne promenljive. Za to se koriste inverzne funkcije raspodele koje određuju onu vrednost promenljive x za koju je zadata verovatnoća p=P(X<x). Recimo, za prethodan slučaj je potrebno odrediti za koju vrednost z je verovatnoća p=P(X<x)=0.876. Za to se koriste funkcije čije ime počinje slovom "q" i u ovom slučaju za normalnu raspodelu je to funkcija qnorm(p,m,s)

Tako je

Početna vrednost -4 je izabrana jer praktično za tu vrednost funkcija gustine teži 0 što se može i proveriti

i odgovarajuća šrafirana površina čija je vrednost

________________________________________________________________________________