martes, 2 de mayo de 2017

Probabilitatea R-n

R, estatistika arloa lantzean oso erabilia den programa bat da. Beraz, probabilititatea lantzeko erabili ahal izango dugu. Horren adibide, R-n landutako honako problemak ditugu:

1. Gozoki denda batean egun bateko gozokien salmentak 30 eta 2 parametroetako banaketa normalari darraio. Zehaztu ezazu:


  1. Zein da egun batean gozoki salmenta 26 baino handiagoak izateko probabilitatea?
  2. Zein da egunen %80 egiten diren salmenta kopuru maximoa.
  3. Demagun beste hiri handiago batean ezaugarri berdinetako 80 denda aske daudela. Zein da denda guztietatik batek edo gehiagok , eguneko 26 salmenta baino gutxiago izateko probabilitatea?



Burutu dezagun ariketa:


X ≡ "Egun bateko gozokien salmentak". X : N(30,2)


  1. P(X>26) = 0.9772499
  2. P(X≤k) = 0.8 orduan, k = 31.68324 baina salmenta kopurua zenbaki osoa izan behar duenez ⇒ k=32
  3. p = 1 - 0.9772499 = 0.0227501

X : Bin(80,0.0227501)
P(X≥1) = P(X>0) = 0.8413461

Hauek dira ariketa egiteko R-n erabilitako scriptak eta bakoitzaren esanahia:

a) pnorm(c(26), mean=30, sd=2, lower.tail=FALSE)

Azter dezagun honen esanahia. Hasteko pnorm-ek adierazten digu banaketa normalari darraion probabilitatea kalkulatzen ari garela (p, probabilitatea. norm, normala). Gainontzekoak guk ezarritako baldintzak izango dira: c(26), 26 gozokiren azterketa egiten ari garela. mean=30 , batazbetekoa 30 dela hau da, banaketa normalaren μ parametroa. sd=2, desbideratze estandarra 2 dela, banaketa normalaren σ parametroa. Eta azkenik, lower.tail=FALSE, X probabilitatatea handiagoa izatea adierazten duena, hots P(X>26)



b) qnorm(c(0.8), mean=30, sd=2, lower.tail=TRUE)

Kasu honetan qnorm daukagu,q, kuantila kalkulatu nahi dugulako (hau da, ematen diguten datua orain probabilitatearen balioa da) eta norm berriro ere banaketa normalari darraiolako. Bestelako baldintzak: c(0.8), 0.8 balioko probabilitatea dela adierazteko eta lower.tail=TRUE, X probabilitatatea txikiagoa edo berdina izatea adierazten duena, hots P(X≤k).


c) pbinom(c(0), size=80, prob=0.0227501, lower.tail=FALSE)

Honakoa aldiz desberdina litzateke. Hasteko oraingoan pbinom daukagu, p probabilitatea kalkulatzen ari garelako eta binom banaketa binomialari darraiolako. Bestelako baldintzak: size=80, daukagun lagina 80 koa delako eta prob=0.0227501 aldeko kasuen probabilitatea hori delako.


2.Pertsona batek telefonoz hitz egiten duen denbora, ondoko dentsitate-funtzioa duen zorizko aldagaiaren bidez adieraz daiteke:

Zein da, pertsona batek telefonoa erabiltzen duen minutu-kopurua ondokoa izateko probabilitatea:

  1. A=10 baino gehiago
  2. B=5 baino gutxiago
  3. C=5 eta 10 bitartean

Ebatz dezagun ariketa:

X ≡ "Pertsona batek telefonoz hitz egiten duen denbora" X:E(0.2)

  1. P(X>10) = 1 - P(X<=10) =0.1353353
  2. P(X<5) = 0.6321206
  3. P(5<X<10) = P(X<10) - P(X<=5) =0.6321206
   
Hauek dira ariketa egiteko R-n erabilitako scriptak eta bakoitzaren esanahia:

a)pexp(c(10), rate=0.2, lower.tail=FALSE)

b)pexp(c(5), rate=0.2, lower.tail=TRUE)


c)pexp(c(10), rate=0.2, lower.tail=TRUE)-pexp(c(5), rate=0.2, lower.tail=TRUE)

Oraingoan, pexp daukagu, p beti bezala probabilitate baten kalkulua dela adierazten du eta exp oraingoan banaketa exponentzialari darraiola. Bestelako baldintzak: rate=0.2, 0.2 parametroko banaketa exponentziala dela adierazten du eta bestelako komandoak beste banaketetan adierazitakoen berdinak dira.


3.Pertsona batek telefonoz minutu erdi baino gutxiago hitz egiteko probabilitatea 0,095 da. Telefono-deia egiten duten 60 pertsona zoriz aukeratuz, kalkula itzazu:


  1. Gutxienez zortzik, minutu erdi baino gutxiago hitz egiteko probabilitatea.
  2. Gutxienez batek minutu erdi baino gutxiago hitz egiteko probabilitatea.
  3. Aurkitu zenbat pertsonek hitz egiten duten telefonoz minutu erdi baino gutxiago, honen probabilitatea 0.445 bada.
Ariketa burutu dezagun:

X ≡ "Zenbat pertsonek hitz egiten duten telefonoz minutu erdi baino gutxiago"
X: Bin(60,0.095)⇒X:P(5.7)⇒X:P(6)

  1. P(X≥8) = 1 - P(X<8) =0.2560202
  2. P(X≥1) = 1 - P(X=0) = 0.9975212
  3. P(X≤k)=0.445 orduan k=5

Hauek dira ariketa egiteko R-n erabilitako scriptak eta bakoitzaren esanahia:

a) ppois(c(7), lambda=6, lower.tail=FALSE)

b) ppois(c(0), lambda=6, lower.tail=FALSE)

c) qpois(c(0.445), lambda=6, lower.tail=TRUE)


Honako hontan, ppois daukagu, p probabilitate baten kalkulua adierazten duena eta pois, poissonen banaketari darraiolako. c atalean aldiz, qpois agertzen zaigu aurreko adibide batean ikusi dugunez q-k kuantila kalkulatu nahi dugula adierazten diguna. Bestelako baldintzak: lambda=6, 6 parametroko poissonen banaketari darraiola adierazten du eta bestelako komandoak dagoeneko aztertu ditugunak.



martes, 28 de marzo de 2017

Probabilitatea vs Estatitistika

Probabilitatea eta estatistika, zorizko ikasketaz arduratzen dira ikuspuntu matematikotik.

Probabilitateak, zorizko fenomenoentzat ereduak proposatzen ditu; hau da, ziurtasun osoz aurresan daitezkeenak eta haren ondorio logikoak aztertzen ditu.

Estatistikak aldiz, metodo eta teknikak eskaintzen ditu, datuak ulertzea ahalbidetzen dutena ereduetatik aurrera.

Ondoren era hedatuago batean definituko ditugu biak

Probabilitatea:

Datu multzo zenbakiduna da, era ordenatu eta sistematiko batean aurkeztuak direnak.
Erregulartasunak bilatzeko, klasifikatzeko, laburtzeko  eta datuak analizatzeko, metodoetaz eta prozeduretaz arduratzen da. Probabilitateen kalkulu zientifikoak, batzuetan intuizioak modu oker batean adierazten diguna ulertzen laguntzen digu. Esaterako, demagun 23 pertsona ditugula, kalkuluak adierazten digu bi pertsonek egun berean urteak betetzeko probabilitatea %50ekoa dela, intuizioz esango ez genukeena. Hortaz, probabilitatea, demografian, medizinan, komunikabideetan, informatikan, ekonomian eta finantzetan oso erabilia da.

Estatistika:

Estatistikaz hitz egitean, zenbakizko datu multzo batean pentsatzen dugu, era ordenatu eta sistematiko batean errepresentatuak direnak. Hala ere, estatistikaren inguruko pentsamendu hau ezagunena izan arren (komunikabideengatik, etab.) estatistika ez da hori bakarrik. Izan ere, estatistika gaur egungo tresna bakarra da, edozein motatako ikerketan, emaitzak lortu eta argitara eman ditzakeena eta lege deterministengatik erasotua izan ez daitekeena. Estatistika datuak analizatzeko, erregulartasunak bilatzeko, laburtzeko,klasifikatzeko eta jasotzeko prozedimentuetaz eta metodoetaz arduratzen da (Estatistika Deskribatzailea), beti ere aldakortasuna eta ziurgabetasuna berezko kausa bat izanik. Baita datuetatik abiatuz inferentziak eginik, erabakiak hartzeko helburuarekin eta iragarpenak eginik (Estatistika inferentziala).

Estatistikan ausazko aldagaiekin lan egiten da, eta hauek lege probabilistiko batez zehaztuta daude.

Adibidez, dado bat botatzen badugu 6 aldeetako bat ateratzeko probabilitatea ⅙ da eta zenbaki bakoiti bat ateratzeko probabillitatea ½ da. Baina dadoa 100 aldiz  botatzen badugu eta lortutako balioak gordetzen baditugu; 1 zenbakia 12 aldiz, 2 zenbakia 17 aldiz, 3 zenbakia 23 aldiz, 4 zenbakia 21 aldiz, 5 zenbakia 19 aldiz eta 6 zenbakia 8 aldiz atera dela ikusten dugu ausazkoak izan diren 100 jaurtiketa horietan. Datu hauek erabiliz, estatistika erabiltzen ari gara eta ez probabilitatea, izan ere, hautatutako lagin espazio batean lan egiten ari gara eta ez espazio osoan.
Beraz dado bat botatzen badugu, zenbaki bat ateratzeko probabilitatea ⅙ izaten jarraituko du, baina estatistika erabiliz zenbaki baten aldeko hautaketa egin dezakegu.

Ondorioz, probabilitateen kalkuluan aukera guztiek ateratzeko aukera berdina dutela esan arren, estatistikaren bidez aukeretako baten alde egin dezakegu, lagin zehatz batean gehiagotan atera baita.

Dakigunez, estatistikako elementu garrantzitsuenetarikoak media, mediana, batez bestekoa eta desbideratze estandarra dira. Horietako batzuk, probabilitateen kalkuluan ere agertuko zaizkigunak. Adibidez, banaketa normalaren {X:N(µ,σ)} bi parametroak (µ,σ), batez bestekoa eta desbideratze estandarra dira hurrenez hurren. Hurrengo taulan bien arteko erlazio gehiago beha ditzakegu:




martes, 14 de marzo de 2017

Atxilotuen dilema

 Atxilotuen dilema 1950ean aztertua eta formalizatua izan zen A. W. Tucker-engatik. Zorizko jokorik ezagunenetariko eta aztertuenetarikoa da. Zorizko joko ez nulua, bipertsonala, biestrategikoa eta simetrikoa da.


Zertan datza zorizko joko hau?

Demagun bi atxilotu ditugula (X eta Y atxilotuak), baina ez ditugu haien aurkako proba nahikorik. Atxilotuek hiru aukera dituzte eta ezin dute haien artean hitz egin:

→ Biek errudunak direla onartzea

→ Batak errudunak direla onartzea eta besteak errugabeak direla esatea

→ Biek errugabeak direla esatea

Aukera hauetako bakoitzak kondena ezberdina dauka. Hauek dira hurrenez hurren:

→ Bakoitzak 6 urte

→ Errudunak direla onartzen duena aske geratzen da eta besteak 10 urte

→ Bakoitzak urte bete


Orduan hau jakinda zuek zer egingo zenukete? Aitortu edo zure lagunaz fidatu? Iradokizunetan utzi zuen erantzuna.

Beraz hau da lortzen dugun aukera taula:





Atxilotu Y

Estrategia
Aitortu
Ukatu
Atxilotu X
Aitortu
6
6
0
10
Ukatu
10
0
1
1


 Taula aztertuz X eta Y atxilotuen ikuspuntua honako hau izango da:


→ Besteak aitortzen badu, nik ere(6<10)

→ Besteak ez badu aitortzen, nik aitortu(0<1)


Beraz, maximin estrategia erabiliz, atxilotuen estrategia dominatzailea aitortzea izango da. Hala ere, aukera bakoitzaren probabilitatea kalkulatuko dugu. Horretarako honako gertaerak definituko ditugu:

A=X atxilotuak aitortzea

B=Y atxilotuak aitortzea

C=X atxilotuak ukatzea

D=Y atxilotuak ukatzea

X-k aitortzearen probabilitatea Y-k aitortzearen probabilitatearen menpekoa ez denez, bakoitzak p eta q probabilitate ezezagunak izango dituzte hurrenez hurren, probabilitate horiek ezezagunak ditugun gertaerek eraginda. Orduan hauek dira lortzen ditugun probabilitateak:
P(A)=p
P(B)=q
P(C)=1-p
P(D)=1-q

Esan dugun bezala, askeak direnez, hauek dira konbinazio ezberdinen probabilitateak eta grafiko hauetan p eta q har ditzaketen balio guztietarako dagokien probabilitateak adierazten dira.



Atxilotu Y
Estrategia
B
D
Atxilotu X
A
pq
p(1-q)
C
(1-p)q
(1-p)(1-q)



P(AB)=pq P(A∩D)=(1-p)q












P(CB)=p(1-q) P(C∩D)=(1-p)(1-q)













Probabilitate hauen kalkulua era dinamiko batean ikusi ahal izateko, honako taulan p eta q balioak sartu ahal izango dituzue eta probabilitate bakoitzaren balioa aztertu:

https://docs.google.com/spreadsheets/d/1Go8Re6g1iDgumvlObZDS9n6kGfzkl3hsYEAkJb2cDZ4/edit?usp=sharing

martes, 28 de febrero de 2017

Probabilitatearen historia


Probabilitatearen historiari buruz hitz egiten hasteko, lehenik Luka Pacioli, Girolamo Cardano, Galileo Galilei eta Niccolo Tartagliari buruz hitz egin beharko genuke. Probabilitatearekin zerikusia zuten zenbait jokoren emaitzak eman zituzten, baina ez zituzten matematikoki frogatu. Hori dela eta, historialari askok ez dituzte probabilitatearen aurrekari konsideratzen. Hala ere, Cardanoren “El libro de los juegos de azar” liburua oso garrantzitsua izan da probabilitatearen historian.
Benetako hastapena XVII mendean eman zitzaion, Pierre Fermat eta Blaise Pascalek zorizko jokoekin zerikusia zuten problemei ebazpena ematen saiatzen hasi zirenean. Biek eskuz esku lan egin zuten El Caballero de Meré-k proposatutako problemetan. Denbora gutxira, Christiaan Huygens matematikariak Fermat eta Pascalen lanaren ezaguera izan zuen eta 1657an, XVII mendeko bigarren zatiko ekarpen garrantzitsuena kontsideratzen den liburua idatzi zuen (De Ratiociniis in Ludo Aleae). Gerora, Ars Conjectandi tratatua idatzi zuen, bertan aurreko liburuan planteatutako galderak erantzun zituen eta beste zenbait teoria garatu. Tratatu hau askorengatik probabilitatearen teoriaren aita kontsideratzen da, eta probabilitatearen txosten hoberena izan zen, landuagoak izan ziren beste lan batzuengatik ordezkatua izan zen arte, James Bernoulli, Montmort eta de Moivreren lanengatik esaterako.

James Bernoulliren antzera, bere familiako beste partaide batzuek ere teoria berriak egin zituzten probabilitatearen inguruan. 'Maxima utilidad moral esperada'-ren inguruan ausnartzen lehena Daniel Bernoulli izan zen eta esperantza matematikoa eta esperantza morala ezberdindu zituen.

Pierre Rémond De Montmort-ek bere lanean, konbinatoriaren teoriaren, karten eta dadoen jokoen inguruan hitz egiten du, Huygensen liburuko hainbat problemei ebazpena emateaz aparte.

Abraham de Moivrek, Fermat eta Pascali planteatutako problemaren inguruan hainbat ebazpen eta emaitza garrantzitsu argitaratu zituen, formula berriak emanez. Beste ekarpen garrantzitsu bat, probabilitatearen teoriarentzat, haren izena daraman teoremaren ekarpena izan zen, banaketa binomiala normalera hurbiltzen duena. Gainera, bera izan zen lehena banaketa normalaren dentsitate funtzioa liburu batean argitaratzen.

Thomas Bayes, teoria honen oinarriak ezagutzera eramateagatik garrantzitsua da. Hauek dira oinarriak: ikusia izan den gertaera bat eragin duten beste gertaeren probabilitatea lortzea. Hau izan zen, bere izena daraman edota alderantzizko probabilitatearen teorematzat ezagutua izan den teoremaren oinarriak.

Pierre Simon Laplace, Bayesen teoremaren garapen bat lantzeaz gain, honek ere Fermat eta Pascalen problemen inguruko garapen zabalagoa egin zuen formula berriak lortuz, problemaren gertaera ezberdinak adierazteko. Gainera, populazioaren inferentzia estatistikoaren inguruko problemari heldu zion lehena izan zen.
Bitxikeriak: Esan bezala probabilitatearen kalkulua zorizko jokoekin erlazionaturiko problemak ebazteko sortzen da. Denborarekin zorizko jokoak k.a. 3500 garaietan dagoeneko erabiliak zirela ikusi da. Gainera, jakina da antzinako zibilizazioetan zorizko jokoek jatorri jainkotiarra zutela, etorkizuna aurresateko erabiltzen zena, dadoen antzeko taba batzuk erabiltzen zuten hau egiteko. Grekoek, Egiptoarrek eta Erromatarrek, dadoei zaletasun handia izan arren ez ziren kapaz izan dadoekin (orekatutako dadoak) lortutako emaitza ekiprobableak iragartzeko (jainkoekin zerikusia zuela zeudelakoan), horren ondorioz probabilitatearen kalkulua mendeak atzeratu egin zen.