teorie statistica

43

Transcript of teorie statistica

Page 1: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 1/43

 

CURS STATISTICA MTC - ANUL I FR

Tema 1.NOTIUNI INTRODUCTIVE

1. Scurt isturle al aparitiel ~idezvoltirii statisticii2. Obiectul ~imetoda statisti.:ii

3. Coneepte de bazi folositetn procesul de eereetare statistici

1. Seurt istori.: al aparitiei ,i dezvoltirii statisticii

Cuvantul statistic! are 0 semnificatie multipla pentru cercetatori, specialisti, studenti ~i populatie in

general, Pentru cei mai multi, statistica inseamna doar 0 "descriere numerica" a unor date culese despre

fenomenele de masa, De-a lungul istoriei, datele au fost permanent colectate. I n timpul civilizatiei egiptene,grecesti si romane datele erau obtinute inscopul primar al taxarii ~iinrolarii inarmata,

Astfel, in antichitate (cu 4-5 milenii i.e.n.) se intdlnesc forme de evidenta ce pot fi asimilate

lntelesului modem de recensaminte statistice, in special in China, Egipt, Grecia ~i in Imperiul Roman.

Recensamintele efectuate de romani (din 5 in 5 ani apoi din 10 in 10 ani) erau cunoscute sub denumirea

de "cens". in Dacia, ocupata de romani, evidentele care se faceau asupra populatiei, productiei ~i

consumului purtau denumirea de ''tabularium''.

Se dezvolta, de asemenea, evidenta cu caracter demografic. in Evul Mediu, institutiile bisericesti,strangeau adesea si pastrau informatii privind casatoriile, nasterile, decesele. Pe masura ce s-au format

statele civilizate statistica s-a diferentiat fata de formele de evidenta contabila.

Se poate afirma cit statistica a aparut in necesitatea de a cunoaste, in expresie numerica, 0 serie de

fenomene, procese si activitati social-economice.

Modul de gandire statistic ne impune sa acceptam ca datele sunt in mod inerent variabile.

Astfel gandirea statistica poate fi definita ca totalitatea ideilor orientate asupra cailor de intelegere,

control si reducere a variatiei.

inprocesul istoric de conturare a statisticii modeme pot fimai multe momente:

D statistica practica

D statistica descriptiva - care servea pentru descrierea aspectelor numerice ale populatiei si ale statului.

Parte a statisticii ce rezum1i datele empirice (intuitive, experimentale, practic, direct) privind

fenomenele de masa investigate.D aritmetica politica - inseamna elaborarea unor concepte in care societatea este privita in ansamblul ei.

Apar astfel notiuni de vaIoare medie ~i de tendinte, Cele mai multe studii in aceasta perioada, s-au

facut pentru demografie, privind miscarea populatiei, Astfel pe baza unui numar mare de date s-a

elaborat pentru prima data 0 regularitate cu privire la proportia dintre nasteri si decese, separat pentru

populatie feminina ~icea masculina,D caIculul probabilitatilor (statistica matematica) - se ocupa cu elaborarea unor notiuni si modele

valabile pentru orice domeniu din natura, societate sau tehnologie.

Statistica reprezinta arta si ~inta colectarii ~iintelegerii datelor ce caracterizeaza fenomenele de masa,

2. Obieetul $i metoda statisticii

Obiectul statisticii ilconstituie studiul fenomenelor si proceselor social-economice care prezintaurmatoarele particularitati:

./ Se produc mtr-un numar suficient de mare de cazuri (sunt fenomene de masa);

./ Variaza de la un element la aItul, de la caz la altul;

./ Sunt forme individuale de manifestare in timp, in spatiu ~i ca forma de organizare.

Rezulta deci c a obiectul de studiu al statisticii ilconstituie fenomenele de masa care prezinta proprietatea

de a fivariabile ca forma de manifestare individuals intimp, in spatiu si sub raport organizatoric.

Spre deosebire de fenomenele simple, fenomenele de masa se produe sub influenta unor factori

sistematici sau intamplatori, esentiali sau neesentiali, de acelasi sens sau de sensuri diferite si au la baza

legile de tip statistic. Pentru a cerceta si verifica 0 lege statistica este necesar sa fie anaIizate toate

Page 2: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 2/43

 

CURS STATISTICA MTC - ANUL I FR

manifestarile individuale ale fenomenului supus cercetarii. In acest mod se creeaza conditiile necesarepentru manifestarea legii numerelor marl.

Legea numerelor mari este un principiu fundamental al cercetarii statistice care presupune luarea inconsiderare a unei colectivitati suficient de numeroase de cazuri individuale, astfel incat abateriletntamplatoare, intr-un sens sau altul, se poate compensa, punandu-se in evidenta 0 anumitamarime/valoare care este tipica pentru intreaga colectivitate.

Definitie. "Statistica este stiinta care studiaza aspectele cantitative ale determinarilor calitative alefenomenelor de masa, fenomene care sunt supuse actiunii legilor statistice care se manifesta in conditiiconcrete, varlabile in timp ~ispatiu, "

Fenomenele de ma sa se mai numesc s i :• fenomene de tip colectiv deoarece legea este valabila pentru intregul ansamblu ~i numai intamplator

se verifica in fiecare caz in parte,

• fenomene de tip statistic sau stohastic pentru ca ele se supun legilor statistice;• fenomene aleatoare pentru eli intre faetorii de influent! exista ~i0component! aleatoare,• fenomene atipice pentru ca forma lor de manifestare individuala este diferita;• fenomene nedeterministe ca urmare a faptului cli modul de asociere a faetorilor esentiali cu cei

neesentiali, a eelor sistematici cu eei aleatori se poate schimba in timp, in spatiu sau ca forma

organizationala,Principal a proprietate a aeestor fenomene este variabilitatea in timp, spatiu ~ica forma de organizare,

dar care potrivit legii numerelor marl ea se compenseaza reciproe fata de linia generala de tendinta (ceexprima esentialitatea fenomenelor legitatea lor de aparitie si dezvoltare).

Fenomenele de masa se intalnesc in toate comportamentele vietii economice ~i sociale s i ele nu pot fistudiate decat cu ajutorul metodelor statistice. Rezultatele cercetarii lor se regasesc in datele statisticepublicate de Institutul National de Statistic! in anuare, breviare si buletine statistice precum ~i in diferitestudii publieate in edituri si reviste de specialitate ~ide Organizatiile Intemationale,

Urmarind etapele oricarui proces de cunoastere, pentru rezolvarea problemelor care fac obiectul saude studiu, statistics, ca orice stiinta, si-a elaborat procedee ~imetode speciale de cercetare.

Metoda statisticii este fermata din totalitatea procedeelor si operatiilor specifiei de culegere,

prelucrare ~ianaliza statistica a fenomenelor din realitatea economica ~isocial! in cadrul carora activeazalegile statistice.Complexitatea ~i amploarea cercetarii statistice fac nece sara pe rfec ti ona rea continua a metodelor de

observare, prelucrare ~i analiza, Dezvoltarea metodelor statisticii este strans legata de progreseleinregistrate in teoria probabilitatilor, statistica matematica ~i in domeniul informaticii. Necesitateaprelucrarii unui volum mare de date a dus la dezvoltarea masinilor de calul si implicit la formareaprogramelor de calul. (Ex. EXCEL, Statistic, SPPS, SAS.)

3. Concepte de bazi folosite in preeesul de eercetare statistici

In statistica se folosesc 0 serie de notiuni (concepte) de baza eu care se opereaza in toate etapelecercetarii ~i in toate statisticile aplicate: Colectivitatea (popularia) statistica, Unitate statistica.

Caracteristici (variabile) statistice, Date ~i lndicatori statistici, Miisurarea statistica, Estlmare statistica,

Eroare statisticaa}0 prima notiune de baza din statistic! 0 reprezinta colectivitatea (denumita ~ipopu/a(ia) statistica carereprezinta totalitatea elementelor de a ce ea si n atu ra care formeaza obiectul unui studiu statistic.

Aceasta poate fi:Concreto (obiectiva ~i finita), delimitata in timp, spatiu si mod de organizare eu care opereaza Statisticasocial-economica;

in fi nit ii s i a b st ra ct ii , cu ca re opereaza Statistica matematica;ipotetica care corespunde unui model de calcul~ianaliza statistici1 in cadrul car ei a exi st a r el at ii ma t ema t ic e,

strict determinate,

Statistica abordeaza de asemenea:colectivitiifi stance- care expr ima 0stare, un nivella unmoment dat; (ex. Popdatta Brasovului la 1 dec. 2(03)

2

Page 3: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 3/43

 

CURS STATISTICA MTC - ANUL I FR

colectivit4ti dinamice - care caracterizeazA un proces, 0devenire in timp.(e x. nasterile in Bucuresti in ac. luna)

Un alt concept

b) Unitatea statistica - reprezinta elementul constitutiv al unei colectivitati statistice.

Unitatile pot fi:Simple (Ex. persoana, muncitor etc) ¥ Complexe (Ex. famil ie, e ch ip a, s ee tie , a nu l de studiu...)

Ca ~i colectivitatile, unitatile pot fi statice ~i dinamice.

c) Caracteristicile statistice denumite val'iIlbilestatistice sau variabile aleatoare reprezinta proprietatile

comune ale unitatilor care formeaza 0colectivitate statistica,

In legatura cu acestea se folosesc urmatoarele notiuni:

./ Variabilii -care este orice caracteristica statistica numerica sau nenumerica care se inregistreaza;

./ Variantii - este forma concreta pe care 0 variabila statistica 0 poate inregistra la nivelul fiecarei

unitati prin cuvinte sau expresie numerica

./ Variatie - proprietatea variabilelor statistice de a-si schimba nivelul de dezvoltare sau forma

concreta de manifestare .

./ camp de variatie (camp de imprastiere) a unitatilor unei colectivitati in functie de fiecare variabila

inregistrata, Pentru variabilele numerice acest camp se mascara prin amplitudinea variatiei, care este

egala cu diferenta dintre valoarea maxima ~i valoarea minima inregistrate .

./ Frecventa - reprezinta numarul de unitati la care se inregistreaza aceeasi varianta

./ Ponderea este locul pe care-I ocupa 0variantll sau un interval de variante in cadrul colectivitatii studiate

Variabilele statistice se pot clasifica:

• dupa continut in:Cl Variabile de timp - arata apartenenta unitatilor la un moment sau perioada de timp

Cl Variabile de spatiu - situarea in teritoriu al unitatii,

o Variabile atributive - sunt toate celelalte insusiri numerice ~icalitative ale unitatilor,

• dupa modul de exprimare in:o caracteristici calitative (exprimate prin cuvinte) Ex. profesia

Cl caracteristici cantitative (exprimate numeric) Ex. Varsta

• dupa natura variatiei se impart in:

Cl Variatie continua - ex. VarstaCl Variatie discontinua sau discrete Ex. Valoarea capitalului fix

• dupa modul de manifestare in:Cl alternative - manifestare directa sau opusa ei (Ex Rural Urban)

c nealternative - cu variante distincte numerice sau calitative (Ex Salariu si profesia)

• dupa modul de obtinere ~ifolosire a datelor ele pot fi:

o primare obtinute inprocesul de culegerea datelor (Numarul de carti din biblioteca )

o derivate - obtinute prin aplicarea unui model de calul statistic (Ex. 90 % din carti au fot citite)

d) Datele ~i indicatori statistici reprezinta caracterizari numerice ale unitatilor obtinute prin observare ~i

prelucrare. in statistica datele sunt intotdeauna marimi concrete. Mesajul datelor il reprezinta

lnformatl« statistica.

• dupa modul de utilizare a datelor ele pot fi:o primare - obtinute in procesul de observare

o derivate - obtinute prin prelucrare

o parte din datele statistice se regasesc sub forma de indicatori statistici. Deosebirea consta, ca datele

statistice sunt notiuni generalizatoare, in timp ce indicatorii sunt particularizati pe domenii.

e) Masurare statistica - presupune exprimarea in unitati concrete de masura,

f) Estimare statistica - presupune ~icaracterizare statistica utilizand un model sau 0ipoteza statistics.

g) Prin Eroare statisticii - intelegem abaterile care pot s A apara intre dimensiunea reala a fenomenelor

studiate ~i cele stabilite printr-un model de calcul statistic Ele sunt admise intr-o proportie de ± 5%.

Acestea sunt reglate prin proprietatile legii numerelor mari si sunt calculabile, in general, cu ajutorul

functiilor de probabilitate, elaborate de statistica matematica,

3

Page 4: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 4/43

 

CURS STATISTICA MTC - ANUL I FR

Tema 2. ORGANIZAREA CERCETARII STATISTICE

1. Etapele cercetArii statistlee2. Observarea statisticA (culegerea datelor statistiee)3. Metode de observare statisticA

4. Conceptul de eroare in statistici. Controlul datelor statistice.

1. Etapele cercetArii statistice

Cercetarea statistica este un proces complex care antreneaza un numar mare de specialisti

statisticieni, infonnaticieni ~ide alte profesii. Organizarea si desfasurarea unei cercetari statistice concrete

se prezenta astfel:

OBSERVAREA PRELUCRAREA ANALIZA SI INTERPRET AREA

STATISTICA STATISTICA f---t' SATlSTICA

Deli cercetarea statisticli se desjllsoarli in trei etape succesive ea reprezintli un proces unital'

prin con(inutul, scopulSi prin metodele utilizate. in cadru' cercetlirii statistice rolul eel mai importantii revine analizei statistlce Ea trebuie sli asigure nu numai 0 lnterpretare stiintiflCa a rezuhatelorcercetarii, dar mal ales obpnerea unu; material documental' real.

Procesul de cercetare statistica se poate realiza in conditii optime folosind echipamente modeme

de ca1cul. Acesta prezinta un dublu avantaj:

se pot culege date pentru un numar suficient de mare de caracteristici;

reduce timpul de prelucrare a datelor culese.

Pe plan national statistica poate fi structurata in statistica oficiala ~iin statistica academicaDe cele m ai multe ori ordinea de elaborare a programului de cercetare este invers procesului de

cercetare. intai se stabileste ce anume se va analiza ~i in ce scop, apoi metodele de prelucrare si in ultimulrand se aleg caracteristicilece trebuie inregistrate ~i forma de observare. Indiferent de ordinea in care se

elaboreaza programul acesta se subordoneaza obiectului ~i scopului cercetarii,

2. Observarea (culegerea) datelor statistice.in toate cazurile, in care se organizeaza un studiu statistic, este necesar st1se in ceapa cu observarea

(culegerea datelor). In acest scop. este necesar st1se stabileasca, in primul rand, sursele de date, metoda de

observare ~ist \ se inregistreze datele care vor fi supuse ulterior prelucrarii.

Prin unna re , observareastatisticli este et s pa in ca re s e inregistreazt\ datele primare in mod u nita r cu privire

la unele caracteristici inprealabil stabilite, de la unitatile care formeaza obiectul supus studiului statistic.

Observarea trebuie st \ indeplineasca anumite conditii de cantitate (volum) ~icalitate.Principiile organizlirii Ii desfolurlirii observari; statistice sunt:

; 0 . . autenticitatea (veridicitatea) datelor culese;

)- completitudinea datelor;

)- confidentialitatea datelor inregistrate;

)- asigurarea credibilitatii datelor;

Din punct de vedere alplanul observlirii statistice acesta trebuie sa cuprinda:)- Obiectul si scopul observarii; - se stabileste odata cu programul intregii cercetari. Acesta

trebuie st1 fie strict precizat deoarece este necesar st1 alegem numai acele variabile care

raspund direct cu scopul cercetarii

)- Timpul observarii (la care se refera datele) ~i timpul inregistrarii;

)- Locul observarii;

)- Programul observarii;

4

Page 5: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 5/43

 

CURS STATISTICA MTC-ANULIFR

» Formularele ~i instructiunile de completare trebuie sa fie tapizate;

» Masuri organizatorice.

» Unitatea simpla si/sau unitatea complexa de observare;

» Unitatea raportoare;

3. Metode de observare statistici

in procesul de dezvoltare al statistici s-au conturat mai multe metode de observare. In generalmetoda de observare a fost ~i este dependenta de modul de organizare !iiifunctionare a sistemului

informational statistic.

Existenta mai multor metode de observare, face posibila clasificarea lor in functie de mai

multe criterii astfel:

-/ In functie de gradul de cuprindere a numarului de unitati avem:

observare totala

observare partiala

-/ in functie de modul in care este caracterizat fenomenul:

Observari statice (la un moment dat)

Observari dinamice (in timp)

-/ in functie de modului de organizare :Observari cu caracter permanent

Observlirispeciale

-/ Din punct de vedere al timpului de efectuare se pot intAlni:

Observliricurente

Observari periodice

Ob se rv ar i u nic e

Principalele metode de observare sunt:

1) Recensamlintul;2) Rapoartele statistice;

3) Sondajul statistic;4) Ancheta statistica;5) Observare«par(ii principale;6) MonografUl.

1) Recensamlintul- este 0metoda de observare totala, cu caracter periodic, care surprinde un fenomen

in mod static.

Este cea mai veche metoda de observare statistica, aparuta inca din antichitate (recensaminte ale

populatiei a romani care se efectua din 5 in 5 ani).

Acesta in general reprezinta fotografierea fenomenelor la un moment dat.

Recensamdnrul populatiei este "un proces de culegere, prelucrare !iii publicare a datelor

demografice economice !iiisociale la un moment specificat". Aceste date ofera informatii despre toate

persoanele din lara respectiva sau de pe un teritoriu delimitat.La noi in t a r a acesta se efectueaza periodic din lOin 10 ani. (Periodicitatea mai mare sau mai mica

este in functie de mutatiile survenite sau de suportul fmanciar disponibil). Momentul critic este ales,

uzual, in timpul iernii evitandu-se vacantele, concediile, astfel ca populatia, in prealabil anuntata, s a fiesurprinsa, (in Romania 7 ianuarie 1992; 17 februarie 2002).

Din domeniul populatiei, recensamsntul s-a extins si asupra altor domenii: exista recensaminte asupra

unitatilor hoteliere, al locuintelor, al animalelor, al unitatilor din industrie, comert, transport agricultura

(prin urmare recensaminte economice).

2) Rapoartele statistice - sau sistemul darilor de seama se intocmesc la nivelul institutiilor !iiiagentilor

economici, fie publici sau privati Acestea sunt obligati (de statul de drept) ca in permanenta sa

furnizeze informatii privind activitatea desfasurata. Prin urmare in aceste dati de seama sunt inclusi

indicatori cu caracter economic social-cultural, juridic, de sanatate publica si invatamant.

5

Page 6: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 6/43

 

CURS STATISTICA MTC - ANUL I FR

3) Sondajul statistic sau seleetia statistica este 0metoda partiala de observare, ~ia devenit una din cele

mai utilizate inprezent. Avantajele acestei cercetari sunt:

poate fi aplicabila in toate cazurile;

economii de resurse banesti;

un program de cercetare amplu

La baza sondajului s13.esantionul extras din colectivitatea totala, care trebuie sa indeplineasca

conditia de reprezentativitate. (Mai amplu vom analiza sondajul statistic in cea de a doua parte a

matertei).4) Ancheta statistica - este 0metoda de observare partials care consta in intervievarea unor persoane

deja stabilite. Acestea primesc un chestionar la care raspund benevol.

5) Observare« par(ii principale - observare partiala special organizata, care se aplica pentru

obtinerea informatiilor despre 0 colectivitate tmpartita pe grupe de importanta, Se inregistreaza

datele numai pentru grupele care au cea mai mare pondere.

6) Monografia - observare partiala care se realizeaza la 0 unitate complexa, Ex. Monografia unui

oras municipiu, intreprindere etc. 0 monografie ampla a fost intocmita de Dimitrie Cantemir in

"Descriptio Moldave". Aceasta lucrare trateaza aspecte istorice, politice, eeonomiee, eulturale,

demografice.

in cadrul oricarei metode se poate opera cu urmatoarele procedee de observare:» masurarea direeta

} ;> interogare

» autoinregistrare

;0 . preluare din alti purtatori de informatie} ;> corespondenta

;0 . telefon

Din datele inregistrat obtinem informatia statistica.

4. Conceptul de eroare in statistic!. Controlul datelor statistice.Eroarea statistica este diferenta dintre un indieatorul obtinut pe baza diferitelor calcule ~ivaloarea reala.

Practica a dovedit ca inmod curent se pot produce mai multefeluri de erori:» De observare sau inregistrare

» De reprezentativitate

;0 . De modelare;

;0 . De interpretare.

Toate acestea pot fi sistematice sau intfunplatoare

Pentru a inlatura sau minimiza aceste variatii se recurge la controlul datelor care poate fi:

» Cantitativ

» Calitativ

» Logic

» Aplicarea testelor de semnificatie pentru indicatorii calculati

} ;> Aplicarea metodelor de verificare a ipotezelor pentru validarea modelului ales.

Dupa ce s-au obtinut datele statistice acestea prezinta forme concrete, individuale de manifestare.

Si pentru a Ie utiliza inanaliza ~iinterpretare statistica este necesar procesul de prelucrare.

6

Page 7: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 7/43

 

CURS STATISTICA MTC - ANUL I FR

Tema 3. PRELUCRAREA PRIMARA A DATELOR STATIST ICE ~I PREZENTAREA

INFORMATIILOR OBTINUTE.

1. Preluerarea statisticA2. Gruparea ~iclasificarea statistici.3. Prezentarea datelor sub forma de tabele, serii lJigraflee,

1. Prelucrarea statisticiPrelucrarea statistica - este un proces prin care datele inregistrate sunt sistematizate sunt tratate

statistic in vederea obtinerii sistemului de indicatori statistici. Obtinerea indicatorilor statistici este

necesara pentru caracterizarea in expresii numerice generalizatoare, a ceea ce este esential pentru un grup

de unitati sau pentru intreaga colectivitate, studiate inconditii de timp s i de spatiu,

Prelucrarea primara tnseamna in acelasi timp ~i centralizarea, sistematizarea ~i omogenizarea

datelor observarii in vederea aplicarii modelelor de calcul ~i analiza satistica

Sistematizarea datelor inregistrate presupune ordonarea acestora in functie de omogenitatea lor.

Deci la baza sistematizarii se afla principiul omogenitatii. (Ex. pentru formularea unei idei sau a

unei fraze de compliment - cuvintele trebuiesc alese (grupate), sau (clasificarea studentilor dupa notele

obtinute la examenul de statistica). Principiul omogenitipi este un principiu de pierdere a informapeipentru a clltiga informatie.

ins iIi sistematizarea se realizeazA prin :a) centralizarea ~ib) gruparea statistica a datelor.

a) centralizarea - presupune totalizarea unitatilor statistice sau a valorilor unei caracteristici la nivelul

grupelor tipice sau al colectivitatii observate. Totalizarea valorilor unei caracteristici se face prin

insumarea directa sau prln folosirea unor coeficienti de echivalenta (preturi, timpul de munca etc.)

In urma centralizarii obtinem mull doritii indicator; statistici de nivel (ex, nr. populatiei unei

localitati, valoarea productiei)

• Centraiizarea s;mpld si obtinerea indicatorilor (agregatelor) generali

Nr.crt. Variabile insumabile directal unitatii Xl X2 .. . Xp

1 Xli X21 ... xpJ

2 X}2 X22 .. . xpJ

... ... ... ... ...

1 Xli X2i .. . Xpi

... .. . ... ... ...n XJn X2n ... Xpn

Total n n n

LXIi LX2i

...LXpi

i=1 ;=1 i= 1

Pe orizontala se gaseste fiecare unitate cU toate variantele inregistrate la toate caracteristicile

(variabilele) inregistrate, iar pe verticals sunt distributiile de valori ale celor p varlabile independente

inregistrate.

2. Gruparea Ii clasificarea datelor statisticeGruparea statistici - este 0centralizare pe grupe a unitatilor unei colectivitatii. Se obtine in baza

aplicarii metodei gruparilor statistice presupunand principiul omogenitatii,

Omogenitatea statistica inseamna ca in grupa (c1asa) respectiva sA existe variatie minima intre

variantele inregistrate - variatie care poate fi explicata ca fiind influenta factorilor aleatori.

7

Page 8: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 8/43

 

CURS STATISTICA MTC - ANUL I FR

In forma gruparii statistice - rezulta siruri de date ordonate dupa variatie, in sens crescator sau

descrescator, a caracteristicilor de grupare.

~ Dupa contimaul caracteristicii de grupare putem avea:

• grupari cronologice in cazul in care sistematizarea datelor se face dupa 0variabila de timp;

• grupari teritoriale cand sistematizarea datelor se face dupa 0variabila de spatiu;

• grupari atribuuve se folosesc pentru toate caracteristicile, in afara caracteristicilor de timp ~i

spatiu,

Caracteristicile atributive pot fi caracteristici cantitative (numeric e) ~icalitative (nenumerice).

~ Dupa numarul variabilelor de grupare pot fi: simple # combinate.Gruparile simple (dupii 0 singura variabila ) pot fi:

a) gruparea pe variante daca amplitudinea variatiei este mica ~i la nivelul unitatilor individuale s-

au inregistrat un num

b) gruparea pe intervale de variatie egale daca amplitudinea variatiei este moderata, in acest caz, e

necesar, s a se stabileasca aml d . arim . tervalul . d variatie,

A r mic de valori distincte (variante);

Durata sejurului (zile ) Nr. turist!

5 10

6 15

7 20

8 30

9 35

10 30

11 15

12 10

TOTAL 165

num egrupe s i m earn ill e

Grupe de studenti dupa Dr. Nr.de volume citite studenti

30- 50 50

50-70 8070-90 60

90-110 120

110-peste 130

Total 440

c) gruparea pe intervale de variatie neegale.Prin gruparea pe intervale neegale se urmareste s a sestructureze colectivitatea pe tipuri calitative, daca nu se cunosc valorile (pragurile) care separa

tipurile calitative, se procedeaza mai tnw la gruparea pe intervale egale ~i apoi se poate folosi

criteriul mediei pentru formarea tipurilor calitative "mic", "mediu", "mare". In acest caz se obtine

o grupare tipol . Aglc.

Grupe de studenti dupa nr. de ore Nr.aferente pree:atirii pentru examene studenti

Sub 30 4

30-40 5

40-60 6

60*85 10

85-120 12

120-150 7

150-200 4

200 peste 2

Total 50

8

Page 9: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 9/43

 

CURS STATISTICA MTC-ANULIFR

Gruparea combinattJ presupune sistematizarea datelor dupa doua sau mai multe caracteristici de

grupare (eel mult 4) care pot fivariahile numerice si/sau calitative. Gruparea combinata impune stabilirea

ordinii de grupare pe baza relatiei de interdependent! dintre variabile. Grupele formate dupa prima

caracteristica se cea de a doua

Grupe dupa

ore lucrate

Clasificarea (gruparea pentru variabile calitative) (Fig. 3.5.) se efectueaza dupa variabile

nenumerice (calitative) ~i presupune inc1uderea in aceeasi grupa (clasa) a tuturor unitatilor la care s-a

inregistrat aceeasi forma de manifestare a caracteristicii. De regula, are un caracter oficial (ex. CAEN) ~i

inprealabil trebuie stabilit un nomenclator al claselor.

SEX Nr studenti

FEMININ 125

MASCULIN 200

Total 325

METODOLOGIA GRUPAluI

Gruparea pe intervale egale implica urmatoarele etape:

a) calculul amplitudinii absolute de variatiei (A) care exprima imprastierea maxima a valorilor serei.

A X a =Xmar - Xmin;

b) stabilirea in parametrii intr-un anumit numar de grupe (r) se poate stabili conform relatiei lui

Sturgers, r =i+3,3221og n

unde: n - nr. caracteristicilor.

c) determinarea marimii intervalului de grupare (h), se calculeaza ca raport intre amplitudinea absoluta a

variatiei ~inumarul de grope:

AX x -x·h = _Q sau h = max. mm

r 1+3,322 log n

Nota: Marimea intervalului (h) se rotunjeste la intreg in plus (ex.3,25~)

Prima grupa se porneste de la Xmin adaugandu-se succesiv marimea intervalului de grupare (h)

rezultat din calculul anterior. Valoarea din stanga intervalului va fi considerata ca limita inferioara, iar

valoarea din dreapta ca limita superioara. Valorile care formeaza limitele intervale lor se inregistreaza fienumai ca limita superioara fie ca Iimita inferioara pentru a evita inregistrari duble a caracteristicilor.

Indiferent de scopul ~iobiectul gruparii, aceasta trebuie sA indeplineasca eel putin urmatoarele conditii:

• completitudinea datelor;

• omogenitatea grupelor(claselor) ~i subgrupelor (subclaselor);

• unicitatea includerii unitiililor intr-o singura grupa (clasa);

• continuitatea variatiei grupe/or in cazul variabilelor numerice, ceea ce practic Inseamna sa

nu existe grope cu frecvente nule care ar duce la intreruperea gruparii,

Pentru analiza structurii colectivitatii pe grope tipice se foloseste gruparea pe intervale neegale.

Gruparea pe intervale neegale presupune regruparea intervalelor egale.

Un prim principiu al gruparii pe intervale neegale este trecerea de la variatia liniara (interval de

9

Page 10: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 10/43

 

CURS STATISTICA MTC ~ANUL I FR

marime constanta) la variatia neuniforma a unor intervale de grupare din ce in ce mai mario De exemplu,

de la 8 grope se poate trece la 5,3 grope obtinand calificative

Clasijicarea se efectueaza dupa variabile nenumerice (calitative) ~i are, de regula. un caracter

oficial (ex. CAEN) ~i in prea1abil trebuie stabilit un nomenclator al claselor.

3. PREZENTAREA DATELOR STATISTICERezultatul sistematizarii necesita 0 prezentare sub 0 forma cat mai comod de manevrat ~i

vizualizat, sub forma de :

a) serii,

b) tabele

c) grafice.

a) Seriile statlstiee

Enumerarea datelor statistice intr-o anumita ordine se numest« serie statisticii. Seria statistica se

reprezintA ca doua siruri de date. Primul sir este criteriul de enumerare (valori , variante) al doilea sir

confine datele numerice.

Seriile statistice sunt de urmatoarele feluri

1. Serii de repartitie sau de distributie2. Serii cronologice (ale dinamicii )sau serii de timp.

3. Serii teritoriale san de spatiu,

4. Serii descriptive sau enumerative (lista candidatilor admisi, facultatea, media de liceu , media

examenelor, scoala absolvita etc.)

5. Serii unidimensionale ~imultidimensionale

La riindullor seriile statistice pot fi atAtnumerice (cantitative) cat ~inenumerice (calitative).

b) Tabele statistice. Prezentarea datelor sub forma unui tabel statistic permite atAt0buna vizualizare cat

~imai ales, efectuarea diverselor calcule in procesul de preluerare a datelor.

Pot fi tabele eu 0 singura intrare ~i cu doua sau mai multe intrari, tabele de lucru ~i de prezentare a

rezultatelor.inelaborarea unui tabel se identifica urmatoarele elemente ~i reguli prineipale:

./ titlul tabelului

./ macheta tabelului

./ subiectul tabelului - colectivitatea ~icomponentele ei

./ predicatul tabelului - constituie variantele ~i indicatorii cu care caracterizam statistic colectivitatea

studiata .

./ Unitatea de masura

./ Sursa datelor (sub tabel)

./ Numerotarea tabelelor (sus)

c) Reprezentiri grafice - Cu ajutorul graficitor se vizualizeaza informatiile statistice facilitandperceperea pe ansamblu a datelor, aspecte privind: variatia valorilor observate, repartitia lor, legaturile

existente intre ele, a evolutiei valorilor in timp s.a,Graficul trebuie sii cuprinda:

./ Titlul- (precizandu-se ~ilimitele fenomenului)

./ Legenda

./ Sistemul axelor reetingulare (ox, oy, oz)

Prineipalele tipuri de grafice sunt: grafice de volum, grafice de structura, grafice prin benzi, grafice prin

coloane simple sau in aflux, cronograma (historiograma) pe scam uniforma sau logaritmica, diagrama

polar! (radiala), histograms, poligonul frecventelor, curba cumulative a frecventelor, graficullui Lorentz,

eartograma, cartodiagrama.

1 0

Page 11: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 11/43

 

CURS STATISTICA MTC - ANUL I FR

Tema 4. MARIMILE RELATIVE

1. Noliune. Detinipe.

2. Tipuri de mirimi relative

1. Notiune. Def"milie.Indicatorii relativi se obtin prin aplicarea unui model de comparatie sub forma de raport. Deei prin

mirimi relative intelegem rezultatul raportirii a doi indicatori absolup.

Indicatorul din numaratorul raportului se numeste indicatorul raportat, iar eel din numitor, indicatorul

baza de raportate. Alegerea bazei raportate se face in functie de scopul compararii,

Marimile relative se pot exprima prin coeficienti, %, promile, prodecimile cat si procentimile.

Ex. Natalitatea = nr..n8scuti vii ... 1000 (5 nascuti la 1000 persoane); nr medici/or cenr mediu al populatiei

revine la 10.000 locuitori . Mai rar se intiilnesc exprimarii in procentimile, adica cat unitcl/i dinindicatorul raportat revin la 100.000 unitap baza de raportare.

Alegerea fonnei de exprimare se face astfel incat marimile relative sa fie sugestive. Dar forma cea

mai obisnuita de exprlmare a lor este cea a procentelor care arata cate unitati din indicatorul raportat revin

la 100 unitati ale indicatorului baza de raportare.

Forma de exprimare a marimilor relative se stabileste in raport cu gradul de variatie al

fenomenelor, a scopului urmarit, precum si particularitatile specifice fenomenului cercetat.

Pentru calculul unei marimi relative, trebuie respectate 3 cerinte:

a) intre tennenii comparati trebuie s a existe 0legatura de conditionalitate sau de cauzalitate;

b) tennenii raportati sa fie cu adevarat comparabili din punctul de vedere al sferei de cuprindere, ca

metodologie de calcul etc;

c) baza de comparatie s a aiba 0anumita semnificatie in evolutia fenomenului studiat.

in cea mai mare parte marimile relative in satistica nu prezinta 0 dificultate de calcul. Cele mai multe

dificultati apar in comparatiile internationale, unde indicatorii provin din diferite surse sau sunt calculati

dupa metodologii diferite.

2. Tipuri de marimi relative

in principal se pot calcula urmatoarele tipuri de marimi relative:

a) de structura;

b) de coordonare (eorespondeata);

c) de intensitate

d) ale dinamicii;

e) ale planului (programArii).

a) mirimea relativA de structuri se poate calcula de fiecare data cand s-a aplicat metoda gruparii

prin unnare calculul lor este posibil atunci cand colectivitate este separata inde dona sau maimulte grupe. Este un raport dintre 0parte la intreg (total).

11

Page 12: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 12/43

 

CURS STATISTICA MTC-ANULIFR

- daca se determina pentru frecventa fiecarei grupe se numesc ponder; iar daca se determina pentru valorilecentralizate ale diferitelor caracteristici se n ume sc g re ut iJ ,i s pe cif lC e care se obtin ca mar imi relative de s tr uc tu ra r apona nd

k k

f re cven ta f ie c it re i grupe (n;, J i ) la totalul frecventelor (L nj,L 1; )dupa relatia:i=1 ;=1

i=1

Frecventele relative permit analiza structurii unei serli de distributie in functie de una sau mai

multe variabile (caracterlstici) ~icompararea repartitiilor empirice cu cele teoretice.

Avand caracter de marimi relative se pot exprlma sub forma de coeficienti sau in procente si fiind

"eliberate" de aspectul concret al exprimarii unitatilor centralizate pe grupe devin comparabile pentru

orlce fel de serle ~imai ales cu probabilitatile din distributiile teoretice.

Proprieta(i: Specific marimile relative de structura este proprietatea de aditivitate. Fiind calculate

falii de aceeasi baza cu greutati specifice corespunzatoare se pot efectua operatii de adunare ~i scadere

Suma Marimile relative de structura este egala cu 1 sau 100 in functie de forma de expriroare

Reprezentarea gratica. Marimile relative de structura se reprezinta grafic prlntr-o diagrams de

structura care poate fi ilustrata prin:

cercul sau semicercul de structura;

dreptunghiul de structura;

patratul de structura,

b) mirimile relative de coordonare sau corespondent' caracterizeaza raportul numeric in care segiisesc doi indicatori cu acelllJi conpnut in spapi diferite coexistente in timp.Pentru 0 colectivitate impArtitii in dow grupe pentru care nivelul pe grupe al variabilei studiate

este XA ~iXB :

X A X BForma de prezentare ar fi: :KAIB:::: X sau KB1A:::: X ,unde: A ~iB unitati teritoriale.

B A

XA ~iXB nivelul colectivitatii de raportate din unitatea A respectiv BMarimi relative de coordonare se pot calcula si pomind de la frecvente:

nA nBKAIB =- sau KBIA =-

nB nA

De regula ei se exprima in coeficienti.

Daca sunt mai multe grupe, se alege una ca baza de comparatie ~i se raporteaza, pe rand,fiecare grupa la baza aleasa.

De regula raportul este valoarea cea mai mica, la eel mai mare, astfel putem obtineexprimarea lor in coeficienti supraunitari.

Aceste marimi se folosesc in studiul variatiei teritorlale ~i prin urmare au caracter de indici

teritoriali.

Reprezentarea grafted: Marimile relative coordonare. se reprezinta grafic prin:Benti sau coloane; stabilind in acest fel relatiile care exista intre diferltele pArti ale aceleiasi

colectivitati.

c) ale dinamieii - se ob(ine ca raport a doi indicatori al aceluilq; jenomen dar aflate tntre doua

momente /perioade diJerite.Pentru a studia in dinamica recurgem la serii cronologice.

in generale 0 serie statistica este fermata din 2 siruri de date in care I sir reprezinta criterlul de

sistematizare (factorul e grupare) al II -lea sir variabila dependenta de factorul de grupare

Analiza se face amt in baza fixii cat ~imobil! (in lant),

* Indicatorii relativi obtinuti prin raportare exprima indicele de variatie

1 2

Page 13: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 13/43

 

CURS STATISTICA MTC - ANUL I FR

eu baza fixa K, 10 = Xt ·100X o

eu baza m o bila (in lant) K,IH=_ _ ! ! _ r _ ·100Xt_1

Putem calcula marimi relative ale dinamicii la nivelul ansamblului, daca variabila este aditivadirect:

Ele se exprima amt sub forma de coeficienti dar mai adesea sub forma % .

Rep re ze nta re a g ra flCa : Marimile relative d. se reprezinta grafic prin:

cronograme (histograme)

d) Mirimile relative ale programirii (planificirii)

Se calculeaza la nivelul unitatilor economice fiind necesar sa se elaboreze programe de

aprovizionare, productie §i desfacere pe termene scurte sau mai lungi.

Calculul marimilor relative ale planului presupune preluarea din evidentele unitatii economice

analizate a informatiilor referitoare la:

• nivelul fenomenului realizat inperioada de baza (xo);

• nivelul planificat (programat) in perioada curenta ( X p l )

• nivelul realizat in perioada curenta (Xl).

Din compararea sub forma de raport a celor trei indica tori rezulta:x ,

• co ejicien tul sarcinii de plan: k pliO = _ _ _ _ e _ x 100Xo

• coeficientul indeplinirii planului: k II pi = _!!_ x 100Xpi

• coejic ientul de dinam icii: kilo =.!!.. x 100X o

intre cei trei coeficienti exist! relatia:

• ks,« = kpJlo·kll pi

Interpretarea valorii marimilor relative ale planului ca si a ratei de depasire (nerealizare) se face inraport eu continutul economic al indieatorului (de crestere sau de reducere obiectiva a fenomenului).

Putem calcula marimi relative ale planului la nivel de ansamblu, pentru variabile insumabile

direct:

L X Ikl/pi = '"

~Xpl

De cele mai multe ori marimile relative de dinamica §i mArimile relative ale planului se exprima

procentual.

LXpl

• kpllO = "~XO

respeetiv

1 3

Page 14: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 14/43

 

CURS STATISTICA MTC - ANUL I FR

e) Mirimile relative de intensitate se obtin prin raportarea a doi indicatori absoluti de natura diferita,da r care se afla intr-un raport de interdependenta,

Relatia de calcul este:

Y j

• la nivel partial: X = Z i

Aceste marimi se pot calcula pentru fiecare grupa de unitati inparte sau pentru Intreaga colectivitate.

L Y ;• la nivelul ansamblului: X i =L Z, sau

Ex: Densitatea populatiei (Joclknl,) Productivitatea muncii (Jei/munc).

Marimile relative de intensitate au numerose aplicatii in:

industrie ( coeficientul mecanizarii, automatizarii, utilizarii intensive etc.)

agriculture (coeficientul cnimizari, irigatiilor, recolta medie la ha);

turism (indicatorii eficientei activitatii de turism, productivitatea muncii etc)

demografice (coeficientul miscarii naturale, migratorii a populatiei)

Problema 1 Pentru Marimile relative de intensitate; de structura; de coordonare (corespondents);

Date privi d I ..I iuli fun . de locuitorirepartitia oraselor Romaniei a 1 I ie 2002 in ctie de numarul

Grupe dupi Numir orale Numir populapemirimea oraselor

Mici 67 474711

Mijlocii 101 1543080

Marl 35 1178523

total 203 3196314

Se cere:1. Cal ulul iill 'I 1 ' , 'bT afiin eaton or re ativi POSI I 1. Reprezentarea gn eft a rezu tatelor obtinute

Grupe dupa Structura % Numarul mediu de coordonare

mar imea oraselor locuitorilor loeuitori pe un oras oraselor locuitoril

oraselor (intensitate) or

Mici 33,00 14,85 7085 1,00 1,00

Mijlocii 49,75 48,28 15278 1,51 3,25

Marl 17,25 36,87 33672 0,52 2,48

total 100,00 100,00 15745

Problema 2. Mirimile relative ale planificirii - vezi curs 2

1 4

Page 15: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 15/43

 

CURS STATISTICA MTC - ANUL I FR

Tema 5. ANALIZA SERIILOR DE REP ARTITIE (DISTRIBU'fIE) UNIDIMENSIONALE

1. Indicatori de nivel~ide freevente,

2. Indicatori ai tendiatei centrale ~iai mediilor de structuri (pozitle);

Rezultatul gruparii ~i clasificarii unitatilor colectivitatii observate in functie de caracteristiciatributive cantitative sau calitative se prezinta sub forma seriilor de repartitie (distributie) empirica, Ele se

mai numesc simplu repartitii sau distributii statistice.

Gruparile simple (dupa 0 singura caracteristica) conduc la serii statistice independente sau

unidimensionale, iar cele combinate la serii statistice conditionate sau multidimensionale.

La calculul ~i analiza indicatorilor (parametrilor) distributiilor empirice trebuie avute in vedere 0

serle de proprietati, care se pot intMni in toate cazurile, dar cu forme specifice fiecarei serii.

Principalele proprietati ale unei serii de repartitie sunt:

o variabilitatea,

o omogenitatea,

c independenta

o concentrarea sau dispersiaVariabilitatea termenilor unei serii statistice de repartitie este determinata de faptul ca fenomenele de

masa apar ca rezultat al actiunii combinate a mai multor cauze, unele cu caracter esential, altele cu

caracter intamplator, care se manifests, de regula, in conditii individuale diferite. Cu cat actiunea cauzelor

aleatoare este mai puternica, cu atilt variabilitatea termenilor este mai mare iar gradul de omogenitate este

mai mic.

Omogenitatea termenilor unei serii de repartitie se explica prin faptul cit toate valorile au acelasi

continut, depinzand de acelasi factor esential,

Daca in urm.a analizei statistice se constata ca seria nu prezinta omogenitate, se trage concluzia ca

aceasta colectivitate este fermata din mai muIte tipuri calitative ~i deci, seria respectiva trebuie separata in

doua sau mai multe serii componente. Se vor folosi ~i in acest scop indicatori medii de variatie ~i

asimetrie partiali ~itotali (vor ji prezenttui in subcapitolele urmlitoare).Independenla termenilor unei serli de repartitie de frecvente provine din faptul ca fiecare valoare

individuala se mregistreaza pentru 0 unitate statistica care reprezinta un element distinct ~i obiectiv al

unei colectivitati statistice. Aceasta independenta este relativa deoarece unitatile statistice apartinand

aceleiasi colectivitati se supun acelorasi legi care se manifesta sub forma de tendinta, FatA de aceasta

tendinta exista abateri intr-un sens sau altul, care pentru un numar mare de cazuri, se compenseaza

reciproc. De aceea, este necesar ca prin metode statistice corespunzatoare, sAse aile trasaturile esentiale ~i

comune care leaga aceste valori individuale relativ independente, dar care apartin aceleasi structuri

calitative ~i care in statistics este cunoscuta sub denumirea de .Jegea de repartitie a seriei ".

Concentrarea sau dispers;a fatA de una sau mai multe valori ale seriei apare ca rezultat al

intensitatii cu care influenteaza cauzele (esentiale ~i intamplatoare) la nivelul fiecarei unitati ~i care prin

centralizare se determina frecventele de aparitie.De cele mai multe ori, intensitatea factorilor de influenta este diferita ~i atunci frecventele de

aparitie se concentreaza fie catre un singur capat al seriei (caz in care pe grafic se descriu repartitii in

forma de Ifn), fie catre valoarea centrala a seriei (caz in care pe grafic se descrie 0 repartitie normal A

(simetrica) , fie catre ambele capete ale seriei (caz in care pe grafic se obtine 0 repartitie in forma de "a",

Multitudinea situatiilor intalnite in practica demonstreaza necesitatea caracterizarii tendintelor de

concentrare/diversificare a valorilor unei serii de repartitie de frecvente cu ajutorul unor metode statistice

specifice. Aceste metode conduc la obtinerea uneia sau a mai multor valori reprezentative, fie pentru

intreaga serie, fie pe intervale de variatie a valorilor individuale.

Sistemul de indicatori al unei repartitii empirice este format din:

1 Legea normal! a repartitiei este numita ~icurba normal! Gauss-Laplace ~igraficul ei "clopotullui Gauss".

15

Page 16: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 16/43

 

CURS STATISTIC..\. MTC - ANUL I FR

1. indicatori de nivelli de frecveme,2. indicatori ai tendin(ei centrale Ii ai mediilor de structurii (poutie);3. indicatori de varia(ie;4. indicaton de asimetrie;5. indicatori de concentrare:

Acesti indica tori se pot stabili in intregime pentru seriile de variabile eantitative (numeriee). in cazuleelor eu variabile ealitative, numarul indicatorilor calculati este mai restrans. In continuare acesti

indieatori se vor prezenta pe exemplul seriilor de variabile numerice si in masura in care ei se pot aplica ~i

pentru seriile de variabile calitative vor fimentionati separat.

1. Indicatori de nivel ,ide freevente ai seriilor de reparntie

Caracterizarea statistic! a unui fenomen de mas! intr-o colectivitate statistica presupune luarea in

consideratie a13t a valorilor individuale cat ~i a frecventelor de aparitie a acestora.

Indicatorii de nivel ai seriei pot fi exprimati in cazul variabilelor numerice prin variante in cazulgruparii pe variante. in cazul intervalelor de variatie se utilizeaza ca indicator de nivel centrul (mijlocul)

intervalului de grupare.

in grupa indicatorilor de frecventa deosebim: frecvente absolute, frecvente relative ~i frecventecumulate.

Frecventele absolute notate in unele lucrari cu "ft sau lin; II in altele, reprezinta numarul de unitati

care corespunde grupelor de unitati (variante sau intervale de valori) obtinut ca rezultat al centralizarii

statistice. Frecventele absolute se exprima in unitati concrete (numar de salariati, numar de agenti

comerciali, numar de unitati turistice, etc.). Frecventele absolute stau la baza calculului frecventelor

relative.

Frecventele relative permit analiza structurii unei serii de distributie in functie de una sau mai

multe variabile (caracteristici) ~icompararea repartitiilor empirice cu cele teoretice.

Frecventele relative notate cu "f/ "san " ni· "denumite ~i ponderi, greutati specifice sau

probabilitati de aparitie se obtin ca marimi relative de structura raportand frecventa fiecarei grupe (n;, J i )k k

la totalul frecventelor (L ni,L J ; ) dupa relatia:;=1 i=1

r * J; *100:;(%) ::::;-k-- ,

IJ;;=1 i=1

Avand caracter de marimi relative se pot exprima sub forma de coeficienti sau in procente

In cercetarea statistica calculul frecventelor relative prezinta interes la detenninarea altor

indicatori statistici ce permit aprofundarea analizei seriilor de repartitie sau cand ne intereseaza

structura seriei.

Frecventele cumulate se noteaza cu F; sau F', in functie de felul frecventelor incluse in calcul

(absolute sau relative). Cumularea se face succesiv pornind de la ambele capete ale seriei, obtinand astfel

pentru fiecare valoare a seriei frecvente cumulate crescator ~i descrescator

Frecventele cumulate sunt comparabile intre ele indiferent de felul de intervalului de grupare. De

asemenea ele stau la baza stabilirii medianei ~i a celorlalte medii de structura sau pozitie - indicatori care

vor fiprezentati intr-un subcapitol din acest capitol.

16

Page 17: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 17/43

 

CURS STATISTICA MTC-ANULIFR

2. Indieaterf! tendiajel centrale

Analiza statistica a trasaturilor esentiale ale fenomenelor de masa, stabilirea tendintelor ce apar in

producerea lor necesita calcularea anumitor valori sintetice cu continut de valori tipice, care sa fie

reprezentative pentru intreaga serie studiata,

in functie de gradul de variabilitate a valorilor individuale, de sursele de date de care dispunem si

de nevoile de cunoastere, in teoria ~i practica statistica se utilizeaza ca principali indicatori ai tendintei

centrale:

2.1. miirimile medii;2.2. modul (dominanta) seriei

2.3.mediana;

2.1.Mirimile medii

Media in statistica reprezinta principalul indicator sintetic cu care se caracterizeaza un numar mare

de valori individuale diferite ca forme de manifestare dar avand acelasi continut,

in consecinta, marimile medii sunt utilizate ea instrumente principale de cunoastere a

fenomenelor de masa, deoarece numai pe baza lor se poate exprima ceea ce este comun ~i general in

forma de manifestare a acestor fenomene, in fiecare etapa data, prin eliminarea a ceea ee este intamplator

~ineesential inproducerea lor.Media sintetizeaza deci, Intr-o singura expresie numerica toate valorile individuale punand in

evidenta ceea ce este esential ~icomun tuturor unitatilor,De cele mai multe ori, valoarea mediei nu coincide eu nici una din valorile individuale din care s-a

calculat.

Pentru a asigura un continut cat mai real mediilor calculate este necesar ca valorile individuale din

care se calculeaza s a fie cat mai apropiate ca marime ceea ce corespunde conceptului de omogenitate

statistica, semnificand faptul ca exista 0 valoare in jurul careia se concentreaza cele mai multe valori

individuale.

Calculul mediei este recomandabil sa se bazeze pe folosirea unui numar mare de cazuri

individuale diferite sub care s-a inregistrat caracteristica, a carer variatie sa poata fi considerata ea

intamplatoare in raport cu intreaga masa de valori imegistrate.in cazurile in care nu dispunem de date dintr-o observare total a, care ar permite evidentierea

tuturor factorilor esentiali ~i intfunplatori care determina variatia caracteristicii studiate, se pot utiliza ~i

date provenite dintr-o observare partiala, in acest caz, mediile calculate pot fi considerate semnificative ~i

pentru intregul ansamblu numai daca esantionul indeplineste conditia de reprezentativitate.

Media este semnificativa numai in cazul unei colectivitati eu grad ridicat de omogenitate. in cazulin care colectivitatea este eterogena se va proceda la impartirea colectivitatii in grupe folosind si serii

conditionate pentru care se vor calcula mediile partiale corespunzatoare iar media pe total colectivitate va

fi in acelasi timp si 0 sinteza a mediilor de grupe.

Pentru ca marimea medie s a aiba un continut obiectiv, este necesar ca alegerea formei de calcul sa

se faca in functie de forma de variatie liide sursele de informatie cu privire la earacteristica studiata.

Inanaliza seriilor de repartitie de frecvente se pot calcula urmatoarele tipuri de medii:a media aritmetiei ( X a sau daei nu semai folose~te~ialti medie simpli X );

CI media armoniea (Xh );

a media pitratiea (X p );

C I media geometries ( X g ).

Fiecare poate fi calculata ca medie simpla ~i ca medie ponderata.

Mediile simple se folosesc in cazul datelor negrupate sau cand repartitiile au intervale cu frecvente

egale intre ele ~i deci se pot simplifica.

1 7

Page 18: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 18/43

 

CURS STATISTICA MTC - ANUL I FR

Mediile ponderate se utilizeaza pentru repartitiile in care fiecarei valori a caracteristicii ise

ataseaza 0 frecventa care difera de la caz la caz.

In statistica social-economica , eel mai frecvent se foloseste media aritmetica,

2.t.I.Media aritmetici

Media aritmetica este rezultatul sintetizarii intr-o singura expresie numerica a tuturor nivelurilor

individuale observate, obtinuta prin raportarea valorii totalizate a caracteristicii la numarul total alunitatilor,

In sens statistic, media aritmetica calculata pentru colectivitate statistica este valoarea care s-ar fi

inregistrat daca toti factorii ar fi influentat in mod constant in toate cazurile inregistrate. in acest sens,

poate fi folosit in statistic! termenul de "speranta" matematica catre care tind valorile individuale ale

unei variabile statistice inregistrate intr-o observare empirica.

Media aritmetica simpla se calculeaza ca raport intre suma nivelurilor individuale sub care s-a

inregistrat caracteristica ~i numarul cazurilor individuale luate in observare. Media se poate calcula

raportand valoarea totalizata a caracteristicii la numarul total al unitatilor la care s-a facut centralizarea.

Se foloseste relatia:n

L X i- x -....!:L_a-

nunde:

Xi reprezinta nivelurile individuale ale variabilei;

n

L X i reprezinta nivelul centralizat al variabilei;i=l

n reprezinta numarul unitatilor observate.

Media aritmetica ponderatii cu frecvente absolute Intr-o colectivitate statistica se intalnesc foarte

rar cazuri in care numarul variantelor coincide cu numarul unitatilor. De regula, fenomenele de masa suntnwneroase ~i aceeasi valoare individual a (varianta) poate fi lntalnlta de mai multe ori. In acest caz, pentrua putea cuprinde in calcul toate valorile individuale trebuie sa se tina seama ~i de frecventa lor de aparitie

iar media se va calcula ca 0medie ponderata utilizand formula:k

L x i n ii " , 1

X ="";""";k:---

L n ;i " , 1

in care k reprezinta numarul de grupe deci k < n

Media aritmetica ponderata cu frecverue relativek k

L x i n i- L x ; n ;x = i=1 ..!.i=::;.:I,--_

k 100L n ;;=1

De retinut: Daca repartitia de frecvente se prezinta pe intervale de variatie, Xi reprezinta centrul de

interval corespunzator,

Media aritmetica are anumite proprietati care au utilitate practica pentru calculul ~i interpretarea

valorii ei.

18

Page 19: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 19/43

 

CURS STATISTICA MTC-ANULIFR

Media este mai exact! cand 0 calculam direct din valorile sub care s-a inregistrat caracteristica.Este 0medie aproximativa cand 0 calculam pentru seriile pe intervale de variatie deoarece in acest cazdeterminarea ei se bazeaza pe ipoteza repartizarii uniforme a frecventelor in cadrul fiecarui interval ceeace, de regula nu corespunde realitatii,

2.1.2.Alte tipuri de medii utilizate in analiza seriilor de repartitie

Una din conditiile de aplicare a valorilor medii este aceea de a gasi criterii de alegere corecta atipului de medii folosit.

in general este recomandabil sa alegem media aritmetica atunci cand fenomenul supus cercetariiinregistreaza modificari aproximativ in progresia aritmetica,

in teoria ~ipractica statistica eel mai frecvent se foloseste media aritmetica,De aceea cand nu se precizeaza media folosita se presupune ca s-a calculat media aritmetica care

este considerat principalul parametru al tendintei centrale.Cand fenomenul Inregistreaza modificari in progresia aritmetica, sau intentionam sa dam 0

importanta mai mare tennenilor mai mici saumai mari ai seriei, calculam alte tipuri de medii ~ianume:

• media armonica ( X h )

• media geometrica (Xg ),

• media patratica (xp)

• MEDIA ARMONICA

Media armonica se defineste ca fiind egala cu valoarea inversa a mediei aritmetice calculata dinvalorile inverse ale termenilor aceleiasi serii.

Desi deriva din media aritmetica ponderata, in practica se intalnesc doua variante ale medieiarmonice, simpla si ponderata,

Se folosesc relatiile de calcul:- pentru 0 serie simpla

_ n» , =-n-l-

I-;=] X i

- pentru 0serie de repartitie de frecventek

In;- ;=1

X h = -k:-'--'-l--

I-n;;=1 X i

Comparand formula mediei armonice cu aceea a mediei aritmetice se pot stabili anumite relatiicare pot fi utile in practica statistica:

1) daca termenii seriei sunt pozitivi, media armonica este intotdeauna mai mica decat mediaaritmetica calculata pe baza acelorasi valori.

2) in cazul in care intre doua variabile interdependente exist! un raport de inversaproportionalitate, acest raport se pastreaza ~i in cazul mediilor calculate. Astfel, daca pentru calcululnivelului mediu al uneia dintre cele doua variabile se foloseste media aritmetica pentru cealalta sefoloseste obligatoriu media armonica,

3) daca se folosesc sisteme de ponderare diferite ~ianume Iamedia aritmetica frecventele absolute(ni), iar la media armonica produsele de frecvenle(xini)se obtine aceeasi valoare a mediei. Practic mediaaritmetica poate fi substituita cu media armonica ponderata cu produsele de frecventele (Xini) '

De cele mai multe ori din evidente nu rezulta frecventele absolute (ni) ci numai variantelecaracteristicii (x J ~i respectiv produsele de frecventa (Xini). In acest caz vom folosi urmatoarea formulapentru calculul mediei armonice ponderate:

19

Page 20: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 20/43

 

CURS STATISTICA MTC • ANUL I FR

k

Lx;n;

s, = - I : . . . . ; . . i = . . . . ; . . \ _ -

L-x;n;i-I Xi

Se observa ca in aceasta forma de ponderare media armonica este 0 forma transformata a mediei

arltmetice.

in cazul distributiilor de frecvente media armonica este indicat a fi folosita cand predominavalorile mici ale seriei, seria prezentand deci 0 asimetrie catre valorile minime ale caracteristicii. In acestcaz se foloseste formula mediei annonice ponderate clasice.

• MEDIA PATRATICA

Media patratica (.ip

) este acea valoare care inlocuind termenii seriei ridicati la patrat nu modifica

suma patratelor lor.Media patratica este folosita, de obicei, atunci cand nivelurile variabilei aleatoare prezinta cresteri

din ce in ce mai marl sau cand Intr-o repartitie predomina frecventele valorilor ridicate ale variabilei si

dorim sa le dam acestora 0 important! mai mare. Si aceasta medie, in cazul seriilor de repartitie defrecvente se foloseste complementar mediei aritmetice care ramane principalul parametru al tendinteicentrale.

Bazandu-se pe ridicarea la patrat ea se poate folosi si in cazul in care termenii seriei au valori

pozitive ~inegative.In cazul unei distributii de frecvente se vor efectua mai intai produsele dintre fiecare termen

ridicat la patrat si ponderea sa ~i pe baza acestora utilizand un rationament analog cu eel descris anteriorse obtine formula mediei patratice ponderate:

k

Lx;ni;=1

X =

;=1

De retinut faptul ca media patratica este intotdeauna mai mare decat media aritmetica a acelorasi

termeni, indiferent de semnul pe care 1 1 au, deoarece prin ridicare la patrat toti termenii devin pozitivi, iar

patratul creste pe masura ce cresc valorile termenilor.

Media patratica sta la baza calculului abaterii medii patratice care este unul din cei mai utilizati

indicatori de variatie.

• MEDIA GEOMETRIC A

Spre deosebire de celelalte medii prezentate pana aici, care se bazeaza pe relatii de insumare intre

termenii seriei, media geometric! se bazeaza pe relatia de produs dintre ei.

X g = ~ ( ~ x ,unde I T este semnul produsului

in cazul unei serii de distributie de frecvente, fiecare termen trebuie sa fie luat in functie de

frecventa sa.

k k

- ~ > IT n.X = 1=1 X. rg I

i=1

De retinut faptul ca media geometric! devine incalculabila daca eel putin un termen al seriei este

ega! cu zero sau negativ.

2 0

Page 21: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 21/43

 

CURS STATISTICA MTC-ANULIFR

Media geometrica se foloseste eel mai frecvent in cazul seriilor cronologice, la calculul mediilor

din marimile relative ale dinamicii, respectiv la determinarea indicelui mediu de dinamica,

In cazul seriilor de distributie de frecvente, media geometrica se foloseste mai rar. Este recomandabil

sa se foloseasca acest tip de medie atunci cand seria prezinta variatii foarte mari intre termeni sau un

pronuntat caracter de asimetrie. Prin logaritmare, abaterile dintre termenii seriei se micsoreaza ~i se

obtine un grad mai mare de concentrare a frecventelor.

De asemenea, cand predomina valorile mai mici, folosind media geometrica, Iise acorda acestorao mai mare importanta, media geometries fiind mai mica decat media aritmetica a acelorasi termeni.

Intre mediile prezentate exista urmatoarea relatie de ordine:

s. <Xg < xa =.in conc1uzie la calculul nivelului mediu al unei repartitii unidimensionale se foloseste pentru

masurarea nivelului mediu media aritmetica ~i complementar celelalte tipuri de medii prezentate, daca

seria prezinta anumite particularitati, sau in scopul aprofundarii analizei.

2.2. Valori medii de pozitie sau de structuraPentru completarea analizei seriilor de distributie este necesar s a se calculeze anumite valori medii

de pozitie sau medii de structura, care s a evidentieze ~i forma de repartitie a frecventelor. Dintre acestea,

mediana ~imodul sunt eel mai frecvent utilizate, fiind considerate tot ca indicatori ai tendintei centrale.• MEDIANA (ME) reprezinta valoarea central a a unei serii statistice, ordonate crescator sau

descrescator, care imparte termenii seriei in dona parti egale.

Indiferent de tipul seriei (simpla sau cu frecvente) la calculul medianei se cer rezolvate doua aspecte:

- aflarea locului medianei

- calculul valorii medianei

in cazul seriilor simple locul medianei se afla dupa relatia: Iocul Me = n + 1 unde n reprezinta2

numarul termenilor seriei.

Determinarea medianei necesita ordonarea prealabila crescatoare sau descrescatoare a termenilor

seriei.

Daca numarul termenilor este impar (n=2p+l), mediana este termenul de rang p+ I (valoarea

termenului central).

Daca numarul termenilor este par, adica n=2p, orice valoare cuprinsa intre tennenul de rang p sitermenul de rang p+1poate fi considerata ca 0 mediana, deci mediana se gaseste intr-un interval de

valori.

Daca date le sunt grupate pe intervale (c1ase) de valori ele i~i pierd individualitatea ~i la

determinarea medianei trebuie s a se tina seama de relatiile dintre grupele de valori ~ifrecventele acestora.Detenninarea valorii se poate realiza in dona moduri:

~ prin calcul algebric;

~ prin calcul grafic.Calculul algebric al medianei presupune utilizarea urmatoarei formule de caleul:

"Ln i +1 m-I

_ ; _ i = . . . : . . . I_ - L ni

2Me=xo

+h> . . . : . . . i = _ : . I _

unde:Xo - limita inferioara a intervalului median (primul interval a carui frecventa cumulata este

k

L n i +1mai mare sau egala eu . ; ,; : ;= : : .. .1 _ _

2h - marimea intervalului median;m - indexul intervalului median;

21

Page 22: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 22/43

 

CURS STATISTICA MTC - ANUL I FR

.,-}

Ln; - frecventa cumulata a intervalului care precede intervalul median;;=1

n m - frecventa absoluta a intervalului median.

Calcuiui grafic al medianei se poate realiza indow moduri:1. Se traseaza poligonul frecventelor cumulate crescator ~i descrescator, Din punctul de intersectie al

celor dow curbe se traseaza perpendiculara pe axa absciselor ~ise citeste valoarea medianei pe Ox (vezifig.6.1.); Me=32,375 milioane lei.2. Se traseaza numai poligonul frecventelor cumulate crescator, De pe axa ordonatelor din punctulcorespunzator locului medianei (in cazul nostru 100,5) se duce 0paralela la Ox ce tntalneste poligonul inpunctul m. Din acest punct se coboara perpendiculara pe Ox ~ise obtine astfel valoarea medianei.

CIIIadIII II"IIk ........

200

175

150

lZ5

100

75

50

2 5

o +-~~-+--~--._~~-+~~~

Figura .1

c...... lf IIIIk ... eeael

200

175

15 0

lZ 5

100

75

SO

2 S

0

2 0

M«Figura .2

Mentionam in continuare cateva proprietati ale medianei. Mediana depinde de locul valorilor inserie, nu de marimea acestor valori. In felul aeesta ea nu este supusa influentei asa-ziselor valoriaberante (anormal de mari sau anormal de mici) care sunt lasate in afara seriei prin deschidereaintervalelor marginale.

Din punct de vedere grafic precizam ca verticala corespunzand medianei imparte histograma serieiin doua patti de aceeasi suprafata, deoarece ariile coloanelor care constituie histograma sunt prin

definitie proportionate ca tnaltime cu frecventele absolute corespunzatore, iar ca baze cu marimeaintervalului de grupare.

Daca sistematizarea datelor s-a facut pe intervale neegale, calculele privind locul ~i valoareamedianei se fae dupa aceleasi ipoteze si formule.

Mediana are 0 larga aplicabilitate in practica: la studiul mortalitatii, la determinarea duratei mediide viata. etc fiind alaturi de media aritmetica ~ide mod, principalii indicatori ai tendintei centrale.

Cand seria empiric! analizata prezinta 0 tendinta de repartitie normal! (simetrica), mediana poates a inlocuiasca valoarea medie, fiind mai usor de calculat.

Cu cat seria este mai apropiata de distributia normala, cu ata1abaterea dintre media aritrnetica ~imediana este mai mica, deci proprietatea de compensare a abaterilor falii de medie se realizeaza ~i incazul medianei, doar pentru 0 serle perfect simetrica, Se poate aprecia ca mediana este un indicatorsemnificativ al tendintei centrale daca se obtine 0 minimizare a abaterilor tuturor termenilor de lamediana, adica:

2 2

Page 23: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 23/43

 

CURS STATISTICA MTC - ANUL I FR

It

L(Xi - M e ) =min, pentru datele negrupate,

k

L( X I - M e } o t i = min , pentru datele grupate.i~1

• MODAl (MODUL, DOMINANT A)Modul (Mo) este valoarea cea mai frecvent intalnita, motiv pentru care mai este cunoscut inliteratura de specialitate ~i sub denumirea de dominanta seriei.

Pentru serii simple (date negupate) modul se calculeaza daca intrunim 0 valoare a variabilei carese repeta de mai multe ori.

Astfel, in seria (4,5,6,6, 7, 7, 8,8,8,9,9, 10),valoarea 8 apare eelmai frecvent; modul este deciMo=8.

Modul se poate calcula cu certitudine pentru orice serie de distributie de frecventa, indiferent demodul ei de prezentare (pe variante sau pe intervale de variatie),

tvtodul se poate ca1cula fie pe cale algebrica fie prin metoda grafica.Incazul unei serii de distributie pe variante modul este usor de reperat. In tabelul statistic in care

este prezentata seria pe variante analizata, modul este varianta Xi corespunzatoare frecventei maxime.

Determinarea grafica a modului presupune utilizarea diagramei prin bastoane. In acest caz Mo

este acea valoare de pe abscisa care are ordonata maxima ~i corespunde frecventei ace lei marimi (vezifig. 3).

Ii3.5

3

2.5

2

1.5

0.5

o A

Figura 4Daca seria prezinta doua frecvente maxime identice alaturate se defineste un interval modal (vezi

fig. 5.4) tara a putea preciza valoarea exacta a modului.

' I

4 5 6 7 8 9 10

I I A

8

7

6

5

"3

: +-+-1+-+-+--4--1---'~'f--+ X J-1 2 3 " S 6 7 8 9

'n&lIfYllmndil Figura 5.

Pentru 0 serle de distributie pe intervale egale valoarea modului trebuie calculata, Intervalul modalse consider! intervalul care are frecventa cea mai mare.

In seria prezentata pentru calculul medianei intervalul modal este cuprins intre 32-36 milioane leiprofit, deoarece aiei frecventa este maxima (60). Cu aceste precizari se poate proceda la calculul algebricsi grafic.

a) Calculul algebric al modului se bazeaza pe relatia:

2 Mod sau moda vine de la termenul franpizesc "la mode" cu sensul de mod!

23

Page 24: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 24/43

 

CURS STATISTICA MTC - ANUL I FR

AMo = Xo +h J incare:

A J +A 2

Xo - reprezinta limita inferioara a intervalului modal;h -marimea intervalului modal;A l - diferenta dintre frecventa intervalului modal ~ia celui precedent

A2 - diferenta dintre frecventa intervalului modal ~ia celui urmatorb) Pe grafic, valoarea modala se poate determina ~i cu ajutorul histogramei fermata dindreptunghiurile corespunzatoare fiecarei grupe (clase) de valori..

Se procedeaza astfel: se construieste histograma (vezi figura 6.5). Din intersectia segmentelor dedreapta care unesc vlirfurile superioare ale dreptunghiului aferent modului cu frecventele de incidenta aleacestuia eu dreptunghiurile adiacente, se coboara 0 perpendiculars pe abscisa, Punctul gasit indicavaloarea modului. De pe grafic rezulta 0valoare apropiata de eea obtinuta prin caleul algebric

»............... fl;~1a.pa

......... pnfl&ullll(IMI.1t1)

60

: :i 50

: : ! 4030

10

10

o

Mn

A Figura 6.C) In cazul distributiilor moderat asimetrice Mo se mai poate determina ~ipornind de la conditia

care trebuie s a fie indeplinitAin acest caz:x-Mo=3(x-Me)

Mo=3Me-2x

In cazul prezentat prin utilizarea acestei relatii de calcul se obtine:De preeizat faptul ca modul este 0valoare foarte instabila, Simpla deplasare eu cateva unitAti(deci

reluarea gruparii) poate sa modifice sensibil valoarea modului.Daca seria prezinta dona sau mai multe frecvente maxime nealaturate ~i nu ne aparat egale,

spunem ca seria este bimodal a . , trimodala etc.Mediana ~i modul se exprima in aceleasi unitati de masura ea ~i variabilele pentru care se

determina ~i prezinta avantajul ca valoarea lor nu se modifica daea se inehid in mod conventionalintervalele desehise.

Cu toate inconvenientele, modul are 0 larga aplicabilitate practica (mai ales in comert) si stAlabaza calculului ~iinterpretarii gradului de asimetrie a repartitiei.

Modul prezinta avantajul ca se poate stabili ~i pentru 0 variabila calitativa. De exemplu, inanalizele de marketing se poate stabili culoarea eea mai frecvent solicitata la articolele de tmbracamintesau incaltmninte.

La seriile eu un grad mare de variatie, unde pot aparea ~imai multe valori modale este necesar sase separe seria pe serii componente ~is a se calculeze ~ivalori medii partiale pe zone de variatie.

Folosirea modului se impune atunci cand 0 valoare domina elar seria de distributie fata.de toatecelelalte valori ~ideci poate fi substituita celorlalte dow valori ale tendintei centrale (media ~ivaloareamedians) tara sa se produca abateri semnificative.

in acelasi timp utilizarea modului trebuie s a se faca cu prudentaIn c azul in care frecventele se distribuie relativ uniform, valoarea modala este doar mai frecventa

decat celelalte valori ale seriei. Daca celelalte valori sunt ins8. aproape tot asa de freevente ca valoareamodala, s-ar putea ca 0valoare sa devina dominanta din intfunplare, ~iea s-ar deplasa, daca intervalele degrupare s-ar schimba. Deci, modul este semnificativ ea valoare tipica, numai daca 0 valoare domina inseria de distributie,

2 4

Page 25: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 25/43

 

CURS STATISTICA MTC - ANUL I FR

Pentru seriile cu un pronuntat 'laracter de asimetrie, valoarea dominanta nu are sens sa fie folositapentru a caracteriza tendinta centrala, Inacest caz, se recomanda st\ se foloseasca grupari combinate cares a separe colectivitatea inregistrata pe mai multe grupe de variatie, apartinand unor structuri diferite.

Pentru seriile de distributie cu tendinta pronuntata de asimetrie, caracterizate printr-o amplitudinemare a variatiei, se calculeaza ~i alp indicatori de pozitie cum sunt: cuartilele, decilele, centilele,percentile Ie etc.

CuartiJele sunt acele valori ale caracteristicii, care separa seria in patru parti egale:

• cuartila inferioara, notata cu QI. este mai mare sau egala de 25% din termenii seriei ~i mai

mica sau egala de 75% dintre ei;

• cuartila a doua Q2 coincide cu Me ~i separa seria in doua parti egale ca efectiv;

• cuartila superioara Q3 este mai mare sau egala de 75% din numarul termenilor ~imai mica

sau egala de 25% din numarul lor.Analog cu mediana pentru cuartile obtinem:

Locul cuartilei

1loe Q J = -(Ln; +1)

4

Valoarea cuartilei

Q2=Me

3/OCQ3 = -CLnj + 1)

4

3-ts».+1)- z »4 \.£..J I P0

Q3 =xo+h~------

in care:

• r.npQl ~i r.npQ3 reprezinta suma frecventelor intervalelor precedente locului pe care-l

ocupa Ql ~iQ3

• nQ! ~inQ3 reprezinta frecventele intervalelor care contin cuartilele respective.

In cazul in care se calculeaza decilele, seria se divide in zece parti egale folosind in acest scop

noua decile.

25

Page 26: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 26/43

 

CURS STATISTICA MTC - ANUL I FR

Tema 6. INDICATORII DE VARIATIE

1. Indicatorii simpli ai variatiei

2. Indicatorii sintetici ai variatfel

3. Asimetria

intr-o colectivitate statistic! valorile individuale (variantele) difera mai mult sau mai putin unelefat! de altele. Ele pot fi mai apropiate sau m ai imprastiate. De aceea, comparatia se face, in principal, cumedia aritmetica, considerata ca fiind valoarea cea mai reprezentativa pentru colectivitatea studiata, Decele mai multe ori este important de cunoscut cat de departe sunt valorile variantelor seriei fata deaceasta medie, sau cu alte cuvinte care este dispersia variantelor in cadrul seriei sau campul de variatie acaracteristicii inregistrate.

• in scopuri speciale, sau pentru completarea analizei variatiei se poate folosi 0 alta valoare a tendintei

centrale (mediana, mediala, modul), sau pe zone de variatiei mediile de structura (centilele, decile Ie).Indicatorii variatiei pot fi calculati ca indicatori simpli ~ica indicatori sintetici.

1. Indieatorii simpli ai variatieiIndicatorii simpli ai variatiei servesc pentru a caracteriza gradul de imprastiere a unitatilor

purtatoare ale caracteristicilor inregistrate. Ei se calculeaza pentru a masura amplitudinea variatiei siabaterile valorilor individuale de la media lor. Acesti indicatori se pot exprima atat in marimi absolute -folosind aceleasi unitati de mdsur! ca ~ipentru caracteristica studiata - cat ~i in marirni relative. calculatein raport cu valoarea medie.

Din aceasta grupa a indicatorilor simpli fac parte:

• amplitudinea variatiei (absoluta si relativa)

• abaterile individuale (absolute ~irelative).

Amplitudinea absoluti (Aa) se calculeaza ca diferenta intre nivelul maxim (xmax) ~i nivelul minim( X m i P l ) al caracteristicii:

Aa=xmax-xmiPlAmplitudinea absoluta se exprima in unitatile de masura ale variabilei respective si prin urmare

nu poate fi folosita Ia compararea a doua variabile exprimate in unitati de masura diferite.

Amplitudinea relativi a variatiei ( A% ) se exprima de regula in procente si se calculeaza ca raportintre amplitudinea absoluta a variatiei ~inivelul mediu al caracteristicii:

A . ; . = ~ ·100x

Abaterile individuale absolute (dJ se calculeaza ca diferenta intre fiecare variant! inregistrata ~imedia aritmetica a acestora dupa relatia:

d .=X. - X i = 1,nI I

Abaterile individuale relative (di'YJ se calculeaza raportand abaterile absolute Ia nivelul mediu alcaracteristicii :

d. = dj .100 = Xj -x .100 i= l,n% _ _

X x

Amt gradul cat s i forma de variatie a unei caracteristici depind insa de toate abaterile variantelorinregistrate ~ide frecventa lor de aparitie ~iprin urmare indicatorii simpli ai variatiei nu pot exprima decatun aspect al variatiei unei caracteristici inregistrate. Din acest motiv caracterizarea gradului de variatie seface in special cu ajutorul indicatorilor sintetici ai variatiei care iau in consideratie toate abaterilecaracteristicii.

2. Indieatorii sintetici ai variatiei

Indicatorii sintetici ai variatiei, Ia fel ca indicatorii tendintei centrale. trebuie s a se bazeze pe toateobservatiile, sa fie usor de inteles, usor de calculat, cat mai putin posibil afectati de fluctuatiile de selectie~iadecvati unui studiu algebric.

Indicatorii sintetici ai variatiei sunt:

26

Page 27: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 27/43

 

CURS STATISTICA MTC-ANULIFR

• abaterea medie liniara (d),

• abaterea medie patratica sau abaterea standard (er),

• dispersia (u2)

• coefieientul de variatie (v).

Abaterea medie liniari (ii) se calculeaza ea medie aritmetica simpla sau ponderata a abaterilor

termenilor seriei de la media lor, luate invaloare absoluta.

Formulele de ealeul ale abaterii medii liniare sunt:n

L lx i - x l• pentru 0 serie simpli: d = . . . . : . i _ ; = I : . . . . _ _ _

n

": L l x ; -X~i• pentru 0 serie de freeveate absolute: d = . . .: . :i = : .. = . .. 1 - - , -- -

"L n i

i-I

• pentru 0 serie cu freeveate relative, exprimate in procente:

kL I X i - i l n \ 0 / 0d = . . . . ; . i = _ I _

100

- k I ;;I~.• pentru 0 serie cu freevente relative, exprimate sub formi de coeflelenti; d = L Xi - XI";

i=/

Abaterea medie liniara se exprima in unitatile de masura ale variabilei ~i deei nu poate fi folositala comparatii.

Abaterea medie liniara prezinta ~i dezavantajul ell nu tine seama de faptul ca abaterile mai marl invaloare absoluta maresc semnificativ gradul de variatie a unei caracteristiei, in comparatie cu abaterilemai mici. in plus, din punct de vedere algebrie nu este indicat s a se renunte, in mod arbitrar, la semnul

valorilor din care se calculeaza 0 valoare medie. Din aceste eonsiderente se foloseste ea principalindicator sintetic al variatiei abaterea medie patratica,

Abaterea medie pitratici, abaterea tip sau abaterea standard (0") se calculeaza ca medie

patratica a abaterile tuturor variantelor seriei de 1amedia lor aritmetica.

Relatiile de calcul ale abaterii medii patratice sunt:

• pentru 0serie simp I!:1-----

r e x ; _X)lU= , : . = 1 = : : . . . . ' _ _ -

n

• pentru 0serie de frecvente absolute:

" - 1L (Xi

-x) njU= 1.;./=-=-1_,- __

" n /1m/

• pentru 0 serle eu frecvente relative. exprimate in procente:

k _ 1

L (X j -X ) ni%u= ~ i= . . . . : . I _ _

100

• pentru 0 serie eu frecvente relative, exprimate sub forma de coeficienti:

k 2 •

C1 = 'L(xi-i)n i

i= 1

2 7

Page 28: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 28/43

 

CURS STATISTICA MTC - ANUL I FR

Indicatorul abatere medie patratica fiind calculat din patratul abaterilor este mai concludent deditabaterea medie Iiniara, Prin ridicarea la patrat se da 0 importanta mai mare abaterilor mai mari in valoareabsoluta, acestea influentand intr-o masura mai mare gradul de variatie al variabilei analizate. Din acestmotiv, calculati pentru aceeasi serle, cei doi indicatorl ve ri fi ca relat ia :

u>din literatura de specialitate se apreciaza eii pentru 0 serie de distributie cu tendinta clara de

normalitate, abaterea medie liniara este aproximativ egala eu 4/5 din valoarea abaterii medii patratice.Abaterea medie piitraticii este un indicator de baza, care se foloseste in analiza variatiei, la

estimarea erorilor de selectie, in calcule de corelatie.La feI ca abaterea medie liniara, abaterea medie patratica se exprima in unitatea de masura a

variabilei a carei variatie 0 caracterizeaza. Prin urmare cei doi indicatori nu se pot folosi pentrueompararea gradului de variatie a doua sau mai multe variabile diferite dar apartinand aceleasicolectivitati ~iin aceste situatii se recurge la un alt indicator de variatie - coeficientul de variatie,

Cand nu se precizeaza altfel, coeficientul de variape (v) se calculeaza ca raport intre abatereamedie patratica ~i nivelul mediu al serie, deoarece abaterea standard se foloseste freevent pentrumasurarea abaterii medii. Formula de calcul a coeficientului de variatie este:

v = (j ·100x

Daca s-a ealculat ~i abaterea medie liniara, coeficientul de variatie se mai poate calcula ~idupa

relatia: v' = ~ ·100x

Coeficientul de variatie se exprima, de regula, in procente, ceea ce inseamna ca el este de fapt

expresia relativa fie a lui if. fie a lui 0" ~i evident v'<v, De aceea se prefera a care conduce la un

coeficient de variatie mai mare.Cu cat nivelul lui v este mai apropiat de zero, cu amt variatia este mai redusa, colectivitatea este

mai omogena , media avand un grad ridieat de reprezentativitate; eu cat valoarea sa este mai departe dezero cu amt variatia este mai intensa, colectivitatea este mai eterogena, iar media are un nivel desemnificatie mai scazut. Se apreciaza ca, pentru fenomenele economiee ~isociale, in cazul unui coeficientde variatie de peste 35-40%, media nu mai este reprezentativa ~i datele trebuie sii fie separate in seriicomponente, pe grupe, in functie de variatia unei alte earacteristici de grupare. Deci se poate afirma caacest indicator (coeficientul de variatie) poate fi folosit ca un test de verificare in aplicarea metodeigruparii care are ea functie principala omogenizarea datelor dintr-o observare statistica,

Desi indicatorul - coeficientul de v ariatie - inlatura dezavantajele prezentate de 0" ~i d ~i acest

indicator are limitele lui. Astfel, a c e s t coefieient este inmod evident neadecvat in cazul in care media

aritmetica este apropiatA de zero sau cand valorile inregistrate sunt relativ egale lntre ele.Desi in literatura de specialitate coeficientul de variatie se calculeaza de cele mai multe ori prin

relatiile mentionate (media fiind indicatorul care respecta cele mai multe din conditiile impuse de Yule),acest indicator se poate ealcula ~iinlocuind media cu mediana, modul sau mediala.

0" dv = _l!!!.... ·100' v' = . . . . . l ! : ! ! . . . . ·100'

Me' Me'

0" dv = _ __ !t ! !! _ • 100' v'= MO·100'

Mo' Mo'Intr-o forma explicitii, pentru 0 serie de frecvente, vom avea pentru mediana:

t(Xi -MeY nj tlXi -Melnji~ k ~:.:..._lk---

Ln; Lnjv = - - = - - _ _ i - _ l ---.100 si v'= _ - - . . . . : . .; . . . i = : : , _ l --.100

Me Mein mod analog se pot serie ~ celelalte formule inlocuind mediana prin alt indicator al tendintei centrale.

Un alt indicator sintetie al variatlei, cu 0larga utilizare inanaliza statistica a fenomenelor, este dispersia

2 8

Page 29: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 29/43

 

CURS STATISTICA MTC - ANUL I FR

Dispenia (variants) unei caracteristici (0-2) se calculeaza ca medie aritmetica simpla sau

ponderata a patratelor abaterilor termenilor seriei fatA de media lor. Se mai numeste ~ipatratul mediu al

abaterilor termenilor fata de media lor. Formulele de calcul sunt:n

L(xj_i)2

• pentru 0 serle simpla: q2 = . . . ;. , . 1 - .. . : .. 1 - - -

nk _ 2

L (X j -x) » .• pentru 0 serie de frecvente absolute: (72 = .;_j~.:....1-k---

L n;1=1

k _ 2 •

L(X; -x) nj(O/o)

• pentru 0 serle cu frecvente relative, exprimate in procente: 0- 2 = . ; ; .. . 1 = .; ; . .. 1 - - - - -

100

• pentru 0 serie cu frecvente relative, exprimate sub forma de coeficienti: (J'2 = ± (x, - X ) 2 n·;; = 1

Inliteratura de specialitate, dispersia este cunoscuta ~isub denumirea de momentul centrat de ordinul doi.

Din relatiile de calcul prezentate anterior se observa ca abaterea medie patranca implica calculul

prealabil a 1 dispersiei, din care se extrage apo i r8dac ina pat rat ica, pentru a ajunge la acelasi grad cu caracteristica

a ca re i va riat ie se studia:zA (cr=.J;;2 ). Formulele de calcul ale dispersiei prezentate neeesita calcule laborioase

care pot fievitate daca t inem s eama de faptul c a dispersia reprezinta momentul centrat de ordinul doi,

Compensand cele doua formule de calcul ale dispersiei (eel obisnuit ~i eel prln dezvoltarea

binomului), se constata c a cea de a dona prezinta avantajul c! se face 0 simpla diferenta intre patratul

mediu ~i media la patrat, in timp ce pentru calculul obisnuit se calculeaza atatea abaterl cate valori

individuale are seria ~i in cazul unei medii care nu este un numar intreg ~i trebuie rotunjita, aceasta

rotunjire se regaseste in valoarea dispersiei.

Dispersia necesitand calcule destul de dificile (mai ales cand variabila are valori marl) in teoria ~i

practica statistic! se foloseste formula de ca1cul simplificat. Acest calcul simplificat se bazeaza pe unele

proprietati ale dispersiei.

3. Asimetria

Pentru caracterizarea seriilor de distributie unidimensionale ~iunimodale un interes deosebit ilprezintA

~icunoasterea gradului de oblicitate, de indepartare a acestor distributii de la simetrie. In practica statistic!

acest aspect este cunoscut sub numele de asimetrie. La interpretarea gradului de asimetrie se porneste de la

pozitia ~ivalorile pe care le au cei trei indicatori ai tendintei centrale: media, mediana ~imodulo

intr-o distributie simetrica cei trei indicatori: mod, medians ~i media artimetica se

confunda ca in diagrama din figura 6.6.

y y

x x

M =M =Xo e

Figura 6.6 Figura 6.7

29

Page 30: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 30/43

 

CURS STATISTICA MTC-ANULIFR

o distributie nonsimetrica se mai numeste ~i oblica ~i ea poate prezenta asimetrie de stanga sau de

dreapta (vezi figurile 6.7 ~i6.8).Forma repartitiei se poate analiza:

a) utilizand metoda grafica;

b) calculand indicatorii de asimetrie adecvati,

Asimetria se poate analiza in primul rand eu ajutorul metodei grafice. in acest scop se folosesc:poligonul frecventelor ~i histograma. Dupa ce s-a construit poligonul frecventelor interpretarea se face camai sus. Reprezentarea grafica a seriei ofera 0 imagine sugestiva asupra gradului de asimetrie tara tnsa a-Iputea masura printr-o valoare numerica. De aceea se calculeaza si indicatorii de asimetrie, exprimati in

marimi absolute ~i relative.Asimetriea absolutA se calculeaza dupa relatia:

As=x- MoSe exprima in unitatile de masura ale variabilei si nu poate fi folosit la comparatii intre serii.

De aceea pentru a masura gradul de asimetrie recurgem la indicatorii de asimetrie relativi. Din

acest grup retinem un anumit numar de coeficienti, adica numere tara dimensiune, permitand

comparatiile,

PrezentAm in continuare doi coeficienti de asimetrie ce poarta nwnele autorilor lor, Pearson ~iYule.

lcs =0 :::) simetrie

x-MoCas = Cas> 0 :::) serie oblica la stanga

aCas < 0 :::) serie oblica la dreapta

Acest coeficient poate lua valori cuprinse intre -1 ~i+1; cu cat este mai mic in valoare absoluta

cu amt asimetria este mai mica.

De retinut. Acest coeficient este recomandabil a se folosi numai pentru distributii usor asimetrice.

i l l cazul cand se cunoaste mediana seriei, coeficientul de asimetrie (C.:a) se poate calcula

utilizand relatia:

C' = 3(x- Me)as (j

Acest coeficient se foloseste cand intre cei trei indicatori ai tendintei centrale se verifica relatia:

Modul =Media - 3(Media - Medians)

Acest coeficient poate sa ia valori cuprinse intre -3 ~i+3 ~iva arata un grad mai mare de simetriecu cat se va apropia mai mult de O.

30

Page 31: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 31/43

 

CURS STATISTICA MTC • ANUL I FR

Tema 7. ANALIZA SERIILOR STATISTICE INTERDEPENDENTE

1 Notiunea de eerelatie Conditii de aplieare

2 Tipuri de legituri intre fenomenele seeial-ecenemiee

3 Metode de analizA a interdependeatei dintre fenomene

1. Nopunea de corelatie Condipi de aplicare

In domeniul fenomenelor ~i proceselor social-economice, iau nastere 0 serie de legaturi, de

interdependente, determinate de actiunea unor cauze ~i conditii diferite, care influenteaza mai mult sau

mai putin fenomenele existente.

Complexitatea fenomenelor economice ~i sociale, caracterizarea lor cantitativa ~i calitativa

determina folosirea combinata a diferitelor stiinte in investigarea relatiilor de cauzalitate, care stau la baza

aparitiei ~i dezvoltarii lor.

Printre metodele ~i modelele care s -au impus in studiul interdependentei cele care se folosesc eel

mai frecvent sunt corelatia ~i regresia statisticiUtilizarea acestor metode este justificata de necesitatea crescanda a reflectarii intr-o forma numerica

adecvata a interdependentei obiective dintre fenomenele social-economice in ceea ce priveste natura,

directia ~i gradul de intensitate a legaturilor, care se manifesta Intr-o anum ita perioada de timp sau in

dinamica.

2. Tipuri de legituri intre fenomenele social-economice

Formele de manifestare a relatiilor de interdependenta sunt extrem de variate ~i adesea destul de

greu de sesizat. Pentru a Ie studia este necesar sa fie c1asificate in functie de unele criterii, dupa care sepot deosebi unele de altele.

Dupa natura relatiei de cauzalitate, legaturile dintre fenomene pot fi legatur] functionale ~ilegituristatistice sau stohastice

1.Legalurile funcfionale sunt univoce, realizate direct intre un fenomen-cauza si un fenomen-efect.Deci, fenomenul-efect depinde de 0 singura cauza, care poate fi identificata de cate ori se produce, ceea

ce t ns eam na ca, daca conditiile mmful constante, atunci unei valori a caracteristicii factoriale Ii

corespunde 0 singura valoare a caracteristicii rezuItative. Ele se mai numesc ~i legaturi de tip determinist.Relatia matematica dintre fenomenul-efect ~i fenomenul-cauza, pentru legaturile de tip functional

(determinist) este: y;=f(xJ.

Ex Un exemplu de astfel de legiitura functionalii este aceea dintre nivelul productivitiuii muncii #consumul specific de timp de munca pentru produsul respectiv in cadrul unei perioade de timp. Se poate,

cu lqurinlii, demonstra ca, pe miisura ce scade timpul de producere a unei marfi, cu atd: creste

productivitatea muncii pentru produsul respectiv.

2. legatu,; statistice, denumite ~i legalur; stohastice, de tip nedeterminist descrise prin functia

matematica : Yi = f(x)j,x2i'''''Xk;) si se refera la fenomene complexe, influentate de mai multecauze, care se manifesta in conditii diferite ~i se pot c1asifica dupa mai multe criterii astfel:

) ; > - dupa numarul variabilelor inregistrate:

• legaturi simple (unifactoriale) cand se tnreglstreaza un singur factor;

• legaturi multiple (bifactoriale ~i multifactoriale) - mregistreaza eel putin doua variabile

factoriale.

) ; > - dupa contimaul variabilelor corelate:

• Iegaturi numerice denumite corelatii statistice - cdnd legiitura se stabileste intre variabile

cantitative

• legaturi incare eel putin 0 variabila este nenumerica , denumite asocieri statistice - cdnd

legarura se stabileste intre varia bile calitative

31

Page 32: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 32/43

 

CURS STATISTICA MTC - ANUL I FR

~ dupa directia legaturii:

• legaturi directe -pe mdsurd ce creste variabila factoriala creste si cea rezultativd.

• legaturi inverse -pe miisurd ce creste variabilafactoriala descreste cea rezultativa.

Ex. intre w # salariu exista 0 legi'itura directa de tipul unei corelatii statistice. Legatura dintre

calificare §i salariu este 0asociere statistica, pentru cd calificarea este 0variabila calitativa

) 0 > dupa functia analitica cu care pot fi exprimate corelatiile statistice:

• liniare - a care; linie de tendinla se mascara cu ecuatia functiei rectiliniare,• curbiliniare, cunoscute sub denumirea generica de legaturi neliniare - care pot fi de tipul

unei functii exponentiale, a functiilor hiperbolice si a functiilor de tip parabolic.

~ dupa timpul in care se produc:

• concomitente sau sincrone

• cu decalaj sau asincrone este acea in care dupa 0 anumitA modificare a factorului incepe sa

apara ~imodificarea efectului. in cadrul analizei in timp, a legaturilor, trebuie verificat daca,

exist! decalaj pfut! la inceperea corelatiei ~i necesitatea stabilirii perioadei de corel are a

seriilor dupa eliminarea deca1ajului.

Ex. lntre inzestrarea tehnica productivitatea poate sa apara legati; dupii un numar de ani necesari

procesului de asimilare sau dupi'i 0 anumitii perioadd un produs atinge performantele de calitate si poate

sa aparli la export.Interpretarea rezultatelor, verificarea ipotezelor, aplicarea testelor de semnificatie a functiilor ~i parametrilor

lor se face potrivit particularitatilor fenomenelor studiate infunctie de timp, loc ~iform! de organizare.

Daca datele provin dintr-un sondaj statistic trebuie sa se verifice reprezentativitatea ansarnblului ~is a se interpreteze probabilistic indicatorii calculati.

3. Metode de analiza a mterdependentei dintre fenomenePentru interpretarea legaturilor dintre fenomene se pot folosi metode de sistematizare ~iverificare a

legaturilor:

A. Metode parametrice simple ~ianalitice,

B. Metode neparametrice

A.I. METODE PARAMETRICE SIMPLEMetodele de sistematizare si verificare a corelatiei sunt:

a) seriile interdependente,

b) metoda tabelului de corelatiec) metoda gruparii,

d) metoda grafica,

e) metoda balantelor

a) Metoda seriilor interdependente pe baza unor analize eomplexe imprima cu stiintele care

studiaza acelasi domeniu s! Inregistram ~i sa inscriem in datele in functie de prima variabila factoriala.

Pentru aceasta se pot folosi serii cronologiee, teritoriale, distributii statistice referitoare la aceeasi

perioada de timp. Daca vrem s a analizam intr-o companie care este legata de numarul de ore lucrate si

salariu vom nota cu x numarul de ore lucrate ~i ell y salariu!.Daca exist! legAtura intre cele doua, si ea este directa, pe masura ce creste variabila factoriala,

descreste ~irezultativa,

b) Metoda tabelulu; de coreuuie care are la baza tabelul de corelatie, tabel cu dubla intrare

reprezent3nd 0 forma speciala a unei grupari combinate, in care separarea pe grupe a unitatilor se face

dupa variatia ambelor caracteristici - factoriala ~irezultativa,

Cu ajutorul tabelului de corelatie in functie de modul de distributie a frecventelor, in tabel se obtin

informatii ell privire la existenta ~i directia legaturii dintre cele doua variabile

In unele cazuri directia legaturii este data de pozitia diagonalei in jurul careia se grupeaza

frecventele: cand diagonala leaga unghiul stang de sus al tabelului cu unghiul drept de jos - legatura este

3 2

Page 33: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 33/43

 

CURS STATISTIC! MTC - ANUL I FR

directa, iar cAnd uneste unghiul stang de jos cu unghiul drept de sus, se apreciaza cA intre cele doua

camcteristici exist! 0 legatura in sens invers.

Valorile Variantele sau valorile Volumul

caracteristicii de camcteristicii dependente Y grupei

grupareX YI Y2 . . . IYi ... IYm

XI nl1 n12 . . . nlj .. . nlm n1.. . . . . . . . . ... .. . ... . . . . .Xi nil nil ... njj ... nim n'I.

. . . ... ... ... . . . .. . .. . . ..Xr I l r l 1lr2 .. . I1ri ... I 1 r m fir.

Total n.1 n.2 n' Omr •.. .J ...I;ni = I;n'ji-I j=1

Modul de asezare a frecventelor in jurul diagonalei ne da posibilitatea sA apreciem intensitatea

legaturii: concentrarea intensa a freeventelor in jurul diagonalelor indica existenta unei legaturi stninse intre

caracteristici. in alte cazuri, frecventele se grupeaza pe diverse curbe. Daca frecventele se repartizeaza pe

intregul tabel tam nici 0 regularitate, atunci ori nu exista Iegatura, ori aceasta este foarte slaba,

c) Metoda grupari; reprezinta un model de analiza prin excelenta calitativ, capabil sA surprinda

aspecte esentiale ale legaturilor dinte variabile. Studiul legaturilor se realizeaza dupa ee unitatile

colectivitatii se grupeaza in functie de earacteristica factoriala, iar pentru caracteristiea rezultativa se

calculeaza indicatorii derivati (marimile relative sau medii) specifici fiecarei grupe. Aceasta metoda de

studiere a legaturilor dintre fenomene necesita ealcularea mediilor conditionate ale variabilei rezultative

Y xj pentru grupele obtinute dupa variabila factoriala, Pe baza tabelului de corelatie se pot calcula

urmatoarele medii de grupa:

m

Ly·n .._ j= J IJ

Y i = m

Ln ..j=I IJ

d) Metoda grafici Graficul de corelatie denumit ~i corelograma sau graficul norului de punete,

pennite s a . identifice eu ajutorul ajustarii care este functia analitica corespunzatoare valorilor noastre.

Prin ajustare inlelegim inlocuirea valorilor empirice obtinute pentru 0 observatie statistica cu valori

teoretice calculate dupa un model statistic. in cazul in care am intocmit un grafic de corelatie putem face

o ajustare vizuala ~i dupa aceea aplicam modelul de calcuI ~i 0 ajustare numerica, Ajustarea vizuala

consta in trasarea unei linii drepte sau a unei curbe care sa treaca cdt mai aproape de valorile empirice

inscrise ingrafic.

Interpretand foram de legatura putem avea corelatii :

Legatura liniara directa Legatura liniara inversa

33

Page 34: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 34/43

 

CURS STATISTICA MTC - ANUL I FR

o 5 10 15

10

8

6

4

2

o20

Lipsa de legatura

Metoda grafica este utilizata eu bune rezultate pentru alegerea functiei analitice care se studiaza

(incazul regresiei §i corelatiei)

e) Metoda balanteler, Aceasta metoda serveste pentru analiza relatiilor care exista in cadru unui

proces stocastic incare se pot analiza relatiile de interdependenta dintre diferitele elemente ale procesului,

dintre diferitele laturi ale lui san dintre diferitele etape sau momente incare el se desfasoara,

A.2. METODE PARAMETRICE ANALITICE

Metode ,i procedee de analizi a legiturilor dintre fenomene

Analiza dispersionali

Analiza dispersionala este folosita pentru verificarea semnificatiei factorului de grupare ales (inainte

de aplicarea regresiei) si dupa aplicarea acesteia, pentru caleulul §i interpretarea rezultatelor obtinute in

urma aplicarii modelului de corelatie (validarea modelului ales pentru cazuri concrete.

• METODA REGRESIEIMetodele de studiere a legaturilor prezentate anterior au ea deficienta principala faptul cli desi

permit constatarea legaturii si caracterulul ei, nu 0 pot masura printr-un indicator sintetic. Acest

inconvenient este inlaturat prin utilizarea me todei r eg re si e:

Metoda regresiei constituie 0metoda statistica analities de eereetare a legaturii dintre variabile cu

ajutorul unor functii denumite functii de regresie.

Notand eu Y variabile dependenta si eu Xl. X2 .•• X n variabilele independente obtinem ecuatia de

regresie y = f (x.; X2 ••• X n ) .

Dupi ee am stabillt functia care devine functia de ajustare, trecem la misurarea corelariel cu

ajutorul metodei regresiei. Aceasti metodi presupune sa aiba inregistrate datele eu privire la eele

doua variabile una factoriali ,iuna rezultativi ,isi presupunem ca legatura dintre cele doui este

de forma unei ecuatu de tendinti, care descrie funcpa rectiliniari. Fiind yorba de legatura de tip

statistic care se supune legilor statistice, care acponeaza sub forma de tendinta cu caraeter de

medie, eeuatia Yx, = a + bx.,

in care:

Yx, - valoarea eeuatiei de regresiemedie;

Xi - variabila factoriala

Parametrul "a" reprezinta ordonata la origtne si arata la ce nivel ar fiajuns valoarea caraeteristieiiY daca toti factorii - mai putin eel inregistrat - ar fiavut 0actiune constants asupra formarii ei.

34

Page 35: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 35/43

 

CURS STATISTICA MTC - ANUL I FR

Parametrul ..b" se mai numeste ~i coeficient de regresie ~i reprezinta, in sens geometric, panta

liniei drepte. Coeficientul de regresie "b" arata cu cat se sch imba in medie variabila Yin cazul in care

variabila X se modifica cu 0 unitate. Acest parametru este pozitiv in cazul legaturii directe si negativ in

cazul legaturii inverse.

Parametrii "a" §i "b " se determina din sistemul de ecuatii normale obtinut prin metoda celor mai mici

patrate { L (Yi - Y x,)2 =minim).

Daca modelul ales este corelatia liniara simpla corespunde datelor empirice, atunci ecuatia de

regresie considera cii valorile teoretice obtinute prin celor mai rnici patrate sa prezinte abateri rninime.

{ I : l Y ; -(a+bx;)j2 =minim).

Parametri ecuatiei in acest caz se determina prin rezolvarea urmatorului sistem de ecuatii:

{na+b2:Xi = LYi

aL x; + bL x; =LX;Y i

Celelalte modele de functii sunt prezentate in "Statistica aplicata in economie" pag 66-693

• COEFICIENTUL DE CORELATIECoeficientul de c or ela tie lin ia ra s imp la poate sl ia valori intre -1 ~i+1.

lntre -1 ~i 0, legatura dintre eele doua variabile este de sens invers ~i este cu amt mai intensa, cu cat seapropie de -1.

Intte 0 ~i+1, legatura dintre cele doua variabile este directa si este cu amt mai intensa, eu cat se apropie

de 1.

Formu la de calcul simplificat pentru seria bidimensional! s impla

nLx;Y i -(L x j)(LY i)

r.: = ~[nL x; -{L xJ2].[nLy; _{Ly;)2]

Pentru verificarea semnificatiei eoefieientului de corelatie liniara simpla, se aplica, eel rnai frecvent,testul t:

t = I r y / x l · . I n - 2J l - r ; l x

unde, n reprezinta numarul de perechi de valori.

Valoarea calculata se compara eu eea tabelara stabilita probabilistic pentru un nivel de semnificatie

P = 1-a12 ~ieu n-2 grade de libertate.

3 Ace s t manual s tud en ti i ilvor a ve a intimpul o re lo r d e c ur s ~is em i na r in clu siv la e xame n.3 5

Page 36: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 36/43

 

CURS STATISTICA. MTC - ANUL I FR

Daca tcaknda: > ttabelar » se verifies ipoteza semnificatiei coeficientului de corelatie iar daca

tea/culal < t/abelar' legatura este nesemnificativa ~i trebuie cautat un alt factor esential cu care s! se studieze

corelatia,

RAPORTUL DE CORELATIE

in cazul in care dispunem de un numar mic de perechi de valori (Xi, yi), negrupate:• pornind de la devianta factorial! :

L (Yx, - y)2Rytx = ~ 2 sau

c: (Yi - y)

• pornind de la devianta reziduala :

R = 1_ L (y; - Yx)2

yl x L (Yi _ y)2

unde Yx reprezinta valorile ajustate indiferent de mode lui de regresie selectat.,

Raportul de corel ape poate lua valori de la zero la +1; interpretarea sensului legaturii se face dupa functia

de regresie.

Daca Ry / x = I r Y l x l se confirma ipoteza legaturii liniare si aceasta relatie este considerata un test de

verificare a legaturii,

in cazu1 unei serii bidimensionale avem abaterile:

abaterea dintre Y i ~i ecuatia de regresie;

abaterea dintre ecuatia de regresie ~imedie;

abaterea dintre Y i s i media lor

• CoeflCientul de determinape (R;, x ) :

u2

R2 =~.lOOy l x 2a

• Coeflcientul de nedeterminatie:

uKl =~.lOO

y/x 1

a

Interpretand cele doua dispersii putem avea doua variante:

Daca: R ; , : c > K ; , x r ezul ta l eg at ur a intre x ~iy

Daca: R : / x < K ; / x tendinta spre independent!

B. METODE NEPARAMETRICE

CoeflCientul de asociere

Aceasta metoda se utilizeaza pentru masurarea intensitatii legaturii a doua caracteristici alternative

prezentate intr-un tabel de asociere de forma:

y Yl Y2 Total

X

Xl a b a+b

X2 c d c+d

Total a+c b+d a+b+c+d

36

Page 37: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 37/43

 

CURS STATISTICA MTC - ANUL I FR

Produsul ad arata gradul de realizare a legaturii directe dintre X ~i Y, iar produsul be gradul delegatura inversa intre aceste doua caracteristici cercetate.

Pentru stabilirea valorii numerice a coeficientului de asociere, care sA indice existenta ~i

intensitatea unei Iegaturi, formula cea mai utilizata este cea propusa de Yule:

Q=ad-bc

ad+beAcest indicator poate sA ia valori intre -1 ~i+ 1, aratand nu numai gradul de intensitate al asocierii

celor doua caracteristici, dar ~i sensul ei.

• Coeflcienul de corelatie a rangurilor propus de Spearman pentru serii paralele tarA frecvente:

6'Ld}r =1- ---"7=----

$ n3-n

in care:

d, - reprezinta diferenta intre rangurile perechii de valori (Xi,Yi); dj=rxi- ryi

n - numarul de perechi de valori.

• Coeflcientul de corelalie a rangurilor propus de Kendall pentru serii paralele tarA frecvente:

rk = 2·S • unde S = 'L(P; -Q;)n·(n-l)

in care:

P i - numarul rangurilor mai mari care urmeaza rangului curent pentru variabila dependent! - Y

Qi - numarul rangurilor mai mici care urmeaza rangului curent pentru variabila dependent! - Y

37

Page 38: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 38/43

 

CURS STATISTICA MTC-ANULIFR

Tema 8. ANALIZA SERIILOR CRONOLOGICE

Una din sarcinile statisticii este aceea de a studia fenomenele ~iprocesele social-economice de masade-a lungul diferitelor perioade de timp sub aspectul evolutiei volumului acestora si al schimbarilorintervenite in structura lor, a interdependentelor dintre fenomene de natura diferita etc.

in munca de analiza concreta a dezvoltarii fenomenelor in timp, statistica foloseste ca instrumentprincipal de cercetare indicatorii obtinuti din prelucrarea statistica a seriilor cronologice. Calculul aeestorindicatori este precedat de elucidarea notiunii de "serie cronologica" ~i preeizarea particularitatilor acesteia.

Seria cronologica este fermata din doua siruri de date paralele, in care primul i~i arata variatiacaracteristicii de timp, iar eel de-al doilea sir variatia fenomenului sau caracteristicii cereetate, de la 0

unitate de timp la alta. Seriile cronologiee se mai numese si serii de timp sau serii ale dinamicii.La analiza seriilor cronologice trebuie avut in vedere unele proprietati ale acestora ~ianume:variabilitatea,

omogenitatea,

periodicitatea,

interdependenta termenilor prezentati.Variabilitatea tennenilor unei serii cronologice provine din faptul ca fiecare tennen se obtine prin

centralizarea unor date individuale diferite ca nivel de dezvoltare. Aceste diferentieri apar pe de 0parte eaurmare a actiunii factorilor intampUitori ~i pe de alta parte ca urmare a faptului ca in dinamica legilesociale si economice se manifests ca tendinta imprimand fenomenelor forme diferite de variatie, Cu catactiunea comuna a acestor factori este mai puternica eu atat variatia in cadrul seriei este mai mare ~itendintele de scurta si lunga durata mai greu de sesizat.

Avand in vedere aceasta trasatura, este necesar ca analizand 0 serie cronologica sa se masoare atatgradul ~i forma de influenta a factorilor esentiali, care imprima fenomenului 0 lege specifica de evolutie,cat ~i gradul de abatere de la aceasta tendinta generals rezultata din influenta faetorilor neesentiali, cucaracter intamplator.

Omogenitatea termenilor trebuie inteleasa in sensul ca in aceeasi serle nu pot fi inscrise decat

fenomene de acelasi gen, care sunt rezultatul actiunii acelorasi cauze esentiale, Asigurarea omogenitatiiobservatiilor de-a lunguI unei perloade de timp presupune mentinerea aceleiasi metodologii de calcul sievaluare a indicatorilor care urmeaza s a fie analizati in dinamica a criteriilor de clasificare a colectivitatiistudiate si nomenclatoarelor ~i lungimii intervalelor de grupare, mentinerea unitatii social-economice sauadministrativ teritorlale asupra careia s-au facut observatii, cat si a unitatii de masurare a timpului.Practic, inseamna ci de fiecare data, cand se analizeaza 0 serle statistica trebuie si se verifice daca dateleprovin din aceeasi sursa, are acelasi grad de cuprindere a unitatilor ~iau fost folosite aceleasi principii ~imetode de prelucrare, cu alte cuvinte este asigurata comparabilitatea datelor inscrise in aceeasi serie.o alta trasatunl caracteristica a seriilor cronologice 0constituieperiodicitatea termenilor din care este

fermata seria, ceea ce inseamna de fapt asigurarea continuitatii datelor din punet de vedere a variabilei detimp ~icare poate da posibilitatea interpretarii seriei cronologice ea0 functie analitica (yj=f(tj». Variabila de

timp poate fi inregistratli cu periodicitati diferite. De aceea, alegerea unitatii de timp la care se refera dateleunei serii cronologice trebuie tacuta in raport cu scopul cercetarii, al continutului ~i posibilitatilor demasurare a fiecarui indicator. De exemplu, productia industriala se poate urmari amt in unitati de timp mici(zilua, decada, luna) cat ~iinunitati marl de timp (trimestrul, semestrul, anul).

in cazurile cand unele earaeteristici sunt influentate in variatia lor de schimbare a anotimpurilor, eualte cuvinte apar fenomene cu caracter sezonier (lunar sau trimestrial) este obligatoriu sa se foloseasca 0

astfel de perlodizare a seriei.In studiul seriilor cronologice, se pune problema atat a alegerii unitatilor de timp la care se refera

fiecare indicator, cat ~ia lungimii etapei pentru care se prezinta datele, cu preeizarea anului de baza, Caan de baza se alege acel an care prezinta 0anumita semnificatie in evolutia fenomenului studiat.

38

Page 39: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 39/43

 

CURS STATISTICA MTC - ANUL I FR

Interdependenta termenilor unei serii cronologice apare ca urmare a respectarii principiului unitatiide timp si spatiu si structurii organizatorice. Ca atare, indicatorii prezenti sunt valori succesive aleacelorasi fenomene inregistrate la nivelul aceleiasi unitati teritorial administrative sau orice unitatestatistica complexa care poate fi inregistrata autonom. Aceasta face ca valoarea fiecarui indicator sadepinda Intr-o oarecare n m s u r a de valoarea indicatorului precedent, ca urmare a faptului ca relatiile decauzalitate se manifesta in conditii asemanatoare de la 0unitate de timp Laalta.

in prezentarea dinamica a fenomenelor se pot intalni mai multe feluri de serii. Clasificarea seriilor

cronologice se face in functie de modul de exprimare a indicatorilor ~i dupa modul de exprimare atimpului la care se refera datele.

in functie de modul de e xp rima re a ind ic ato ri lo r din care esteformata seria, seriile eronologice pot :fi:

1. serii cronologiceformate din indicator!absolu(i,

2. serii cronologice formate din indicatori relativi,

3. serii cronologice formate din indicatori mediL

1. Seriile cronologice formate din indicatori absoluti

Reprezinta forma de baza a serlilor dinamice. Pe baza lor se pot obtine indicatorii generalizatoripeintreagaperioada

Indicatorii de nivel sunt chiar termenii unei serii formate din indicatori absoluti ( Y J , . . . y« ... , Yt).

NweIullDtolk .at al termenilor ( t . v, ) ,numai pentru seriile de intervale de limp de marimi absolute.

Modijicarile absolute

• cu bazlijixo(AtJl):

AUI=Yt - YI, unde, t =2,n

• cu baza in lant (bazli mobile sau variabila) (At/t-l):

Aut- l=Y t - Y t- I, unde, t =2, n

2. Serii cronologice formate din indicatori relativi

Constituie un mod de prezentare de regula procentual. In aceasta situatie este obligatorlu ca in titlusau in afara tabelului sa se specifice care este baza de raportare, pentru ea interpretarea datelor s a se facacorect.

a) Indice de dinamica

cu baza flXjj (It /I): 1t/l = Yt sau 111 1(%) = E ! . . ·100 unde t =2.nYl YI

• cu baza in lant ( I t I t - I ) : 1111-1 =Lau lul_I(%) =L100 unde t = 2,nY,-I Y t-l

b) Ritmul de dinamica

• cu bazafixa (~ tJ :~/I =1'/1(%) -100'10 t = 2. n

• cu baza in lant ( RtJt-I ) :

R,'t-l =1t1t-1(%) -10CPIo t =2,n

3. Serii cronologice formate din indicatori medii

Se folosesc ea mijloc de prezentare a evolutiei unor caracteristiei ealitative ce apar sub forma decategorii medii: productivitatea muncii, randamentul mediu, recolta medie la ha, salariul mediu etc. Deasemenea, se folosesc astfel de serii si pentru unele earacteristici eantitative atunci cand ele trebuie

39

Page 40: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 40/43

 

CURS STATISTICA MTC-ANULIFR

incluse in analiza unor fenomene ce se produc in cadrul unui interval de timp, ca de exemplu: valoarea

medie anuala a fondurilor fixe, numarul mediu al personalului muncitor.

a) Nivelului mediu

• pentru 0 serle cronologica de intervale de timp formate din indicatori absoluti:. .L Y ,

y =.!=!._

n

• pentru 0 serie de momente cu intervale egale intre momente (media cronologica simpla ):

YI Y n2+ Y2 + Y3 +...+yj+...+ Yn-l +2

Yern-l

• pentru 0 serie de momente cu intervale neegale intre momente (media cronologica ponderatii):

( d , . ) ( d . . + d , _ J ( " ' - I + " ' ) ( d _ l)__ }'J 2 " +Y2 -2- + .. J 't 2 + · ·· + Y ..2

Y c r - ,;-1

L ' "b) ModiflCarea medie absoluta:

h. = ~ > ~ t l l - l sau ~=Y ..-y,

n-l n-l

c) Indicele mediu de dinamica(l):

-~au I= n« _!!...

Y t

Daca dispunem de mai multi indici medii ce caracterizeaza mai multe subperioade succesive de

timp, indicele mediu ce caracterizeaza intreaga perioada se calculeaza astfel:k

= L n : j "I I-I Inl I~ In; Ink= '·2 · · · · ·;· ..·/r.

in care:

I-ndicele mediu general de dinamica;

1 - indicii medii partiali de dinamica;n, - numarul indicilor eu baza in lant ce intra in componenta fiecarui indice mediu partial;

k - numarul subperioadelor, adica al indicilor medii partiali.

d) Ritmul mediu de dinamica

R = ( 1 ( % ) )-100%

Serii cronologice de intervale (perioade) de timp

Denumite si serii de fluxuri, sunt seriile statistice in care fiecare indicator reprezinta rezultatul

unui proces social-economic pe fiecare perioada de timp folosita in prezentarea datelor. Astfel de serii se

pot in1ilni in prezentarea evolutiei productiei, a cifrei de afaceri, a marimii investitiilor, a profitului

realizat, a creditului acordat si/sau rambursat etc. Ele se intocmesc pentru indicatori insumabili pe 0

anumita perioada de timp, care determina periodicitatea cu care se prezinta termenii seriei. Termenii

seriei de intervale pot fi cumulati obtinandu-se un indicator totalizator pe intreaga serie sau pe

subperioade.

40

Page 41: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 41/43

 

CURS STATISTICA MTC-ANULIFR

Serii eronologiee de momente (sau de stocuri)

Sunt acelea in care fiecare indicator caracterizeaza marimea la care a ajuns caracteristica urmarita

sau volumul colectivitatii in momentul de calcul. De exemplu, puterea instalata, exprimata in mii Kw , la

s~itu1 fiecarui an; populatia Romaniei, la 1 iulie a fiecarui an; valoarea capitalului fix al intreprinderii x

la s~itu1 anului; valoarea capitalului investit in industrie la sfarsitul fiecarui trimestru sau an; numarul

depunatorilor ~i depozitelor la sfarsitul fiecarei luni etc.

Pentru seria de elemente este caracteristic faptul ca termenii ei nu se pot cwnula in vederea

obtinerii unui indicator statistic totalizator cu continut real pe intreaga perioada, deoarece seria de

momente cuprinde inregistrari repetate. De exemplu, 0 parte din marfurile de la 1 I se pot gasi s i in

stocurile de la 1 II, 1 III etc. Deci, acesti termeni reprezinta marimi de stoc. Caracterizarea nivelului atins

pe intreaga perioada nu se poate face, in acest c az , d ec at pe baza unui indicator mediu.

Scopul analizei datelor unei scrii cronologice este acela de a caracteriza modul de dezvoltare a

fenomenelor sociale ~i economice pe 0 perioada expirata, in vederea extrapolarii datelor statistice pentru

fundamentarea diferitelor calcule de prognoza. Aceasta analiza statistica se realizeaza in mod diferentiat

in functie de felul seriei (de stocuri sau de fluxuri); de lungimea seriei ~i de periodicitatea cu care este

inregistrata variabila de timp. Cea mai cuprinzatoare analiza statistica se realizeaza pentru seriile

cronologice, in care variatia de timp este continua ~ipe grafic se poate descrie sub forma unei cronograme(historiograme) ~ica atare poate fi interpretata ca 0 functie analitica de timp.

Metode analitice de ajustare

Metodele analitice au la baza un model matematic, in care tendinta centrala a evolutiei se exprima ca 0

functie de timp:

Yi =f(tJ n um i ta fu nc tie de ajustare,

in care:

ti - reprezinta valorile variabilei independente (timpul);

Y ; - reprezinta valorile variabilei dependente (fenomenele) care sunt prezentate in seria cronologica,

Alegerea tipului de functie care se potriveste eel mai bine pentru exprimarea trendului se face pe baza

urmatoarelor criterii aplicabile optional:

• criteriul bazat pe reprezentarea grajicii. Se construieste cronograma ~i se apreciaza forma

tendintei de evolutie

• critertul diferentelor. Se procedeaza la calculul diferentelor absolute cu baza in lant de ordinul

unu, doi etc. p a n a cand obtinem diferentele de ordin i aproximativ eonstante ajustarea facandu-

se dupa polinomul de gradul i.

• Daca fenomenul cercetat s-a dezvoltat in progresie g eometric a, a dic a indicii eu baza in lant

sunt constanti ( 1 1 1 1 - 1 = constant), admitem ca seria cronologica respectiva prezinta 0 tendinta exponentiala.

in urma alegerii functiei de ajustare dupa criteriile prezentate se impune estimarea parametrilor acestor

functii utilizand metoda celor mai mici patrate. Aceasta metoda are ca functie obiectiv minimizarea sumei

patratelor abaterilor valorilor reale de Ia cele ajustate deci:

min L ( Y i - 1 ' ; , r ti= 1, 2, ... .n timpuI

Trend liniar: Yti = a + b Ii

in care:

Yti - reprezinta valorile ajustate calculate in functie de valorile caracteristicii faetoriale (Ii);

a - reprezinta parametrul care are sens de marime medie ~i arata ce nivel ar fi atins y daca influenta

tuturor factorilor cu exceptia celui inregistrat, ar fi fost constanta pe toata perioada;

b - reprezinta parametrul care sintetizeaza numai influenta caracteristicii factoriale (I):

t, - reprezinta valorile caracteristicii factoriale care, in cazul seriilor cronologice, este timpul.

41

Page 42: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 42/43

 

CURS STATISTICA MTC - ANUL I FR

Parametrii a si b se determina prin rezolvarea sistemului de ecuatii normale obtinut prin metoda celor

mai mici patrate (~::r'yj - (a +btJ)2 = min):

{

na+bLt; = L Y ;

aLt; +b~>: = ~>jyj

Pentru L t, =0, sistemul de ecuatii normale devine:

L Y ia=--

n

~t·Y·b=~ I I

Ltj2

{

na=L Y ;"2" de unde,b~tj = ~t,Y;

Variatia de timp trebuie centrata ~i pentru seriile impare se mascara in unitati iar pentru cele pare

injumlitliti de interval intre termenii serieiWocuind valorile calculate ale celor doi parametri in ecuatia de regresie ~i apoi inlocuind succesiv

valorile variabilei timp se obtin valorile ajustate ale caracteristicii rezultative.

Verificarea corectitudinii calcularii ecuatiilor de regresie se face pe baza relatiei L Ytt = L Y i

in care Yti = a + b . t,

Criterii de alegere a proeedeelor de ajnstare

a) Se calculeaza suma abaterilor, luate in valoare absoluta, dintre datele empirice si cele ajustate

I Y I - Y , I pentru toate procedeele de ajustare folosite. Se considera eel mai potrivit procedeul Ia

care se obtine L I Y t - 1 ' ; 1 =min.

b) se calculeaza coeficientul de variatie:

dV' = _ _ _ ! . ! _ ! _ • 100ylt -

Y

in care d y , t reprezinta abaterea medie liniara a valorilor reale de la valorile ajustate calculata

dupa formula:

nSezonalitatea este variatia produsa de influenta modificarii succesive a anotimpurilor

Metoda grafiei; se prezinta succesiv variatia de timp astfel tncat in cronogramA s a apara

tendintele de variatie pe luni, trimestre sau semestre dupa cum este alcatuita seria.

Metoda mediilor mobile; se calculeaza medii mobile provizorii sau definitive dupa numarul determeni - par sau impar - din care se calculeaza mediile ~i se face ajustarea seriei. Numarul mediilor

mobile este mai mic fatAde numarul termenilor seriilor

Se ajusteazA ~i se calculeaza mediile multi anuale lunare, trimestriale, sau semestriale calculate

din rapoartele dintre valorile ajustate ~i eele reale si se calculeaza indicii de sezonalitate ea raport intre

fiecare medie partial! ~i media generala,

Metoda analitiei difera numai prin faptul ca inainte de a caleula sezonalitatea se ajusteaza seria

de date impirice printr-o functie analitica care corespunde, eu tendinta obiectiva de dezvoltate in timp a

fenomenului.

42

Page 43: teorie statistica

5/13/2018 teorie statistica - slidepdf.com

http://slidepdf.com/reader/full/teorie-statistica 43/43

 

CURS STATISTICA MTC-ANULIFR

Extrapolarea seriilor cronologice

Extrapolarea datelor unei serii statistice are la baza metodele ~iprocedeele folosite la ajustare.

Pentru a face distinctie intre termenii ajustati (Yti) ~icei extrapolati - care sunt considerati tot termenii

teoretici - se vor nota termenii extrapolati cu r;;, iar variabila de timp cu t,'.Deci, formulele de calcul vor fi:

• pentru extrapolarea pe baza sporului mediu:A _

1 ' ; ' = YI +d{t -1)I

• pentru extrapolarea pe baza indicelui mediu de crestere:

1':' = y . / / - 1t, 1

Aceste formule se aplica atunci cand se folosesc valorile parametrilor ( l \ , I ) din perioada expirata, In cazul

cand acestia se modifica, formulele se modi fica cu un coeficient K, astfel:

Y , ; = Y o + t;l1 ' incare:l1t=k·l1

Y , ' = Yo . i'±t' in care: l'= ki

43