teorie statistica
-
Upload
alinutza-alina -
Category
Documents
-
view
492 -
download
2
Transcript of teorie statistica
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 1/43
CURS STATISTICA MTC - ANUL I FR
Tema 1.NOTIUNI INTRODUCTIVE
1. Scurt isturle al aparitiel ~idezvoltirii statisticii2. Obiectul ~imetoda statisti.:ii
3. Coneepte de bazi folositetn procesul de eereetare statistici
1. Seurt istori.: al aparitiei ,i dezvoltirii statisticii
Cuvantul statistic! are 0 semnificatie multipla pentru cercetatori, specialisti, studenti ~i populatie in
general, Pentru cei mai multi, statistica inseamna doar 0 "descriere numerica" a unor date culese despre
fenomenele de masa, De-a lungul istoriei, datele au fost permanent colectate. I n timpul civilizatiei egiptene,grecesti si romane datele erau obtinute inscopul primar al taxarii ~iinrolarii inarmata,
Astfel, in antichitate (cu 4-5 milenii i.e.n.) se intdlnesc forme de evidenta ce pot fi asimilate
lntelesului modem de recensaminte statistice, in special in China, Egipt, Grecia ~i in Imperiul Roman.
Recensamintele efectuate de romani (din 5 in 5 ani apoi din 10 in 10 ani) erau cunoscute sub denumirea
de "cens". in Dacia, ocupata de romani, evidentele care se faceau asupra populatiei, productiei ~i
consumului purtau denumirea de ''tabularium''.
Se dezvolta, de asemenea, evidenta cu caracter demografic. in Evul Mediu, institutiile bisericesti,strangeau adesea si pastrau informatii privind casatoriile, nasterile, decesele. Pe masura ce s-au format
statele civilizate statistica s-a diferentiat fata de formele de evidenta contabila.
Se poate afirma cit statistica a aparut in necesitatea de a cunoaste, in expresie numerica, 0 serie de
fenomene, procese si activitati social-economice.
Modul de gandire statistic ne impune sa acceptam ca datele sunt in mod inerent variabile.
Astfel gandirea statistica poate fi definita ca totalitatea ideilor orientate asupra cailor de intelegere,
control si reducere a variatiei.
inprocesul istoric de conturare a statisticii modeme pot fimai multe momente:
D statistica practica
D statistica descriptiva - care servea pentru descrierea aspectelor numerice ale populatiei si ale statului.
Parte a statisticii ce rezum1i datele empirice (intuitive, experimentale, practic, direct) privind
fenomenele de masa investigate.D aritmetica politica - inseamna elaborarea unor concepte in care societatea este privita in ansamblul ei.
Apar astfel notiuni de vaIoare medie ~i de tendinte, Cele mai multe studii in aceasta perioada, s-au
facut pentru demografie, privind miscarea populatiei, Astfel pe baza unui numar mare de date s-a
elaborat pentru prima data 0 regularitate cu privire la proportia dintre nasteri si decese, separat pentru
populatie feminina ~icea masculina,D caIculul probabilitatilor (statistica matematica) - se ocupa cu elaborarea unor notiuni si modele
valabile pentru orice domeniu din natura, societate sau tehnologie.
Statistica reprezinta arta si ~inta colectarii ~iintelegerii datelor ce caracterizeaza fenomenele de masa,
2. Obieetul $i metoda statisticii
Obiectul statisticii ilconstituie studiul fenomenelor si proceselor social-economice care prezintaurmatoarele particularitati:
./ Se produc mtr-un numar suficient de mare de cazuri (sunt fenomene de masa);
./ Variaza de la un element la aItul, de la caz la altul;
./ Sunt forme individuale de manifestare in timp, in spatiu ~i ca forma de organizare.
Rezulta deci c a obiectul de studiu al statisticii ilconstituie fenomenele de masa care prezinta proprietatea
de a fivariabile ca forma de manifestare individuals intimp, in spatiu si sub raport organizatoric.
Spre deosebire de fenomenele simple, fenomenele de masa se produe sub influenta unor factori
sistematici sau intamplatori, esentiali sau neesentiali, de acelasi sens sau de sensuri diferite si au la baza
legile de tip statistic. Pentru a cerceta si verifica 0 lege statistica este necesar sa fie anaIizate toate
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 2/43
CURS STATISTICA MTC - ANUL I FR
manifestarile individuale ale fenomenului supus cercetarii. In acest mod se creeaza conditiile necesarepentru manifestarea legii numerelor marl.
Legea numerelor mari este un principiu fundamental al cercetarii statistice care presupune luarea inconsiderare a unei colectivitati suficient de numeroase de cazuri individuale, astfel incat abateriletntamplatoare, intr-un sens sau altul, se poate compensa, punandu-se in evidenta 0 anumitamarime/valoare care este tipica pentru intreaga colectivitate.
Definitie. "Statistica este stiinta care studiaza aspectele cantitative ale determinarilor calitative alefenomenelor de masa, fenomene care sunt supuse actiunii legilor statistice care se manifesta in conditiiconcrete, varlabile in timp ~ispatiu, "
Fenomenele de ma sa se mai numesc s i :• fenomene de tip colectiv deoarece legea este valabila pentru intregul ansamblu ~i numai intamplator
se verifica in fiecare caz in parte,
• fenomene de tip statistic sau stohastic pentru ca ele se supun legilor statistice;• fenomene aleatoare pentru eli intre faetorii de influent! exista ~i0component! aleatoare,• fenomene atipice pentru ca forma lor de manifestare individuala este diferita;• fenomene nedeterministe ca urmare a faptului cli modul de asociere a faetorilor esentiali cu cei
neesentiali, a eelor sistematici cu eei aleatori se poate schimba in timp, in spatiu sau ca forma
organizationala,Principal a proprietate a aeestor fenomene este variabilitatea in timp, spatiu ~ica forma de organizare,
dar care potrivit legii numerelor marl ea se compenseaza reciproe fata de linia generala de tendinta (ceexprima esentialitatea fenomenelor legitatea lor de aparitie si dezvoltare).
Fenomenele de masa se intalnesc in toate comportamentele vietii economice ~i sociale s i ele nu pot fistudiate decat cu ajutorul metodelor statistice. Rezultatele cercetarii lor se regasesc in datele statisticepublicate de Institutul National de Statistic! in anuare, breviare si buletine statistice precum ~i in diferitestudii publieate in edituri si reviste de specialitate ~ide Organizatiile Intemationale,
Urmarind etapele oricarui proces de cunoastere, pentru rezolvarea problemelor care fac obiectul saude studiu, statistics, ca orice stiinta, si-a elaborat procedee ~imetode speciale de cercetare.
Metoda statisticii este fermata din totalitatea procedeelor si operatiilor specifiei de culegere,
prelucrare ~ianaliza statistica a fenomenelor din realitatea economica ~isocial! in cadrul carora activeazalegile statistice.Complexitatea ~i amploarea cercetarii statistice fac nece sara pe rfec ti ona rea continua a metodelor de
observare, prelucrare ~i analiza, Dezvoltarea metodelor statisticii este strans legata de progreseleinregistrate in teoria probabilitatilor, statistica matematica ~i in domeniul informaticii. Necesitateaprelucrarii unui volum mare de date a dus la dezvoltarea masinilor de calul si implicit la formareaprogramelor de calul. (Ex. EXCEL, Statistic, SPPS, SAS.)
3. Concepte de bazi folosite in preeesul de eercetare statistici
In statistica se folosesc 0 serie de notiuni (concepte) de baza eu care se opereaza in toate etapelecercetarii ~i in toate statisticile aplicate: Colectivitatea (popularia) statistica, Unitate statistica.
Caracteristici (variabile) statistice, Date ~i lndicatori statistici, Miisurarea statistica, Estlmare statistica,
Eroare statisticaa}0 prima notiune de baza din statistic! 0 reprezinta colectivitatea (denumita ~ipopu/a(ia) statistica carereprezinta totalitatea elementelor de a ce ea si n atu ra care formeaza obiectul unui studiu statistic.
Aceasta poate fi:Concreto (obiectiva ~i finita), delimitata in timp, spatiu si mod de organizare eu care opereaza Statisticasocial-economica;
in fi nit ii s i a b st ra ct ii , cu ca re opereaza Statistica matematica;ipotetica care corespunde unui model de calcul~ianaliza statistici1 in cadrul car ei a exi st a r el at ii ma t ema t ic e,
strict determinate,
Statistica abordeaza de asemenea:colectivitiifi stance- care expr ima 0stare, un nivella unmoment dat; (ex. Popdatta Brasovului la 1 dec. 2(03)
2
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 3/43
CURS STATISTICA MTC - ANUL I FR
colectivit4ti dinamice - care caracterizeazA un proces, 0devenire in timp.(e x. nasterile in Bucuresti in ac. luna)
Un alt concept
b) Unitatea statistica - reprezinta elementul constitutiv al unei colectivitati statistice.
Unitatile pot fi:Simple (Ex. persoana, muncitor etc) ¥ Complexe (Ex. famil ie, e ch ip a, s ee tie , a nu l de studiu...)
Ca ~i colectivitatile, unitatile pot fi statice ~i dinamice.
c) Caracteristicile statistice denumite val'iIlbilestatistice sau variabile aleatoare reprezinta proprietatile
comune ale unitatilor care formeaza 0colectivitate statistica,
In legatura cu acestea se folosesc urmatoarele notiuni:
./ Variabilii -care este orice caracteristica statistica numerica sau nenumerica care se inregistreaza;
./ Variantii - este forma concreta pe care 0 variabila statistica 0 poate inregistra la nivelul fiecarei
unitati prin cuvinte sau expresie numerica
./ Variatie - proprietatea variabilelor statistice de a-si schimba nivelul de dezvoltare sau forma
concreta de manifestare .
./ camp de variatie (camp de imprastiere) a unitatilor unei colectivitati in functie de fiecare variabila
inregistrata, Pentru variabilele numerice acest camp se mascara prin amplitudinea variatiei, care este
egala cu diferenta dintre valoarea maxima ~i valoarea minima inregistrate .
./ Frecventa - reprezinta numarul de unitati la care se inregistreaza aceeasi varianta
./ Ponderea este locul pe care-I ocupa 0variantll sau un interval de variante in cadrul colectivitatii studiate
Variabilele statistice se pot clasifica:
• dupa continut in:Cl Variabile de timp - arata apartenenta unitatilor la un moment sau perioada de timp
Cl Variabile de spatiu - situarea in teritoriu al unitatii,
o Variabile atributive - sunt toate celelalte insusiri numerice ~icalitative ale unitatilor,
• dupa modul de exprimare in:o caracteristici calitative (exprimate prin cuvinte) Ex. profesia
Cl caracteristici cantitative (exprimate numeric) Ex. Varsta
• dupa natura variatiei se impart in:
Cl Variatie continua - ex. VarstaCl Variatie discontinua sau discrete Ex. Valoarea capitalului fix
• dupa modul de manifestare in:Cl alternative - manifestare directa sau opusa ei (Ex Rural Urban)
c nealternative - cu variante distincte numerice sau calitative (Ex Salariu si profesia)
• dupa modul de obtinere ~ifolosire a datelor ele pot fi:
o primare obtinute inprocesul de culegerea datelor (Numarul de carti din biblioteca )
o derivate - obtinute prin aplicarea unui model de calul statistic (Ex. 90 % din carti au fot citite)
d) Datele ~i indicatori statistici reprezinta caracterizari numerice ale unitatilor obtinute prin observare ~i
prelucrare. in statistica datele sunt intotdeauna marimi concrete. Mesajul datelor il reprezinta
lnformatl« statistica.
• dupa modul de utilizare a datelor ele pot fi:o primare - obtinute in procesul de observare
o derivate - obtinute prin prelucrare
o parte din datele statistice se regasesc sub forma de indicatori statistici. Deosebirea consta, ca datele
statistice sunt notiuni generalizatoare, in timp ce indicatorii sunt particularizati pe domenii.
e) Masurare statistica - presupune exprimarea in unitati concrete de masura,
f) Estimare statistica - presupune ~icaracterizare statistica utilizand un model sau 0ipoteza statistics.
g) Prin Eroare statisticii - intelegem abaterile care pot s A apara intre dimensiunea reala a fenomenelor
studiate ~i cele stabilite printr-un model de calcul statistic Ele sunt admise intr-o proportie de ± 5%.
Acestea sunt reglate prin proprietatile legii numerelor mari si sunt calculabile, in general, cu ajutorul
functiilor de probabilitate, elaborate de statistica matematica,
3
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 4/43
CURS STATISTICA MTC - ANUL I FR
Tema 2. ORGANIZAREA CERCETARII STATISTICE
1. Etapele cercetArii statistlee2. Observarea statisticA (culegerea datelor statistiee)3. Metode de observare statisticA
4. Conceptul de eroare in statistici. Controlul datelor statistice.
1. Etapele cercetArii statistice
Cercetarea statistica este un proces complex care antreneaza un numar mare de specialisti
statisticieni, infonnaticieni ~ide alte profesii. Organizarea si desfasurarea unei cercetari statistice concrete
se prezenta astfel:
OBSERVAREA PRELUCRAREA ANALIZA SI INTERPRET AREA
STATISTICA STATISTICA f---t' SATlSTICA
Deli cercetarea statisticli se desjllsoarli in trei etape succesive ea reprezintli un proces unital'
prin con(inutul, scopulSi prin metodele utilizate. in cadru' cercetlirii statistice rolul eel mai importantii revine analizei statistlce Ea trebuie sli asigure nu numai 0 lnterpretare stiintiflCa a rezuhatelorcercetarii, dar mal ales obpnerea unu; material documental' real.
Procesul de cercetare statistica se poate realiza in conditii optime folosind echipamente modeme
de ca1cul. Acesta prezinta un dublu avantaj:
se pot culege date pentru un numar suficient de mare de caracteristici;
reduce timpul de prelucrare a datelor culese.
Pe plan national statistica poate fi structurata in statistica oficiala ~iin statistica academicaDe cele m ai multe ori ordinea de elaborare a programului de cercetare este invers procesului de
cercetare. intai se stabileste ce anume se va analiza ~i in ce scop, apoi metodele de prelucrare si in ultimulrand se aleg caracteristicilece trebuie inregistrate ~i forma de observare. Indiferent de ordinea in care se
elaboreaza programul acesta se subordoneaza obiectului ~i scopului cercetarii,
2. Observarea (culegerea) datelor statistice.in toate cazurile, in care se organizeaza un studiu statistic, este necesar st1se in ceapa cu observarea
(culegerea datelor). In acest scop. este necesar st1se stabileasca, in primul rand, sursele de date, metoda de
observare ~ist \ se inregistreze datele care vor fi supuse ulterior prelucrarii.
Prin unna re , observareastatisticli este et s pa in ca re s e inregistreazt\ datele primare in mod u nita r cu privire
la unele caracteristici inprealabil stabilite, de la unitatile care formeaza obiectul supus studiului statistic.
Observarea trebuie st \ indeplineasca anumite conditii de cantitate (volum) ~icalitate.Principiile organizlirii Ii desfolurlirii observari; statistice sunt:
; 0 . . autenticitatea (veridicitatea) datelor culese;
)- completitudinea datelor;
)- confidentialitatea datelor inregistrate;
)- asigurarea credibilitatii datelor;
Din punct de vedere alplanul observlirii statistice acesta trebuie sa cuprinda:)- Obiectul si scopul observarii; - se stabileste odata cu programul intregii cercetari. Acesta
trebuie st1 fie strict precizat deoarece este necesar st1 alegem numai acele variabile care
raspund direct cu scopul cercetarii
)- Timpul observarii (la care se refera datele) ~i timpul inregistrarii;
)- Locul observarii;
)- Programul observarii;
4
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 5/43
CURS STATISTICA MTC-ANULIFR
» Formularele ~i instructiunile de completare trebuie sa fie tapizate;
» Masuri organizatorice.
» Unitatea simpla si/sau unitatea complexa de observare;
» Unitatea raportoare;
3. Metode de observare statistici
in procesul de dezvoltare al statistici s-au conturat mai multe metode de observare. In generalmetoda de observare a fost ~i este dependenta de modul de organizare !iiifunctionare a sistemului
informational statistic.
Existenta mai multor metode de observare, face posibila clasificarea lor in functie de mai
multe criterii astfel:
-/ In functie de gradul de cuprindere a numarului de unitati avem:
observare totala
observare partiala
-/ in functie de modul in care este caracterizat fenomenul:
Observari statice (la un moment dat)
Observari dinamice (in timp)
-/ in functie de modului de organizare :Observari cu caracter permanent
Observlirispeciale
-/ Din punct de vedere al timpului de efectuare se pot intAlni:
Observliricurente
Observari periodice
Ob se rv ar i u nic e
Principalele metode de observare sunt:
1) Recensamlintul;2) Rapoartele statistice;
3) Sondajul statistic;4) Ancheta statistica;5) Observare«par(ii principale;6) MonografUl.
1) Recensamlintul- este 0metoda de observare totala, cu caracter periodic, care surprinde un fenomen
in mod static.
Este cea mai veche metoda de observare statistica, aparuta inca din antichitate (recensaminte ale
populatiei a romani care se efectua din 5 in 5 ani).
Acesta in general reprezinta fotografierea fenomenelor la un moment dat.
Recensamdnrul populatiei este "un proces de culegere, prelucrare !iii publicare a datelor
demografice economice !iiisociale la un moment specificat". Aceste date ofera informatii despre toate
persoanele din lara respectiva sau de pe un teritoriu delimitat.La noi in t a r a acesta se efectueaza periodic din lOin 10 ani. (Periodicitatea mai mare sau mai mica
este in functie de mutatiile survenite sau de suportul fmanciar disponibil). Momentul critic este ales,
uzual, in timpul iernii evitandu-se vacantele, concediile, astfel ca populatia, in prealabil anuntata, s a fiesurprinsa, (in Romania 7 ianuarie 1992; 17 februarie 2002).
Din domeniul populatiei, recensamsntul s-a extins si asupra altor domenii: exista recensaminte asupra
unitatilor hoteliere, al locuintelor, al animalelor, al unitatilor din industrie, comert, transport agricultura
(prin urmare recensaminte economice).
2) Rapoartele statistice - sau sistemul darilor de seama se intocmesc la nivelul institutiilor !iiiagentilor
economici, fie publici sau privati Acestea sunt obligati (de statul de drept) ca in permanenta sa
furnizeze informatii privind activitatea desfasurata. Prin urmare in aceste dati de seama sunt inclusi
indicatori cu caracter economic social-cultural, juridic, de sanatate publica si invatamant.
5
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 6/43
CURS STATISTICA MTC - ANUL I FR
3) Sondajul statistic sau seleetia statistica este 0metoda partiala de observare, ~ia devenit una din cele
mai utilizate inprezent. Avantajele acestei cercetari sunt:
poate fi aplicabila in toate cazurile;
economii de resurse banesti;
un program de cercetare amplu
La baza sondajului s13.esantionul extras din colectivitatea totala, care trebuie sa indeplineasca
conditia de reprezentativitate. (Mai amplu vom analiza sondajul statistic in cea de a doua parte a
matertei).4) Ancheta statistica - este 0metoda de observare partials care consta in intervievarea unor persoane
deja stabilite. Acestea primesc un chestionar la care raspund benevol.
5) Observare« par(ii principale - observare partiala special organizata, care se aplica pentru
obtinerea informatiilor despre 0 colectivitate tmpartita pe grupe de importanta, Se inregistreaza
datele numai pentru grupele care au cea mai mare pondere.
6) Monografia - observare partiala care se realizeaza la 0 unitate complexa, Ex. Monografia unui
oras municipiu, intreprindere etc. 0 monografie ampla a fost intocmita de Dimitrie Cantemir in
"Descriptio Moldave". Aceasta lucrare trateaza aspecte istorice, politice, eeonomiee, eulturale,
demografice.
in cadrul oricarei metode se poate opera cu urmatoarele procedee de observare:» masurarea direeta
} ;> interogare
» autoinregistrare
;0 . preluare din alti purtatori de informatie} ;> corespondenta
;0 . telefon
Din datele inregistrat obtinem informatia statistica.
4. Conceptul de eroare in statistic!. Controlul datelor statistice.Eroarea statistica este diferenta dintre un indieatorul obtinut pe baza diferitelor calcule ~ivaloarea reala.
Practica a dovedit ca inmod curent se pot produce mai multefeluri de erori:» De observare sau inregistrare
» De reprezentativitate
;0 . De modelare;
;0 . De interpretare.
Toate acestea pot fi sistematice sau intfunplatoare
Pentru a inlatura sau minimiza aceste variatii se recurge la controlul datelor care poate fi:
» Cantitativ
» Calitativ
» Logic
» Aplicarea testelor de semnificatie pentru indicatorii calculati
} ;> Aplicarea metodelor de verificare a ipotezelor pentru validarea modelului ales.
Dupa ce s-au obtinut datele statistice acestea prezinta forme concrete, individuale de manifestare.
Si pentru a Ie utiliza inanaliza ~iinterpretare statistica este necesar procesul de prelucrare.
6
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 7/43
CURS STATISTICA MTC - ANUL I FR
Tema 3. PRELUCRAREA PRIMARA A DATELOR STATIST ICE ~I PREZENTAREA
INFORMATIILOR OBTINUTE.
1. Preluerarea statisticA2. Gruparea ~iclasificarea statistici.3. Prezentarea datelor sub forma de tabele, serii lJigraflee,
1. Prelucrarea statisticiPrelucrarea statistica - este un proces prin care datele inregistrate sunt sistematizate sunt tratate
statistic in vederea obtinerii sistemului de indicatori statistici. Obtinerea indicatorilor statistici este
necesara pentru caracterizarea in expresii numerice generalizatoare, a ceea ce este esential pentru un grup
de unitati sau pentru intreaga colectivitate, studiate inconditii de timp s i de spatiu,
Prelucrarea primara tnseamna in acelasi timp ~i centralizarea, sistematizarea ~i omogenizarea
datelor observarii in vederea aplicarii modelelor de calcul ~i analiza satistica
Sistematizarea datelor inregistrate presupune ordonarea acestora in functie de omogenitatea lor.
Deci la baza sistematizarii se afla principiul omogenitatii. (Ex. pentru formularea unei idei sau a
unei fraze de compliment - cuvintele trebuiesc alese (grupate), sau (clasificarea studentilor dupa notele
obtinute la examenul de statistica). Principiul omogenitipi este un principiu de pierdere a informapeipentru a clltiga informatie.
ins iIi sistematizarea se realizeazA prin :a) centralizarea ~ib) gruparea statistica a datelor.
a) centralizarea - presupune totalizarea unitatilor statistice sau a valorilor unei caracteristici la nivelul
grupelor tipice sau al colectivitatii observate. Totalizarea valorilor unei caracteristici se face prin
insumarea directa sau prln folosirea unor coeficienti de echivalenta (preturi, timpul de munca etc.)
In urma centralizarii obtinem mull doritii indicator; statistici de nivel (ex, nr. populatiei unei
localitati, valoarea productiei)
• Centraiizarea s;mpld si obtinerea indicatorilor (agregatelor) generali
Nr.crt. Variabile insumabile directal unitatii Xl X2 .. . Xp
1 Xli X21 ... xpJ
2 X}2 X22 .. . xpJ
... ... ... ... ...
1 Xli X2i .. . Xpi
... .. . ... ... ...n XJn X2n ... Xpn
Total n n n
LXIi LX2i
...LXpi
i=1 ;=1 i= 1
Pe orizontala se gaseste fiecare unitate cU toate variantele inregistrate la toate caracteristicile
(variabilele) inregistrate, iar pe verticals sunt distributiile de valori ale celor p varlabile independente
inregistrate.
2. Gruparea Ii clasificarea datelor statisticeGruparea statistici - este 0centralizare pe grupe a unitatilor unei colectivitatii. Se obtine in baza
aplicarii metodei gruparilor statistice presupunand principiul omogenitatii,
Omogenitatea statistica inseamna ca in grupa (c1asa) respectiva sA existe variatie minima intre
variantele inregistrate - variatie care poate fi explicata ca fiind influenta factorilor aleatori.
7
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 8/43
CURS STATISTICA MTC - ANUL I FR
In forma gruparii statistice - rezulta siruri de date ordonate dupa variatie, in sens crescator sau
descrescator, a caracteristicilor de grupare.
~ Dupa contimaul caracteristicii de grupare putem avea:
• grupari cronologice in cazul in care sistematizarea datelor se face dupa 0variabila de timp;
• grupari teritoriale cand sistematizarea datelor se face dupa 0variabila de spatiu;
• grupari atribuuve se folosesc pentru toate caracteristicile, in afara caracteristicilor de timp ~i
spatiu,
Caracteristicile atributive pot fi caracteristici cantitative (numeric e) ~icalitative (nenumerice).
~ Dupa numarul variabilelor de grupare pot fi: simple # combinate.Gruparile simple (dupii 0 singura variabila ) pot fi:
a) gruparea pe variante daca amplitudinea variatiei este mica ~i la nivelul unitatilor individuale s-
au inregistrat un num
b) gruparea pe intervale de variatie egale daca amplitudinea variatiei este moderata, in acest caz, e
necesar, s a se stabileasca aml d . arim . tervalul . d variatie,
A r mic de valori distincte (variante);
Durata sejurului (zile ) Nr. turist!
5 10
6 15
7 20
8 30
9 35
10 30
11 15
12 10
TOTAL 165
num egrupe s i m earn ill e
Grupe de studenti dupa Dr. Nr.de volume citite studenti
30- 50 50
50-70 8070-90 60
90-110 120
110-peste 130
Total 440
c) gruparea pe intervale de variatie neegale.Prin gruparea pe intervale neegale se urmareste s a sestructureze colectivitatea pe tipuri calitative, daca nu se cunosc valorile (pragurile) care separa
tipurile calitative, se procedeaza mai tnw la gruparea pe intervale egale ~i apoi se poate folosi
criteriul mediei pentru formarea tipurilor calitative "mic", "mediu", "mare". In acest caz se obtine
o grupare tipol . Aglc.
Grupe de studenti dupa nr. de ore Nr.aferente pree:atirii pentru examene studenti
Sub 30 4
30-40 5
40-60 6
60*85 10
85-120 12
120-150 7
150-200 4
200 peste 2
Total 50
8
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 9/43
CURS STATISTICA MTC-ANULIFR
Gruparea combinattJ presupune sistematizarea datelor dupa doua sau mai multe caracteristici de
grupare (eel mult 4) care pot fivariahile numerice si/sau calitative. Gruparea combinata impune stabilirea
ordinii de grupare pe baza relatiei de interdependent! dintre variabile. Grupele formate dupa prima
caracteristica se cea de a doua
Grupe dupa
ore lucrate
Clasificarea (gruparea pentru variabile calitative) (Fig. 3.5.) se efectueaza dupa variabile
nenumerice (calitative) ~i presupune inc1uderea in aceeasi grupa (clasa) a tuturor unitatilor la care s-a
inregistrat aceeasi forma de manifestare a caracteristicii. De regula, are un caracter oficial (ex. CAEN) ~i
inprealabil trebuie stabilit un nomenclator al claselor.
SEX Nr studenti
FEMININ 125
MASCULIN 200
Total 325
METODOLOGIA GRUPAluI
Gruparea pe intervale egale implica urmatoarele etape:
a) calculul amplitudinii absolute de variatiei (A) care exprima imprastierea maxima a valorilor serei.
A X a =Xmar - Xmin;
b) stabilirea in parametrii intr-un anumit numar de grupe (r) se poate stabili conform relatiei lui
Sturgers, r =i+3,3221og n
unde: n - nr. caracteristicilor.
c) determinarea marimii intervalului de grupare (h), se calculeaza ca raport intre amplitudinea absoluta a
variatiei ~inumarul de grope:
AX x -x·h = _Q sau h = max. mm
r 1+3,322 log n
Nota: Marimea intervalului (h) se rotunjeste la intreg in plus (ex.3,25~)
Prima grupa se porneste de la Xmin adaugandu-se succesiv marimea intervalului de grupare (h)
rezultat din calculul anterior. Valoarea din stanga intervalului va fi considerata ca limita inferioara, iar
valoarea din dreapta ca limita superioara. Valorile care formeaza limitele intervale lor se inregistreaza fienumai ca limita superioara fie ca Iimita inferioara pentru a evita inregistrari duble a caracteristicilor.
Indiferent de scopul ~iobiectul gruparii, aceasta trebuie sA indeplineasca eel putin urmatoarele conditii:
• completitudinea datelor;
• omogenitatea grupelor(claselor) ~i subgrupelor (subclaselor);
• unicitatea includerii unitiililor intr-o singura grupa (clasa);
• continuitatea variatiei grupe/or in cazul variabilelor numerice, ceea ce practic Inseamna sa
nu existe grope cu frecvente nule care ar duce la intreruperea gruparii,
Pentru analiza structurii colectivitatii pe grope tipice se foloseste gruparea pe intervale neegale.
Gruparea pe intervale neegale presupune regruparea intervalelor egale.
Un prim principiu al gruparii pe intervale neegale este trecerea de la variatia liniara (interval de
9
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 10/43
CURS STATISTICA MTC ~ANUL I FR
marime constanta) la variatia neuniforma a unor intervale de grupare din ce in ce mai mario De exemplu,
de la 8 grope se poate trece la 5,3 grope obtinand calificative
Clasijicarea se efectueaza dupa variabile nenumerice (calitative) ~i are, de regula. un caracter
oficial (ex. CAEN) ~i in prea1abil trebuie stabilit un nomenclator al claselor.
3. PREZENTAREA DATELOR STATISTICERezultatul sistematizarii necesita 0 prezentare sub 0 forma cat mai comod de manevrat ~i
vizualizat, sub forma de :
a) serii,
b) tabele
c) grafice.
a) Seriile statlstiee
Enumerarea datelor statistice intr-o anumita ordine se numest« serie statisticii. Seria statistica se
reprezintA ca doua siruri de date. Primul sir este criteriul de enumerare (valori , variante) al doilea sir
confine datele numerice.
Seriile statistice sunt de urmatoarele feluri
1. Serii de repartitie sau de distributie2. Serii cronologice (ale dinamicii )sau serii de timp.
3. Serii teritoriale san de spatiu,
4. Serii descriptive sau enumerative (lista candidatilor admisi, facultatea, media de liceu , media
examenelor, scoala absolvita etc.)
5. Serii unidimensionale ~imultidimensionale
La riindullor seriile statistice pot fi atAtnumerice (cantitative) cat ~inenumerice (calitative).
b) Tabele statistice. Prezentarea datelor sub forma unui tabel statistic permite atAt0buna vizualizare cat
~imai ales, efectuarea diverselor calcule in procesul de preluerare a datelor.
Pot fi tabele eu 0 singura intrare ~i cu doua sau mai multe intrari, tabele de lucru ~i de prezentare a
rezultatelor.inelaborarea unui tabel se identifica urmatoarele elemente ~i reguli prineipale:
./ titlul tabelului
./ macheta tabelului
./ subiectul tabelului - colectivitatea ~icomponentele ei
./ predicatul tabelului - constituie variantele ~i indicatorii cu care caracterizam statistic colectivitatea
studiata .
./ Unitatea de masura
./ Sursa datelor (sub tabel)
./ Numerotarea tabelelor (sus)
c) Reprezentiri grafice - Cu ajutorul graficitor se vizualizeaza informatiile statistice facilitandperceperea pe ansamblu a datelor, aspecte privind: variatia valorilor observate, repartitia lor, legaturile
existente intre ele, a evolutiei valorilor in timp s.a,Graficul trebuie sii cuprinda:
./ Titlul- (precizandu-se ~ilimitele fenomenului)
./ Legenda
./ Sistemul axelor reetingulare (ox, oy, oz)
Prineipalele tipuri de grafice sunt: grafice de volum, grafice de structura, grafice prin benzi, grafice prin
coloane simple sau in aflux, cronograma (historiograma) pe scam uniforma sau logaritmica, diagrama
polar! (radiala), histograms, poligonul frecventelor, curba cumulative a frecventelor, graficullui Lorentz,
eartograma, cartodiagrama.
1 0
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 11/43
CURS STATISTICA MTC - ANUL I FR
Tema 4. MARIMILE RELATIVE
1. Noliune. Detinipe.
2. Tipuri de mirimi relative
1. Notiune. Def"milie.Indicatorii relativi se obtin prin aplicarea unui model de comparatie sub forma de raport. Deei prin
mirimi relative intelegem rezultatul raportirii a doi indicatori absolup.
Indicatorul din numaratorul raportului se numeste indicatorul raportat, iar eel din numitor, indicatorul
baza de raportate. Alegerea bazei raportate se face in functie de scopul compararii,
Marimile relative se pot exprima prin coeficienti, %, promile, prodecimile cat si procentimile.
Ex. Natalitatea = nr..n8scuti vii ... 1000 (5 nascuti la 1000 persoane); nr medici/or cenr mediu al populatiei
revine la 10.000 locuitori . Mai rar se intiilnesc exprimarii in procentimile, adica cat unitcl/i dinindicatorul raportat revin la 100.000 unitap baza de raportare.
Alegerea fonnei de exprimare se face astfel incat marimile relative sa fie sugestive. Dar forma cea
mai obisnuita de exprlmare a lor este cea a procentelor care arata cate unitati din indicatorul raportat revin
la 100 unitati ale indicatorului baza de raportare.
Forma de exprimare a marimilor relative se stabileste in raport cu gradul de variatie al
fenomenelor, a scopului urmarit, precum si particularitatile specifice fenomenului cercetat.
Pentru calculul unei marimi relative, trebuie respectate 3 cerinte:
a) intre tennenii comparati trebuie s a existe 0legatura de conditionalitate sau de cauzalitate;
b) tennenii raportati sa fie cu adevarat comparabili din punctul de vedere al sferei de cuprindere, ca
metodologie de calcul etc;
c) baza de comparatie s a aiba 0anumita semnificatie in evolutia fenomenului studiat.
in cea mai mare parte marimile relative in satistica nu prezinta 0 dificultate de calcul. Cele mai multe
dificultati apar in comparatiile internationale, unde indicatorii provin din diferite surse sau sunt calculati
dupa metodologii diferite.
2. Tipuri de marimi relative
in principal se pot calcula urmatoarele tipuri de marimi relative:
a) de structura;
b) de coordonare (eorespondeata);
c) de intensitate
d) ale dinamicii;
e) ale planului (programArii).
a) mirimea relativA de structuri se poate calcula de fiecare data cand s-a aplicat metoda gruparii
prin unnare calculul lor este posibil atunci cand colectivitate este separata inde dona sau maimulte grupe. Este un raport dintre 0parte la intreg (total).
11
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 12/43
CURS STATISTICA MTC-ANULIFR
- daca se determina pentru frecventa fiecarei grupe se numesc ponder; iar daca se determina pentru valorilecentralizate ale diferitelor caracteristici se n ume sc g re ut iJ ,i s pe cif lC e care se obtin ca mar imi relative de s tr uc tu ra r apona nd
k k
f re cven ta f ie c it re i grupe (n;, J i ) la totalul frecventelor (L nj,L 1; )dupa relatia:i=1 ;=1
i=1
Frecventele relative permit analiza structurii unei serli de distributie in functie de una sau mai
multe variabile (caracterlstici) ~icompararea repartitiilor empirice cu cele teoretice.
Avand caracter de marimi relative se pot exprlma sub forma de coeficienti sau in procente si fiind
"eliberate" de aspectul concret al exprimarii unitatilor centralizate pe grupe devin comparabile pentru
orlce fel de serle ~imai ales cu probabilitatile din distributiile teoretice.
Proprieta(i: Specific marimile relative de structura este proprietatea de aditivitate. Fiind calculate
falii de aceeasi baza cu greutati specifice corespunzatoare se pot efectua operatii de adunare ~i scadere
Suma Marimile relative de structura este egala cu 1 sau 100 in functie de forma de expriroare
Reprezentarea gratica. Marimile relative de structura se reprezinta grafic prlntr-o diagrams de
structura care poate fi ilustrata prin:
cercul sau semicercul de structura;
dreptunghiul de structura;
patratul de structura,
b) mirimile relative de coordonare sau corespondent' caracterizeaza raportul numeric in care segiisesc doi indicatori cu acelllJi conpnut in spapi diferite coexistente in timp.Pentru 0 colectivitate impArtitii in dow grupe pentru care nivelul pe grupe al variabilei studiate
este XA ~iXB :
X A X BForma de prezentare ar fi: :KAIB:::: X sau KB1A:::: X ,unde: A ~iB unitati teritoriale.
B A
XA ~iXB nivelul colectivitatii de raportate din unitatea A respectiv BMarimi relative de coordonare se pot calcula si pomind de la frecvente:
nA nBKAIB =- sau KBIA =-
nB nA
De regula ei se exprima in coeficienti.
Daca sunt mai multe grupe, se alege una ca baza de comparatie ~i se raporteaza, pe rand,fiecare grupa la baza aleasa.
De regula raportul este valoarea cea mai mica, la eel mai mare, astfel putem obtineexprimarea lor in coeficienti supraunitari.
Aceste marimi se folosesc in studiul variatiei teritorlale ~i prin urmare au caracter de indici
teritoriali.
Reprezentarea grafted: Marimile relative coordonare. se reprezinta grafic prin:Benti sau coloane; stabilind in acest fel relatiile care exista intre diferltele pArti ale aceleiasi
colectivitati.
c) ale dinamieii - se ob(ine ca raport a doi indicatori al aceluilq; jenomen dar aflate tntre doua
momente /perioade diJerite.Pentru a studia in dinamica recurgem la serii cronologice.
in generale 0 serie statistica este fermata din 2 siruri de date in care I sir reprezinta criterlul de
sistematizare (factorul e grupare) al II -lea sir variabila dependenta de factorul de grupare
Analiza se face amt in baza fixii cat ~imobil! (in lant),
* Indicatorii relativi obtinuti prin raportare exprima indicele de variatie
1 2
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 13/43
CURS STATISTICA MTC - ANUL I FR
eu baza fixa K, 10 = Xt ·100X o
eu baza m o bila (in lant) K,IH=_ _ ! ! _ r _ ·100Xt_1
Putem calcula marimi relative ale dinamicii la nivelul ansamblului, daca variabila este aditivadirect:
Ele se exprima amt sub forma de coeficienti dar mai adesea sub forma % .
Rep re ze nta re a g ra flCa : Marimile relative d. se reprezinta grafic prin:
cronograme (histograme)
d) Mirimile relative ale programirii (planificirii)
Se calculeaza la nivelul unitatilor economice fiind necesar sa se elaboreze programe de
aprovizionare, productie §i desfacere pe termene scurte sau mai lungi.
Calculul marimilor relative ale planului presupune preluarea din evidentele unitatii economice
analizate a informatiilor referitoare la:
• nivelul fenomenului realizat inperioada de baza (xo);
• nivelul planificat (programat) in perioada curenta ( X p l )
• nivelul realizat in perioada curenta (Xl).
Din compararea sub forma de raport a celor trei indica tori rezulta:x ,
• co ejicien tul sarcinii de plan: k pliO = _ _ _ _ e _ x 100Xo
• coeficientul indeplinirii planului: k II pi = _!!_ x 100Xpi
• coejic ientul de dinam icii: kilo =.!!.. x 100X o
intre cei trei coeficienti exist! relatia:
• ks,« = kpJlo·kll pi
Interpretarea valorii marimilor relative ale planului ca si a ratei de depasire (nerealizare) se face inraport eu continutul economic al indieatorului (de crestere sau de reducere obiectiva a fenomenului).
Putem calcula marimi relative ale planului la nivel de ansamblu, pentru variabile insumabile
direct:
L X Ikl/pi = '"
~Xpl
De cele mai multe ori marimile relative de dinamica §i mArimile relative ale planului se exprima
procentual.
LXpl
• kpllO = "~XO
respeetiv
1 3
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 14/43
CURS STATISTICA MTC - ANUL I FR
e) Mirimile relative de intensitate se obtin prin raportarea a doi indicatori absoluti de natura diferita,da r care se afla intr-un raport de interdependenta,
Relatia de calcul este:
Y j
• la nivel partial: X = Z i
Aceste marimi se pot calcula pentru fiecare grupa de unitati inparte sau pentru Intreaga colectivitate.
L Y ;• la nivelul ansamblului: X i =L Z, sau
Ex: Densitatea populatiei (Joclknl,) Productivitatea muncii (Jei/munc).
Marimile relative de intensitate au numerose aplicatii in:
industrie ( coeficientul mecanizarii, automatizarii, utilizarii intensive etc.)
agriculture (coeficientul cnimizari, irigatiilor, recolta medie la ha);
turism (indicatorii eficientei activitatii de turism, productivitatea muncii etc)
demografice (coeficientul miscarii naturale, migratorii a populatiei)
Problema 1 Pentru Marimile relative de intensitate; de structura; de coordonare (corespondents);
Date privi d I ..I iuli fun . de locuitorirepartitia oraselor Romaniei a 1 I ie 2002 in ctie de numarul
Grupe dupi Numir orale Numir populapemirimea oraselor
Mici 67 474711
Mijlocii 101 1543080
Marl 35 1178523
total 203 3196314
Se cere:1. Cal ulul iill 'I 1 ' , 'bT afiin eaton or re ativi POSI I 1. Reprezentarea gn eft a rezu tatelor obtinute
Grupe dupa Structura % Numarul mediu de coordonare
mar imea oraselor locuitorilor loeuitori pe un oras oraselor locuitoril
oraselor (intensitate) or
Mici 33,00 14,85 7085 1,00 1,00
Mijlocii 49,75 48,28 15278 1,51 3,25
Marl 17,25 36,87 33672 0,52 2,48
total 100,00 100,00 15745
Problema 2. Mirimile relative ale planificirii - vezi curs 2
1 4
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 15/43
CURS STATISTICA MTC - ANUL I FR
Tema 5. ANALIZA SERIILOR DE REP ARTITIE (DISTRIBU'fIE) UNIDIMENSIONALE
1. Indicatori de nivel~ide freevente,
2. Indicatori ai tendiatei centrale ~iai mediilor de structuri (pozitle);
Rezultatul gruparii ~i clasificarii unitatilor colectivitatii observate in functie de caracteristiciatributive cantitative sau calitative se prezinta sub forma seriilor de repartitie (distributie) empirica, Ele se
mai numesc simplu repartitii sau distributii statistice.
Gruparile simple (dupa 0 singura caracteristica) conduc la serii statistice independente sau
unidimensionale, iar cele combinate la serii statistice conditionate sau multidimensionale.
La calculul ~i analiza indicatorilor (parametrilor) distributiilor empirice trebuie avute in vedere 0
serle de proprietati, care se pot intMni in toate cazurile, dar cu forme specifice fiecarei serii.
Principalele proprietati ale unei serii de repartitie sunt:
o variabilitatea,
o omogenitatea,
c independenta
o concentrarea sau dispersiaVariabilitatea termenilor unei serii statistice de repartitie este determinata de faptul ca fenomenele de
masa apar ca rezultat al actiunii combinate a mai multor cauze, unele cu caracter esential, altele cu
caracter intamplator, care se manifests, de regula, in conditii individuale diferite. Cu cat actiunea cauzelor
aleatoare este mai puternica, cu atilt variabilitatea termenilor este mai mare iar gradul de omogenitate este
mai mic.
Omogenitatea termenilor unei serii de repartitie se explica prin faptul cit toate valorile au acelasi
continut, depinzand de acelasi factor esential,
Daca in urm.a analizei statistice se constata ca seria nu prezinta omogenitate, se trage concluzia ca
aceasta colectivitate este fermata din mai muIte tipuri calitative ~i deci, seria respectiva trebuie separata in
doua sau mai multe serii componente. Se vor folosi ~i in acest scop indicatori medii de variatie ~i
asimetrie partiali ~itotali (vor ji prezenttui in subcapitolele urmlitoare).Independenla termenilor unei serli de repartitie de frecvente provine din faptul ca fiecare valoare
individuala se mregistreaza pentru 0 unitate statistica care reprezinta un element distinct ~i obiectiv al
unei colectivitati statistice. Aceasta independenta este relativa deoarece unitatile statistice apartinand
aceleiasi colectivitati se supun acelorasi legi care se manifesta sub forma de tendinta, FatA de aceasta
tendinta exista abateri intr-un sens sau altul, care pentru un numar mare de cazuri, se compenseaza
reciproc. De aceea, este necesar ca prin metode statistice corespunzatoare, sAse aile trasaturile esentiale ~i
comune care leaga aceste valori individuale relativ independente, dar care apartin aceleasi structuri
calitative ~i care in statistics este cunoscuta sub denumirea de .Jegea de repartitie a seriei ".
Concentrarea sau dispers;a fatA de una sau mai multe valori ale seriei apare ca rezultat al
intensitatii cu care influenteaza cauzele (esentiale ~i intamplatoare) la nivelul fiecarei unitati ~i care prin
centralizare se determina frecventele de aparitie.De cele mai multe ori, intensitatea factorilor de influenta este diferita ~i atunci frecventele de
aparitie se concentreaza fie catre un singur capat al seriei (caz in care pe grafic se descriu repartitii in
forma de Ifn), fie catre valoarea centrala a seriei (caz in care pe grafic se descrie 0 repartitie normal A
(simetrica) , fie catre ambele capete ale seriei (caz in care pe grafic se obtine 0 repartitie in forma de "a",
Multitudinea situatiilor intalnite in practica demonstreaza necesitatea caracterizarii tendintelor de
concentrare/diversificare a valorilor unei serii de repartitie de frecvente cu ajutorul unor metode statistice
specifice. Aceste metode conduc la obtinerea uneia sau a mai multor valori reprezentative, fie pentru
intreaga serie, fie pe intervale de variatie a valorilor individuale.
Sistemul de indicatori al unei repartitii empirice este format din:
1 Legea normal! a repartitiei este numita ~icurba normal! Gauss-Laplace ~igraficul ei "clopotullui Gauss".
15
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 16/43
CURS STATISTIC..\. MTC - ANUL I FR
1. indicatori de nivelli de frecveme,2. indicatori ai tendin(ei centrale Ii ai mediilor de structurii (poutie);3. indicatori de varia(ie;4. indicaton de asimetrie;5. indicatori de concentrare:
Acesti indica tori se pot stabili in intregime pentru seriile de variabile eantitative (numeriee). in cazuleelor eu variabile ealitative, numarul indicatorilor calculati este mai restrans. In continuare acesti
indieatori se vor prezenta pe exemplul seriilor de variabile numerice si in masura in care ei se pot aplica ~i
pentru seriile de variabile calitative vor fimentionati separat.
1. Indicatori de nivel ,ide freevente ai seriilor de reparntie
Caracterizarea statistic! a unui fenomen de mas! intr-o colectivitate statistica presupune luarea in
consideratie a13t a valorilor individuale cat ~i a frecventelor de aparitie a acestora.
Indicatorii de nivel ai seriei pot fi exprimati in cazul variabilelor numerice prin variante in cazulgruparii pe variante. in cazul intervalelor de variatie se utilizeaza ca indicator de nivel centrul (mijlocul)
intervalului de grupare.
in grupa indicatorilor de frecventa deosebim: frecvente absolute, frecvente relative ~i frecventecumulate.
Frecventele absolute notate in unele lucrari cu "ft sau lin; II in altele, reprezinta numarul de unitati
care corespunde grupelor de unitati (variante sau intervale de valori) obtinut ca rezultat al centralizarii
statistice. Frecventele absolute se exprima in unitati concrete (numar de salariati, numar de agenti
comerciali, numar de unitati turistice, etc.). Frecventele absolute stau la baza calculului frecventelor
relative.
Frecventele relative permit analiza structurii unei serii de distributie in functie de una sau mai
multe variabile (caracteristici) ~icompararea repartitiilor empirice cu cele teoretice.
Frecventele relative notate cu "f/ "san " ni· "denumite ~i ponderi, greutati specifice sau
probabilitati de aparitie se obtin ca marimi relative de structura raportand frecventa fiecarei grupe (n;, J i )k k
la totalul frecventelor (L ni,L J ; ) dupa relatia:;=1 i=1
r * J; *100:;(%) ::::;-k-- ,
IJ;;=1 i=1
Avand caracter de marimi relative se pot exprima sub forma de coeficienti sau in procente
In cercetarea statistica calculul frecventelor relative prezinta interes la detenninarea altor
indicatori statistici ce permit aprofundarea analizei seriilor de repartitie sau cand ne intereseaza
structura seriei.
Frecventele cumulate se noteaza cu F; sau F', in functie de felul frecventelor incluse in calcul
(absolute sau relative). Cumularea se face succesiv pornind de la ambele capete ale seriei, obtinand astfel
pentru fiecare valoare a seriei frecvente cumulate crescator ~i descrescator
Frecventele cumulate sunt comparabile intre ele indiferent de felul de intervalului de grupare. De
asemenea ele stau la baza stabilirii medianei ~i a celorlalte medii de structura sau pozitie - indicatori care
vor fiprezentati intr-un subcapitol din acest capitol.
16
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 17/43
CURS STATISTICA MTC-ANULIFR
2. Indieaterf! tendiajel centrale
Analiza statistica a trasaturilor esentiale ale fenomenelor de masa, stabilirea tendintelor ce apar in
producerea lor necesita calcularea anumitor valori sintetice cu continut de valori tipice, care sa fie
reprezentative pentru intreaga serie studiata,
in functie de gradul de variabilitate a valorilor individuale, de sursele de date de care dispunem si
de nevoile de cunoastere, in teoria ~i practica statistica se utilizeaza ca principali indicatori ai tendintei
centrale:
2.1. miirimile medii;2.2. modul (dominanta) seriei
2.3.mediana;
2.1.Mirimile medii
Media in statistica reprezinta principalul indicator sintetic cu care se caracterizeaza un numar mare
de valori individuale diferite ca forme de manifestare dar avand acelasi continut,
in consecinta, marimile medii sunt utilizate ea instrumente principale de cunoastere a
fenomenelor de masa, deoarece numai pe baza lor se poate exprima ceea ce este comun ~i general in
forma de manifestare a acestor fenomene, in fiecare etapa data, prin eliminarea a ceea ee este intamplator
~ineesential inproducerea lor.Media sintetizeaza deci, Intr-o singura expresie numerica toate valorile individuale punand in
evidenta ceea ce este esential ~icomun tuturor unitatilor,De cele mai multe ori, valoarea mediei nu coincide eu nici una din valorile individuale din care s-a
calculat.
Pentru a asigura un continut cat mai real mediilor calculate este necesar ca valorile individuale din
care se calculeaza s a fie cat mai apropiate ca marime ceea ce corespunde conceptului de omogenitate
statistica, semnificand faptul ca exista 0 valoare in jurul careia se concentreaza cele mai multe valori
individuale.
Calculul mediei este recomandabil sa se bazeze pe folosirea unui numar mare de cazuri
individuale diferite sub care s-a inregistrat caracteristica, a carer variatie sa poata fi considerata ea
intamplatoare in raport cu intreaga masa de valori imegistrate.in cazurile in care nu dispunem de date dintr-o observare total a, care ar permite evidentierea
tuturor factorilor esentiali ~i intfunplatori care determina variatia caracteristicii studiate, se pot utiliza ~i
date provenite dintr-o observare partiala, in acest caz, mediile calculate pot fi considerate semnificative ~i
pentru intregul ansamblu numai daca esantionul indeplineste conditia de reprezentativitate.
Media este semnificativa numai in cazul unei colectivitati eu grad ridicat de omogenitate. in cazulin care colectivitatea este eterogena se va proceda la impartirea colectivitatii in grupe folosind si serii
conditionate pentru care se vor calcula mediile partiale corespunzatoare iar media pe total colectivitate va
fi in acelasi timp si 0 sinteza a mediilor de grupe.
Pentru ca marimea medie s a aiba un continut obiectiv, este necesar ca alegerea formei de calcul sa
se faca in functie de forma de variatie liide sursele de informatie cu privire la earacteristica studiata.
Inanaliza seriilor de repartitie de frecvente se pot calcula urmatoarele tipuri de medii:a media aritmetiei ( X a sau daei nu semai folose~te~ialti medie simpli X );
CI media armoniea (Xh );
a media pitratiea (X p );
C I media geometries ( X g ).
Fiecare poate fi calculata ca medie simpla ~i ca medie ponderata.
Mediile simple se folosesc in cazul datelor negrupate sau cand repartitiile au intervale cu frecvente
egale intre ele ~i deci se pot simplifica.
1 7
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 18/43
CURS STATISTICA MTC - ANUL I FR
Mediile ponderate se utilizeaza pentru repartitiile in care fiecarei valori a caracteristicii ise
ataseaza 0 frecventa care difera de la caz la caz.
In statistica social-economica , eel mai frecvent se foloseste media aritmetica,
2.t.I.Media aritmetici
Media aritmetica este rezultatul sintetizarii intr-o singura expresie numerica a tuturor nivelurilor
individuale observate, obtinuta prin raportarea valorii totalizate a caracteristicii la numarul total alunitatilor,
In sens statistic, media aritmetica calculata pentru colectivitate statistica este valoarea care s-ar fi
inregistrat daca toti factorii ar fi influentat in mod constant in toate cazurile inregistrate. in acest sens,
poate fi folosit in statistic! termenul de "speranta" matematica catre care tind valorile individuale ale
unei variabile statistice inregistrate intr-o observare empirica.
Media aritmetica simpla se calculeaza ca raport intre suma nivelurilor individuale sub care s-a
inregistrat caracteristica ~i numarul cazurilor individuale luate in observare. Media se poate calcula
raportand valoarea totalizata a caracteristicii la numarul total al unitatilor la care s-a facut centralizarea.
Se foloseste relatia:n
L X i- x -....!:L_a-
nunde:
Xi reprezinta nivelurile individuale ale variabilei;
n
L X i reprezinta nivelul centralizat al variabilei;i=l
n reprezinta numarul unitatilor observate.
Media aritmetica ponderatii cu frecvente absolute Intr-o colectivitate statistica se intalnesc foarte
rar cazuri in care numarul variantelor coincide cu numarul unitatilor. De regula, fenomenele de masa suntnwneroase ~i aceeasi valoare individual a (varianta) poate fi lntalnlta de mai multe ori. In acest caz, pentrua putea cuprinde in calcul toate valorile individuale trebuie sa se tina seama ~i de frecventa lor de aparitie
iar media se va calcula ca 0medie ponderata utilizand formula:k
L x i n ii " , 1
X ="";""";k:---
L n ;i " , 1
in care k reprezinta numarul de grupe deci k < n
Media aritmetica ponderata cu frecverue relativek k
L x i n i- L x ; n ;x = i=1 ..!.i=::;.:I,--_
k 100L n ;;=1
De retinut: Daca repartitia de frecvente se prezinta pe intervale de variatie, Xi reprezinta centrul de
interval corespunzator,
Media aritmetica are anumite proprietati care au utilitate practica pentru calculul ~i interpretarea
valorii ei.
18
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 19/43
CURS STATISTICA MTC-ANULIFR
Media este mai exact! cand 0 calculam direct din valorile sub care s-a inregistrat caracteristica.Este 0medie aproximativa cand 0 calculam pentru seriile pe intervale de variatie deoarece in acest cazdeterminarea ei se bazeaza pe ipoteza repartizarii uniforme a frecventelor in cadrul fiecarui interval ceeace, de regula nu corespunde realitatii,
2.1.2.Alte tipuri de medii utilizate in analiza seriilor de repartitie
Una din conditiile de aplicare a valorilor medii este aceea de a gasi criterii de alegere corecta atipului de medii folosit.
in general este recomandabil sa alegem media aritmetica atunci cand fenomenul supus cercetariiinregistreaza modificari aproximativ in progresia aritmetica,
in teoria ~ipractica statistica eel mai frecvent se foloseste media aritmetica,De aceea cand nu se precizeaza media folosita se presupune ca s-a calculat media aritmetica care
este considerat principalul parametru al tendintei centrale.Cand fenomenul Inregistreaza modificari in progresia aritmetica, sau intentionam sa dam 0
importanta mai mare tennenilor mai mici saumai mari ai seriei, calculam alte tipuri de medii ~ianume:
• media armonica ( X h )
• media geometrica (Xg ),
• media patratica (xp)
• MEDIA ARMONICA
Media armonica se defineste ca fiind egala cu valoarea inversa a mediei aritmetice calculata dinvalorile inverse ale termenilor aceleiasi serii.
Desi deriva din media aritmetica ponderata, in practica se intalnesc doua variante ale medieiarmonice, simpla si ponderata,
Se folosesc relatiile de calcul:- pentru 0 serie simpla
_ n» , =-n-l-
I-;=] X i
- pentru 0serie de repartitie de frecventek
In;- ;=1
X h = -k:-'--'-l--
I-n;;=1 X i
Comparand formula mediei armonice cu aceea a mediei aritmetice se pot stabili anumite relatiicare pot fi utile in practica statistica:
1) daca termenii seriei sunt pozitivi, media armonica este intotdeauna mai mica decat mediaaritmetica calculata pe baza acelorasi valori.
2) in cazul in care intre doua variabile interdependente exist! un raport de inversaproportionalitate, acest raport se pastreaza ~i in cazul mediilor calculate. Astfel, daca pentru calcululnivelului mediu al uneia dintre cele doua variabile se foloseste media aritmetica pentru cealalta sefoloseste obligatoriu media armonica,
3) daca se folosesc sisteme de ponderare diferite ~ianume Iamedia aritmetica frecventele absolute(ni), iar la media armonica produsele de frecvenle(xini)se obtine aceeasi valoare a mediei. Practic mediaaritmetica poate fi substituita cu media armonica ponderata cu produsele de frecventele (Xini) '
De cele mai multe ori din evidente nu rezulta frecventele absolute (ni) ci numai variantelecaracteristicii (x J ~i respectiv produsele de frecventa (Xini). In acest caz vom folosi urmatoarea formulapentru calculul mediei armonice ponderate:
19
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 20/43
CURS STATISTICA MTC • ANUL I FR
k
Lx;n;
s, = - I : . . . . ; . . i = . . . . ; . . \ _ -
L-x;n;i-I Xi
Se observa ca in aceasta forma de ponderare media armonica este 0 forma transformata a mediei
arltmetice.
in cazul distributiilor de frecvente media armonica este indicat a fi folosita cand predominavalorile mici ale seriei, seria prezentand deci 0 asimetrie catre valorile minime ale caracteristicii. In acestcaz se foloseste formula mediei annonice ponderate clasice.
• MEDIA PATRATICA
Media patratica (.ip
) este acea valoare care inlocuind termenii seriei ridicati la patrat nu modifica
suma patratelor lor.Media patratica este folosita, de obicei, atunci cand nivelurile variabilei aleatoare prezinta cresteri
din ce in ce mai marl sau cand Intr-o repartitie predomina frecventele valorilor ridicate ale variabilei si
dorim sa le dam acestora 0 important! mai mare. Si aceasta medie, in cazul seriilor de repartitie defrecvente se foloseste complementar mediei aritmetice care ramane principalul parametru al tendinteicentrale.
Bazandu-se pe ridicarea la patrat ea se poate folosi si in cazul in care termenii seriei au valori
pozitive ~inegative.In cazul unei distributii de frecvente se vor efectua mai intai produsele dintre fiecare termen
ridicat la patrat si ponderea sa ~i pe baza acestora utilizand un rationament analog cu eel descris anteriorse obtine formula mediei patratice ponderate:
k
Lx;ni;=1
X =
;=1
De retinut faptul ca media patratica este intotdeauna mai mare decat media aritmetica a acelorasi
termeni, indiferent de semnul pe care 1 1 au, deoarece prin ridicare la patrat toti termenii devin pozitivi, iar
patratul creste pe masura ce cresc valorile termenilor.
Media patratica sta la baza calculului abaterii medii patratice care este unul din cei mai utilizati
indicatori de variatie.
• MEDIA GEOMETRIC A
Spre deosebire de celelalte medii prezentate pana aici, care se bazeaza pe relatii de insumare intre
termenii seriei, media geometric! se bazeaza pe relatia de produs dintre ei.
X g = ~ ( ~ x ,unde I T este semnul produsului
in cazul unei serii de distributie de frecvente, fiecare termen trebuie sa fie luat in functie de
frecventa sa.
k k
- ~ > IT n.X = 1=1 X. rg I
i=1
De retinut faptul ca media geometric! devine incalculabila daca eel putin un termen al seriei este
ega! cu zero sau negativ.
2 0
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 21/43
CURS STATISTICA MTC-ANULIFR
Media geometrica se foloseste eel mai frecvent in cazul seriilor cronologice, la calculul mediilor
din marimile relative ale dinamicii, respectiv la determinarea indicelui mediu de dinamica,
In cazul seriilor de distributie de frecvente, media geometrica se foloseste mai rar. Este recomandabil
sa se foloseasca acest tip de medie atunci cand seria prezinta variatii foarte mari intre termeni sau un
pronuntat caracter de asimetrie. Prin logaritmare, abaterile dintre termenii seriei se micsoreaza ~i se
obtine un grad mai mare de concentrare a frecventelor.
De asemenea, cand predomina valorile mai mici, folosind media geometrica, Iise acorda acestorao mai mare importanta, media geometries fiind mai mica decat media aritmetica a acelorasi termeni.
Intre mediile prezentate exista urmatoarea relatie de ordine:
s. <Xg < xa =.in conc1uzie la calculul nivelului mediu al unei repartitii unidimensionale se foloseste pentru
masurarea nivelului mediu media aritmetica ~i complementar celelalte tipuri de medii prezentate, daca
seria prezinta anumite particularitati, sau in scopul aprofundarii analizei.
2.2. Valori medii de pozitie sau de structuraPentru completarea analizei seriilor de distributie este necesar s a se calculeze anumite valori medii
de pozitie sau medii de structura, care s a evidentieze ~i forma de repartitie a frecventelor. Dintre acestea,
mediana ~imodul sunt eel mai frecvent utilizate, fiind considerate tot ca indicatori ai tendintei centrale.• MEDIANA (ME) reprezinta valoarea central a a unei serii statistice, ordonate crescator sau
descrescator, care imparte termenii seriei in dona parti egale.
Indiferent de tipul seriei (simpla sau cu frecvente) la calculul medianei se cer rezolvate doua aspecte:
- aflarea locului medianei
- calculul valorii medianei
in cazul seriilor simple locul medianei se afla dupa relatia: Iocul Me = n + 1 unde n reprezinta2
numarul termenilor seriei.
Determinarea medianei necesita ordonarea prealabila crescatoare sau descrescatoare a termenilor
seriei.
Daca numarul termenilor este impar (n=2p+l), mediana este termenul de rang p+ I (valoarea
termenului central).
Daca numarul termenilor este par, adica n=2p, orice valoare cuprinsa intre tennenul de rang p sitermenul de rang p+1poate fi considerata ca 0 mediana, deci mediana se gaseste intr-un interval de
valori.
Daca date le sunt grupate pe intervale (c1ase) de valori ele i~i pierd individualitatea ~i la
determinarea medianei trebuie s a se tina seama de relatiile dintre grupele de valori ~ifrecventele acestora.Detenninarea valorii se poate realiza in dona moduri:
~ prin calcul algebric;
~ prin calcul grafic.Calculul algebric al medianei presupune utilizarea urmatoarei formule de caleul:
"Ln i +1 m-I
_ ; _ i = . . . : . . . I_ - L ni
2Me=xo
+h> . . . : . . . i = _ : . I _
unde:Xo - limita inferioara a intervalului median (primul interval a carui frecventa cumulata este
k
L n i +1mai mare sau egala eu . ; ,; : ;= : : .. .1 _ _
2h - marimea intervalului median;m - indexul intervalului median;
21
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 22/43
CURS STATISTICA MTC - ANUL I FR
.,-}
Ln; - frecventa cumulata a intervalului care precede intervalul median;;=1
n m - frecventa absoluta a intervalului median.
Calcuiui grafic al medianei se poate realiza indow moduri:1. Se traseaza poligonul frecventelor cumulate crescator ~i descrescator, Din punctul de intersectie al
celor dow curbe se traseaza perpendiculara pe axa absciselor ~ise citeste valoarea medianei pe Ox (vezifig.6.1.); Me=32,375 milioane lei.2. Se traseaza numai poligonul frecventelor cumulate crescator, De pe axa ordonatelor din punctulcorespunzator locului medianei (in cazul nostru 100,5) se duce 0paralela la Ox ce tntalneste poligonul inpunctul m. Din acest punct se coboara perpendiculara pe Ox ~ise obtine astfel valoarea medianei.
CIIIadIII II"IIk ........
200
175
150
lZ5
100
75
50
2 5
o +-~~-+--~--._~~-+~~~
Figura .1
c...... lf IIIIk ... eeael
200
175
15 0
lZ 5
100
75
SO
2 S
0
2 0
M«Figura .2
Mentionam in continuare cateva proprietati ale medianei. Mediana depinde de locul valorilor inserie, nu de marimea acestor valori. In felul aeesta ea nu este supusa influentei asa-ziselor valoriaberante (anormal de mari sau anormal de mici) care sunt lasate in afara seriei prin deschidereaintervalelor marginale.
Din punct de vedere grafic precizam ca verticala corespunzand medianei imparte histograma serieiin doua patti de aceeasi suprafata, deoarece ariile coloanelor care constituie histograma sunt prin
definitie proportionate ca tnaltime cu frecventele absolute corespunzatore, iar ca baze cu marimeaintervalului de grupare.
Daca sistematizarea datelor s-a facut pe intervale neegale, calculele privind locul ~i valoareamedianei se fae dupa aceleasi ipoteze si formule.
Mediana are 0 larga aplicabilitate in practica: la studiul mortalitatii, la determinarea duratei mediide viata. etc fiind alaturi de media aritmetica ~ide mod, principalii indicatori ai tendintei centrale.
Cand seria empiric! analizata prezinta 0 tendinta de repartitie normal! (simetrica), mediana poates a inlocuiasca valoarea medie, fiind mai usor de calculat.
Cu cat seria este mai apropiata de distributia normala, cu ata1abaterea dintre media aritrnetica ~imediana este mai mica, deci proprietatea de compensare a abaterilor falii de medie se realizeaza ~i incazul medianei, doar pentru 0 serle perfect simetrica, Se poate aprecia ca mediana este un indicatorsemnificativ al tendintei centrale daca se obtine 0 minimizare a abaterilor tuturor termenilor de lamediana, adica:
2 2
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 23/43
CURS STATISTICA MTC - ANUL I FR
It
L(Xi - M e ) =min, pentru datele negrupate,
k
L( X I - M e } o t i = min , pentru datele grupate.i~1
• MODAl (MODUL, DOMINANT A)Modul (Mo) este valoarea cea mai frecvent intalnita, motiv pentru care mai este cunoscut inliteratura de specialitate ~i sub denumirea de dominanta seriei.
Pentru serii simple (date negupate) modul se calculeaza daca intrunim 0 valoare a variabilei carese repeta de mai multe ori.
Astfel, in seria (4,5,6,6, 7, 7, 8,8,8,9,9, 10),valoarea 8 apare eelmai frecvent; modul este deciMo=8.
Modul se poate calcula cu certitudine pentru orice serie de distributie de frecventa, indiferent demodul ei de prezentare (pe variante sau pe intervale de variatie),
tvtodul se poate ca1cula fie pe cale algebrica fie prin metoda grafica.Incazul unei serii de distributie pe variante modul este usor de reperat. In tabelul statistic in care
este prezentata seria pe variante analizata, modul este varianta Xi corespunzatoare frecventei maxime.
Determinarea grafica a modului presupune utilizarea diagramei prin bastoane. In acest caz Mo
este acea valoare de pe abscisa care are ordonata maxima ~i corespunde frecventei ace lei marimi (vezifig. 3).
Ii3.5
3
2.5
2
1.5
0.5
o A
Figura 4Daca seria prezinta doua frecvente maxime identice alaturate se defineste un interval modal (vezi
fig. 5.4) tara a putea preciza valoarea exacta a modului.
' I
4 5 6 7 8 9 10
I I A
8
7
6
5
"3
: +-+-1+-+-+--4--1---'~'f--+ X J-1 2 3 " S 6 7 8 9
'n&lIfYllmndil Figura 5.
Pentru 0 serle de distributie pe intervale egale valoarea modului trebuie calculata, Intervalul modalse consider! intervalul care are frecventa cea mai mare.
In seria prezentata pentru calculul medianei intervalul modal este cuprins intre 32-36 milioane leiprofit, deoarece aiei frecventa este maxima (60). Cu aceste precizari se poate proceda la calculul algebricsi grafic.
a) Calculul algebric al modului se bazeaza pe relatia:
2 Mod sau moda vine de la termenul franpizesc "la mode" cu sensul de mod!
23
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 24/43
CURS STATISTICA MTC - ANUL I FR
AMo = Xo +h J incare:
A J +A 2
Xo - reprezinta limita inferioara a intervalului modal;h -marimea intervalului modal;A l - diferenta dintre frecventa intervalului modal ~ia celui precedent
A2 - diferenta dintre frecventa intervalului modal ~ia celui urmatorb) Pe grafic, valoarea modala se poate determina ~i cu ajutorul histogramei fermata dindreptunghiurile corespunzatoare fiecarei grupe (clase) de valori..
Se procedeaza astfel: se construieste histograma (vezi figura 6.5). Din intersectia segmentelor dedreapta care unesc vlirfurile superioare ale dreptunghiului aferent modului cu frecventele de incidenta aleacestuia eu dreptunghiurile adiacente, se coboara 0 perpendiculars pe abscisa, Punctul gasit indicavaloarea modului. De pe grafic rezulta 0valoare apropiata de eea obtinuta prin caleul algebric
»............... fl;~1a.pa
......... pnfl&ullll(IMI.1t1)
60
: :i 50
: : ! 4030
10
10
o
Mn
A Figura 6.C) In cazul distributiilor moderat asimetrice Mo se mai poate determina ~ipornind de la conditia
care trebuie s a fie indeplinitAin acest caz:x-Mo=3(x-Me)
Mo=3Me-2x
In cazul prezentat prin utilizarea acestei relatii de calcul se obtine:De preeizat faptul ca modul este 0valoare foarte instabila, Simpla deplasare eu cateva unitAti(deci
reluarea gruparii) poate sa modifice sensibil valoarea modului.Daca seria prezinta dona sau mai multe frecvente maxime nealaturate ~i nu ne aparat egale,
spunem ca seria este bimodal a . , trimodala etc.Mediana ~i modul se exprima in aceleasi unitati de masura ea ~i variabilele pentru care se
determina ~i prezinta avantajul ca valoarea lor nu se modifica daea se inehid in mod conventionalintervalele desehise.
Cu toate inconvenientele, modul are 0 larga aplicabilitate practica (mai ales in comert) si stAlabaza calculului ~iinterpretarii gradului de asimetrie a repartitiei.
Modul prezinta avantajul ca se poate stabili ~i pentru 0 variabila calitativa. De exemplu, inanalizele de marketing se poate stabili culoarea eea mai frecvent solicitata la articolele de tmbracamintesau incaltmninte.
La seriile eu un grad mare de variatie, unde pot aparea ~imai multe valori modale este necesar sase separe seria pe serii componente ~is a se calculeze ~ivalori medii partiale pe zone de variatie.
Folosirea modului se impune atunci cand 0 valoare domina elar seria de distributie fata.de toatecelelalte valori ~ideci poate fi substituita celorlalte dow valori ale tendintei centrale (media ~ivaloareamedians) tara sa se produca abateri semnificative.
in acelasi timp utilizarea modului trebuie s a se faca cu prudentaIn c azul in care frecventele se distribuie relativ uniform, valoarea modala este doar mai frecventa
decat celelalte valori ale seriei. Daca celelalte valori sunt ins8. aproape tot asa de freevente ca valoareamodala, s-ar putea ca 0valoare sa devina dominanta din intfunplare, ~iea s-ar deplasa, daca intervalele degrupare s-ar schimba. Deci, modul este semnificativ ea valoare tipica, numai daca 0 valoare domina inseria de distributie,
2 4
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 25/43
CURS STATISTICA MTC - ANUL I FR
Pentru seriile cu un pronuntat 'laracter de asimetrie, valoarea dominanta nu are sens sa fie folositapentru a caracteriza tendinta centrala, Inacest caz, se recomanda st\ se foloseasca grupari combinate cares a separe colectivitatea inregistrata pe mai multe grupe de variatie, apartinand unor structuri diferite.
Pentru seriile de distributie cu tendinta pronuntata de asimetrie, caracterizate printr-o amplitudinemare a variatiei, se calculeaza ~i alp indicatori de pozitie cum sunt: cuartilele, decilele, centilele,percentile Ie etc.
CuartiJele sunt acele valori ale caracteristicii, care separa seria in patru parti egale:
• cuartila inferioara, notata cu QI. este mai mare sau egala de 25% din termenii seriei ~i mai
mica sau egala de 75% dintre ei;
• cuartila a doua Q2 coincide cu Me ~i separa seria in doua parti egale ca efectiv;
• cuartila superioara Q3 este mai mare sau egala de 75% din numarul termenilor ~imai mica
sau egala de 25% din numarul lor.Analog cu mediana pentru cuartile obtinem:
Locul cuartilei
1loe Q J = -(Ln; +1)
4
Valoarea cuartilei
Q2=Me
3/OCQ3 = -CLnj + 1)
4
3-ts».+1)- z »4 \.£..J I P0
Q3 =xo+h~------
in care:
• r.npQl ~i r.npQ3 reprezinta suma frecventelor intervalelor precedente locului pe care-l
ocupa Ql ~iQ3
• nQ! ~inQ3 reprezinta frecventele intervalelor care contin cuartilele respective.
In cazul in care se calculeaza decilele, seria se divide in zece parti egale folosind in acest scop
noua decile.
25
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 26/43
CURS STATISTICA MTC - ANUL I FR
Tema 6. INDICATORII DE VARIATIE
1. Indicatorii simpli ai variatiei
2. Indicatorii sintetici ai variatfel
3. Asimetria
intr-o colectivitate statistic! valorile individuale (variantele) difera mai mult sau mai putin unelefat! de altele. Ele pot fi mai apropiate sau m ai imprastiate. De aceea, comparatia se face, in principal, cumedia aritmetica, considerata ca fiind valoarea cea mai reprezentativa pentru colectivitatea studiata, Decele mai multe ori este important de cunoscut cat de departe sunt valorile variantelor seriei fata deaceasta medie, sau cu alte cuvinte care este dispersia variantelor in cadrul seriei sau campul de variatie acaracteristicii inregistrate.
• in scopuri speciale, sau pentru completarea analizei variatiei se poate folosi 0 alta valoare a tendintei
centrale (mediana, mediala, modul), sau pe zone de variatiei mediile de structura (centilele, decile Ie).Indicatorii variatiei pot fi calculati ca indicatori simpli ~ica indicatori sintetici.
1. Indieatorii simpli ai variatieiIndicatorii simpli ai variatiei servesc pentru a caracteriza gradul de imprastiere a unitatilor
purtatoare ale caracteristicilor inregistrate. Ei se calculeaza pentru a masura amplitudinea variatiei siabaterile valorilor individuale de la media lor. Acesti indicatori se pot exprima atat in marimi absolute -folosind aceleasi unitati de mdsur! ca ~ipentru caracteristica studiata - cat ~i in marirni relative. calculatein raport cu valoarea medie.
Din aceasta grupa a indicatorilor simpli fac parte:
• amplitudinea variatiei (absoluta si relativa)
• abaterile individuale (absolute ~irelative).
Amplitudinea absoluti (Aa) se calculeaza ca diferenta intre nivelul maxim (xmax) ~i nivelul minim( X m i P l ) al caracteristicii:
Aa=xmax-xmiPlAmplitudinea absoluta se exprima in unitatile de masura ale variabilei respective si prin urmare
nu poate fi folosita Ia compararea a doua variabile exprimate in unitati de masura diferite.
Amplitudinea relativi a variatiei ( A% ) se exprima de regula in procente si se calculeaza ca raportintre amplitudinea absoluta a variatiei ~inivelul mediu al caracteristicii:
A . ; . = ~ ·100x
Abaterile individuale absolute (dJ se calculeaza ca diferenta intre fiecare variant! inregistrata ~imedia aritmetica a acestora dupa relatia:
d .=X. - X i = 1,nI I
Abaterile individuale relative (di'YJ se calculeaza raportand abaterile absolute Ia nivelul mediu alcaracteristicii :
d. = dj .100 = Xj -x .100 i= l,n% _ _
X x
Amt gradul cat s i forma de variatie a unei caracteristici depind insa de toate abaterile variantelorinregistrate ~ide frecventa lor de aparitie ~iprin urmare indicatorii simpli ai variatiei nu pot exprima decatun aspect al variatiei unei caracteristici inregistrate. Din acest motiv caracterizarea gradului de variatie seface in special cu ajutorul indicatorilor sintetici ai variatiei care iau in consideratie toate abaterilecaracteristicii.
2. Indieatorii sintetici ai variatiei
Indicatorii sintetici ai variatiei, Ia fel ca indicatorii tendintei centrale. trebuie s a se bazeze pe toateobservatiile, sa fie usor de inteles, usor de calculat, cat mai putin posibil afectati de fluctuatiile de selectie~iadecvati unui studiu algebric.
Indicatorii sintetici ai variatiei sunt:
26
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 27/43
CURS STATISTICA MTC-ANULIFR
• abaterea medie liniara (d),
• abaterea medie patratica sau abaterea standard (er),
• dispersia (u2)
• coefieientul de variatie (v).
Abaterea medie liniari (ii) se calculeaza ea medie aritmetica simpla sau ponderata a abaterilor
termenilor seriei de la media lor, luate invaloare absoluta.
Formulele de ealeul ale abaterii medii liniare sunt:n
L lx i - x l• pentru 0 serie simpli: d = . . . . : . i _ ; = I : . . . . _ _ _
n
": L l x ; -X~i• pentru 0 serie de freeveate absolute: d = . . .: . :i = : .. = . .. 1 - - , -- -
"L n i
i-I
• pentru 0 serie cu freeveate relative, exprimate in procente:
kL I X i - i l n \ 0 / 0d = . . . . ; . i = _ I _
100
- k I ;;I~.• pentru 0 serie cu freevente relative, exprimate sub formi de coeflelenti; d = L Xi - XI";
i=/
Abaterea medie liniara se exprima in unitatile de masura ale variabilei ~i deei nu poate fi folositala comparatii.
Abaterea medie liniara prezinta ~i dezavantajul ell nu tine seama de faptul ca abaterile mai marl invaloare absoluta maresc semnificativ gradul de variatie a unei caracteristiei, in comparatie cu abaterilemai mici. in plus, din punct de vedere algebrie nu este indicat s a se renunte, in mod arbitrar, la semnul
valorilor din care se calculeaza 0 valoare medie. Din aceste eonsiderente se foloseste ea principalindicator sintetic al variatiei abaterea medie patratica,
Abaterea medie pitratici, abaterea tip sau abaterea standard (0") se calculeaza ca medie
patratica a abaterile tuturor variantelor seriei de 1amedia lor aritmetica.
Relatiile de calcul ale abaterii medii patratice sunt:
• pentru 0serie simp I!:1-----
r e x ; _X)lU= , : . = 1 = : : . . . . ' _ _ -
n
• pentru 0serie de frecvente absolute:
" - 1L (Xi
-x) njU= 1.;./=-=-1_,- __
" n /1m/
• pentru 0 serle eu frecvente relative. exprimate in procente:
k _ 1
L (X j -X ) ni%u= ~ i= . . . . : . I _ _
100
• pentru 0 serie eu frecvente relative, exprimate sub forma de coeficienti:
k 2 •
C1 = 'L(xi-i)n i
i= 1
2 7
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 28/43
CURS STATISTICA MTC - ANUL I FR
Indicatorul abatere medie patratica fiind calculat din patratul abaterilor este mai concludent deditabaterea medie Iiniara, Prin ridicarea la patrat se da 0 importanta mai mare abaterilor mai mari in valoareabsoluta, acestea influentand intr-o masura mai mare gradul de variatie al variabilei analizate. Din acestmotiv, calculati pentru aceeasi serle, cei doi indicatorl ve ri fi ca relat ia :
u>din literatura de specialitate se apreciaza eii pentru 0 serie de distributie cu tendinta clara de
normalitate, abaterea medie liniara este aproximativ egala eu 4/5 din valoarea abaterii medii patratice.Abaterea medie piitraticii este un indicator de baza, care se foloseste in analiza variatiei, la
estimarea erorilor de selectie, in calcule de corelatie.La feI ca abaterea medie liniara, abaterea medie patratica se exprima in unitatea de masura a
variabilei a carei variatie 0 caracterizeaza. Prin urmare cei doi indicatori nu se pot folosi pentrueompararea gradului de variatie a doua sau mai multe variabile diferite dar apartinand aceleasicolectivitati ~iin aceste situatii se recurge la un alt indicator de variatie - coeficientul de variatie,
Cand nu se precizeaza altfel, coeficientul de variape (v) se calculeaza ca raport intre abatereamedie patratica ~i nivelul mediu al serie, deoarece abaterea standard se foloseste freevent pentrumasurarea abaterii medii. Formula de calcul a coeficientului de variatie este:
v = (j ·100x
Daca s-a ealculat ~i abaterea medie liniara, coeficientul de variatie se mai poate calcula ~idupa
relatia: v' = ~ ·100x
Coeficientul de variatie se exprima, de regula, in procente, ceea ce inseamna ca el este de fapt
expresia relativa fie a lui if. fie a lui 0" ~i evident v'<v, De aceea se prefera a care conduce la un
coeficient de variatie mai mare.Cu cat nivelul lui v este mai apropiat de zero, cu amt variatia este mai redusa, colectivitatea este
mai omogena , media avand un grad ridieat de reprezentativitate; eu cat valoarea sa este mai departe dezero cu amt variatia este mai intensa, colectivitatea este mai eterogena, iar media are un nivel desemnificatie mai scazut. Se apreciaza ca, pentru fenomenele economiee ~isociale, in cazul unui coeficientde variatie de peste 35-40%, media nu mai este reprezentativa ~i datele trebuie sii fie separate in seriicomponente, pe grupe, in functie de variatia unei alte earacteristici de grupare. Deci se poate afirma caacest indicator (coeficientul de variatie) poate fi folosit ca un test de verificare in aplicarea metodeigruparii care are ea functie principala omogenizarea datelor dintr-o observare statistica,
Desi indicatorul - coeficientul de v ariatie - inlatura dezavantajele prezentate de 0" ~i d ~i acest
indicator are limitele lui. Astfel, a c e s t coefieient este inmod evident neadecvat in cazul in care media
aritmetica este apropiatA de zero sau cand valorile inregistrate sunt relativ egale lntre ele.Desi in literatura de specialitate coeficientul de variatie se calculeaza de cele mai multe ori prin
relatiile mentionate (media fiind indicatorul care respecta cele mai multe din conditiile impuse de Yule),acest indicator se poate ealcula ~iinlocuind media cu mediana, modul sau mediala.
0" dv = _l!!!.... ·100' v' = . . . . . l ! : ! ! . . . . ·100'
Me' Me'
0" dv = _ __ !t ! !! _ • 100' v'= MO·100'
Mo' Mo'Intr-o forma explicitii, pentru 0 serie de frecvente, vom avea pentru mediana:
t(Xi -MeY nj tlXi -Melnji~ k ~:.:..._lk---
Ln; Lnjv = - - = - - _ _ i - _ l ---.100 si v'= _ - - . . . . : . .; . . . i = : : , _ l --.100
Me Mein mod analog se pot serie ~ celelalte formule inlocuind mediana prin alt indicator al tendintei centrale.
Un alt indicator sintetie al variatlei, cu 0larga utilizare inanaliza statistica a fenomenelor, este dispersia
2 8
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 29/43
CURS STATISTICA MTC - ANUL I FR
Dispenia (variants) unei caracteristici (0-2) se calculeaza ca medie aritmetica simpla sau
ponderata a patratelor abaterilor termenilor seriei fatA de media lor. Se mai numeste ~ipatratul mediu al
abaterilor termenilor fata de media lor. Formulele de calcul sunt:n
L(xj_i)2
• pentru 0 serle simpla: q2 = . . . ;. , . 1 - .. . : .. 1 - - -
nk _ 2
L (X j -x) » .• pentru 0 serie de frecvente absolute: (72 = .;_j~.:....1-k---
L n;1=1
k _ 2 •
L(X; -x) nj(O/o)
• pentru 0 serle cu frecvente relative, exprimate in procente: 0- 2 = . ; ; .. . 1 = .; ; . .. 1 - - - - -
100
• pentru 0 serie cu frecvente relative, exprimate sub forma de coeficienti: (J'2 = ± (x, - X ) 2 n·;; = 1
Inliteratura de specialitate, dispersia este cunoscuta ~isub denumirea de momentul centrat de ordinul doi.
Din relatiile de calcul prezentate anterior se observa ca abaterea medie patranca implica calculul
prealabil a 1 dispersiei, din care se extrage apo i r8dac ina pat rat ica, pentru a ajunge la acelasi grad cu caracteristica
a ca re i va riat ie se studia:zA (cr=.J;;2 ). Formulele de calcul ale dispersiei prezentate neeesita calcule laborioase
care pot fievitate daca t inem s eama de faptul c a dispersia reprezinta momentul centrat de ordinul doi,
Compensand cele doua formule de calcul ale dispersiei (eel obisnuit ~i eel prln dezvoltarea
binomului), se constata c a cea de a dona prezinta avantajul c! se face 0 simpla diferenta intre patratul
mediu ~i media la patrat, in timp ce pentru calculul obisnuit se calculeaza atatea abaterl cate valori
individuale are seria ~i in cazul unei medii care nu este un numar intreg ~i trebuie rotunjita, aceasta
rotunjire se regaseste in valoarea dispersiei.
Dispersia necesitand calcule destul de dificile (mai ales cand variabila are valori marl) in teoria ~i
practica statistic! se foloseste formula de ca1cul simplificat. Acest calcul simplificat se bazeaza pe unele
proprietati ale dispersiei.
3. Asimetria
Pentru caracterizarea seriilor de distributie unidimensionale ~iunimodale un interes deosebit ilprezintA
~icunoasterea gradului de oblicitate, de indepartare a acestor distributii de la simetrie. In practica statistic!
acest aspect este cunoscut sub numele de asimetrie. La interpretarea gradului de asimetrie se porneste de la
pozitia ~ivalorile pe care le au cei trei indicatori ai tendintei centrale: media, mediana ~imodulo
intr-o distributie simetrica cei trei indicatori: mod, medians ~i media artimetica se
confunda ca in diagrama din figura 6.6.
y y
x x
M =M =Xo e
Figura 6.6 Figura 6.7
29
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 30/43
CURS STATISTICA MTC-ANULIFR
o distributie nonsimetrica se mai numeste ~i oblica ~i ea poate prezenta asimetrie de stanga sau de
dreapta (vezi figurile 6.7 ~i6.8).Forma repartitiei se poate analiza:
a) utilizand metoda grafica;
b) calculand indicatorii de asimetrie adecvati,
Asimetria se poate analiza in primul rand eu ajutorul metodei grafice. in acest scop se folosesc:poligonul frecventelor ~i histograma. Dupa ce s-a construit poligonul frecventelor interpretarea se face camai sus. Reprezentarea grafica a seriei ofera 0 imagine sugestiva asupra gradului de asimetrie tara tnsa a-Iputea masura printr-o valoare numerica. De aceea se calculeaza si indicatorii de asimetrie, exprimati in
marimi absolute ~i relative.Asimetriea absolutA se calculeaza dupa relatia:
As=x- MoSe exprima in unitatile de masura ale variabilei si nu poate fi folosit la comparatii intre serii.
De aceea pentru a masura gradul de asimetrie recurgem la indicatorii de asimetrie relativi. Din
acest grup retinem un anumit numar de coeficienti, adica numere tara dimensiune, permitand
comparatiile,
PrezentAm in continuare doi coeficienti de asimetrie ce poarta nwnele autorilor lor, Pearson ~iYule.
lcs =0 :::) simetrie
x-MoCas = Cas> 0 :::) serie oblica la stanga
aCas < 0 :::) serie oblica la dreapta
Acest coeficient poate lua valori cuprinse intre -1 ~i+1; cu cat este mai mic in valoare absoluta
cu amt asimetria este mai mica.
De retinut. Acest coeficient este recomandabil a se folosi numai pentru distributii usor asimetrice.
i l l cazul cand se cunoaste mediana seriei, coeficientul de asimetrie (C.:a) se poate calcula
utilizand relatia:
C' = 3(x- Me)as (j
Acest coeficient se foloseste cand intre cei trei indicatori ai tendintei centrale se verifica relatia:
Modul =Media - 3(Media - Medians)
Acest coeficient poate sa ia valori cuprinse intre -3 ~i+3 ~iva arata un grad mai mare de simetriecu cat se va apropia mai mult de O.
30
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 31/43
CURS STATISTICA MTC • ANUL I FR
Tema 7. ANALIZA SERIILOR STATISTICE INTERDEPENDENTE
1 Notiunea de eerelatie Conditii de aplieare
2 Tipuri de legituri intre fenomenele seeial-ecenemiee
3 Metode de analizA a interdependeatei dintre fenomene
1. Nopunea de corelatie Condipi de aplicare
In domeniul fenomenelor ~i proceselor social-economice, iau nastere 0 serie de legaturi, de
interdependente, determinate de actiunea unor cauze ~i conditii diferite, care influenteaza mai mult sau
mai putin fenomenele existente.
Complexitatea fenomenelor economice ~i sociale, caracterizarea lor cantitativa ~i calitativa
determina folosirea combinata a diferitelor stiinte in investigarea relatiilor de cauzalitate, care stau la baza
aparitiei ~i dezvoltarii lor.
Printre metodele ~i modelele care s -au impus in studiul interdependentei cele care se folosesc eel
mai frecvent sunt corelatia ~i regresia statisticiUtilizarea acestor metode este justificata de necesitatea crescanda a reflectarii intr-o forma numerica
adecvata a interdependentei obiective dintre fenomenele social-economice in ceea ce priveste natura,
directia ~i gradul de intensitate a legaturilor, care se manifesta Intr-o anum ita perioada de timp sau in
dinamica.
2. Tipuri de legituri intre fenomenele social-economice
Formele de manifestare a relatiilor de interdependenta sunt extrem de variate ~i adesea destul de
greu de sesizat. Pentru a Ie studia este necesar sa fie c1asificate in functie de unele criterii, dupa care sepot deosebi unele de altele.
Dupa natura relatiei de cauzalitate, legaturile dintre fenomene pot fi legatur] functionale ~ilegituristatistice sau stohastice
1.Legalurile funcfionale sunt univoce, realizate direct intre un fenomen-cauza si un fenomen-efect.Deci, fenomenul-efect depinde de 0 singura cauza, care poate fi identificata de cate ori se produce, ceea
ce t ns eam na ca, daca conditiile mmful constante, atunci unei valori a caracteristicii factoriale Ii
corespunde 0 singura valoare a caracteristicii rezuItative. Ele se mai numesc ~i legaturi de tip determinist.Relatia matematica dintre fenomenul-efect ~i fenomenul-cauza, pentru legaturile de tip functional
(determinist) este: y;=f(xJ.
Ex Un exemplu de astfel de legiitura functionalii este aceea dintre nivelul productivitiuii muncii #consumul specific de timp de munca pentru produsul respectiv in cadrul unei perioade de timp. Se poate,
cu lqurinlii, demonstra ca, pe miisura ce scade timpul de producere a unei marfi, cu atd: creste
productivitatea muncii pentru produsul respectiv.
2. legatu,; statistice, denumite ~i legalur; stohastice, de tip nedeterminist descrise prin functia
matematica : Yi = f(x)j,x2i'''''Xk;) si se refera la fenomene complexe, influentate de mai multecauze, care se manifesta in conditii diferite ~i se pot c1asifica dupa mai multe criterii astfel:
) ; > - dupa numarul variabilelor inregistrate:
• legaturi simple (unifactoriale) cand se tnreglstreaza un singur factor;
• legaturi multiple (bifactoriale ~i multifactoriale) - mregistreaza eel putin doua variabile
factoriale.
) ; > - dupa contimaul variabilelor corelate:
• Iegaturi numerice denumite corelatii statistice - cdnd legiitura se stabileste intre variabile
cantitative
• legaturi incare eel putin 0 variabila este nenumerica , denumite asocieri statistice - cdnd
legarura se stabileste intre varia bile calitative
31
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 32/43
CURS STATISTICA MTC - ANUL I FR
~ dupa directia legaturii:
• legaturi directe -pe mdsurd ce creste variabila factoriala creste si cea rezultativd.
• legaturi inverse -pe miisurd ce creste variabilafactoriala descreste cea rezultativa.
Ex. intre w # salariu exista 0 legi'itura directa de tipul unei corelatii statistice. Legatura dintre
calificare §i salariu este 0asociere statistica, pentru cd calificarea este 0variabila calitativa
) 0 > dupa functia analitica cu care pot fi exprimate corelatiile statistice:
• liniare - a care; linie de tendinla se mascara cu ecuatia functiei rectiliniare,• curbiliniare, cunoscute sub denumirea generica de legaturi neliniare - care pot fi de tipul
unei functii exponentiale, a functiilor hiperbolice si a functiilor de tip parabolic.
~ dupa timpul in care se produc:
• concomitente sau sincrone
• cu decalaj sau asincrone este acea in care dupa 0 anumitA modificare a factorului incepe sa
apara ~imodificarea efectului. in cadrul analizei in timp, a legaturilor, trebuie verificat daca,
exist! decalaj pfut! la inceperea corelatiei ~i necesitatea stabilirii perioadei de corel are a
seriilor dupa eliminarea deca1ajului.
Ex. lntre inzestrarea tehnica productivitatea poate sa apara legati; dupii un numar de ani necesari
procesului de asimilare sau dupi'i 0 anumitii perioadd un produs atinge performantele de calitate si poate
sa aparli la export.Interpretarea rezultatelor, verificarea ipotezelor, aplicarea testelor de semnificatie a functiilor ~i parametrilor
lor se face potrivit particularitatilor fenomenelor studiate infunctie de timp, loc ~iform! de organizare.
Daca datele provin dintr-un sondaj statistic trebuie sa se verifice reprezentativitatea ansarnblului ~is a se interpreteze probabilistic indicatorii calculati.
3. Metode de analiza a mterdependentei dintre fenomenePentru interpretarea legaturilor dintre fenomene se pot folosi metode de sistematizare ~iverificare a
legaturilor:
A. Metode parametrice simple ~ianalitice,
B. Metode neparametrice
A.I. METODE PARAMETRICE SIMPLEMetodele de sistematizare si verificare a corelatiei sunt:
a) seriile interdependente,
b) metoda tabelului de corelatiec) metoda gruparii,
d) metoda grafica,
e) metoda balantelor
a) Metoda seriilor interdependente pe baza unor analize eomplexe imprima cu stiintele care
studiaza acelasi domeniu s! Inregistram ~i sa inscriem in datele in functie de prima variabila factoriala.
Pentru aceasta se pot folosi serii cronologiee, teritoriale, distributii statistice referitoare la aceeasi
perioada de timp. Daca vrem s a analizam intr-o companie care este legata de numarul de ore lucrate si
salariu vom nota cu x numarul de ore lucrate ~i ell y salariu!.Daca exist! legAtura intre cele doua, si ea este directa, pe masura ce creste variabila factoriala,
descreste ~irezultativa,
b) Metoda tabelulu; de coreuuie care are la baza tabelul de corelatie, tabel cu dubla intrare
reprezent3nd 0 forma speciala a unei grupari combinate, in care separarea pe grupe a unitatilor se face
dupa variatia ambelor caracteristici - factoriala ~irezultativa,
Cu ajutorul tabelului de corelatie in functie de modul de distributie a frecventelor, in tabel se obtin
informatii ell privire la existenta ~i directia legaturii dintre cele doua variabile
In unele cazuri directia legaturii este data de pozitia diagonalei in jurul careia se grupeaza
frecventele: cand diagonala leaga unghiul stang de sus al tabelului cu unghiul drept de jos - legatura este
3 2
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 33/43
CURS STATISTIC! MTC - ANUL I FR
directa, iar cAnd uneste unghiul stang de jos cu unghiul drept de sus, se apreciaza cA intre cele doua
camcteristici exist! 0 legatura in sens invers.
Valorile Variantele sau valorile Volumul
caracteristicii de camcteristicii dependente Y grupei
grupareX YI Y2 . . . IYi ... IYm
XI nl1 n12 . . . nlj .. . nlm n1.. . . . . . . . . ... .. . ... . . . . .Xi nil nil ... njj ... nim n'I.
. . . ... ... ... . . . .. . .. . . ..Xr I l r l 1lr2 .. . I1ri ... I 1 r m fir.
Total n.1 n.2 n' Omr •.. .J ...I;ni = I;n'ji-I j=1
Modul de asezare a frecventelor in jurul diagonalei ne da posibilitatea sA apreciem intensitatea
legaturii: concentrarea intensa a freeventelor in jurul diagonalelor indica existenta unei legaturi stninse intre
caracteristici. in alte cazuri, frecventele se grupeaza pe diverse curbe. Daca frecventele se repartizeaza pe
intregul tabel tam nici 0 regularitate, atunci ori nu exista Iegatura, ori aceasta este foarte slaba,
c) Metoda grupari; reprezinta un model de analiza prin excelenta calitativ, capabil sA surprinda
aspecte esentiale ale legaturilor dinte variabile. Studiul legaturilor se realizeaza dupa ee unitatile
colectivitatii se grupeaza in functie de earacteristica factoriala, iar pentru caracteristiea rezultativa se
calculeaza indicatorii derivati (marimile relative sau medii) specifici fiecarei grupe. Aceasta metoda de
studiere a legaturilor dintre fenomene necesita ealcularea mediilor conditionate ale variabilei rezultative
Y xj pentru grupele obtinute dupa variabila factoriala, Pe baza tabelului de corelatie se pot calcula
urmatoarele medii de grupa:
m
Ly·n .._ j= J IJ
Y i = m
Ln ..j=I IJ
d) Metoda grafici Graficul de corelatie denumit ~i corelograma sau graficul norului de punete,
pennite s a . identifice eu ajutorul ajustarii care este functia analitica corespunzatoare valorilor noastre.
Prin ajustare inlelegim inlocuirea valorilor empirice obtinute pentru 0 observatie statistica cu valori
teoretice calculate dupa un model statistic. in cazul in care am intocmit un grafic de corelatie putem face
o ajustare vizuala ~i dupa aceea aplicam modelul de calcuI ~i 0 ajustare numerica, Ajustarea vizuala
consta in trasarea unei linii drepte sau a unei curbe care sa treaca cdt mai aproape de valorile empirice
inscrise ingrafic.
Interpretand foram de legatura putem avea corelatii :
Legatura liniara directa Legatura liniara inversa
33
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 34/43
CURS STATISTICA MTC - ANUL I FR
o 5 10 15
10
8
6
4
2
o20
Lipsa de legatura
Metoda grafica este utilizata eu bune rezultate pentru alegerea functiei analitice care se studiaza
(incazul regresiei §i corelatiei)
e) Metoda balanteler, Aceasta metoda serveste pentru analiza relatiilor care exista in cadru unui
proces stocastic incare se pot analiza relatiile de interdependenta dintre diferitele elemente ale procesului,
dintre diferitele laturi ale lui san dintre diferitele etape sau momente incare el se desfasoara,
A.2. METODE PARAMETRICE ANALITICE
Metode ,i procedee de analizi a legiturilor dintre fenomene
Analiza dispersionali
Analiza dispersionala este folosita pentru verificarea semnificatiei factorului de grupare ales (inainte
de aplicarea regresiei) si dupa aplicarea acesteia, pentru caleulul §i interpretarea rezultatelor obtinute in
urma aplicarii modelului de corelatie (validarea modelului ales pentru cazuri concrete.
• METODA REGRESIEIMetodele de studiere a legaturilor prezentate anterior au ea deficienta principala faptul cli desi
permit constatarea legaturii si caracterulul ei, nu 0 pot masura printr-un indicator sintetic. Acest
inconvenient este inlaturat prin utilizarea me todei r eg re si e:
Metoda regresiei constituie 0metoda statistica analities de eereetare a legaturii dintre variabile cu
ajutorul unor functii denumite functii de regresie.
Notand eu Y variabile dependenta si eu Xl. X2 .•• X n variabilele independente obtinem ecuatia de
regresie y = f (x.; X2 ••• X n ) .
Dupi ee am stabillt functia care devine functia de ajustare, trecem la misurarea corelariel cu
ajutorul metodei regresiei. Aceasti metodi presupune sa aiba inregistrate datele eu privire la eele
doua variabile una factoriali ,iuna rezultativi ,isi presupunem ca legatura dintre cele doui este
de forma unei ecuatu de tendinti, care descrie funcpa rectiliniari. Fiind yorba de legatura de tip
statistic care se supune legilor statistice, care acponeaza sub forma de tendinta cu caraeter de
medie, eeuatia Yx, = a + bx.,
in care:
Yx, - valoarea eeuatiei de regresiemedie;
Xi - variabila factoriala
Parametrul "a" reprezinta ordonata la origtne si arata la ce nivel ar fiajuns valoarea caraeteristieiiY daca toti factorii - mai putin eel inregistrat - ar fiavut 0actiune constants asupra formarii ei.
34
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 35/43
CURS STATISTICA MTC - ANUL I FR
Parametrul ..b" se mai numeste ~i coeficient de regresie ~i reprezinta, in sens geometric, panta
liniei drepte. Coeficientul de regresie "b" arata cu cat se sch imba in medie variabila Yin cazul in care
variabila X se modifica cu 0 unitate. Acest parametru este pozitiv in cazul legaturii directe si negativ in
cazul legaturii inverse.
Parametrii "a" §i "b " se determina din sistemul de ecuatii normale obtinut prin metoda celor mai mici
patrate { L (Yi - Y x,)2 =minim).
Daca modelul ales este corelatia liniara simpla corespunde datelor empirice, atunci ecuatia de
regresie considera cii valorile teoretice obtinute prin celor mai rnici patrate sa prezinte abateri rninime.
{ I : l Y ; -(a+bx;)j2 =minim).
Parametri ecuatiei in acest caz se determina prin rezolvarea urmatorului sistem de ecuatii:
{na+b2:Xi = LYi
aL x; + bL x; =LX;Y i
Celelalte modele de functii sunt prezentate in "Statistica aplicata in economie" pag 66-693
• COEFICIENTUL DE CORELATIECoeficientul de c or ela tie lin ia ra s imp la poate sl ia valori intre -1 ~i+1.
lntre -1 ~i 0, legatura dintre eele doua variabile este de sens invers ~i este cu amt mai intensa, cu cat seapropie de -1.
Intte 0 ~i+1, legatura dintre cele doua variabile este directa si este cu amt mai intensa, eu cat se apropie
de 1.
Formu la de calcul simplificat pentru seria bidimensional! s impla
nLx;Y i -(L x j)(LY i)
r.: = ~[nL x; -{L xJ2].[nLy; _{Ly;)2]
Pentru verificarea semnificatiei eoefieientului de corelatie liniara simpla, se aplica, eel rnai frecvent,testul t:
t = I r y / x l · . I n - 2J l - r ; l x
unde, n reprezinta numarul de perechi de valori.
Valoarea calculata se compara eu eea tabelara stabilita probabilistic pentru un nivel de semnificatie
P = 1-a12 ~ieu n-2 grade de libertate.
3 Ace s t manual s tud en ti i ilvor a ve a intimpul o re lo r d e c ur s ~is em i na r in clu siv la e xame n.3 5
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 36/43
CURS STATISTICA. MTC - ANUL I FR
Daca tcaknda: > ttabelar » se verifies ipoteza semnificatiei coeficientului de corelatie iar daca
tea/culal < t/abelar' legatura este nesemnificativa ~i trebuie cautat un alt factor esential cu care s! se studieze
corelatia,
RAPORTUL DE CORELATIE
in cazul in care dispunem de un numar mic de perechi de valori (Xi, yi), negrupate:• pornind de la devianta factorial! :
L (Yx, - y)2Rytx = ~ 2 sau
c: (Yi - y)
• pornind de la devianta reziduala :
R = 1_ L (y; - Yx)2
yl x L (Yi _ y)2
unde Yx reprezinta valorile ajustate indiferent de mode lui de regresie selectat.,
•
Raportul de corel ape poate lua valori de la zero la +1; interpretarea sensului legaturii se face dupa functia
de regresie.
Daca Ry / x = I r Y l x l se confirma ipoteza legaturii liniare si aceasta relatie este considerata un test de
verificare a legaturii,
in cazu1 unei serii bidimensionale avem abaterile:
abaterea dintre Y i ~i ecuatia de regresie;
abaterea dintre ecuatia de regresie ~imedie;
abaterea dintre Y i s i media lor
• CoeflCientul de determinape (R;, x ) :
u2
R2 =~.lOOy l x 2a
• Coeflcientul de nedeterminatie:
uKl =~.lOO
y/x 1
a
Interpretand cele doua dispersii putem avea doua variante:
Daca: R ; , : c > K ; , x r ezul ta l eg at ur a intre x ~iy
Daca: R : / x < K ; / x tendinta spre independent!
B. METODE NEPARAMETRICE
CoeflCientul de asociere
Aceasta metoda se utilizeaza pentru masurarea intensitatii legaturii a doua caracteristici alternative
prezentate intr-un tabel de asociere de forma:
y Yl Y2 Total
X
Xl a b a+b
X2 c d c+d
Total a+c b+d a+b+c+d
36
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 37/43
CURS STATISTICA MTC - ANUL I FR
Produsul ad arata gradul de realizare a legaturii directe dintre X ~i Y, iar produsul be gradul delegatura inversa intre aceste doua caracteristici cercetate.
Pentru stabilirea valorii numerice a coeficientului de asociere, care sA indice existenta ~i
intensitatea unei Iegaturi, formula cea mai utilizata este cea propusa de Yule:
Q=ad-bc
ad+beAcest indicator poate sA ia valori intre -1 ~i+ 1, aratand nu numai gradul de intensitate al asocierii
celor doua caracteristici, dar ~i sensul ei.
• Coeflcienul de corelatie a rangurilor propus de Spearman pentru serii paralele tarA frecvente:
6'Ld}r =1- ---"7=----
$ n3-n
in care:
d, - reprezinta diferenta intre rangurile perechii de valori (Xi,Yi); dj=rxi- ryi
n - numarul de perechi de valori.
• Coeflcientul de corelalie a rangurilor propus de Kendall pentru serii paralele tarA frecvente:
rk = 2·S • unde S = 'L(P; -Q;)n·(n-l)
in care:
P i - numarul rangurilor mai mari care urmeaza rangului curent pentru variabila dependent! - Y
Qi - numarul rangurilor mai mici care urmeaza rangului curent pentru variabila dependent! - Y
37
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 38/43
CURS STATISTICA MTC-ANULIFR
Tema 8. ANALIZA SERIILOR CRONOLOGICE
Una din sarcinile statisticii este aceea de a studia fenomenele ~iprocesele social-economice de masade-a lungul diferitelor perioade de timp sub aspectul evolutiei volumului acestora si al schimbarilorintervenite in structura lor, a interdependentelor dintre fenomene de natura diferita etc.
in munca de analiza concreta a dezvoltarii fenomenelor in timp, statistica foloseste ca instrumentprincipal de cercetare indicatorii obtinuti din prelucrarea statistica a seriilor cronologice. Calculul aeestorindicatori este precedat de elucidarea notiunii de "serie cronologica" ~i preeizarea particularitatilor acesteia.
Seria cronologica este fermata din doua siruri de date paralele, in care primul i~i arata variatiacaracteristicii de timp, iar eel de-al doilea sir variatia fenomenului sau caracteristicii cereetate, de la 0
unitate de timp la alta. Seriile cronologiee se mai numese si serii de timp sau serii ale dinamicii.La analiza seriilor cronologice trebuie avut in vedere unele proprietati ale acestora ~ianume:variabilitatea,
omogenitatea,
periodicitatea,
interdependenta termenilor prezentati.Variabilitatea tennenilor unei serii cronologice provine din faptul ca fiecare tennen se obtine prin
centralizarea unor date individuale diferite ca nivel de dezvoltare. Aceste diferentieri apar pe de 0parte eaurmare a actiunii factorilor intampUitori ~i pe de alta parte ca urmare a faptului ca in dinamica legilesociale si economice se manifests ca tendinta imprimand fenomenelor forme diferite de variatie, Cu catactiunea comuna a acestor factori este mai puternica eu atat variatia in cadrul seriei este mai mare ~itendintele de scurta si lunga durata mai greu de sesizat.
Avand in vedere aceasta trasatura, este necesar ca analizand 0 serie cronologica sa se masoare atatgradul ~i forma de influenta a factorilor esentiali, care imprima fenomenului 0 lege specifica de evolutie,cat ~i gradul de abatere de la aceasta tendinta generals rezultata din influenta faetorilor neesentiali, cucaracter intamplator.
Omogenitatea termenilor trebuie inteleasa in sensul ca in aceeasi serle nu pot fi inscrise decat
fenomene de acelasi gen, care sunt rezultatul actiunii acelorasi cauze esentiale, Asigurarea omogenitatiiobservatiilor de-a lunguI unei perloade de timp presupune mentinerea aceleiasi metodologii de calcul sievaluare a indicatorilor care urmeaza s a fie analizati in dinamica a criteriilor de clasificare a colectivitatiistudiate si nomenclatoarelor ~i lungimii intervalelor de grupare, mentinerea unitatii social-economice sauadministrativ teritorlale asupra careia s-au facut observatii, cat si a unitatii de masurare a timpului.Practic, inseamna ci de fiecare data, cand se analizeaza 0 serle statistica trebuie si se verifice daca dateleprovin din aceeasi sursa, are acelasi grad de cuprindere a unitatilor ~iau fost folosite aceleasi principii ~imetode de prelucrare, cu alte cuvinte este asigurata comparabilitatea datelor inscrise in aceeasi serie.o alta trasatunl caracteristica a seriilor cronologice 0constituieperiodicitatea termenilor din care este
fermata seria, ceea ce inseamna de fapt asigurarea continuitatii datelor din punet de vedere a variabilei detimp ~icare poate da posibilitatea interpretarii seriei cronologice ea0 functie analitica (yj=f(tj». Variabila de
timp poate fi inregistratli cu periodicitati diferite. De aceea, alegerea unitatii de timp la care se refera dateleunei serii cronologice trebuie tacuta in raport cu scopul cercetarii, al continutului ~i posibilitatilor demasurare a fiecarui indicator. De exemplu, productia industriala se poate urmari amt in unitati de timp mici(zilua, decada, luna) cat ~iinunitati marl de timp (trimestrul, semestrul, anul).
in cazurile cand unele earaeteristici sunt influentate in variatia lor de schimbare a anotimpurilor, eualte cuvinte apar fenomene cu caracter sezonier (lunar sau trimestrial) este obligatoriu sa se foloseasca 0
astfel de perlodizare a seriei.In studiul seriilor cronologice, se pune problema atat a alegerii unitatilor de timp la care se refera
fiecare indicator, cat ~ia lungimii etapei pentru care se prezinta datele, cu preeizarea anului de baza, Caan de baza se alege acel an care prezinta 0anumita semnificatie in evolutia fenomenului studiat.
38
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 39/43
CURS STATISTICA MTC - ANUL I FR
Interdependenta termenilor unei serii cronologice apare ca urmare a respectarii principiului unitatiide timp si spatiu si structurii organizatorice. Ca atare, indicatorii prezenti sunt valori succesive aleacelorasi fenomene inregistrate la nivelul aceleiasi unitati teritorial administrative sau orice unitatestatistica complexa care poate fi inregistrata autonom. Aceasta face ca valoarea fiecarui indicator sadepinda Intr-o oarecare n m s u r a de valoarea indicatorului precedent, ca urmare a faptului ca relatiile decauzalitate se manifesta in conditii asemanatoare de la 0unitate de timp Laalta.
in prezentarea dinamica a fenomenelor se pot intalni mai multe feluri de serii. Clasificarea seriilor
cronologice se face in functie de modul de exprimare a indicatorilor ~i dupa modul de exprimare atimpului la care se refera datele.
in functie de modul de e xp rima re a ind ic ato ri lo r din care esteformata seria, seriile eronologice pot :fi:
1. serii cronologiceformate din indicator!absolu(i,
2. serii cronologice formate din indicatori relativi,
3. serii cronologice formate din indicatori mediL
1. Seriile cronologice formate din indicatori absoluti
Reprezinta forma de baza a serlilor dinamice. Pe baza lor se pot obtine indicatorii generalizatoripeintreagaperioada
Indicatorii de nivel sunt chiar termenii unei serii formate din indicatori absoluti ( Y J , . . . y« ... , Yt).
NweIullDtolk .at al termenilor ( t . v, ) ,numai pentru seriile de intervale de limp de marimi absolute.
Modijicarile absolute
• cu bazlijixo(AtJl):
AUI=Yt - YI, unde, t =2,n
• cu baza in lant (bazli mobile sau variabila) (At/t-l):
Aut- l=Y t - Y t- I, unde, t =2, n
2. Serii cronologice formate din indicatori relativi
Constituie un mod de prezentare de regula procentual. In aceasta situatie este obligatorlu ca in titlusau in afara tabelului sa se specifice care este baza de raportare, pentru ea interpretarea datelor s a se facacorect.
a) Indice de dinamica
cu baza flXjj (It /I): 1t/l = Yt sau 111 1(%) = E ! . . ·100 unde t =2.nYl YI
•
• cu baza in lant ( I t I t - I ) : 1111-1 =Lau lul_I(%) =L100 unde t = 2,nY,-I Y t-l
b) Ritmul de dinamica
• cu bazafixa (~ tJ :~/I =1'/1(%) -100'10 t = 2. n
• cu baza in lant ( RtJt-I ) :
R,'t-l =1t1t-1(%) -10CPIo t =2,n
3. Serii cronologice formate din indicatori medii
Se folosesc ea mijloc de prezentare a evolutiei unor caracteristiei ealitative ce apar sub forma decategorii medii: productivitatea muncii, randamentul mediu, recolta medie la ha, salariul mediu etc. Deasemenea, se folosesc astfel de serii si pentru unele earacteristici eantitative atunci cand ele trebuie
39
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 40/43
CURS STATISTICA MTC-ANULIFR
incluse in analiza unor fenomene ce se produc in cadrul unui interval de timp, ca de exemplu: valoarea
medie anuala a fondurilor fixe, numarul mediu al personalului muncitor.
a) Nivelului mediu
• pentru 0 serle cronologica de intervale de timp formate din indicatori absoluti:. .L Y ,
y =.!=!._
n
• pentru 0 serie de momente cu intervale egale intre momente (media cronologica simpla ):
YI Y n2+ Y2 + Y3 +...+yj+...+ Yn-l +2
Yern-l
• pentru 0 serie de momente cu intervale neegale intre momente (media cronologica ponderatii):
( d , . ) ( d . . + d , _ J ( " ' - I + " ' ) ( d _ l)__ }'J 2 " +Y2 -2- + .. J 't 2 + · ·· + Y ..2
Y c r - ,;-1
L ' "b) ModiflCarea medie absoluta:
h. = ~ > ~ t l l - l sau ~=Y ..-y,
n-l n-l
c) Indicele mediu de dinamica(l):
-~au I= n« _!!...
Y t
Daca dispunem de mai multi indici medii ce caracterizeaza mai multe subperioade succesive de
timp, indicele mediu ce caracterizeaza intreaga perioada se calculeaza astfel:k
= L n : j "I I-I Inl I~ In; Ink= '·2 · · · · ·;· ..·/r.
in care:
I-ndicele mediu general de dinamica;
1 - indicii medii partiali de dinamica;n, - numarul indicilor eu baza in lant ce intra in componenta fiecarui indice mediu partial;
k - numarul subperioadelor, adica al indicilor medii partiali.
d) Ritmul mediu de dinamica
R = ( 1 ( % ) )-100%
Serii cronologice de intervale (perioade) de timp
Denumite si serii de fluxuri, sunt seriile statistice in care fiecare indicator reprezinta rezultatul
unui proces social-economic pe fiecare perioada de timp folosita in prezentarea datelor. Astfel de serii se
pot in1ilni in prezentarea evolutiei productiei, a cifrei de afaceri, a marimii investitiilor, a profitului
realizat, a creditului acordat si/sau rambursat etc. Ele se intocmesc pentru indicatori insumabili pe 0
anumita perioada de timp, care determina periodicitatea cu care se prezinta termenii seriei. Termenii
seriei de intervale pot fi cumulati obtinandu-se un indicator totalizator pe intreaga serie sau pe
subperioade.
40
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 41/43
CURS STATISTICA MTC-ANULIFR
Serii eronologiee de momente (sau de stocuri)
Sunt acelea in care fiecare indicator caracterizeaza marimea la care a ajuns caracteristica urmarita
sau volumul colectivitatii in momentul de calcul. De exemplu, puterea instalata, exprimata in mii Kw , la
s~itu1 fiecarui an; populatia Romaniei, la 1 iulie a fiecarui an; valoarea capitalului fix al intreprinderii x
la s~itu1 anului; valoarea capitalului investit in industrie la sfarsitul fiecarui trimestru sau an; numarul
depunatorilor ~i depozitelor la sfarsitul fiecarei luni etc.
Pentru seria de elemente este caracteristic faptul ca termenii ei nu se pot cwnula in vederea
obtinerii unui indicator statistic totalizator cu continut real pe intreaga perioada, deoarece seria de
momente cuprinde inregistrari repetate. De exemplu, 0 parte din marfurile de la 1 I se pot gasi s i in
stocurile de la 1 II, 1 III etc. Deci, acesti termeni reprezinta marimi de stoc. Caracterizarea nivelului atins
pe intreaga perioada nu se poate face, in acest c az , d ec at pe baza unui indicator mediu.
Scopul analizei datelor unei scrii cronologice este acela de a caracteriza modul de dezvoltare a
fenomenelor sociale ~i economice pe 0 perioada expirata, in vederea extrapolarii datelor statistice pentru
fundamentarea diferitelor calcule de prognoza. Aceasta analiza statistica se realizeaza in mod diferentiat
in functie de felul seriei (de stocuri sau de fluxuri); de lungimea seriei ~i de periodicitatea cu care este
inregistrata variabila de timp. Cea mai cuprinzatoare analiza statistica se realizeaza pentru seriile
cronologice, in care variatia de timp este continua ~ipe grafic se poate descrie sub forma unei cronograme(historiograme) ~ica atare poate fi interpretata ca 0 functie analitica de timp.
Metode analitice de ajustare
Metodele analitice au la baza un model matematic, in care tendinta centrala a evolutiei se exprima ca 0
functie de timp:
Yi =f(tJ n um i ta fu nc tie de ajustare,
in care:
ti - reprezinta valorile variabilei independente (timpul);
Y ; - reprezinta valorile variabilei dependente (fenomenele) care sunt prezentate in seria cronologica,
Alegerea tipului de functie care se potriveste eel mai bine pentru exprimarea trendului se face pe baza
urmatoarelor criterii aplicabile optional:
• criteriul bazat pe reprezentarea grajicii. Se construieste cronograma ~i se apreciaza forma
tendintei de evolutie
• critertul diferentelor. Se procedeaza la calculul diferentelor absolute cu baza in lant de ordinul
unu, doi etc. p a n a cand obtinem diferentele de ordin i aproximativ eonstante ajustarea facandu-
se dupa polinomul de gradul i.
• Daca fenomenul cercetat s-a dezvoltat in progresie g eometric a, a dic a indicii eu baza in lant
sunt constanti ( 1 1 1 1 - 1 = constant), admitem ca seria cronologica respectiva prezinta 0 tendinta exponentiala.
in urma alegerii functiei de ajustare dupa criteriile prezentate se impune estimarea parametrilor acestor
functii utilizand metoda celor mai mici patrate. Aceasta metoda are ca functie obiectiv minimizarea sumei
patratelor abaterilor valorilor reale de Ia cele ajustate deci:
min L ( Y i - 1 ' ; , r ti= 1, 2, ... .n timpuI
Trend liniar: Yti = a + b Ii
in care:
Yti - reprezinta valorile ajustate calculate in functie de valorile caracteristicii faetoriale (Ii);
a - reprezinta parametrul care are sens de marime medie ~i arata ce nivel ar fi atins y daca influenta
tuturor factorilor cu exceptia celui inregistrat, ar fi fost constanta pe toata perioada;
b - reprezinta parametrul care sintetizeaza numai influenta caracteristicii factoriale (I):
t, - reprezinta valorile caracteristicii factoriale care, in cazul seriilor cronologice, este timpul.
41
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 42/43
CURS STATISTICA MTC - ANUL I FR
Parametrii a si b se determina prin rezolvarea sistemului de ecuatii normale obtinut prin metoda celor
mai mici patrate (~::r'yj - (a +btJ)2 = min):
{
na+bLt; = L Y ;
aLt; +b~>: = ~>jyj
Pentru L t, =0, sistemul de ecuatii normale devine:
L Y ia=--
n
~t·Y·b=~ I I
Ltj2
{
na=L Y ;"2" de unde,b~tj = ~t,Y;
Variatia de timp trebuie centrata ~i pentru seriile impare se mascara in unitati iar pentru cele pare
injumlitliti de interval intre termenii serieiWocuind valorile calculate ale celor doi parametri in ecuatia de regresie ~i apoi inlocuind succesiv
valorile variabilei timp se obtin valorile ajustate ale caracteristicii rezultative.
Verificarea corectitudinii calcularii ecuatiilor de regresie se face pe baza relatiei L Ytt = L Y i
in care Yti = a + b . t,
Criterii de alegere a proeedeelor de ajnstare
a) Se calculeaza suma abaterilor, luate in valoare absoluta, dintre datele empirice si cele ajustate
I Y I - Y , I pentru toate procedeele de ajustare folosite. Se considera eel mai potrivit procedeul Ia
care se obtine L I Y t - 1 ' ; 1 =min.
b) se calculeaza coeficientul de variatie:
dV' = _ _ _ ! . ! _ ! _ • 100ylt -
Y
in care d y , t reprezinta abaterea medie liniara a valorilor reale de la valorile ajustate calculata
dupa formula:
nSezonalitatea este variatia produsa de influenta modificarii succesive a anotimpurilor
Metoda grafiei; se prezinta succesiv variatia de timp astfel tncat in cronogramA s a apara
tendintele de variatie pe luni, trimestre sau semestre dupa cum este alcatuita seria.
Metoda mediilor mobile; se calculeaza medii mobile provizorii sau definitive dupa numarul determeni - par sau impar - din care se calculeaza mediile ~i se face ajustarea seriei. Numarul mediilor
mobile este mai mic fatAde numarul termenilor seriilor
Se ajusteazA ~i se calculeaza mediile multi anuale lunare, trimestriale, sau semestriale calculate
din rapoartele dintre valorile ajustate ~i eele reale si se calculeaza indicii de sezonalitate ea raport intre
fiecare medie partial! ~i media generala,
Metoda analitiei difera numai prin faptul ca inainte de a caleula sezonalitatea se ajusteaza seria
de date impirice printr-o functie analitica care corespunde, eu tendinta obiectiva de dezvoltate in timp a
fenomenului.
42
5/13/2018 teorie statistica - slidepdf.com
http://slidepdf.com/reader/full/teorie-statistica 43/43
CURS STATISTICA MTC-ANULIFR
Extrapolarea seriilor cronologice
Extrapolarea datelor unei serii statistice are la baza metodele ~iprocedeele folosite la ajustare.
Pentru a face distinctie intre termenii ajustati (Yti) ~icei extrapolati - care sunt considerati tot termenii
teoretici - se vor nota termenii extrapolati cu r;;, iar variabila de timp cu t,'.Deci, formulele de calcul vor fi:
• pentru extrapolarea pe baza sporului mediu:A _
1 ' ; ' = YI +d{t -1)I
• pentru extrapolarea pe baza indicelui mediu de crestere:
1':' = y . / / - 1t, 1
Aceste formule se aplica atunci cand se folosesc valorile parametrilor ( l \ , I ) din perioada expirata, In cazul
cand acestia se modifica, formulele se modi fica cu un coeficient K, astfel:
Y , ; = Y o + t;l1 ' incare:l1t=k·l1
Y , ' = Yo . i'±t' in care: l'= ki
43