stata - usmeni

83
8/3/2019 stata - usmeni http://slidepdf.com/reader/full/stata-usmeni 1/83 Статистика 1. Појам и значај статистике? Реч статистика има два значења. У свакодневном животу реш статистика се односи на нумеричке податке, као што су приходи породице, старост судената, почетна плата приправника...У другом значењу реч статистика се односи на научну дисциплину и као такву можемо је дефинисати на следећи начин: Статистика је научни метод који се користи за прикупљање, приказивање, анализу и интерпретацију података и доношење закључака. Одлуке донете на основу статистичких метода називају се проценам и прогнозама, док одлуке које се доносе без статистичких метода су обична нагађања и као таква нису поуздана. Као и свака научна дисциплина статистика има два аспекта: Теоријска или математичка статистика бави се развојем, извођењем и доказивањем статистичких теорема, метода, формула, правила и закона. Примењена статистика подразумева примену тих теорема, метода, формула, правила и закона у решавању реалних проблема 2. Дескриптивна и инфернцијална статистика? Пимењена статистика у најширем смислу речи може да се подели на две области и то:  Дескриптивна статистика се састоји од метода прикупљања, сређивања, приказивања и описивања података, помоћу графикона, табела и сумарних показатеља. Инфернцијална статистика је област која обухвата статистичке методе које примењујемо да бисмо на основу резултата из узорка дошли до закључака о карактеристикама целог скупа. Ова област статистике назива се још и индуктивна статистика. Вероватноћа која представља шансу јављања одређеног исхода повезује ове две статистике. 3. Параметри расподеле фреквенција? Расподела фреквенција представља статистичку табелу у којој су приказане све категорије или групни интервали, као и број вредности који припадају свакој од њих, а које називамо фреквенције или учесталост понављања. Нумеричке мере су статистички показатељи који на синтетички начин описују посматране податке (једним податком описују се карактеристике свих посматраних података). Смисао ових мера је: Статистичке мере класификујемо у четри групе: - Скрипта за усмени део из основа статистичке анализе- 1 1. Теоријски 1. Дескриптивну статистику  1.да нам једним податком опишу карактеристике посматраних података 2. да нам омогуће поређење између више статистичких серија података ПИТАЊА ИЗ ОБЛАСТИ ДЕСКРИПТИВНЕ СТАТИСТИКЕ ОД 1-18

Transcript of stata - usmeni

Page 1: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 1/83

Статистика

1. Појам и значај статистике? 

Реч статистика има два значења. У свакодневном животу реш статистика се односи нанумеричке податке, као што су приходи породице, старост судената, почетна плата

приправника...У другом значењу реч статистика се односи на научну дисциплину и као таквуможемо је дефинисати на следећи начин:Статистика је научни метод који се користи за прикупљање, приказивање, анализу иинтерпретацију података и доношење закључака.Одлуке донете на основу статистичких метода називају се проценам и прогнозама, док одлуке које се доносе без статистичких метода су обична нагађања и као таква нисупоуздана.Као и свака научна дисциплина статистика има два аспекта:

Теоријска или математичка статистика бави се развојем, извођењем и доказивањемстатистичких теорема, метода, формула, правила и закона.Примењена статистика подразумева примену тих теорема, метода, формула, правила изакона у решавању реалних проблема

2. Дескриптивна и инфернцијална статистика? 

Пимењена статистика у најширем смислу речи може да се подели на две области и то:

 Дескриптивна статистика се састоји од метода прикупљања, сређивања, приказивања иописивања података, помоћу графикона, табела и сумарних показатеља.Инфернцијална статистика је област која обухвата статистичке методе које примењујемода бисмо на основу резултата из узорка дошли до закључака о карактеристикама целогскупа. Ова област статистике назива се још и индуктивна статистика.Вероватноћа која представља шансу јављања одређеног исхода повезује ове двестатистике.

3. Параметри расподеле фреквенција? 

Расподела фреквенција представља статистичку табелу у којој су приказане свекатегорије или групни интервали, као и број вредности који припадају свакој од њих, а којеназивамо фреквенције или учесталост понављања.

Нумеричке мере су статистички показатељи који на синтетички начин описујупосматране податке (једним податком описују се карактеристике свих посматранихподатака). Смисао ових мера је:

Статистичкемере

класификујемо у четри групе:

- Скрипта за усмени део из основа статистичке анализе-1

1. Теоријски

1. Дескриптивну статистику 

1.да нам једним податком опишу карактеристике посматраних података2. да нам омогуће поређење између више статистичких серија података

ПИТАЊА ИЗ ОБЛАСТИ ДЕСКРИПТИВНЕ СТАТИСТИКЕ ОД 1-18

Page 2: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 2/83

Статистика

Дескриптивне статистичке мере описују податке како на ниво скупа тако и на нивоуузорка, тј. приписују се статистичком скупу или узорку у зависности од тога да ли сеизрачунавају на бази скупа или на бази узорка. Дескриптивне мере које се анализирају набази скупа називамо параметри скупа, а дескриптивне мере које се анализирају на базиузорка називају се статистиком узорка.

5. Основни скуп и узорак? 

Основни скуп или популација се састоји од свих елемената или јединицапосматрања чије карактеристике испитујемо а чине га појединци, ствари или догађаји.Основни скуп који се проучава назива се још и циљна популација.

Закључци о основном скупу доносе се увек на бази дела тог скупа који називамо узорком.Узорак представља део основног скупа који је изабран у сврхе статистичке анализе.Прикупљање података о елементима основног скупа или узорка може се спроводити

путем анкете. Анкета која укључује све елементе скупа назива се још и пописом. Обзиромна то да је основни скуп често веома велик, у пракси се ретко спроводи, па се анкетаспроводи на основу изабраног узорка, тј. закључке о карактеристикама скупа заснивамо наоснову информација из узорка. Оваква анкета назива се узорачка анкета.

Без обзира да ли се до податка долази путем пописа или узорачке анкете, сврха је дасе одреде карактеристике скупа, па је неопходно да узорак буде репрезентативан, тј. даодсликава карактеристике скупа. Према томе узорак је репрезентативан ако одсликава скуп.

6. Аритметичка средина- особине и интерпретација?  Аритметичка средина је најчешће коришћена мера централне тенденције, а назива се

и просек. Добија се када се збир свих вредности подели бројем података.Аритметичка средина као просечна вредност свих јединица скупа изравнава апсолутнеразлике између података посматране серије. Она има све потребне особине којекарактеришу мере централне тенденције, уз додатне особине које су значајне за њенупримену, а то су:

- Скрипта за усмени део из основа статистичке анализе- 2

1) мере централне тенденције2) мере варијације (дисперзије; одступања)3) мере облика распореда4) релативно учешће (пропорција)

1. Аритметичка средина већа је од најмње вредности, а мања од највеће вредностиобележја.

2.Ако су све вредности обележја једнаке тада ће и аритметичка средина бити једнакавредности ма ког обележја.

3. Збир одступања свих вредности обележја од аритметичке средине једнак је увек 

нули, што би у случају негруписаних података могло бити записано на следећи начин:Σ (xi - µ )=0, а у случају груписаних података Σ f i (xi - µ )=0

4. Збир кавдрата одступања свих вредности обележја од аритметичке средине јеминималан тј. мањи је од збира квадрата одступања ма које вредности обележја која

се налази у домену тих обележја, тј. Σ (xi - µ )2=min а у случају груписаних

података Σ f i (xi - µ )2=min

5.Ако су вредности два обележја повезане неком линеарном функцијом онда су

ињихове аритметичке средине повезане аритметичком средином.

Page 3: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 3/83

Статистика

Аритметичка средина за негруписане податке добија се када се збирвредности свих обележја подели бројем података.

Код груписаних података аритметичка средина добија се тако што се вредност свакогобележја пондерише одговарајућом фреквенцијом, а затим се збир тако добијенихвредности подели сумом свих фреквенција.

Уколико су подаци груписани као непрекидна обележја, најпре се одређује срединасваког интервала а затим средине интервала множимо одговарајућим фреквенцијама.

Аритметичка средина није најбољи показатељ када у серији имамо екстремнихвредности.

6. Модус – појам особине и компарација са аритметичком средином ? 

Модус је обележје (нумеричко или атрибутивно) којe се у једној серији најчешће јавља, ако су подаци негруписани, или обележје (нумеричко или атрибутивно) које у једнојсерији има највећу фреквенцију ако су подаци груписани. Због тога он представљанајзаступљенију вредност.

Највећи недостатак модуса је у томе што је могуће да једна серија података нема

модуса или има више од једног модуса, док је аритметичка средина само једна.Уколико се у једној серији података свака вредност појављује само једном, онда затакву серију кажемо да нема модус. Серија података у којој се само једна вредност јавља санајвећом фреквенцијом има само један модус и такву серију називамо унимодална. Серијаподатака у којој се два обележја јављају са истом највећом фреквенцијом има два модуса иназива се бимодална¸а ако више од две вредности имају исту највећу фреквенцију онда сетаква серија назива мултимодална.

Модус је лако лоцирати али такође има недостатак у односу на аритметичку срединушто не обухвата све вредности серије података, па се у пракси ретко користи. Може селоцирати без обзира на којој скали је мерљиво обележје. 

7. Репрезентативност узорка? 

Статистички узорак представља део статистичког скупа на основу чијих особинадоносимо закључке о карактеристикама скупа из кога је узорак изабран.

Узорак не узимамо никада да би смо сазнали карактеристике узорка, већ искључивода би уопштавањем информација из узорка дошли до информације о карактеристикамаскупа. Да би закључци о карактеристикама скупа били валидни неопходно је да узорак будерепрезезнтативан.

Узорак је репрезентативан ако својим карактеристикама одсликава особинестатистичког скупа из којег је изабран.

Статистика увек користи метод узорка како би дошла до сазнања о непознатој

вредности параметра скупа. Узорак при томе није сам по себи циљ већ средтво да се дођедо информације о одређеном парметру скупа.

При томе је битно нагласити да савршено репрезентативан узорак не постоји, јеркада би се случајним избором увек добијао репрезентативан узорак онда би се статистичкозакључивање свело на мерење елемената једног узорка, израчунавање жељене вредностии њено проглашавање за параметар скупа.

Обзиром да из неке популације можемо у зависности од величине скупа, избораузорка са или без понављања изабрати већи или мањи број узорака, вредности које се уњима добију разликоваће се од узорка до узорка па самим тим и од вредности параметра.

Због тога што највећи број узорака није савршено репрезентативан, статистика којасе израчунава на основу вредности из параметра популације није прецизна оценапараметра.

- Скрипта за усмени део из основа статистичке анализе-3

Page 4: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 4/83

Статистика

Када се користе технике случајног узoрковања за избор елемената у узорак онда сеузорачка грешка може израчунати и анализирати, и што је она мања узорак јерепрезентативнији.

Све остале грешке које нису које нису узорачке означавају се као неузорачке грешкеи оне се јављају као последица недостатка података, грешке у записивању, грешке приуносу података у рачунар, као и аналитичке грешке. Уз то неузорачке грешке јављају се икао последица нејасно дефинисаног циља истраживања, неподесних и погрешнодефинисаних питања у упитницима...

Лоше дефинисан оквир истраживања такође проузрокује грешке овог типа.Грешке у одговорима такође смањују репрезентативност узорка.Да би узорак био што репрезентативнији треба настојати да се смање неузорачке

грешке, док се узорачке у великом броју података смањују или потпуно нестају.Узорак је савршено репрезентативан само у следећа два случаја:1. када је велишина узорка једнака величини скупа2. Ако би скуп био апсолутно хомоген односно састваљен од идентичних јединица, па

би посматрањем само једне јединице скупа дошли до истих резултата као и посматрањемцелог скупа.

8. Извори података ? 

Према извору података који се користе у статистичком истраживању све податкеможемо груписати у примарне и секундарне статистичке податке. Примарни статистичкиподаци прикупљају се поступком статистичког посматрања и прикупљања података, док сесекундарни подаци добијају из секундарних извора, као што су заводи за статистику, илиинституције овлашћене за прикупљање података (централна банка, царинска служба,матичне службе општина, извештаји о пословању...).

Статистичко истраживање може се заснивати на потпуном обухвату свих јединица,које се обезбеђује применом статистичког пописа и извештаја.Статистичким пописом се најчешће прикупљају подаци остновништву, становима,

домаћинствима и пољопривредним газдинствима.Основне карактеристике пописа су:1. свеобухватност – ( посматрање свих јединица скупа)2. истовременост пописа – пописис се врше увек у истим размацима времена ( на примерсвке пете или десете године) при чему краћи интервали обезбеђују тачније податке.3. врше се у времену када је стање појаве нормално ( на пример када није сезона одмора,празника, суше, поплаве...).

Статистички извештај, као метод потпуног посматрања користи се код појава кодкојих је већи варијабилитет током времена или простора. Извештаји могу да се односе настање запослених, остварену производњу, кретање становништва...

Иако статистички попис и статистички извештај дају најсигурније и најпоузданијеинформације о појави, они се због величине обухвата јединица, великог броја учесника,великих трошкова, не оправдавају у сваком истраживању, већ се примењује методделимичног посматрања засновано на статистичком узорку.

Статистичко узoрковање представља методологију којом се на основу посматрања једног дела јединица скупа доносе закључци о карактеристикамa целог скупа.

Примена метода узорка подразумева анкетирање као једнобразно прикупљањеподатака, а оно се обезбеђује адекватним упитницима и припремом анкетара и лица која ћеих попуњавати. Од начина састављања питања, јасне дефиниције обележја која сепосматрају, начина давања одговора, као и обучености анкетара у великој мери зависиуспех анкете.

9. Медијана – појам, особине и компарација са аритметичком средином ? 

- Скрипта за усмени део из основа статистичке анализе- 4

Page 5: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 5/83

Статистика

Медијана је позициона мера централне тенденције која се дефинише на следћиначин:

Медијана је једнака вредности обележја које се налзи у средини серије чији су подациуређени (рангирани) од најмањег ка највећем. Она дели серију на два једнака дела иуколико је број чланова у серији непаран она је једнака вредности средишнњег чланасерије, а уколико је паран онда је једнака аритметичкој средини два средишња члана.

Као и аритметичка средина медијана спада у мере централне тенденције, али онасе одређује према позицији коју заузима у серији, при чему се половина вредности обележјаналазе испод вредности медијане, а друга половина изнад вредности медијане. Предносткоришћења медијане у односу на аритметичку средину је у томе што на њу не утичуекстремне вредности, па ако у серији има таквих вредности онда је медијана бољипоказатељ централне тенденције од аритметичке средине.

Под екстремним вредностима подразумевамо оне вредности које се у односу наостале вредности занчајно разликују било као изузетно мале или изузетно велике.

Медијана се углавном користи код непараметарских истраживања, а аритметичкакод параметарских, и медијана се може одредити и када су обележја мерљива наординалној скали, а аритметичка средина само на интервалној и скали односа.

10. Врсте променљивих и мерне скале? 

Променљива (обележје) је особина скупа која се испитује и по којој се јединицепосматрања међусобно разликују.

Променљива може бити квантитативна ( нумеричка ) или квалитативна(атрибутивна ).

Квантитативна ( нумеричка ) променљива је она врста променљиве која се можебројчано исказати. Подаци о квантитативној променљивој називају се квантитативнимподацима.

Вредности одређене квантитативне променљиве могу бити пребројиве и

непребројиве. На пример можемо пребројати број аутомобила коју има једна породица, алине можемо да пребојимо висину неког њеног члана. Променљива чије вредности можемопребројати назива се прекидном или дискретном променљивом, и она може да узме самоизоловане вредности које су најчешће цели бројеви, а не и међувредности.

Као примере прекидне случајне променљиве можемо навести број аутомобилапродатих у току дана, број грла стоке које поседује један пољопривредник, број ученика уразреду...

Непрекидна променљива може узети било коју вредност између два броја и њеневредности не могу се пребројати, и такву променљиву називамо непрекидном иликонтинуираном променљивом.

Као примере непрекидних променљивих можемо навести време чекања на услугу у

 једном сервису, време трајања испита, висину, тежину...Променљиве које се не могу бројчано исказати, али се могу разврстати у различите

категорије јесу кавлитативне или категоријске променљиве (атрибутивна). Подациприкупљени о оваквој променљивој називају е квалитативни подаци.

Пример квалитативне променљиве јесу. статус студената јер се могу сврстати укатегорију самофинансирајући или на буџету, боја косе, марка аутомобила, пол,националност, вероисповест...

У зависности од природе посматране појаве; модалитета променљиве као и од циљаистраживања сваки ниво мерења има посебну скалу при чему се успешност мерењаизражава количином прибављених информација. Постоје 4 нивоа мерења и 4 мерне скале:

- Скрипта за усмени део из основа статистичке анализе-5

Page 6: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 6/83

Статистика

Ово је најнепрецизнија скала јер не показује никакав однос(разлику) између модалитета. Користи се само код атрибутивних

обележја међу чијим модалитетима не постоје кавнтитативне разлике као на примервероисповест, шифра делатности, занимање, бројеви на дресу, градске зоне паркирања...

Класификација се уводи чисто ради форме, као на пример 1- ожењен; 2- неожењен;3- удовац; 4- удовица; 5- разведен... или на пример 1- банкарство; 2- пољопривреда;3- водопривреда; 4- електропривреда... Примећујете да овде бројке не представљајуникакав квалитативан јер не можемо направити квалитативну разлику на основу брачногстања или на основу делатности у којој је неко запослен. Редни бројеви ученика који су удневнику заведени под азбучним редом такође представљају ниво мерења на номиналнојскали на пример 1.Алексић Дејан 2.Бранковић Марија 3.Вељковић Марина...Овде нам редниброј под којим је заведен ученик не показују никакав квлитативан однос већ би моралиимати неки други показатељ, на пример просечна оцена, залагање на часу ... Вршење билокаквих рачунских операција са бројевима на овој скали је бесмислено, тј. не бисмо добилиникакав смислени податак на пример не бисмо ништа добили ако би сабирали модалитетеожењен(1)+неожењен(2)+удовац(3)+ удовица(4)...

  Ова скала је прецизнија од номиналне, јер нам она показује однос,а користи се код атрибутивних обележја међу којима постојиквалитативна разлика, тј. код оних обележја које можемо рангирати.

Таква обележја су на пример успех у школи са модалитететима недовољан; довољан;добар; врло добар и одличан, јер се између ових модалитета може направити квалитативнаразлика мада не баш прецизна обзиром да на пример врло добар успех обухвата“релативно“ велику категорију имеђу којих постоје значајне разлике, јер врло добар ученик може бити и онај који има просек 3,50 и онај који има просек 4,49; или можда још бољипример замагљене прецизности код ученика који има успех недовољан, обзиром данедовољан успех може имати и ученик са једном непролазном оценом и онај са пет

непролазних. Сличан пример може бити и ранг листа фудбалских клубова у којима би например Црвена Звезда била прва на листи са на пример 50 бодова, а на другом местуВојводина са свега 12 поена, што значи да би фудбалска лига имала на првом и другомместу „у врху“ два клуба изнеђу којих очигледно постоји драстична разлика у квалитету.Сетите се и бројних примера са председничким изборима гд еје на пример на првом местукандидат „ А.А“ на првом месту са освојених 2.000.000 гласова, а на другом месту кандидат„Б.Б.“ са 130.000 гласова. Очигледно би у првом примеру као мерило успеха правилнијебило као критеријум успеха узети просечну оцену, у другом број поена који је сваки клубосвојио, а у трећем број гласова који је председнички кандидат добио. На овој скали такођенема смисла вршити било какве рачунске операције, из истих разлога као и кодноминалне скале.

Ралику између ове две доста сличне скале најлакше ћете направити ако себи поставитепитање да ли се модалитети могу рангирати, па ако је одговор да, онда је обележјемерено на ординалној скали, а ако је не онда је на номиналној.

Овом сваком модалитету се придружује број, при чему једнакеразлике између бројева представљају једнаке разлике мернекарактеристике. Интервална скала омогућује утврђивање

редоследа модалитета у скупу као и меру њиховог разликовања. За интервалну скалукарактерисрично је да нулта вредност не значи непостојање појаве, јер ова скала јекарактерисрична по томе што се код ње нулта вредност утврђује договором или

конвенцијом, па самим тим за једну исту величину можемо имати различите мерне скале,као на пример за мерење температуре ваздуха ( може се исказати и Целзијусовом и

- Скрипта за усмени део из основа статистичке анализе- 6

1. Номинална скала

2. О динална скала

3. Инте вална скала

Page 7: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 7/83

Статистика

Фаренхајтовом скалом, тј. у Келвиновим степенима). Такође и календарско време јетипично за ову скалу јер хришћани као нулту тачку времена узимају годину рођења ИсусаХриста; муслимани Мухамеда...Немојте „упасти у замку“ и помислити да је карактеистикамерне скале то што се иста појава може исказати у различитим интервалним скалама, већда код ње нула не значи непостојање појаве, већ да је само нулта таччка одређенапроизвољно. Тако на пример температура од 0 степини, било Целзијусових, билоКелвинових не значи да температуре нема. Да ли би брзина од 0 метара у секунди или 0километара на час значила да нема ветра тј. да он не дува. Свакако да је одговор да, штозначи да брзина ветра није мерена на интервалној скали (генерално брзина било чега нијена овој скали, као на пример брзина кретања аутомобила) већ се за њу користи нареднаскала коју називамо скала односа. Пошто скала односа садржи бројеве који заистапоказују квалитативан однос на њој се могу вршити све рачунске операције. На примеримало би смисла сабрати укупну месечну температуру а затим поделити са бројем дана умесецу и тако добити просечну дневну температуру за посматрани месец.

Скала односа је најпрецизнија скала, због тога што као и интервалнаскала показује редослед модалитета и меру њиховог разликовања ализа разлику од ње она има праву нулу тј. на њој можемо мерити појаве

које по природи имају нулу, или боље речено код које нула заиста означава непостојањепосматране појаве. Наведен вам је пример за брзину ветра; брзину аутомобила, а наводимвам и још неке примере који су типични за ову скалу а то су: висина, тежина, приход, јачиназемљоотреса...

Интервална и ординална скала једним именом називају се кардиналне скале, и онепредстваљају нумеричке скале тј. једино код њих бројеви који се додељују модалитетимаимају „прави значај“.

11. Аритметичка средина и медијана узорка? 

Аритметичка средина узорка израчунава се на основу података из узорка, а озрачунава се

по обрасцуn

xΣx i= уколико је реч о негруписаним подацима, тј по обрасцу

N

xf Σx ii= ако су

подаци груписани. Показује нам колико износи просечна вредност у узорку и најчешће се

користи у параметарском статистичком оцењивању и тестирању параметарских хипотеза.Поседује веома важну особину да је непристрасна оцена аритметичке средине скупа.

Медијана узорка велику примену код непараметаеских тестова, односно оних тестовакод којих није задовољена претпоставка о нормалности основног скупа.

Да би оцењивање било коректно спроведено пожељно је да оцене задовољавају некекарактеристике од којих су следеће најважније:

-Оцена параметра је непристрасна ако је њена очекиванавредност у просеку једнака параметру који оцењујемо. За

аритметичку средину аритметичких средина узорака кажемо да је непристрасна оценааритметичке средине скупа јер иако се већина aритметичких средина појединих узорака,

раликује од µ , оне су у просеку једнаке µ .Ако у сваком узорку израчунамо медијану (me),

- Скрипта за усмени део из основа статистичке анализе-7

4.Скала односа

НЕПРИСТРАСНОСТ

Page 8: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 8/83

Статистика

затим формирамо распоред медијана узорака и израчунамо очекиавну вредност овог

распореда добијамо једнакост E(me)=µ , па закључујемо да је и медијана непристраснаоцена аритметичке средине основног скупа.

-Особина непристрасности иако је потребна није довољна да би оценапараметрa била ваљана. На пример оцена може да буде непристрасна

и да истовремено има велику варијансу. Зато поред непристрасности оцену треба да

карактерише што мањи варијабилитет.Будући да су и и Me непристрасне оцене аритметичке средине скупа, изабраћемо ону са

мањом варијансом. Однос између оцена варианси ових оцена није увек стабилан, већзависи од облика распореда основног скупа, али код нормалног распореда важи релација:

δ 2Ме=1,57δ 2

 што значи да је  57% ефикаснија оцена од медијане.

Код распореда који имају већу спљоштеност медијана узорка је ефикаснија оцена одаритметичке средине узорка.

12. Структурне серије и временске серије? 

Серије структуре показују распоред статистичког скупа према модалитетима, односнопрема вредностима обележја.

Ове серије могу садржати обележја чији модалитети могу бити атрибутивни илинумерички. Специфичну врсту серије структуре по атрибутивним обележјима су географске(територијалне) серије.

1. Низови атрибутуивних података формирани на основу атрибутивних обележјапредствљају атрибутивне серије структуре. Атрибутивна обележја изражавају се описно иза њихову класификацију потребно је имати јасну шему класификације, а она најчешћезависи од циља истраживања.

2.Низови нумеричких података формирани на основу нумеричких обележја називају

се анлогно са атрибутивним обележјима нумеричке серије структуре, тј. распоредфреквенција.Нумеричка обележја могу бити као што смо нагласили прекидна и непрекидна, па

сходно томе и серије структуре са нумеричким обележјима могу бити серије структуре сапрекидним и непрекидним обележјима. Уколико је реч о нумеричким обележјима која супрекидана (да се подсетимо узимају само једну вредност, која је најчешће цео број), онда сеобележја групишу у растућем низу од најмањег ка највећем.

Временске серије представљају низове статистичких података који су сложенихронолошким редоследом, па се често називају хронолошким серијама.

Ове серије показују варијабилитет појаве током времена и формирају се из два низаподатака од којих се један односи на време, а други на ниво (величину) појаве. У зависности

од природе података о појави могу бити:

1.интервалне2. моментне

1.Моментне временске серије показују ниво појаве у тачно одређенимузастопним временским моментима ( нпр. стање залиха на дан 31.12; број запослених накрају месеца...). Моментне серије се добијају као резултат више узастопних пописа илистатистичких извештаја о стању појаве.

2. Интервалне временске серије показују кретање појаве у узастопнимвременским интервалима. Њима се најчешће приказује кретање нивоа производње,

плата, трошкова живота...

- Скрипта за усмени део из основа статистичке анализе- 8

ЕФИКАСНОСТ

Page 9: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 9/83

Статистика

Моментне временске серије нема смисла сумирати (сабирати), јер се њиховимсумирањем не добија никакав логичан податак, док је код интервалних временских серија тодозвољено. Покажимо то на једноставном примеру : Једно предузеће имало је сваке годинеисти број запослених нпр. у периоду од 2001.-2005. Уколико би смо сабрали све податке засвих пет година ове моментне серије добили би вредност од 150, која не би ништапредстављала, барем не у контексту посматраног броја запослених.

Посматрајмо сада податке о производњи једне врсте аутомобила који је сваке годинеу периоду од 2001.-2005. производио 5.000 аутомобила. Уколико би сабрали податке заових пет година добили би број од 25.000, чије би значење било врло логично тј. то би билапетогодишња производња овог произвођача аутомобила.

13. Апсолутне и релативне мере дисперзије ? 

Мере централне тенденције ( средње вредности ) нису довољне да нам у потпуности опишураспоред јединица статистичког скупа. Може се десити да једна мера средње вредности будепотпуно иста за различите серије података. Због тога она не може бити довољна карактеристикасвих посматраних јединица са становишта њиховог варијабилитета.

Мере варијације могу се поделити у зависности од тога да ли се варијације изражавају уасполутним или релативним мерним јединицама. Уколико су мере изражене у јединицама мере у

којим је изражено обележје онда говоримо о апсолутним мерама варијације, а ако су израженепроцентуално или у стандардним девијацијама онда говоримо о релативним мерама варијације.

Такође се мере варијације могу поделити и на основу тога да ли се њихова вредност одређујепрема позицији коју заузимају у серији података или се добијају рачунским путем, тј. помоћуобрасца, на израчунате и позиционе, као и мере централне тенденције.

1. Интервал варијације- Представља најједноставнији показатељ варијабилитета у једној серијиподатака и даје само приближну информацију о варијабилитету серије података, јер на његововеличину утичу само две вредности највећа и најмања. Уколико су те две вредности екстремнеутолико ће његова вредност бити нереално велика и на погрешан начин одсликавати варијацијепосматране серије. Такође интервал варијације није осетљив на величину серије података, што јењегов други недостатак. Због тога се у пракси ретко користи.2 .Варијанса – Уколико би уместо збира апсолутних одступања у бројилац ставили збир квадратниходступања свих чланова серије од аритметичке средине, а у именилац број података, добили бимеру варијабилитета која се назива варијанса и показује нам просечна квадратна одступања одњихове аритметичке средине.3. Стандардна девијација – Како варијанса представља меру варијабилитета која се честопримењује у статистици, она има велики недостатак што квадрира одступања, па се приликом њенеинтерпретације она исказана у квадратима мерни јединица ( на пример број деце2; годинестарости2 ), а такође се повећава величина израчунатог показатеља, па се због тога израчунаваквадратни корен из варијансе чиме се добија најчешће коришћена мера варијабилитета устатистици стандардна девјација.

Стандардна девијаација представља просечно одступање свих података од аритметичке

средине.

4. Коефицијент варијације – За разлику од апсолутних мера варијабилитета које се исказују умерним јединицама у којима је исказано обележје, коефицијент варијације исказује се у процентимаи зато га обавезно користимо када поредимо варијабилитет између две појаве које нису исказане уистим мерним јединицама, јер коефицијент варијације елиминише мерне једиице ( на пример ако би желели да упоредимо да ли група студента више варира према тежини или висини станарине којуплаћају за изнајмљени стан, дошли би до погрешног закључка јер студенти од просечне висинемогу варирати 10 центиметра, а према висини станарине коју плаћају за изнајмљени стан за 1.500 динара1.500> 10, међутим када би то све свели на проценат добили би упоредиве податке). Сетите се ибројних примера о еластичности тражње, која је исказана у % и за хлеб и за луксузне аутомобиле.

- Скрипта за усмени део из основа статистичке анализе-9

Page 10: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 10/83

Статистика

Коефицијент варијације нам показује колико износе одступања у процентима свих податакаод аритметичке средине.

5. Стандардизовано одступање – Ово је такође релативна мера варијабилитета, па се због тогакао и коефицијент варијације користи за поређење варијабилитета, али његов значај је и у томе штоне показује варијабилитет са гледишта целине већ са гледишта појединачних података усерији. Другим речима стандардизовано одступање је једина мера варијабилитета на основу којегможемо израчунати колико износи одступање једне вредности обележја од аритметичке средине.

Исказује се у стндатдним девијацијама.Интервал варијације, варијанса и стандардна девијација представљају апсолутне мередисперзије, а коефицијент варијације и стандардизовано одступање релативне мере дисперзије.

14. Попис и узорачка анкета? 

Статистичко истраживање може се заснивати на потпуном обухвату свих јединица,које се обезбеђује применом статистичког пописа и извештаја.Статистичким пописом се најчешће прикупљају подаци остновништву, становима,домаћинствима и пољопривредним газдинствима.Основне карактеристике пописа су:

1. свеобухватност – ( посматрање свих јединица скупа)2. истовременост пописа – пописис се врше увек у истим размацима времена ( на примерсвке пете или десете године) при чему краћи интервали обезбеђују тачније податке.3. врше се у времену када је стање појаве нормално ( на пример када није сезона одмора,празника, суше, поплаве...).

Статистички извештај, као метод потпуног посматрања користи се код појава код којих јевећи варијабилитет током времена или простора. Извештаји могу да се односе на стањезапослених, остварену производњу, кретање становништва...

Иако статистички попис и статистички извештај дају најсигурније и најпоузданијеинформације о појави, они се због величине обухвата јединица, великог броја учесника,

великих трошкова, не оправдавају у сваком истраживању, већ се примењује методделимичног посматрања засновано на статистичком узорку

Статистичко узорковање представља методологију којом се на основу посматрања једног дела јединица скупа доносе закључци о карактеристикам целог скупа.

Примена метода узорка подразумева анкетирање као једнобразно прикупљањеподатака, а оно се обезбеђује адекватним упитницима и припремомо анкетара и лица којаће их попуњавати. Од начина састављања питања, јасне дефиниције обележја која сепосматрају, начина давања одговора, као и обучености анкетара у великој мери зависиуспех анкете.

15. Позиционе и зрачунате мере дисперзије? 

Мере дисперзије могу поделити и на основу тога да ли се њихова вредност одређујепрема позицији коју заузимају у серији података или се добијају рачунским путем, тј. помоћуобрасца, на израчунате и позиционе, као и мере централне тенденције.

У позиционе мере дипрезије спадају:1. интервал варијације

2. интерквартилна разлика

У израчунате мере дисперзије убрајамо:1. варијансу

2. стандардну девијацију

- Скрипта за усмени део из основа статистичке анализе- 10

Page 11: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 11/83

Статистика

3. коефицијент варијације4. стандардизовано нормално одступање

1. Интервал варијације- Представља најједноставнији показатељ варијабилитета у једној серијиподатака и даје само приближну информацију о варијабилитету серије података, јер на његововеличину утичу само две вредности највећа и најмања. Уколико су те две вредности екстремнеутолико ће његова вредност бити нереално велика и на погрешан начин одсликавати варијацијепосматране серије. Такође интервал варијације није осетљив на величину серије података, што је

његов други недостатак. Због тога се у пракси ретко користи. Недостатак интервала варијације можесе отклонити једном такође позиционом мером дисперзије интерквартилном разликом, која серачуна као разлика између кавртила првог и трећег реда, али и даље остаје недостатк што се и онрачуна на бази само две вредности, из којих смо елиминисали 25% најмањих и 25% највећихвредности, па је по правилу интерквартилна разлика увек мања од интервала варијације.2 .Варијанса – Уколико би уместо збира апсолутних одступања у бројилац ставили збир квадратниходступања свих чланова серије од аритметичке средине, а у именилац број података, добили бимеру варијабилитета која се назива варијанса и показује нам просечна квадратна одступања одњихове аритметичке средине.3. Стандардна девијација – Како варијанса представља меру варијабилитета која се честопримењује у статистици, она има велики недостатак што квадрира одступања, па се приликом њенеинтерпретације она исказана у квадратима мерни јединица ( на пример број деце2; године

старости2 ), а такође се повећава величина израчунатог показатеља, па се због тога израчунаваквадратни корен из варијансе чиме се добија најчешће коришћена мера варијабилитета устатистици стандардна девјација.

Стандардна девијаација представља просечно одступање свих података од аритметичкесредине.

4. Коефицијент варијације – За разлику од апсолутних мера варијабилитета које се исказују умерним јединицама у којима је исказано обележје, коефицијент варијације исказује се у процентимаи зато га обавезно користимо када поредимо варијабилитет између две појаве које нису исказане уистим мерним јединицама, јер коефицијент варијације елиминише мерне једиице ( на пример ако би желели да упоредимо дали група студента више варира према тежини или висини станарине којуплаћају за изнајмљени стан, дошли би до погрешног закључка јер студенти од просечне висине

могу варирати 10 центиметра, а према висини станарине коју плаћају за изнајмљени стан за 1.500 динара1.500> 10, међутим када би то све свели на проценат добили би упоредиве податке). Сетите се ибројних примера о еластичности тражње, која је исказана у % и за хлеб и за луксузне аутомобиле.

Коефицијент варијације нам показује колико износе одступања у процентима свих податакаод аритметичке средине.

5. Стандардизовано одступање – Ово је такође релативна мера варијабилитета, па се због тогакао и коефицијент варијације користи за поређење варијабилитета, али његов значај је и у томе штоне показује варијабилитет са гледишта целине већ са гледишта појединачних података усерији. Другим речима стандардизовано одступање је једина мера варијабилитета на основу којегможемо израчунати колико износи одступање једне вредности обележја од аритметичке средине.Исказује се у стндардним девијацијама.

16. Сређивање и графичко приказивање квантитативних податка? 

Статистички подаци приказују се графички у виду одговарајућих геометријскихоблика, ознака на географским каратама или сликовито популарних приказа ( слика ифигура ).

Геометријски облици који се користе за приказивање података називају седијаграми.

Картограми су графички прикази статистичких података на географским картама.Дијаграми су много чешће у употреби од картограма и могу бити:

- Скрипта за усмени део из основа статистичке анализе-11

Page 12: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 12/83

Статистика

1.Тачкасти дијаграми користе се за приказивање статистичких података у видутачака. На Х осу наносе се вредности обележја а на У- осу фреквенције.

2.Линијски дијаграми служе за приказивање података помоћу линија. Они честонастају и повезинањем стигмограма у једну пуну линију: Линијски дијаграми користе се заприказивање структуре статистичког скупа према модалитетима једног обележја или заупоређивање динамике две или више појава током времена.

3.Површински дијаграми у приказивању података користе површине различитихоблика ( правоугаоника, кругова, пирамида...). Посебну врсту површинских дијаграма чинехистограми, који се користи за приказивање већег броја обележја у виду правоугаонихповршина (стубаца) а користимо га увек за приказивање непрекидних обележја.

Графичко приказивање може се вршити у правоуганом координатном сиситему и ванкоординатног система. Уколико се врши приказивање у правоугаоном координатномсиситему тада се подаци могу приказивати и на правоугаоном координатном сиситемукао и у поларном дијаграму ( њега углавном користимо када приказујемо времнске серијечији су подаци дати за краће временске интервале на пример месеце или квартале).

Приликом приказивања у првоугаоном систему може се користити аритметичка илилогоритамска скала. Ако је на ординати ( У- оси ) аритметичка скала ( исказана уоригиналним јединицама), реч је о аритметичком дијаграму, а ако је коришћеналогоритамска скала реч је о полулогоритамском дијаграму.

4.За приказивање података изван координатног система подаци се најчешћеприказују у облику површинским дијаграмима – круговима, квадратима , пирамидама...

17. Расподела кумулативних фреквенција? 

Некада се апсолутне фреквенције кумулирају па се уместо појединачних фреквенцијаза сваки модалитет обележја користе њихове кумуланте, тј. кумулиране фреквенције.

Кумулирање фреквенција врши се тако што се почевши од прве фреквенције вршипоступно сабирање односно сукцесивно додају збиру претходних фреквенција. Тако седобијају такозване кумулиране фреквенције „испод“, које нам показују коликовредности обележја у скупу имја вредност која је мања или једнака од горње границегрупног интервала.

Слично тако могу се добити и кумулиране фреквенције „изнад“, тј. опадајућа

кумуланта, на тај начин што се последња фреквенција препише а затим се сукцесивносабира са осталим фреквенцијама. Опадајућа кумуланта или кумуланта изнад нам показујеколико вредности обележја модалитета у скупу има вредност која је већа од доњегранице групног интервала.

18. Однос између аритметичке средине, модуса и медијане? 

Симетричност распореда може се одредити на два начина:

- Скрипта за усмени део из основа статистичке анализе- 12

1. тачкасти2.линијски

3.површински

1. Преко коефицијента асиметрије α 3 који представљарелативну меру асиметрије.

2. Преко односа мера централне тенденције тј.аритметичке средине, модуса и медијане.

Page 13: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 13/83

Статистика

Асиметричност распореда може се одредити преко мера централне тенденције тј.стављањем у однос аритметичке средине; модуса и медијане, па закључак о асиметрији наоснову ове три мере доносимо на следћи начин:

µ  ≅ Ме ≅ Мо

Рапоред је приближно симетричан

 µ  > Ме> МоРаспоред је позитивно асиметричан

µ  < Ме< Мо Распоред је негативно асиметричан

19. Параметри расподела фреквенција? 

  Статистика испитује варијабилне појаве на два начина:

1. На бази свих података статистичког скупа (метод пописа)2. На бази дела тог скупа (метод узорка).

Узорак представља само средство до којег се долази до података о карактеристикамаскупа, што значи да узорак сам по себи није циљ, већ средство да се дође до неке битненумеричке карактеристике скупа. Такве карактеристике скупа у статистици се називајупараметрима скупа.

Изсаме

дефиниције параметра можемо закључити да је то један број који се односи искључиво наскуп и да се до њега може доћи једино путем обухватања свих елемената скупа.

Пошто у статистици ретко користимо метод пописа, због великих трошкова,

немогућности обухватања свих јединица скупа (ако је скуп бесконачан)...то значи да довредности параметра скупа не можемо доћи. Међутим у статистици се о непознатомпараметру скупа долази на основу одговарајућег показатеља из узорка, и такав показатељназивамо статистика узорка или само статистика.

Све

параметре можемо груписати у четри групе у зависности од тога на који се нумеричкипоказатељ односе, и то :

1. Параметре локације (централне тенденције)2. Парметре диспрзије

3. Параметре облика распореда4. Параметре пропорције (релативног учешћа)

Пошто се параметри по дефиницији односе на једну нумеричку вредност која је добијена наоснову података из скупа.

- Скрипта за усмени део из основа статистичке анализе-13

ПИТАЊА ИЗ ОБЛАСТИ ПРЕКИДНИХ И НЕПРЕКИДНИХ

СЛУЧАЈНИХ ПРОМЕНЉИВИХ ОД 20 - 29

Параметар скупа (или само параметар) је нека сумарна нумеричка

Статистика узорка је нека сумарна нумеричка вредност тог узорка.

Page 14: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 14/83

Статистика

20. Експеримент, исход и простор узорка? 

СТАТИСТИЧКИ ЕКСПЕРИМЕНТ- То је прцизно формулисан начин посматрања иприкупњаља података о некој појави. Сваки могући исход неког експеримента називамослучајним или елементарним догађајем.Например при експерименту бацања коцкиценумерисане бријевима од 1-6 елемнтарни догађај био био сваки од бројева 1;2;3;4;5;6.

ПРОСТОР УЗОРКА- Скуп свих елементарних догађаја називамо простором узорка.Догађај може бити:1.немогућ-например при бацању коцкице немогућ је догађај да ће пасти на број осам.2.сигуран- например при бацању коцкице сигурно је да ће она пасти на неки број који јемањи или једнак броју шест.3.неизвестан тј.може имати више исхода-например при бацању коцкице незвено је на којиће број она пасти,али је извесно да ће то бити неки број у интервалу од 1-6

21. Концепти вероватноће? 

Постоји неколико концепата вероватноће од којих су вам за овај предмет битна само два ито:

Класичан – математички (a priori вероватноћа)До вероватноће долазимо без претходног решења експеримента при чему су елементарнидогађаји независни и подједнако вероватни, као на пример оцена на испиту где суелементарни догађаји оцене од 5-10, и све су подједнако вероватне.

Статистички концепт- (a poѕteriori вероватноћа)Понављамо експеримент безброј пута а затим утврђујемо одговарајуће вероватноће), што

би у случају са оценом на испиту значило да сви елементарни исходи нису једнаковероватни.У пракси експеримент се не врши бесконачно пута па овим концептом само можемо стећи„пристојну слику“ о вероватноћама ,тј. вршимо њихово оцењивање.

Субјективни концепт- по овом концепту вероватноћа је мера неизвесности по којојособа логички долази до закључка на основу искуства.

22.Очекивана вредност и ст андардна девијација дискретне (прекидне) случајнепроменљиве? 

Аналогно са распоредом фреквенција где су најважнији показатељи µ као средња

вредност и δ 2 као мера дисперзије, то су код распореда вероватноћа очекивана вредност и

Е ( Х ) и2xδ као мера дисперзије.

Поставља се питање како да формулишемо такве мере код распореда вероватноћа,обзиром да не располажемо апсолутним фреквенцијама. Прва и једина могућа идеја једа вредности случајне променљиве помножимо одговарајућим вероватноћама, па би такодошли до мере централне тенденције која се у теорији вероватноће назива очекиванавредност и обележава се са Е(Х), а израчунава се по обрасцу:

- Скрипта за усмени део из основа статистичке анализе- 14

Вероватноћа је мера неизвесности која се у облику броја приписује сваком догађају.Њенеособине су:

1.увек је позитивна

Е (Х)= Σ xi×pi

Page 15: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 15/83

Статистика

Ако знамо да је аритметичка средина скупаi

ii

  f  

  f   x

Σ

Σ= µ  на основу обрасца за релативну

фреквенцијуi

ii

f Σ

f p = , дошли би до закључка да је разлика између аритметичке средине и

очекиване вредности у томе што су код аритметичке средине пондери апсолутнефреквенције, а код очекиване вредности вероватноће. Ако знамо да је на нивоуконачних скупова релативна фреквенција једанка вероватноћи доћи ћемо до закључка да

 је Е (Х)=µ .Очекивана вредност представља центар или средину прекидне случајне

променљиве, а самим тим се поставља питање у којој мери остале вредности прекиднеслучајне промнљиве одступају од очекиване вредности, тј.колико износи дисперзија осталих података одочекиване вредности?

По сличној аналогији са варијансом распореда фреквенција, потребно је квадриратизбир одступања од свих вредности случајне променљиве од њене очекиване вредности( њеног просека ) и тако добијамо меру дисперзије случајне променљиве која је се зове

варијанса прекидне случајне променљиве, а обрачунава се по обрасцу:

Варијанса прекидне случајне променљиве има иста ограничења као и варијансараспореда фреквенција, тј. интерпретира се у квадратним мерним јединицама ( ако јеслучајна променљива исказана у кг, онда ће варијанса прекидне случајне променљиве битиисказана у кг2). Овај недостака као што вам је познато отклања се као што вам је познато ииз дескриптивне статистике кореновањем варијансе , те се добија стандардна девијацијаслучајне променљиве.

23. Случајна променљива? 

24.Р ас 

подела вероватноће дискретне (прекидне) случајне променљиве? 

Прекидна случајна променљива узима коначан број вредности из интервала и њимасе могу приписати вероватноће.

- Скрипта за усмени део из основа статистичке анализе-

случајна променљива xi

X1 X2 X3 X4

вероватноћа pi p1 p2 p3 p4

15

Очекивана вредност Е (Х) представља просек случајне променљиве, илиочекивана вредност је једнака просеку случајне променљиве

[ ] pixExiΣδ22

x )(

СЛУЧАЈНА ПРОМЕНЊИВА је нумеричка функција која сваком исходустатистичког експеримента придружује један реалан број.

Page 16: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 16/83

Статистика

По дефиницији распоред вероватноће прекидне сучајне променљиве је скуп уређенихпарова вредности случајне променљиве са одговарајућом вероватноћом.

Особине распореда вероватноћа су следеће:

Ниједна вероватноћа у распореду није негативна P( X= xi ) ≥ 0

Укупна вероватноћа у распореду вероватноћа случајне променњиве једанака је 1

Σ Pi =1

Распоред фреквенција је експериментални модел где сваком обелжју придружујемоодговарајућу фреквенцију,а распоред вероватноћа је теоријски модел где свакојвредности случајне променљиве придружујемо одговарајућу вероватноћу.

Гранична вредност релативне фреквеције заправо представља вероватноћу а разликаизмеђу релативних фреквенција и вероватноћа настаје услед малог броја понављањаексперимента.

25. Расподела вероватноће непрекидне случајне променљиве ? 

 Непрекидна случајна променљива узима бесконачно много вредности из одређеног

интервала па је немогуће анализирати  0

1pi =

∞= , па самим тим код непрекидне случајне променљиве нема смисла говорити о

томе да она узме једну вредност већ само да је ≤ ; > или да се налази у неком интервалуОсобине распореда вероватноће непрекидне случајне променљиве

1. Дефинисан је за све вредности од - ∝ до +∝2. Вероватноћа је увек позитивна

3. Површина испод криве вероватноће је једнака 1

∫+∞

∞=1dxxf p )(

4. Функција распореда је вероватноћа да непрекидна случајна променљива узме некувредност која је мања или једанка од уочене вредности.

F( X)= P ( X ≤ xi )

F (X) код прекидне случајне променљиве рачунамо сабирањем вероватноће, а код

непрекидне случајне променљиве интегралом.

5. P ( a < x <b )= P (a ≤ x < b)= P ( a < x ≤ b)= P ( a ≤ x ≤ b)6. Свако питање вероватноће своди се на функцију распореда чије су вредности дате у

одговарајућим таблицама, како би се избегло интегрисање.

P( x ≤ a )= F ( a )

P( x ≥ a ) = 1- F (a )

P ( a ≤ x ≤ b)= F (a ) – F ( b )

27. Нормалан распоред, особине и значај ? 

- Скрипта за усмени део из основа статистичке анализе- 16

Распоред вероватноће непрекидне случајне променљиве је глатка крива линија која

Page 17: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 17/83

Статистика

Нормалан распоред има централну улогу у статистичкој теорији и пракси, нарочито удомену статистичког закључивања.

За случајну променљиву кажемо да има нормалан распоред ако је карактеришунепреккидне вредности а њена функција густине вероватноће има израз :

Такву случајну променљиву означавамо са X : N ( µ , δ 2 ) што се чита Х има нормалан

распоред са параметрима µ и δ 2

Особине нормалног распореда

1. Нормална крива има облик звона, уномодална је и симетрична у односу на аритметичкусредину.

2. Аритметичка средина, модус и медијана су једанаки.

3. Крива се протеже од - ∝ до +∝ тј. асимптотски се приближава апциси ( х – оси ), па је

интервал варијације бесконачан i= ∝

4. Релативна мера асиметрије α 3 једнака је нула , а релативна мера спљоштености α 4

 једанка је три α 3=0 ; α 4=35. Укупна површина испод нормалне криве једнака је 1 ( 100%)

Како је крива симетрична у односу на аритметичку средину то значи да се 50% површиненалази испод аритметичке средине, а 50% изнад аритметичке средине. Пошто је површинаиспод криве заправо вероватноћа то значи да је вероватноћа да случајна променљива Хузме вредност мању или већу од аритметичке средине 50%.

6. Нормалан распоред је у потпуности дефинисан са два параметра µ  и  δ 2 . Постоје

различити случајеви нормалног распореда у зависности од вредности параметра µ  и  δ 2.

два нормална распореда са једнаким варијансама и различитимаритметичким срединама

два нормална распореда са једнаким аритметичким срединама иразличитим варијансама.

- Скрипта за усмени део из основа статистичке анализе-17

22 δ2μxeπ2δ

1xf  /)()( −=

=  22 δδ <

µ 1< µ 2 2

2

2

1 δδ =

Page 18: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 18/83

Статистика

разликују се и аритметичке средине и варијансе

7.

а)68% вредности обележја налази се на удаљености од једне стандарне девијације

вероватноћа да случајна променљива узмевредност у овом интервалу је

б) на удаљености од две стндардне девијације налази се95% вредности обележја, вероватноћа да случајна

променљива узме вредност у овом интервалу је:

в) на удаљености од три стандардне девијације налзи се99,7% вредности обележја, тј. вероватноћа да случајна променљива узме вредност у овоминтервалу износи 99,7%.

Код нормалног распореда важе следеће релације:

Ако случајна променљива Х1 : N (µ 1,21δ ) и Х2 : (µ 2,

22δ ) у том случају:

- Скрипта за усмени део из основа статистичке анализе- 18

 22 δδ ≠

- < < + ≈  

- < < + ≈  

- < < + ≈  

Х1 + Х2 : N (µ 1+ µ 2 ;21δ +

22δ )

Х1 - Х2 : N (µ 1 - µ 2 ;21δ +

22δ )

n Х1 : N ( nµ 1; n2

1δ )

Page 19: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 19/83

Статистика

28. Нормалан и студентов распоред – особине и примена? 

Нормалан распоред има централну улогу у статистичкој теорији и пракси, нарочито удомену статистичког закључивања.

 За случајну променљиву кажемо да има нормалан распоред ако је карактеришу непрекидне

вредности, а њена функција густине вероватноће има израз :

Такву случајну променљиву означавамо са X : N ( µ ,

δ 2 ) што се чита Х има нормалан распоред са параметрима

µ и δ 2

Особине нормалног распореда

1. Нормална крива има облик звона, уномодална је и симетрична у односу на аритметичкусредину.

2. Аритметичка средина, модус и медијана су једанаки.

3. Крива се протеже од - ∝ до +∝ тј. асимптотски се приближава апциси ( х – оси ), па је

интервал варијације бесконачан i= ∝

4. Релативна мера асиметрије α 3 једнака је нула , а релативна мера спљоштености α 4

 једанка је три α 3=0 ; α 4=35. Укупна површина испод нормалне криве једнака је 1 ( 100%)

Студентов распоред први је открио и формилисао Вилијем госет и објавио у раду подпсеудонимом „студент“. Због тога се та расподела назива још и Студентова или т

расподела. т Расподела донекле је слична нормалној расподели: Попут криве нормалнерасподеле крива т- расподеле је симетрична око аритметичке средине и никада се не спајаса хоризонталном Х-осом. Укупна површина испод т криве је једанка 1 или 100%. Међутим,студентова расподела је више спљоштена од криве стандардизоване нормалнерасподеле. Другим речима крива т расподеле има мању издуженост и већу распшеностод нормалне криве. Како се величина узорка повећева онда студентова расподела сеприближава нормалној расподели.Облик криве т расподеле зависи и од броја степени слободе df ( degrees of freedom). Као икод стандардизоване нормалне криве аритметичка средина т расподеле је једнака нули,али за разлику од стандардизоване нормалне расподеле чија стандардна девијација износи

1, стандардна девијација студентове расподеле је ) /( 2df df  − што је увек веће од 1. Значи

да је стандардна девијација студентове расподеле већа од стандардне девијацијенормалног распореда.

Нормалан распоред при оцењивању и тестирању употрбљавамо:1. Када оцењујемо непознату аритметичку средину, а варијанса скупа нам је позната

2. Када оцењујемо непознату аритметичку средину, а варијанса скупа нам је непозната, аузорак је већи од 30 елемента.

3.Када тестирамо хипотезе о непознатој аритметичкој средини, а варијанса нам је позната.4. Када тестирамо хипотезе о непознатој аритметичкој средини, а варијанса нам је

непозната а узорак већи од 30 елемената.5. Када тестирамо хипотезе о једнакости аритметичких средина, а варијансе скупа су нам

познате.

- Скрипта за усмени део из основа статистичке анализе-19

22 δ2μxeπ2δ

1xf  /)()( −=

Page 20: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 20/83

Статистика

6. Када тестирамо и оцењујемо пропорцију основног скупа, уколико су испуњени услови заапроксимацију нормалног распореда.

Студентов распоред при оцењивању и тестирању хипотеза употребљавамо:

1. Када оцењујемо непознату аритметичку средину, узорак је мањи од 30 а варијанса скупанам је непозната df=n-1

2. Када тестирамо хипотезе о непознатој аритметичкој средини на једном узорку санепознатом варијансом скупа а узорак је мањи од 30 елемената. df=n-1

3. Када тестирамо хипотезе о једнакости аритметичких средина а варијансе скупа су намнепознате. df=n1+n2-2

4. У регресионој анализи приликом оцењивања непознатог параметра β 1 df=n-2

5. У регресионој анализи када тестирамо занчајност оцене параметра β 1 df=n-26. У регресионој анализи приликом оцењивања просечне вредности зависно променљиве Y

df=n-27. У регресионој анализи при предвиђању индивидуалне вредности зависно променљиве Y

df=n-2

8. У вишеструкој регресији приликом оцењивања непознатих параметара β 1 и β 2 df=n-3

9. У вишеструкој регресији приликом тестирања значајности оцена параметра β 1 и β 2 df=n-3

10. У корелационој анализи приликом тестирања значајности добијене оцене коефицијентапросте линеарне корелације df=n-2

29. Стандардизована нормална расподела – значај и примена? 

Да би смо одговарајуће проблеме решили применом нормалног рапореда, а да притом избегнемо интегрисање тј. да уместо рачунања одговарајућих интеграла користимотаблице, било би неопходно да за сваку од појава које имају приближно нормалан распоредимамо посебне таблице ( на пример посебне таблице за висину ,посебне за тежину,

посебне за личне доходке...). Како је таквих појава безброј ( у првој половини 20 векасматрало се да све појаве имају нормалан распоред, али се то ипак показало каонетачним), настла је потреба да се пронађу јединствене таблице које би нам омогућиле дабез обзира о којој појави је реч проблем решимо помоћу једних таблица. Тај проблем серешио стандардизацијом нормалног распореда, тј. свакој вредности случајне променљиведодајемо одговарајућу трансформисану вредност случајне променљиве по обрасцу:

Трансформацијом X у Z добијамо за свку вредност X одговарајућу вредностZ, која показује смер и одступање вредности нормалне променљиве Х одаритметичке средине исказано у стандардним девијацијама.

Ако је на пример Z= 2, то значи да стндардизована случајна променљива одступа за +2 стандардне девијације од аритметичке средине.; ако је случајна променљива Z= – 2,5, тозначи да случајна променљива Х одступа испод аритметичке средине за своје две и постандардне девијације.

- Скрипта за усмени део из основа статистичке анализе- 20

μδzxσ

μxZ i

i+

−=

Z: N (0 ;1)

За нормалан распоред кажемо да је у стандардизованом облику ако је његовааритметичка средина једанка нули, а стандардна девијација једнака јединици, што

к аће можемо записати сле ећем облик :

Page 21: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 21/83

Статистика

1. Вредности стандардизоване случајне променљиве (обележавају се са мало  z  или

 z 0) дате су у таблицама број 3 и заокружене су на две децимале. Претколона таблице

садржи вредности  z а друга децимала се очитав у издвојеном првом реду таблице. У

пресеку тако добијеног греда и колоне налзи се тражена вредност функције распореда. Такона пример да вероватноћа да случајна променљива узме вредност која је мања или једнакаод 2,25 износи :

P ( Z ≤ 2,25)= F (2,25)= 0,9878

 z  0,01 0,02 0,03 0,04 0,05

0,0

0,9878

0,1

.

.

.

2,2

2. Очигледно је да се таблица број 3 може користити и у обрнутом смеру. односно запроизвољну вероватноћу може се одередити она тачка Z0за коју је функција распореда једнака вероватноћи. На пример ако је познато да вредност функције распореда износи0,9878 онда у таблици број 3. можемо видети да је тачка Z0 =2,25 тј.

F( Z≤  Z0)= 0,9878 Z0 =2,25.На основу таблица број три можемо одредити вероватноћу да се случајна

променљива Z нађе ун еком интервалу, на пример од -1,5 – 2,25.Тражена вероватнноћа израчунава се у општем случају коришћењем релације

3. На основу таблица број 3. можемо одредити и вероватноћу да се случајнапроменљива Z нађе у интервалу који је симетричан у односу на аритметичку средину.Ово ће нам нарочито бити значајно када формирамо интервал поузданости за аритметичкусредину.

Ако би смо тржили вероватноћу да се случајна променљива з нађе у некоминтервалу који је симнетричан у односу на аритметичку средину на удаљности од ± једнестандардне девијације, онда би то могли записати у следећем облику.

Овим смо показали да се заиста у размаку од ± једне стандардне девијације налази68,26 % вредности обележја, па ако би уопштили образац да израчунамо вероватноћу да сеслучајна променљива z нађе у неком интервалу чије су границе симетричне у односу нааритметичку средину, онда би се тражена вероватноћа тражила по обрасцу :

Због симетричности нормалног распореда, образац да израчунамо вероватноћу да

се случајна променљива z нађе у неком интервалу чије су границе симетричне у односу нааритметичку средину можемо записати и у следећем облику :

- Скрипта за усмени део из основа статистичке анализе-21

F ( z1 ≤ Z ≤ z2 ) = F(z2) – F(z1)= P ( -1,5 ≤ Z ≤ 2,25)= F(2,25) - F(-1,5)= 0,9878 – 0,0068= 0,921

F ( z1 ≤ Z ≤ z2 ) = F(z2) – F(z1)= P ( -1 ≤ Z ≤ 1)= F(1) - F(-1)= 0,8413 – 0, 1587= 0,

P - z ≤ Z ≤ z  = F z – F -z

2 F ( z ) - 1

Page 22: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 22/83

Статистика

 

 јер је F (-z) = 1 - F (z), па би заменом у општи образац добили 2 F ( z ) – 1.

У

петходном примеру тражена вероватноћа је могла да се добије и на следећи начин:

4. Као и у осталим случајевима и овде је могуће применити супротан поступак,односно да познавајући вероватноћу да се случајна променљива Z узме вредност у некоминтервалу одредимо и границе тог интервала, што ће нам опет бити корисно у наредимпоглављима.

Ако је на пример познато да вероватноћа да износи 0,6826 границе интерваламожемо одредити на основу релације 2 F ( z ) – 1 постављајући следећу једнакост:

2 F ( z ) – 1= 0,6826  F ( z )= 1,6826/2= 0,8413 , па је тражена граница симетричногинтервала у таблицама број 3. ±1

5. Осим што се применом нормалног распореда могу одредити тражене

вероватноће, вредност случајне променљиве  z за задату вероватноћу, границе

симетричног интервала, на основу њега можемо за свако произвољно µ и δ 2 одредитивредност оригиналне случајне променљиве.

30. Параметри скупа и њихове оцене? 

Оцењивање је поступак којим се нумеричка вредност или вредности додоељујупараметру основног скупа на основву информација из узорка.

У статистичком закључивању са µ  се означава аритметичка средина скупа а са Рпропорција скупа, а постоје и други параметри који се оцењују, попут варијансе, медијане,

модуса...Када би могли да спроведемо попис (потпуно посматрање ), сваки пут када желимода да нађемо вредност параметра онда нам поступак оцењивања не би би потребан.Међутим како попис изискује високе трошкове а често није ни могуће обухватити све јединице посматрања, па зато обично узимамао узорак из популације, израчунавамовредност одговарајуће статистике узорка. Затим додељујемо вредност статистике узоркаодговарајућем параметру популације засновану на вредности статистике узорка.

Вредност која се додељује параметру скупа заснована на вредности узорка називамооцењена вредност. Из једног скупа можемо извући више различитих узорак чије ће се оцењене вредностимеђусобно разликовати, практикује се да се узима само један узорак из основног скупа и

да се на основу његове вредности донесе закључак о непознатом параметру скупа. Таквувредност називамо оцена.

- Скрипта за усмени део из основа статистичке анализе- 22

Другим речима када је нормално распоређена случајна променљива симетричнау односу на аритметичку средину, тражена вероватноћа се може одредити преко

горње границе интервала.

F z1 ≤ Z ≤ z2 = F z2 – F z1 = P -1 ≤ Z ≤ 1 = 2 F 1 – 1 = 2 × 0,8413 – 1= 0,6826

Page 23: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 23/83

Статистика

Статистика узорка која се користи за оцењивање параметра скупа назива се оцена.Оцењене вредности могу бити тачкасте и интервалне.Ако изаберемо узорак и израчунамо вредност статистике узорка за овај узорак, онда

ова вредност представља тачкасту оцењену вредност одговарајућег параметра скупа ( µ ;

π ).У случају интервалног оцењивања уместо придруживања једне вредности параметру

скупа, конструише се интервал око тачкасте оцењен вредности за које се верује да садржи

одговарајући параметар скупа. Такав поступак називамо интервално оцењивање, а таквуоцену интервалном оценом.

31. Прост случајан узорак? 

Ово је најједноставнији и најчешћи начин избора узорка, који служи и као основа заостале технике избора узорка.

Ако из основног скупа величине N извлачимо узорке од n елемената тако да свакиузорак има исту вероватноћу да буде изабран онда такав узорак називамо прост случајанузорак.

Прост случајан узорак може бити узорак са и без понављања.

У поступку избора узорака са понављањем елемент који смо изабрали у узорак враћамо у основни скуп пре избора следећег елемента, што значи да исти елемент можемоизабрати више пута у узорак. Код узорака са понављањем узимамо у обзир и редоследизвлачења, тако да узорак са истим елементима сматрамо различитим ако је редоследизбора елемената различит.

Код узорака без понављања сваком елементу пружамо исту вероватноћу изборапре сваког извлачења па на тај начин обезбеђујемо међусобну независност избораелемената у узорак.

Када је основни скуп бесконачан из њега можемо да изаберемо и бесконачноразличитих узорака, па у том случају прост случајан узорак дефиничемо на следећи начин:Прост случајан узорак из бесконачног скупа је узорак у којем су све опсервације међусобно

независне, па је отуда прост случајан узорак без понављања из бесконачног скупаеквивалентан са простом случајним узорком са понављањем из коначног скупа, тј. у обаслучаја избори елемената из основног скупа су међусобно независни.

И поред наведене предности узорака са понављања у пракси ипак чешће користимоузорке без понављања и то из два разлога:

1. Основни скуп из којег бирамо елементе у узорак по правилу је велик па се променекоје сукцесивни избор елемената изазива на вероватноћама избора преосталих јединица

могу занемарити.2. Узорци без понављања су ефикаснији јер у њима нема поновљеног избора истих

елемената из основног скупа, па сваки новоизабрани узорак носи са собом новуинформацију.

32. Контролисани узорци? 

Поред избора елемената простим случајним путем постоје бројни методи случајногизбора елемената у узорак којим формирамо различите случајне узорке.

Случајан избор елемената у овој групи метода значи да свака јединица има познату,али не и обавезну и једнаку вероватноћу избора у узорак, док се основни скуп посматра каоскуп међусобно јасно разграничених подскупова. Овакви узорци се називајуконтролисаним узорцима и сваки од њих има предности инедостатке у односу на простслучајан узорак. Од контролисаних узорака најчешће користимо:

1. стратификовани узорак 

- Скрипта за усмени део из основа статистичке анализе-23

Page 24: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 24/83

Статистика

2. узорак скупина3. вишеетапни узорак 4.систематски узорак 

1. Стартификован узорак – Ако је основни скуп релативно хомоген, онда простслучајан узорак предствља добру основу за доношење прецизних оцена о параметру скупа.Али ако је основни скуп хетероген тј. ако се његови елемнти битно разликују попосматраном обележју онда прост случајан узорак неће бити репрезентативан, а закључцикоје доносимо на основу њега неће бити прецизни. Да би повећали репрезентативностслучајног узорка вршимо стратификацију основног скупа, делћи основни скуп на известанброј подскупова које називамо стратуми, а затим из сваког стратума бирамо по један простслучајан узорак. Тако формирана унија простих случајних узорака назива сестратификовани узорак.

Као критеријун за деобу користимо неку од особина која је у чврстој вези са сапосматраним обележјем. На пример уколико нас занимају издаци за куповину књигастановника Београда, једанод критеријума за поделу скупа могао би бити ниво образовањастановника, па би у том случају могли поделити све становнике Београда на стратуме нижеобразовање; више образовање и високо. Из ова три подскупа изабрали би по један прост

случајан узорак тако да сваки елемент из по три стратума има подједнаку вероватноћу дабуде изабран у узорак., чиме обезбеђујемо репрезентативност узорка. Будући да стратуминису исте величине , јединице скупа међусобно неће имати исту вероватноћу да будуизабране у узорак, али су нам вероватноће избора унапред познате.

Сврха стратификације је двострука:1. Њоме се повећава репрезентативност узорка на основу којег доносимо закључке о

карактеристикама скупа.2. Стратификован узорак пружа информације и о појединим деловима основног скупа,

што нам омогућује да спроведемо засебну анализу сваког стратума.2. Узорак скупина и вишеетапни узорак – Ако је основни скуп веома велики или ако

не располажемо списком свих јединица основног скупа или не можемо да их

идентификујемо, уместо појединачних елемената скупа бирамо групе елемената тзв.скупине. Скупине представљају на одређен начин већ формиране целине унутар скупа, ипоп правилу се међусобно разликују по величини.

Узорак којим обухватамо све јединице изабраних скупина , тј. у свакој изабранојскупини извршимо попис, називамо простим узорком скупина. Претпоставимо да нас занимамишљење путника о квалитету услуга једног авио превозника. Уместо простог случајногизбора путника са свих летова у току једног месеца, случајним путем изабраћемо на пример15 летова и анкетирати све путнике на њима, узорак дакле обухвата 15 скупина. Да биоцена неке карактеристике била скупа на основу овог узорка била прецизна, потребно је даскупине по својој стррултури буду што сличније структури основног скупа; што је основнаразлика између стратификованог и узорка скупина.

Уколико узорком не обухватимо све елемнте у скупинама, већ случајним путембирамо само неке од њих, формирамо тзв. двоетапни узорак тако што:

1. у првој етапи бирамо скупине2. у другој етапи бирамо бирамо само неке од јединица унутар скупа.Ако су јединице у првој етапи превелике, онда ћемо формирати троетапни узорак,

тако што ћемо у другој етапи смањити избор јединица.Узорак скупина користимо када желимо да смањимо време и трошкове оцењивања,

али овај узорак је обично мање прецизан од простог случајног или стратификованог.3. Систематски узорак је случајан узорак је случајан узорак код којег избор елемената

из основног скупа вршимо по неком систематском реду полазећи од случајно изабраногпочетка. Да бисмо изабрали случајан узорак из коначног скупа, потребно је да формирамосписак свих јединица са редним бројевима.

- Скрипта за усмени део из основа статистичке анализе- 24

Page 25: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 25/83

Статистика

При избору систематског узорка важно је да познајемо особине основног скупа. Ако јередослед елемената основног скупа случајан, онда систематски узорак можемо посматратикао прост случајан узорак. Али ако редослед елемената није случајан ( ако су јединицепоређане по величини) тада један узорак неће дати задовољавајуће резултате.

33. Оцене парметра скупа и њихове особине? 

Даби

оцењивање било коректно спроведено пожељно је да оцене задовољавају некекарактеристике од којих су следеће најважније:

-Оцена параметра је непристрасна ако је њена очекиванавредност у просеку једнака параметру који оцењујемо.За

аритметичку средину аритметичких средина узорака кажемо да јенепристрасна оцена аритметичке средине скупа јер иако се већина аритметичких средина

појединих узорака, раликује од µ , оне су у просеку једнаке µ .Ако у сваком узоркуизрачунамо медијану (me), затим формирамо распоред медијана узорака и израчунамо

очекиавну вредност овог распореда добијамо једнакост E(me)=µ , па закључијемо да је имедијана непристрасна оцена аритметичке средине основног скупа.Такође важи и једнакост E(Pr )= µ , што занчи да је и пропорција узорака непристраснаоцена аритметичке средине основног скупа. За разлику од претходних наведених оцена, варијанса ако би је рачунали по обрасцу

S*=Σ (Xi -)2/n,

Она не би задовољила овај услов, јер као што сте видели у претходна два примераваријабилитет у узорцима је мањи од варијабилитета у скупу, па зато важи опште правило

S2*≠ δ 2, па закључујемо да је варијанса пристрасна оцена

варијансе основноог скупа, тј. она потцењује варијансу скупа, што нарочито долази доизражаја када оцењивање помоћу малих узорака.Због тога када израчунавамо варијансу или стандардну девијацију узорка у имениоцу

уместо n, користимо n-1.

-Особина непристрасности иако је потребна није довољна да би оценапараметр била ваљана.На пример оцена може да буде непристрасна ида истовремено има велику варијансу. Зато поред непристрасности

оцену треба да карактерише што мањи варијабилитет.

Будући да су и и Me непристрасне оцене аритметичке средине скупа, изабраћемо ону са

мањом варијансом. Однос између оцена варијанси ових оцена није увек стабилан, већзависи од облика распореда основног скупа, али код нормалног распореда важи релација:

δ 2Ме=1,57δ 2

  што значи да је  57% ефикаснија оцена од медијане.

-Оцена је конзистентна ако са повећањем величине узорка она тежи параметру којиоцењујемо.Типичан пример за конзистентну оцену је варијанса јер

- Скрипта за усмени део из основа статистичке анализе-25

Због тога је правило да ако је редослед елемената у скупу случајан тада бирамо само један

систематски узорак.

Ако редослед елемената у основном скупу није случајан бирамо вишесиситематских узорака.

ЕФИКАСНОСТ

НЕПРИСТРАСНОСТ

КОНЗИСТЕНТНОСТ

Page 26: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 26/83

Статистика

са повећањем величине узорка S2*δ 2. Другим речима варијанса је пристрасна и

конзистентна оцена.-Оцена је довољна ако користи све информације које узорак садржи о том

параметру.  је довољна оцена параметра µ , док Me није (не зависи од

свих елемената у узорку, јер је позициона средња вредност).

34. Тачкаста оцена и интервал поузданости оцене? 

Ако изаберемо узорак и израчунамо вредност статистике узорка, онда за овавредност представља тачкастуоцењену вредност одговарајућег параметра.

Тачкаста оцењена вредност- Вредност статистике узорка која се користи за за оценупараметра скупа.

За сваки узорак извучен из основног скупа очекује се да да различиту вредностстатистике узорка. Тако додељена вредност аритметичкој средини или пропорцији скупазависи од тога који је узорак извучен. Као последица тога, тачкаста оцењена вредност

додељује µ или π вредност која се увек разликује од параметра скупа.У случају интервалног оцењивања , уместо придруживања једне вредности

параметру основног скупа, конституише се интервал око тачкасте оцењене вредности закоји верујемо да садржи параметар основног скупа.

Код интервалног оцењивања намеће се питање који број би требало додати и одузетиод тачкасте оцењене вредности?

Одговор на ово питање зависи од:

1. стандардне девијације аритметичке средине узорка xδ ( стандардне грешке)

2. нивоа поузданости који је приписан интервалу

1. што је већа стандардна девијација аритметичке средине узорка већи је број којиодузимамо и додајемо тачкастој оцењеној вредности. Према томе очигледно је да уколико је распон вредности које x може узети већи, интервал формиран око аритметичке средине

мора бити шири да би обухватио праву вредност параметра скупа.2. величина која је одузета и додата мора бити већа уколико желимо већи интервалпоузданости. Интервалном оцењивању увек приписујемо одређено тврђење из теоријевероватноће, које се исказује преко нивоа поузданости. Интервал конструисан уз одређениниво поузданости називамо интервалом поузданости.

Ниво поузданости који је придружен интервалу поверења показује колико можемобити сигурни да овај интервал садржи праву вредност параметра скупа. Ниво поузданости

се обележава са (1-α ).Иако се било која вредност може нивоа поузданости може може изабрати за конструкцијуинтервала поверења, најчешће вредности су 90%; 95%; 99%.

Интервал поверења може се у општем облику записати на следећи начин:

35. Централна гранична теорема ? 

Централна граничана теорема заузима кључну улогу у статистичкој анализи, из вишеразлога. У великом броју основни скупови из којих потичу узорци немају нормалнурасподелу. Тада се облик узорачке расподеле статистике X одређује на основу веомаважне теореме која се назива централна гранична теорема.

- Скрипта за усмени део из основа статистичке анализе- 26

ДОВОЉНА

тачкаста оцењена вредност ± маргиналана грешка

Према централној граничној теореми, без обзира на облик расподеле основног скупа,аритметичке средине X великих узорака имају приближно нормалну расподелу сааритметичком средином и стандардном девијацијом:

n

δδ и μμ

XX=

Page 27: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 27/83

Статистика

На снову централне граничне теореме узорачка расподела пропорције скупа је приближнонормална код великих узорака. Узорак се сматра великим уколико су испуњени следећиуслови:

36. Раподела аритметичких средина узорака? 

Вредност параметра основног скупа увек је консатнта, што значи да за било који низподатака основног скупа постоји само једна вредност аритметичке средине.

То се не односи на аритметичку средину узорака. Различити узорци исте величине ,изабрани из истог основног скупа дају различите вредности аритметичке средине. Вредностаритметичке средине узорка зависиће од тога који су елементи изабрани у узорак. Према

томе аритметичка средина узорка је случајна променљива. Као и свака друга

случајна променљива и аритметичка средина узорка има расподелу вероватноћа, којуназивамо узорачком расподелом статистике. И друге статистике као што су медијана,

модус и варијанса имају своје узорачке расподеле.

Уопштено говорећи расподела вероватноћа било које статистике узорка се називаузорачком расподелом.

Аритметичка средина и стандардна девијација које се израчунавају на основу

узорачке расподеле називају се аритметичка средина и стандардна девијација

статистике.

Аритметичка средина статистике увек је једнака аритметичкој средини основног

скупа, тј.

Ову особину називамо непристрасном оценом .

Међутим стандардна девијација статистике тј. Xδ  ( стандардна грешка) није

 једнака стандардној девијацији скупа δ . Стандардна грешка статистике је једнка

стандардној девијацији основног скупа подељеној са квадратним кореном величиномузорка.

Ова формула важи само за узорке који се бирају из коначнихскупова са понављањем или из бесконачних скупова без

понављања. Другим речима, образацn

δδ X= важи само када је величина узорка

- Скрипта за усмени део из основа статистичке анализе-27

1. n> 302. n×p>5

3. n×q>5 q=(1-p)

Расподела вероватноћа статистике се назива узорачком расподелом

аритметичких средина узорака. Она представља скуп парова различитих

µ = µ

n

δδ X=

Page 28: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 28/83

Статистика

довољно мала у поређењу са величином скупа. Узорак се сматра малим у односу навеличину скупа онда када величина узорка није већа од 5% основног скупа тј.

Ако овај услов није задовољен онда се при израчунавању стандардне грешке користиследећа релација:

где1N

nN  −

−представља поправни фактор за коначне основне скупове.

Како се многа истраживања у пракси заснивају на великим скуповима, онда је

величина узорка у односу на величину скупа мала.

Две важне информације карактеришу узорачку расподелу .

1. Дисперзија статистике   је мања од дисперзије одговарајуће променљиве Х у основном

скупу, односно Xδ  < δ . Када је величина узорка већа од 1, што је најчешћи случај онда је

n

δδ 

X= < δ .

2. Стандардна грешка се смањује са порастом величине узорка, што је очигледно из

формуле за изручанавањеn

δδ 

X= .

37. Расподела пропорција узорака? 

Као и аритметичка средина , и пропорција узорака има своју узорачку расподелу,

односно расподелу вероватноћа.

Аритметичка средина статистике пропорције P  увек је једнака пропорцији скупа p,

исто као што је и аритметичка средина узорака увек једнака аритметичкој средини

основног скупа.Пропорција узорка P , назива се оцена пропорције основног скупа p. Ако је очекивана

вредност ( средња вредност ) статистике узорка једнака вредности одговарајућег параметраосновног скупа, таква статистика назива се непристрасном оценом. Пошто за пропорцију

узорака P важи да је pμp=ˆ онда је она непристрасна оцена пропорције скупа p.

Стандардна девијација ( стандардна грешка ) пропорције узорака се означава са pδ и

добија се на основу следеће формуле:

- Скрипта за усмени део из основа статистичке анализе- 28

050N

n,

1N

nN

n

δδ 

X −−=

Расподела вероватноћа пропорције узорака се назива узорачкомрасподелом пропорције и представља скуп парова вредности које може

n

pqδp =

Page 29: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 29/83

Статистика

где је р пропорција основног скупа q=n-p а n величина узорка. Ова формула се примењује

само када 050N

n, , при чему је N величина скупа из којег је узет узорак.

Ако овај услов није задовољен стандардна грешка добија се по формули:

 1NnN 

npqδp −

−= где 1NnN  −

−представља поправни фактор за коначне основне скупове.

Како се многа истраживања у пракси заснивају на великим скуповима, онда јевеличина узорка у односу на величину скупа мала, па се тандардна грешка пропорцијескупа израчунава по обрасцу .

Облик узорачке расподеле одређује се на основу централне граничне теореме, покојој узорачка расподела статистике P има нормалну расподелу уколико је узорак довољно

велики. У пракси се што се тиче пропорције великим сматрају узорци који задоваљавајуследеће услове:

1. n> 30

2. n×p>53. n×q>5 q=(1-p)

Ови услови су потрбени за апроксимацију биномне вероватноће нормалномрасподелом, јер распоред пропорција узорака уколико нису задовољени ови услови следиприближно биномну вероватноћу.

38. Избор врсте узорака у зависности од хомогености основног скупа? 

Ако је основни скуп релативно хомоген, онда прост случајан узорак предствља добру основу за доношење прецизних оцена о параметру скупа. Али ако је основнискуп хетероген тј. ако се његови елемнти битно разликују по посматраном обележју ондапрост случајан узорак неће бити репрезентативан, а закључци које доносимо на основуњега неће бити прецизни. Да би повећали репрезентативност случајног узорка вршимостратификацију основног скупа, делћи основни скуп на известан број подскупова којеназивамо стратуми, а затим из сваког стратума бирамо по један прост случајан узорак. Такоформирана унија простих случајних узорака назива се стратификовани узорак.

Као критеријум за деобу користимо неку од особина која је у чврстој вези са сапосматраним обележјем. На пример уколико нас занимају издаци за куповину књигастановника Београда, једанод критеријума за поделу скупа могао би бити ниво образовањастановника, па би у том случају могли поделити све становнике Београда на стратуме нижеобразовање; више образовање и високо. Из ова три подскупа изабрали би по један прост

случајан узорак тако да сваки елемент из по три стратума има подједнаку вероватноћу дабуде изабран у узорак., чиме обезбеђујемо репрезентативност узорка. Будући да стратуминису исте величине , јединице скупа међусобно неће имати исту вероватноћу да будуизабране у узорак, али су нам вероватноће избора унапред познате.

Сврха стратификације је двострука:1. Њоме се повећава репрезентативност узорка на основу којег доносимо закључке о

карактеристикама скупа.2. Стратификован узорак пружа информације и о појединим деловима основног скупа,

што нам омогућује да спроведемо засебну анализу сваког стратума.

39. Случајне и неслучајне грешке? 

Резултати који се добијају узорачком анкетом могу садржати два типа грешака:

- Скрипта за усмени део из основа статистичке анализе-291. случајне

2. неслучајне

Page 30: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 30/83

Статистика

1. Случајна грешка – Обично сви узорци који се добијају из истог основног скупа дајуразличите резултате, јер садрже различите елементе тог скупа. Поред тога, резултатидобијени из билло ког узорка неће бити потпуно исти као они који би се добили пописом.Разлика измешу резултата узорка и резултата које би смо добили пописом назива сеслучајна грешка, под претпоставком да је узорак случајан и да није направљена никаквасистематска грешка.

Случајна грешка јавља се због случајног избора елемената у узорак и не може сеизбећи. Случајна грешка јавља се само у узорачкој анкети, а не и код пописа.

2. Неслучајна грешка – Ова врста грешке може се јавити и у узорачкој анкети и упопису. Такве грешке су последице људског фактора.

Неслучајне грешке се јављају због људске грешке и могу да се сведу на минимум,ако се води рачуна о томе како се састављају питања и врши пажљива обрада добијенихподатака. У анкетама могу да се јаве многе врсте неслучајних грешака или пристрасности,укључујући и грешку избора, грешку због одсуства одговора, грешку у одговору игрешку у добровољном одговору.

а) Грешка због погрешно изабраног оквира – Када бирамо узорак, користимо листуелемената на основу којег бирамо узорак. Та листа обично не укључује многе елементеосновног скупа, јер најчешће није ни могуће укључити све елементе скупа. Листа елемената

коју користимо да би се изабрао узорак називамо оквир узорка. На пример ако за изборузорака користимо телефонски именик, из ње ће бити изостављени људи који немју

- Скрипта за усмени део из основа статистичке анализе-

Врста грешака

Случајне

неслучајне;неузорачке

(систематске )грешке

погрешно изабраноквир из којег се

бира узорак 

грешка збогодсусутваодговора

грешка у одговоругрешка у

добровољномодговору

30

Према томе разлика између резултата који се добијају узорачкоманкетом и оних које би добили да је анкетом обухваћен цео скуп назива се

Грешка која се јавља при прикупљању , бележењу и формирању

Page 31: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 31/83

Статистика

телефон, људе који не желе да им се име нађе у телефонском именику...Пошто оквирузорка који смо изабрали није репрезентативан за основни скуп, грешка која ће се јавитиназива се грешка због погрешно изабраног оквира.

б) Грешка због одсуства одговора – Чак и када је оквир узорка па и сам узорак репрезентативан за основни скуп, може да се појави грешка због одсуства одговора, јермноги испитаници нису дали одговор на постављено питање.

Оваква врста грешака се јавља нарошито када се анкета спроводи путем поште извише разлога. Прво, примећено је да многи људи не враћају упитник, као и да породицеса ниским и високим приходима не учествују у анкети која се спроводи путем поште. Стога јепревелика заступљеност оних људи са средњим приходима.

Оваква грешка јавља се и у другим врстама анкета, као на пример када се спроводикућна анкета. Многи људи неће бити кући када анкетар дође, а разлика између оних људикоји су били код куће и који нису били може да буде велика, што доводи до пристрасностирезултата. Да би избегли грешку због одсуства одговора, морамо учинити све да ступимо уконтакт са свим испитаницима које смо обухватили анкетом.

в) Грешка у одговору – Грешка у одговору се јавља када нека особа која је укљученау анкету да одговор који није тачан. то може да се деси из различитих разлога, а један однајчешћих је тај што испитаник није добро разумео питање. Дакле,формулација питања

 је може да да узрокује нетачан одговор. Такође је примећено да када се питањепреформулише многи испитаници не дају исти одговор, и да то обично не чине намерно.Понекад испитаници не желе ни да дају тачан одговор на неко питање, што је честслучај када се испитанику постави питање о висини прихода.

г) Грешка добровољног одговора – Овакав врста грешке се јавља када се анкетане спроводи на случајном узорку, већ се упитник објави у неком часопису или новинама ипозову се читапци да дају одговор на то питање.

Оваква анкета разумљиво није репрезентативна, јер људи који читају одређеничасопис већ имају изграђен свој став.

Такође и када се људи позову да се јаве на одређени број телефона и да искажу својстав о питању постављеном у анкети, она неће бити задовољавајућа, јер многи људи

избегавају да сносе трошкове давања одговора. Зато узорак обично није нирепрезентативан ни случајан, јер је учешће добровољно.

40. Стандардна девијација скупа, стандардна девијација узорка и стандарднагрешка аритметичке средине? 

Стандардна девијација је најчешће коришћена мера варијабилитета у статистици.Вредност стандардне девијације скупа показује нам колико близу су све вредностисерије података од аритметичке средине. Уопштено мања вредност стандарднедевијације нам показује да су подаци те серије веома мало распршени од аритметичкесредине скупа, ако се рачуна на бази података из скупа. Уколико је њена вредност већа то

нам указује на веће одступање од аритметичке средине скупа. Стандардна девијација скупасе добија када се збир квадрата одступања свих обележја подели величином серије, а

обележава се са δ .Стандардна девијација узорка показује нам колико у просеку подаци из узорка

одступају од аритметичке средине узорка.Стандардна грешка аритметичке средине нам показује за колико у просеку подаци

из узорка одступају од аритметичке средине скупа. Израчунава се по обрасцуn

δδ 

X= за

узорке чија је величина мања од 5% основног скупа, тј по обрасцу1N

nN

n

δδ 

X −−= за

узорке чија је величина већа од 5%.

- Скрипта за усмени део из основа статистичке анализе-31

Page 32: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 32/83

Статистика

Важне особине које карактеришу стандардну девијацију скупа, узорка и стандарднугрешку:

1. Оне ниикада нису негативне јер се у бројиоцу сва одступања од аритметичкесредине квадрирају. Вредности стандардне девијације увек су позиттивне или евентуално једнаке нули ако у серији сви подаци имају исту вредност, јер у таквој серији нема никаквиходступања.

2. Стандардна девијација скупа и узорка исказују се умерним јединицама укојима је исказана оригинална вредност података. Наиме варијанса као мераваријабилитета подиже оригиналне податке на квадрат па се њена вредност исказује уквадратним мерним јединицама. Међутим стандардна девијација представља корен изваријансе, па се исказује у истим мерним јединицама као и оригинални подаци.

3. Дисперзија статистике   је мања од дисперзије одговарајуће променљиве Х у

основном скупу, односно Xδ  < δ . Када је величина узорка већа од 1, што је најчешћи

случај онда јеn

δδ 

X= < δ .

4. Стандардна грешка се смањује са порастом величине узорка, што је очигледно из

формуле за изручанавањеn

δδ 

X= .

41. Оцењивање пропорције скупа? 

Често желимо да оценимо пропорцију скупа или проценат. На пример менаџер упроизводној фирми жели да процени колико износи проценат неисправних производа у једној серији производње. Политичка партија жели да израчуна проценат гласача који ћегласати за њу...

Уколико можемо да спроведемо попис ( потпуно посматрање ) сваки пут када желимода израчунамо пропорцију онда не постоји потреба да вршимо оцењивање. Како у праксичесто нисмо у могућности да спроведемо попис, због великих трошкова, ангажовањавеликог броја људи, немогућности обухвата свих јединица...принуђени смо да вршимо

оцењивање.Оцењивање пропорције скупа заснива се на следећем:1. Узорачка расподела пропорције узорака има приближно нормалну расподелу2. Аритметичка средина узорачке расподеле пропорције једнака је пропорцији скупа

3. Стандардна девијација узорачке расподеле пропорције узорака једнака јеn

pqδp =  

где је р пропорција основног скупа q=1-p а n величина узорка.У случају пропорције , узорак се сматра великим ако је

2. n×p>53. n×q>5 q=(1-p)

Када оцењујемо вредност пропорције скупа нису нам познати ни q ни p, па не можемоизрачунати δp , па због тога користимо њену оцену pS ˆ . Реализовану вредност ове ове

оцене је тачкаста оцењена вредност δp . Пропорција узорка P , представља тачкасту оцену

одговарајуће пропорције скупа р.Да бисмо формирали интервал поверења за пропорцију скупа потребно је да од

пропорције узорка одузмемо и додамо од ње број који се назива маргинална грешка, Е.Код оцењивања пропорције скупа одређујемо ниво поузданости.Ниво поузданости који је придружен интервалу поверења за оцену пропорције

показује колико можемо бити сигурни да овај интервал садржи праву вредност параметра

скупа. Ниво поузданости се обележава са (1-α ).

- Скрипта за усмени део из основа статистичке анализе- 32

Page 33: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 33/83

Статистика

43. Статистичко оцењивање? 

Поред оцењивања закључак о параметру скупа можемо донети и помоћу тестирањахипотеза, а ова два поступка једним именом називамо статистичким закључивањем.Прематоме статистичко закључивање састоји се из:

Статистичког оцењивања

Тестирања хипотеза

Статиатичко закључивање представља поступак доношења закључка о вредностиманепозанатог параметра скупа на основу информација добијених из узорка.

Ако не поседујемо довољно информација о параметру скупа на основу кога бисмо могли дапретпоставимо његову вредност, онда ћемо ту вредност оценити поступком статистичкогоцењивања.Будући да нумеричку вредност параметра оцењујемо на основу информација изузорка , не можемо бити сигурни у исправност донетог закључка. Због тога закључак 

оцењивања доносимо са поузданошћу са мањом од 100%.С друге стране ако нам је нека од особина основног скупа позната онда ћемо

закључак о непознатом параметру скупа донети поступком тестирањем хипотеза, тј.испитиваћемо да ли информација из узорка подржава наше почетно уверење окарактеристици основног скупа. Пошто не можемо бити потпуно сигурни у исправностдонетог закључка, претпоставку ћемо прихватити или одбацити уз одређени ризик да смопогрешили.Оцене које доносимо на бази узорка могу бити:

Тачкасте

Интервалне

Нпр. Уколико бисмо хтели да знамо колико износи просечна оцена студенатаЕкономског факултета уместо да извршимо попис изабраћемо узорак од 100 студената и наоснову њиховог просека донети закључак о просечној оцени свих студената Економскогфакултета. Како се вредност већине узорака по правили разликује од параметра који

оцењујемо(погледајте претходна два примера), онда ћемо параметар µ   ( просечну оценусвих студената ) уместо једним бројем оценити једним интервалом који вероватно садржи

праву вредност параметра µ . Да ли је та оцена тачна никада не можемо знати, осим ако неизвршимо потпуно посматрање, чоме би дошли до тачне вредности параметра µ , чиме бинаравно оцењивање изгубуло смисао, тј. не би ни било потребно.Због различитих вредности које може имати стаистика узорка један парамеатр може имативише различитих оцена.Да би оцењивање било коректно спроведено пожељно је да оцене задовољавају некекарактеристике од којих су следеће најважније:

-Оцена параметра је непристрасна ако је њена очекиванавредност у просеку једнака параметру који оцењујемо.Зааритметичку средину аритметичких средина узорака кажемо да је

непристрасна оцена аритметичке средине скупа јер иако се већина ритметичких средина

- Скрипта за усмени део из основа статистичке анализе-33

НЕПРИСТРАСНОСТ

Оцењивање је поступак статистичког закључивања којим се нумеричка вредност

добијена из узорка додељује параметру основног скупа на основу информација иззо ка.

Page 34: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 34/83

Статистика

појединих узорака, раликује од µ , оне су у просеку једнаке µ .Ако у сваком узорку

израчунамо медијану (me), затим формирамо распоред медијана узорака и израчунамо

очекиавну вредност овог распореда добијамо једнакост E(me)=µ , па закључијемо да је имедијана непристрасна оцена аритметичке средине основног скупа.Такође важи и једнакост E(Pr )= µ , што занчи да је и пропорција узорака непристраснаоцена аритметичке средине основног скупа. 

За разлику од претходних наведених оцена, варијанса ако би је рачунали по обрасцу

S*=Σ (Xi -)2/n,

Она неби задовољилиа овај услов, јер као што сте видели у претходна два примераваријабилитет у узорцима је мањи од варијабилитета у скупу, па зато важи опште правило

S2*≠ δ 2, па закључујемо да је варијанса пристрасна оцена

варијансе основноог скупа, тј. она потцењује варијансу скупа, што нарочито долази доизражаја када оцењивање помоћу малих узорака.

Због тога када израчунавамо варијансу или стандардну девијацију узорка у имениоцууместо n, користимо n-1.

-Особина непристрасности иако је потребна није довољна да би оценапараметр била ваљана.На пример оцена може да буде непристрасна ида истовремено има велику варијансу.Ѕато поред непристрасности

оцену треба да карактерише што мањи варијабилитет.

Будући да су и и Me непристрасне оцене аритметичке средине скупа, изабраћемо ону са

мањом варијансом.Однос између оцена варианси ових оцена није увек стабилан, већзависи од облика распореда основног скупа, али код нормалног распореда важи релација:

δ

е=1,57

δ

2  што значи да је  57% ефикаснија оцена од медијане.

Покушајте и сами да да формирате распоред медијана узорака и да потврдите ову тврдњу,на бази истог принципа као и за аритметичке средине.

-Оцена је конзистентнаако са повећањем величине узорка онатежи параметру који оцењујемо.Типичан пример за конзистентну

оцену је варијанса јер са повећањем величине узорка S2*δ 2.Другим речима варијанса је

пристрасна и конзистентна оцена.

-Оцена је довољна ако користи све информације које узорак садржи о том

параметру.  је довољна оцена параметра µ , док Me није( не зависи од

свих елемената у узорку, јер је позициона средња вредност).

44. Поузданост и прцизност оцене? 

Параметре основног скупа можемо оцењивати са различитим нивоима поузданости,пошто оцењивање никада не вршимо преко тачкасте оцене.

Ниво поузданости који је придружен интервалу поверења за оцену аритметичкесредине или пропорције показује колико можемо бити сигурни да овај интервал садржи

праву вредност параметра скупа. Ниво поузданости се обележава са (1-α ). 

Иако можемо одабрати било који ниво поузданости у пракси се најчешће користенивои од 0,90; 0,95;0,99. У зависности од од одабране вредности (1-α ), мењаће се и

- Скрипта за усмени део из основа статистичке анализе- 34

ЕФИКАСНОСТ

КОНЗИСТЕНТНОСТ

ДОВОЉНА

Page 35: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 35/83

Статистика

вредност z. Од вредности z зависи ширина интервала поверења па самим тим ипрецизност.

Уколико би на основу истог узорка оцењивали непознати парметар уз нивопоузданости од 0,95, а затим са нивоом поузданости од 0,99, добили би два интерваларазличитих ширина, при чемиу би био шири интервал који смо донели са поузданошћу од0,99 па самим тим и непрецизнији. Оваква промена је и логична јер уколико желимо дадонесемо интервала у чију смо тачност 100% сигурни, онда би тај интервал морао битивеома широк. Шири интервал поверењаа значи мање прецизан закључак. Другим речима,са порастом поузданости, смањује се прецизност оцене. Понекад интервал може бититолико широк да резултат губи сваку информативност и практичну корист. Због тога се упракси најчешће користи ниво поузданости од 95%, јер се истовремено постиже великапрецизност и висока поузданост. 

44. Оцењивање аритметичке средине основног скупа? 

Код

интервалног оцењивања конструише се интервал око тачкасте оцењене вредности и тврдисе да овај интервал вероватно садржи одговарајућег параметра.

Приликом конструкције интервала поверења за аритметичку средину скупаразликујемо случајеве када је:

1. Када је позната стандардна девијација – У случају када је позната стандардна девијацијаможемо разликовати три случаја:

а) стандардна девијација скупа је позната; величина узорка је мала ( n<30 );основни скуп из кога се узима узорак има нормалну расподелу. Онда користимо

наормалну расподелу за оцену аритметичке средине скупа, јер је узорачка расподела 

нормална са аритметичком средином µ и стандардном девијацијомn

δδ 

X= за узорке

чија је величина мања од 5% основног скупа, тј по обрасцу 1N

nN

n

δδ  X −

−= за узорке чија

 је величина већа од 5%.

б) стандардна девијација скупа је позната; величина узорка је велика ( n≥ 30 )опет користимо нормалну расподелу за оцену аритметичке средине скупа, јер према

централној граничној теореми, узорачка расподела нормална са аритметичком средином

µ и стандардном девијацијомn

δδ 

X= за узорке чија је величина мања од 5% основног

скупа, тј по обрасцу1N

nN

n

δδ 

X −−= за узорке чија је величина већа од 5%.

в) стандардна девијација скупа је позната; величина узорка је мала ( n<30 );основни скуп из кога се узима узорак нема нормалну расподелу или је његова

- Скрипта за усмени део из основа статистичке анализе-35

Оцењивање је поступак статистичког закључивања којим се нумеричкавредност добијена из узорка додељује параметру основног скупа на основу

ин о ма и а из зо ка.

1. Стандардна девијација позната2. Када је стандардна девијација непозната

Page 36: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 36/83

Статистика

расподела непозната. У том случају користимо неки од непараметарских тестова јер уовом случају не важи централна гранична теорема.

2) Уколико је стандардна девијација скупа непозната; величина узорка је мала (n<30 ); основни скуп из кога се узима узорак има нормалну расподелу, онда користимостудентову или т расподелу за оцену аритметичке средине скупа.

Када је стандардна девијација скупа непозната, онда је замењујемо стандардномдевијацијом узорка S, која је њена оцена. То значи да уместо стандардне грешке користимоњену оцену кој се израчунава по обрасцу:

45. Примена Студентове т расподеле при оцењивању и тестирању параметра основног скупа? 

Студентов распоред први је открио и формилисао Вилијем госет и објавио у раду подпсеудонимом „студент“. Због тога се та расподела назива још и Студентова ии т расподела.

т Расподела донекле је слична нормалној расподели: Попут криве нормалне расподелекрива т- расподеле је симетрична око аритметичке средине и никада се не спаја сахоризонталном Х-осом. Укупна површина испод т криве је једанка 1 или 100%. Мешутинстудентова расподела је више спљоштена од криве стандардизоване нормалнерасподеле. Другим речима крива т расподеле има мању издуженост и већу распшеностод нормалне криве, Како се величина узорка повећева онда студентова расподела сеприближава нормалној расподели.Облик криве т расподеле зависи и од броја степени слободе df ( degrees of freedom). Као икод стандардизоване нормалне криве аритметичка средина т расподеле је једнака нули,али за разлику од стандардизоване нормалне расподеле чија стандардна девијација износи

1, стандардна девијација студентове расподеле је ) /( 2df df  − што је увек веће од 1. Значи

да је стандардна девијација студентове расподеле већа од стандардне девијацијенормалног распореда.

Студентов распоред при оцењивању и тестирању хипотеза употребљавамо:

1. Када оцењујемо непознату аритметичку средину, узорак је мањи од 30 а варијанса скупанам је непозната df=n-1

2. Када тестирамо хипотезе о непознатој аритметичкој средини на једном узорку са

непознатом варијансом скупа а узорак је мањи од 30 елемената. df=n-13. Када тестирамо хипотезе о једнакости аритметичких средина а варијансе скупа су нам

непознате. df=n1+n2-2

4. У регресионој анализи приликом оцењивања непознатог параметра β 1 df=n-2

5. У регресионој анализи када тестирамо занчајност оцене параметра β 1 df=n-26. У регресионој анализи приликом оцењивања просечне вредности зависно променљиве Y

df=n-27. У регресионој анализи при предвиђању индивидуалне вредности зависно променљиве Y

df=n-2

8. У вишеструкој регресији приликом оцењивања непознатих параметара β 1 и β 2 df=n-3

9. У вишеструкој регресији приликом тестирања значајности оцена параметра β 1 и β 2 df=n-3

- Скрипта за усмени део из основа статистичке анализе- 36

ss

x=

Page 37: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 37/83

Статистика

10. У корелационој анализи приликом тестирања значајности добијене оцене коефицијентапросте линеарне корелације df=n-2

46. Примена нормалне расподеле у оцењивању и тестирању аритметичке срединеосновног скупа – поступак и претпоставке? 

Нормалан распоред при оцењивању и тестирању користимо у следћим случајевима:1. За оцену непознате аритметичке средине скупа и то у следећа два случаја:

а) стандардна девијација скупа је позната; величина узорка је мала ( n<30 );основни скуп из кога се узима узорак има нормалну расподелу. Онда користимо

наормалну расподелу за оцену аритметичке средине скупа, јер је узорачка расподела 

нормална са аритметичком средином µ и стандардном девијацијомn

δδ 

X= за узорке

чија је величина мања од 5% основног скупа, тј по обрасцу1N

nN

n

δδ 

X −−= за узорке чија

 је величина већа од 5%.

б) стандардна девијација скупа је позната; величина узорка је велика ( n≥ 30 )опет користимо нормалну расподелу за оцену аритметичке средине скупа, јер према

централној граничној теореми, узорачка расподела нормална са аритметичком средином

µ и стандардном девијацијомn

δδ 

X= за узорке чија је величина мања од 5% основног

скупа, тј по обрасцу1N

nN

n

δδ X −

−= за узорке чија је величина већа од 5%.

Нормалан распоред приликом тестирања хипотеза о непознатој аритметичкојсредини користимо у следећим случајевима:

1. Када оцењујемо непознату аритметичку средину а варијанса скупа нам је позната2. Када оцењујемо непознату аритметичку средину а варијанса скупа нам је непозната, а

узорак је већи од 30 елемента.3.Када тестирамо хипотезе о непознатој аритметичкој средини а варијанса нам је позната.

4. Када тестирамо хипотезе о непознатој аритметичкој средини а варијанса нам је непознатаа узорак већи од 30 елемената.

5. Када тестирамо хипотезе о једнакости аритметичких средина а варијансе скупа су нампознате.

6. Када тестирамо и оцењујемо пропорцију основног скупа, уколико су испуњени услови заапроксимацију нормалног распореда.

Поступак оцењивања укључује следеће етапе:

1. Избор узорка

2. Прикупљање неопходних информација од јединица узорка

3. Израчунавање вредности статистике узорка

4. Додела вредности одговарајућем параметру скупа

У свим случајевима основна претпоставка је да је извучен случајан узорак.

Приликом тестирања хипотезе о непознатој аритметичкој средини разликујемо два поступкау зависности од тога:

- Скрипта за усмени део из основа статистичке анализе-37

Page 38: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 38/83

Статистика

1. Да ли је приступ заснован на критичној вредности2. Да ли је приступ заснован на р вредности

1. Поступак заснован на критичној вредности – спроводимо у 5 етапа:

Прва етапа – Формулишемо нулту и алтернативну хипотезу Друга етапа – Избор одговарајућег теста који ће се користити

Трећа етапа – Израчунавање критичне вредностиЧетврта етапа – Доношење одлуке о одбацивању или неодбацивању нулте хипотезе, на

основу критичне вредностиПета етапа – Доношење закључка

2. Поступак заснован на р- вредности – спроводимо у 5 етапа

Прва етапа – Формулишемо нулту и алтернативну хипотезу Друга етапа – Избор одговарајућег теста који ће се користити

Трећа етапа – Израчунавање критичне вредности

Четврта етапа – Доношење одлуке о одбацивању или неодбацивању нулте хипотезе, наоснову р вредности Пета етапа – Доношење закључка

У свим случајевима тестирања хипотеза морају бити испуњене следеће претпоставке:1. да је узорак случајан

2. да основни скуп има нормалан распоред или да има више од 30 елемената3. код тестирања хипотеза о једнакости аритметичких средина поред претходна два услова,

уводи се још један додатан услов, а то је да су варијансе скупова међусобно једнаке

47. Оцењивање пропорције основног скупа: велики узорци? 

Често желимо да оценимо пропорцију скупа или проценат. На пример менаџер упроизводној фирми жели да процени колико износи проценат неисправних производа у једној серији производње. Политичка партија жели да израчуна проценат гласача који ћегласати за њу...

Уколико можемо да спроведемо попис ( потпуно посматрање ) сваки пут када желимода израчунамо пропорцију онда не постоји потреба да вршимо оцењивање. Како у пракси

често нисмо у могућности да спроведемо попис, због великих трошкова, ангажовањавеликог броја људи, немогућности обухвата свих јединица...принуђени смо да вршимооцењивање.

Оцењивање пропорције скупа заснива се на следећем:1. Узорачка расподела пропорције узорака има приближно нормалну расподелу2. Аритметичка средина узорачке расподеле пропорције једнака је пропорцији скупа

3. Стандардна девијација узорачке расподеле пропорције узорака једнака јеn

pqδp =  

где је р пропорција основног скупа q=1-p а n величина узорка.У случају пропорције , узорак се сматра великим ако је

1. n×p>52. n×q>5 q=(1-p)

- Скрипта за усмени део из основа статистичке анализе- 38

Оцењивање је поступак статистичког закључивања којим се нумеричка вредностдобијена из узорка додељује параметру основног скупа на основу информација из

зо ка.

Page 39: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 39/83

Статистика

Када оцењујемо вредност пропорције скупа нису нам познати ни q ни p, па не можемо

израчунати δp , па због тога користимо њену оцену pS ˆ . Реализовану вредност ове ове

оцене је тачкаста оцењена вредност δp . Пропорција узорка P , представља тачкасту оцену

одговарајуће пропорције скупа р.Да бисмо формирали интервал поверења за пропорцију скупа потребно је да од

пропорције узорка одузмемо и додамо од ње број који се назива маргинална грешка, Е.

Код оцењивања пропорције скупа одређујемо ниво поузданости.Ниво поузданости који је придружен интервалу поверења за оцену пропорције

показује колико можемо бити сигурни да овај интервал садржи праву вредност параметра

скупа. Ниво поузданости се обележава са (1-α ).

48. Облик (смер) теста? 

Статистичка хипотеза је прецизно формулисана тврдња о особни скупа иливредности неког параметра у скупу, или односу тог параметра у више скупова. Метод којим је проверавамо назива се тестирање хипотеза.

Садржај Но је оно у шта ми не вреујемо, а Н1 оно у шта верујемо.Међутим како сесамо Но тестира тј. оно у шта не верујемо потребни су нам јаки докази да је одбацимо, и даприхватимо Н 1 у коју од почетка верујемо, јер су нам увек потребни много јачи докази даприхватимо оно у шта не верујемо од доказа за прихватање онога у шта од почеткаверујемо.

Статистика теста представља критеријум на основу којег одбацијемо или не

одбацијемо нулту хипотезу.У зависности од тога како је формулисана алтернативна хипотеза, тј. са које странесе налзи област одбацивања разликујемо двосмерне и једносмерне хипотезе, као и тестовекоје примењујемо за тестирање.

Нулта и алтернативна хипотеза могу се формулисати у следећа три облика:

1. Но: µ = µ 0 Н1 : µ ≠  µ 0

2. Но: µ  ≥  µ 0 Н1 : µ <µ 0

3. Но: µ  ≤  µ 0 Н1 : µ >µ 0

Први облик хипотезе представља такав облик хипотеза у којем је Но проста, а Н1

сложена. Ако претпоставимо да нас занима да постоји сумња да тежина неког паковањаодступа од просечене тежине која износи 1 килограм, онда ће нулта хипотеза гласити:

Но: µ =1 кг а Н1: µ ≠ 1 килограм.

- Скрипта за усмени део из основа статистичке анализе-39

Нулта хипотеза Но представља тврђење о вредности параметра који настојимо даоспоримо и обележава се са Н0

Наспрам нулте хипотезе увек стоји алтернативна која садржи све вредности које параметаркојег тестирамо не садржи у нултој хипотези, у облику сложене хипотезе и називамо је још

и истраживачком, а обележавамо је са Н1

Алтернативну хипотезу којом могућа одступања пратимо са обе стране тј.називамо двосмерном или двостраном хипотезом а тест којим тестирамо

такву хипотезу двосмерним или двостраним.

Page 40: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 40/83

Статистика

Ако Но одбацимо прихватићемо алтернативну хипотезу да просечна тежина не износи 1килограм, при чему смер одступаља није одређен.

.Други облик хипотезе називамо левостраном хипотезом, јер се област одбацивања

налази само са леве стране, па ако би испитивали претпоставку да просечно кашњењевозова мање од 20 минута, онда би поставили левострану хипотезу у облику:

Но: µ  ≥ 20 Н1 : µ <20

Нулта хипотеза је истинита за све вредности које су веће или једнаке од 20, па сеобласт одбацивања налази са леве стране и због тога се овај облик назива левостраномхипотезом, а тест којим тестирамо такву хипотезу левостраном хипотезом.

Трећи облик хипотезе називамо десностраном хипотезом, а тест којим тестирамотакву хипотезу десностраним тестом.

Одавде можемо закључити следеће:

49. Нулта и алтернативна хипотеза?

Статистичка хипотеза је прецизно формулисана тврдња о особни скупа или вредности некогпараметра у скупу, или односу тог параметра у више скупова. Метод којим је проверавамоназива се тестирање хипотеза.

50.

Примена нормалне расподеле у оцењивању итестирању 

пропорције скупа? 

Често желимо да оценимо пропорцију скупа или проценат. На пример менаџер у

производној фирми жели да процени колико износи проценат неисправних производа у једној серији производње. Политичка партија жели да израчуна проценат гласача који ћегласати за њу...

Уколико можемо да спроведемо попис ( потпуно посматрање ) сваки пут када желимода израчунамо пропорцију онда не постоји потреба да вршимо оцењивање. Како у праксичесто нисмо у могућности да спроведемо попис, због великих трошкова, ангажовањавеликог броја људи, немогућности обухвата свих јединица...принуђени смо да вршимооцењивање.

Оцењивање пропорције скупа заснива се на следећем:1. Узорачка расподела пропорције узорака има приближно нормалну расподелу2. Аритметичка средина узорачке расподеле пропорције једнака је пропорцији скупа

- Скрипта за усмени део из основа статистичке анализе- 40

Двосмерни тестови имају област одбацивања са обе стране; једносмерни само са једне стране и то левострани са леве стране, а

десност ани са десне ст ане.

Нулта хипотеза Но представља тврђење о вредности параметра који настојимо даоспоримо и обележава се са Н0

Наспрам нулте хипотезе увек стоји алтернативна која садржи све вредности које параметар

којег тестирамо не садржи у нултој хипотези, у облику сложене хипотезе и називамо је јоши истраживачком, а обележавамо је са Н1

Page 41: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 41/83

Статистика

3. Стандардна девијација узорачке расподеле пропорције узорака једнака јеn

pqδp =  

где је р пропорција основног скупа q=1-p а n величина узорка.У случају пропорције , узорак се сматра великим ако је

1. n×p>52. n×q>5 q=(1-p)

Када оцењујемо вредност пропорције скупа нису нам познати ни q ни p, па не можемоизрачунати δp , па због тога користимо њену оцену pS ˆ . Реализовану вредност ове ове

оцене је тачкаста оцењена вредност δp . Пропорција узорка P , представља тачкасту оцену

одговарајуће пропорције скупа р.Да бисмо формирали интервал поверења за пропорцију скупа потребно је да од

пропорције узорка одузмемо и додамо од ње број који се назива маргинална грешка, Е.Код оцењивања пропорције скупа одређујемо ниво поузданости.Ниво поузданости који је придружен интервалу поверења за оцену пропорције

показује колико можемо бити сигурни да овај интервал садржи праву вредност параметра

скупа. Ниво поузданости се обележава са (1-α ).Поступак оцењивања укључује следеће етапе:

1. Избор узорка

2. Прикупљање неопходних информација од јединица узорка

3. Израчунавање вредности статистике узорка

4. Додела вредности одговарајућем параметру скупа

У свим случајевима основна претпоставка је да је извучен случајан узорак.

Процедура тестирања хипотезе о пропорцији скупа у много чему је слична процедуритестирања хипотеза о аритметичкој средини скупа. И овде тест може да буде обостран;

левостран и десностран. Примену нормалнг распореда при тестирању хипотезе опропорцији скупа можемо спровести само на великим узорцима.У случају пропорције , узорак се сматра великим ако је

1. n×p>52. n×q>5 q=(1-p)

Приликом тестирања хипотезе о непознатој пропорцији разликујемо два приступа узависности од тога:

1. Дали је приступ заснован на критичној вредности2. Дали је приступ заснован на р вредности

1. Поступак заснован на критичној вредности – спроводимо у 5 етапа:

Прва етапа – Формулишемо нулту и алтернативну хипотезу Друга етапа – Избор одговарајућег теста који ће се користити

Трећа етапа – Израчунавање критичне вредности- одређивање области одбацивања инеодбацивања.

Четврта етапа израчунавање вредности статистике тестаПета етапа – Доношење одлуке и закључка

2. Поступак заснован на р- вредности – спроводимо у 5 етапа

Прва етапа – Формулишемо нулту и алтернативну хипотезу

- Скрипта за усмени део из основа статистичке анализе-41

Page 42: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 42/83

Статистика

 Друга етапа – Избор одговарајућег теста који ће се користитиТрећа етапа – Израчунавање критичне вредности

Четврта етапа – Доношење одлуке о одбацивању или неодбацивању нулте хипотезе, наоснову р вредности 

Пета етапа – Доношење закључка

51. Поступак статистичког тестирања хипотеза – приступ засновна накритичној вредности? 

Овај приступ назива се још и класичан или традиционалан приступ. У њему је

вредност нивоа значајности α Унапред одређена. Вредност α представља укупнуповршину области одбацивања. У оквиру ове процедуре прво налазимо критичну вредностиз таблице нормалне расподеле за дати ниво значајности, или из таблице студентоверасподеле. Затим израчунавамо вредност статистике z или t на основу реализованевредности статистике узорка. На крају реализовану вредност статистике теста поредимо сакритичном вредносшћу и поредимо са критичном вредносшћу коју очитавамо из таблице занормалну расподелу или студентову расподелу. При томе морамо знати да критичнавредност може бити:

1. једна – када је реч о једностраним хипотезама и једностраним тестовима, левостраним

или десностраним. Вредност α налази се са десног или са левог краја.2. две – ако је двострани тест онда се критичне вредности налзе на обе стране и рачунају

се на основу вредности α  /2.Приликом тестирања хипотезе о аритметичкој средини статистика теста се

израчунава по обрасцу :

Поступак заснован на критичној вредности – спроводимо у 5 етапа:

Прва етапа – Формулишемо нулту и алтернативну хипотезу Друга етапа – Избор одговарајућег теста који ће се користити

Трећа етапа – Израчунавање критичне вредности- одређивање области одбацивања инеодбацивања.

Четврта етапа израчунавање вредности статистике тестаПета етапа – Доношење одлуке и закључка

52. Тестирање хипотезе засновано на једном узорку? 

- Скрипта за усмени део из основа статистичке анализе- 42

n

δ

μxZ

0=

Статистика теста је критеријум на основу кога доносимо одлуку о одбацивању илинеодбацивању нулте хипотезе.

Page 43: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 43/83

Статистика

Тестирање хипотеза можемо вршити на само једном узорку, на два узорка и три и вишеузорака. При томе се у зависности од испуњености услова користе различити тестови. Приизбору теста истраживач се мора руководити следећим принципом:

Какосе у статистици најчешће тестирају параметри скупа аритметичка средина и пропорцијаскупа, набројаћемо само оне тестове који се користе при тестирању параметра заснованогна једном узоорку.

Приликом тестирања хипотеза о аритметичкој средини могу се користити двапараметарска теста z или t тест.

z тест користимо у следећим случајевима:

Услови:

1.узорак је случајан2.основни скуп има нормалан распоред или се може применити 3.познатанам је варијанса скупa

Услови:1.узорак је случајан2.основни скуп има нормалан распоред или се може применити Централна

гранична теорема а n ≥ 303.позната нам је варијанса скупа

Услови:1.узорак је случајан2.основни скуп има нормалан распоред а n < 303.непозната нам је варијанса скупа

Услови:1.узорак је случајан2. основни скуп има нормалан распоред

3. n≥ 30

4.n× p ≥ 5

5. n×(1-p) ≥ 5

53. Тестирање хипотеза о разлици аритметичких средина засновано на дванезависна узорка? 

Осим тестирања хипотеза о вредности једног параметра постоје и тестови којимаможемо тестирати једнакост аритметичких средина два скупа. Многи статистичари оветестове сматрају најпрактичнијим и најкориснијим у пракси.

Оваква врста тестирања користи се са циљем да се утврди да ли изнеђу дванепозната параметра два основна скупа постоји статистички значајна разлика, па се може

тестирати нпр. Хипотеза да су испит из статистике и рачуноводства пдједнаке тежине, илинпр.да два различита произвођача имају исти квалитет производа мерено бројем

- Скрипта за усмени део из основа статистичке анализе-43

Треба одабрати онај тест који највише одговара емпиријским подацимаодносно тест који ће одбацивати најмањи ризик грешке прве и друге врсте.

n

δ

μxZ

0=

n

s

μxZ

0=

n

sμx

t0=

n

pq

ppZ

−= ˆ

Page 44: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 44/83

Статистика

рекламација у гарантном року... Коју ћемо логику применити у ова два случаја? Веома једноставно, тако што ћемо нпр. у првом случају извући два случајна и независна узорка одстудената који су полагали испит из статистике и рачуноводства и на основу реализованевредности аритмеричких средина у оба узорка упоредити да ли постоји значајнастатистичка разлика у просеку оцена ових студената тј.поставити двосмерну хипотезуоблика:

Но: µ 1=µ 2 – не постоји разлика у просечним оценама између статистике и рачуноводства;другим речима испит из статистике је исте тежине као и испит из рачуноводства

Н1: µ 1≠ µ 2 - постоји разлика у просечним оценама између статистике и рачуноводства;другим речима испит из статистике није исте тежине као и испит из рачуноводства

У овом случају применићете или Z- тест ( уколико су варијансе скупова познате ) или t-тест ( уколико варијанссе скупова нису познате).

УСЛОВИ:1.узорци су случајни и међусобно независни

2.основни скупови имају нормалан распоред3.варијансе скупова су познате и међусобно једанке

Прва претпоставка о случајности је “ услов свих услова “ али пошто имамо два узоркапотребно је да су они независни тј. да избор елемената из једног скупа не утиче на изборелемената из другог скупа, тј. вршена су два независна плана узорка.

Трећа

претпоставка је у суштини веома логична јер тестирати једнакост аритметичких срединаима смисла само када су варијансе једнаке, обзиром на особине аритметичке средине.Например код два различита професора можемо имати исти просечан број поена од рецимо50, али код првог професора број поена креће се у распону од 48-52, акод другог од 20-90.

Тест који користимо при тестирању једнакости аритметичких средина када варијанса скупаније позната а основни скупови имају нормалана распоред је t* тест, који има следећиоблик.

УСЛОВИ:

1. узорци су случајни и међусобно независни2.основни скупови имају нормалан распоред3.варијансе скупова су непознате и међусобно једанке

Овде је само потребно објаснити шта представља симбол Sp ( није случајно велико Sа мало р како је неби поистовећивали са стандардном грешком оценом пропорције). Он језаједничка оцена стандардне грешке оцене аритметичких средина. Пошто нам у овомслучају варијансе скупова нису познате

54. Тестирање хипотеза засновано на три и више узорака? 

- Скрипта за усмени део из основа статистичке анализе- 44

Z*=

t*=

Два узорка изабрана из два основна скупа су независна ако избор једногузорка из једног скупа не утиче на избор другог узорка из другог

основног скупа. У успротном узорци су зависни.

Page 45: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 45/83

Статистика

Када желимо да испитамо да ли између три и више скупова не постоје разлике уаритметичким срединама онда користимо модел који је у статистици познат под називоманлизу варијансе АNOVA.

Анализу варијансе можемо користити и за испитивање једнакости аритметичкихсредина два скупа, али је процедура помоћу Z*или t*теста ефикаснија и једноставнија, пазбог тога при испитивању хипотеза о једнакости аритметичких средина користимо Z*или t*тест, а код испитивања једнакости аритметичких средина три и више скупова користимометод анализе варијансе.

Примена анализе варијансе захтева испуњеност одређених претпоставки:

1. Претпоставимо да на предмету Основи статистичке анализе постоје три предавачаи да управа факултета жели да испита да ли сва три предавача подједнако успешноизводе предавања. У том циљу управа ће изабрати по један узорак ( групу студената) којису предавања слушали код првог; другог и трећег предавача и претпоставити да оцене којесу добили на испиту имају приближно нормалну расподелу.

2.Просечне оцене које су остварили студенти код сваког од предавача могу и неморају бити једнаке, али морају имати нормалну расподелу.

3. Коначно узорци ( студенти) који су изабрани морају бити независни, тј. изборстудената из који су слушали предавња код првог предавача не сме утицати на изборстудената који су слушали предавања код другог или трећег предавача. Ово је најважнијапретпоставка анлизе варијансе.

Тест анализе варијансе или како се често назива ANOVA се примењује

израчунавањем две оцен варијансе и то:

Варијанса између узорака VA представља оцену δ 2 добијену на основу разлика измеђуузорака узетих из различитих основних скупова. На примеру три различита предавача VA ћесе базирати на на вредностима просечних оцена (аритметичких средина) три узорака који супратили предавања код три раличита предавача. Ако су вредности аритметичких средина

скупова исте ( просечне оцене свих студената), онда ће просечне оцене одговарајућихузорака бити вероватно приближно исте или ће се незнатно разликовати, али ће раликаизмеђу њих бити веома мала па се очекује да и VA буде мала. Међутим ако су просечнеоцене основних скупова различите, онда ће и разлике између просечних оцена измеђуузорака бити велике, па се очекује да ће и VA бити велика.

Варијанса унутар узорака VR представља оцену δ 2 добијену на основу разлика унутарподатака за различите групе студената.

Суштина анлизе варијансе је да се стављањем у однос факторске и резидуалневаријансе дође до закључка да ли је разлика између аритметичких средина три и вишескупова статистички значајна.

55. Поступак статистичког тестирања хипотеза – приступ заснован на рвредности? 

- Скрипта за усмени део из основа статистичке анализе-45

1. Основни скупови из којих бирамо узорке морају имати нормалан распоред2. Основни скупови из којих се бирају узорци морају имати једнаке варијансе

( стандардне девијације)3. Узорци изабрани из основних скупова морају бити случајни и међусобно

1. Варијансе имеђу узорака – која се још назива просек квадрата одступања измеђуузорака или факторска варијанса а обележава се са VA

2. Варијансе унутар узорака - која се још назива просек квадрата одступања унутарузорака или резидуална варијанса а обележава се са VR

Page 46: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 46/83

Статистика

У оквиру овог приступа нлазимо такву вредност вероватноће да дату нулту хипотезу

одбацујемо за свако α ( ниво значајности ) које је веће од ове вредности, и нулту хипотезу

не одбацујемо за свако α које је мање од ове вредности. Примењујући приступ засновна навредности вероватноће ( приступ заснованна р – вредности) израчунавамо р- вредносттеста, која се дефинише као најмањи ниво значајности са којим одбацујемо нулту хипотезуна основу информација из узорка.

Уколико смо претходно одредили вредност α  онда њу поредимо са р – вредносшћу изакључак на основу р – вредности доносимо на следећи начин:

Код

 једносмерног теста р – вредност приказана је површином испод криве која се налзи накрају расподеле, а омеђена је реализованом вредношћу статистике теста.

Код двосмерног теста р – вредност је вероватноћа приказана двострукомповршином испод криве уторачке расподеле, која је ограничена апсолутном ( позитивном )вредношћу статистике теста. Свака површина испод криве узорачке расподеле показује по

 једну половину р – вредности.Да би пронашли р- вредност најпре израчунавамо вредност статистике теста на

основу реализоване вредности статистике узорка.Затим налазимо вероватноћу приказану испод криве стандардизоване нормалне

расподеле, која је на крају криве ограничена реализованом вредношћу z теста ако је реч о једностраном тесту, или половини р – вредности ако је реч о двосмерном тесту.

Поступак заснован на р- вредности – спроводимо у 5 етапа

Прва етапа – Формулишемо нулту и алтернативну хипотезу Друга етапа – Избор одговарајућег теста који ће се користити

Трећа етапа – Израчунавање критичне вредностиЧетврта етапа – Доношење одлуке о одбацивању или неодбацивању нулте хипотезе, на

основу р вредности Пета етапа – Доношење закључка

56.

Грешке при тестирању хипотезе и њихове вероватноће? 

Нулта хипотеза као тврђење о вредности непознатог параметра може у стварности битиистинита или неистинита, а са друге стране подаци из узорка могу бити или сагласни са Ноили јој противуречити.То значи да постоји могућност:

1) да подаци из узорка доведу до исправне одлуке и подрже истиниту Но или да оспорепогрешну Но.

2) да подаци из узорка доведу до неисправне одлуке тј. да се информација из узоркасагласи са неистинитом Но или оспори истиниту Но.

Могући исходи при Стварна ситуација

- Скрипта за усмени део из основа статистичке анализе- 46

1. ако је р – вредност ≤  α  Но одбацујемо

2. ако је р – вредност > α немамо довољно доказа да одбацимо Но

Р-ВРЕДНОСТ представља најмањи ниво значајности са којим се може одбацитина основу информација из узорка Но која је истинита или најманји ризик грешке

са којим одбацујемо истиниту Но

Page 47: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 47/83

Статистика

тестирању хипотеза Но истинита Но неистинита

одлукаНо не одбацујемо Правилна одлука Грешка II врсте

Но одбацујемо Грешка I врсте Правилна одлука

Правилно поступамо у следећа два случаја:

1) Но истинита а информација из узорка је сагласна са њом, нулту хипотезу нећемоодбацити и закључак тестирања биће исправан.

2) Но је неистинита а ми је одбацујемо.

Неправилно поступамо у следећа два случаја:1) Одбацујемо Но иако је она истинита и тада правимо ризик грешке прве врсте,2) Не одбацујемо нетачну Но и тада правимо ризик грешке друге врсте.

У закључку можемо само направити једну врсту грешке, а не обе, тј. могућност једне грешкеискључује могућност прављења друге.

Ризик грешкенијеисто

што и грешка, јер ризик грешке је вероватноћа да нећемо направити грешку, а такође узбиру

α +β ≠ 1

Како би судија могао да смањи истовремено и ризик грешке прве и друге врсте да биизбегао да донесе погрешну одлуку ( осуди невиног или ослободи кривог)? По логичкомрасуђивању требао би од тужилаштва да тржи додатне доказе, а статистички гледано даповећа узорак, што је и једини начин да се оба ризика смање истовремено, или да једаностане константан, а други да се смањи. Такође видите да судија не може истовременонаправити обе врсте грешака.

57. Стратификовани узорак – метод избора и проблем алокације? 

- Скрипта за усмени део из основа статистичке анализе-

Могући исходи при доношењусудске одлуке

Стварна ситуација

осумњичени је невин осумњичени је крив

одлука

Но не одбацујемо

Суд ослобађаневиног

Правилна одлука Грешка II врсте

Но одбацујемо

Суд не ослобађа

невиног

Грешка I врсте Правилна одлука

47

НИВО ЗНАЧАЈНОСТИ ТЕСТА- назива се још и ризиком грешке првеврсте је вероватноћа да ћемо одбацити истиниту Но. Обележава се

г чким словом α .

Вероватноћа да нећемо одбацити нетачну нулту хипотезу назива се

РИЗИК ГРЕШКЕ II ВРСТЕ и обележава се грчким словм β

Но: осумњичени је невин

Н1: осумњичени је крив

Page 48: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 48/83

Статистика

Ако је основни скуп релативно хомоген, онда прост случајан узорак предствља добру основу за доношење прецизних оцена о параметру скупа. Али ако је основнискуп хетероген тј. ако се његови елемнти битно разликују по посматраном обележју ондапрост случајан узорак неће бити репрезентативан, а закључци које доносимо на основуњега неће бити прецизни. Да би повећали репрезентативност случајног узорка вршимостратификацију основног скупа, делћи основни скуп на известан број подскупова којеназивамо стратуми, а затим из сваког стратума бирамо по један прост случајан узорак. Такоформирана унија простих случајних узорака назива се стратификовани узорак.

Као критеријум за деобу користимо неку од особина која је у чврстој вези са сапосматраним обележјем. На пример уколико нас занимају издаци за куповину књигастановника Београда, једанод критеријума за поделу скупа могао би бити ниво образовањастановника, па би у том случају могли поделити све становнике Београда на стратуме нижеобразовање; више образовање и високо. Из ова три подскупа изабрали би по један простслучајан узорак тако да сваки елемент из по три стратума има подједнаку вероватноћу дабуде изабран у узорак., чиме обезбеђујемо репрезентативност узорка. Будући да стратуминису исте величине , јединице скупа међусобно неће имати исту вероватноћу да будуизабране у узорак, али су нам вероватноће избора унапред познате.

Сврха стратификације је двострука:1. Њоме се повећава репрезентативност узорка на основу којег доносимо закључке о

карактеристикама скупа.2. Стратификован узорак пружа информације и о појединим деловима основног скупа,

што нам омогућује да спроведемо засебну анализу сваког стратума.

58. Тестирање хипотезе о значајности разлике аритметичких средина више

скупова? 

Када желимо да испитамо дали између три и више скупова не постоје разлике уаритметичким срединама онда користимо модел који је у статистици познат под називоманлизу варијансе АNOVA.

Анализу варијансе можемо користити и за испитивање једнакости аритметичкихсредина два скупа, али је процедура помоћу Z*или t*теста ефикаснија и једноставнија, пазбог тога при испитивању хипотеза о једнакости аритметичких средина користимо Z*или t*тест, а код испитивања једнакости аритметичких средина три и више скупова користимометод анализе варијансе.

Примена анализе варијансе захтева испуњеност одређених претпоставки:

59. F - расподела и Hi квадрат расподела? 

F- расподела је непрекидна расподела која зависи од два броја степени слободе и то:

1. степени слободе за бројилац2. степени слободе за именилац

- Скрипта за усмени део из основа статистичке анализе- 48

Величине простих случајних узорака изабраних из различитих стратума

1. Основни скупови из којих бирамо узорке морају имати нормалан распоред2. Основни скупови из којих се бирају узорци морају имати једнаке варијансе

( стандардне девијације)3. Узорци изабрани из основних скупова морају бити случајни и међусобно

Page 49: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 49/83

Статистика

Ова два броја која представљају степени слободе су параметри F- расподеле. Свакакомбинација за број степени слободе за бројилац и именилац представља другачију F-криву. Свака вредност F- расподеле обележава се словом F. Случајна променљива узимасамо ненегативне вредности. Као и нормална, t – расподела; Hi квадрат расподела и F-расподела је теоријска расподела вероватноће.

F- расподела користи се за добијање критичне вредности при тестирању хипотеза о једнакости аритметичких средина три и више скупова.

Hi квадрат расподела као и t – расподела; Hi квадрат расподела, има само једанпараметар који се зове број степени слободе. Облик криве Hi квадрат расподеле зависисамо од једног броја степени слободе. Број степени слободе за Hi квадрат расподелу сеизрачунава коришћењем различитих формула за различите тестове.Случајна променљива узима само ненегативне вредности, због тога крива Hi квадратрасподеле почиње од нуле и простире се удесно од апцисе. Hi квадрат расподела имаискошен облик за мали број степени слободе и драстично се мења са повећањем степенислободе.

За велики број степени слободе крива Hi квадрат расподеле има облик сличаннормалној расподели.

χ 2 тест заснован је на χ 2 распореду чије су основне карактеристике:

1. χ 2 расопоред је позитивно асиметричан и дефинисан је бројем степени слободе, и

повећањем броја степени слободе он тежи нормалном, a интервал варијације је ∝

i=∝

2. очекивана вредност χ 2 распореда је једнака броју степени слободе Е(χ 2)=df, а

варијанса двоструком износу броја степени слободе тј.δ 2= 2df.3. број степени слободе одређује се за сваки случај примене и зависи од броја

модалитета или броја ћелија у табели контигенције.

Употребљава се за очитавање критичних вредности, код теста прилагођености итеста независности или хомогености.

60. Једнофакторска анализа варијансе? 

 

Примена анализе варијансе захтева испуњеност одређених претпоставки:

1. Претпоставимо да на предмету Основи статистичке анализе постоје три предавачаи да управа факултета жели да испита да ли сва три предавача подједнако успешноизводе предавања. У том циљу управа ће изабрати по један узорак ( групу студената) којису предавања слушали код првог; другог и трећег предавача и претпоставити да оцене којесу добили на испиту имају приближно нормалну расподелу.

2.Просечне оцене које су остварили студенти код сваког од предавача могу и неморају бити једнаке, али морају имати нормалну расподелу.

- Скрипта за усмени део из основа статистичке анализе-49

Једнофакторску анализу варијансе користимо за тестирање нулте хипотезе да су аритметичке средине три и више скупова једнаке, наспрам

алтернативне хипотезе да аритметичке средине ових скупова нису једнаке.1. Основни скупови из којих бирамо узорке морају имати нормалан распоред

2. Основни скупови из којих се бирају узорци морају имати једнаке варијансе( стандардне девијације)

3. Узорци изабрани из основних скупова морају бити случајни и међусобно

Page 50: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 50/83

Статистика

3. Коначно узорци ( студенти) који су изабрани морају бити независни, тј. изборстудената из који су слушали предавња код првог предавача не сме утицати на изборстудената који су слушали предавања код другог или трећег предавача. Ово је најважнијапретпоставка анлизе варијансе.

Тест анализе варијансе или како се често назива ANOVA се примењујеизрачунавањем две оцен варијансе и то факторске и резидуалне.

61. Факторска и резидуална варијанса? 

Примена анализе варијансе захтева испуњеност одређених претпоставки:

1. Претпоставимо да на предмету Основи статистичке анализе постоје три предавачаи да управа факултета жели да испита да ли сва три предавача подједнако успешноизводе предавања. У том циљу управа ће изабрати по један узорак ( групу студената) којису предавања слушали код првог; другог и трећег предавача и претпоставити да оцене којесу добили на испиту имају приближно нормалну расподелу.

2.Просечне оцене које су остварили студенти код сваког од предавача могу и неморају бити једнаке, али морају имати нормалну расподелу.

3. Коначно узорци ( студенти) који су изабрани морају бити независни, тј. изборстудената из који су слушали предавња код првог предавача не сме утицати на изборстудената који су слушали предавања код другог или трећег предавача. Ово је најважнијапретпоставка анлизе варијансе.

Тест анализе варијансе или како се често назива ANOVA се примењујеизрачунавањем две оцен варијансе и то:

Варијанса између узорка VA представља оцену δ 2 добијену на основу разлика измеђуаритметичких средина узорака узетих из различитих скупова. Ако су аритметичке срединесвих посматраних основних скупова исте, онда се очекује да ће се аритметичке средине

узорака разликовати значајно па ће и VA бити велика.Варијанса унутар узорака VR представља оцену δ 2 добијену на основу разлика

унутар аритметичких средина узорака узетих из различитих скупова.

62. Тест прилагођености ( тест облика расподеле )

Тестом прилагођености тестирамо нулту хипотезу да осрварене фреквенције уузорку следе унапред одређену или теоријску расподелу. Тест је назван тестомприлагођености, зато што тестирамо хипотезу да се остварене фреквенције доброприлагођавају одређеном моделу. У статистичкој литератури тест прилагођености назива се још и тест облика расподеле јер се њиме испитује да ли на пример основни скуп иманормалан; униформан или неку другу теоријску расподелу.

- Скрипта за усмени део из основа статистичке анализе- 50

1. Основни скупови из којих бирамо узорке морају имати нормалан распоред2. Основни скупови из којих се бирају узорци морају имати једнаке варијансе

( стандардне девијације)3. Узорци изабрани из основних скупова морају бити случајни и међусобно

1. Варијансе имеђу узорака – која се још назива просек квадрата одступања измеђуузорака или факторска варијанса а обележава се са VA

2. Варијансе унутар узорака - која се још назива просек квадрата одступања унутарузорака или резидуална варијанса а обележава се са VR

Фреквенције добијене у одређеном експерименту називају се остварене фреквенцијеи обележавају се саО.

Page 51: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 51/83

Статистика

Да би спровели тест прилагођеност неопходно је да израчунамо и очекиванефреквенције за сваку категорију експеримента. Очекиване фреквенције категоријаобележавају се словом Е, а добијају се као производ n; p, где је n величина узорка, а рвероватноћа сваке категорије ( модалитета ).

Број степени слободе за тест прилагођености је:

где к означава број могућих исхода ( или категорија ) у експерименту.Процедура за спровођење Hi квадрат теста прилагођености спроводи се кроз

следећих пет етапа.Прва етапа – Формулишемо нулту и алтернативну хипотезу

 Друга етапа – Избор одговарајућег теста који ће се користитиТрећа етапа – Израчунавање критичне вредности

Четврта етапа – Доношење одлуке о одбацивању или неодбацивању нулте хипотезе, наоснову р вредности 

Пета етапа – Доношење закључка

63. Тест независности или хомогености? 

Тестом независности тестирамо нулту хипотезу да два обележја нису међусобноповезана, тј. да су независна насупрот алтеранативној хипотези да су обелжја повезана тј.да између њих постоји зависност. На пример, желимо да тестирамо да ли постоји зависностизмеђу пола ( мушки и женски ) и преференција у избору програма на телевизији( спортски, музички; серијски).

Број степени слободе за тест независности је:

Хипотезе код теста независности увек формулишемо на следћи начин:

Тест независности спроводи се помоћу табела контигенције, која може бити били

којих димензија 2×2; 3 × 3 итд. Табела контигенције састоји се од ћелија а у ћелијаматабеле дате су остварене фреквенције које обележавамо са О, које могу бити релативнеили апсолутне, али при спровођењу теста независности користимо искључиво апсолутнефреквенције.

Да би спровели тест независности потребно је да свакој оствареној фреквенцијипридружимо одговарајућу очекивану фреквенцију коју као и код теста прилагођеностиобележавамо са Е.

Очекиване фреквенције код теста независности рачунамо нешто другачије него кодтеста прилагођености, тј. по обрасцу:

- Скрипта за усмени део из основа статистичке анализе-51

df = k - 1

df = (R-1)(K-1)

Ho: Два обележја нису зависнаH1: Два обележја су зависна

уузорк величина

сумаколонередасумаE

×=

Page 52: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 52/83

Статистика

Ниједна очекивана фреквенција не сме бити мања од броја 5.

Тест независности спроводимо кроз пет етапа:

Прва етапа – Формулишемо нулту и алтернативну хипотезу Друга етапа – Избор одговарајућег теста који ће се користити

Трећа етапа – Израчунавање критичне вредностиЧетврта етапа – Доношење одлуке о одбацивању или неодбацивању нулте хипотезе, на

основу р вредности Пета етапа – Доношење закључка

64. Функционална и стохастичка зависност и њихово приказивање? 

Међусобне везе између појава( променљивих) можемо поделити на у две групе:

 Детерминистичка се назива још и функционална или егзактна веза јавља се када једној вредности независне променљиве одговара само једна вредност зависнепроменљиве. Тако на пример површина квадрата се израчунава по формули Р=а2 те забило коју дужину странице квадрата можемо тачно( егзактно ) одредити површину, једноставном замнеом нумеричке вредности у образац. Детерминистичке везе реткоможемо срести у економији.

На појаве у друштву делује велики број фактора који су непредвидиве природе. Због

тога нисмо у стању да на основу познавања појединих вредности независне променљиве употпуности предвидимо вредности зависне променљиве. Везе које се овде јављају суслабије од детерминистичких и називају се стохастичким везама. Код стохастичких веза једној вредности независне променљиве одговара читав низ могућих вредностизависне променљиве.Сваку од тих вредности зависна променљива Y може узети са одговарајућом вероватноћоми како њене исходе у појединачним случајевима не можемо предвидети, она је случајнапроменљива.

Битно је знати да да код стохастичке везе индивидуалне вредности Y могу показиватизнатна одступања од просека и да се правилност може уочити тек испитивањем великогброја података. Ако посматрамо потрошњу воћа великог броја домаћинства видећемо дањихова потрошња у великој мери зависи од висине дохадка, тј. да са порастом висинедоходка у просеку расте потрошња воћа. Међутим како потрошња домаћинства не зависисамо од дохоодка већ и од других фактора ( цене, укус потрошача, близина пијаце...), коддомаћинства са ниским примањима јављаће се и она са великом потрошњом воћа; као икод оних са високим примањим релативно мала потрошња воћа.

Везе код којих порасту независно променљиве Х одговара пораст зависнепроменљиве Y, или опадању вредности независно променљиве Х опадање зависне

- Скрипта за усмени део из основа статистичке анализе- 52

1. детерминистичке2. стохастичке

Суштина стохастичких веза јесте да између појединиих вредности независних

променљивих Х и просечне вредности зависне променљиве Y, постоји чврставеза.

Page 53: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 53/83

Статистика

променљиве Y називамо директним везама, а типичан пример за то је употреба вештачкогђубрива и приноса на парцелама.

Са друге стране ако порасту једне променљиве одговара опадање друге појаве радисе о инверзним везама, на пример са порастом цене опада тражња.

Уколико се установи да са порастом једне појаве друга остаје непромењена ондазакључијемо да између таквих појава не постоји веза.

65. Утврђивање везе између атрибутивних обележја (номинална и ординалан скала)? 

Везу између две или више појава можемо утврдити применом различитих метода узависности од тога на којој скали су мерљива обележја.

Тако на пример помоћу Hi квадрат теста можемо утврдити везу између дваатрибутивна обележја чак и када су она мерљива на номиналној скли. Међутим такваанализа не пружа могућност предвиђања вредности једне појаве на основу познавањавредности неке друге. Код примене Hi квадрат теста јачину везе између две појавеутврђујемо помоћу коефицијента контигенције, уколико смо тестирањем одбацили нулту

хипотезу.Уколико су обележја мерљива на ординалној скали за утврђивање везе измеђуобелжја користимо спирманов тест корелације ранга, из разлога што он уместоориигиналних податак користи рангиране податке, а рангирање нам омогућава ординалнаскала.

Анлиза помоћу Hi квадрат теста крије у себи четри крупна недостатка:

1. не пружа могућност да се утврди какв облик везе постоји ( помоћу спирмановогкоефицијента можемо открити постојање монотоне везе);

2. није могуће предвидети вредност једне променљиве на основу друге ( то није могуће нипомоћу спирмановог коефицијента);

3. како се појаве класификују речима у различите категорије посматране појаве су мерљивена најнижем нивоу мерења, номиналној или ординалној скали;

4. можемо анализирати само зависност између две појаве.

66. Метод најмањих квадрата? 

Прва етапа у простој линеарној регресији је идентификација зависне и независнепроменљиве што истраживач одређује на бази искуства и других сазнања, која нису строговезана за статистику.

 Друга етапа у простој регресионој анализи своди се на графичко приказивањеподатака на дијаграму распршености . Без дијаграма распршености често се могу добити

потпуно невалидни и погрешни закључци; стога је препоручљиво да се најпре онконструише како би се уочило дали постоји слагање између две појаве.

На основу дијаграма распшености одабраћемо тип криве који највише одговараемпиријским подацима. Тек када нам дијаграм распшености ( уз друга теоријска сазнања )сугерише линеарну зависност између две појаве прелазимо на следећу етапу – оцењивање

непознатих параметра: слободног члана β 0 и коефицијента нагиба β 1. Циљ је да се наоснову података из узорка дође до најбољих могућих оцена bo и b1 и тиме постави линијарегресије у узорку:

- Скрипта за усмени део из основа статистичке анализе-53

xbbY 1oi +ˆ

Page 54: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 54/83

Статистика

Где се са iY означава она вредност Y која се тачно налзи на најбоље прилагођеној линији

регресије узорка, па се назива прилагођена вредност. Оцене bo и b1 имају исти значењекао и код основног скупа, стим што се односе на узорак.

Кроз Између тачака на дијаграму распшености може се повући безброј правих линија,па се поставља питање: Како између емпиријских тачака повући ону линију којанајбоље репрезентује оцењене вредности?

Та права би требало да буде што ближа вредностима свих тачака и тиме нам даоптималне оцене bo и b1. То би могли урадити визуелно, тј. да субјективно одаберемо онуправу која најбоље репрезентује општу тенденцију распореда тачака на дијаграмураспршености. Овај метод поред тога што је субјективне природе не даје могућностодређивања грешке оцене.

Због тога је у пракси развијено више различитих метода, од којих се најчешће користиметод најмањих квадрата.

Познато нам је да ће због стохастичког карактера везе емпиријске тачке показивативећа или мања одступања од линије регресије. Вертикално одступање ( разлику ) измеђустварне ( емпиријске ) вредности и прилагођене вредности називамо резидуалом и

означавамо са e I . 

Резидуал можемо записати у облику једначине:

Уколико је стварна вредност мања од емпиријске тачка на дијаграму распршеностибиће испод линије регресије; уколико је стварна вредноср већа од емпиријске тачка ће бити

изнад линије и уколико се налзи на линији регресије резидула ће бити једнак нули.Из овога закључујемо да да ће права добро репрезентовати распоред тачака ако сурезидуали мали као и обрнуто.

Такође закључујемо да би најбољи избор био да се одабере она права линија код којесе потиру позитивна и негативна одступања ( изнад и испод праве ), тј. она права код којезбир вертикалних одступања једнак нули. Такође и оваквих правих линија можемо иматибесконачно, а обзиром да морамо одабрати само једну праву линију која се најбољеприлагођава подацима, узимамо још један критеријум, тј суму квадрата вертикалниходступања.

Идеја метода најмањих квадрата је да се од свих могућих правих линија одабере онакоја има најмњу суму квадрата вертикалних одступања ( резидуала ).

Математички овај проблем се своди на проналажење минимума израза:

У овој једначини bo и b1 представљају непознате и решавају налжењем парцијалних изводапо bo и b1 одакле се добијају једначине за оцењивање простог линеарног регресионогмодела.

68. Примена студентовог t распореда у оцењивању и тестирању у  регресионој анлизи? 

Студентов распоред први је открио и формилисао Вилијем Gоsет и објавио у радупод псеудонимом „студент“. Због тога се та расподела назива још и Студентова ии т

- Скрипта за усмени део из основа статистичке анализе- 54

Метод најмањих квадрат се базира на минимизирању квадратаодступања свих емпиријских тачака од линије регресије.

ei= Yi- Ŷi=Yi-( bo + b1x)

[ ] 2

i1oi

2

ii

2

i xbbyΣyyΣeΣ −()ˆ(

Page 55: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 55/83

Статистика

расподела. т Расподела донекле је слична нормалној расподели: Попут криве нормалнерасподеле крива т- расподеле је симетрична око аритметичке средине и никада се не спајаса хоризонталном Х-осом. Укупна површина испод т криве је једанка 1 или 100%. Међутимстудентова расподела је више спљоштена од криве стандардизоване нормалнерасподеле. Другим речима крива т расподеле има мању издуженост и већу распшеностод нормалне криве, Како се величина узорка повећева онда студентова расподела сеприближава нормалној расподели.Облик криве т расподеле зависи и од броја степени слободе df ( degrees of freedom). Као икод стандардизоване нормалне криве аритметичка средина т расподеле је једнака нули,али за разлику од стандардизоване нормалне расподеле чија стандардна девијација износи

1, стандардна девијација студентове расподеле је ) /( 2df df  − што је увек веће од 1. Значи

да је стандардна девијација студентове расподеле већа од стандардне девијацијенормалног распореда

Велику примену студентов распоред има у регресионој анализи и користи се:

1. У регресионој анализи приликом оцењивања непознатог параметра β 1 df=n-2

2. У регресионој анализи када тестирамо занчајност оцене параметра β 1 df=n-2

3. У регресионој анализи приликом оцењивања просечне вредности зависно променљиве Ydf=n-2

4. У регресионој анализи при предвиђању индивидуалне вредности зависно променљиве Ydf=n-2

5. У вишеструкој регресији приликом оцењивања непознатих параметара β 1 и β 2 df=n-3

6. У вишеструкој регресији приликом тестирања значајности оцена параметра β 1 и β 2 df=n-3

69. Коефицијент просте корелације и његова примена? 

Сврха корелационе анализе је да утврди да ли између варијација посматраних појавапостоји квантитативно слагање ( корелациона веза ) и ако постоји у ком смеру и у комстепену.

Ако се при томе посматрају две појаве говори се о простој корелацији, а приликоманализе више појава о вишеструкој корелацији.

Код просте корелације може се испитивати да ли између појава постоји линеарна;криволинијска или монотона веза.

Линеарну везу између две појаве испитујемо помоћу коефицијента просте линеарнекорелације у узорку, кога обележавамо са r.

Као мера јачине просте линеарне корелационе везе у узорку користи се релативнамера, која се назива Пирсонов коефицијент или коефицијент линеарне корелације.

Коефицијент просте линеарне корелације као релативна мера, узима вредност од -1до 1. Уколико узима позитивне вредности, корелација између појава је директна ( обепојаве показују варијације у истом смеру ), а ако узима негативне вредности веза јеинверзна ( појаве показују варијације у супротном смеру).

Ако између посматраних појава постоји функционална веза онда говоримо оперфектној корелацији и тада ће вредност коефицијента просте линеарне корелације бити-1 ( ако је реч о инверзној вези ) или +1( ако је веза директна ). Што је коефицијенткорелације по апсолутној вредности ближи јединици то је веза јача, а насупрот томе што јеближи нули линерна веза је слабија.

У екстремној ситуацији када коефицијент корелације једнак нули, закључује се данема линеарне везе између појава. Дакле када се на основу узорка добије коефицијент

корелације једнак нули погрешно је закључити да између појава не постоји квантитативнослагање, јер постоји могућност да можда постоји неки други облик квантитативног слагања

- Скрипта за усмени део из основа статистичке анализе-55

Page 56: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 56/83

Статистика

( криволинијског ) или да нема уопште слагања, али то не можемо закључити без дијаграм распшености.

Правилна интерпретација коефицијента просте линеарне корелације захтева добропознавања још неких карактеристика, обзиром да се он уз аритметичку средину честопогрешнотумачи.

1. Коефицијент просте линеарне корелације говори само то дали у узорку постојилинеарна корелација.

2. Коефицијент просте линеарне корелације захтева прецизне нумеричке податке,односно да се појаве могу мерити на интервалној и скали односа.

3. Коефицијент просте линеарне корелације је релативна мера што значи да нијеисказан у оригиналним јединицама.

5. Некоректна примена коефицијента просте линеарне корелације постоји у случајукад нас његова вредност упућује на погрешан смер везе. То се може десити ако применимокоефицијент просте линеарне корелације на анлизу времнских серија. Например акопосматрамо временске серије тражње за једном врстом цигарета и њеном ценом, могуће једа добијемо позитиван коефицијент корелације, што би упућивало на закључак да сапорастом цене за цигаретама одређене марке расте тражња. Такав резултат би се могаодобити јер су у посматраном периоду и цена и тражња бележиле раст, а ако би искључили

утицај временског фактора добили би логичан резултат да су цена и тражња за цигаретамау инверзној вези.6. На основу постојања линеарне везе не смемо закључивати да је Х узрок а Y

последица, или обрнуто. На пример висок степен корелације на значи да између појавапостоји узрочна веза. У пракси могуће је:а) да Y узрокује Хб) да Х узрокује Yв) да су обе појаве под утицајем неке треће појаве која је под утицајем неких другихнеидентификованих факторад) да између појава постоји интеракција ( узајмно делевоње )ђ) да смо извукли нерепрезентативан узорак која упућује на постојање корелације иако она

не постојида смо добили искривљену корелацију

Између две појаве постоји искривљена ( апсурдна ) корелација када јекоефицијент корелације различит од нуле, а немамо никаквог разлога да верујемо дасу оне међусобно повезане. На пример поједина истраживања показују да основци садужим рукама боље логички резонују од основаца са кратким рукама. Овакав закључак сеиспоставио као бесмислен, јер су накнадне анализе показале да је ( случајно или намерно )изостављена трећа важна варијабла а то је њихов узраст. Логично је да основци са дужимрукама боље резонују али из простог разлога што су старији.

69. Укупан објашњен и необјашњен варијабилитет? 

Након што оценимо параметре регресионог модела, дођемо до оптималних оцена и наоснову њих конструишемо регресиону линију, поставља се питање колико је и та линија( која је најбоља од свих могућих ) довољно репрезентативна. Другим речима поставља сепитање колико је уопште успешан модел у описивању зависности између две појаве.

Репрезентативност добијене линије регресије можемо измерити помоћу две мере и тоапсолутне мере ( која се назива стандардна грешка регресије ) а друга коефицијентдетерминације, који представља релативан показатељ.

Да би боље разумели ове две мере неопходно је да сагледамо под којим утицајимаварира зависна променљива Y.

Претпоставимо да располажемо подацима о издацима за исхрану домаћимстава, алине и о њиховим доходцима ( исхрана је зависна променљива Y; а доходци независна ). Утом случају не бисмо могли користити регресиони модел у сврхе оцењивања и

- Скрипта за усмени део из основа статистичке анализе- 56

Page 57: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 57/83

Статистика

предвиђања издатак за исхрану било ког домаћинства. Могли би оценити просечне издаткеза исхрану Y . Разлику између стварне и просечне вредности за исхрану свакогдомаћинства означавамо са Y-Y . Уколио би сабрали те разлике због познате особинеаритметичке средине да изравнава апсолутне варијације њихова сума би износила 0. Збогтога те разлике морамо најпре квадрирати а затим сабрати ( сумирати ) чиме добијамоукупну суму квадрат одступања или укупан варијабилитет. (Y-Y )2

Уколико би на основу регресионог модела желимо да оценимо издтке за исхранусваког домаћинства онда би једноставном заменом у образац који представља оцењену

линију регресије: [ ] 2

i1oi

2

ii xbbyΣyy −()ˆ( . Овакво одступање представља одступање

стварне од прилагођене вредности, које се такође квадрира, а настало је под утицајемслучајне грешке тј, факора кои нису обухваћени регресионим моделом. Због тога таквоодступање називамо необјашњеним одступањем или необјашњеним варијабилитетом.

Насупрот томе одступање прилагођене од просечне вредности зависнепроменљиве је настало под утицајем фактора који су обухваћени регресионим моделом итакво одступање називамо објашњеним одступањем или објашњеним варијабилитетом.

Укупно одступање ( варијабилитет ) могли би на основу овога рашчланити на збиробкашњеног инеобјашњеногваријабилитета.

70. Коефицијент просте ивишеструке детерминације ( r 2 ; R 2  ) – поређење? 

Једна од мера варијабилитета у простој регресионој анализи, која нам показујеколико је регресиони модел репрезентативан а предстваља однос између објашњеног иукупног варијабилитета назива се коефицијент детерминације. Коефицијент детерминације нам показује колико је процената варијација у зависно променљивој Y

објашњено варијацијама независно променљиве Х. Он се обележава у скупу са ρ 2, ауколико рачунамо на основу информација из узорка са r 2.

Аналогно овом коефицијенту у вишеструкој регресији као релативну меруваријабилитета користимо коефицијент вишеструке детерминације R2, који такође показујеучешће објашњеног у укупном варијабилитету. Међутим како у вишеструкој регресији заразлику од просте регресије имамо више независних променљивих, коефицијентвишеструке детерминације нам показује проценат варијација који је објашњензаједничким утицајем објашњавајућих променљивих укључених у модел.

Његова вредност варира од 0-1 као и код простог регресионог модела и што је ближи јединици то је учешће објашњеног варијабилитета у укупном веће, као и обрнуто.

Недостатак коефицијента детерминације је у томе што зависи од бројапроменљивих у моделу и величине узорка. Уколико је узорак мали а псматра се велики

- Скрипта за усмени део из основа статистичке анализе-57

2YYΣ )ˆ( −

Σ (Y-Y )2= Σ −2

ii yy )ˆ( Σ 2YY )ˆ( −

Укупанваријабилите

т

Σ (Y-)2

Објашњенваријабилите

т

Σ

Необјашњениваријабилите

т

Σ

Page 58: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 58/83

Статистика

број објашњавајућих ( независних ) променљивих, његова вредност биће блиска јединици,чак и када објашњавајуће променљиве појединачно не утичу у тој мери. Тада R2

искривљено показује везу између појава, јер је нереално висок. Такође укључивањемдодатне објашњавајуће променљиве у модел, његова вредност аутоматски расте, безобтира на њен стварни утицај. Због тога је потребно извршити његову корекцију чиме седобија кориговани коефицијент вишеструке детерминације.

Кориговани коефицијент детерминације увек је мањи или једнак од некоригованог.Разлика између ова два коефицијента се смањује повећањем величине узорка, узнепромењени број независно променљивих.

71. Циљеви регресионе и корелационе анализе? 

Сврха регресије јесте да утврди облик везе, односно зависност измеђупосматраних појава. То се постиже помоћу одговарајућег регресионог модела. Регресиони

модел је такв стохастички модел који кроз низ одговарајућих претпоставки и математичкихобразаца описује квантитативну зависност између варијација посматраних појава.Обзиром да се статистика бави стохастичким везама, закључујемо да регресиони

модел показује просечно слагање варијација посматрних појава. Регресиони модел није сампо себи циљ, већ средство помоћу којег можемо да предвидимо и оценимо вредностзависне променљиве за за жељене вредности независне променљиве.

На основу наведених циљева закључујемо да регресиона анализа има много већи ипрактичнији значај од корелационе анализе.

Такође важно је напоменути да ни помоћу регресионе ни корелационе анализе неможемо утврдити која је од посматраних појава узрок а која последица, већ се за то користедруги методи квалитативне или квантитативне анализе.

72. Оцене регресионих парметара по методи најмањих квадрата особине иинтерпретација? 

Идеја метода најмањих квадрата је да се од свих могућих правих линија одабере она којаима најмњу суму квадрата вертикалних одступања ( резидуала ).

Математички овај проблем се своди на проналажење минимума израза:

- Скрипта за усмени део из основа статистичке анализе- 58

Циљ корелационе анализе је да се утврди дали између варијација посматраних појавапостоји слаагње и ако постоји у ком степену.

Циљ регресионе анализе је да се одреди регресиони модел који најбоље описује везуизмеђу појава и да се на основу тог модела изврши оцењивање и предвиђње врендсоти

зависне променљиве за одговарајућу вредност независне објашњавајуће променљиве.

Метод најмањих квадрат се базира на минимизирању квадрата одступања свихемпиријских тачака од линије регресије.

[ ] 2

i1oi

2

ii

2

i xbbyΣyyΣeΣ −()ˆ(

Page 59: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 59/83

Статистика

У овој једначини bo и b1 представљају непознате и решавају налжењем парцијалнихизвода по bo и b1 одакле се добијају једначине за оцењивање простог линеарногрегресионог модела.

Према Гаус – Марковљевој теореми оцене добијене методом најмањих квадратапредстављају најбоље ( ефикасне ), непристрасне линеарне оцене.

Добјене оцене ( вредности из узорка ) тумаче се на исти начин као и вредностипараметра у скупу тј. добијена оцена:

b1 – показује нам за колико се у просеку промени ( повећа/смањи ) ниво зависнепроменљиве, ако се независна променљива повећа за једну своју мерну јединицу.Називамо га и коефицијент нагиба, јер одређује нагиб регресионе праве. Може бити ипозитивани негатаиван.

b0 – слободан члан ( константа ), показује нам колико ће у просеку износити нивозависне променљиве када је ниво независне променљиве једнак нули. У појединимслучајевим нема посебан економски а ни логички значај. Називамо га још и одсечак јер надијаграму распршености показује тачку у којој линија регресије сече Y осу.

73. Кориговани коефицијент вишеструке детерминације 2R ? 

Аналогно коефицијенту детерминације у простој регресији коефицијент у вишеструкојрегресији као релативну меру варијабилитета користимо коефицијент вишеструке детерминације R2, који такође показује учешће објашњеног у укупном варијабилитету.Међутим како у вишеструкој регресији за разлику од просте регресије имамо вишенезависних променљивих, коефицијент вишеструке детерминације нам показује проценатваријација који је објашњен заједничким утицајем објашњавајућих променљивихукључених у модел.

Његова вредност варира од 0-1 као и код простог регресионог модела и што је ближи јединици то је учешће објашњеног варијабилитета у укупном веће, као и обрнуто.

Недостатак коефицијента детерминације је у томе што зависи од бројапроменљивих у моделу и величине узорка. Уколико је узорак мали а псматра се велики

број објашњавајућих ( независних ) променљивих, његова вредност биће блиска јединици,чак и када објашњавајуће променљиве појединачно не утичу у тој мери. Тада R2 показујеискривљено везу између појава, јер је нереално висок. Такође укључивањем додатнеобјашњавајуће променљиве у модел, његова вредност аутоматски расте, без обтира на њенстварни утицај. Због тога је потребно извршити његову корекцију чиме се добијакориговани коефицијент вишеструке детерминације.

Кориговани коефицијент детерминације увек је мањи или једнак однекоригованог. Разлика између ова два коефицијента се смањује повећањем величинеузорка, уз непромењени број независно променљивих.

74. Стандардна девијација случајне грешке и стандардна грешка регресије? 

Стандардна девијација случајне грешке нам показује колика је дисперзијаслучајних грешака , односно колика су одступања стварних врености променљиве Y одњених просечних вредности Y  на регресионој прави скупа. Растојање сваке појединачнетачке на регресионој правој основног скупа представља одговарајућу вредност случајнегрешке. Стандардна девијација случајне грешке мери дисперзију тих тачакаод регресионеправе скупа. Случајне грешке називамо и резидуалима.

Будући да нам стандардна девијација и варијанса случајне грешке нису познате , онесе оцењују на основу случајног узорка. Оцена варијансе случајне грешке S2 на основуподатака из узорка ( резидуала узорка ) назива се резидуална варијанса, а оценастандардне девијације случајне грешке S стандардна грешка регресије.

- Скрипта за усмени део из основа статистичке анализе-59

Page 60: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 60/83

Статистика

75. Мо дел просте линеарне регресије (претпоставке и примена)? 

Линеарни регресиони модел заснива се на одређеним претпоставкама. Посматрајућирегресиони модел скупа који се записује у облику једначине

а на бази претпостављеног примера у коме доходак представља независну, а издаци заисхрану зависну променљиву можемо лакше објаснити те претпоставке.

1. Очекивана вредност случајне грешке ε једнака је нулу за сваку вредностпроменљиве Х*. Другим речима међу домаћинствима са са истим нивоом доходка постоје

нека домаћинства која троше више од оцењеног нивоа издатак за исхрану ( случајна грешка је позитивна ); као и она која троше испод тог нивоа ( случајна грешка је негативна).Претпоставка говори да је сума позитивних вредности једнака суми негативних

вредности, па су случајне грешке за сва домаћинства са истиим нивоом доходка упросеку једнаке нули.

2. Случајне грешке различитих опсервација су међусобно независне. У нашем

примеру са домаћинствима то би значило да свако домаћинство независно од осталихдомаћинства доноси одлику од осталих домаћинства колико ће издвојити за исхрану.

3. Случајна грешка за сваку вредност променљиве Х има константну варијансу.4. За дату вредност променљиве X , расподела случајних грешака је нормална.

5. Објашњавајућа променљива X узима фиксиране вредности из из поновљенихузорка тј. није стохастичка. Другим речима објашњавајућа променљива X и случајна грешка

ε нису корелисане.

ПРИМЕНА:У регресионој анализи је важно изабрати адекватну форму ( облик ) регресионог

модела. Када користимо просту линеарну регресију, претпостављамо да се веза између

две променљиве може описати правом линијом. У стварности веза између две променљивене мора бити линеарна. Зато је пре спровођења линеарне регресионе анализе потребнопреко дијаграма распђености неопходно испитати прирофу, облик и смер слагања измеђупроменљивих. Линеарну форму оцењујемо само када нам дијаграм распшености сугеришеда постоји линеарно слагање.

77. Тестирање значајности оцена регресионих параметара? 

Како оцена регресионог параметра β 0 понекад нема економски значај, тестирање

значајности оцена регресионих параметара углавном се своди на тестирање параметра β 1.

Приликом тестирања хипотезе о параметру β 1, нулту хипотезу формулишемо уоблику β 1=0 или вербално да променљива X не утиче на Y и да се регресиона права неможе користити у сврхе предвиђања и оцењивања.Треба имати у виду да се на овај начин тестира само хипотеза о непостојању линеарнезависности, а не и других облика зависности.Нултој хипотези придружујемо алтернативну, која се може поставити у облику :

1) β 1≠ 0 – X утиче на  Y

2) β 1 > 0 – X позитивно утиче на Y

3) β 1 < 0 - X негативно утиче на Y

Статистика теста којом тестирамо параметар β 1 има облик: 1

1

Sb

b

t =

- Скрипта за усмени део из основа статистичке анализе- 60

 Y=β 0+β 1X+ ε

Page 61: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 61/83

Статистика

Тестирање спроводимо кроз истих пет етапа, и оно може бити заснованао на критичнојвредности, или на р вредности.

77. Модел вишеструке регресије ( претпоставке и примена )?

Када у регресиони модел укључимо две или више независних променљивих онда је реч овишеструком регресионом моделу. Треба знати да без обзира дали је реч о просром иливишеструком регресионом моделу увек постојисамо једна зависна променљива, а свеостале су независне ( објашњавајуће ).

Вишеструки регресиони модел са једном зависном Y и више независних X1, X2 , X3, XК можесе записати у следећем облику:

Где β 0 представља одсечак или константу, а коефицијенти β 1;β 2 ; β 3 … коефицијенте

нагиба или регресионе параметре уз објашњавајуће променљиве а ε  случајна грешкавишеструког модела. Овај модел описује линеарну зависност између зависне променљиве

 Y и к независних променљивих X. Осим тога модел претпоставља да измеђуобјашњавајућих променљивих нема међусобног деловања ( интеракције; аутокорелације).

Модел вишеструке регресије заснован је на следећим претпоставкама.

1. Просечна вредност сличајне грешке једнака је нули – другим речима претпоставка једа је сума позитивних вредности једнак суми негативних вредности, које се међусобнопотиру.2. Случајне грешке за различите опсервације су међусобно некорелисане( независне ).Поред тога случајне грешке су нормално распоређене и имају константнустандардну девијацију.3. Објашњавајуће променљиве нису међусобно зависне. Када је ова претпоставка испуњена

то значи да нема мултиколинеарности. У пракси мултиколинеарност представља великипроблем, а један од начина да се она испита је да се изврши корелациона анлиза попаровима случајних променљивих.

4. Објашњавајуће променљиве X узимају фиксиране вредности из поновљених узорка

тј.веза није стохастичка. Другим речима објашњавајућепроменљивеX и случајна грешка εнису корелисане.

78. Статистички тестови у регресионој и корелационој анализи?

Највећу примену у ргресионој и корелационој анлизи има студентов t – test, кога користимо :

1. При оцењивању значајности добијене оцене параметра β 1, тј када Желимо да испитамо

дали независна променљива Х утиче на Y. Статистика овог теста има облик 1

1

Sb

bt = , и

идентичан тест употребљавамо и у вишеструкој регресије када испитујемо дали X1, X2 , X3,утичу на Y, мењајући у бројиоцу одговарајуће вредности у зависности од параметра којитестирамо.2. Приликом тестирања добијене оцене коефицијента просте линеарне корелације r  тј. када желимо да испитамо дали између две случајне променљиве постоји линеарноквантитативно слагање. У том случају статистика теста има облик:

- Скрипта за усмени део из основа статистичке анализе-61

 Y= β 0+β 1х1+β 21х2+.....β 1xк 

Page 62: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 62/83

Статистика

Sr 

r t = , где Sr представља стандардну грешку оцене коефицијента проте линеарне

корелације.Како је параметар студентове расподеле број степени слободе, треба напоменути да је кодтестова који се користе у простој регресији број степени слободе једнак  n – 2, aкодвишеструке n – 3.

79. Спирманов коефицијент корелације ранга?

Спирманов коефицијент корелације ранга је непараметарски тест, који је заправоаналоган коефицијенту просте линеарне корелације r . Помоћу њега такође утврђујемо далиизмеђу две појаве постоји слагање, односмо монотона веза која може бити монотонаорастућа и монотоно опадајућа.

Његова предност је што се може употребити и када су обелжја атрибутивна подусловом да су мерљива на ординалној скали, и што се при његовом тестирању не морајууводити никакве претпоставке о распореду основног скупа, осим да је непрекидан.

Као и већину непараметрских тестова карактерише га једноставност извођења, аспроводи се тако што се најпре оригинални подаци рангирају, а затим се на основу њихових

рангова утврђује степен слагања варијација између две појаве.Значајност добијеног коефицијента корелације ранга врши се кроз поступак 

тестирања хипотеза.

80. Параметарски и непарметарски показатељи корелације – претпоставке и примена?

У зависности од испуњености претпоставки везу између две појаве можемо испитатипомоћу:

1. Коефицијента просте линеарне корелације r 2. Спирмановог коефицијента корелације ранга r s

Линеарну везу између две појаве испитујемо помоћу коефицијента просте линеарнекорелације у узорку, кога обележавамо са r.

Примена овог коефицијента захтева испуњеност следећих претпоставки:1. Да је заједнички распоред X и Y нормалан.2. Да су обележја ( варијабле ) мерена прецизно тј. на скали односа или интервалној

скали.Спирманов коефицијент корелације ранга је непараметарски тест, који је заправо

аналоган коефицијенту просте линеарне корелације r . Помоћу њега такође утврђујемо далиизмеђу две појаве постоји слагање, односмо монотона веза која може бити монотонаорастућа и монотоно опадајућа.

Његова предност је што се може употребити и када су обелжја атрибутивна подусловом да су мерљива на ординалној скали, и што се при његовом тестирању не морајууводити никакве претпоставке о распореду основног скупа, осим да је непрекидан.

Као и већину непараметрских тестова карактерише га једноставност извођења, аспроводи се тако што се најпре оригинални подаци рангирају, а затим се на основу њиховихрангова утврђује степен слагања варијација између две појаве.

82. Оцењивање и предвиђање у регресионој анализи?

Циљ регресионе анализе је да се одреди регресиони модел који најбоље описује везуизмеђу појава и да се на основу тог модела изврши оцењивање и предвиђње врендсотизависне променљиве за одговарајућу вредност независне објашњавајуће променљиве.

- Скрипта за усмени део из основа статистичке анализе- 62

Page 63: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 63/83

Статистика

Да би коректно користили регресиони модел за предвиђање и оцењивање потребно једа буду испуњена следећа два услова:

1. да регресиона линија добро репрезентује емпиријске податке r 2 > 0,5 ( висок нивокоефицијента детерминације)

2. Да између варијација посматраних појава у скупу постоји линеарна веза ( коефицијент β 1

се разликује од нуле).

Обзором на стохастичку природу везе између зависне и независне променљиве, за свакупојединачну вредност Х у скупу постоји читавраспоред могућих врености Y. Услед тогапредвишање у регресионој анлизи има двојако значење, тј. можемо:

1.Вршити предвиђање за индивидуалне вредности X2. Оцењивање за просечне вредности Y

Разлика је у томе што што просечна вредност представља константу , а индивидуалнавредност случајну променљиву.

Предвиђање ( оцењивање просечних вредности или предвиђање индивидуалнихвредности) се врши формирањем интервала око тачкасте оцењене вредности, а да би

формирали са одговарајућом поузданошћу интервал поверења потребно је да познајемомеру одступањавредности за коју вршимо предвиђање од просечне вредности. Таква мераназива се стандардна грешка оцене зависне променљиве Y.

Код предвиђања индивидулних вредности зависно променљиве Y поступак формирања је идентичан као икод оцењивања просечних вредности, тако што у оцењенувреност регресионог модела уврстимо вредност закоју вршимо предвиђање, али сад се јавља додтан проблем што предвиђамо индивидуалну а не просечну вредност. Тешкоћа је утоме што ова вредност зависи и од случајне грешке за коју знамо да је случајнапроменљива. Као последица тога стандардна грешка предвиђања је већа од стандарднегрешке оцене јер нам је потребан шири интервал.

83. Мерне скале и њихов значај у корелационој анализи?

У зависности од природе посматране појаве; модалитета променљиве као и од циљаистраживања сваки ниво мерења има посебну скалу при чему се успешност мерењаизражава количином прибављених информација. Постоје 4 нивоа мерења и 4 мерне скале:

Ово је најнепрецизнија скала јер не показује никакав однос( разлику) између модалитета. Користи се само код атрибутивних

обележја међу чијим модалитетима не постоје кавнтитативне разлике као на примервероисповест, шифра делатности, занимање, бројеви на дресу, градске зоне паркирања...Класификација се уводи чисто ради форме, као на пример 1- ожењен; 2- неожењен;

3- удовац; 4- удовица; 5- разведен... или на пример 1- банкарство; 2- пољопривреда;3- водопривреда; 4- електропривреда... Примећујете да овде бројке не представљајуникакав квалитативан јер не можемо направити квалитативну разлику на основу брачногстања или на основу делатности у којој је неко запослен. Редни бројеви ученика који су удневнику заведени под азбучним редом такође представљају ниво мерења на номиналнојскали на пример 1.Алексић Дејан 2.Бранковић Марија 3.Вељковић Марина...Овде нам редниброј под којим је заведен ученик не показују никакав квлитативан однос већ би моралиимати неки други показатељ, на пример просечна оцена, залагање на часу ... Вршење билокаквих рачунских операција са бројевима на овој скали је бесмислено, тј. не бисмо добилиникакав смислени податак на пример не бисмо ништа добили ако би сабирали модалитетеожењен(1)+неожењен(2)+удовац(3)+ удовица(4)...

- Скрипта за усмени део из основа статистичке анализе-63

Номинална скала

Page 64: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 64/83

Статистика

 Ова скала је прецизнија од номиналне, јер нам она показује однос, акористи се код атрибутивних обележја међу којима постојиквалитативна разлика, тј. код оних обележја које можемо рангирати.

Таква обележја су на пример успех у школи са модалитететима недовољан; довољан;добар; врло добар и одличан, јер се између ових модалитета може направити квалитативнаразлика мада не баш прецизна обзиром да на пример врло добар успехобухвата“релативно“ велику категорију имеђу којих постоје значајне разлике, јер врло добарученик може бити и онај који има просек 3,50 и онај који има просек 4,49; или можда јошбољи пример замагљене прецизности код ученика који има успех недовољан, обзиром данедовољан успех може имати и ученик са једном непролазном оценом и онај са петнепролазних. Сличан пример може бити и ранг листа фудбалских клубова у којима би например Црвена Звезда била прва на листи са на пример 50 бодова, а на другом местуВојводина са свега 12 поена, што значи да би фудбалска лига имала на првом и другомместу „у врху“ два клуба изнеђу којих очигледно постоји драстична разлика у квалитету.Сетите се и бројних примера са председничким изборима гд еје на пример на првом местукандидат „ А.А“ на првом месту са освојених 2.000.000 гласова, а на другом месту кандидат„Б.Б.“ са 130.000 гласова. Очигледно би у првом примеру као мерило успеха правилније

било као критеријум успеха узети просечну оцену, у другом број поена који је сваки клубосвојио, а у трећем број гласова који је председнички кандидат добио. На овој скали такођенема смисла вршити било какве рачунске операције, из истих разлога као и кодноминалне скале.

Овом сваком модалитету се придружује број, при чему једнакеразлике између бројева представљају предстваљају једнакеразлике мерне карактеристике. Интервална скала омогућује

утврђивање редоследа модалитета у скупу као и меру њиховог разликовања. Заинтервалну скалу карактерисрично је да нулта вредност не значи непостојање појаве, јер ова скала је карактерисрична по томе што се код ње нулта вредност утврђује

 договором или конвенцијом, па самим тим за једну исту величину можемо имати различитемерне скале, као на пример за мерење температуре ваздуха ( може се исказати иЦелзијусовом и Фаренхајтовом скалом, тј. у Келвиновим степенима). Такође и календарсковреме је типично за ову скалу јер хришћани као нулту тачку времена узимају годину рођењаИсуса Христа; муслимани Мухамеда...Немојте „упасти у замку“ и помислити да јекарактеистика мерне скале то што се иста појава може исказати у различитим интервалнимскалама, већ да код ње нула не значи непостојање појаве, већ да је само нулта таччкаодређена произвољно. Тако на пример температура од 0 степини, било Целзијусових, билоКелвинових не значи да температуре нема. Дали би брзина од 0 метара у секунди или 0километара на час значила да нема ветра тј. да он не дува. Свакако да је одговор да, штозначи да брзина ветра није мерљена на интервалној скали ( генерално брзина било чега

није на овој скали, као на пример брзина кретања аутомобила) већ се за њу користинаредна скала коју називамо скала односа. Пошто скала односа садржи бројеве који заистапоказују квалитативан однос на њој се могу вршити све рачунске операције. На примеримало би смисла сабрати укупну месечну температуру а затим поделити са бројем дана умесецу и тако добити просечну дневну температуру за посматрани месец.

Скала односа је најпрецизнија скала, због тога што као и интервалнаскала показује редослед модалитета и меру њиховог разликовања али заразлику од ње она има праву нулу тј. на њој можемо мерити појаве које

по природи имају нулу, или боље речено код које нула заиста означава непостојање

посматране појаве. Наведен вам је пример за брзину ветра; брзину аутомобила, а наводим

- Скрипта за усмени део из основа статистичке анализе- 64

Ординална скала

 Интервална скала

Скала односа

Page 65: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 65/83

Статистика

вам и још неке примере који су типични за ову скалу а то су: висина, тежина, приход, јачиназемљоотреса...

Интервална и ординална скала једним именом називају се кардиналне скале, и онепредстваљају нумеричке скале тј. једино код њих бројеви који се додељују модалиттетимаимају „прави значај“.

У корелационој анализи у зависности од тога на којој скали је мерљиво обележје користимо

различите показатеље корелације, и то :

1. Коефицијента просте линеарне корелације r – захтева најпрецизнији ниво мерења, тј. дасу обележја мерљива на интервалној или скали односа

2. Спирмановог коефицијента корелације ранга r s – не захтева искључиво нумеричкаобележја, већ се може употребити и на атрибутивним обележјима под условом да су

мерљива на ординалној скали.

84. Екстраполација и њена ограничења у корелационој и анализи времнских серија?

Екстраполација у линеарној регресији је коришћење регресионог модела за

предвиђање и оцењивање оних вредности X које у регресионом моделу нису обухваћенеемпиријским подацима из узорка.

Екстарполацијом уствари продужавамо линију регресије изван опсега вредностиобјашњавајуће променљиве које смо добили у узорку. Велики број статистичара сматра дасе екстраполација регресионе линије уопште не би смела вршити. При таквом поступкуистраживач сноси ризик да изван опсега података на основу којих врши екстраполацију непостоји линеарна веза.

Међутим у пракси ипак преовлађује став да се екстраполација може вршити, алисамо у непосредној близини најмање и највеће вредности X дате узорком.

Да би се вршила екстраполација тренда, односно прогноза будућих вредности појавеу периоду који је претходио или у периоду који следи потребно је да оригиналне вредности

значајно не одступају од линије тренда.

Да би екстраполација тренда била релативно успешнапотребно је да буде испуњеновише услова:

1. Фактори који су деловали на кретање појаве у обухваћеном периоду, моморају идаље да наставе да делују у истом смеру и интезитету, и без уплива нових фактора.

2. Као и у регресионој анлизи дозвољена је само прогноза у непосредну будућност.3.Уколико су у питању пројекције економских појава прогноза која се врши у

стабилним условима је тачнија од прогнозе која се врши у нестабилним условимапривређивања.

4. Уз сва ограничења потребно је знати да екстраполација тренда представља самоупросечену слику у будућност као механичка пројекција.

88. Индексни бројеви и индексни поени?

- Скрипта за усмени део из основа статистичке анализе-65

Екстраполација тренда представља продужење линије тренда изван интервалобухваћеног времнском серијом, било у прошлост било у будућност

Индекс је релативна мера промене појаве у времену представља

однос нивоа појаве у текућем и нивоа појаве у неком одабраномбазном периоду.

Page 66: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 66/83

Статистика

Индексни бројеви деле се на :1.индивидуалне (прате промену једне појаве)2.групне(прате промену групе сродних појава)

Разлика између два базна индекса се исказује идексним поенима, што је апсолутнаа не релативна мера. Један индексни поен представља 100 део ниво појаве из базногпериода. У нашем случају то би било:I 2007(2005=100)- I 2006(2005=100)=300-150=150 индексних поена.Један индексни поен у нашем

случају износио би 0,1=100

 10 динара, па ако би разлику од 150 индексних поена помножили са

вредношћу 150, добили би 0,1×150=15ó 30 - 15= 15 динара.

Индивидуалне индексе даље можемо поделити на :1.1 Индексе са сталном базом ( базни )- подразумевају да све податке временске серије

делимо само са једним податком из периода који је узет као база.Израчунавају се када се сваки податак из временскр серије подели са податком из периодакоји је узет као база. Обележавамо их са Ii а израчунавамо по обрасцу:

где је:Yi-ниво појаве у текућем периоду  Yb-ниво појаве у базном периоду

Множење са бројем 100 вршимо само зато да би јаче исказали проценат. Бани индексза базни период је једнак 100.

Индекс који има вредност изнад сто показује нам релативан пораст појаве, а индекс који имавредност испод сто показује нам релативан пад појаве(например ако је цена хлеба у 2005.години износила 10 динара, а у 2006.години 15 динара, уколико би смо желели да искажеморелативну промену цену хлеба у 2006. у односу на 2005.онда би индекс износио

1501001015100

YYI

2005

20062006 =×=×= , што би значило да је цена хлеба у у 2006 у односу на 2005

порасла за 50 процената (150-100=50). У овом примеру базни период била је цена хлеба у2005. години, а текући период цена хлеба у 2006. години, што би статистички моглизаписати на следећи начин: I 2006 (2005=100).

Уколико је цена хлеба у 2007 износила 30 динара а у 2006.години као што смо видели 15

динара, онда би баизни индекс цена за 2007 годину износио 30010010

30100

Y

Y I

2005

20072007 =×=×=

што би значило да је цена хлеба у 2007. у односу на 2005. порасла за 200 процената(300-100=200).

89. Индекси са сталном и променљивом базом?

Индивидуалне индексе даље можемо поделити на :1. Индексе са сталном базом ( базни )- подразумевају да све податке временске сериједелимо само са једним податком из периода који је узет као база.

Израчунавају се када се сваки податак из временскр серије подели са податком изпериода који је узет као база. Обележавамо их са Ii а израчунавамо по обрасцу:

где је:Yi-ниво појаве у текућем периоду  Yb-ниво појаве у базном периоду

Множење са бројем 100 вршимо само зато да би јаче исказали проценат. Бани индексза базни период је једнак 100.

- Скрипта за усмени део из основа статистичке анализе- 66

Ii=

Ii

=

Page 67: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 67/83

Статистика

Индекс који има вредност изнад сто показује нам релативан пораст појаве, а индекс који имавредност испод сто показује нам релативан пад појаве(например ако је цена хлеба у 2005.години износила 10 динара, а у 2006.години 15 динара, уколико би смо желели да искажеморелативну промену цену хлеба у 2006. у односу на 2005.онда би индекс износио

15010010

15100

Y

YI

2005

20062006 =×=×= , што би значило да је цена хлеба у у 2006 у односу на 2005

порасла за 50 процената (150-100=50). У овом примеру базни период била је цена хлеба у

2005. години, а текући период цена хлеба у 2006. години, што би статистички моглизаписати на следећи начин: I 2006 (2005=100).

Уколико је цена хлеба у 2007 износила 30 динара а у 2006.години као што смо видели 15

динара, онда би баизни индекс цена за 2007 годину износио 30010010

30100

Y

Y I

2005

20072007 =×=×=

што би значило да је цена хлеба у 2007. у односу на 2005. порасла за 200 процената

90. Проблем избора базе и интерпретација индексних бројева?

Код базних индекса најчешћи проблем се јавља када треба одредити базу, тј. којугодину узети као базу. У нашем случају узета је као база прва година у серији што нијепрепоручљиво када се прати понашање појаве у релативно дугом периоду, као штоније препоручљиво ни узимати ону годину када је појава имала сувише висок или низак ниво.Да би индекси показали што реалнијуи слику кретања појаве потребно је узети онугодину(месец) када је појава показала стабилан ниво, а у пракси због једноставностиуколико се ново појаве у првој години не разликује драстично од осталих податканајпрепоручљивије је узети прву годину. (замислимо пример ако бисмо пртили ниво продајемобилних телефона у периоду од 1996-2005, тада би као базу било погршно узети првугодину 1996, јер је тада број мобилних телефона имао знатно мали број људи).Генрално каобаза се може узети било која година обухваћена временском серијом, вишегодишњи

просек...Базни индекс у нпр.2000.години од 122,10 нам показу е да је производња угља у 2000.години била за 22,10% била већа у односу на 1995.годину , исто важи и за остале годинекао нпр.у 2003, где би закључили да је производња угља била за 50,73% већа у односу на1995.

91. Пондерисање индексних бројева? 

Групни индекси могу бити пондерисани и непондерисани, а непондерисане индексе је коректно применити само ако су саставне серије групе исте по значају противномпотребно је извршити њихову пондерацију. И код непондерисаних групних индекса постојивид пондерације али он није адекватан (нпр.код неки индекса цена најскупљи производћеимати највећи утицај на резултат или код индекса количина најзаступљенија количинаима највећи утицај на резултат иако је њена цена мала). Овакав начин називамо " Привидно

пондерисање". Као пондер за цене узима се количина а као пондер за количинецена.

- Скрипта за усмени део из основа статистичке анализе-67

Пондерисање групних индекса има за циљ да свакој саставној сериј која улази у групнииндекс да одгиварајући значај.Пондерисањем се повећава репрезентативност групних

индекса као показатеља динамике више временских серија.

Page 68: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 68/83

Статистика

Пондерација индекса највише долази до изражаја код индекса цена.Тако на пример код индекса цена на мало пондери појединих серија цена утврђују се усразмери са учешћем ових артикала у робном промету на мало, односно учешћу у робномпромету на велико ако је у питању промет робе на велико.Ако се пак ради о индексутрошкова живота, онда се значај појединих сериј цена утврђује према проценту са којимпосматрани производи оптерећују кућни буџет(нпр.цене позоришних карата имале бидалеко мање учешће од цена меса и месних прерађевина).

92. Конструкција групнихх индекса по методу просечних односа? 

1.Код средњег аритметичког индекса узима се као пондер вредност из базног периодапа би тако средњи пондерисани групни индекс цена гласио:

А индекс количина:

2.Геометријски индекс се пондерише истим пондерима као и средњиаритметички индекс па би образац са пондерисани геометријски индекс гласио:

3.Као пондер код хармонијсаког индексаузима се вредност из текућег периода, па би образац за његово израчунавање гласио:

 

93. Конструкција групних индекса методом агрегата? 

По методи агрегата пондерисање групних индекса се врши далкео једноставније.Акоби рачунали групни агрегатни индекс цена као пондер узели би количине,а кодпондерисања количина узимамо цене.Проблем се јавља када треба одредити које цене иколичине узети као пондере, дали из базног или текућег периода.Немачки екоономистаЛаспејерс је предложио да се као пондери узму цене или количине из базног периода па супо њему индекси и добили назив а добијамо их по обрасцима:

за цену за количину

- Скрипта за усмени део из основа статистичке анализе- 68

Ip=poqo

poqopo

pi

Σ

×Σ

×1

00

Iq=poqo

poqoqo

qi

Σ

×Σ

×100

Ip= pogo poqon

poqo2

pogo1 I...II ××Σ

Ip=piqi

po

piqi

×Σ

Σ

 ×100

Iq=100

piqiqi

qo

piqi×

×Σ

Σ

Page 69: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 69/83

Статистика

Други немачки економиста Херман Паше препоручио је коришћење пондера из текућегпериода, и Пашеови индедкси се израчунавају по следећим обрасцима:

за цену за количину

Примећијете да се индекс вредности не пондерише, јер код њега нема потребе да сеузима било какав пондер, па се он по методу агрегата увек рачуна на исти начин тј. по

обрасцу:

Недостатак Ласпејерсовог начина пондерисања је у томе што током времена долазидо промена у структури посматраних серија, па задржавање пондера из базног периодадеформише слику слику њихове динамике.Тако на пример ако се посматра индекс количинеизвоза Јужне Кореје од 1980. до 2005. и задрже пондери из базног периода(цене из1971.)добили бисмо нереалну слику јер многи прозводи из 2005.битни у структури извоза

ове земље тада нису постојали(компјутери, музичке линије), те са све већим удаљавањембазног од текућег периода индекси пондерисани по Ласпејерсовом методу губе нарепрезентативности. Као могуће решење наводи се измена базне године.

Пашеов метод има два крупна недостатка:1.не располажемо увек документацијом о пондерима из текућег периода.

2.сваке године пондере треба мењати па резултати носу нису међу собом упоредиви. Збогтога се он у пракси ретко користи.

94. Просечна стопа раста и базни индекси? 

Релативне варијације једне серије посматране у одређеном временском периоду,поред индивидуалних индекса можемо исказати и просечном ( геометријском ) стопомраста.

Просечна стопа раста представља стипу по којој се појава у просеку годишњеповећавала или смањивала. Може се израчинати преко базних или ланчаних индекса.

Недостатк јој је у томе што она упросечије раст појаве у свим годинама, без обзирадали је појава у посматраном периоду расла или опадала. Може бити и позитивна инегативна, па њену негативну вредност тумачимо као просечно смањење.

Уколико је например стопа раста износила 5,26% у периоду од 2000 – 2007 тимаћимода је у периоду од 2000 – 2007 појава у просеку годишње расла по стопи од 5,26%.

Уколико је например стопа раста износила - 5,26% у периоду од 2000 – 2007тимаћимо да је у периоду од 2000 – 2007 појава у просеку годишње опадала по стопи од5,26%.

- Скрипта за усмени део из основа статистичке анализе-69

Ip= 100piqo

×Σ Iq= 100

qopo

qipo×

Σ

Σ

Ip= 100poqi

piqi×

Σ

ΣIq= 100

qopi

qipi×

Σ

Σ

Ipq=

100piqi

×Σ

Page 70: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 70/83

Статистика

Базни индекс нам показује релативну промену у текућем у односу на базни период,па уклико је базни индекс у 2007 години износио 105,26 а базна година је била 2000. ондатумачимо да је у 2007 у односу на 2000. појава порасла за 5,26%.

95. Приступи у анлизи времнских серија? 

Постоје разноврсни методи приступа анализи временских серија који се могу разврстати удве групе и то:

Прва група метода приступа истраживању серија у функцији времена ( време јенезависна променљива а ниво појаве зависна), а друга група метода спада у доменспектралне и хармонијске анализе. У статистичкој теорији много већи значај се даје анлизивременских серија са становишта времена јер се она у пракси више и користи, а осимтога друга група метода захтева сложеније математичко знање.

Код анализе временских серија најпре се анализирају годишњи подаци, затим сеанализа проширује укључањем кварталних

( тромесечних) података а затим се приступа прогнозирању кретања временских серија.Анализа временских серија у функцији времена полази од претпоставке да напромене посматраних појава током времена утичу четри компоненете и то:

Тренд компонента (Т) - Развојна тенденција у дужем временском периоду или секуларнатенденција.

Циклична (С)- компонента која показује колебања која се појављују у одређеним честонеједнаким периодима од више година.

Сезонске варијације (S)- Варијације које се испољавају у размацима мањим од једнегодине и то по правилу на исти начин у дужем временском периоду

Нерегуларни утицаји (резидуална компонента)- Сучајне варијације појава које настају збогдогађаја који се не могу предвидети.

Сумарно их можемо приказати у следећој табели:

компонента дефиниција разлог утицаја време трајања

ТРЕНД

Тенденција уразвоју неке

појаве(раст илиопадање) у

посматраном

периоду

Промена технологије,становништва,

друштвеногбогатсва,менталитета

-

сви фактори који сеспоро мењају

Више временских јединица(месеци,

година..)

СЕЗОНСКА

Прилично правилнепериодичне

варијације које се јављају током сваког

одговарајућегмесечног или

кварталног периодаи то у истом периоду

током године

Временскиуслови,друштвени и

религиозниобичаји,школскираспусти,одмори

Током одређеногквартала или

месеца, може сесамо одредити када

су подаци намесечном или

кварталном нивоу

- Скрипта за усмени део из основа статистичке анализе- 70

1.Они који приступају серији са аспекта времена 

Page 71: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 71/83

Статистика

ЦИКЛИЧНА

Понављање кретањакроз 4 фазе:од

врха(просперитет) касмањивању(рецесија)од

дна(депресија),каврху(експанзија)

Међуделовање вишефактора који утичу на

економију

Обично вишегодина са

променљивиминтезитетом за

комплетан циклус

РЕЗИДУАЛНА

слулајне и остале

варијације којепостоје у серији

осим Т,С,S

Случајне и преостале

флуктуације које се јављају због

непредвиђених догађаја

кратко трајање без

понављања

Основна претпоставка при прогнозирању у анализи временских серија је да ћефактори који су утицали на ново појаве у прошлости и садашњости деловати на исти начину будућности и да неће бити уплитања неких нових фактора.Анализа времнских серијапокушава да идентификује образац понашања наведених компоненти у прошлости ,а затимда претпостављајући да ће идентичан образац да се настави у будућности, прогнозирабудуће нивое појаве. Због тога се може рећи да је један од главних циљева авализевременских серија прогнозирање будућих вредности појаве. Са гледишта прогнозирањапосматрајући 4 наведене компоненте, једино је немогуће прогнозирати понашање случајнекомпоненте будући да она одражава непредвидиве варијације. Осим тога кључна разликаизмеђу сезонске и цикличне компоненте је у томе да се сезонски утицај можепрогнозирати а циклични готово да је непредвидив.

96. Временске серије – појам иподела? 

Ниво појаве може да се односи на један временски тренутак када је извршено посматрање итада говоримо о момнетним временским серијама, а може се односити и на један временскиинтервал(годину, квартал или месец) и тада је реч о интервалиним временским серијама.Из овога закључујемо да временске серије можемо поделити на:

1. Моментне- показују стање у једном временском тренутку када је извршенопосматрање попут стања залиха готових производа и недовршене производње на дан31.12., стање готовине у благајни на крају радног дана, број становника закључно саданом 31.03. итд...

2. Интервалене- обим производње по годинама или месецима, квартални подаци опродаји производа...

97. Декомпозиција временских серија? 

Сама реч декомпозисија употребљава се у два основна значења:

1.Разлагање посматране компоненте на њене саставне делове2.Могућност да се поједине компоненте елиминишу из серије података.

У статистици су формулисана три основна модела која на различите начине говоре о оначину делиовања ових компоненти а то су:

1.Мултипликативни 2.Адитивни 

- Скрипта за усмени део из основа статистичке анализе-71

Временске серије представљају низове нумеричких података о појави који су сложенихронолошким редоследом у правилним временским периодима.

Page 72: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 72/83

Статистика

3. Комбиновани 

1.Уколико су подаци из временске серије дати на годишњем нивоу, онда се помултипликованом моделу серија може представити као производ наведених компонентитј.

 Y=T×C×R

Док уколико су подаци из серије дати на нивоу краћем од једне године(месечном иликварталаном), онда они укључују и сезонску компоненту па ће мултипликовни моделгласити:

 Y=T×C×R×S

2.Према адитивном моделу варијације појаве представљају збир наведевихкомпоненти, па ако су дати на годишњем нивоу, биће записани у облику:

 Y=T+C+R

А на нивоу краћем од једне године:

 Y=T+C+R+S3.По комбиниваном или хибридном моделу подаци на годишњем нивоу могу се

записати у облику једначине на различите начине али један од могућих начина био би заподатке на годишњем нивоу:

 Y=T+C×Rа за податке на нивоу краћем од једне године, он би гласио:

 Y=T+C×R+S(битно је да између компоненти имате знакове + ; ×).

У статистици се највише користи први модел, па ћемо се само на њему и задржати.Користећи мултипликативни модел, на основу података о појави (Y), могуће је утврдитидејство непознатих компоненти времнске серије. Уколико се оригиналан податак о појави(Y), подели трендом Т и сезонском компонентом S, добиће се релативан значај (утицај)цикличне С и резидуалне компоненте R, што би мопгли представити на следећи начин:

ST

RCST

ST

Y

×

×××=

×= C×R

У горњем изразу кажемо да смо елиминисали ( одстранили ) деловање трнда и цикуса извременске серије, или што је идентично издвојили( изоловали ) дејство цикличне и резидуалне компоненте.

оно што је у имениоцу је елиминисано, а оно што остане је изоловано.

98. Покретни просеци – значење и употреба? 

Метод покретних просекаима троструку функцију у статистици:

- Скрипта за усмени део из основа статистичке анализе- 72

1. да омогући истицање основног тока појаве, одстрањујући текућа колебања из серије2. као метод за прогнозу будућих вредности временске серије

3. користи се при конструкцији сезонских индекса

Page 73: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 73/83

Статистика

Разликујемо два начина израчунавања покретних просека у зависности од тога да лиимамо непаран или паран број чланова.

На основу серије података о промету једног производа у периоду од 1971-1990 израчунајтетрогодишње и петогодишње покретне просеке.

година оригинални

подациY

трогодишњипокретнизбирови

трогодишњипокретни просеци

петогодишњи покретни

збирови

петогодишњи покретни

просеци

1971. 10 / / /

1972. 20 60 (10+20+30)/3=20 / /

1973 30 70 23,3 90 18

1974. 20 60 20 100 20

1975. 10 50 16,7 110 22

1976. 20 60 20 120 24

1977. 30 90 30 130 26

1978. 40 100 33,3 140 28

1979. 30 90 30 150 30

1980. 20 80 26,7 160 32

1981. 30 90 30 170 34

1982. 40 120 40 180 36

1983. 50 130 43,3 190 38

1984. 40 120 40 200 40

1985. 30 110 36,7 210 42

1986. 40 120 40 220 44

1987. 50 150 50 230 46

1988. 60 160 53,3 240 48

1989. 50 150 50 / /

1990. 40 / / /

1. Ако подаци посматране серије временске серије показују стабилне периодочнефлуктуације, онда покретни просеци у потпуности елиминишу цикличан варијабилитет( скретање појаве од утврђеног тренда навише или наниже), што је случај са петогодишњимпросецима, где се примећује савршен тренд.

У случају да се покретни просеци не поклапају са дужином циклуса, онда ће као упримеру са трогодишњим просецима бити откривене и цикличне варијације.

2. Ако серија са стабилним периодичним флуктуацијама показује и стабиланпериодичан раст или пад, онда покретни просеци откривају тренд, као што је у нашем

случају ( нарочито код петогодишњих просека ).

- Скрипта за усмени део из основа статистичке анализе-73

Покретни просеци представљају такву трансформацију случајне променљиве укојој се сваки податак замењује аритметичком средином тог податка која се добија

сабирањем конкретног податка одређеног броја претходних и исто толико

наредних података.

Page 74: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 74/83

Статистика

Ове особине препоручују метод покретних просека за одређивање тренда али само услучајевима када када серије испољавају цикличне варијације са једнакимамплитудама што је у пракси редак случај. Осим тога метод покретних просека има великинедостатак јер се не моггу израчунати за почетне и крајње временске интервале ( у нашемслучају код трогодишњих просека то су први и последњи код трогодишњих покретнихпросека, а прва два и последња два код петогодишњих).

Колико чланова узети при израчунавању покретних просека не постоји егзактанодговор, што је недостатак овог метода. У пракси се обично покушава узимање вишеразличитх комбинација са различитим величинама покретних просека ( на пример на истојсерији података покушава се најпре са мањим бројем чланова, на пример трогодишњим,четворогодишњим, петогодишњим...све док се не дође до задовољавајуће апроксимације),водећи рачуна о томе да ће:

99. Експоненцијална и геометријска стопа раста? 

Експоненцијална стопа раста добија се када се од коефицијента b1 израчунатог пообрасцима за експоненцијални тренд одузме 1 и помножи са 100. Обележава се са r e ипоказује нам за колико се у просеку појава смањивала или повећавала у посматраном

периоду.

Просечна стопа раста представља стипу по којој се појава у просеку годишњеповећавала или смањивала. Може се израчинати преко оригиналних или ланчаних индекса.

Недостатк јој је у томе што она упросечије раст појаве у свим годинама, без обзирадали је појава у посматраном периоду расла или опадала. Може бити и позитивна инегативна, па њену негативну вредност тумачимо као просечно смањење.

Уколико је например стопа раста износила 5,26% у периоду од 2000 – 2007 тимаћимода је у периоду од 2000 – 2007 појава у просеку годишње расла по стопи од 5,26%.

Уколико је например стопа раста износила - 5,26% у периоду од 2000 – 2007тимаћимо да је у периоду од 2000 – 2007 појава у просеку годишње опадала по стопи од5,26%.

100. Избор функције тренда? 

Као прва етапа у испитивању развојне тенденције неке појаве потребно је испитати да ли тренд уопште постоји.

Постоји више начина да се испита постојање тренда, од којих су најчешће коришћени:

 Да се серија прикаже графички на временском дијаграму – ово је најједноставнијиначин, и неопходно је поседовати већи број података да би уочили постојање тренда.

 Други начин јесте применити поступак тестирања хипотеза о непостојању тренда,односно претпоставке о томе да су варијације временске серије само случајне. Уколико сетаква нулта хипотеза одбаци, онда се усваја алтернативна хипотеза да је трендкомпоненета карактеристична за посматрану серију података. Уколико серија не показујетренд, кажемо за такву серију да је стационарна.

У

 другој етапи бира се функција тренда која највише одговара посматраној временској

- Скрипта за усмени део из основа статистичке анализе- 74

r e= (b1 – 1) 100

За временску серију кажемо да је стационарна ако не показује никаквутенденцију у своме развоју односно ако не постоји тренд.

Page 75: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 75/83

Статистика

серији, тј. дати одговор на питање да ли користити линеарни, параболични1 илиекспоненцијални тренд.

У зависности од тога да ли бирамо најбоље прилагођени тренд пре или наконоцењивања параметра, можемо користити две групе индикатора за избор функције тренда.

Ако одређујемо оптималну ( најбоље прилагођену ) функцију тренда пре оцењивањафункције тренда на располагању су нам следећи методи:

1. Графички метод представља најједноставнији индикатор. Серија података сеприкаже грагички на временском дијаграму ( аритметичком, полулогоритамском)2 и наоснову тога истраживач сам бира функцију тренда. Овакав начин избора функције трнда недаје задовољавајуће резултате у пракси, јер је доста субјективан.

2. Метод диференције ( разлике) се заснива на израчунавању разлика узастопнихчланова серије и на основу њега бирамо одговарајућу функцију тренда руководећи се

следћеим правилима.

Линеарни тренд највише одговара подацима из серије ако су вредности првихразлика узастопних чланова приближно исте. Његова функција иста је као и код простелинеарне регресије и гласи:

За податке у скупу

За податке у узорку

Параболични тренд бирамо уколико су апсолутне вредности других разлика( разлике првих разлика) приближно једнаке, а његова функција има следећи облик:

За податке у скупу

За податке у узорку

Експоненцијални тренд по методу разлика бира се ако су разликелогоритамских вредности узастопних података временске серије приближно једнаке.Његов математички облик је следећи:

За податке у скупу

1 Параболични тренд се не користи на испиту2 О графичком приказивању временских серија погледајте излагања са почетка.

- Скрипта за усмени део из основа статистичке анализе-75

1. Графички метод2. Метод диференције

3. Метод изравнања (покретних просека)

Yt = 0 + 1x

xbbtY +ˆ

Yt = 0 + 1x + 2x2

2xbxbbtY +ˆ

Yt = ×  x

x׈

Page 76: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 76/83

Статистика

За податке у узорку

3. Идеја метода изравнања је у томе да се из серије одстране случајна колебања инесистематски утицаји. Након њиховог елиминисања серија ће бити изравната ипоказиваће дали има одређену развојну тенденцију. Да ли тенденција постоји и каквог јеоблика, може се одредити када се изравнате податке прикажемо графички на временскомдијаграму.

У трећој етапи оцењујемо параметре изабраног модела тренда, а у четвртојетапи вршимо прогнозирање тако што ћемо екстраполисати линију тренда у будућност.Код месечних и кварталних ( тромесечних ) серија, ако је сезонски утицај израженпрогнозирана вредност тренда мора да се коригује узимајући у обзир утицај сезоне.

Како су методи графичког приказивања већ објашњени у почетним излагањима, ана њих ћемо се опет вратити у склопу решавања задатка из области временских серија,сада је потребно објаснити метод диференција и метод изравнања где ћемо методдиференција објасното на конкретном примеру, а метод изравнања и на примеру и уз

теоријски део који вам је неопходан за усмени део испита.

Сумирајмо још једном правила метода диференцирања, чија нам примена олакшаваизбор функције тренда:

Подаци о продаји једног производа у периоду од 1982 до 1991дати су следећом табелом.

година 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991

базнииндекс

1983=100

156 189 234 300 330 390 465 537 624 744 840 1041

а) методом диференција одредите функцију тренда која највише одговара емпиријскимподацима, ако је ниво појаве у у 1980 години износио 56.

година продаја Y прве

разлике∆ 1

друге

разлике∆ 2

log Y ∆ log Y

- Скрипта за усмени део из основа статистичке анализе- 76

1. Линеарни тренд највише одговара подацима из серије ако су вредности првихразлика узастопних чланова приближно исте.

2. Параболични тренд бирамо уколико су апсолутне вредности других разлика( разлике првих разлика) приближно једнаке

3. Експоненцијални тренд по методу разлика бира се ако су разликелогоритамских вредности узастопних података временске серије приближно

ПРИМЕР БРОЈ 1. 

Page 77: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 77/83

Статистика

1980198119821983198419851986

19871988198919901991

156189234300330390465

5376247448401041

156-189=33234-159=45300-234=66330 – 300=30390 – 330=60465-390=75

537-465=72624 – 537=87744 – 624=120840 – 744=961041-840=201

12= 45-3321363015

3153324105

2,191322,276462,369222,477122,518512,591062,66745

2,729972,795182,871572,924283,01745

0,083340,092750,107900,041390,072550,07639

0,062520,065210,076390,052710,09317

Најмање разлике показују разлике логоритамске вредности, па је у овом случају најбољекористити експоненцијални тренд.

Метод изравнања временске серије

Метод изравнања поред графичког и метода диференције је један од метода да сеодабере функција трнда која највише одговара датим подацима. Ови методи имају улогу„филтера“, помоћу којих се из серје одстрањују текућа колебања, да би се затим„очишћена серија графички приказала и уочило евентуално постојање стабилности токомобухваћеног временског периода.

Важно је напоменути да методи иизравнања имају дојаку улогу код временскухсерија:

Најпознатији методи изравнања су :

Метод покретних просека

Метод покретних просекаима троструку функцију у статистици:

Разликујемо два начина израчунавања покретних просека у зависности од тога да лиимамо непаран или паран број чланова.

- Скрипта за усмени део из основа статистичке анализе-77

1. да се уочи евентуално постојање тренда2. ради прогнозе будуће вредности временске серије

1. метод покретних просека2. експоненцијално изравнање

1. да омогући истицање основног тока појаве, одстрањујући текућа колебања из серије2. као метод за прогнозу будућих вредности временске серије

3. користи се при конструкцији сезонских индекса

Покретни просеци представљају такву трансформацију случајне променљиве укојој се сваки податак замењује аритметичком средином тог податка која се добија

сабирањем конкретног податка одређеног броја претходних и исто толиконаредних података.

Page 78: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 78/83

Статистика

На основу серије података о промету једног производа у периоду од 1971-1990 израчунајтетрогодишње и петогодишње покретне просеке.

година оригинални

подациY

трогодишњипокретнизбирови

трогодишњипокретнипросеци

петогодишњипокретнизбирови

петогодишњипокретнипросеци

1971. 10 / / /

1972. 20 60 (10+20+30)/3=20

/ /

1973 30 70 23,3 90 18

1974. 20 60 20 100 20

1975. 10 50 16,7 110 22

1976. 20 60 20 120 24

1977. 30 90 30 130 26

1978. 40 100 33,3 140 28

1979. 30 90 30 150 30

1980. 20 80 26,7 160 321981. 30 90 30 170 34

1982. 40 120 40 180 36

1983. 50 130 43,3 190 38

1984. 40 120 40 200 40

1985. 30 110 36,7 210 42

1986. 40 120 40 220 44

1987. 50 150 50 230 46

1988. 60 160 53,3 240 48

1989. 50 150 50 / /1990. 40 / / /

1. Ако подаци посматране серије временске серије показују стабилне периодочнефлуктуације, онда покретни просеци у потпуности елиминишу цикличан варијабилитет( скретање појаве од утврђеног тренда навише или наниже), што је случај са петогодишњимпросецима, где се примећује савршен тренд.

У случају да се покретни просеци не поклапају са дужином циклуса, онда ће као упримеру са трогодишњим просецима бити откривене и цикличне варијације.

2. Ако серија са стабилним периодичним флуктуацијама показује и стабилан

периодичан раст или пад, онда покретни просеци откривају тренд, као што је у нашемслучају ( нарочито код петогодишњих просека ).

- Скрипта за усмени део из основа статистичке анализе- 78

Page 79: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 79/83

Статистика

Ове особине препоручују метод покретних просека за одређивање тренда али само услучајевима када када серије испољавају цикличне варијације са једнакимамплитудама што је у пракси редак случај. Осим тога метод покретних просека има великинедостатак јер се не моггу израчунати за почетне и крајње временске интервале ( у нашемслучају код трогодишњих просека то су први и последњи код трогодишњих покретнихпросека, а прва два и последња два код петогодишњих).

Колико чланова узети при израчунавању покретних просека не постоји егзактанодговор, што је недостатак овог метода. У пракси се обично покушава узимање вишеразличитх комбинација са различитим величинама покретних просека ( на пример на истојсерији података покушава се најпре са мањим бројем чланова, на пример трогодишњим,четворогодишњим, петогодишњим...све док се не дође до задовољавајуће апроксимације),водећи рачуна о томе да ће:

101. Линеарни и експоненцијални тренд? 

Ако нека серија из године у годину бележи приближно исти раст или пад уапсолутним износима онда се њено кретање најбоље може описати помоћу линеарногтренда. Модел линеарног тренда у скупу свих података има облик:

Где је ε стохастички члан чија је вредност у просеку једнака нули. Непознатевеличине

β 0 и β 1 представљају параметре линеарног трнда које можемо оценити једино помоћуузорка, па је оцењена вредност линеарног тренда:

Експоненцијални тренд – када појава из периода у период бележи приближно истираст или пад у апсолутним износима, онда њено кретање најбоље описује експоненцијални

тренд.Оцњивање параметра експоненцијалног тренда врши се на исти начин као и код линеарног,стим што се овде подаци најпре логоритмују, а затим се антилогоритмовањем долази довредности парметра експоненцијалног тренда.Као и код линеарног тренда оцена bO нема никав значај, док оцена b1 нам показује за колико је у просеку појава расла или опадала у посматраном периоду, у зависности дали је b1

позитивно ил негативно.

102. Сезонске варијације – мерење и интерпетација? 

- Скрипта за усмени део из основа статистичке анализе-79

Yt = 0 + 1t+ε

tbbtY 1o +ˆ

b1- средњи апсолутан раст, који нам показује за колико је појава у просеку годишњерасла или опадала у посматраном периоду. Његова вредост интерпретира се у

мерним јединицама у којима је исказан ниво појаве.bo- показује просечан ниво појаве у посматраном периоду,

b1- средњи апсолутан раст, који нам показује за колико је појава у просеку годишње раслаили опадала у посматраном периоду. Његова вредост интерпретира се у мерним

 јединицама у којима је исказан ниво појаве.

Page 80: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 80/83

Статистика

Код великог броја економских појава уочавају се периодичне флуктуације чије седејство испољава редовно током године. Годишњи подаци о појавама не исказују сезонскепромене, јер се оне одвијају у краћим временским интервалима од једне године. Збогтога се сезонске варијације могу уочити само код времнских серија код којих су јединицедате на краћим интервалима ( на пример месечним или кварталним).

Интезитетсезонскогутицаја наодређену

појаву не мора се поновити на исти начин и у нарендом периоду. Једном утврђене сезонскеваријације могу мењати своју периодичност, смер и интезитет под дејством неких другихфактора у наредносм периду. Због тога се може говорити о различитим типовима сезонскихваријацја, тј. на :

1. Стабилне сезонске варијације – Сезонске варијације које се током више годинане мењају систематски, односно чије се дејство испољава из године у годину на приближноисти начин. Оваква стабилност сезонских варијација је последица релативне стабилностиструктуре и начина деловања сезонских варијација.

2. Нестабилне сезонске варијације – Ове варијације показују нестабилнесистематске промене, односно повећавају се или смањују, при чему ниво посматране појавеније исти у свим периодима. За разлику од стабилног сезонског ритма овде није реч само опроменама у амплитуди, него и о промени облика, односно померању сезонског максимумаили минимума током времена.

Без обзира дали је реч о стабилним или нестабилним сезонским варијацијама, оне семере и зражавају сезонским индексима.

Просечна вредност појаве изражава се са 100, тако да сезонски индекс чија јевредност изнад 100 показују да посматрана појава расте под утицајем сезоне, а индекс чија је вредност испод 100 да посматрана појава под утицајем сезоне опада.

У

статистици је формулисано више метода помоћу којих се мере сезонске варијације. Упракси се међутим најчешће користи метод односа оригиналних података премапокретним просецима.

Идеја метода односа према покретним просецима је у следећем:1. Тренд и циклична компонента се не обухватају појединачно већ заједно, помоћу

одговарајућих месечних односно кварталних просека.2. Дељењем оригиналних података покретним просецима искључују се тренд и

циклична компонента, чиме у серији остаје још и агрегирана сезонска и нерегуларна

компонента.

- Скрипта за усмени део из основа статистичке анализе- 80

Сезонске варијацје представљају промене одређене времнске серије које се

понављају током више година у исто доба, у истом смеру и приближно истоминтезитету.

1. стабилне2. нестабилне

Сезонски индекси уопштавају интезитет сезонскогваријабилитета за дужи временски период.

Сезонски индекс је релативан број који показује просек сезонскогутицаја, односно јачину сезонског утицаја, у одређеном месецу или квартала.

Page 81: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 81/83

Статистика

3. Елиминисање нерегуларне компоненте конкретно постиже тиме што сеизрачунавају просечне вредности за S × R, за поједине квартале или месеце.

103. Десезонирање поступак и значај? 

Анализа сезонске компоненете у временској серији веома је значајна са станосвиштаквалитета прогнозе. Наиме, занемаривањем сезонске компоненете у анлизи временскесерије изоставили би важну карактеристику серије, а прогнозе би ибиле нереалне.Осим тога просуство сезонке компоненте замгљује оснвну развојну тенденцију појаве, пасамо њеним елиминисањем ( искључењем ) можемо сагледати основни ток, односнонесезоонске карактеристике серије. Зато се у пракси најчешће поред оригиналне серијеприказује и серија из које је елиминисан утицај сезонске компоненте. Овакав поступак називамо сезонско изравнање или десезонирање.

Код сезонских временских серија има смисла поредити ниво серије у једном кварталуили (месецу) само ако је серија десезонирана.

Када поредимо оригиналну серију , а не десезонирану времнеску серију, тада јединоможемопоредити њен ниво у одређеном кварталу ( месецу ) текуће године у односу наисти квартал претходне године. То наравно важи само под условом да је сезонски ритамстабилан, односно да је у истим кварталима посматраних година интезитет дејства сезонеприближно исти.

Постоје различити поступци десезонирања, од којих је најједноставнији онај који језаснован на мултипликованом моделу. Поступак се спроводи тако што кварталне илимесечне податке оригиналне временске серије деелимо сезонским индексом и множимо са100.

104. Методи прогнозирањ a временских серија? 

Један од најважнијих циљева анализе временских серија јесте прогнозирање будућегтока посматране серије са што мањом грешком прогнозе. Постоји више приступа упрогнозирању временских серија. Од значаја је изабрати адекватан метод прогнозе, јер оддобијених прогноза зависи и исправност одлука доносиоца пословне и економске политике.Постоје бројне методе прогнозирања временских серија које можемо класификовати у тригрупе и то:

 

- Скрипта за усмени део из основа статистичке анализе-81

CT

RSCTRS

××=

RSIs

×=

Десезонирање је поступак којим се из оргиналних податакавремнске серије одстрањује сезонски утицај. У

мултипликованом моделу ово се постиже делењеморигиналних података са одговарајућим сезонским

индексом и множењем са 100.

1. квантитативни2. квалитативни

3. комбиновани

Page 82: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 82/83

Статистика

1. Квалитатиивни методи користе се код оних временских серија када се подаци не могуквантификовати ( бројчано исказати ).2. Квантитативни методи се могу користити под условом да се:

а) располаже подацима о вредностима времнске серије у прошлостиб) информација о појави која се прогнозира може се квантификовати

в) може се усвојити претпоствака да ће појава у будућности приближно наставити да сепонаша као и у прошлости.

3. комбиновани методи су релативно новија дисциплина у прогнозирању временскихсерија, али им се предвиђа велика експанзија из простог разлога што квантитативни методичак и када су испуњени услови за њихово коришћење, представљају чисту „механичку“пројекцију прогнозе временске серије у будућности.

105. Екстраполација тренда? 

Најједноставнији квантитативни метод прогнозирањ временске серије је методпрогнозирања по методи прогнозирања, који још називамо и екстраполација тренда.

.

Дакле код серија које имају нагле и неочекиване заокрете ове методе не можемокористити.

10 6. Предвиђање ниво појаве помоћу тренда и сезонских индекса? 

Метод екстраполације тј. предвиђања нивоа појаве у будућности или прошлости,незнатно се разликује у зависности дали су подаци дати на годишњем или кварталном

нивоу ( или евентуално месечном ). Код месечних лили кварталних података, потребно је уобзир узети и утицај сезоне да да би се дошло до прецизније прогнозе. Ако у серији постојиизражена сезонска компонента (што испитујемо преко сезонских индекса), онда је потребноу обзир узети и утицај сезоне. Такав поступак можемо назвати коригованомекстраполацијом тренда. Ако у серији постоји изражена сезонска компонента овакав начиндаје далеко прецизнију прогнозу.

Коригована екстраполација тренда спроводи се у следећа четри корака:

1) Из серије се елиминише утицај сезоне делењем оригиналних података саодговарајућим сезонским индексом.

2) Одређујемо одговарајући тренд на бази десезонираних података3) Врши се екстраполација тренда у будућност

4) Коригује се екстраполисана тренд вредност узимајући у обзир утицај сезоне упрогнозираном периоду.

107. Проблеми и ограничења екстраполације тренда? 

- Скрипта за усмени део из основа статистичке анализе- 82

Екстраполација тренда подразумева продужавање оцењене функције тренда изванузорачког периода ( у прошли или будући период ). Прогнозу по овој методи

можемо користити само у непосредној будућности и то само у оним серијама којенемају нагле и неочекиване заокрете

100

индекссезонскићиодговарајувредносттрендсанаЕкстраполивреднсотсанаекстраполи

коригованаСезонски

×=

Page 83: stata - usmeni

8/3/2019 stata - usmeni

http://slidepdf.com/reader/full/stata-usmeni 83/83

Статистика

Да би се вршила екстраполација тренда, односно прогноза будућих вредности појавеу периоду који је претходио или у периоду који следи потребно је да оригиналне вредностизначајно не одступају од линије тренда.

Да би екстраполација тренда била релативно успешнапотребно је да буде испуњено вишеуслова:

1. Фактори који су деловали на кретање појаве у обухваћеном периоду, моморају и даље данаставе да делују у истом смеру и интезитету, и без уплива нових фактора.

2. Као и у регресионој анлизи дозвољена је само прогноза у непосредну будућност.3.Уколико су у питању пројекције економских појава прогноза која се врши у стабилним

условима је тачнија од прогнозе која се врши у нестабилним условима привређивања.4. Уз сва ограничења потребно је знати да екстраполација тренда представља само

упросечену слику у будућност као механичка пројекција.

Посебну пажњу обратите на све што је уоквирено, а такође обратите пажњу и на следећа питањакоја вам увек могу бити постављена као додатноо подпитање или код којих ће вам се можда тражитии да кажете нешто додатно у смисли повезивања грдива:

 Особине аритметичке средине

Централна гранична теорема – никако немојте рећи да узорци теже да формирају нормалан

распоред, већ њихове аритметичке средине.

Параметар скупа је константа, оцена параметра је случајна променљива; а оцењена вредност је

константа.

На укупан, објашњен и необјаљњен варијабилитет у регресионој анализи питање 69.

Шта нам показују оцене параметра b0;b1 у регресионој и анализи временских серија.

Екстраполација тренда представља продужење линије тренда изван интервалобухваћеног времнском серијом, било у прошлост било у будућност