Судалгааны программ хангамжийн хэрэглээ (STATISTICA 10.0...

Post on 21-Aug-2020

48 views 0 download

Transcript of Судалгааны программ хангамжийн хэрэглээ (STATISTICA 10.0...

Судалгааны программ хангамжийн хэрэглээ (STATISTICA 10.0 жишээн дээр)

П. Цэрэндаваа

Агуулга

• STATISTICA 10.0 программын танилцуулга

• STATISTICA 10.0 өгөгдөл цуглуулах, боловсруулалт хийх

• Судалгааны мэдээлэл боловсруулахад STATISTICA 10.0 ашиглахнь: Жишээн дээр тайлбарлах

- Корреляци, регрессийн шинжилгээ

- ANOVA, Cluster анализ

- Box plot

- Scatter plot

• Дүгнэлт

Статистик 10 программ дажиллах заавар Спирмений корреляцийн шинжилгээ

Дата өгөгдлөө Excel 97-2003 Workbook гэсэн төрлөөр хадгалана.

Алхам 2. Дата өгөгдөлөө нээн оруулах

Excel- ийн хуудасыг зааж өгөх

Алхам 4. Дата өгөгдлөө нээхийн тулд ( import as text labels) цонхыг сонгоно.

Алхам 5. Statistics гэсэн цэсийг сонгож Nonparametric

цонхыг нээнэ.

Алхам 6. Nonparametric цэсны сонголтуудаас correlations

(Spearman, Kendal tau, gamma) гэсэн төрлийг сонгоно.

Алхам 7. Variables-руу орж

хувьсагчаа сонгоно.

Алхам 8. Корреляцийн коэффицент ба утга

гарч ирнэ.

Алхам 9. Корреляцийн график байгуулахдаа:

№1 Graphs цэсний common цонхны scatter

plot гэсэн төрлийг сонгоно.

Алхам 10. Хувьсагчууд, графикийн

төрөл, регрессийн бүлгийн сонголтуудыг

хийнэ. Үр дүн нь 2 хувьсагчийн

хоорондийн хамааралыг харуулна.

Эцсийн үр дүн хамаарлын шнжилгээний

график гарч ирнэ, х ба у тэнхлэгт харгалзах

хувьсагч тэдгээрийн нэр, нэгж, утга тайлбар

бичнэ.

Корреляцийн шинжилгээ

Korrelation des Körpergewichts

mit der Kopf-Rumpf-Länge bei

juvenilen Weibchen (rs = 0.43,

p<0.0001, n=111)

Bei adulten Weibchen

(rs = 0.55, p=0.05, n=13)

Korrelation des

Körpergewichts mit der

Kopf-Rumpf-Länge bei

juvenilen Männchen (rs =

0.36,

p<0.0001, n=92)

bei adulten Männchen (rs = 0.29,

p=0.25, n=15)

Корреляцийн шинжилгээ

Korrelation des Körpergewichts mit

der Schwanzlänge bei

S. caecutiens(rs = -0.46, p=0.49, n=232)

Korrelation der Schwanzlänge mit

der Kopf-Rumpf-Länge bei

S. caecutiens

(rs = 0.06, p=0.34, n=232)

Корреляцийн шинжилгээ

Регресийн шинжилгээ

Streudiagramm von relativem G und KR der

S. caecutensis mit Zuordnung zu separate Altersklassen

Регресс хийх дата өгөгдөлөө статистик программ дээр нээх

Graphs цэсний графикийн төрлүүддээс 2D scatter plot гэсэн төрлийг

сонгож авна. Ингээд 2D scatter plot цонх нээгдэнэ. Шараар тодруулсан

сонголтуудыг ашиглан графикаа бүтээнэ.

ANOVA шинжилгээ

Anova F(11.1) =10.4; p<0.0001

0

1

2

3

4

5

6

7

8

9

Aug.00

Aug.01

Aug.02

Aug.03

Aug.04

Aug.05

Aug.06

Aug.07

Aug.08

Aug.09

Aug.10

Aug.11

ge

fan

ge

n In

div

. p

ro T

ag

S. caecutensis: Durchschnittlicher Fangverlauf

Нэг хүчин зүйлийн ANOVA

Алхам 1. дата өгөгдлөө оруулаад идэвхжүүлнэ. Statistic цэсний base

цонхны ANOVA гэсэн сонголтыг хийхэд General ANOVA гэсэн анализ

хийх төрлүүд нээгдэнэ. Түүний one-way ANOVA гэсэн төрлийг сонгоно.

Алхам 2. Хувьсагчаа

сонгоно.

Алхам 2. Хувьсагчаа сонгоно.

Алхам 3. More result цэсийг сонгоно. Desc.

cell statistic гэсэн төрлийг сонгож авна.

Алхам 4. Гарсан үр дүнг excel програмруу хуулж авна.

Эцэст нь графикаа байгуулна.

Алхам 5.

График

байгуулахын

тулд insert

цэсний chart

цонхны

column

графикийн

төрлүүдээс

энгийн

графикийн

төрлийг

сонгон

ашиглана.

Алхам 6. Ингээд

графикийн layout

цэсийг сонгон

analysis цонхны

error bars гэсэн

төрөл рүү орно.

Түүний more error

bars options рүү

орно.

Алхам 7. Эдгээр сонголтуудыг хийгээд Specify

Value цэс лүү орж программаас хуулсан дата

өгөгдлийн стандарт ялгааг идэвхжүүлнэ. Ингээд

үүний үр дүнд хоорондын стандартын ялгааг

харуулсан байна. Үүний p-value –г мөн олдог.

Алхам 8. p-value –г олохын

тулд univariate results төрлийг

сонгоно.

Box plot графикийг STATISTICA 10.0 –дээр

байгуулахдаа дата өгөгдөлөө статистик

программ луу хуулаад энэ цэсрүү хандах

Үүний дараа Graphs цэсний Common цонхны Box төрлийг сонгон авч ашиглана.

Түүврийн дундаж ба стандарт

хазайлт

Geschlecht

Adulte

(n=29) Juvenile (n=204)t-values p

G (g)

Weibchen 6.70 ± 0.85 4.70 ± 0.49 9.0909 < 0.05

Männchen 7.33 ± 0.72 4.66 ± 0.50 15.7058 < 0.05

KR (mm)

Weibchen 73.07 ± 3.12 64.17 ± 1.85 10.2298 < 0.05

Männchen 71.90 ± 3.80 63.55 ± 1.97 8.6979 < 0.05

S (mm)

Weibchen 34.00 ± 1.52 34.32 ± 1.86 -0.7272 > 0.05

Männchen 32.78 ± 2.34 34.81 ± 5.59 -2.5061 > 0.05

HF (mm)

Weibchen 11.60 ± 0.45 11.31 ± 0.65 1.9333 > 0.05

Männchen 11.49 ± 0.88 11.28 ± 0.88 0.875 > 0.05

S. caecutensis: statistische Kennzahlen der Körpermaße (Mittel ± SD)

Cluster analysis – Кластер шинжилгээг судалгааны

дата өгөгдөл боловсоруулхад хэзээ, яаж хэрэглэх вэ?

А. Матриц байгуулан хийх

Б. Тоон өгөгдөлд тулгуурлан багцан

хийх

Tree Diagram for 13 Variables

Single Linkage

Euclidean distances

0 5000 10000 15000 20000

Linkage Distance

50-54

45-49

30-34

40-44

35-39

25-29

55-59

20-24

60-64

15-19

70+

65-69

Ajillagchdiin too

▪ Тоон мэдээлэл дээр таамаглал хийх шаардлагатай болдог. Энэ үед

статистик шинжилгээ хийж таамаглалаа гаргаж болно. Тэгвэл энэ

үйлдлийг Excel дээр хялбархан боловсруулах боломжтой. Түүхэн

мэдээний дундаж, дундажаас хазайх хазайлт зэргийг нь Excel

программ маань бодоод ирээдүйд байж болох таамаглалуудыг

гаргадаг, STATISTICA 10.0 программын орчинд таамаглалыг яаж

хийх вэ ?

Таамаглал хийх гурван арга :

A. Trendline оруулж тэгшитгэлээр үнэлэх;- Нэр томъёоны тайлбар;

B. Trend formula ашиглаж үнэлэх;

C. Forecast formula ашиглаж үнэлэх;

D. Statistica 10.0 програм дээр forecast хийх;

A. Trendline оруулж тэгшитгэлээр үнэлэх

Үе Борлуулалт

1 35

2 40

3 27

4 29

5 44

6 21

7 44

8 27

9 40

10 43

11 48

12 41

13 58

14 48

15 58

16

17

18

y = 1.6571x + 26.943

R² = 0.4625

0

10

20

30

40

50

60

70

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Борлуулалтын Trendline

1. Борлуулалтын датагаараа Line график байгуулна.

2. Үүсгэсэн график дээрээ Trendline оруулна.

3. Оруулсан Trendline дээрээ (Display Equation) үйлдлийг сонгож таамаглалын томьёог график дээр гаргаж ирнэ

• Ирээдүйн борлуулалтын утгыг олохдоо

бид заавал тэгшитгэлийг нь гаргахгүйгээр

TREND, FORECAST томъёог ашиглан

гаргаж болно. Үр дүн адилхан гарна.

• Excel дээр Trend, Forecast үйлдлүүдийг

комманд өгч гаргасан үр дүн нь шугаман

регрессийн томьёогоор бодож гаргаж

ирсэн утгатай ижил байх ба дараагийн

хуудсанд томьёоны задаргааг харуулья.

B. Trend formula ашиглаж үнэлэх

Нэр томъёоны тайлбар

𝛽0 - интерсепт буюу тогтмол утга

𝛽1- үл хамаарах хувьсагч нь хамаарах хувьсагчдаа яаж нөлөөлөх

𝑦𝑖- хамааран хувьсагч (борлуулалт)

𝑥𝑖- үл хамаарах хувьсагч (борлуулалтын үе)

ത𝑦 - борлуулалтын дундаж утга

ҧ𝑥 - борлуулалтын үеийн дундаж утга

𝑛 - түүвэр

C. Trend-ээр борлуулалтын таамаглалыг тооцоолохдоо дараах томъёог ашиглана.

𝑦 = 𝛽0 + 𝛽1𝑥, тооцоолвол: 𝑦 = 26.9 + 1.65𝑥

𝛽0 = ത𝑦 − 𝛽1 ҧ𝑥, дата өгөгдлөө орлуулвал

𝛽0 = 40.2 − 1.65 ∗ 8 = 26.9,

𝛽1 =σ(𝑥𝑖− ҧ𝑥)(𝑦𝑖− ത𝑦)

σ(𝑥𝑖− ҧ𝑥)2 , 𝛽1 =464

280= 1.65

Буюу дараагийн 16, 17, 18 үеүүдэд дараах тоо хэмжээгээр таамаглагдсан байна.

16 53.5

17 55.1

18 56.8

D. Forecast-аар борлуулалтын таамаглалыг тооцоолохдоо дараах томъёог ашиглана.

𝑦 = 𝑎 + 𝑏𝑥,

a=σ 𝑥𝑦−𝑛 ҧ𝑥 ത𝑦

σ 𝑥2−𝑛 ҧ𝑥2 , дата өгөгдлөө орлуулвал: a=5288+4824

1240+960= 1,65

𝑏 = ത𝑦 − ො𝑎 ҧ𝑥, 𝑏 = 40.2 − 1.65 ∗ 8 = 26.9,

Буюу дараагийн 16, 17, 18 үеүүдэд дараах тоо хэмжээгээр таамаглагдсан байна.

Хоёр томьёогоор бодсон дараагийн гурван үеийн утга ижил

гарсан болно.

16 53.5

17 55.1

18 56.8

Statistica 10.0 програм ашиглан борлуулалтыг таамаглах нь

Statistica 10.0 програм ашиглан борлуулалтыг таамаглах

1. Өгөгдөлөө дуудаж оруулна.2. Зөвхөн борлуулалтын тоо хэмжээтэй

баганыг идэвхижүүлнэ.3. Statistics цэслүү орж Advanced

Linear/Nonlinear Models цэсийг сонгоно.4. Time series/Forecas сонгоно5. Exponential smoothing аргыг сонгон, Linear

trend буюу Holt-г сонгоно.

Line Plot of Борлуулалт

forecast data 2v*18c

Борлуулалт = 26.9429+1.6571*x

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1615

20

25

30

35

40

45

50

55

60

Борлуул

алт

STATISTICA 10.0 программ ашиглан

борлуулалтыг таамагласан үр дүнд

график тэгшитгэл гарч ирнэ

Дүгнэлт

АНХААРАЛ ТАВЬСАНД БАЯРЛАЛАА

ТАНД АСУУХ АСУУЛТ БАЙНА УУ?

37