Судалгааны программ хангамжийн хэрэглээ (STATISTICA 10.0...
Transcript of Судалгааны программ хангамжийн хэрэглээ (STATISTICA 10.0...
Судалгааны программ хангамжийн хэрэглээ (STATISTICA 10.0 жишээн дээр)
П. Цэрэндаваа
Агуулга
• STATISTICA 10.0 программын танилцуулга
• STATISTICA 10.0 өгөгдөл цуглуулах, боловсруулалт хийх
• Судалгааны мэдээлэл боловсруулахад STATISTICA 10.0 ашиглахнь: Жишээн дээр тайлбарлах
- Корреляци, регрессийн шинжилгээ
- ANOVA, Cluster анализ
- Box plot
- Scatter plot
• Дүгнэлт
Статистик 10 программ дажиллах заавар Спирмений корреляцийн шинжилгээ
Дата өгөгдлөө Excel 97-2003 Workbook гэсэн төрлөөр хадгалана.
Алхам 1. Статистик 10 программ дээрээ хадгалсан дата өгөгдөлөө нээх
Алхам 2. Дата өгөгдөлөө нээн оруулах
Excel- ийн хуудасыг зааж өгөх
Алхам 4. Дата өгөгдлөө нээхийн тулд ( import as text labels) цонхыг сонгоно.
Алхам 5. Statistics гэсэн цэсийг сонгож Nonparametric
цонхыг нээнэ.
Алхам 6. Nonparametric цэсны сонголтуудаас correlations
(Spearman, Kendal tau, gamma) гэсэн төрлийг сонгоно.
Алхам 7. Variables-руу орж
хувьсагчаа сонгоно.
Алхам 8. Корреляцийн коэффицент ба утга
гарч ирнэ.
Алхам 9. Корреляцийн график байгуулахдаа:
№1 Graphs цэсний common цонхны scatter
plot гэсэн төрлийг сонгоно.
Алхам 10. Хувьсагчууд, графикийн
төрөл, регрессийн бүлгийн сонголтуудыг
хийнэ. Үр дүн нь 2 хувьсагчийн
хоорондийн хамааралыг харуулна.
Эцсийн үр дүн хамаарлын шнжилгээний
график гарч ирнэ, х ба у тэнхлэгт харгалзах
хувьсагч тэдгээрийн нэр, нэгж, утга тайлбар
бичнэ.
Корреляцийн шинжилгээ
Korrelation des Körpergewichts
mit der Kopf-Rumpf-Länge bei
juvenilen Weibchen (rs = 0.43,
p<0.0001, n=111)
Bei adulten Weibchen
(rs = 0.55, p=0.05, n=13)
Korrelation des
Körpergewichts mit der
Kopf-Rumpf-Länge bei
juvenilen Männchen (rs =
0.36,
p<0.0001, n=92)
bei adulten Männchen (rs = 0.29,
p=0.25, n=15)
Корреляцийн шинжилгээ
Korrelation des Körpergewichts mit
der Schwanzlänge bei
S. caecutiens(rs = -0.46, p=0.49, n=232)
Korrelation der Schwanzlänge mit
der Kopf-Rumpf-Länge bei
S. caecutiens
(rs = 0.06, p=0.34, n=232)
Корреляцийн шинжилгээ
Регресийн шинжилгээ
Streudiagramm von relativem G und KR der
S. caecutensis mit Zuordnung zu separate Altersklassen
Регресс хийх дата өгөгдөлөө статистик программ дээр нээх
Graphs цэсний графикийн төрлүүддээс 2D scatter plot гэсэн төрлийг
сонгож авна. Ингээд 2D scatter plot цонх нээгдэнэ. Шараар тодруулсан
сонголтуудыг ашиглан графикаа бүтээнэ.
ANOVA шинжилгээ
Anova F(11.1) =10.4; p<0.0001
0
1
2
3
4
5
6
7
8
9
Aug.00
Aug.01
Aug.02
Aug.03
Aug.04
Aug.05
Aug.06
Aug.07
Aug.08
Aug.09
Aug.10
Aug.11
ge
fan
ge
n In
div
. p
ro T
ag
S. caecutensis: Durchschnittlicher Fangverlauf
Нэг хүчин зүйлийн ANOVA
Алхам 1. дата өгөгдлөө оруулаад идэвхжүүлнэ. Statistic цэсний base
цонхны ANOVA гэсэн сонголтыг хийхэд General ANOVA гэсэн анализ
хийх төрлүүд нээгдэнэ. Түүний one-way ANOVA гэсэн төрлийг сонгоно.
Алхам 2. Хувьсагчаа
сонгоно.
Алхам 2. Хувьсагчаа сонгоно.
Алхам 3. More result цэсийг сонгоно. Desc.
cell statistic гэсэн төрлийг сонгож авна.
Алхам 4. Гарсан үр дүнг excel програмруу хуулж авна.
Эцэст нь графикаа байгуулна.
Алхам 5.
График
байгуулахын
тулд insert
цэсний chart
цонхны
column
графикийн
төрлүүдээс
энгийн
графикийн
төрлийг
сонгон
ашиглана.
Алхам 6. Ингээд
графикийн layout
цэсийг сонгон
analysis цонхны
error bars гэсэн
төрөл рүү орно.
Түүний more error
bars options рүү
орно.
Алхам 7. Эдгээр сонголтуудыг хийгээд Specify
Value цэс лүү орж программаас хуулсан дата
өгөгдлийн стандарт ялгааг идэвхжүүлнэ. Ингээд
үүний үр дүнд хоорондын стандартын ялгааг
харуулсан байна. Үүний p-value –г мөн олдог.
Алхам 8. p-value –г олохын
тулд univariate results төрлийг
сонгоно.
Box plot графикийг STATISTICA 10.0 –дээр
байгуулахдаа дата өгөгдөлөө статистик
программ луу хуулаад энэ цэсрүү хандах
Үүний дараа Graphs цэсний Common цонхны Box төрлийг сонгон авч ашиглана.
Түүврийн дундаж ба стандарт
хазайлт
Geschlecht
Adulte
(n=29) Juvenile (n=204)t-values p
G (g)
Weibchen 6.70 ± 0.85 4.70 ± 0.49 9.0909 < 0.05
Männchen 7.33 ± 0.72 4.66 ± 0.50 15.7058 < 0.05
KR (mm)
Weibchen 73.07 ± 3.12 64.17 ± 1.85 10.2298 < 0.05
Männchen 71.90 ± 3.80 63.55 ± 1.97 8.6979 < 0.05
S (mm)
Weibchen 34.00 ± 1.52 34.32 ± 1.86 -0.7272 > 0.05
Männchen 32.78 ± 2.34 34.81 ± 5.59 -2.5061 > 0.05
HF (mm)
Weibchen 11.60 ± 0.45 11.31 ± 0.65 1.9333 > 0.05
Männchen 11.49 ± 0.88 11.28 ± 0.88 0.875 > 0.05
S. caecutensis: statistische Kennzahlen der Körpermaße (Mittel ± SD)
Cluster analysis – Кластер шинжилгээг судалгааны
дата өгөгдөл боловсоруулхад хэзээ, яаж хэрэглэх вэ?
А. Матриц байгуулан хийх
Б. Тоон өгөгдөлд тулгуурлан багцан
хийх
Tree Diagram for 13 Variables
Single Linkage
Euclidean distances
0 5000 10000 15000 20000
Linkage Distance
50-54
45-49
30-34
40-44
35-39
25-29
55-59
20-24
60-64
15-19
70+
65-69
Ajillagchdiin too
▪ Тоон мэдээлэл дээр таамаглал хийх шаардлагатай болдог. Энэ үед
статистик шинжилгээ хийж таамаглалаа гаргаж болно. Тэгвэл энэ
үйлдлийг Excel дээр хялбархан боловсруулах боломжтой. Түүхэн
мэдээний дундаж, дундажаас хазайх хазайлт зэргийг нь Excel
программ маань бодоод ирээдүйд байж болох таамаглалуудыг
гаргадаг, STATISTICA 10.0 программын орчинд таамаглалыг яаж
хийх вэ ?
Таамаглал хийх гурван арга :
A. Trendline оруулж тэгшитгэлээр үнэлэх;- Нэр томъёоны тайлбар;
B. Trend formula ашиглаж үнэлэх;
C. Forecast formula ашиглаж үнэлэх;
D. Statistica 10.0 програм дээр forecast хийх;
A. Trendline оруулж тэгшитгэлээр үнэлэх
Үе Борлуулалт
1 35
2 40
3 27
4 29
5 44
6 21
7 44
8 27
9 40
10 43
11 48
12 41
13 58
14 48
15 58
16
17
18
y = 1.6571x + 26.943
R² = 0.4625
0
10
20
30
40
50
60
70
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Борлуулалтын Trendline
1. Борлуулалтын датагаараа Line график байгуулна.
2. Үүсгэсэн график дээрээ Trendline оруулна.
3. Оруулсан Trendline дээрээ (Display Equation) үйлдлийг сонгож таамаглалын томьёог график дээр гаргаж ирнэ
• Ирээдүйн борлуулалтын утгыг олохдоо
бид заавал тэгшитгэлийг нь гаргахгүйгээр
TREND, FORECAST томъёог ашиглан
гаргаж болно. Үр дүн адилхан гарна.
• Excel дээр Trend, Forecast үйлдлүүдийг
комманд өгч гаргасан үр дүн нь шугаман
регрессийн томьёогоор бодож гаргаж
ирсэн утгатай ижил байх ба дараагийн
хуудсанд томьёоны задаргааг харуулья.
B. Trend formula ашиглаж үнэлэх
Нэр томъёоны тайлбар
𝛽0 - интерсепт буюу тогтмол утга
𝛽1- үл хамаарах хувьсагч нь хамаарах хувьсагчдаа яаж нөлөөлөх
𝑦𝑖- хамааран хувьсагч (борлуулалт)
𝑥𝑖- үл хамаарах хувьсагч (борлуулалтын үе)
ത𝑦 - борлуулалтын дундаж утга
ҧ𝑥 - борлуулалтын үеийн дундаж утга
𝑛 - түүвэр
C. Trend-ээр борлуулалтын таамаглалыг тооцоолохдоо дараах томъёог ашиглана.
𝑦 = 𝛽0 + 𝛽1𝑥, тооцоолвол: 𝑦 = 26.9 + 1.65𝑥
𝛽0 = ത𝑦 − 𝛽1 ҧ𝑥, дата өгөгдлөө орлуулвал
𝛽0 = 40.2 − 1.65 ∗ 8 = 26.9,
𝛽1 =σ(𝑥𝑖− ҧ𝑥)(𝑦𝑖− ത𝑦)
σ(𝑥𝑖− ҧ𝑥)2 , 𝛽1 =464
280= 1.65
Буюу дараагийн 16, 17, 18 үеүүдэд дараах тоо хэмжээгээр таамаглагдсан байна.
16 53.5
17 55.1
18 56.8
D. Forecast-аар борлуулалтын таамаглалыг тооцоолохдоо дараах томъёог ашиглана.
𝑦 = 𝑎 + 𝑏𝑥,
a=σ 𝑥𝑦−𝑛 ҧ𝑥 ത𝑦
σ 𝑥2−𝑛 ҧ𝑥2 , дата өгөгдлөө орлуулвал: a=5288+4824
1240+960= 1,65
𝑏 = ത𝑦 − ො𝑎 ҧ𝑥, 𝑏 = 40.2 − 1.65 ∗ 8 = 26.9,
Буюу дараагийн 16, 17, 18 үеүүдэд дараах тоо хэмжээгээр таамаглагдсан байна.
Хоёр томьёогоор бодсон дараагийн гурван үеийн утга ижил
гарсан болно.
16 53.5
17 55.1
18 56.8
Statistica 10.0 програм ашиглан борлуулалтыг таамаглах нь
Statistica 10.0 програм ашиглан борлуулалтыг таамаглах
1. Өгөгдөлөө дуудаж оруулна.2. Зөвхөн борлуулалтын тоо хэмжээтэй
баганыг идэвхижүүлнэ.3. Statistics цэслүү орж Advanced
Linear/Nonlinear Models цэсийг сонгоно.4. Time series/Forecas сонгоно5. Exponential smoothing аргыг сонгон, Linear
trend буюу Holt-г сонгоно.
Line Plot of Борлуулалт
forecast data 2v*18c
Борлуулалт = 26.9429+1.6571*x
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1615
20
25
30
35
40
45
50
55
60
Борлуул
алт
STATISTICA 10.0 программ ашиглан
борлуулалтыг таамагласан үр дүнд
график тэгшитгэл гарч ирнэ
Дүгнэлт
АНХААРАЛ ТАВЬСАНД БАЯРЛАЛАА
ТАНД АСУУХ АСУУЛТ БАЙНА УУ?
37