Loading...
SPSS x Data Analysis
by Kumamon + Uncle G
Regression Diagnostics
Data Cleansing
ทำเพื่อลบ Outlier + Influence Data + Leverage
Outlier = ค่าที่เดา
(จากการวาดเส้น)
กับค่าแท้จริง ก่อเกิดเป็น Residual เยอะมากผิดปกติ
Leverage = ค่าที่เกาะเส้น แต่ไปอยู่ไกลค่าอื่นๆ
Influence = ทั้ง Outlier + Leverage รวมกัน
Outlier Detection
Analy
z
e → Regression → Linear → ปุ่ม Save → กดตามนี้ :
Distance
Leverage Values
Cook’s
Mahalanobis
Residuals
Unstandardized
Influence Statistics
Standardized
D
F
Fit
(optional) DFFIT
Cook’s Distance
(วัด
Influence)
ยิ่งเข้าใกล้ 1 ยิ่งดี
Ma
halanobi
s Distance
(วัด
Leverage → อธิบาย Outlier)
วัดค่าระหว่าง ค่าจริงกับค่าที่ predict ออกมา ว่าห่างกันกี่ SD
สำหรับ Multiple Regression
คำนวณโดยการใช้
`SIG.CHISQ(
calculated MAH, Degree of freedom)` เพื่อหาความ Significant
ค่าไม่เกิน Chi Square ที่ df = จำนวนตัวแปร Predictor
(ไม่ต้องไปลบ
1) และจะ significant ที่ P < 0.001
หาก significant = ค่าผิดปกติแล้ว
Leverage Value / Center Leverage Value / Average Leverage
(วัด
Leverage → อธิบาย Outlier)
ไม่มากกว่า 2 หรือ 3 เท่าของ
(k+1/n)
(แล้วแต่ว่าอยากใช้
2 หรือ 3 แต่ส่วนใหญ่ใช้ 2 กัน)
โดยที่
n = จำนวน Sample ทั้งหมด
k = จำนวน Independent Variable ที่เกี่ยวข้อง
Unstandardized Residuals
Standard Deviation
(วัด
Outlier)
Analy
s
e
→
Descriptive Statistics
→
Descriptive
→
เลือกตัวแปรแล้วติ๊ก Save standardi
s
ed values as variables
→
กด Ok
Please turn on JavaScript to use Paper in all of its awesomeness. ^_^
Data Cleansing
Outlier Detection