비누 중량에 대한 비누 거품 높이의 관계식을 구하고자 한다
비누 데이터에 대해
(a) (X,Y) 산점도를 그리시오
> x=c(3.5,4.0,4.5,5.0,5.5,6.0,6.5,7.0,7.5,8.0)
> y=c(24.4,32.1,37.1,40.4,43.3,51.4,61.9,66.1,77.2,79.2)
> plot(x,y,pch = 19, col = "blue")
(b) 통계적 모형 Y= β1X+ ε 를 적합하시오
> soap.lm=lm(y~x)
> summary(soap.lm)
Call:
lm(formula = y ~ x)
Residuals:
Min 1Q Median 3Q Max
-4.899 -1.374 0.490 1.322 4.116
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -20.2339 3.6995 -5.469 0.000595 ***
x 12.4424 0.6242 19.933 4.18e-08 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.835 on 8 degrees of freedom
Multiple R-squared: 0.9803, Adjusted R-squared: 0.9778
F-statistic: 397.3 on 1 and 8 DF, p-value: 4.183e-08
(c) 결정계수를 구하고 해석하시오
> tb1=abs(summary(soap.lm)$coefficients[2, "t value"])
> df = summary(soap.lm)$df[2]
> ptb1=2 * pt(tb1, df, lower.tail = FALSE)
> ptb1
[1] 4.183058e-08
(d) 결정계수를 구하고 해석하시오
> r_squared = summary(soap.lm)$r.squared
> r_squared
[1] 0.9802624
(e) (b)번의 모형을 이용하여 각 X에 대응되는 ^Y를 구하시오
> y_hat = fitted(soap.lm)
> y_hat
1 2 3 4 5 6 7 8
23.31455 29.53576 35.75697 41.97818 48.19939 54.42061 60.64182 66.86303
9 10
73.08424 79.30545
fitted(soap.lm): 예측값 ^Y 구하기
(f) 각 Y에 대응하는 잔차를 구하시오
> residuals(soap.lm)
1 2 3 4 5 6
1.0854545 2.5642424 1.3430303 -1.5781818 -4.8993939 -3.0206061
7 8 9 10
1.2581818 -0.7630303 4.1157576 -0.1054545
> residuals = y - y_hat
> residuals
1 2 3 4 5 6
1.0854545 2.5642424 1.3430303 -1.5781818 -4.8993939 -3.0206061
7 8 9 10
1.2581818 -0.7630303 4.1157576 -0.1054545
residuals(soap.lm): 잔차 계산
residuals = y - y_hat : 수동으로 잔차계산
(g) (^Y, e) 잔차그림을 그리고 독립성과 등분산성에 대해 설명하시오
> plot(y_hat, residuals,pch = 19, col = "blue")
> abline(h = 0, col = "red", lwd = 2)
(h) 잔차가 정규분포를 따른다고 할수 있는지 Q-Q그림을 그리고 설명하시오
> qqnorm(residuals, pch = 19, col = "blue")
> qqline(residuals, col = "red", lwd = 2)
(i) X=5.3에서의 ^Y를 구하시오
> new_data = data.frame(x = 5.3)
> predicted_y = predict(soap.lm, newdata = new_data)
> predicted_y
1
45.71091