MAE (Mean Absolute Error), MSE (Mean Squared Error), 그리고 RMSE (Root Mean Squared Error)는 모두 회귀 모델의 성능을 평가하는 데 사용되는 오차 측정 지표들입니다. 이들은 모델이 예측한 값과 실제 값 사이의 차이를 나타내며, 각기 다른 방식으로 오차를 계산하고 해석합니다.
1. MAE (Mean Absolute Error)
정의: MAE는 예측값과 실제값의 절대값 차이의 평균입니다. 즉, 예측값과 실제값 사이의 차이를 절대값으로 구하고, 그 평균을 계산합니다.
수식:
특징:
MAE는 오차의 크기를 그대로 반영하기 때문에, 모든 오차를 동일하게 취급합니다.
예측 오차가 얼마나 큰지 직관적으로 이해하기 쉬운 지표입니다.
장점: 극단적인 오차에 덜 민감하고, 이해하기 쉽습니다.
단점: 큰 오차에 대한 처리가 약하므로, 모델이 극단적인 오류를 낼 경우 이를 반영하기 어렵습니다.
2. MSE (Mean Squared Error)
정의: MSE는 예측값과 실제값의 차이 제곱의 평균입니다. 차이를 제곱하여 계산하므로, 큰 오차에 더 큰 페널티를 부여합니다.
수식:
특징:
MSE는 큰 오차에 더 민감하며, 제곱된 값이 커지므로 큰 오차가 모델 성능에 큰 영향을 미칩니다.
장점: 큰 오차에 더 많은 페널티를 부여하여 모델이 극단적인 오차를 줄이려는 방향으로 학습합니다.
단점: 이상치(outlier)나 극단적인 오차에 지나치게 민감할 수 있습니다.
3. RMSE (Root Mean Squared Error)
정의: RMSE는 MSE의 제곱근을 취한 값으로, MSE에서 발생하는 제곱의 영향을 줄여서 원래의 단위로 돌아가는 방식입니다. 이는 MSE의 크기를 보다 직관적으로 이해할 수 있게 도와줍니다.
수식:
특징:
RMSE는 MSE와 비슷하지만, 원래 데이터의 단위로 결과가 나타나기 때문에 해석이 더 용이합니다.
장점: MSE보다 직관적이고, 오차가 실제 데이터의 단위와 동일하므로 해석이 간편합니다.
단점: 여전히 큰 오차에 민감하며, 이상치에 영향을 받을 수 있습니다.
비교
지표
특징
장점
단점
MAE
오차의 절대값 평균
직관적이고 단순, 이상치에 덜 민감
큰 오차에 대한 처리가 약함
MSE
오차의 제곱 평균
큰 오차에 민감, 모델이 극단적인 오류를 줄이도록 유도
이상치에 매우 민감
RMSE
MSE의 제곱근, 원래 단위로 변환된 오차
직관적이고 해석이 쉬움, 원래 단위로 돌아감
여전히 큰 오차에 민감하며, 이상치에 영향받을 수 있음
어떤 지표를 선택할까?
MAE는 모든 오차를 동일하게 취급하고 싶을 때 유용합니다.
MSE는 큰 오차에 대한 처리가 중요할 때 사용하며, 모델이 이상치에 대해 민감하게 반응하도록 합니다.