Xin chào mọi người, hôm nay tôi sẽ hướng dẫn bạn về hai chỉ số quan trọng trong hồi quy tuyến tính là MSE và RMSE. Hai chỉ số này có thể thay thế cho chỉ số R (R-squared) và đánh giá độ tin cậy của mô hình hồi quy tuyến tính. MSE càng gần 0 thì mô hình càng tin cậy, còn RMSE càng nhỏ thì mô hình càng chính xác. Điều này giúp chúng ta đánh giá độ tin cậy cao mà RMSE mang lại.
Bạn đang xem: MSE và RMSE là gì và cách tính trên STATA
Bây giờ chúng ta sẽ tìm hiểu cách tính toán và hiểu rõ về MSE và RMSE.
Trước khi tìm hiểu về RMSE, chúng ta phải biết MSE là gì. Khi chúng ta đã hiểu về MSE, chúng ta sẽ tìm hiểu thêm về RMSE.
-
MSE là gì (Mean Squared Error)?
Giải thích:
-
Theo wikipedia.
Trong thống kê, Mean Squared Error (MSE) là một chỉ số đo trung bình của sự sai lệch bình phương giữa các giá trị ước tính và các giá trị quan sát. MSE là một hàm mất mát, tương ứng với giá trị kỳ vọng của sự mất lỗi bình phương. MSE thường dương do tính ngẫu nhiên hoặc do sự không chính xác trong quá trình ước tính. MSE là chỉ số đơn giản chỉ đề cập đến giá trị trung bình của chênh lệch bình phương giữa giá trị dự đoán và giá trị quan sát.
MSE còn được gọi là giá trị sai số bình phương trung bình. Khi nói về sai số trung bình của một mô hình thống kê cụ thể, đây là một khái niệm khá phức tạp vì không thể xác định mức độ sai lệch do mô hình và mức độ sai lệch do ngẫu nhiên. MSE cung cấp một thống kê cho phép nhà nghiên cứu đưa ra tuyên bố như vậy. MSE đơn giản chỉ là giá trị trung bình của chênh lệch bình phương giữa tham số dự đoán và tham số quan sát được.
-
Công thức tính MSE
-
Với:
yi là biến độc lập
yb là giá trị ước lượng
Bây giờ chúng ta hãy tính MSE trên STATA sử dụng tập dữ liệu từ bài trước hoặc có thể làm theo hình dưới đây. Bạn có thể tham khảo bài trước tại đây
use https://solieu.vip/data/quyetdinh.dta
Sau đó, thực hiện các bước sau.
Bước 1: Áp dụng hồi quy bình thường (reg…..)
Xem thêm : Toang là gì? toang rồi bu em ạ nghĩa là gì?
Bước 2: Ước lượng giá trị của biến (predict yhat,xb)
Bước 3: Đặt tên biến và gán giá trị (gen mse = (Y-yhat)^2)
Bước 4: Tính giá trị trung bình của mse (sum mse)
Trong lệnh “sum”, chúng ta tính được giá trị trung bình của mse=0.993834
-
Khái niệm RMSE và cách tính toán (Root Mean Squared Error)
Theo những gì chúng ta biết, R-squared được coi là một đơn vị đo chuẩn của một mô hình tuyến tính. Nó là một thước đo quen thuộc nhắc tới mô hình, vì nó cho chúng ta biết mức độ chính xác của mô hình. Tuy nhiên, R-squared không luôn đảm bảo độ tin cậy cao. Trong những trường hợp như vậy, chúng ta có thể sử dụng R-MSE.
-
R-MSE là gì?
Giải thích chung:
Theo wikipedia.
Root Mean Squared Deviation (RMSD) hoặc Root Mean Squared Error (RMSE) là một phép đo thường được sử dụng để đánh giá sự khác biệt giữa các giá trị dự đoán (mẫu hoặc dân số) và giá trị quan sát. RMSD đại diện cho căn bậc hai của sự khác biệt giữa giá trị dự đoán và giá trị quan sát hoặc giá trị trung bình bình phương của sự khác biệt này. RMSD được gọi là phần mục tiêu khi tính toán trên mẫu dữ liệu được sử dụng để ước tính và được gọi là sai số (hoặc sai số dự đoán) khi tính toán bên ngoài mẫu. RMSD dùng để tổng hợp cường độ của sai số trong dự đoán trong nhiều thời điểm khác nhau thành một thước đo duy nhất về sức mạnh dự đoán. RMSD là một phép đo độ chính xác để so sánh sai lệch dự đoán của các mô hình khác nhau trên cùng một tập dữ liệu cụ thể.
Root Mean Squared Error (RMSE) là độ lệch chuẩn của phần dư (lỗi dự đoán). Phần dư là khoảng cách từ các điểm dữ liệu đến đường hồi quy; RMSE cho biết độ phân tán của các phần dư này. Nói cách khác, nó cho biết mức độ tập trung của dữ liệu xung quanh đường hồi quy tốt nhất. RMSE thường được sử dụng để đánh giá các mô hình trong khí hậu học, dự báo và phân tích hồi quy.
Root Mean Squared Error (RMSE) là một thước đo hiệu quả của mô hình. Nó đo sự khác biệt giữa các giá trị dự đoán và giá trị thực tế. RMSE càng nhỏ, mô hình càng chính xác và tin cậy.
-
Công thức tính R-MSE
-
Với:
y^i là giá trị dự đoán
yi là biến độc lập
Xem thêm : In terms of là gì? Ý nghĩa & cách dùng trong bài Writing
n=(N – k – 1)
N : số lượng quan sát tổng cộng
K : số lượng biến
Bây giờ chúng ta hãy tính toán RMSE trên STATA.
Bước 1: Chia MSE cho số lượng quan sát (a)
Bước 2: Tính trung bình của (a) (b)
Bước 3: Lấy căn bậc hai của (b)
Bước 4: Xem kết quả
So sánh RMSE tính toán được với kết quả của hồi quy OLS để kiểm tra tính chính xác. Nếu chênh lệch không quá lớn, RMSE của chúng ta là chính xác.
Ở đây, chúng ta thấy RMSE của OLS gần giống với RMSE tính toán. Điều này cho thấy chúng ta đã tính toán đúng RMSE. Phương pháp tính toán này có thể hữu ích trong quá trình nghiên cứu và học tập.
Vậy là chúng ta đã tìm hiểu về cách tính hai chỉ số mà chúng ta đã đề cập ở trên. Xin cảm ơn đã đọc bài viết của tôi. Hẹn gặp lại bạn trong những bài viết tiếp theo. Chúc thành công và gặp nhiều may mắn.
Trân trọng
Nguồn: https://stamboom-boden.com
Danh mục: Là Gì