Hàm hồi quy mẫu là khái niệm trung tâm trong phân tích hồi quy và kinh tế lượng, đóng vai trò cầu nối giữa dữ liệu quan sát thực tế và mối quan hệ lý thuyết của tổng thể. Trong thực tế nghiên cứu, chúng ta hầu như không bao giờ có dữ liệu của toàn bộ tổng thể mà chỉ làm việc với dữ liệu mẫu. Vì vậy, việc hiểu đúng bản chất hàm hồi quy mẫu là điều kiện bắt buộc để diễn giải chính xác kết quả hồi quy.
Bài viết này trình bày rõ ràng khái niệm hàm hồi quy mẫu, mối quan hệ giữa hàm hồi quy mẫu và hàm hồi quy tổng thể, cách xác định, ước lượng và diễn giải trong bối cảnh hồi quy tuyến tính.
Mục lục
Toggle1. Từ hàm hồi quy tổng thể đến hàm hồi quy mẫu
Trong lý thuyết kinh tế lượng, mối quan hệ giữa biến phụ thuộc Y và biến độc lập X trong tổng thể được mô tả bởi hàm hồi quy tổng thể (Population Regression Function – PRF):
E(Y | X = Xi) = β1 + β2Xi
Tuy nhiên, các tham số β1, β2 là tham số tổng thể và không thể quan sát trực tiếp. Do đó, khi chỉ có dữ liệu mẫu, chúng ta phải xây dựng hàm hồi quy mẫu để ước lượng mối quan hệ này.
2. Hàm hồi quy mẫu là gì?
Hàm hồi quy mẫu (Sample Regression Function – SRF) là hàm hồi quy được ước lượng từ dữ liệu mẫu nhằm xấp xỉ hàm hồi quy tổng thể chưa biết. Dạng tổng quát của hàm hồi quy mẫu trong hồi quy tuyến tính đơn là:
Ŷi = β̂1 + β̂2Xi
Trong đó:
- β̂1: ước lượng mẫu của tung độ gốc
- β̂2: ước lượng mẫu của độ dốc
- Ŷi: giá trị dự đoán của Y tại quan sát i
Như vậy, hàm hồi quy mẫu là kết quả trực tiếp của quá trình ước lượng mẫu.
3. Bản chất ngẫu nhiên trong hàm hồi quy mẫu

Một điểm quan trọng cần hiểu là: trong phân tích hồi quy, biến độc lập X được xem là xác định, còn biến phụ thuộc Y là biến ngẫu nhiên có điều kiện theo X.
Với cùng một mức X = Xi, nếu lấy mẫu nhiều lần, ta có thể quan sát được nhiều giá trị Y khác nhau do:
- Bỏ sót biến giải thích
- Sai số đo lường
- Tác động ngẫu nhiên không dự đoán trước
- Dạng hàm mô hình chưa hoàn hảo
Do đó, sai lệch giữa Yi và Ŷi được gọi là sai số hồi quy:
Yi = β̂1 + β̂2Xi + ei
Trong đó ei là sai số ngẫu nhiên của hàm hồi quy mẫu.
4. Mối quan hệ giữa hàm hồi quy mẫu và hàm hồi quy tổng thể
Hàm hồi quy mẫu là sự xấp xỉ của hàm hồi quy tổng thể. Nếu mẫu đủ lớn và các giả định hồi quy được thỏa mãn, các ước lượng β̂1, β̂2 sẽ tiến gần đến β1, β2.
Nói cách khác:
- PRF: mô tả mối quan hệ thật sự trong tổng thể
- SRF: mô tả mối quan hệ ước lượng từ dữ liệu mẫu
Do đó, chất lượng của hàm hồi quy mẫu phụ thuộc trực tiếp vào chất lượng dữ liệu mẫu và phương pháp ước lượng.
5. Hàm hồi quy mẫu trong hồi quy tuyến tính
Trong hồi quy tuyến tính, hàm hồi quy mẫu có dạng đường thẳng, trong đó:
- β̂1 xác định vị trí đường hồi quy
- β̂2 xác định mức độ thay đổi của Y khi X thay đổi một đơn vị
Ví dụ: nếu β̂2 = 0.6, điều này cho thấy khi X tăng 1 đơn vị, Y dự kiến tăng trung bình 0.6 đơn vị theo hàm hồi quy mẫu.
6. Diễn giải kết quả từ hàm hồi quy mẫu
Khi diễn giải hàm hồi quy mẫu, cần lưu ý:
- Ŷi là giá trị kỳ vọng có điều kiện, không phải giá trị quan sát thực tế
- Sai số ei phản ánh phần biến thiên chưa giải thích được
- Không suy diễn quan hệ nhân quả nếu không có cơ sở lý thuyết
Việc diễn giải đúng hàm hồi quy mẫu giúp tránh các kết luận sai lệch trong nghiên cứu khoa học.
7. Ý nghĩa thực tiễn của hàm hồi quy mẫu
Hàm hồi quy mẫu được sử dụng rộng rãi trong:
- Phân tích kinh tế: tiêu dùng – thu nhập, đầu tư – lãi suất
- Nghiên cứu xã hội: giáo dục – thu nhập
- Phân tích dữ liệu kinh doanh và marketing
Nhờ hàm hồi quy mẫu, nhà nghiên cứu có thể dự báo, kiểm định giả thuyết và ra quyết định dựa trên dữ liệu thực tế.
8. Kết luận
Hàm hồi quy mẫu là nền tảng của phân tích hồi quy hiện đại. Việc hiểu đúng bản chất sample regression function, vai trò của ước lượng mẫu và mối quan hệ với hàm hồi quy tổng thể giúp bạn sử dụng hồi quy tuyến tính một cách chính xác và khoa học.
Nếu bạn cần hỗ trợ học tập, Xử lý số liệu hoặc phân tích hồi quy từ dữ liệu mẫu, bạn có thể tham khảo tại:









