Bài viết này sẽ giúp bạn đọc hiểu rõ tầm quan trọng của hồi quy trong phân tích bằng cách hướng dẫn cách chạy hồi quy SPSS, cách đọc kết quả, giải thích ý nghĩa của các chỉ số và đánh giá các giả định thông qua biểu đồ một cách chính xác.
Mục lục
Toggle1. Định Nghĩa Hồi Quy Tuyến Tính trong SPSS
Hồi quy trong SPSS là một công cụ mạnh mẽ được sử dụng để đánh giá mức độ ảnh hưởng của các biến độc lập lên biến phụ thuộc. Nó không chỉ giúp dự đoán giá trị của biến phụ thuộc dựa trên một hoặc nhiều biến độc lập mà còn cho biết tỷ lệ phương sai của biến phụ thuộc được giải thích bởi tập hợp các biến độc lập.
2. Hướng Dẫn Cách Thực Hiện Hồi Quy SPSS
Để hiểu rõ quy trình chạy hồi quy tuyến tính trên SPSS, chúng ta sẽ xem xét một ví dụ cụ thể sau đây:
2.1. Các Điều Kiện Tiên Quyết cho Hồi Quy
Trước khi tiến hành phân tích dữ liệu bằng hồi quy trên SPSS, điều quan trọng là phải đảm bảo rằng dữ liệu đáp ứng các điều kiện cần thiết. Điều này có nghĩa là dữ liệu phải “vượt qua” bảy giả định quan trọng để đảm bảo kết quả hồi quy tuyến tính là hợp lệ.
- Giả định 1: Biến phụ thuộc phải được đo ở thang đo liên tục (tức là, biến khoảng hoặc biến tỷ lệ).
- Giả định 2: Các biến độc lập cũng nên được đo ở thang đo liên tục (biến khoảng hoặc biến tỷ lệ).
- Giả định 3: Cần có một mối quan hệ tuyến tính giữa các biến.
- Giả định 4: Không có các giá trị ngoại lệ (outliers) đáng kể.
- Giả định 5: Các quan sát phải độc lập với nhau, có thể kiểm tra bằng thống kê Durbin-Watson.
- Giả định 6: Dữ liệu phải thể hiện tính đồng nhất phương sai (homoscedasticity).
- Giả định 7: Phần dư (sai số) của đường hồi quy phải tuân theo phân phối chuẩn.
Lưu ý:
- Không phải lúc nào kết quả cũng hoàn hảo; đôi khi, khi phân tích bằng SPSS, một hoặc nhiều giả định có thể không được đáp ứng.
- Giả định 3 nên được kiểm tra đầu tiên, trước khi kiểm tra các giả định 4, 5, 6 và 7.
2.2. Quy Trình 5 Bước Thực Hiện Hồi Quy trên SPSS
Bài toán ví dụ: Một nhân viên bán xe hơi muốn tìm hiểu xem liệu có mối liên hệ giữa thu nhập của khách hàng và giá xe họ mua hay không. “Thu nhập” là biến độc lập, và “giá” xe là biến phụ thuộc.
Thiết lập thống kê:
- Trong SPSS, tạo hai biến: Thu nhập (biến độc lập) và Giá (biến phụ thuộc) để nhập dữ liệu.
- Có thể tạo một biến thứ ba là caseno để đánh số thứ tự các trường hợp. Điều này giúp dễ dàng loại bỏ các trường hợp ngoại lệ khi kiểm tra các giả định.
Thực hiện phân tích: Dưới đây là hướng dẫn 5 bước để phân tích dữ liệu bằng hồi quy trong SPSS khi tất cả bảy giả định đều được đáp ứng:
- Bước 1: Trên thanh công cụ, chọn: Analyze – Regression – Linear.

Bước 1 chạy hồi quy trong SPSS
- Bước 2: Kéo biến phụ thuộc “Giá” vào ô Dependent và biến độc lập “Thu nhập” vào ô Independent(s)

Bước 2 cách chạy hồi quy trong spss
- Bước 3: Nhấn vào nút Statistics, hộp thoại “Linear Regression: Statistics” xuất hiện. Chọn Collinearity diagnostics (để tính hệ số VIF) để đánh giá hiện tượng đa cộng tuyến. Sau đó, nhấn Continue để quay lại hộp thoại Linear Regression.

Bước 3 cách chạy spss hồi quy
Bước này giúp kiểm tra đồng thời bốn giả định: không có ngoại lệ đáng kể (giả định 3), tính độc lập của các quan sát (giả định 4), tính đồng nhất phương sai (giả định 5), và phân phối chuẩn của sai số (giả định 6).
- Bước 4: Nhấn OK để bắt đầu phân tích.
- Bước 5: Phân tích và diễn giải kết quả hồi quy tuyến tính trên SPSS.
3. Ba Bảng Kết Quả Quan Trọng Trong Hồi Quy SPSS
🔹 Bảng ANOVA
Bảng này kiểm định mức độ phù hợp của mô hình hồi quy. Nếu giá trị Sig. < 0.05, mô hình có ý nghĩa thống kê – tức là mô hình dự đoán được biến phụ thuộc.

Bảng kết quả ANOVA
🔹 Bảng Model Summary

Bảng kết quả Model Summary phân tích SPSS hồi quy
Cung cấp các giá trị:
- R: Mức độ tương quan giữa biến độc lập và phụ thuộc.
- R² (R bình phương): Tỷ lệ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập. Ví dụ: R² = 0.762 → 76,2% biến thiên được giải thích.
🔹 Bảng Coefficients

Bảng kết quả Coefficients
Cho biết phương trình hồi quy và ý nghĩa của từng biến. Nếu Sig. < 0.05, biến độc lập có ảnh hưởng đáng kể đến biến phụ thuộc.
Ví dụ:
Giá = 8287 + 0,564 × Thu nhập
4. Các Chỉ Số Cần Lưu Ý Khi Chạy Hồi Quy SPSS
✅ R² & Adjusted R²
- Đánh giá mức độ giải thích của mô hình.
- Adjusted R² điều chỉnh theo số lượng biến độc lập – giúp tránh “R² ảo”.
✅ Durbin – Watson (DW)
- Kiểm tra tự tương quan chuỗi.
- ≈ 2: Không có tự tương quan.
- < 1 hoặc > 3: Có thể có tự tương quan bậc 1.
✅ Sig. kiểm định F và t
- Sig. F < 0.05: Mô hình phù hợp.
- Sig. t < 0.05: Biến độc lập có ý nghĩa thống kê.
✅ VIF (Variance Inflation Factor)
- Kiểm tra hiện tượng đa cộng tuyến.
- VIF < 2: Không có đa cộng tuyến.
- VIF > 10: Đa cộng tuyến nghiêm trọng → cần loại bỏ biến.
5. Cách Đánh Giá Giả Định Hồi Quy Qua Biểu Đồ Trong SPSS
Khi thực hiện phân tích hồi quy tuyến tính trong SPSS, việc kiểm tra các giả định nền tảng là rất quan trọng để đảm bảo mô hình xây dựng là phù hợp và đáng tin cậy. Dưới đây là 3 loại biểu đồ phổ biến được sử dụng để kiểm định các giả định hồi quy:
5.1. Biểu Đồ Histogram – Kiểm Tra Phân Phối Chuẩn Của Phần Dư

Biểu đồ tần số phần dư chuẩn hóa Histogram
Biểu đồ tần số phần dư chuẩn hóa (Histogram) giúp kiểm tra xem phần dư có phân phối gần chuẩn hay không.
- Nếu giá trị Mean ≈ 0 và độ lệch chuẩn (Std. Dev.) ≈ 1, cùng với đường cong hình chuông nằm chồng trên biểu đồ, ta có thể kết luận rằng phần dư phân phối xấp xỉ chuẩn.
- Ví dụ: Mean = -8.95E-16, Std. Dev = 0.989 → thỏa điều kiện phân phối chuẩn.
✅ Kết luận: Giả định phân phối chuẩn của phần dư không bị vi phạm.
5.2. Biểu Đồ Normal P-P Plot – Kiểm Tra Sự Chuẩn Hóa Của Phần Dư

Biểu đồ phần dư chuẩn hóa Normal P-P Plot
Biểu đồ Normal Probability Plot (P-P Plot) cho phép trực quan hóa phân phối phần dư bằng cách so sánh phân vị của phần dư với phân vị của phân phối chuẩn lý tưởng.
- Nếu các điểm trong biểu đồ nằm gần một đường chéo thẳng, điều này cho thấy phần dư có phân phối gần chuẩn.
✅ Kết luận: Phần dư có phân phối chuẩn, tức là giả định phân phối chuẩn được thỏa mãn.
5.3. Biểu Đồ Scatter Plot – Kiểm Tra Tính Tuyến Tính

Biểu đồ Scatter Plot kiểm tra
Biểu đồ phân tán (Scatter Plot) giữa phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa giúp kiểm tra giả định về mối quan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập.
- Nếu các điểm dữ liệu phân bố ngẫu nhiên quanh trục tung = 0, không tạo thành hình mẫu rõ ràng và có xu hướng nằm trên một dải tuyến tính → mô hình hồi quy không vi phạm giả định tuyến tính.
✅ Kết luận: Quan hệ tuyến tính giữa các biến không bị vi phạm.
Tổng Kết
Việc sử dụng 3 biểu đồ kiểm định giả định hồi quy trong SPSS – Histogram, Normal P-P Plot và Scatter Plot – là bước không thể thiếu để đánh giá chất lượng mô hình hồi quy tuyến tính. Nếu cả ba biểu đồ cho thấy phần dư tuân theo phân phối chuẩn và quan hệ giữa các biến là tuyến tính, bạn có thể yên tâm sử dụng mô hình để diễn giải và dự đoán.