Bài hướng dẫn này tập trung vào logistic regression spss: hiểu hồi quy logistic là gì, cách kiểm định giả định, cách chạy logistic regression trong SPSS, và diễn giải kết quả logistic regression spss theo chuẩn báo cáo nghiên cứu. Tài liệu và hỗ trợ thực hành có tại xulysolieu.info – dịch vụ Xử lý số liệu.
Mục lục
Toggle1) Hồi quy logistic là gì?
Hồi quy logistic nhị phân dự đoán xác suất một biến phụ thuộc nhị phân (0/1) xảy ra dựa trên một hay nhiều biến độc lập định lượng hoặc định tính. Với logistic regression spss, đầu ra chính là logit của xác suất, odds và odds ratio. Nếu biến phụ thuộc là đếm, dùng Poisson; nếu đa lớp >2, dùng multinomial. Khi triển khai logistic regression spss, bạn làm việc với hàm liên kết logit nên hệ số hồi quy diễn giải theo log-odds/odds ratio.
2) Giả định cần kiểm tra trước khi chạy logistic regression SPSS
- DV nhị phân: 0/1 rõ ràng. Đây là tiền đề của logistic regression spss.
- IV dạng liên tục hoặc phân loại: được phép dùng cả hai trong logistic regression spss.
- Độc lập quan sát: không lặp lại đo trên cùng cá thể, phù hợp khuôn khổ logistic regression spss.
- Tuyến tính giữa biến liên tục và logit: kiểm bằng Box–Tidwell trong logistic regression spss; nếu vi phạm, xem xét biến đổi hoặc phân đoạn.
- Không đa cộng tuyến nghiêm trọng: kiểm tra hệ số tương quan cao; trong logistic regression spss có thể thăm dò qua ma trận tương quan hoặc chạy OLS phụ để xem VIF tham khảo.
- Không có outlier ảnh hưởng lớn: rà soát casewise residuals, leverage, Cook’s trong logistic regression spss.
Nếu vi phạm một số giả định, vẫn có giải pháp: biến đổi biến, phân loại, loại điểm ngoại lai hợp lý, hoặc chọn mô hình khác. Đây là thực tế thường gặp khi thao tác logistic regression spss.
3) Ví dụ logistic regression
Giả sử dự đoán “bệnh tim: có/không” theo tuổi, cân nặng, giới, VO2max. Đây là kịch bản chuẩn để minh họa toàn bộ quy trình logistic regression spss từ nhập dữ liệu, đặt mã, chạy lệnh đến báo cáo.
4) Chuẩn bị dữ liệu trong SPSS
- Mã hóa DV:
heart_disease(0 = không, 1 = có). Cách mã hóa nhất quán là điều kiện của logistic regression spss. - Biến liên tục:
age,weight,vo2maxđể dùng trực tiếp trong logistic regression spss. - Biến phân loại:
gender(0 = nữ, 1 = nam). Cần khai báo “Categorical…” đúng trong logistic regression spss để thiết lập nhóm tham chiếu.
5) Cách chạy logistic regression trong SPSS

- Vào Analyze > Regression > Binary Logistic… để mở hộp thoại logistic regression spss.
- Đưa
heart_diseasevào Dependent; đưaage,weight,gender,vo2maxvào Covariates theo chuẩn logistic regression spss. - Nhấn Categorical…, chuyển
gendersang “Categorical Covariates”, chọn Reference Category = First hoặc Last đúng theo mã hóa 0/1. Bước này quyết định cách SPSS tạo biến giả trong logistic regression spss. - Nhấn Options…, chọn:
- Hosmer–Lemeshow goodness-of-fit để kiểm độ phù hợp trong logistic regression spss.
- Classification plots, Casewise listing of residuals để xem phân loại và ngoại lệ trong logistic regression spss.
- CI for Exp(B) để lấy khoảng tin cậy odds ratio trong logistic regression spss.
- Giữ Method = Enter cho mô hình chuẩn logistic regression spss; nhấn OK.
6) Diễn giải kết quả logistic regression SPSS
6.1. Độ phù hợp mô hình
- Hosmer–Lemeshow test: p > 0.05 ngụ ý mô hình phù hợp dữ liệu, một tiêu chí căn bản khi đọc logistic regression spss.
- -2 Log Likelihood: càng nhỏ càng tốt; dùng để so sánh mô hình trong logistic regression spss.
- Cox & Snell R² và Nagelkerke R²: “pseudo R²”, báo cáo Nagelkerke R² vì có thể tiến gần 1. Đây là thước đo phần phương sai giải thích trong logistic regression spss.
6.2. Bảng phân loại (Classification Table)
Cho biết tỷ lệ dự báo đúng tổng thể (PAC), Sensitivity (TPR), Specificity (TNR), PPV, NPV với ngưỡng cắt mặc định 0.5. Khi tối ưu hiệu năng trong logistic regression spss, có thể thay đổi cut-off theo mục tiêu cân bằng nhạy/đặc hiệu hoặc chi phí sai lầm.
6.3. Bảng “Variables in the Equation”
- B: hệ số log-odds; S.E.: sai số chuẩn; Wald và Sig.: kiểm định ý nghĩa từng biến trong logistic regression spss.
- Exp(B): odds ratio; 95% CI cho Exp(B) là mấu chốt diễn giải trong logistic regression spss.
- Ví dụ diễn giải: Exp(B)=7.03 cho
gender(nam so với nữ) nghĩa là odds mắc bệnh tim của nam cao gấp 7.03 lần, nếu p<0.05 trong logistic regression spss.
7) Báo cáo kết quả theo chuẩn

Mẫu báo cáo gọn:
Mô hình logistic regression spss dự đoán bệnh tim theo tuổi, cân nặng, giới, VO2max có ý nghĩa chung (χ², p<0.001). Nagelkerke R²=0.33. Hosmer–Lemeshow p=0.41 cho thấy độ phù hợp chấp nhận được. Bảng phân loại đạt 78% PAC, Se=70%, Sp=83% tại cut-off 0.5. Về biến riêng lẻ, tuổi (B=0.04, p=0.003), giới nam (OR=7.03, p=0.021) và VO2max (OR=0.95, p=0.039) có ý nghĩa; cân nặng không có ý nghĩa (p=0.799).
Khi viết bài, nhắc rõ thước đo (OR, CI 95%), p-value, và pseudo-R² để hoàn thiện phần diễn giải kết quả logistic regression spss.
8) Thực hành tốt và bẫy thường gặp
- Mã hóa tham chiếu: xác định nhóm 0/1 nhất quán trước khi chạy logistic regression spss.
- Tuyến tính logit: kiểm Box–Tidwell cho biến liên tục trong logistic regression spss; nếu vi phạm, dùng spline hoặc phân loại bậc thang.
- Tương tác: thêm biến tương tác nếu có lý thuyết hỗ trợ; đánh giá qua Wald trong logistic regression spss.
- Thang đo khác nhau: cân nhắc chuẩn hóa để cải thiện ổn định ước lượng trong logistic regression spss.
- Class imbalance: nếu lớp dương hiếm, cân nhắc điều chỉnh cut-off, trọng số hoặc kỹ thuật lấy mẫu khi dùng logistic regression spss.
9) Câu hỏi nhanh
Hồi quy logistic là gì? Mô hình xác suất cho DV nhị phân. Trong logistic regression spss, hệ số diễn giải bằng odds ratio.
Cách chạy logistic regression trong SPSS? Analyze > Regression > Binary Logistic…; đặt DV, IV, khai báo categorical, chọn Hosmer–Lemeshow, CI cho Exp(B) và chạy. Đó là quy trình chuẩn logistic regression spss.
Diễn giải kết quả logistic regression spss? Kiểm Hosmer–Lemeshow, pseudo-R², bảng phân loại, và bảng hệ số với OR, CI, p-value.
Ví dụ logistic regression? Dự đoán bệnh tim bằng tuổi, cân nặng, giới, VO2max minh họa đầy đủ các bảng của logistic regression spss.
10) Tài nguyên và hỗ trợ
Để có template báo cáo, file dữ liệu thực hành, và checklist giả định cho logistic regression spss, xem xulysolieu.info. Khi cần đội ngũ triển khai phân tích, mô hình hóa và viết báo cáo logistic regression spss cho luận văn hay đề án doanh nghiệp, liên hệ dịch vụ Xử lý số liệu.









