Mục lục
Toggle1) Chi-Square Test là gì? Ý nghĩa
Chi-Square Test – Kiểm định Chi bình phương đánh giá liên hệ giữa hai biến phân loại. Nếu hai biến độc lập, tần số quan sát gần trùng tần số kỳ vọng. Cùng họ có chi-square test of independence và chi square goodness of fit.
Ý nghĩa chi square: p-value ≤ 0,05 ⇒ bác bỏ H0, kết luận có liên hệ. Kiểm định không suy luận nhân quả.
2) Điều kiện áp dụng và ngoại lệ
Dùng khi
- Hai biến đều categorical, mỗi biến ≥ 2 nhóm.
- Quan sát độc lập.
- Kỳ vọng ô: mỗi ô ≥ 1 và ≥ 80% ô có kỳ vọng ≥ 5.
Không dùng khi
- Dữ liệu cặp trước–sau ⇒ dùng McNemar.
- Bảng 2×2 có kỳ vọng nhỏ ⇒ cân nhắc Fisher’s exact.
3) Giả thuyết kiểm định
- H0: Biến A độc lập với biến B.
- H1: Biến A không độc lập với biến B.
Hoặc: H0 = “không liên hệ”, H1 = “có liên hệ”.
4) Chi square formula và cách tính chi square
χ² = Σ Σ ( (o_ij - e_ij)² / e_ij )
với e_ij = (tổng dòng i × tổng cột j) / tổng chung
bậc tự do: df = (R - 1)(C - 1)
Quy tắc: so χ² với phân bố χ²df hoặc dùng p-value. Nếu p ≤ α ⇒ bác bỏ H0.
5) Chuẩn bị dữ liệu
A. Dữ liệu thô (mỗi dòng = 1 đối tượng)
- Hai cột là hai biến phân loại. Mỗi đối tượng xuất hiện một lần.

B. Dữ liệu tần số (mỗi dòng = 1 tổ hợp nhóm)
- Ba cột: Biến 1, Biến 2,
Freq. - Trong SPSS: Data > Weight Cases… đặt
Freqlàm trọng số.

6) Chi square trong SPSS: thao tác từng bước
B1: Mở: Analyze > Descriptive Statistics > Crosstabs…

B2: Row(s): chọn biến hàng; Column(s): chọn biến cột.
B3: Statistics… → tick Chi-square → Continue.
B4: Cells… → Counts: Observed, Expected; Residuals: Unstandardized.
B5: (Tùy chọn) tick Display clustered bar charts.
B6: Nhấn OK.
Syntax mẫu:
CROSSTABS
/TABLES=VarRow BY VarCol
/FORMAT=AVALUE TABLES
/STATISTICS=CHISQ
/CELLS=COUNT EXPECTED RESID
/COUNT ROUND CELL
/BARCHART.
Đọc output chính:
- Bảng Case Processing Summary: số ca hợp lệ.

- Bảng Crosstabulation: COUNT, EXPECTED, RESIDUAL.

- Bảng Chi-Square Tests: xem dòng Pearson Chi-Square → giá trị χ², df, p-value.

7) Ví dụ chi square test
Ví dụ 3×2: Hút thuốc × Giới tính
- Kết quả minh họa: χ² = 3.171, df = 2, p = 0.205.
- Diễn giải: p > 0.05 ⇒ chưa có bằng chứng về liên hệ.

Ví dụ 2×2: Năm học × Ở ký túc xá
- Kết quả minh họa: χ² = 138.926, df = 1, p < 0.001.
- Diễn giải: p < 0.05 ⇒ có liên hệ giữa hai biến.

Gợi ý báo cáo ngắn gọn theo chuẩn:
- “Không thấy liên hệ giữa giới và hút thuốc, χ²(2) = 3.17, p = .205.”
- “Có liên hệ giữa năm học và nơi ở, χ²(1) = 138.93, p < .001.”
8) Mức độ liên hệ: Phi và Cramer’s V
Khi p có ý nghĩa, báo thêm phi (2×2) hoặc Cramer’s V (>2×2). Trong SPSS: Statistics… tích Nominal (Phi and Cramer’s V). Gợi ý: ~0.1 nhỏ, ~0.3 trung bình, ~0.5 lớn.
9) Chi square goodness of fit (một biến)
So phân bố quan sát của một biến phân loại với phân bố kỳ vọng.
- Công thức: giống χ², với df = k − 1.
- SPSS: Analyze > Nonparametric Tests > Legacy Dialogs > Chi-Square…
10) Bẫy thường gặp
- Kỳ vọng nhỏ: gộp nhóm hiếm, tăng cỡ mẫu, dùng Fisher cho 2×2.
- Không độc lập: cùng người xuất hiện nhiều lần ⇒ dùng McNemar cho dữ liệu cặp.
- Thứ bậc → danh mục: cân nhắc kiểm định xu thế hoặc mô hình phù hợp.
- Nhầm nhân quả: chi-square chỉ khẳng định liên hệ.
11) Checklist thao tác nhanh
- Chọn 2 biến categorical, xác định câu hỏi.
- Kiểm tra độc lập quan sát, điều kiện kỳ vọng ô.
- Chạy Crosstabs, bật Chi-square, Expected, Residual.
- Đọc χ², df, p; cân nhắc Fisher cho 2×2.
- Nếu có ý nghĩa, báo thêm Cramer’s V/phi.
- Kết luận ngắn gọn, đúng chuẩn.
12) Hỗ trợ phân tích & báo cáo
Cần chuẩn hóa dữ liệu, thiết kế bảng chéo, chạy chi square test, goodness of fit, tính Cramer’s V, dựng dashboard? Tham khảo ngay dịch vụ xử lý số liệu của xulysolieu.info để được hỗ trợ.









