Mục lục
Toggle1. KIỂM ĐỊNH CHI BÌNH PHƯƠNG LÀ GÌ?
Trong luận văn, kiểm định Chi bình phương hay còn gọi là kiểm định Crosstab thường được ứng dụng nhiều khi chúng ta cần phân tích sâu hơn mối quan hệ giữa các đặc điểm nhân khẩu học của đáp viên hoặc phân tích sự liên kết các yếu tố trong thị trường… Đây là một công cụ mạnh hỗ trợ chúng ta đưa ra giải pháp cho bài nghiên cứu.
Kiểm định Chi bình phương được sử dụng khi chúng ta muốn đánh giá xem liệu có mối quan hệ giữa hai biến định tính hay biến phân loại (categorical variables) trong một tập dữ liệu hay không. Ví dụ, chúng ta cần đánh giá xem độ tuổi và thâm niên của nhân viên trong công ty có quan hệ với nhau không, giới tính và tình trạng hôn nhân của khách hàng có sự liên kết nào hay không…
2. VÍ DỤ VỀ PHÂN TÍCH KIỂM ĐỊNH CHI BÌNH PHƯƠNG
Để cụ thể hơn, chúng ta cùng đi vào một ví dụ thực tế với một tập dữ liệu mẫu gồm 312 quan sát nghiên cứu về sự hài lòng của nhân viên trong một công ty. Chúng ta sẽ đánh giá xem Độ tuổi và Học vấn của các nhân viên có sự liên kết nhau hay không.
Biến Độ tuổi được chia làm các mức giá trị:
Dưới 18 tuổi
Từ 18 – 27 tuổi
Từ 28 – 43 tuổi
Trên 43 tuổi
Biến Học vấn được chia làm các mức giá trị:
Trung học
Trung cấp
Cao đẳng/ đại học
Trên đại học
Giả thuyết Ho: Độ tuổi và Học vấn không có mối quan hệ với nhau (độc lập nhau)
Thực hiện kiểm định Chi bình phương mối quan hệ giữa Độ tuổi và Học vấn trên SPSS 27. Chúng ta vào Analyze > Descriptives Statistics > Crosstabs.
Tại cửa sổ Crosstabs đưa biến Độ tuổi vào ô Row(s) và biến Học vấn vào ô Column(s), có thể đưa một trong hai biến vào bất kỳ mục Rows hay Column đều được, không ảnh hưởng đến kết quả kiểm định. Bạn có thể chọn vào Display clustered bar charts để hiển thị đồ thị mối quan hệ hai biến.
Nhấp vào tùy chọn Statistics, tích chọn vào Chi-square và Cramer’s V, sau đó nhấp vào Continue.
Nhấp vào tùy chọn Cells, trong mục Percentages tích chọn vào Rows, Columns. Tiếp tục nhấp vào Continue, sau đó chọn OK để tiến hành kiểm định.
Trong kết quả ở Output, bảng Crosstabulation cho chúng ta cái nhìn sơ bộ về mối quan hệ giữa hai biến này về mặt thống kê tần số.
Tiếp đến, chúng ta sẽ đọc bảng quan trọng nhất là Chi-Square Tests. Nếu giá trị Asymptotic Significance (2-sided) hàng Pearson Chi-Square nhỏ hơn 0.05. Chúng ta bác bỏ giả thuyết Ho, nghĩa là 2 biến Độ tuổi và Học vấn có mối quan hệ với nhau. Nếu giá trị Sig này lớn hơn 0.05, chúng ta chấp nhận giả thuyết Ho, tương đương rằng Độ tuổi và Học vấn không có mối quan hệ với nhau.
Cuối bảng Chi-Square Tests luôn có một dòng thông báo dạng: X cells (Z%) have expected count less than 5. The minimum expected count is Y. Khi chạy không ra được kết quả kiểm định, các bạn cần để ý đến dòng này.
Kiểm định Chi bình phương chỉ có ý nghĩa khi số quan sát đủ lớn, nếu có quá 20% số ô trong bảng Crosstabulation có tần số nhỏ hơn 5 thì Chi-Square không còn mang ý nghĩa chính xác hoặc có thể kết quả kiểm định không thực hiện được và báo lỗi.
Khi xảy ra trường hợp này, các bạn cần tăng số lượng đáp viên ở các nhóm đáp án có dưới 5 người trả lời hoặc mã hóa lại biến để tăng số lượng người ở mỗi đáp án lên đủ lớn. Ví dụ nhóm Độ tuổi chỉ có 3 người chọn vào Trên 43 tuổi, chúng ta phải khảo sát thêm để số lượng trên 5 người.
Nếu bạn đang gặp khó khăn trong tìm kiếm dữ liệu phù hợp cho phân tích SPSS nhằm đảm bảo các tiêu chí kiểm định. Bạn có thể tham khảo việc mua số liệu SPSS của Xử Lý Số Liệu Định Lượng để có được kết quả tốt nhất và tối ưu về thời gian nhất.
Kết quả Sig từ Chi-Square Test chỉ nói lên được 2 biến có mối quan hệ hay không. Nếu 2 biến này có sự liên kết với nhau thì chúng ta sẽ cần đánh giá mức độ liên kết giữa 2 biến qua giá trị Value của kiểm định Phi và Cramer’s V.
Kiểm định Phi chỉ phù hợp khi xem xét mối quan hệ giữa 2 biến mà mỗi biến chỉ có 2 giá trị, nếu một trong hai biến có từ 3 giá trị trở lên chúng ta sẽ dùng kết quả của Cramer’s V.
Cụ thể trong bảng kết quả ở trên, chúng ta đọc chỉ số Value của Cramer’ V, hệ số này là 0.489 = 48.9%, như vậy 2 biến này có sự tương quan khá cao.
Đồ thị cột biểu diễn tần số người trả lời (số đáp viên) của mỗi giá trị của biến này khi so với biến còn lại, đây là đồ thị biểu diễn kết quả bảng Crosstabulation. Ví dụ, Độ tuổi Dưới 18 tuổi, thì màu xanh dương và màu xanh lá có số lượng người dưới 5 người, màu hồng và màu tím có số lượng trên 10 người.
SPSS, một công cụ phân tích số liệu thống kê không thể thiếu cho người nghiên cứu, giúp chúng ta thực hiện các phân tích dữ liệu một cách chính xác. Bạn có biết cách cài đặt phần mềm này không? Hãy cùng đi tìm câu trả lời trong bài viết hướng dẫn cài đặt SPSS full bản quyền của Xulysolieu nhé!
Trong bài hướng dẫn này, Xulysolieu đã trình bày khái niệm về kiểm định Chi bình phương một cách tỉ mỉ, đi kèm với ví dụ minh họa giúp bạn dễ dàng theo dõi. Mong rằng qua bài viết, bạn đã có thể nắm bắt được cách thức thực hiện kiểm định Chi bình phương và áp dụng chúng một cách thành thạo trong công việc phân tích dữ liệu với SPSS.