Trong quá trình phân tích dữ liệu bằng SPSS, hai thuật ngữ thường gặp là tương quan và hồi quy. Mặc dù cả hai đều liên quan đến việc khám phá mối liên hệ giữa các biến, chúng phục vụ những mục đích khác nhau.
Tương quan nhằm đo lường mức độ và hướng của mối liên hệ giữa hai biến số, trong khi hồi quy tập trung vào việc dự đoán giá trị của một biến dựa trên giá trị của biến khác.
Trong hướng dẫn này, xulysolieu.info sẽ trình bày ngắn gọn về cả hai thuật ngữ và nêu rõ các tính chất giống và khác nhau giữa chúng.
Xem thêm:
Hướng dẫn 4 bước phân tích hồi quy tuyến tính trong SPSS
Hướng dẫn phân tích tương quan Pearson trong SPSS
Mục lục
ToggleKhái niệm Tương quan và Hồi quy trong SPSS
Tương quan (Correlation) là gì?
Hệ số tương quan là một thước đo định lượng mối quan hệ tuyến tính giữa hai biến x và y. Hệ số này dao động trong khoảng từ -1 đến 1, trong đó:
– Giá trị -1 biểu thị mối tương quan tuyến tính hoàn toàn âm, tức là khi một biến tăng thì biến còn lại giảm một cách hoàn toàn.
– Giá trị 0 biểu thị không có mối tương quan tuyến tính giữa hai biến, tức là không có mối quan hệ tuyến tính nào giữa sự thay đổi của biến này và biến kia.
– Giá trị 1 biểu thị mối tương quan tuyến tính hoàn toàn dương, tức là khi một biến tăng thì biến còn lại cũng tăng một cách hoàn toàn.
Ví dụ: Giả sử có tập dữ liệu chứa hai biến (1) Số giờ học và (2) Điểm thi từ 15 sinh viên khác nhau
Số giờ học
|
Điểm thi
|
1
|
60
|
1
|
63
|
2
|
64
|
2
|
69
|
2
|
65
|
3
|
75
|
4
|
79
|
4
|
73
|
5
|
76
|
6
|
80
|
7
|
83
|
7
|
83
|
8
|
86
|
8
|
85
|
9
|
88
|
10
|
90
|
10
|
87
|
11
|
98
|
12
|
95
|
Tiếp tục sử dụng biểu đồ phân tán (Scatterplot) về số giờ học so với điểm thi, biểu đồ đó sẽ trông như thế này:
Biểu đồ thể hiện một mối liên hệ tuyến tính dương giữa biến độc lập “số giờ học” và biến phụ thuộc “điểm thi”. Khi số giờ học tăng, điểm thi có xu hướng tăng theo một tỷ lệ nhất định. Kết quả này cho thấy một mối tương quan thống kê có ý nghĩa.
Sử dụng máy tính sẽ thấy được mối tương quan giữa hai biến này là r = 0,969. Vì giá trị này gần bằng 1 nên nó xác nhận rằng có mối tương quan dương mạnh giữa hai biến.
Hồi quy (Regression) là gì?
Hồi quy là một phương pháp thống kê được sử dụng để hiểu cách thay đổi giá trị của biến độc lập x ảnh hưởng đến giá trị của biến phụ thuộc y.
Mô hình hồi quy sử dụng biến x làm biến dự báo và biến y làm biến phản hồi. Mô hình này xác định một phương trình dưới dạng sau để mô tả tốt nhất mối quan hệ giữa hai biến:
y= b0 + b1.x
Trong đó:
– y: Giá trị dự đoán của biến phản hồi
– b0: Giao điểm y (giá trị của y khi x bằng không)
– b1: Hệ số hồi quy (mức tăng trung bình của y khi x tăng một đơn vị)
– x: Giá trị của biến dự báo
Ví dụ: Tiếp tục sử dụng dữ liệu Số giờ học và Điểm thi ở trên để phân tích
Sử dụng tính toán hồi quy tuyến tính, nhận thấy rằng phương trình sau đây mô tả tốt nhất mối quan hệ giữa hai biến này:
Điểm thi dự kiến = 61,148 + 3,011*(giờ học)
Cách giải thích phương trình này như sau:
– Điểm thi dự kiến của một sinh viên học không giờ nào là 61,148.
– Điểm thi trung bình tăng thêm sau một giờ học là 3,011.
Chúng ta cũng có thể sử dụng phương trình này để dự đoán điểm số mà học sinh sẽ nhận được dựa trên số giờ học.
Ví dụ, một sinh viên học 6 giờ dự kiến sẽ nhận được số điểm là 79,214:
Điểm thi dự kiến = 61,148 + 3,011*(6) = 79,214
Chúng ta cũng có thể biểu diễn phương trình này dưới dạng đường thẳng trên biểu đồ phân tán:
Chúng ta có thể thấy rằng đường hồi quy khớp khá tốt với dữ liệu.
Như đã đề cập trước đó, mối tương quan giữa hai biến này là r = 0,969. Khi bình phương giá trị này, ta nhận được một chỉ số gọi là ”r bình phương” (r^2 ), mô tả tỷ lệ tổng phương sai của biến phản hồi có thể được giải thích bởi biến dự báo.
Trong ví dụ này, r^2 = 0,969^2 = 0,939 . Điều này có nghĩa là 93,9% sự thay đổi trong điểm thi có thể được giải thích bởi số giờ học.
So sánh Tương quan (Correlation) và Hồi quy (Regression) : Điểm giống và khác nhau
Tương quan (Correlation)
|
Hồi quy (Regression)
|
Đều định lượng hướng mối quan hệ giữa hai biến
|
|
Đều định lượng mức độ mạnh yếu của mối quan hệ giữa hai biến
|
|
Tương quan không làm được điều này
|
Hồi quy có thể cho thấy mối quan hệ nhân quả giữa hai biến
|
Tương quan không làm được điều này.
|
Hồi quy có thể sử dụng một phương trình để dự đoán giá trị của một biến, dựa trên giá trị của một biến khác.
|
Tương quan sử dụng một con số duy nhất.
|
Hồi quy sử dụng phương trình để định lượng mối quan hệ giữa hai biến.
|
Mặc dù có sự tương đồng nhưng phân tích tương quan hay phân tích hồi quy đều là các bước cần thiết trong quá trình phân tích. Nếu bạn gặp khó khăn trong phân tích tương quan và phân tích hồi quy, bạn có thể tham khảo Dịch vụ chạy SPSS, trong đó bao gồm tất cả chỉ số cần phân tích. Hoặc bạn có thể trực tiếp liên hệ thông quan fanpage chính thức của xulysolieu.info.