Phân tích tương quan là gì? Đây là kỹ thuật thống kê được dùng để đo lường và đánh giá mối quan hệ giữa các biến trong một tập dữ liệu. Cụ thể, nó cho biết mức độ và chiều hướng của mối liên hệ tuyến tính giữa hai biến định lượng. Khi muốn hiểu xem hai yếu tố có di chuyển cùng chiều hay ngược chiều, phân tích tương quan là bước đầu tiên mà các nhà nghiên cứu dữ liệu cần thực hiện.
Mục lục
Toggle1. Khái niệm cơ bản: Phân tích tương quan là gì?
Về mặt lý thuyết, phân tích tương quan là gì có thể hiểu đơn giản là việc định lượng hóa mối liên hệ giữa hai biến số. Hệ số này được biểu diễn bằng một con số duy nhất gọi là hệ số tương quan (correlation coefficient), ký hiệu là r.
Hệ số tương quan là gì? Đây là giá trị thể hiện mức độ chặt chẽ giữa hai biến định lượng, có thể dao động trong khoảng từ −1 đến 1:
- r → 1: mối tương quan dương mạnh (hai biến tăng/giảm cùng chiều).
- r → −1: mối tương quan âm mạnh (hai biến biến động ngược chiều).
- r → 0: không có tương quan tuyến tính đáng kể.
Khi r = 1, các điểm dữ liệu sẽ nằm trên một đường thẳng dốc lên hoàn hảo. Ngược lại, r = 0 cho thấy không có mối liên hệ tuyến tính nào giữa hai biến, mặc dù có thể tồn tại mối liên hệ phi tuyến.
2. Tương quan Pearson là gì?
Tương quan Pearson là phương pháp phổ biến nhất dùng trong phân tích tương quan. Hệ số này được gọi là hệ số tương quan Pearson (Pearson’s correlation coefficient) – công cụ đánh giá mức độ tuyến tính giữa hai biến định lượng. Khi dữ liệu chứa biến định tính hoặc biến nhị phân, thì không nên sử dụng tương quan Pearson mà thay bằng phương pháp khác như Spearman hoặc Kendall.
Giá trị của hệ số tương quan Pearson được tính dựa trên công thức:
r = Cov(X, Y) / (σX * σY)
Trong đó:
- Cov(X, Y): hiệp phương sai giữa hai biến X và Y.
- σX, σY: độ lệch chuẩn của từng biến.
Như vậy, để hiểu sâu phân tích tương quan là gì, bạn cần nắm rõ cách tính và diễn giải hệ số tương quan Pearson trong SPSS.
3. Cách thực hiện phân tích tương quan trong SPSS

Cách chạy phân tích tương quan trong SPSS rất đơn giản. Dưới đây là hướng dẫn chi tiết do xulysolieu.info biên soạn, giúp bạn áp dụng dễ dàng:
- Vào menu Analyze → Correlate → Bivariate….
- Chọn các biến muốn phân tích trong ô Variables.
- Tick chọn Pearson và Two-tailed để kiểm định hai phía.
- Nhấn OK để chạy phân tích tương quan.
Kết quả sẽ hiển thị trong bảng Correlations, gồm các cột:
- Pearson Correlation (r): hệ số tương quan Pearson.
- Sig. (2-tailed): giá trị sig (p-value) để kiểm định ý nghĩa thống kê.
- N: kích thước mẫu.
4. Cách đọc kết quả phân tích tương quan trong SPSS
Trong phân tích tương quan, có hai loại mối quan hệ cần quan tâm:
- Tương quan giữa biến phụ thuộc và biến độc lập: thể hiện mức độ tác động tiềm năng. Nếu sig < 0.05, tức là có mối tương quan tuyến tính đáng kể.
- Tương quan giữa các biến độc lập với nhau: nhằm phát hiện khả năng đa cộng tuyến. Nếu |r| > 0.7, có thể hai biến chứa thông tin trùng lặp.
Theo Andy Field (2009), ta có thể đánh giá độ mạnh của mối tương quan như sau:
- |r| < 0.1: rất yếu
- |r| < 0.3: yếu
- |r| < 0.5: trung bình
- |r| ≥ 0.5: mạnh
Đây là các quy ước giúp xác định mức độ liên hệ giữa các biến trong phân tích tương quan.
5. Ý nghĩa kiểm định trong phân tích tương quan
Khi SPSS hiển thị kết quả, bạn sẽ thấy ký hiệu và trong bảng:
- : mối tương quan có ý nghĩa ở mức tin cậy 99% (p < 0.01).
- : mối tương quan có ý nghĩa ở mức tin cậy 95% (p < 0.05).
Điều này giúp nhà phân tích xác định được đâu là mối quan hệ thật sự đáng tin cậy giữa các biến.
6. Ví dụ phân tích tương quan thực tế

Giả sử bạn muốn kiểm tra mối quan hệ giữa các biến như “Mức độ hài lòng của sinh viên” và “Chất lượng giảng dạy”. Sau khi chạy phân tích tương quan Pearson trong SPSS, kết quả cho thấy:
r = 0.68, Sig. (2-tailed) = 0.000, N = 200
Diễn giải:
- r = 0.68 → mối tương quan dương mạnh.
- Sig < 0.05 → mối quan hệ có ý nghĩa thống kê.
Như vậy, có thể kết luận rằng khi chất lượng giảng dạy tăng, mức độ hài lòng của sinh viên cũng tăng tương ứng. Đây là ví dụ điển hình giúp hiểu rõ phân tích tương quan là gì trong ứng dụng thực tế.
7. Ứng dụng và lưu ý khi phân tích tương quan
- Ứng dụng: được dùng phổ biến trong nghiên cứu hành vi, phân tích dữ liệu doanh nghiệp, giáo dục và y học.
- Lưu ý:
- Phân tích tương quan chỉ phản ánh mối liên hệ, không khẳng định nhân quả.
- Nếu biến không tuân theo phân phối chuẩn, nên dùng Spearman thay Pearson.
- Kết hợp phân tích tương quan với kiểm định đa cộng tuyến (VIF) trong hồi quy để đánh giá chính xác hơn.
8. Tổng kết
Như vậy, phân tích tương quan là gì – đó là bước cơ bản nhưng quan trọng trong thống kê, giúp bạn phát hiện và đánh giá mối quan hệ giữa các biến trong dữ liệu. Thông qua tương quan Pearson, bạn có thể xác định hướng và độ mạnh của liên hệ, kiểm định ý nghĩa thống kê và chuẩn bị cơ sở cho phân tích hồi quy.
Để thực hành thành thạo, bạn có thể tham khảo tài liệu chi tiết và ví dụ minh họa tại xulysolieu.info của đội ngũ Xử lý số liệu – nơi tổng hợp các bài hướng dẫn SPSS chuyên sâu, dễ hiểu và ứng dụng trực tiếp vào công việc nghiên cứu dữ liệu.









