Hướng dẫn phân tích tương quan Pearson trong SPSS 26, 27

Phân tích tương quan Pearson là bước phân tích không thể thiếu khi thực hiện nghiên cứu khoa học, đặc biệt là phân tích định lượng trong SPSS. Bước phân tích tương quan Pearson sẽ được thực hiện trước khi phân tích hồi quy, hãy cùng Xulsolieu tìm hiểu trong bài viết này.

Xem thêm:

Chạy Cronbach’s Alpha trên SPSS: 4 trường hợp loại hay giữ biến

Hướng dẫn 4 bước phân tích hồi quy tuyến tính trong SPSS

Hướng Dẫn Phân Tích Tương Quan Pearson Trong Spss 26, 27

Hướng dẫn phân tích tương quan Pearson trong SPSS 26, 27

1. Cơ sở lý thuyết

Khái niệm hệ số tương quan Pearson

Hệ số tương quan Pearson hai biến đo lường cường độ và hướng của mối quan hệ tuyến tính giữa các cặp biến liên tục.

Hệ số tương quan Pearson cho hai biến tạo ra một hệ số tương quan mẫu, r, đo lường mức độ và hướng của mối quan hệ tuyến tính giữa các cặp biến liên tục.

Ngoài ra, hệ số tương quan Pearson kiểm tra xem có bằng chứng thống kê nào về mối quan hệ tuyến tính giữa các cặp biến tương tự trong quần thể hay không, được biểu thị bằng hệ số tương quan quần thể, ρ (“rho”). Hệ số tương quan Pearson là một thước đo tham số.

Thước đo này còn được gọi là:

  • Pearsons’ correlation
  • Pearson product – moment correlation (PPMC)

Mục đích dùng phân tích tương quan Pearson

Hệ số tương quan Pearson hai biến thường được sử dụng để đo lường những điều sau:

Hệ số tương quan Pearson hai biến chỉ ra điều sau:

Lưu ý 1:

Hệ số tương quan Pearson không áp dụng cho các mối quan hệ phi tuyến tính hoặc giữa các biến phân loại. Để phân tích các mối quan hệ này, cần sử dụng một biện pháp liên kết khác.

Lưu ý 2: 

Hệ số tương quan Pearson chỉ thể hiện mối liên hệ giữa các biến liên tục và không đưa ra suy luận về quan hệ nhân quả, dù hệ số tương quan có lớn đến đâu.

Yêu cầu dữ liệu tiêu chuẩn để phân tích tương quan Pearson

Để có thể phân tích tương quan Pearson, dữ liệu cần đáp ứng được các yêu cầu như sau:

1. Hai hoặc nhiều biến liên tục (tức là mức khoảng hoặc tỷ lệ)

2. Các trường hợp phải có giá trị không bị thiếu trên cả hai biến
3. Mối quan hệ tuyến tính giữa các biến
4. Các trường hợp độc lập (tức là, sự độc lập của các quan sát)

+ Không có mối quan hệ giữa các giá trị của biến giữa các trường hợp. Điều này có nghĩa là:

– Các giá trị của tất cả các biến trong các trường hợp là độc lập và không liên quan.
– Trong mỗi trường hợp, giá trị của bất kỳ biến nào không ảnh hưởng đến giá trị của bất kỳ biến nào trong các trường hợp khác.
– Không có trường hợp nào có thể ảnh hưởng đến trường hợp khác trên bất kỳ biến nào.

+ Hệ số tương quan Pearson song phương và phép thử ý nghĩa tương ứng không còn đáng tin cậy khi tính độc lập bị vi phạm.

5. Chuẩn hóa hai biến

– Mỗi cặp biến được phân phối chuẩn hai biến
– Mỗi cặp biến được phân phối chuẩn hai biến ở mọi cấp độ của biến khác
– Giả định này đảm bảo rằng các biến có liên quan tuyến tính; vi phạm giả định này có thể chỉ ra rằng tồn tại mối quan hệ phi tuyến tính giữa các biến. Tính tuyến tính có thể được đánh giá trực quan bằng cách sử dụng biểu đồ phân tán của dữ liệu.

6. Mẫu dữ liệu ngẫu nhiên

7. Không có dữ liệu ngoại lai (outlier)

Giả thuyết trong phân tích tương quan Pearson

Giả thuyết không (H0) và giả thuyết thay thế (H1) của phép kiểm định ý nghĩa cho mối tương quan có thể được diễn đạt theo những cách sau, tùy thuộc vào việc yêu cầu kiểm định một phía (one-tailed test) hay hai phía (two – tailed test):

Kiểm định ý nghĩa two – tailed test:

  • H0: ρ = 0 (“hệ số population correlation coefficient là 0; không có mối liên hệ nào”)
  • H1: ρ ≠ 0 (“hệ số population correlation coefficient không phải là 0; có thể tồn tại mối tương quan khác không”)

Kiểm định ý nghĩa one – tailed test:

  • H0: ρ = 0 (“hệ số population correlation coefficient là 0; không có mối liên hệ nào”)
  • H1: ρ > 0 (“hệ số population correlation coefficient lớn hơn 0; có thể tồn tại mối tương quan dương”)
    HOẶC
  • H1: ρ < 0 (“hệ số population correlation coefficient nhỏ hơn 0; có thể tồn tại mối tương quan âm”)

trong đó ρ là hệ số population correlation coefficient.

Thiết lập dữ liệu

Bộ dữ liệu cần thiết cho phân tích phải chứa ít nhất hai biến liên tục, được đo ở thang đo, và mỗi biến đại diện cho một đặc trưng khác nhau của các đơn vị quan sát. Mỗi quan sát (đơn vị) phải được trình bày trên một hàng riêng biệt. Trong trường hợp dữ liệu lặp lại cho cùng một đơn vị quan sát, dữ liệu cần được định hình lại theo cấu trúc “wide format” trước khi tiến hành phân tích tương quan.

2. Hướng dẫn phân tích tương quan Pearson trong SPSS

Để thực hiện phân tích tương quan Pearson trong SPSS, cần thực hiện các bước như sau:

Buớc 0: Tính toán giá trị của biến đại diện cho nhân tố bằng cách tính trung bình tất cả các biến quan sát của nhân tố đó. Lưu ý chỉ tính cho những biến được hình thành từ ma trận xoay EFA. Ta vào Transform > Compute Variables, sau đó nhập tên biến cần tính và công thức ở ô bên phải bằng hàm MEAN(biến 1, biến 2,…), làm lần lượt cho từng biến, sau đó nhấn OK để quay lại giao diện ban đầu.

Huong Dan Phan Tich Tuong Quan Pearson Trong Spss 1

Xem thêm: Phân tích nhân tố khám phá EFA trong SPSS: 7 bước phải biết

Bước 1: Chọn Analyze > Correlate > Bivariate

Huong Dan Phan Tich Tuong Quan Pearson Trong Spss 2

Chọn Analyze > Correlate > Bivariate

Bước 2: Cửa sổ “Bivariate Correlations” sẽ hiển thị, cho phép bạn chỉ định các biến cần phân tích. Danh sách tất cả các biến trong tập dữ liệu sẽ được liệt kê ở khung bên trái. Để đưa các biến vào phân tích, hãy chọn chúng và nhấp vào nút mũi tên để di chuyển chúng sang khung “Variables“.

Lưu ý: Để tiện cho việc đọc hiểu kết quả, hãy đưa biến phụ thuộc lên đầu tiên (trong hình minh họa là biến RI) và sau đó là các biến độc lập

Huong Dan Phan Tich Tuong Quan Pearson Trong Spss 3

Di chuyển các biến sang khung “Variables”

  • Variables: Các biến được sử dụng trong Phân tích tương quan Pearson hai biến. Bạn phải chọn ít nhất hai biến liên tục, nhưng có thể chọn nhiều hơn hai. Bài kiểm tra sẽ tạo ra hệ số tương quan cho từng cặp biến trong danh sách này.
  • Correlation Coefficients: Có nhiều loại hệ số tương quan. Theo mặc định, Pearson được chọn. Việc chọn Pearson sẽ tạo ra số liệu thống kê kiểm tra cho Hệ số tương quan Pearson hai biến.
  • Test of Significance: Nhấp vào Two-tailed hoặc One-tailed, tùy thuộc vào kiểm tra ý nghĩa mong muốn của bạn. Theo mặc định, SPSS sử dụng kiểm tra hai đuôi
  • Flag significant correlations: Việc kích hoạt tùy chọn này sẽ hiển thị các dấu hoa thị (**) cạnh các hệ số tương quan có ý nghĩa thống kê ở mức alpha = 0.05 và 0.01. Mức alpha = 0.001 sẽ được coi tương đương với mức alpha = 0.01 trong trường hợp này.
  • Options: Nhấp vào Options sẽ mở một cửa sổ nơi bạn có thể chỉ định Statistics nào cần đưa vào (tức là Means and standard deviations, Cross-product deviations and covariances) và cách xử lý Missing Values (tức là Loại trừ các trường hợp theo cặp hoặc Loại trừ các trường hợp theo danh sách).
Huong Dan Phan Tich Tuong Quan Pearson Trong Spss 4

Hộp thoại Options

Bước 3: Nhấp OK để tiến hành phân tích

3. Đọc kết quả trong phân tích tương quan Pearson

Kết quả sẽ hiển thị các mối tương quan trong bảng Correlations. Ý nghĩa của các ký hiệu trong bảng này: Pearson Correlation là hệ số tương quan Pearson (r), Sig. (2-tailed) là giá trị sig của kiểm định t đánh giá hệ số tương quan Pearson có ý nghĩa thống kê hay không, N là cỡ mẫu.

Huong Dan Phan Tich Tuong Quan Pearson Trong Spss 5 1

Kết quả phân tích tương quan Pearson trong SPSS

Chúng ta sẽ xem xét hai loại mối quan hệ tương quan: tương quan giữa biến phụ thuộc với các biến độc lập và tương quan giữa các biến độc lập với nhau. Sở dĩ việc chia ra như vậy, vì sự kỳ vọng về kết quả sẽ có đôi chút khác biệt giữa hai loại mối quan hệ này.

3.1 Tương quan giữa biến độc lập với biến phụ thuộc

Trong bảng kết quả bên trên là các giá trị sig nằm trong vùng tô màu đỏ. Khi xây dựng mô hình nghiên cứu chúng ta đã tìm hiểu rất kỹ để tìm ra các biến độc lập có sự tác động lên biến phụ thuộc. Việc đưa ra các biến độc lập này dựa trên nền tảng cơ sở lý thuyết, các nghiên cứu tương tự trước đó và sự đánh giá tình hình thực tế tại môi trường khảo sát. Do đó, chúng ta kỳ vọng rằng kết quả phân tích từ dữ liệu sẽ cho thấy các biến độc lập có sự tương quan với biến phụ thuộc hoặc có sự tác động lên biến phụ thuộc. Nếu chúng ta thực hiện phân tích tương quan trước hồi quy, kết quả từ tương quan Pearson cho thấy biến độc lập có tương quan với biến phụ thuộc, khả năng biến độc lập đó sẽ tác động lên biến phụ thuộc ở hồi quy sẽ cao hơn.
Trong bảng kết quả ví dụ, sig kiểm định t tương quan Pearson các giữa 5 biến độc lập PP, PS, COO, CS, BL với biến phụ thuộc RI đều nhỏ hơn 0.05. Như vậy, có mối liên hệ tuyến tính giữa các biến độc lập này với biến phụ thuộc.

Kỳ vọng: sig tương quan giữa độc lập với phụ thuộc nhỏ hơn 0.05 và hệ số tương quan càng cao càng tốt.

3.2 Tương quan giữa các biến độc lập với nhau

Trong bảng kết quả trên, các giá trị sig nằm ở các hàng không nằm trong vùng tô màu đỏ. Tên gọi “biến độc lập” phản ánh kỳ vọng rằng các biến này không có sự liên quan với nhau. Nếu giữa hai biến độc lập có sự tương quan quá mạnh, có thể chúng thực chất chỉ là một biến hoặc cùng thể hiện một khái niệm. Khi hai biến độc lập không có tương quan (sig lớn hơn 0.05), khả năng xảy ra cộng tuyến giữa chúng là rất thấp. Ngược lại, nếu hai biến có tương quan (sig nhỏ hơn 0.05) và hệ số tương quan tuyệt đối lớn hơn 0.7, thì khả năng xảy ra cộng tuyến giữa chúng là khá cao (theo nghiên cứu của Carsten F. Dormann và cộng sự, 2013).

Cần lưu ý rằng khi đánh giá đa cộng tuyến, nên kết hợp hệ số tương quan Pearson ở bước này với chỉ số VIF trong phân tích hồi quy tuyến tính để có được kết quả đánh giá chính xác nhất. Bạn có thể tham khảo thêm về cách đánh giá VIF và biện pháp khắc phục trong bài viết chuyên sâu.

Xem thêm: Đa cộng tuyến: Nguyên nhân, dấu hiệu nhận biết và cách khắc phục.

Kỳ vọng: (1) sig tương quan giữa các biến độc lập lớn hơn 0.05 hoặc (2) sig nhỏ hơn 0.05 và hệ số tương quan sẽ càng thấp càng tốt (nên dưới 0.7).

3.3 Cách đọc ý nghĩa 2 dòng cuối trong kết quả Pearson

Khi sig nhỏ hơn 0.05 thì chỗ hệ số tương quan Pearson chúng ta sẽ thấy ký hiệu * hoặc **.
Ký hiệu ** cho biết rằng cặp biến này có sự tương quan tuyến tính ở mức tin cậy đến 99% (tương ứng mức ý nghĩa 1% = 0.01).
Ký hiệu * cho biết rằng cặp biến này có sự tương quan tuyến tính ở mức tin cậy đến 95% (tương ứng mức ý nghĩa 5% = 0.05).

——

Việc phân tích tương quan Pearson đòi hỏi những điều kiện nhất định liên quan đến chất lượng của dữ liệu, mẫu khảo sát và các chỉ số trước đó. Vì vậy bạn sẽ cần mất nhiều thời gian để điều chỉnh cho phù hợp với nghiên cứu của mình. Bạn có thể tham khảo Dịch vụ chạy SPSS, trong đó bao gồm tất cả chỉ số cần phân tích. Hoặc bạn có thể trực tiếp liên hệ thông quan fanpage chính thức của xulysolieu.info

Bài viết này hữu ích với bạn?

Bình luận

Bài liên quan
error: Nội dung bản quyền !!