Hướng dẫn 4 bước phân tích hồi quy tuyến tính trong SPSS

Hồi quy tuyến tính là bước quan trọng tiếp theo sau tương quan trong chuỗi các kiểm định SPSS. Trong bài viết bên dưới, Xulysolieu sẽ mách bạn 4 bước thực hiện hồi quy tuyến tính bằng SPSS, cũng như giải thích và báo cáo kết quả từ kết quả nhận được.

1. Định nghĩa hồi quy tuyến tính trong SPSS

Trong quá trình nghiên cứu, chúng ta thường phải kiểm tra các giả thuyết liên quan đến mối quan hệ giữa hai hoặc nhiều biến. Trong trường hợp chỉ có một biến độc lập, chúng ta sử dụng mô hình hồi quy tuyến tính đơn biến (SLR – Simple Linear Regression). Khi có từ hai biến độc lập trở lên, chúng ta áp dụng hồi quy tuyến tính bội (MLR – Multiple Linear Regression). MLR là mô hình mở rộng của SLR, cho phép xem xét tương quan giữa một biến phụ thuộc và nhiều biến độc lập.

Hướng Dẫn Phân Tích Hồi Quy Tuyến Tính Trong Spss 26

Hướng dẫn phân tích hồi quy tuyến tính trong SPSS 26

Các phần tiếp theo trong bài viết này sẽ tập trung vào hồi quy tuyến tính bội, nhưng hồi quy tuyến tính đơn biến cũng có tính chất tương tự với hồi quy bội. Phương trình cụ thể cho 2 dạng như bên dưới:

– Phương trình hồi quy tuyến tính đơn biến (SLR): Y = β0 + β1X + e

– Phương trình hồi quy tuyến tính bội (MLR): Y = β0 + β1X1 + β2X2 + … + βnXn + e

Với mục tiêu là tìm các hệ số β0​ và β1​ sao cho mô hình phù hợp với dữ liệu quan sát. Trong đó:

  • Y: biến phụ thuộc, là biến nhận tác động của (các) biến khác.
  • X, X1, X2, Xn: (các) biến độc lập, là biến tác động lên biến khác.
  • β0: hằng số hồi quy, hay còn được gọi là hệ số chặn.
    • Hằng số hồi quy ( β0) là giá trị của biến phụ thuộc Y khi tất cả các biến độc lập X đều bằng 0. Nói cách khác, nếu không có sự ảnh hưởng của bất kỳ biến nào, giá trị của Y sẽ là β0.
    • Khi chúng ta biểu diễn hàm hồi quy trên đồ thị hai chiều (đồ thị Oxy), điểm β0 là điểm mà đường hồi quy cắt qua trục Oy. Nó cho chúng ta cái nhìn về giá trị ban đầu của biến phụ thuộc khi không có ảnh hưởng từ các biến độc lập.
  • β1β2, βn: hệ số hồi quy, hay còn được gọi là hệ số góc.
    • Hệ số hồi quy (βi) (với (i = 1, 2, …, n) là chỉ số cho biết mức thay đổi của biến phụ thuộc Y do biến độc lập Xi tương ứng gây ra. Nói cách khác, βi cho chúng ta biết có bao nhiêu đơn vị Y sẽ thay đổi nếu Xi tăng hoặc giảm một đơn vị.
    • Khi biểu diễn trên đồ thị hai chiều, hệ số hồi quy (βi) là độ dốc của đường hồi quy liên quan đến biến Xi. Điều này giúp chúng ta hiểu về mức độ ảnh hưởng của từng biến độc lập đối với biến phụ thuộc.
  • e: sai số, hay thường được hiểu dưới dạng sai số trong hồi quy tổng thể. Nó là sự sai lệch giữa giá trị dự đoán của mô hình hồi quy và giá trị thực tế. Chỉ số này càng lớn, khả năng dự đoán của mô hình trở nên kém chính xác hơn hoặc sai lệch nhiều hơn so với thực tế.
    • Sai số trong hồi quy tổng thể: Đây là sự sai lệch giữa giá trị dự đoán của mô hình và giá trị thực tế trên toàn bộ dữ liệu. Nó phản ánh khả năng dự đoán của mô hình trên tất cả các quan sát.
    • Sai số phần dư trong hồi quy mẫu: Đây là sự sai lệch giữa giá trị dự đoán của mô hình và giá trị thực tế trên từng quan sát cụ thể trong mẫu dữ liệu. Sai số này bao gồm hai thành phần:
      • Các biến độc lập ngoài mô hình: Đây là sự ảnh hưởng của các biến không được bao gồm trong mô hình hồi quy tuyến tính.
      • Các sai số ngẫu nhiên: Đây là sai số không thể dự đoán được, phụ thuộc vào yếu tố ngẫu nhiên và các yếu tố không xác định khác.

Trong thống kê, chúng ta thường muốn đánh giá thông tin về tổng thể, tuy nhiên vì tổng thể thường quá lớn để thu thập toàn bộ dữ liệu, chúng ta không thể có được thông tin này một cách trực tiếp. Vì vậy, chúng ta sử dụng thông tin từ mẫu nghiên cứu để ước lượng hoặc kiểm định thông tin của tổng thể.

Trong hồi quy tuyến tính, các hệ số hồi quy tổng thể như β1β2, βn hay hằng số hồi quy β0 là những tham số chúng ta quan tâm và muốn biết. Tuy nhiên, chúng không thể đo lường trực tiếp được. Do đó, chúng ta sử dụng tham số tương ứng từ mẫu để ước lượng và từ đó suy diễn ra thông tin về tổng thể.

Phương trình hồi quy tuyến tính trên mẫu nghiên cứu có dạng:

Y = B0 + B1X1 + B2X2 + … + BnXn + ε

Trong đó:

  • Y: biến phụ thuộc
  • X, X1, X2, Xn: biến độc lập
  • B0: hằng số hồi quy
  •  B1, B2, Bn: hệ số hồi quy
  • ε: phần dư

Tất cả các nội dung hồi quy tiếp sau đây chỉ nói về hồi quy tuyến tính trên tập dữ liệu mẫu. Do vậy, thuật ngữ sai số sẽ không được đề cập mà chỉ nói về phần dư. Nếu 2 hoặc nhiều biến có mối tương quan với nhau, thì ta có thể dùng mô hình hồi quy tuyến tính để phân tích mối quan hệ nhân quả của chúng. Trong đó, có một bên là biến phụ thuộc (biến được giải thích – Y) và một bên là (các) biến độc lập (biến giải thích – X).

2. Ước lượng hồi quy tuyến tính bằng OLS

Một trong các phương pháp ước lượng hồi quy tuyến tính phổ biến là bình phương nhỏ nhất OLS (Ordinary Least Squares). Mục tiêu của OLS là làm cho biến thiên phần dư trong phép hồi quy là nhỏ nhất. 

Nguyên tắc khi biểu diễn trên mặt phẳng Oxy, đường hồi quy OLS là một đường thẳng đi qua đám đông các điểm dữ liệu. Đường hồi quy OLS được xác định sao cho khoảng cách từ các điểm dữ liệu đến đường hồi quy (trị tuyệt đối của ε) là ngắn nhất.

Trong tổng thể, sai số được ký hiệu là (e). Đây là sự sai lệch giữa giá trị dự đoán của mô hình hồi quy tuyến tính và giá trị thực tế. Sai số phản ánh sự không hoàn hảo của mô hình trong việc dự đoán.

Còn trong mẫu nghiên cứu, sai số lúc này được gọi là phần dư (residual) và được ký hiệu là ε. Phần dư là sự sai lệch giữa giá trị dự đoán của mô hình và giá trị thực tế trên từng quan sát cụ thể. Biến thiên phần dư tính bằng tổng bình phương của tất cả các phần dư.

1. Phan Tich Hoi Quy Da Bien Spss E1720683272907

Ước lượng hồi quy tuyến tính bằng OLS trong SPSS

Đồ thị phân tán scatter biểu diễn mối quan hệ giữa các biến độc lập và biến phụ thuộc. Các điểm dữ liệu sẽ nằm phân tán trên đồ thị, nhưng có xu hướng chung tạo thành một đám đông. Điều này thể hiện xu hướng tổng quát của dữ liệu.

Trong hồi quy tuyến tính, chúng ta cố gắng tìm ra đường thẳng mô tả sát nhất xu hướng dữ liệu. Có rất nhiều đường hồi quy có thể đi qua đám đông các điểm dữ liệu, không chỉ một đường duy nhất. Bình phương nhỏ nhất OLS sẽ tìm ra đường thẳng đó dựa trên nguyên tắc cực tiểu hóa khoảng cách từ các điểm dữ liệu đến đường hồi quy. Trong hình ở trên đường màu đỏ là đường hồi quy OLS.

3. Các bước phân tích hồi quy tuyến tính trong SPSS

Kiểm tra giả định hồi quy

Hồi quy tuyến tính là một công cụ phân tích dữ liệu mạnh mẽ trong SPSS, tuy nhiên để đảm bảo kết quả chính xác và đáng tin cậy, cần kiểm tra các giả định trước khi áp dụng mô hình. 

Việc kiểm tra giả định đảm bảo rằng dữ liệu bạn sử dụng phù hợp với mô hình hồi quy tuyến tính, từ đó mang lại kết quả chính xác và có ý nghĩa thống kê. Bỏ qua bước kiểm tra này có thể dẫn đến những sai lệch nghiêm trọng trong phân tích.

(1) Biến phụ thuộc là biến liên tục: Biến phụ thuộc (Y) phải được đo lường trên thang đo liên tục, có thể có giá trị tăng giảm bất kỳ trong phạm vi cho phép. Ví dụ: điểm thi, thời gian học tập, thu nhập,…

(2) Biến độc lập là biến liên tục: Biến độc lập (X) cũng phải được đo lường trên thang đo liên tục, có thể có giá trị tăng giảm bất kỳ trong phạm vi cho phép. Ví dụ: số giờ học tập, mức độ tập trung, chi phí quảng cáo,…

(3) Mối quan hệ tuyến tính: Mối quan hệ giữa biến phụ thuộc và biến độc lập phải là mối quan hệ tuyến tính. Điều này có nghĩa là khi biến độc lập thay đổi, biến phụ thuộc sẽ thay đổi theo một tỷ lệ tương đối không đổi.

(4) Không có giá trị ngoại lệ: Dữ liệu không được phép có giá trị ngoại lệ, là những điểm dữ liệu khác biệt hoàn toàn so với phần còn lại của tập dữ liệu.

(5) Độc lập: Các giá trị của lỗi độc lập với nhau. Điều này có nghĩa là lỗi ở một đơn vị quan sát không ảnh hưởng đến lỗi ở các đơn vị quan sát khác.

(6) Phương sai đồng nhất: Phương sai của lỗi không đổi ở tất cả các mức giá trị của biến độc lập.

(7) Phân phối chuẩn của lỗi: Lỗi theo phân phối chuẩn với trung bình bằng 0.

Thao tác chạy hồi quy tuyến tính trong SPSS chi tiết

Ví dụ: Một sinh viên muốn xác định mối quan hệ giữa “Các yếu tố liên quan đến sản phẩm sữa Fami” (biến độc lập) và “Quyết định chấp nhận sản phẩm Fami” (biến phụ thuộc)

– Tạo các biến để có thể nhập dữ liệu của: Các yếu tố liên quan đến sản phẩm (biến độc lập) và Quyết định chấp nhận sản phẩm Fami (biến phụ thuộc). 

– Tạo biến số thứ ba (case number): Biến này (có thể không cần thiết) lưu trữ số thứ tự của mỗi trường hợp (bản ghi dữ liệu). Biến này có thể hữu ích khi cần loại bỏ các trường hợp ngoại lệ trong quá trình phân tích.

Để thực hiện phân tích hồi quy tuyến tính bội theo phương pháp OLS để đánh giá sự tác động của các biến độc lập lên biến phụ thuộc, chúng ta làm như sau:

Bước 1:

Trong giao diện SPSS, nhấp vào Analyze > Regression > Linear trên menu trên cùng, như hiển thị bên dưới:

Phan Tich Hoi Quy Da Bien Spss 2 E1720698131903

Nhấp vào Analyze > Regression > Linear

Bạn sẽ thấy hộp thoại Linear Regression:

Phan Tich Hoi Quy Da Bien Spss 3 E1720698186158

Hộp thoại Linear Regression

Bước 2:

Chuyển các biến độc lập vào hộp Independent(s), và biến phụ thuộc vào hộp Dependent: Bạn có thể thực hiện việc này bằng cách kéo và thả các biến hoặc sử dụng các nút mũi tên Right thích hợp. Bạn sẽ thấy màn hình sau:

Phan Tich Hoi Quy Da Bien Spss 4 E1720698248638

Chuyển các biến độc lập và biến phụ thuộc vào

Bước 3:

Tiếp tục kiểm tra các giả định: Không có giá trị ngoại lệ; Độc lập; Phương sai đồng nhất; Phân phối chuẩn của lỗi.

Sử dụng các tính năng trong hộp Statistics, tích chọn các mục như trong hình minh họa và chọn Continue.

Phan Tich Hoi Quy Da Bien Spss 5 E1720698296329

Sử dụng các tính năng trong hộp Statistics

Tiếp tục chọn vào hộp Plots, tích chọn vào mục Histogram và mục Normal probability plot, kéo thả biến ZRESID vào ô Y, kéo thả biến ZPRED vào ô X như hình minh họa bên dưới. Sau đó chọn Continue.

Phan Tich Hoi Quy Da Bien Spss 6 E1720698327579

Tick các tùy chọn trong hộp Plots

Bước 4:

Quay lại giao diện ban đầu, chúng ta có mục Method để xác định phương pháp đưa biến vào mô hình hồi quy tuyến tính. Tùy thuộc vào dạng nghiên cứu, bạn có thể chọn Enter hoặc Stepwise. Trong trường hợp đề tài thực hành và mục tiêu là nghiên cứu khẳng định, Xulysolieu đề xuất bạn chọn phương pháp Enter để đưa tất cả các biến vào mô hình một lượt. Sau đó, hãy nhấp vào nút OK để tiến hành chạy hồi quy tuyến tính.

Phan Tich Hoi Quy Da Bien Spss 7 E1720698445964

Chọn phương pháp Enter và nhất nút OK

4. Đọc kết quả hồi quy tuyến tính trong SPSS

Phần mềm SPSS sẽ tạo ra khá nhiều bảng và biểu đồ đầu ra cho hồi quy tuyến tính. Trong phần này, Xulysolieu chỉ cho bạn thấy 3 bảng chính cần thiết bao gồm ANOVA, Model Summary, Coefficients và 3 biểu đồ Histogram, Normal P-P Plot, Scatter Plot để hiểu kết quả của bạn từ quy trình chạy hồi quy tuyến tính, giả sử rằng không có giả định nào bị vi phạm.

Bảng Model Summary

Trong phân tích hồi quy tuyến tính, chúng ta thường đối mặt với sự phân tán của các điểm dữ liệu. Thực tế là hầu như không có đường thẳng nào có thể đi qua toàn bộ tất cả các điểm dữ liệu một cách hoàn hảo. Điều này tạo ra sự sai lệch giữa các giá trị ước tính và các giá trị thực tế.

Để đánh giá mức độ sai lệch và phù hợp của mô hình hồi quy tuyến tính, chúng ta cần tính toán các chỉ số đánh giá như sai số chuẩn (standard error), hệ số xác định (coefficient of determination), và kiểm tra giả thuyết về các hệ số hồi quy. Những thông số này giúp chúng ta hiểu rõ hơn về hiệu suất của mô hình và đưa ra quyết định phù hợp.

Một thước đo sự phù hợp của mô hình hồi quy tuyến tính thường dùng là hệ số xác định R2 (R square). Khi phần lớn các điểm dữ liệu tập trung sát vào đường hồi quy, giá trị R2 sẽ cao, ngược lại, nếu các điểm dữ liệu phân bố rải rác cách xa đường hồi quy, R2 sẽ thấp.

Phan Tich Hoi Quy Da Bien Spss 8 E1720698536970

Khác nhau giữa giá trị R2 cao và thấp

Bảng Model Summary chứa các chỉ số thường được sử dụng để đánh giá sự phù hợp của mô hình hồi quy tuyến tính với ý nghĩa:

Hệ số Durbin–Watson (DW): đánh giá hiện tượng tự tương quan chuỗi bậc nhất (kiểm định tương quan của các sai số kề nhau). DW có giá trị biến thiên trong khoảng từ 0 đến 4 (Yahua Qiao, 2011), cụ thể hơn:

+ DW dao động xung quanh mức 2: Các phần dư không có tương quan chuỗi bậc nhất với nhau.

+ DW dao động về mức 0: Giá trị DW càng nhỏ, gần về 0 có nghĩa là phần dư có tương quan thuận.

+ DW dao động về mức 4: Giá trị DW càng lớn, gần về 4 có nghĩa là phần dư có tương quan nghịch.

Hệ số tương quan Pearson (R): đo lường mức độ tương quan tuyến tính giữa biến phụ thuộc (Y) và biến độc lập (X) với ngưỡng giá trị từ 0 đến 1, cụ thể:

+ R = 0: Biến Y và X hoàn toàn không tương quan với nhau.

+ 0 < R < 1: Biến Y và X tương quan dương: Khi X tăng, Y có xu hướng tăng.

+ -1 < R < 0: Biến Y và X tương quan âm: Khi X tăng, Y có xu hướng giảm.

+ R = 1: Biến Y và X tương quan tuyến tính hoàn hảo: Mọi thay đổi trong X đều dẫn đến thay đổi tuyến tính trong Y.

– Hệ số xác định (R2 – R Square) & Hệ số xác định hiệu chỉnh (Adjusted R2 – Adjusted R Square): Thể hiện tỷ lệ phần trăm phương sai của biến phụ thuộc (Y) được giải thích bởi biến độc lập (X) trong mô hình hồi quy tuyến tính. R2 hay R2 hiệu chỉnh đều có mức dao động trong đoạn từ 0 đến 1 với ý nghĩa như sau:

+ R2 càng cao (gần 100%) cho thấy mô hình hồi quy tuyến tính giải thích tốt biến động của Y bởi X.

+ R2 càng thấp (gần 0%) cho thấy mô hình hồi quy tuyến tính giải thích kém biến động của Y bởi X.

Khi chúng ta đưa thêm biến độc lập vào phân tích hồi quy tuyến tính, R2 có xu hướng tăng lên. Điều này dẫn đến một số trường hợp mức độ phù hợp của mô hình hồi quy bị thổi phồng khi chúng ta đưa vào các biến độc lập giải thích rất yếu hoặc không giải thích cho biến phụ thuộc. Trong SPSS, bên cạnh chỉ số R2, chúng ta còn có thêm chỉ số R2 Adjusted (R2 hiệu chỉnh). Chỉ số R2 hiệu chỉnh không nhất thiết tăng lên khi nhiều biến độc lập được thêm vào hồi quy, do đó R2 hiệu chỉnh phản ánh độ phù hợp của mô hình chính xác hơn hệ số R2.

Không có tiêu chuẩn chính xác cho R2 ở mức bao nhiêu thì mô hình mới được chấp nhận về mặt thống kê. Cần lưu ý rằng, không phải luôn luôn một mô hình hồi quy tuyến tính có R2 cao thì nghiên cứu có giá trị cao, mô hình có R2 thấp thì nghiên cứu đó có giá trị thấp, độ phù hợp mô hình hồi quy không có mối quan hệ nhân quả với giá trị của bài nghiên cứu.

Trong nghiên cứu lặp lại, chúng ta thường chọn mức trung gian là 0.5 để phân ra 2 nhánh ý nghĩa mạnh/ý nghĩa yếu và kỳ vọng từ 0.5 đến 1 thì mô hình là tốt, bé hơn 0.5 là mô hình chưa tốt. Tuy nhiên, điều này không thực sự chính xác bởi việc đánh giá giá trị R2 sẽ phụ thuộc rất nhiều vào các yếu tố như lĩnh vực nghiên cứu, tính chất nghiên cứu, cỡ mẫu, số lượng biến tham gia hồi quy, kết quả các chỉ số khác của phép hồi quy,…

Phan Tich Hoi Quy Da Bien Spss 9 E1720698585271

Kết quả bảng Model Summary

Trong hình minh họa ở trên, bảng Model Summary cho chúng ta kết quả R2 hiệu chỉnh bằng 0.776 cho thấy các biến độc lập đưa vào phân tích hồi quy tuyến tính giải thích được 77.6% sự biến thiên của biến phụ thuộc, còn lại 22.4% là do các biến ngoài mô hình và sai số ngẫu nhiên.

Kết quả bảng Model Summary bên trên cũng đưa ra giá trị Durbin–Watson với DW = 2.025, dao động quanh mốc 2 nên kết quả không vi phạm giả định tự tương quan chuỗi bậc nhất.

Đôi khi việc phân tích hồi quy tuyến tính sẽ có khó khăn và mất nhiều thời gian khi chỉ số R2 quá thấp, xảy ra hiện tượng đa cộng tuyến,…Hãy tham khảo ngay dịch vụ chạy SPSS của xulysolieu.info ngay nhé.

Bảng ANOVA

Bảng tiếp theo là bảng ANOVA giúp chúng ta đánh giá độ phù hợp mô hình phương trình hồi quy tuyến tính với dữ liệu (tức là dự đoán biến phụ thuộc) một cách chính xác qua kiểm định giả thuyết. Phép kiểm định F cũng được sử dụng để kiểm định giả thuyết này. Trong đó có các chỉ số:

Sum of Squares (SS):

– Regression (SS): Thể hiện mức độ biến động của Y được giải thích bởi mô hình hồi quy.

– Residual (SS): Thể hiện mức độ biến động của Y không được giải thích bởi mô hình hồi quy.

– Total (SS): Tổng biến động của Y.

Degrees of Freedom (df):

– Regression (df): Số lượng biến độc lập trong mô hình.

– Residual (df): Số lượng quan sát trừ đi số lượng biến trong mô hình.

– Total (df): Số lượng quan sát trừ đi 1.

Mean Square (MS): Bình quân phương sai của mỗi nguồn biến động.

Hệ số F: Thống kê F dùng để kiểm định giả thuyết về ý nghĩa thống kê của mô hình hồi quy.

– H0: Các biến độc lập (X) không có ảnh hưởng đến biến phụ thuộc (Y).

– H1: Các biến độc lập (X) có ảnh hưởng đến biến phụ thuộc (Y).

Hệ số Sig.: Giá trị p-value của thống kê F.

– Nếu Sig. < 0.05: Bác bỏ H0, kết luận các biến độc lập (X) có ảnh hưởng đến biến phụ thuộc (Y) với mức độ tin cậy 95%.

– Nếu Sig. ≥ 0.05: Không đủ bằng chứng để bác bỏ H0, kết luận các biến độc lập (X) có thể không có ảnh hưởng đến biến phụ thuộc (Y).

Phan Tich Hoi Quy Da Bien Spss 10 E1720698635376

Bảng kết quả ANOVA

Bảng ANOVA bên trên cho chúng ta kết quả kiểm định F để đánh giá giả thuyết sự phù hợp của mô hình hồi quy tuyến tính. Giá trị sig kiểm định F bằng 0.000 < 0.05, do đó, mô hình hồi quy là phù hợp.

Bảng Coefficients

Chúng ta sẽ xem xét ý nghĩa của hệ số hồi quy cho từng biến độc lập trong mô hình dựa trên kiểm định T student. Giả thuyết H0 trong trường hợp này là: “Hệ số hồi quy của biến độc lập Xi bằng 0.” Nếu mô hình hồi quy tuyến tính có nhiều biến độc lập, chúng ta sẽ kiểm tra nhiều giả thuyết H0. Cách đọc kết quả kiểm định như sau:

  • Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi khác 0 một cách có ý nghĩa thống kê, biến Xi có tác động lên biến phụ thuộc.
  • Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi bằng 0 một cách có ý nghĩa thống kê, biến Xi không tác động lên biến phụ thuộc.

Trong phân tích hồi quy tuyến tính, thường có hai loại hệ số hồi quy: hệ số chưa chuẩn hóa (được ký hiệu là B trong SPSS) và hệ số đã chuẩn hóa (được ký hiệu là Beta trong SPSS). Mỗi loại hệ số này đóng vai trò khác nhau trong việc diễn giải các kết quả thống kê của mô hình hồi quy. Trong ví dụ này, chúng ta sẽ sử dụng hệ số đã chuẩn hóa để phản ánh ý nghĩa thực tiễn của các biến.

Nếu hệ số hồi quy (B hoặc Beta) có dấu âm, điều đó cho thấy biến độc lập tác động ngược chiều lên biến phụ thuộc. Ngược lại, nếu hệ số B hoặc Beta có dấu dương, điều đó cho thấy biến độc lập tác động cùng chiều lên biến phụ thuộc. Khi xem xét mức độ ảnh hưởng của các biến độc lập lên biến phụ thuộc, chúng ta sẽ dựa vào giá trị tuyệt đối của hệ số Beta. Giá trị tuyệt đối của Beta càng lớn, biến độc lập tác động càng mạnh lên biến phụ thuộc.

Trong SPSS, các số liệu của kiểm định t được lấy từ bảng hệ số hồi quy Coefficients. Đáng lưu ý, nếu một biến độc lập không có ý nghĩa thống kê trong kết quả hồi quy tuyến tính, chúng ta có thể kết luận rằng biến độc lập đó không có ảnh hưởng đáng kể lên biến phụ thuộc mà không cần thực hiện việc loại bỏ biến và phân tích lại hồi quy tuyến tính.

Phan Tich Hoi Quy Da Bien Spss 11 E1720698676163

Kết quả bảng Coefficients

Trong ví dụ ở trên, bảng Coefficients cho chúng ta kết quả kiểm định t để đánh giá giả thuyết ý nghĩa hệ số hồi quy, chỉ số VIF đánh giá đa cộng tuyến và các hệ số hồi quy.

Các biến độc lập gồm CHATLUONG, GIACA, BAOBI, CTKM đều có sig kiểm định t nhỏ hơn 0.05, do đó các biến này đều có ý nghĩa thống kê, đều tác động lên biến phụ thuộc CHAPNHANSP. Hệ số hồi quy các biến độc lập này đều mang dấu dương, như vậy các biến độc lập có tác động thuận chiều lên biến phụ thuộc.

Kết luận các giả thuyết lần lượt:

H1: Chất lượng sản phẩm (CHATLUONG) tác động đến sự hài lòng của nhân viên trong công việc (Chấp nhận)

H2: Giá cả (GIACA) tác động đến Quyết định chấp nhận sản phẩm (Chấp nhận)

H3: Bao bì (BAOBI) tác động đến Quyết định chấp nhận sản phẩm (Chấp nhận)

H4: Chương trình khuyến mãi (CTKM) tác động đến Quyết định chấp nhận sản phẩm (Chấp nhận)

Cũng cần lưu ý rằng trong trường hợp biến không có ý nghĩa trong hồi quy tuyến tính thì không cần loại biến đó và chạy lại phân tích.

Từ các hệ số hồi quy ở trên, chúng ta xây dựng được hai phương trình hồi quy tuyến tính như sau:

  • Dạng chuẩn hóa: Y = 0.205*CHATLUONG + 0.310*BAOBI + 0.209*GIACA + 0.231*CTKM + ε
  • Dạng chưa chuẩn hóa: Y= 0.402 + 0.184*CHATLUONG + 0.293*BAOBI + 0.203*GIACA + 0.212*CTKM + ε

Khi viết phương trình hồi quy tuyến tính, lưu ý rằng:

  • Không đưa biến độc lập không có ý nghĩa thống kê vào phương trình.
  • Nếu biến độc lập có hệ số hồi quy âm, chúng ta sẽ viết dấu trừ trước hệ số hồi quy trong phương trình. 
  • Nhìn vào phương trình chúng ta sẽ có thể xác định ngay được biến độc lập nào tác động mạnh nhất, mạnh thứ hai,…, yếu nhất lên biến phụ thuộc.
  • Luôn có phần dư ε cuối phương trình hồi quy tuyến tính dù là phương trình chuẩn hóa hay chưa chuẩn hóa.

Hệ số phóng đại phương sai (VIF) là một chỉ số dùng để đánh giá hiện tượng đa cộng tuyến trong mô hình hồi quy tuyến tính. VIF càng thấp, khả năng xảy ra đa cộng tuyến càng nhỏ.

Theo Hair và các cộng sự (2009), khi VIF đạt ngưỡng 10 trở lên, hiện tượng đa cộng tuyến mạnh sẽ xuất hiện. Các nhà nghiên cứu nên cố gắng giữ VIF ở mức thấp nhất có thể, vì ngay cả khi VIF đạt mức 5 hoặc 3, hiện tượng đa cộng tuyến nghiêm trọng vẫn có thể xảy ra. Theo Nguyễn Đình Thọ (2010), trong thực tế, nếu VIF > 2, cần cẩn thận vì đã có khả năng xuất hiện đa cộng tuyến gây sai lệch các ước lượng hồi quy tuyến tính.

Cụ thể trong ví dụ ở bảng trên, Hệ số VIF của các biến độc lập đều nhỏ hơn 10 gần mức 5, do vậy dữ liệu không vi phạm giả định đa cộng tuyến.

Đôi khi việc phân tích hồi quy tuyến tính sẽ có khó khăn và mất nhiều thời gian khi chỉ số R2 quá thấp, xảy ra hiện tượng đa cộng tuyến,…Hãy tham khảo ngay dịch vụ chạy SPSS của xulysolieu.info ngay nhé.

Biểu đồ tần số phần dư chuẩn hóa Histogram

Mục đích: Hiểu rõ phân bố của phần dư.

Cách giải thích:

– Phân bố chuẩn: Phần dư phân bố đều đặn quanh đường 0,không có hiện tượng skewness (lép) hoặc kurtosis (béo).

– Phân bố khác chuẩn: Cần xem xét kỹ lưỡng trước khi đưa ra kết luận về mô hình.

Lưu ý: Nên sử dụng biểu đồ mật độ thay cho biểu đồ tần số khi có nhiều dữ liệu. Phần dư có thể không tuân theo phân phối chuẩn vì những lý do như: sử dụng sai mô hình, phương sai không phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích… 

Phan Tich Hoi Quy Da Bien Spss 12 1 1

Biểu đồ tần số phần dư chuẩn hóa Histogram

Cụ thể trong ảnh trên, Mean = 1.39E-15 = 1.39 * 10-15 = 0.00000… xấp xỉ bằng 0, độ lệch chuẩn là 0.984 gần bằng 1. Như vậy có thể nói, phân phối phần dư xấp xỉ chuẩn, giả định phân phối chuẩn của phần dư không bị vi phạm.

Biểu đồ phần dư chuẩn hóa Normal P-P Plot

Mục đích: So sánh phân bố thực tế của phần dư với phân bố chuẩn.

Cách giải thích:
– Điểm dữ liệu nằm gần đường chéo: Phân bố thực tế gần giống phân bố chuẩn.
– Điểm dữ liệu lệch khỏi đường chéo: Phân bố thực tế khác phân bố chuẩn.
Lưu ý: Cần xem xét kết hợp với các biện pháp thống kê khác để đưa ra kết luận chính xác.

Phan Tich Hoi Quy Da Bien Spss 13 1 1

Biểu đồ phần dư chuẩn hóa Normal P-P Plot

Cụ thể trong hình minh họa trên, các điểm dữ liệu phần dư tập trung khá sát với đường chéo. Kết luận, phần dư có phân phối xấp xỉ chuẩn, giả định phân phối chuẩn của phần dư không bị vi phạm.

Biểu đồ Scatter Plot giả định liên hệ tuyến tính

Mục đích: Kiểm tra giả định về mối quan hệ tuyến tính giữa biến phụ thuộc (Y) và biến độc lập (X).
Cách giải thích:
– Mối quan hệ tuyến tính: Điểm dữ liệu xếp xấp xỉ theo đường thẳng.
– Mối quan hệ phi tuyến tính: Điểm dữ liệu không xếp xấp xỉ theo đường thẳng.
Lưu ý: Cần xem xét kỹ lưỡng hình dạng của biểu đồ và sử dụng các phương pháp thống kê khác để xác nhận giả định tuyến tính.

Phan Tich Hoi Quy Da Bien Spss 14 1

Biểu đồ Scatter Plot giả định liên hệ tuyến tính

Cụ thể với kết quả mẫu ở trên, phần dư chuẩn hóa phân bổ tập trung xung quanh đường tung độ 0, do vậy giả định quan hệ tuyến tính không bị vi phạm.

Đôi khi việc phân tích hồi quy tuyến tính sẽ có khó khăn và mất nhiều thời gian khi chỉ số R2 quá thấp, xảy ra hiện tượng đa cộng tuyến,…Hãy tham khảo ngay dịch vụ chạy SPSS của xulysolieu.info ngay nhé.

5/5 - 1 Bình chọn

Bình luận

Bài liên quan
error: Nội dung bản quyền !!