Trong nghiên cứu định lượng, sau khi hoàn thành các bước kiểm định độ tin cậy thang đo, phân tích nhân tố và phân tích tương quan, bước tiếp theo rất thường gặp là hồi quy. Đây là công cụ giúp người nghiên cứu đánh giá mức độ tác động của nhiều biến độc lập lên một biến phụ thuộc. Nếu bạn đang cần tìm một bài viết dễ hiểu về cách phân tích hồi quy đa biến, nội dung dưới đây của xulysolieu.info sẽ giúp bạn nắm từ khái niệm, cách chạy trên SPSS đến cách đọc kết quả và kiểm tra các giả định quan trọng.
Bài viết này được trình bày theo hướng đi thẳng vào thực hành, phù hợp với người đang làm khóa luận, luận văn, nghiên cứu thị trường hoặc xử lý dữ liệu khảo sát. Xử lý số liệu sẽ lần lượt giải thích hồi quy đa biến là gì, cách chạy hồi quy đa biến trong SPSS, cách đọc bảng kết quả và những lưu ý cần biết để tránh diễn giải sai.
Mục lục
ToggleHồi quy đa biến là gì?
Trước khi đi vào cách phân tích hồi quy đa biến, bạn cần hiểu rõ khái niệm. Hồi quy đa biến là phương pháp dùng để xem xét ảnh hưởng đồng thời của nhiều biến độc lập lên một biến phụ thuộc. Trong nhiều tài liệu, phương pháp này còn được gọi là phân tích hồi quy bội hoặc multiple regression SPSS khi thao tác trên phần mềm SPSS.
Ví dụ, nếu bạn muốn kiểm tra mức độ tác động của các yếu tố như tin cậy, đáp ứng, đảm bảo, cảm thông, hữu hình và minh bạch lên sự hài lòng của khách hàng, thì bạn sẽ sử dụng hồi quy đa biến. Kết quả sẽ cho biết biến nào tác động mạnh, biến nào có ý nghĩa thống kê và mô hình giải thích được bao nhiêu phần trăm biến thiên của biến phụ thuộc.
Chính vì vậy, cách phân tích hồi quy đa biến là một kỹ năng rất quan trọng trong nghiên cứu khoa học, đặc biệt với các đề tài khảo sát sử dụng bảng hỏi.
Khi nào nên dùng cách phân tích hồi quy đa biến?

Bạn nên áp dụng cách phân tích hồi quy đa biến khi có một biến phụ thuộc và từ hai biến độc lập trở lên. Các biến này cần có cơ sở lý thuyết rõ ràng và thường đã được kiểm tra qua phân tích tương quan trước đó. Nói cách khác, trước khi chạy hồi quy, bạn không nên bỏ qua bước kiểm tra mối liên hệ tuyến tính giữa các biến.
Trong thực tế, cách phân tích hồi quy đa biến thường được sử dụng để kiểm định mô hình nghiên cứu và các giả thuyết. Đây là bước giúp chuyển từ mô tả dữ liệu sang giải thích mối quan hệ tác động giữa các biến.
Cách chạy hồi quy đa biến trong SPSS
Để thực hiện cách phân tích hồi quy đa biến trên SPSS, bạn vào menu:
Analyze > Regression > Linear

Sau đó, đưa biến phụ thuộc vào ô Dependent và các biến độc lập vào ô Independent(s). Ví dụ, nếu biến phụ thuộc là HAILONG và các biến độc lập gồm TINCAY, DAPUNG, DAMBAO, CAMTHONG, HUUHINH, MINHBACH thì bạn đưa đúng các biến này vào các ô tương ứng.

Tiếp theo, nhấn vào nút Statistics và chọn Collinearity diagnostics. Tùy chọn này giúp SPSS hiển thị thêm các chỉ số như Tolerance và VIF để kiểm tra hiện tượng đa cộng tuyến. Đây là một bước rất quan trọng trong cách chạy hồi quy đa biến trong SPSS vì nếu các biến độc lập tương quan quá cao với nhau, kết quả hồi quy có thể bị sai lệch.

Sau khi thiết lập xong, nhấn OK để chạy mô hình. Đây là thao tác cơ bản nhất trong cách phân tích hồi quy đa biến bằng SPSS theo phương pháp Enter, tức là đưa tất cả biến độc lập vào mô hình cùng một lúc.

Đọc kết quả hồi quy đa biến qua bảng Model Summary
Khi học cách phân tích hồi quy đa biến, bảng đầu tiên bạn cần chú ý là Model Summary. Trong bảng này, chỉ số quan trọng nhất thường là Adjusted R Square, tức hệ số R bình phương hiệu chỉnh.
Ví dụ, nếu Adjusted R Square bằng 0.609 thì có nghĩa là mô hình giải thích được 60.9% sự biến thiên của biến phụ thuộc. Nói đơn giản hơn, các biến độc lập trong mô hình đang giải thích được 60.9% thay đổi của sự hài lòng. Phần còn lại đến từ các yếu tố khác chưa được đưa vào mô hình hoặc do sai số ngẫu nhiên.
Đây là bước rất quan trọng trong đọc kết quả hồi quy đa biến vì nó cho bạn biết mô hình mạnh hay yếu ở mức tổng quát. Tuy nhiên, không nên chỉ dựa vào R bình phương hiệu chỉnh để kết luận toàn bộ mô hình là tốt hay chưa, mà cần xem thêm kiểm định F và các hệ số hồi quy.
Đọc kết quả hồi quy đa biến qua bảng ANOVA
Bảng ANOVA dùng để kiểm định mức độ phù hợp chung của mô hình. Trong cách phân tích hồi quy đa biến, bạn cần quan tâm đến giá trị F và Sig.
Nếu kết quả cho thấy F có giá trị đủ lớn và Sig. nhỏ hơn 0.05, điều đó chứng tỏ mô hình hồi quy có ý nghĩa thống kê. Nói cách khác, tập hợp các biến độc lập đưa vào mô hình có tác động đến biến phụ thuộc khi xét trên tổng thể.
Ví dụ, nếu F = 26.746 và Sig. = 0.000 thì có thể kết luận mô hình phù hợp với dữ liệu nghiên cứu. Đây là một phần cốt lõi trong kiểm định hồi quy đa biến vì nó cho thấy mô hình không phải được tạo ra do ngẫu nhiên.
Đọc kết quả hồi quy đa biến qua bảng Coefficients
Đây là bảng quan trọng nhất khi thực hiện cách phân tích hồi quy đa biến. Bảng Coefficients cho biết từng biến độc lập có tác động như thế nào đến biến phụ thuộc.
Ở bảng này, bạn cần chú ý các cột gồm hệ số B, Sig., Tolerance và VIF.
Ý nghĩa của hệ số B
Hệ số B cho biết mức thay đổi của biến phụ thuộc khi biến độc lập tăng một đơn vị, trong điều kiện các biến khác giữ nguyên. Ví dụ, nếu hệ số B của TINCAY là 0.215 thì có thể diễn giải rằng khi TINCAY tăng 1 đơn vị, HAILONG tăng trung bình 0.215 đơn vị.
Trong cách phân tích hồi quy đa biến, hệ số B còn giúp bạn viết phương trình hồi quy. Dựa vào đó, bạn có thể mô hình hóa mối quan hệ giữa các biến trong nghiên cứu.
Ý nghĩa của cột Sig.
Cột Sig. dùng để kiểm định từng giả thuyết riêng lẻ. Nếu Sig. của một biến nhỏ hơn 0.05 thì biến đó có tác động có ý nghĩa thống kê đến biến phụ thuộc. Ngược lại, nếu Sig. lớn hơn 0.05 thì chưa đủ cơ sở kết luận biến đó có ảnh hưởng trong mô hình.
Đây là phần không thể bỏ qua khi đọc kết quả hồi quy đa biến vì nhiều người chỉ nhìn hệ số B mà quên xem biến đó có thật sự có ý nghĩa thống kê hay không.
So sánh mức độ ảnh hưởng giữa các biến
Khi làm cách phân tích hồi quy đa biến, nhiều người muốn biết yếu tố nào tác động mạnh nhất. Trong trường hợp này, bạn nên xem hệ số chuẩn hóa Beta để so sánh tương đối giữa các biến. Nếu chỉ nhìn hệ số B chưa chắc đã phản ánh đúng mức độ ảnh hưởng vì đơn vị đo của các biến có thể khác nhau.
Tuy vậy, trong nhiều bài nghiên cứu cơ bản, người viết vẫn thường dùng hệ số B để giải thích chiều tác động và dùng Beta để so sánh mức độ ảnh hưởng giữa các biến.
Kiểm tra đa cộng tuyến trong cách phân tích hồi quy đa biến
Một bước rất quan trọng khác trong cách phân tích hồi quy đa biến là kiểm tra đa cộng tuyến. Đây là hiện tượng các biến độc lập có tương quan quá mạnh với nhau, làm cho mô hình trở nên kém ổn định.
Để kiểm tra, bạn xem cột VIF hoặc Tolerance trong bảng Coefficients. Về lý thuyết, nếu VIF lớn hơn 10 thì có thể nghi ngờ đa cộng tuyến nghiêm trọng. Tuy nhiên, trong thực hành, nhiều người thận trọng hơn và thường so sánh VIF với ngưỡng 2 hoặc 5.
Nếu toàn bộ VIF đều nhỏ hơn 2 thì có thể yên tâm rằng mô hình không có hiện tượng đa cộng tuyến đáng kể. Vì VIF là nghịch đảo của Tolerance nên bạn chỉ cần xem một trong hai chỉ số là đủ.
Đây là nội dung rất quan trọng trong kiểm định hồi quy đa biến vì nếu bỏ qua đa cộng tuyến, kết quả ước lượng có thể thiếu tin cậy.
Phần nâng cao trong cách phân tích hồi quy đa biến
Sau khi chạy mô hình cơ bản, bạn nên kiểm tra thêm các giả định hồi quy để đảm bảo mô hình có ý nghĩa. Trong SPSS, tại cửa sổ Linear Regression, bạn nhấn vào Plots rồi đưa *ZRESID vào ô Y và *ZPRED vào ô X. Sau đó chọn Histogram và Normal Probability Plot.
Việc này giúp SPSS tạo ra ba biểu đồ quan trọng để kiểm tra giả định của mô hình.

Histogram của phần dư

Biểu đồ này dùng để xem phần dư chuẩn hóa có phân phối gần chuẩn hay không. Nếu biểu đồ có dạng gần giống hình chuông, giá trị Mean xấp xỉ 0 và độ lệch chuẩn xấp xỉ 1 thì có thể xem giả định phân phối chuẩn của phần dư là đạt.
Trong cách phân tích hồi quy đa biến, đây là bước giúp đánh giá xem sai số của mô hình có phù hợp với giả định thống kê hay không.
Normal P-P Plot

Biểu đồ này kiểm tra mức độ bám sát của phần dư chuẩn hóa với phân phối chuẩn kỳ vọng. Nếu các điểm nằm gần đường chéo, có thể kết luận phần dư phân phối gần chuẩn. Đây là một trong những cách trực quan nhất để đọc kết quả hồi quy đa biến ở phần giả định.
Scatterplot giữa ZRESID và ZPRED

Biểu đồ phân tán này giúp kiểm tra giả định liên hệ tuyến tính và phần nào hỗ trợ xem xét phương sai sai số có ổn định hay không. Nếu các điểm phân bố ngẫu nhiên, không tạo thành hình mẫu rõ rệt, thì có thể xem giả định tuyến tính không bị vi phạm.
Khi thực hiện cách phân tích hồi quy đa biến nghiêm túc, bạn không nên dừng lại ở bảng Coefficients mà cần kiểm tra thêm các giả định hồi quy như vậy.
Một số lưu ý trước khi chạy hồi quy đa biến
Để cách phân tích hồi quy đa biến cho kết quả đáng tin cậy hơn, bạn nên nhớ một số điểm sau. Thứ nhất, trước khi hồi quy cần phân tích tương quan để xác định có mối liên hệ tuyến tính giữa các biến. Thứ hai, các biến độc lập đưa vào mô hình nên là các nhân tố đã được rút trích và kiểm định từ các bước trước như Cronbach’s Alpha và EFA. Thứ ba, cần thống nhất mức ý nghĩa thống kê, phổ biến nhất là 5%.
Ngoài ra, bạn cũng nên hiểu rằng multiple regression SPSS không tự động làm cho nghiên cứu đúng hơn. Phần mềm chỉ hỗ trợ tính toán, còn việc lựa chọn mô hình, diễn giải kết quả và kết luận khoa học vẫn phụ thuộc vào người nghiên cứu.
Kết luận
Cách phân tích hồi quy đa biến là một bước rất quan trọng trong phân tích dữ liệu định lượng vì nó giúp kiểm định mô hình nghiên cứu và đánh giá tác động của nhiều yếu tố lên một biến phụ thuộc. Khi nắm được hồi quy đa biến là gì, biết cách chạy hồi quy đa biến trong SPSS, hiểu cách đọc kết quả hồi quy đa biến qua các bảng Model Summary, ANOVA, Coefficients và biết kiểm tra các giả định hồi quy, bạn sẽ chủ động hơn rất nhiều trong quá trình xử lý số liệu.
Hy vọng bài viết này đã giúp bạn hiểu rõ hơn về cách phân tích hồi quy đa biến theo hướng dễ áp dụng, dễ diễn giải và phù hợp với người đang làm nghiên cứu. Nếu bạn cần hỗ trợ thêm về phân tích hồi quy bội, kiểm định hồi quy đa biến hoặc các kỹ thuật xử lý dữ liệu khác, bạn có thể tham khảo thêm tại xulysolieu.info hoặc liên hệ Xử lý số liệu qua số 0878968468.









