Trong nghiên cứu khoa học định lượng, các phương pháp phân tích dữ liệu đóng vai trò nền tảng để kiểm định giả thuyết và rút ra kết luận có giá trị học thuật. Trong số đó, hồi quy, SEM (Structural Equation Modeling) là hai kỹ thuật được sử dụng phổ biến nhất. Hồi quy tuyến tính cho phép đánh giá tác động của các biến độc lập lên biến phụ thuộc, trong khi SEM mở rộng hơn, giúp phân tích đồng thời nhiều mối quan hệ phức tạp và kiểm định mức độ phù hợp của toàn bộ mô hình nghiên cứu.
Tuy nhiên, trong quá trình phân tích, các nhà nghiên cứu thường gặp phải một tình huống quen thuộc: một số biến độc lập không đạt ý nghĩa thống kê (p-value > 0.05). Điều này đặt ra câu hỏi quan trọng: Liệu có cần loại bỏ những biến không có ý nghĩa đó và chạy lại mô hình hay không?
Đây là vấn đề không chỉ liên quan đến kỹ thuật phân tích mà còn ảnh hưởng đến cách diễn giải và bảo vệ cơ sở lý thuyết của nghiên cứu. Bài viết này sẽ làm rõ quan điểm: biến không có ý nghĩa trong hồi quy, SEM không nhất thiết phải loại bỏ, và lý giải chi tiết vì sao.
Mục lục
Toggle1. Chức năng chính của hồi quy, SEM
Để hiểu rõ vì sao không cần loại bỏ biến không có ý nghĩa, trước hết chúng ta phải nhìn lại chức năng cốt lõi của hồi quy, SEM trong nghiên cứu khoa học.
1.1. Hồi quy – công cụ phân tích tác động trực tiếp
Hồi quy tuyến tính, đặc biệt là hồi quy tuyến tính bội, được sử dụng để kiểm định xem các biến độc lập (X1, X2, …, Xn) có ảnh hưởng như thế nào đến biến phụ thuộc (Y). Kết quả hồi quy thường cung cấp:
- Hệ số hồi quy (β): mức độ và chiều tác động của từng biến độc lập.
- p-value (sig): giúp kết luận biến có ý nghĩa thống kê hay không.
- R²: cho biết tỷ lệ biến thiên của Y được giải thích bởi các biến X.
👉 Chức năng quan trọng nhất của hồi quy là kiểm định giả thuyết: biến độc lập có thật sự ảnh hưởng đến biến phụ thuộc hay không.
1.2. SEM – mở rộng phân tích mô hình đường dẫn
SEM (Structural Equation Modeling) được coi là một bước tiến so với hồi quy vì:
- Cho phép kiểm định nhiều mối quan hệ cùng lúc trong một mô hình đường dẫn.
- Đánh giá đồng thời tác động trực tiếp, gián tiếp và tổng thể.
- Xem xét mức độ phù hợp tổng thể của mô hình (Model Fit Indices: CFI, TLI, RMSEA…).
Hiểu đơn giản, mô hình SEM mô tả bằng mũi tên: mỗi mũi tên là một giả thuyết nghiên cứu, từ biến độc lập (đầu mũi tên) đến biến phụ thuộc (đuôi mũi tên).
1.3. Minh họa bằng ví dụ
Giả sử một nghiên cứu xây dựng mô hình:
- H1: X1 có tác động đến Y.
- H2: X2 có tác động đến Y.
Khi phân tích trên SPSS hoặc AMOS:
- X1 có sig = 0.01 (< 0.05) → chấp nhận H1.
- X2 có sig = 0.12 (> 0.05) → bác bỏ H2.
👉 Ở đây, nhiệm vụ của hồi quy, SEM đã hoàn thành: cho ta biết giả thuyết nào được chấp nhận, giả thuyết nào bị bác bỏ.

1.4. Ý nghĩa cốt lõi
Điểm mấu chốt: hồi quy, SEM không nhằm loại bỏ biến để tối ưu mô hình, mà nhằm trả lời câu hỏi nghiên cứu: giả thuyết đặt ra ban đầu có được ủng hộ hay không. Vì thế, việc một biến không có ý nghĩa thống kê vẫn mang lại giá trị cho nghiên cứu.
2. Vì sao không cần loại biến không có ý nghĩa và chạy lại?
Một trong những thắc mắc phổ biến của nghiên cứu sinh và sinh viên khi phân tích dữ liệu là: nếu biến không có ý nghĩa thống kê (p-value > 0.05), có nên loại bỏ và chạy lại mô hình hay không? Ở đây cần phân biệt rõ giữa mục tiêu của phân tích dữ liệu và cách diễn giải kết quả.
2.1. Mục tiêu chính của hồi quy, SEM
Hồi quy và SEM được thiết kế để kiểm định giả thuyết nghiên cứu. Điều này đồng nghĩa:
- Nếu biến độc lập có p-value nhỏ hơn ngưỡng ý nghĩa (thường là 0.05), ta kết luận biến đó có ảnh hưởng đến biến phụ thuộc.
- Nếu p-value lớn hơn 0.05, ta kết luận biến đó không có ảnh hưởng có ý nghĩa thống kê.
👉 Như vậy, việc xuất hiện biến không có ý nghĩa không làm mất giá trị của mô hình. Ngược lại, nó giúp nhà nghiên cứu biết giả thuyết nào bị bác bỏ – đây chính là một phần của kết quả khoa học.
2.2. Loại biến và chạy lại: thao tác thừa
Khi ta loại bỏ biến không có ý nghĩa rồi chạy lại mô hình, điều gì xảy ra?
- Các hệ số hồi quy còn lại sẽ thay đổi do biến độc lập thường có tác động qua lại với nhau.
- Mô hình sau khi loại biến không còn phản ánh đầy đủ mối quan hệ ban đầu.
- Kết quả mới tuy có thể “đẹp” hơn (R² tăng, fit tốt hơn), nhưng lại làm sai lệch mục tiêu nghiên cứu.
Trong nghiên cứu học thuật, mục tiêu không phải là tối ưu hóa số liệu để đạt “kết quả đẹp”, mà là phản ánh đúng thực tế dữ liệu và kiểm định giả thuyết đặt ra.
2.3. Ý nghĩa khoa học của việc giữ biến không có ý nghĩa
Biến không có ý nghĩa thống kê vẫn mang nhiều giá trị:
- Góp phần củng cố tính minh bạch: báo cáo cả giả thuyết chấp nhận lẫn bác bỏ giúp nghiên cứu toàn diện và đáng tin cậy hơn.
- Đóng vai trò tham chiếu: trong các nghiên cứu tiếp theo, kết quả này là bằng chứng thực nghiệm rằng biến đó không ảnh hưởng trong bối cảnh cụ thể.
- Hỗ trợ lý giải hiện tượng: một biến không có ý nghĩa trong nghiên cứu A, nhưng lại có ý nghĩa trong nghiên cứu B, sẽ mở ra hướng thảo luận sâu hơn về yếu tố bối cảnh, văn hóa hoặc mẫu khảo sát.
2.4. So sánh với phân tích tương quan
Một lý do nhiều người lầm tưởng phải loại biến là do nhầm lẫn với phân tích tương quan. Ở phân tích tương quan, thêm hoặc bớt biến không ảnh hưởng đến kết quả giữa hai biến cụ thể. Nhưng trong hồi quy, SEM, loại bỏ một biến đồng nghĩa với giả định rằng biến đó không hề tồn tại trong hệ thống, từ đó làm thay đổi toàn bộ quan hệ giữa các biến còn lại.
👉 Điều này chứng minh rằng: giữ biến không có ý nghĩa trong mô hình là lựa chọn hợp lý, bởi nó phản ánh đúng cơ chế hoạt động phức tạp của các biến trong nghiên cứu.
2.5. Quan điểm học thuật
Trong các tạp chí khoa học uy tín, việc báo cáo đầy đủ các biến (bao gồm cả biến không ý nghĩa) là tiêu chuẩn bắt buộc. Nghiên cứu chỉ tập trung báo cáo những biến có ý nghĩa và loại bỏ phần còn lại thường bị đánh giá là thiếu minh bạch hoặc có xu hướng “làm đẹp số liệu” (data manipulation).
Do đó, xét trên cả hai phương diện – phân tích thống kê và chuẩn mực học thuật, việc loại bỏ biến không có ý nghĩa và chạy lại hồi quy, SEM là không cần thiết.
3. Các loại tác động trong hồi quy, SEM
Một trong những điểm khác biệt quan trọng của hồi quy, SEM so với các phân tích thống kê đơn giản như tương quan là cách các biến độc lập tác động trong mô hình. Thực tế, tồn tại hai dạng tác động chính: tác động trực tiếp và tác động gián tiếp. Việc hiểu rõ hai dạng tác động này giúp lý giải vì sao biến không có ý nghĩa trực tiếp vẫn nên được giữ lại trong mô hình.
3.1. Tác động trực tiếp (independent → dependent)
Đây là dạng tác động quen thuộc nhất trong hồi quy và SEM. Một biến độc lập (X) có thể tác động trực tiếp đến biến phụ thuộc (Y). Nếu hệ số hồi quy (β) của mối quan hệ này có p-value nhỏ hơn 0.05, ta kết luận X có ảnh hưởng trực tiếp đến Y.
Ví dụ: trong nghiên cứu về ý định mua sắm trực tuyến, biến nhận thức sự hữu ích (PU) có tác động trực tiếp và có ý nghĩa đến ý định mua hàng (PI).
Ngược lại, nếu p-value > 0.05, ta kết luận biến X không có tác động trực tiếp đến Y. Tuy nhiên, điều này chưa khẳng định rằng X hoàn toàn “vô tác dụng” trong mô hình.
3.2. Tác động gián tiếp (independent ↔ independent → dependent)
Điểm nổi bật của hồi quy, SEM là biến độc lập không chỉ tác động trực tiếp đến biến phụ thuộc, mà còn có thể ảnh hưởng thông qua các biến độc lập khác.
- Một biến X1 có thể không có ý nghĩa khi tác động trực tiếp đến Y.
- Nhưng X1 có thể tác động đến X2, X3 và từ đó ảnh hưởng gián tiếp đến Y.
👉 Điều này cho thấy: biến “không có ý nghĩa trực tiếp” vẫn có thể đóng vai trò quan trọng trong tổng thể mô hình.
So sánh với phân tích tương quan
- Trong tương quan: kết quả chỉ xét từng cặp biến, hệ số không thay đổi khi thêm hoặc bớt biến khác.
- Trong hồi quy, SEM: do tồn tại tác động qua lại giữa các biến độc lập, khi loại bỏ một biến, hệ số hồi quy của các biến còn lại sẽ thay đổi đáng kể.
Nói cách khác, loại một biến độc lập ra khỏi mô hình đồng nghĩa với giả định rằng biến đó không hề tồn tại trong bất kỳ mối quan hệ nào, từ trực tiếp đến gián tiếp. Điều này làm cho kết quả hồi quy, SEM kém phản ánh thực tế và mất đi tính toàn diện của phân tích.
4. So sánh cách xử lý biến không ý nghĩa trong hồi quy và SEM
Khi gặp biến không có ý nghĩa thống kê, cách xử lý trong hồi quy và SEM có sự khác biệt nhất định.
- Với hồi quy tuyến tính, một số nhà nghiên cứu lựa chọn loại bỏ biến để mô hình “gọn” hơn, các chỉ số R² được cải thiện và hệ số hồi quy ổn định hơn. Tuy nhiên, cách làm này thường chỉ phù hợp với các nghiên cứu ứng dụng, ít nhấn mạnh yếu tố lý thuyết.
- Với SEM, các biến trong mô hình thường được xây dựng dựa trên nền tảng lý thuyết (theoretical framework). Do đó, dù biến không có ý nghĩa, nhà nghiên cứu thường vẫn giữ lại để đảm bảo mô hình phản ánh đúng giả thuyết lý thuyết ban đầu.
Bảng so sánh cách xử lý biến không ý nghĩa
Tiêu chí | Hồi quy tuyến tính (SPSS) | SEM (AMOS/SmartPLS) |
Mục tiêu chính | Kiểm định tác động trực tiếp, tối ưu mô hình thống kê | Kiểm định toàn bộ mô hình lý thuyết, bao gồm cả mối quan hệ trực tiếp và gián tiếp |
Cách xử lý biến không ý nghĩa | Có thể loại để cải thiện R² và sự ổn định của mô hình | Thường giữ lại để bảo vệ tính toàn diện và nhất quán về lý thuyết |
Ảnh hưởng khi loại biến | Hệ số hồi quy thay đổi, R² có thể tăng | Model fit thay đổi, mô hình có nguy cơ sai lệch so với lý thuyết gốc |
Chuẩn mực học thuật | Có thể chấp nhận trong nghiên cứu ứng dụng | Trong nghiên cứu khoa học, khuyến nghị giữ lại và báo cáo đầy đủ |
5. Cách trình bày trong báo cáo nghiên cứu
Khi phân tích dữ liệu bằng hồi quy, SEM, việc xuất hiện các biến không có ý nghĩa là điều hoàn toàn bình thường. Điều quan trọng không phải là loại bỏ biến đó, mà là trình bày kết quả một cách minh bạch và khoa học.
5.1. Báo cáo kết quả trong Chương 4
Trong phần Kết quả nghiên cứu, cần:
- Trình bày đầy đủ bảng hệ số hồi quy (β), p-value, R² (đối với hồi quy) hoặc bảng hệ số đường dẫn và các chỉ số model fit (đối với SEM).
- Đánh dấu rõ những biến có ý nghĩa (p < 0.05) và những biến không có ý nghĩa (p > 0.05).
- Không nên xóa bỏ biến ra khỏi bảng kết quả, bởi điều này làm mất đi tính trung thực khoa học.
👉 Ví dụ:
- X1 → Y: β = 0.320, p = 0.01 (có ý nghĩa).
- X2 → Y: β = 0.080, p = 0.12 (không có ý nghĩa).
5.2. Thảo luận trong Chương 5
Ở phần Thảo luận kết quả, cần đi sâu phân tích nguyên nhân:
- Vì sao giả thuyết bị bác bỏ?
- Do kích thước mẫu chưa đủ lớn?
- Do bối cảnh nghiên cứu khác với các nghiên cứu trước?
- Do công cụ đo lường (thang đo) chưa phù hợp?
- Đặt kết quả trong bối cảnh lý thuyết: một biến không có ý nghĩa trong nghiên cứu này có thể vẫn được chứng minh là quan trọng trong nghiên cứu khác.
5.3. Ý nghĩa thực tiễn của việc báo cáo đầy đủ
- Tính minh bạch: thể hiện rõ quá trình kiểm định và kết quả thực tế.
- Đóng góp cho học thuật: giả thuyết bị bác bỏ cũng là một phát hiện, bởi nó cung cấp bằng chứng rằng biến đó có thể không ảnh hưởng trong một bối cảnh cụ thể.
- Hỗ trợ nghiên cứu sau: kết quả này có thể trở thành cơ sở để các nhà nghiên cứu khác so sánh, kiểm chứng hoặc mở rộng mô hình.
6. FAQ – Giải đáp câu hỏi thường gặp
6.1. Biến không có ý nghĩa có cần loại bỏ không?
Không. Trong hồi quy, SEM, sự xuất hiện biến không có ý nghĩa (p-value > 0.05) là điều bình thường. Đây chính là cách để xác định giả thuyết nào bị bác bỏ. Việc giữ lại và báo cáo kết quả minh bạch sẽ giúp nghiên cứu có giá trị học thuật cao hơn so với việc loại bỏ để làm “đẹp số liệu”.
6.2. Nếu loại biến thì có cần chạy lại mô hình không?
Có. Nếu loại biến, bạn bắt buộc phải chạy lại mô hình để tính toán lại các hệ số hồi quy và chỉ số phù hợp (model fit). Tuy nhiên, kết quả sau khi loại biến không còn phản ánh đúng cơ chế quan hệ tổng thể giữa các biến, bởi các biến độc lập có tác động qua lại với nhau. Do đó, thao tác loại biến và chạy lại thường được xem là không phù hợp trong nghiên cứu học thuật.
6.3. Khi nào nên loại biến?
Trong một số trường hợp, có thể cân nhắc loại biến nếu:
- Biến không có ý nghĩa thống kê và không có cơ sở lý thuyết rõ ràng.
- Biến làm ảnh hưởng nghiêm trọng đến chỉ số phù hợp mô hình (ví dụ: trong SEM, chỉ số CFI, TLI, RMSEA bị giảm mạnh).
- Nghiên cứu mang tính ứng dụng, thiên về mô hình dự báo hơn là kiểm định lý thuyết.
Tuy nhiên, trong nghiên cứu khoa học, tốt nhất vẫn nên giữ lại để báo cáo và giải thích.
6.4. Trong SEM, biến không ý nghĩa có thể loại bỏ không?
Thông thường là không. SEM được xây dựng dựa trên mô hình lý thuyết (theoretical framework). Do đó, dù biến không có ý nghĩa, nó vẫn nên được giữ lại để đảm bảo tính toàn diện của mô hình. Việc loại bỏ có thể làm sai lệch cấu trúc mô hình và khiến nghiên cứu mất đi sự gắn kết với nền tảng lý thuyết ban đầu.
Trong các nghiên cứu học thuật, tiêu chuẩn quốc tế là: báo cáo đầy đủ cả biến có ý nghĩa và không có ý nghĩa, kèm thảo luận nguyên nhân.
7. Kết luận
Qua những phân tích trên, có thể thấy rằng trong nghiên cứu khoa học, hồi quy, SEM không nhất thiết phải loại bỏ biến không có ý nghĩa. Thay vào đó, nhiệm vụ cốt lõi của hai phương pháp này là kiểm định giả thuyết: biến nào có tác động, biến nào không có tác động. Việc xuất hiện biến không ý nghĩa thống kê (p-value > 0.05) là điều hoàn toàn bình thường và cần được ghi nhận như một phần kết quả nghiên cứu.
Hơn nữa, một biến không có ý nghĩa trực tiếp vẫn có thể đóng vai trò gián tiếp trong mô hình, thông qua sự tác động qua lại với các biến độc lập khác. Nếu loại bỏ biến này, mô hình sẽ mất đi sự phản ánh trung thực và toàn diện về mối quan hệ giữa các biến.
Do đó, cách tiếp cận đúng đắn là: giữ biến, báo cáo đầy đủ, giải thích minh bạch. Đây không chỉ là chuẩn mực trong nghiên cứu học thuật, mà còn giúp nâng cao tính giá trị và độ tin cậy của công trình khoa học.
Bạn đang gặp khó khăn khi phân tích dữ liệu bằng hồi quy, SEM?
👉 Hãy liên hệ ngay với đội ngũ Xử Lý Số Liệu để được hỗ trợ chi tiết trong việc chạy mô hình bằng SPSS, AMOS, SmartPLS – nhanh chóng, chính xác và đúng chuẩn học thuật.
Ngoài ra, đừng quên đọc thêm các bài viết liên quan về kiểm định giả thuyết, phân tích dữ liệu định lượng và SEM hoặc tham gia cộng đồng học thuật để cùng trao đổi kinh nghiệm và nâng cao kỹ năng nghiên cứu.