Cách chạy PLS-SEM và Bootstrapping Hiệu Quả Trên SmartPLS 4
PLS-SEM dùng để phân tích mô hình đo lường và Boostrap dùng cho mô hình cấu trúc. 2 công cụ này là không thể thiếu khi thực hiện thống kê dữ liệu trên SmartPLS 4
Tính hội tụ, tính phân biệt của thang đo: Định nghĩa, ý nghĩa và cách kiểm định
Trong nghiên cứu định lượng, thang đo là công cụ quan trọng để đo lường các khái niệm trừu tượng như thái độ, hành vi hay cảm nhận. Tuy nhiên, để đảm bảo kết quả nghiên cứu đáng tin cậy, thang đo không chỉ cần độ tin cậy mà còn phải đạt tính hội tụ và tính phân biệt. Bài viết này giúp bạn hiểu rõ hai khái niệm này, phân biệt chúng và hướng dẫn cách kiểm định bằng phần mềm như SPSS, AMOS và SmartPLS.
1. Tổng quan về độ giá trị trong thang đo
1.1. Định nghĩa độ giá trị (Validity)
Độ giá trị (Validity) phản ánh mức độ mà một thang đo có thực sự đo lường đúng khái niệm cần đo hay không. Nói cách khác, một thang đo có độ giá trị cao là khi nó đo đúng nội dung lý thuyết mà nhà nghiên cứu hướng đến, chứ không bị lệch sang đo các khái niệm khác hoặc các yếu tố không liên quan.
Khái niệm này đóng vai trò then chốt trong nghiên cứu định lượng, bởi nếu thang đo không có độ giá trị, thì các kết quả thống kê dù có độ tin cậy cao đến đâu cũng không có ý nghĩa về mặt học thuật.

1.2. Phân loại độ giá trị
Độ giá trị được phân thành nhiều loại, trong đó ba loại quan trọng và thường được kiểm định trong các nghiên cứu khoa học là:
a) Độ giá trị nội dung (Content Validity)
- Là mức độ mà các mục hỏi (items) trong thang đo bao quát đầy đủ các khía cạnh của khái niệm lý thuyết.
- Được đánh giá chủ yếu bằng phương pháp chuyên gia (expert judgment), tức là dựa vào nhận định của các chuyên gia trong lĩnh vực để xác định tính phù hợp và đầy đủ của các mục đo.
- Ví dụ: Khi xây dựng thang đo “sự hài lòng của khách hàng”, các chuyên gia sẽ kiểm tra xem các câu hỏi có bao phủ hết các khía cạnh như sản phẩm, dịch vụ, chăm sóc sau bán không.
b) Độ giá trị hội tụ (Convergent Validity)
- Phản ánh mức độ các chỉ báo (items) cùng thuộc một khái niệm lý thuyết có liên kết mạnh với nhau.
- Nói cách khác, các biến quan sát đo cùng một yếu tố cần có mối tương quan cao.
- Thường được kiểm định bằng:
- Outer Loadings (hệ số tải ngoài): > 0.5 hoặc tốt hơn > 0.7
- Average Variance Extracted (AVE): > 0.5
- Composite Reliability (CR): > 0.7
- Tính hội tụ đảm bảo rằng các câu hỏi trong cùng một nhóm thang đo đều phản ánh cùng một nội dung lý thuyết.
c) Độ giá trị phân biệt (Discriminant Validity)
- Thể hiện mức độ một khái niệm lý thuyết khác biệt với các khái niệm khác trong mô hình.
- Tức là các thang đo của các khái niệm khác nhau không được trùng lặp hay chồng lấn về mặt nội dung.
- Một số cách kiểm định phổ biến:
- Fornell-Larcker Criterion: Căn bậc hai AVE của một biến lớn hơn tương quan giữa biến đó với các biến khác.
- Cross Loadings: Mỗi chỉ báo có hệ số tải cao nhất tại yếu tố nó thuộc về.
- HTMT Ratio (Heterotrait-Monotrait Ratio): < 0.85 hoặc < 0.90 tùy trường hợp.
2. Tính hội tụ (Convergent Validity)
2.1. Định nghĩa
Tính hội tụ (Convergent Validity) là một dạng độ giá trị trong nghiên cứu định lượng, phản ánh mức độ mà các biến quan sát (items) cùng đo lường một khái niệm lý thuyết có sự tương quan cao với nhau. Nói cách khác, khi các chỉ báo thực sự đại diện cho cùng một cấu trúc tiềm ẩn (latent construct), thì chúng cần “hội tụ” lại với nhau – tức là cùng có xu hướng biến động giống nhau.

2.2. Ý nghĩa trong nghiên cứu
Tính hội tụ giúp đảm bảo rằng thang đo đang sử dụng là nhất quán trong việc phản ánh khái niệm cần đo. Nếu không có tính hội tụ, điều đó có thể cho thấy:
- Các biến quan sát chưa đủ sát nghĩa với khái niệm lý thuyết.
- Có thể có vấn đề về thiết kế câu hỏi hoặc do dịch thuật (với thang đo nhập khẩu).
- Dữ liệu không phản ánh đúng cấu trúc khái niệm như kỳ vọng.
Việc đảm bảo tính hội tụ giúp tăng độ tin cậy của thang đo và cải thiện giá trị học thuật của nghiên cứu.
2.3. Điều kiện để đảm bảo tính hội tụ
Theo tiêu chuẩn học thuật phổ biến (Hair et al., 2014; Fornell & Larcker, 1981), một thang đo được coi là đạt tính hội tụ nếu thỏa mãn ba tiêu chí sau:
- Outer Loadings ≥ 0.70 Hệ số tải ngoài phản ánh mức độ tương quan giữa mỗi biến quan sát và nhân tố tiềm ẩn. Giá trị này cần lớn hơn 0.7 để chứng minh rằng item đo lường tốt cho cấu trúc đó.
- Average Variance Extracted (AVE) ≥ 0.50 AVE thể hiện lượng phương sai trung bình được giải thích bởi các biến quan sát so với toàn bộ phương sai (bao gồm nhiễu). Giá trị AVE ≥ 0.5 chứng tỏ ít nhất 50% phương sai của biến quan sát được giải thích bởi cấu trúc tiềm ẩn.
- Composite Reliability (CR) ≥ 0.70 CR đo lường độ tin cậy tổng hợp của nhóm các biến quan sát, tương tự như Cronbach’s Alpha nhưng được đánh giá tốt hơn trong các mô hình SEM.
Nếu cả ba tiêu chí trên đều đạt, ta có thể khẳng định rằng thang đo có tính hội tụ tốt.
2.4. Cách kiểm định
a) Trong SPSS
SPSS không trực tiếp hỗ trợ kiểm định tính hội tụ, nhưng có thể thực hiện thông qua CFA (Confirmatory Factor Analysis) nếu tích hợp thêm phần mềm như AMOS. Trong đó:
- Outer Loadings tương ứng với trọng số (factor loadings) trong CFA.
- AVE và CR được tính thủ công hoặc qua plug-in hỗ trợ.
b) Trong AMOS
- Sử dụng mô hình CFA để kiểm định.
- Kết quả Outer Loadings được thể hiện qua hệ số hồi quy chuẩn hóa (Standardized Regression Weights).
- AVE và CR cần được tính toán theo công thức thủ công từ kết quả CFA.
c) Trong SmartPLS
SmartPLS cung cấp các chỉ số tính hội tụ tự động:
- Outer Loadings xuất hiện trực tiếp trong phần “Outer Loadings”.
- AVE và CR được trình bày trong phần “Construct Reliability and Validity”.
- Các chỉ báo không đạt Outer Loadings < 0.7 có thể bị loại khỏi mô hình nếu ảnh hưởng đến AVE và CR.
2.5. Ví dụ minh họa từ nghiên cứu thực tiễn
Ví dụ nghiên cứu: Trong một nghiên cứu về sự hài lòng của khách hàng đối với dịch vụ ngân hàng (construct: Customer Satisfaction), thang đo gồm 4 biến quan sát:
- SAT1: Tôi hài lòng với tốc độ phục vụ.
- SAT2: Nhân viên ngân hàng cư xử lịch sự.
- SAT3: Dịch vụ đáp ứng đúng nhu cầu của tôi.
- SAT4: Tôi sẽ tiếp tục sử dụng dịch vụ này trong tương lai.
Kết quả kiểm định (trên SmartPLS):
- Outer Loadings: SAT1 = 0.82, SAT2 = 0.77, SAT3 = 0.85, SAT4 = 0.80.
- AVE = 0.655 (> 0.5)
- CR = 0.881 (> 0.7)
→ Thang đo Customer Satisfaction đạt tính hội tụ.
3. Tính phân biệt (Discriminant Validity)
3.1. Định nghĩa
Tính phân biệt (Discriminant Validity) là một khía cạnh quan trọng trong việc đánh giá độ giá trị của thang đo trong nghiên cứu định lượng. Nó thể hiện mức độ khác biệt rõ ràng giữa các khái niệm lý thuyết (constructs) – tức là một thang đo cần đo lường đúng khái niệm của nó và không bị chồng chéo với các khái niệm khác trong mô hình.
Nếu hai khái niệm lý thuyết khác nhau nhưng lại có thang đo phản ánh tương tự nhau, điều này cho thấy thiếu tính phân biệt, dẫn đến sai lệch kết luận trong nghiên cứu.

3.2. Ý nghĩa trong nghiên cứu
Tính phân biệt có vai trò quyết định trong việc:
- Khẳng định độ độc lập giữa các cấu trúc tiềm ẩn (latent constructs) trong mô hình.
- Tránh hiện tượng đa cộng tuyến giữa các biến tiềm ẩn.
- Nâng cao độ tin cậy và giá trị lý thuyết của mô hình đo lường.
- Đảm bảo rằng kết quả kiểm định giả thuyết không bị sai lệch do các biến có sự chồng lắp về nội dung.
Nếu không đạt tính phân biệt, các mối quan hệ nhân quả có thể không còn ý nghĩa về mặt lý thuyết.
3.3. Các cách đánh giá tính phân biệt
Dưới đây là ba phương pháp phổ biến nhất để kiểm định tính phân biệt của thang đo, được sử dụng rộng rãi trong SEM – đặc biệt là khi dùng phần mềm SmartPLS hoặc AMOS.
a) Fornell – Larcker Criterion (1981)
Tiêu chí này so sánh căn bậc hai của AVE (Average Variance Extracted) với hệ số tương quan bình phương giữa các cấu trúc tiềm ẩn:
- Điều kiện: AVE của một biến phải lớn hơn bình phương tương quan giữa biến đó với bất kỳ biến nào khác trong mô hình.
- Ý nghĩa: Điều này đảm bảo rằng mỗi biến tiềm ẩn chia sẻ nhiều phương sai hơn với các chỉ báo của chính nó so với phương sai chia sẻ với các biến khác.
b) Cross Loadings
- Mỗi biến quan sát nên có hệ số tải cao nhất với nhân tố mà nó được gán và thấp hơn với các nhân tố còn lại.
- Điều kiện: Hệ số tải (loading) của một biến vào cấu trúc tiềm ẩn chính của nó phải lớn hơn rõ rệt so với tải của biến đó vào các cấu trúc khác.
- Ý nghĩa: Kiểm tra xem biến đo có thực sự “thuộc về” đúng khái niệm mà nó cần đo hay không.
c) HTMT – Heterotrait-Monotrait Ratio (Henseler et al., 2015)
- Khái niệm: HTMT đo tỷ lệ giữa tương quan chéo trung bình của các biến đo khác nhau (heterotrait) với tương quan trung bình giữa các biến đo cùng cấu trúc (monotrait).
- Ngưỡng chấp nhận:
- HTMT < 0.85 (phân biệt rõ ràng)
- HTMT < 0.90 (trong một số nghiên cứu thực tiễn)
- Ưu điểm: Được đánh giá là đáng tin cậy hơn so với tiêu chí Fornell – Larcker trong nhiều trường hợp.
3.4. So sánh các phương pháp (ưu – nhược điểm)
| Phương pháp | Ưu điểm | Nhược điểm |
| Fornell – Larcker | Dễ hiểu, được trích dẫn rộng rãi trong SEM truyền thống (AMOS, SmartPLS) | Thiếu nhạy trong một số trường hợp, có thể bỏ sót vi phạm tính phân biệt |
| Cross Loadings | Dễ triển khai trong PLS-SEM, trực quan khi đánh giá biến đo | Thiếu tiêu chí định lượng rõ ràng để xác định vi phạm |
| HTMT | Mạnh hơn, phát hiện vi phạm phân biệt chính xác hơn | Không có sẵn trong AMOS; cần hiểu rõ ý nghĩa thống kê |
3.5. Cách kiểm định trên AMOS / SmartPLS
Trong AMOS:
- AMOS không hỗ trợ trực tiếp HTMT hay cross loadings.
- Kiểm định tính phân biệt thường được thực hiện qua Fornell – Larcker bằng cách:
- Chạy CFA → lấy giá trị AVE.
- So sánh căn bậc 2 AVE với hệ số tương quan.
- Các bước tính thủ công:
- AVE = tổng bình phương loadings / số biến.
- So sánh với ma trận tương quan giữa các nhân tố.
Trong SmartPLS:
- Fornell – Larcker: Có sẵn trong mục Discriminant Validity.
- Cross Loadings: Xem trực tiếp trong bảng kết quả.
- HTMT: Cung cấp tự động, cho phép điều chỉnh ngưỡng cảnh báo (0.85 hoặc 0.90).
SmartPLS được đánh giá là toàn diện hơn trong việc đánh giá tính phân biệt so với AMOS.
3.6. Ví dụ minh họa
Giả sử bạn nghiên cứu ảnh hưởng của niềm tin thương hiệu (Brand Trust) và giá trị cảm xúc (Emotional Value) đến ý định mua hàng (Purchase Intention).
Kết quả kiểm định trong SmartPLS:
- AVE (Brand Trust) = 0.65 → √AVE = 0.81
- Tương quan Brand Trust ↔ Emotional Value = 0.60 → r² = 0.36 → √AVE > r² → Đạt Fornell – Larcker
- HTMT giữa Brand Trust và Emotional Value = 0.78 < 0.85 → Đạt HTMT
→ Thang đo đạt tính phân biệt, có thể tiếp tục sử dụng trong mô hình cấu trúc (SEM).
4. So sánh: Tính hội tụ vs. Tính phân biệt
Trong nghiên cứu định lượng, tính hội tụ (convergent validity) và tính phân biệt (discriminant validity) là hai tiêu chí quan trọng trong việc đánh giá độ giá trị cấu trúc (construct validity) của thang đo. Dù có vai trò khác nhau, cả hai cùng đóng góp vào việc đảm bảo rằng các thang đo phản ánh chính xác khái niệm cần nghiên cứu, và không bị nhầm lẫn với các khái niệm khác.
4.1. Bảng so sánh: Tính hội tụ vs. Tính phân biệt
| Tiêu chí | Tính hội tụ (Convergent Validity) | Tính phân biệt (Discriminant Validity) |
| Định nghĩa | Mức độ mà các chỉ báo của cùng một khái niệm lý thuyết có sự tương quan cao và hội tụ với nhau. | Mức độ mà một khái niệm khác biệt rõ ràng so với các khái niệm khác trong mô hình. |
| Mục tiêu | Đảm bảo rằng các thang đo phản ánh đúng và nhất quán một khái niệm. | Đảm bảo rằng các thang đo chỉ phản ánh duy nhất một khái niệm, không trùng lặp với khái niệm khác. |
| Điều kiện kiểm định | – Hệ số tải nhân tố (Outer loadings) ≥ 0.7 – AVE (Average Variance Extracted) ≥ 0.5 – CR (Composite Reliability) ≥ 0.7 | – Fornell-Larcker: AVE của từng biến > bình phương tương quan giữa các biến – Cross Loadings: mỗi chỉ báo tải cao nhất vào biến tiềm ẩn của nó – HTMT (Heterotrait-Monotrait ratio) < 0.85 hoặc 0.90 |
| Phương pháp kiểm định | – CFA trong AMOS – SmartPLS: Kiểm tra Outer Loadings, AVE, CR – SPSS: Không kiểm định trực tiếp | – AMOS: Fornell-Larcker (tính toán thủ công) – SmartPLS: Cross Loadings, Fornell-Larcker, HTMT |
| Ý nghĩa học thuật | Giúp xác nhận rằng các chỉ báo đo một khái niệm duy nhất và có tính nhất quán nội tại. | Giúp phân biệt các khái niệm khác nhau trong mô hình, tránh đo trùng lặp. |
| Hậu quả nếu vi phạm | Thang đo không đủ độ giá trị → kết luận nghiên cứu không đáng tin cậy. | Các khái niệm chồng chéo → mô hình thiếu rõ ràng, làm sai lệch mối quan hệ giữa các biến. |
| Vai trò trong phân tích | Là bước xác nhận độ giá trị hội tụ trước khi kiểm định mô hình cấu trúc. | Là bước xác nhận độ giá trị phân biệt để đảm bảo cấu trúc khái niệm rõ ràng và không bị nhiễu. |
4.2. Vai trò bổ sung lẫn nhau trong kiểm tra độ giá trị mô hình
- Tính hội tụ giúp đảm bảo rằng các biến quan sát thực sự đo cùng một khái niệm, từ đó tạo ra nền tảng vững chắc cho mô hình đo lường.
- Tính phân biệt đảm bảo rằng mỗi khái niệm trong mô hình là khác biệt và độc lập, giúp tránh sự nhầm lẫn hoặc chồng lấp giữa các khái niệm.
→ Cả hai đều không thể thiếu trong phân tích CFA và SEM. Nếu chỉ đạt tính hội tụ mà không đạt tính phân biệt (hoặc ngược lại), mô hình sẽ thiếu độ tin cậy về mặt lý thuyết và thống kê.
5. Một số lưu ý khi kiểm định độ giá trị thang đo
Trong quá trình phân tích mô hình đo lường trong nghiên cứu định lượng, việc đánh giá độ giá trị thang đo là bước quan trọng nhằm đảm bảo rằng các biến đo lường phản ánh đúng khái niệm lý thuyết mà chúng đại diện. Dưới đây là một số lưu ý cần ghi nhớ khi kiểm định tính hội tụ và tính phân biệt:
✅ Chỉ kiểm định độ giá trị sau khi thang đo đạt độ tin cậy
Trước khi đánh giá độ giá trị (validity), cần đảm bảo thang đo đã đạt yêu cầu về độ tin cậy:
- Cronbach’s Alpha ≥ 0.7 (SPSS)
- Composite Reliability (CR) ≥ 0.7 (AMOS/SmartPLS)
Nếu thang đo không đáng tin cậy, các kết quả về độ giá trị sau đó sẽ không còn ý nghĩa.
✅ Không áp dụng kết quả phần mềm một cách máy móc
Mặc dù các phần mềm như AMOS hay SmartPLS cung cấp bảng chỉ số rõ ràng, nhưng:
- Cần so sánh các chỉ số với ngưỡng lý thuyết để đưa ra nhận định đúng.
- Cần diễn giải có cơ sở lý thuyết thay vì chỉ liệt kê giá trị đạt/không đạt.
- Tránh sao chép toàn bộ bảng kết quả mà không phân tích, vì điều này làm giảm chất lượng học thuật của nghiên cứu.
✅ Cần đánh giá cả tính hội tụ và tính phân biệt
Độ giá trị không chỉ bao gồm một yếu tố:
- Tính hội tụ: Đảm bảo các biến đo cùng một khái niệm có mối liên hệ mạnh.
- Tính phân biệt: Đảm bảo các khái niệm khác nhau được đo bằng các nhóm biến đo riêng biệt.
Việc chỉ kiểm định một trong hai là chưa đủ, đặc biệt trong mô hình SEM.
✅ Ưu tiên HTMT trong SmartPLS
Trong các nghiên cứu hiện đại sử dụng phần mềm SmartPLS, chỉ số HTMT (Heterotrait-Monotrait Ratio) đang trở thành phương pháp chuẩn để đánh giá tính phân biệt, nhờ tính chính xác và dễ kiểm định:
- Ngưỡng phổ biến: HTMT < 0.85 hoặc < 0.90 tùy theo mục tiêu nghiên cứu.
- HTMT thường được khuyến nghị hơn cả Fornell-Larcker và Cross Loadings.
6. Kết luận
Trong nghiên cứu định lượng, tính hội tụ (convergent validity) và tính phân biệt (discriminant validity) là hai trụ cột quan trọng trong việc đánh giá độ giá trị (validity) của thang đo. Nếu không đảm bảo hai yếu tố này, toàn bộ hệ thống đo lường sẽ có nguy cơ sai lệch, dẫn đến kết luận nghiên cứu thiếu chính xác và không đáng tin cậy.
Việc kiểm định đúng cách sẽ:
- Đảm bảo các biến đo phản ánh đúng bản chất của khái niệm nghiên cứu.
- Tránh nhầm lẫn giữa các khái niệm có liên quan nhưng khác biệt.
- Tăng độ tin cậy và giá trị học thuật của mô hình nghiên cứu.
Ứng dụng thực tiễn trên các phần mềm phân tích
- SPSS: Dù không kiểm định trực tiếp tính hội tụ/phân biệt, nhưng có thể hỗ trợ thông qua phân tích EFA, kết hợp kiểm định CFA trên phần mềm bổ trợ như AMOS.
- AMOS: Cho phép thực hiện CFA, đánh giá tính hội tụ qua các chỉ số λ (loadings), CR, AVE, và đánh giá tính phân biệt bằng Fornell-Larcker.
- SmartPLS: Rất mạnh trong kiểm định SEM với dữ liệu không phân phối chuẩn. Cho phép kiểm định AVE, CR, Cross Loadings, Fornell-Larcker và đặc biệt là HTMT, một công cụ hiện đại để đánh giá phân biệt.
Gợi ý hỗ trợ nếu bạn cần trợ giúp chuyên sâu
Nếu bạn gặp khó khăn khi:
- Xây dựng mô hình đo lường phù hợp,
- Kiểm định CFA, tính hội tụ – phân biệt bằng SPSS, AMOS, hoặc SmartPLS,
- Viết Chương 4 – Kết quả nghiên cứu và Chương 5 – Thảo luận & Hàm ý một cách logic, chuẩn chỉnh học thuật, trình bày bảng biểu chuyên nghiệp,
👉 Đừng ngần ngại liên hệ với đội ngũ chuyên gia tại: https://xulysolieu.info/lien-he
Phân biệt biến trung gian, biến điều tiết và biến kiểm soát trong nghiên cứu định lượng
Trong nghiên cứu định lượng, việc phân biệt rõ các loại biến là yếu tố then chốt để xây dựng mô hình chính xác. Tuy nhiên, nhiều sinh viên thường nhầm lẫn giữa biến trung gian, điều tiết và kiểm soát. Bài viết này sẽ giúp bạn hiểu rõ ba khái niệm quan trọng trên, kèm ví dụ minh họa và cách áp dụng phù hợp.
1. Biến trung gian (Mediator Variable)
1.1. Định nghĩa
Biến trung gian (mediator variable) là một biến đóng vai trò trung gian trong mối quan hệ giữa biến độc lập (X) và biến phụ thuộc (Y). Theo lý thuyết kinh điển của Baron và Kenny (1986), biến trung gian giúp giải thích cơ chế mà qua đó X ảnh hưởng đến Y. Thay vì tác động trực tiếp, biến X tác động đến biến M (trung gian), và M tiếp tục tác động đến Y. Khi đó, M được xem như “cầu nối” trong mô hình nghiên cứu.

1.2. Vai trò và cơ chế tác động
Biến trung gian giúp phân tách tổng ảnh hưởng của X lên Y thành hai phần:
- Hiệu ứng trực tiếp (Direct effect): Ký hiệu là c’, là phần tác động từ X đến Y sau khi đã kiểm soát ảnh hưởng qua M.
- Hiệu ứng gián tiếp (Indirect effect): Là tích số a*b, trong đó:
- a: hệ số hồi quy từ X đến M.
- b: hệ số hồi quy từ M đến Y.
- Hiệu ứng tổng (Total effect): Ký hiệu là c, được tính bằng: c = a*b + c’
Sự hiện diện của hiệu ứng gián tiếp có ý nghĩa cho thấy rằng M thực sự đóng vai trò trung gian trong mối quan hệ giữa X và Y.
1.3. Ví dụ minh họa
Giả sử một nhà nghiên cứu muốn tìm hiểu tác động của đào tạo nhân sự (X) đến hiệu suất công việc của nhân viên (Y). Tuy nhiên, mối quan hệ này có thể không trực tiếp mà thông qua động lực làm việc (M). Trong trường hợp này:
- X: Chương trình đào tạo
- M: Động lực làm việc
- Y: Hiệu suất công việc
Nếu kết quả phân tích chỉ ra rằng chương trình đào tạo làm tăng động lực, và động lực làm việc lại làm tăng hiệu suất, thì động lực chính là biến trung gian.
1.4. Cách kiểm định
Hiện nay, có hai cách phổ biến để kiểm định biến trung gian:
- Sử dụng SPSS với PROCESS Macro (Model 4): Đây là mô hình trung gian đơn, được phát triển bởi Hayes, rất thông dụng trong kiểm định học thuật. Bootstrapping thường được dùng để đánh giá hiệu ứng gián tiếp thông qua khoảng tin cậy (CI).
- Sử dụng SmartPLS: Phân tích trung gian thông qua phương pháp bootstrap với cấu trúc mô hình SEM, rất phù hợp trong nghiên cứu có mẫu nhỏ hoặc phân phối không chuẩn.
Ngoài ra, Sobel Test cũng là một công cụ truyền thống, tuy nhiên, kỹ thuật này có nhiều hạn chế như yêu cầu phân phối chuẩn và mẫu lớn, nên ít được sử dụng hơn so với Bootstrapping trong các nghiên cứu hiện đại.
2. Biến điều tiết (Moderator Variable)
2.1. Định nghĩa
Biến điều tiết (moderator variable) là một biến có chức năng làm thay đổi cường độ hoặc hướng của mối quan hệ giữa biến độc lập (X) và biến phụ thuộc (Y). Nói cách khác, mối quan hệ X → Y không cố định, mà phụ thuộc vào giá trị của biến điều tiết (Z). Theo lý thuyết tương tác, biến điều tiết không tham gia trực tiếp vào chuỗi nguyên nhân-kết quả, mà ảnh hưởng đến cách thức X tác động đến Y.

2.2. Vai trò và cơ chế tác động
Biến điều tiết tạo ra hiệu ứng tương tác (interaction effect), biểu hiện thông qua sự kết hợp giữa X và Z (X × Z) để tác động lên Y.
Công thức tổng quát trong mô hình hồi quy là: Y = β₀ + β₁X + β₂Z + β₃(X×Z) + ε
- Nếu hệ số tương tác β₃ có ý nghĩa thống kê, tức là có tồn tại tác động điều tiết.
- Tác động điều tiết có thể làm tăng, giảm hoặc đảo chiều mối quan hệ X → Y tùy vào giá trị của Z.
2.3. Ví dụ minh họa
Giả sử ta nghiên cứu mối quan hệ giữa mức độ stress công việc (X) và hiệu suất làm việc (Y). Tuy nhiên, tác động tiêu cực của stress đến hiệu suất có thể giảm bớt nếu người lao động nhận được sự hỗ trợ từ cấp trên (Z).
→ Khi đó, “sự hỗ trợ từ cấp trên” là biến điều tiết, làm giảm tác động tiêu cực của stress lên hiệu suất.
2.4. Cách kiểm định
Có nhiều cách để kiểm định tác động điều tiết, tùy vào phương pháp nghiên cứu và phần mềm sử dụng:
- Hồi quy tuyến tính với biến tương tác (X × Z): Đây là phương pháp phổ biến trong SPSS. Biến X và Z cần được chuẩn hóa (center) trước khi tạo biến tương tác để tránh đa cộng tuyến.
- PROCESS Macro – Model 1: Được thiết kế riêng để kiểm định hiệu ứng điều tiết đơn giản. Ngoài ra, PROCESS còn có các model khác cho điều tiết phức tạp (model 2, 3…).
- Phân nhóm (Multi-group Analysis) trong SEM: Nếu Z là biến phân nhóm (giới tính, độ tuổi, kinh nghiệm…), có thể thực hiện kiểm định đa nhóm để so sánh đường dẫn X → Y giữa các nhóm.
3. Biến kiểm soát (Control Variable)
3.1. Định nghĩa
Biến kiểm soát (control variable) là những biến không nằm trong giả thuyết nghiên cứu chính, nhưng có khả năng ảnh hưởng đến biến phụ thuộc (Y). Nếu không được kiểm soát, các biến này có thể gây ra nhiễu (confounding effects), khiến kết luận nghiên cứu bị sai lệch.
→ Mục đích của biến kiểm soát là để giữ cho các yếu tố ngoài mô hình không ảnh hưởng đến kết quả phân tích, đảm bảo tính khách quan và độ tin cậy cho mối quan hệ X → Y.

3.2. Vai trò trong mô hình nghiên cứu
- Loại bỏ yếu tố gây nhiễu: Giúp phân biệt rõ ảnh hưởng thuần túy của biến độc lập lên biến phụ thuộc.
- Tăng độ chính xác và tin cậy: Việc kiểm soát các yếu tố bên ngoài giúp kết quả hồi quy phản ánh đúng mối quan hệ giữa các biến chính.
- Giải thích rõ ràng hơn: Cho thấy mô hình đã xét đến các yếu tố nền tảng, tăng sức thuyết phục cho kết luận.
3.3. Ví dụ minh họa
Khi nghiên cứu tác động của động lực nội tại (X) đến hiệu suất làm việc (Y) của nhân viên:
- Những yếu tố như giới tính, độ tuổi, trình độ học vấn, thâm niên công tác có thể ảnh hưởng đến Y.
- Tuy nhiên, vì không thuộc giả thuyết chính, những yếu tố này được đưa vào mô hình dưới vai trò biến kiểm soát, nhằm làm rõ tác động thật sự của động lực nội tại.
3.4. Cách đưa vào mô hình
- Trong hồi quy tuyến tính: Biến kiểm soát được thêm vào cùng với biến độc lập chính như các biến độc lập phụ (covariates).
- Không cần phân tích hệ số riêng biệt: Mục đích không phải để diễn giải tác động của biến kiểm soát, mà để đảm bảo mối quan hệ giữa X và Y không bị nhiễu.
- Trong các phần mềm phân tích (SPSS, AMOS, SmartPLS): Biến kiểm soát thường được gắn trực tiếp vào biến phụ thuộc như một đường dẫn phụ, hoặc đưa vào mô hình phân tích đa biến để làm rõ tác động chính.
4. So sánh ba loại: biến trung gian, biến điều tiết và biến kiểm soát
| Tiêu chí | Biến trung gian (Mediator) | Biến điều tiết (Moderator) | Biến kiểm soát (Control Variable) |
| Định nghĩa | Là biến giải thích cách hoặc lý do tại sao X ảnh hưởng đến Y | Là biến làm thay đổi cường độ hoặc hướng của mối quan hệ giữa X và Y | Là biến không nằm trong giả thuyết chính nhưng có thể ảnh hưởng đến Y |
| Vai trò trong mô hình | Truyền dẫn ảnh hưởng từ X đến Y (X → M → Y) | Điều chỉnh mối quan hệ giữa X và Y bằng tương tác (X × Z → Y) | Kiểm soát các yếu tố gây nhiễu, tăng độ chính xác cho mô hình |
| Cơ chế tác động | Hiệu ứng gián tiếp: a*b | Hiệu ứng tương tác: X × Z | Ảnh hưởng trực tiếp đến Y nhưng không phải là biến nghiên cứu chính |
| Cách kiểm định | PROCESS Model 4, Sobel Test, Bootstrapping | PROCESS Model 1, tương tác trong hồi quy, multi-group SEM | Thêm vào mô hình như biến độc lập phụ trong hồi quy |
| Ví dụ minh họa | Đào tạo (X) → Động lực (M) → Hiệu suất (Y) | Stress (X) → Hiệu suất (Y), điều tiết bởi Hỗ trợ cấp trên (Z) | Khi nghiên cứu X → Y, kiểm soát các biến như tuổi, giới tính, trình độ học vấn |
| Có giả thuyết riêng không? | Có | Có | Không – không phải là trọng tâm nghiên cứu |
| Ý nghĩa khi đưa vào mô hình | Giải thích cơ chế ảnh hưởng | Kiểm tra điều kiện tác động thay đổi theo nhóm/lượng của biến điều tiết | Loại bỏ nhiễu để bảo vệ kết luận, không cần giải thích riêng |
- Một số lưu ý khi sử dụng các loại biến
Khi xây dựng và phân tích mô hình nghiên cứu, việc xác định và sử dụng đúng biến trung gian, biến điều tiết, và biến kiểm soát là yếu tố then chốt để đảm bảo độ chính xác và giá trị khoa học của kết quả. Dưới đây là một số lưu ý quan trọng:

5.1. Đảm bảo cơ sở lý thuyết vững chắc
Trước khi đưa bất kỳ biến nào vào mô hình, cần dựa trên lý thuyết nền tảng hoặc kết quả nghiên cứu trước đó để xác định vai trò cụ thể của biến (trung gian, điều tiết hay kiểm soát). Việc gán vai trò một cách tùy tiện có thể dẫn đến sai lệch trong mô hình và kết luận.
5.2. Không được đánh đồng giữa các loại biến
- Biến trung gian liên quan đến cơ chế truyền dẫn tác động, cần kiểm định hiệu ứng gián tiếp (a*b).
- Biến điều tiết ảnh hưởng đến mức độ hoặc hướng của mối quan hệ, cần kiểm tra tương tác (interaction).
- Biến kiểm soát không nằm trong giả thuyết chính, không cần giải thích mối quan hệ, nhưng cần đưa vào để kiểm soát nhiễu.
5.3. Lựa chọn công cụ phân tích phù hợp
- Đối với biến trung gian, nên sử dụng PROCESS Macro Model 4, Bootstrapping hoặc Sobel Test (nếu dữ liệu phân phối chuẩn).
- Đối với biến điều tiết, nên dùng PROCESS Model 1, kiểm định tương tác trong hồi quy, hoặc kiểm định đa nhóm trong SEM.
- Với biến kiểm soát, chỉ cần thêm vào mô hình như biến độc lập phụ mà không cần phân tích sâu.
5.4. Cẩn trọng khi diễn giải kết quả
Không nên suy luận sự tồn tại của mối quan hệ trung gian hoặc điều tiết nếu chưa có kiểm định thống kê rõ ràng. Việc suy diễn chủ quan có thể làm sai lệch kết luận và ảnh hưởng đến chất lượng bài nghiên cứu.
5.5. Đảm bảo tính nhất quán trong toàn bộ nghiên cứu
Sau khi xác định vai trò của các biến, cần giữ nhất quán trong phần trình bày chương 2 (cơ sở lý thuyết), chương 3 (phương pháp nghiên cứu), và chương 4 (phân tích kết quả). Điều này giúp tăng tính liền mạch và chuyên nghiệp của bài viết.
6. Kết luận
Việc hiểu rõ và phân biệt ba loại biến cơ bản trong nghiên cứu – biến trung gian (mediator), biến điều tiết (moderator) và biến kiểm soát (control variable) – là nền tảng quan trọng giúp bạn thiết kế mô hình nghiên cứu chặt chẽ, logic và có tính học thuật cao. Mỗi loại biến đóng vai trò khác nhau trong việc lý giải, mở rộng và tinh chỉnh các mối quan hệ trong mô hình.
Đối với người mới bắt đầu làm nghiên cứu định lượng, nên ưu tiên tiếp cận mô hình trung gian đơn giản để làm quen với cách xây dựng giả thuyết, kiểm định gián tiếp và diễn giải kết quả. Sau khi nắm vững, bạn có thể mở rộng sang các mô hình nâng cao như trung gian điều tiết (moderated mediation) hoặc nhiều biến trung gian, kiểm định đa nhóm nhằm gia tăng chiều sâu cho nghiên cứu.
Gợi ý hỗ trợ nếu bạn cần:
✅ Tư vấn mô hình nghiên cứu và xác định đúng vai trò của các biến.
✅ Hỗ trợ kiểm định biến trung gian – điều tiết – kiểm soát bằng SPSS, AMOS, SmartPLS.
✅ Viết chương 4–5 đúng chuẩn học thuật, trình bày bảng biểu và diễn giải chi tiết, logic.
👉 Truy cập ngay dịch vụ: https://xulysolieu.info/dich-vu-spss
Hướng dẫn SmartPLS 4: Phân tích mô hình đo lường
Phân tích mô hình đo lường là bước quan trọng trong phương pháp Partial Least Squares Structural Equation Modeling (PLS-SEM), một kỹ thuật mạnh mẽ được sử dụng để phân tích các mô hình có nhiều biến số. Với phiên bản SmartPLS 4, quy trình này đã trở nên dễ dàng hơn nhờ các tính năng cải tiến và giao diện trực quan. Trong bài viết này, chúng ta sẽ tìm hiểu cách thực hiện phân tích mô hình đo lường từ đầu đến cuối bằng SmartPLS 4, với hướng dẫn chi tiết các bước và hình ảnh minh họa.
Hướng dẫn phân tích biến trung gian (mediator) bằng SPSS: Sobel Test và Bootstrapping với PROCESS Macro
Biến trung gian (mediator) đóng vai trò quan trọng trong việc khám phá cơ chế tác động giữa các biến trong nghiên cứu định lượng. Với ưu điểm dễ sử dụng và phổ biến, SPSS là công cụ phù hợp để kiểm định biến trung gian. Bài viết này sẽ hướng dẫn bạn cách phân tích biến trung gian trên SPSS bằng hai phương pháp: Sobel Test và Bootstrapping với PROCESS Macro.
1. Biến trung gian mediator là gì?
Trong nghiên cứu định lượng, biến trung gian (mediator) là một khái niệm quan trọng nhằm giải thích cơ chế tác động giữa biến độc lập và biến phụ thuộc. Theo định nghĩa kinh điển của Baron & Kenny (1986), biến trung gian là một biến nằm giữa mối quan hệ giữa biến độc lập (X) và biến phụ thuộc (Y), giúp làm rõ cách thức mà X ảnh hưởng đến Y thông qua một quá trình trung gian (M).

Cụ thể, mô hình trung gian bao gồm ba đường tác động chính:
- Tác động trực tiếp (direct effect – c’): Là ảnh hưởng của biến độc lập (X) đến biến phụ thuộc (Y) khi đã kiểm soát sự xuất hiện của biến trung gian (M).
- Tác động gián tiếp (indirect effect – a*b): Là ảnh hưởng của X đến Y thông qua M. Trong đó:
- a: hệ số tác động từ X đến M
- b: hệ số tác động từ M đến Y
- Tổng tác động (total effect – c): Là tổng của tác động trực tiếp và gián tiếp: c = c’ + a*b
Sơ đồ mô hình trung gian cơ bản:
- X là biến độc lập
- M là biến trung gian
- Y là biến phụ thuộc
- Mũi tên từ X đến Y biểu thị tác động trực tiếp (c’)
- Mũi tên X → M và M → Y thể hiện tác động gián tiếp (a và b)
Phân biệt với các loại biến khác:
- Biến điều tiết (moderator): Là biến làm thay đổi cường độ hoặc hướng tác động giữa X và Y, thường được kiểm tra qua tương tác (interaction term).
- Biến kiểm soát (control variable): Là các yếu tố được giữ cố định để loại bỏ nhiễu trong quá trình phân tích, không nằm trong mô hình trung gian.
2. Phương pháp xử lý biến trung gian bằng Sobel Test
a) Cơ sở lý thuyết: Mô hình của Baron & Kenny (1986)
Baron và Kenny (1986) là những người đầu tiên đề xuất quy trình kiểm định biến trung gian (mediator) một cách có hệ thống. Để xác định sự tồn tại của một biến trung gian, cần thỏa mãn ba điều kiện sau:
- Biến độc lập (X) phải ảnh hưởng đến biến trung gian (M): Hệ số a ≠ 0, nghĩa là mối quan hệ giữa X và M là có ý nghĩa.
- Biến trung gian (M) phải ảnh hưởng đến biến phụ thuộc (Y): Hệ số b ≠ 0, tức là khi M thay đổi thì Y cũng thay đổi có ý nghĩa.
- Tác động trực tiếp của X đến Y (c’) phải giảm so với tổng tác động ban đầu (c): Điều này cho thấy một phần ảnh hưởng từ X đến Y được truyền qua M.
Nếu tác động trực tiếp (c’) không còn ý nghĩa thống kê, có thể coi là trung gian toàn phần. Nếu c’ vẫn còn ý nghĩa nhưng nhỏ hơn c, ta có trung gian một phần.
b) Quy trình 3 bước hồi quy trên SPSS
Để kiểm định vai trò của biến trung gian theo mô hình của Baron & Kenny (1986), ta tiến hành 3 phân tích hồi quy riêng biệt như sau:
1. Hồi quy đơn: X → M → Kiểm tra xem biến độc lập (X) có ảnh hưởng đáng kể đến biến trung gian (M) hay không (tương ứng với điều kiện 1). Kết quả mong đợi: hệ số X có giá trị Sig. < 0.05. Phương trình hồi quy: M = β₀ + aX + e₁
2. Hồi quy bội: X, M → Y → Kiểm tra xem biến trung gian (M) có tác động đáng kể đến biến phụ thuộc (Y) hay không khi đã kiểm soát biến X (tương ứng với điều kiện 2). Kết quả mong đợi: hệ số M có giá trị Sig. < 0.05. Phương trình hồi quy: Y = β₀ + c′X + bM + e₂
3. Hồi quy đơn: X → Y → Xác định tổng ảnh hưởng ban đầu của biến độc lập (X) lên biến phụ thuộc (Y), tức là hệ số c. Dùng để so sánh với hệ số c′ từ bước 2 nhằm đánh giá mức độ giảm tác động trực tiếp khi thêm biến trung gian vào mô hình. Kết quả mong đợi: c′ < c, và nếu c′ không còn ý nghĩa thì có thể kết luận trung gian toàn phần.
Phương trình hồi quy: Y = β₀ + cX + e₃
Ví dụ:
- Nếu c = 0.6 và c’ = 0.2 ⇒ M đóng vai trò trung gian lớn
- Nếu c = 0.6 và c’ ≈ 0.6 ⇒ M không phải biến trung gian đáng kể
c) Thực hiện Sobel Test
Sau khi hoàn tất 3 bước hồi quy theo mô hình của Baron & Kenny (1986), chúng ta sẽ tiến hành kiểm tra ý nghĩa thống kê của hiệu ứng gián tiếp thông qua Sobel Test (Sobel, 1982). Phép kiểm này giúp xác định xem biến trung gian (M) có thực sự đóng vai trò trung gian trong mối quan hệ giữa biến độc lập (X) và biến phụ thuộc (Y) hay không.
Cách thực hiện:
- Lấy các hệ số từ hồi quy 1 và 2:
- a = hệ số X → M
- b = hệ số M → Y
- sa = sai số chuẩn (standard error) của a
- sb = sai số chuẩn của b
Cách tính nhanh: Bạn có thể sử dụng công cụ Sobel Test Online như
- https://www.danielsoper.com/statcalc/calculator.aspx?id=31
- http://quantpsy.org/sobel/sobel.htm
Nhập vào: a, sa, b, sb Kết quả trả ra: z-value và p-value
Diễn giải:
- Nếu p < 0.05, hiệu ứng gián tiếp có ý nghĩa → có trung gian
- Nếu p ≥ 0.05, không đủ bằng chứng khẳng định có trung gian
d) Thực hành xử lý biến trung gian bằng Sobel Test
Giả sử bạn đã có dữ liệu gồm 3 biến X (biến độc lập), M (trung gian), và Y (biến phụ thuộc). Ví dụ:
- X: Chất lượng dịch vụ
- M: Mức độ hài lòng
- Y: Ý định quay lại sử dụng dịch vụ
Tất cả các biến được đo lường bằng thang đo Likert 5 điểm. Phân tích này sẽ giúp xác định xem mức độ hài lòng có đóng vai trò trung gian trong mối quan hệ giữa chất lượng dịch vụ và ý định quay lại hay không.
Bước 1: Lấy thông tin từ hồi quy X → M
Bạn hãy xem lại cách chạy hồi quy trên SPSS tại bài viết này. Chúng ta có sig kiểm định t của biến X bằng 0.000 < 0.05, biến X có tác động lên M. Hệ số tác động chưa chuẩn hóa và sai số chuẩn của X lần lượt: a = 0.305 và sa = 0.028 (các ký hiệu a, sa chúng ta sẽ dùng ở Sobel Test).

Bước 2: Lấy thông tin từ hồi quy X, M → Y
Chúng ta có sig kiểm định t của biến M bằng 0.000 < 0.05, biến M có tác động lên Y. Hệ số tác động chưa chuẩn hóa và sai số chuẩn của M lần lượt: b = 0.104 và sb = 0.027. Hệ số tác động chưa chuẩn hóa của X trong phép hồi quy này là c’ = 0.626.

Bước 3: Thực hiện hồi quy đơn X → Y
Chúng ta có hệ số tác động chưa chuẩn hóa c = 0.657 > c’ = 0.626, điều này cho thấy biến trung gian M đã làm giảm tác động của biến độc lập lên biến phụ thuộc.
Hiệu số c – c’ = 0.657 – 0.626 = 0.031 (cũng chính bằng tích số a*b) cho chúng ta thấy có sự khác biệt. Tuy nhiên, sự khác biệt này có ý nghĩa thống kê hay không, c lớn hơn c’ có ý nghĩa thống kê hay không, chúng ta cần phải thực hiện kiểm định t để đánh giá. Phép kiểm định t đánh giá hiệu số c – c’ có nghĩa thống kê hay không được gọi là Sobel Test (xem thêm tại đây). Do đó, chúng ta sẽ tiếp tục thực hiện bước 4.

Bước 4: Đánh giá sự khác biệt c – c’ bằng Sobel Test.
SPSS không tích hợp sẵn Sobel Test, chúng ta sẽ thực hiện kiểm định tại website này. Sau khi truy cập vào website, chúng ta sẽ chú ý tới phần Input với 4 giá trị cần khai báo đầu vào là a, b, sa, sb. Với:
- a, sa: lần lượt là hệ số hồi quy chưa chuẩn hóa và sai số chuẩn của X trong phương trình hồi quy đơn X → M.
- b, sb: lần lượt là hệ số hồi quy chưa chuẩn hóa và sai số chuẩn của M trong phương trình hồi quy bội X, M → Y.
Nhập 4 giá trị a, b, sa, sb tương ứng vào các ô trên bảng Sobel Test, sau đó nhấn vào Calculate để tiến hành phân tích. Chúng ta sẽ đọc kết quả giá trị p-value ở phần bôi vàng.

Giá trị sig (p-value) của kiểm định Sobel bằng 0.000 < 0.05, như vậy M là biến trung gian tác động lên mối quan hệ từ X lên Y.
3. Phân tích biến trung gian mediator bằng Bootstrapping trong SPSS
a) Cơ sở lý thuyết Bootstrapping
Biến trung gian (mediator) là một khái niệm quan trọng trong các mô hình phân tích hồi quy và mô hình nhân quả. Theo lý thuyết kinh điển của Baron và Kenny (1986), biến trung gian là biến nằm giữa mối quan hệ của biến độc lập (X) và biến phụ thuộc (Y), giúp giải thích cơ chế tại sao hoặc bằng cách nào mà X ảnh hưởng đến Y.
Cấu trúc mô hình trung gian cơ bản bao gồm:

Với các thành phần:
- a: Hệ số tác động của biến độc lập X lên biến trung gian M
- b: Hệ số tác động của biến trung gian M lên biến phụ thuộc Y (đã kiểm soát X)
- c’: Tác động trực tiếp của X lên Y (direct effect)
- a*b: Tác động gián tiếp (indirect effect)
- c = a*b + c’: Tác động tổng hợp (total effect)
Từ đây, ta thấy tổng ảnh hưởng của X đến Y bao gồm cả ảnh hưởng trực tiếp (c’) và ảnh hưởng gián tiếp thông qua M (a*b).
Baron & Kenny cho rằng, để phân tích biến trung gian có ý nghĩa, tác động tổng hợp c (X → Y) phải có ý nghĩa thống kê. Tuy nhiên, các nghiên cứu sau này đã chỉ ra rằng điều kiện này không bắt buộc.
Theo MacKinnon et al. (2000) và Shrout & Bolger (2002), việc mối quan hệ tổng thể (c) không có ý nghĩa không đồng nghĩa với việc không tồn tại tác động trung gian. Điều này đặc biệt đúng trong các tình huống xảy ra trung gian hoàn toàn (full mediation), khi tác động trực tiếp c’ không còn đáng kể và toàn bộ ảnh hưởng được truyền qua M.
Do đó, việc kiểm định hiệu ứng gián tiếp (a*b) trở nên quan trọng và là trọng tâm của phân tích trung gian hiện đại.
Trong bối cảnh đó, kỹ thuật Bootstrapping đã được đề xuất như một phương pháp mạnh mẽ để kiểm định tác động gián tiếp trong mô hình trung gian.
Bootstrapping là phương pháp lấy mẫu lặp lại (resampling with replacement) từ tập dữ liệu gốc để tạo ra hàng ngàn mẫu mới (ví dụ: 5.000 mẫu), sau đó ước lượng hệ số a, b và đặc biệt là tích số ab trên mỗi mẫu. Từ đó, ta tạo ra **phân phối ước lượng của ab** và tính khoảng tin cậy (Confidence Interval – CI) cho tác động gián tiếp.
Theo Preacher & Hayes (2004, 2008): Nếu khoảng tin cậy không chứa giá trị 0, thì có thể kết luận rằng hiệu ứng gián tiếp có ý nghĩa thống kê, và tồn tại mối quan hệ trung gian.
b) So sánh Bootstrapping với Sobel Test
| Tiêu chí | Sobel Test | Bootstrapping |
| Yêu cầu phân phối chuẩn | Có | Không |
| Độ nhạy với cỡ mẫu nhỏ | Thấp | Cao (hiệu quả với mẫu nhỏ) |
| Phương pháp kiểm định | Phân tích phương sai tích số a*b (giả định chuẩn) | Dựng phân phối thực nghiệm từ lấy mẫu lặp |
| Phổ biến hiện nay | Ít dùng trong thực tế | Là phương pháp chuẩn mực hiện nay |
| Ưu điểm | Đơn giản, tính toán tay được | Chính xác hơn, phù hợp với dữ liệu thực nghiệm |
Theo Williams & MacKinnon (2008) và Zhao, Lynch & Chen (2010), Bootstrapping vượt trội hơn về mặt thống kê, khắc phục các hạn chế nghiêm ngặt của Sobel Test, đặc biệt trong bối cảnh dữ liệu không phân phối chuẩn hoặc cỡ mẫu không lớn.
c) Giới thiệu và cách cài đặt PROCESS Macro của Hayes
Để thực hiện phân tích biến trung gian (mediator) một cách chính xác và chuyên nghiệp trên SPSS, công cụ được sử dụng phổ biến nhất hiện nay là PROCESS Macro do GS. Andrew F. Hayes phát triển. Công cụ này hỗ trợ chạy mô hình trung gian (model 4), mô hình điều tiết, và các dạng phân tích nhân quả mở rộng khác.
Hướng dẫn tải PROCESS Macro
- Bạn có thể tải phiên bản mới nhất của PROCESS Macro tại website chính thức: https://www.processmacro.org/download.html
- Tại đây, bạn sẽ thấy các phiên bản dành cho: SPSS (Windows hoặc Mac), SAS, R. Chọn đúng phiên bản SPSS tương ứng với hệ điều hành bạn đang sử dụng (Windows/Mac).
Hướng dẫn cài đặt PROCESS Macro vào SPSS
➤ Bước 1: Tải file process.sps về máy
Sau khi truy cập trang trên, hãy tải file process.sps về máy. Đây là file script cài đặt PROCESS.
➤ Bước 2: Mở SPSS và chạy file process.sps
- Mở phần mềm SPSS.
- Vào File → Open → Syntax và chọn file
process.spsvừa tải về. - Một cửa sổ Syntax sẽ hiện ra. Nhấn nút Run All (Ctrl + R) hoặc chọn toàn bộ đoạn lệnh và nhấn Run để thực thi.
Nếu cài đặt thành công, bạn sẽ thấy thông báo: PROCESS version 3.5 by Andrew F. Hayes installed successfully.
Kiểm tra PROCESS đã cài thành công chưa
- Trên thanh công cụ SPSS, vào: Analyze → Regression → PROCESS v3.5 by Andrew F. Hayes
- Nếu bạn thấy dòng lệnh này, tức là PROCESS đã được cài đặt thành công và sẵn sàng để sử dụng.
Giới thiệu Model 4 – Mô hình trung gian cơ bản
Trong PROCESS, các mô hình phân tích nhân quả được đánh số theo sơ đồ có sẵn từ 1 đến 92. Trong đó:
- Model 4 là mô hình trung gian cơ bản (simple mediation model), thường dùng nhất trong nghiên cứu khoa học xã hội.
- Cấu trúc: X → M → Y, trong đó:
- X: Biến độc lập
- M: Biến trung gian (Mediator)
- Y: Biến phụ thuộc
Mô hình này ước lượng:
- Tác động trực tiếp (c’): X ảnh hưởng đến Y sau khi kiểm soát M
- Tác động gián tiếp (a*b): Thông qua M
- Tác động tổng hợp (c = c’ + a*b)
Đặc biệt, PROCESS tự động thực hiện:
- Bootstrapping để kiểm định hiệu ứng gián tiếp
- Xuất kết quả bao gồm: hệ số hồi quy, khoảng tin cậy (CI), giá trị p
Lợi ích của việc dùng PROCESS v3.5
| Tính năng | Mô tả |
| Hỗ trợ Bootstrapping | Giúp kiểm định hiệu ứng trung gian chính xác hơn |
| Tích hợp SPSS | Không cần phần mềm ngoài |
| Giao diện đơn giản | Không cần biết lập trình |
| Tùy chỉnh tham số | Số mẫu Bootstrap, loại khoảng tin cậy, chuẩn hóa… |
d) Thao tác chạy PROCESS để phân tích trung gian
Sau khi đã cài đặt thành công PROCESS Macro v3.5 của Hayes, bạn có thể bắt đầu thực hiện phân tích biến trung gian (mediator) trên SPSS theo mô hình cơ bản (Model 4). Dưới đây là các bước hướng dẫn chi tiết từ thiết lập mô hình đến diễn giải kết quả.
Mở tệp dữ liệu SPSS cần chạy phân tích trung gian, vào Analyze > Regression > PROCESS v3.5 by Andrew F. Hayes (macro cập nhật liên tục theo thời gian, do vậy số phiên bản 3.5 có thể thay đổi). Nếu bạn không nắm rõ về kỹ thuật thao tác, tải – cài đặt – chạy phần mềm, bạn cần dịch vụ SPSS có thể tham khảo dịch vụ từ Xử Lý Số Liệu nhé.

Cửa sổ PROCESS xuất hiện, chúng ta đưa biến phụ thuộc vào Y variable, biến độc lập vào X variable, biến trung gian vào Mediator(s). Nếu có nhiều biến trung gian cùng tác động lên mối quan hệ X, Y, chúng ta có thể đưa tất cả vào cùng lúc. Chọn các tùy chọn giống như mục số 2, sau đó nhấp vào Options mục 3.

Trong Options, tích vào 2 lựa chọn ở mục 1 và thiết lập mục 2 như ảnh. Nhấp Continue để quay lại cửa sổ ban đầu, sau đó nhấp OK để xuất kết quả ra Output.

Tương tự như Sobel Test, Macro PROCESS cũng xuất kết quả các phép hồi quy X → M (hồi quy 1) và X, M → Y (hồi quy 2). Tuy nhiên, kết quả các phép hồi quy này dù thế nào đi nữa cũng không quyết định có hay không mối tác động trung gian trong phương pháp Bootstrapping.


Yếu tố quyết định một biến có vai trò trung gian hay không, hay tồn tại mối quan hệ gián tiếp giữa hai biến hay không trong kỹ thuật Bootstrapping là kết quả đoạn tin cậy bootstrap của mối quan hệ Indirect effects. Bảng TOTAL, DIRECT AND INDIRECT EFFECTS OF X ON Y:
- Total effect of X on Y: Tổng tác động từ X lên Y (hệ số c)
- Direct effect of X on Y: Tác động trực tiếp từ X lên Y (hệ số c’)
- Indirect effect(s) of X on Y: Tác động gián tiếp từ X lên Y qua M (tích số a*b)

e) Diễn giải kết quả Bootstrapping
Phần Indirect effects chúng ta sẽ đánh giá có sự tác động gián tiếp hay không dựa vào khoảng tin cậy phép bootstrap cho tích số a*b .
- Nếu khoảng tin cậy phép bootstrap tích số a*b chứa giá trị 0, chúng ta kết luận không cótác động gián tiếp từ X lên Y.
- Nếu khoảng tin cậy phép bootstrap tích số a*b không chứa giá trị 0, chúng ta kết luận cótác động gián tiếp từ X lên Y.
Cụ thể trong ví dụ thực hành, từ đầu chúng ta chọn độ tin cậy là 95%, kết quả cho gá trị dưới BootLLCI (Lower-Level Confidence Interval) bằng 0.0139 và giá trị trên BootULCI (Upper-Level Confidence Interval) bằng 0.0509. Khoảng tin cậy [0.0139; 0.0509] không bao gồm giá trị 0, như vậy có tác động gián tiếp từ X lên Y qua M với mức tác động là 0.0317. Như vậy, biến M có vai trò trung gian tác động lên mối quan hệ từ X tới Y.
4. Một số lưu ý khi phân tích biến trung gian trên SPSS
Phân tích biến trung gian là một bước quan trọng trong nghiên cứu định lượng, giúp làm sáng tỏ cơ chế tác động giữa các biến trong mô hình. Tuy nhiên, để đảm bảo kết quả có giá trị và đáng tin cậy, người nghiên cứu cần lưu ý một số điểm sau:
a) Cơ sở lý thuyết phải rõ ràng trước khi đưa biến vào mô hình
Không nên đưa biến trung gian chỉ vì mục tiêu kiểm định kỹ thuật. Việc xây dựng mô hình trung gian cần dựa trên lý thuyết vững chắc, các nghiên cứu trước đó, và giả thuyết khoa học rõ ràng. Cấu trúc X → M → Y phải được lý giải hợp lý về mặt logic và học thuật.
Ví dụ: Nếu nghiên cứu mối quan hệ giữa sự hài lòng công việc (X) và ý định nghỉ việc (Y), thì cam kết tổ chức (M) có thể là biến trung gian hợp lý dựa trên các nghiên cứu về hành vi tổ chức.
b) Không suy luận trung gian nếu chưa kiểm định gián tiếp
Chỉ dựa vào việc hệ số hồi quy c’ (direct effect) giảm so với c (total effect) là chưa đủ để kết luận có hiện tượng trung gian. Cần kiểm định ý nghĩa thống kê của hiệu ứng gián tiếp (a*b), đặc biệt là thông qua Bootstrapping hoặc ít nhất là Sobel Test, nếu điều kiện cho phép.
Việc bỏ qua kiểm định gián tiếp là một lỗi phổ biến và dễ dẫn đến kết luận sai trong nghiên cứu.
c) Chỉ nên dùng Sobel Test khi dữ liệu phân phối chuẩn và cỡ mẫu đủ lớn
Sobel Test có những hạn chế nhất định:
- Yêu cầu giả định phân phối chuẩn đối với tích số a*b.
- Độ tin cậy giảm đáng kể khi cỡ mẫu nhỏ (<200).
- Không cung cấp khoảng tin cậy, dễ gây hiểu nhầm về mức độ chính xác.
Do đó, Sobel Test chỉ phù hợp với những bộ dữ liệu lớn và có tính chất gần chuẩn. Trong hầu hết trường hợp thực tế, Bootstrapping được khuyến khích sử dụng thay thế.
d) PROCESS Macro cần tương thích với phiên bản SPSS đang dùng
PROCESS Macro là công cụ mạnh mẽ hỗ trợ kiểm định trung gian, điều tiết và tương tác. Tuy nhiên, để sử dụng hiệu quả, cần:
- Cài đúng phiên bản PROCESS phù hợp với phiên bản SPSS bạn đang sử dụng.
- Đảm bảo không bị lỗi macro khi chạy mô hình.
- Kiểm tra định dạng biến đầu vào (không để dữ liệu thiếu, biến định tính cần mã hóa đúng).
Bạn có thể tải PROCESS Macro bản mới nhất tại: https://www.processmacro.org/download.html
5. Kết luận
Trong bài viết này, chúng ta đã đi qua toàn bộ quy trình phân tích biến trung gian bằng hai kỹ thuật phổ biến nhất trên SPSS: Sobel Test và Bootstrapping thông qua PROCESS Macro. Cụ thể:
- Sobel Test dựa trên nền tảng lý thuyết của Baron & Kenny (1986), dễ thực hiện nhưng có nhiều giới hạn về điều kiện phân phối chuẩn và cỡ mẫu.
- Bootstrapping, đặc biệt là qua công cụ PROCESS Macro của Hayes, là phương pháp kiểm định hiệu ứng gián tiếp chính xác hơn, không yêu cầu giả định phân phối chuẩn và hiện được sử dụng rộng rãi trong nghiên cứu định lượng hiện đại.
Việc lựa chọn đúng công cụ và diễn giải đúng kết quả không chỉ giúp đảm bảo độ tin cậy của nghiên cứu mà còn phản ánh sự nghiêm túc trong phương pháp và trình độ học thuật của người nghiên cứu.
Nếu bạn đang gặp khó khăn, Xử Lý Số Liệu có thể hỗ trợ bạn:
- Hỗ trợ chạy PROCESS Macro hoặc Sobel Test nhanh, chuẩn mẫu mã và đúng logic học thuật.
- Viết chương 4–5 đúng chuẩn báo cáo nghiên cứu khoa học, đầy đủ bảng biểu và diễn giải theo chuẩn đại học/cao học.
- Tư vấn 1:1 hoặc cung cấp file mẫu phân tích trung gian để bạn học và triển khai theo.
📩 Truy cập ngay dịch vụ SPSS tại: https://xulysolieu.info/dich-vu-spss
Hướng dẫn đánh giá mô hình cấu trúc trên SmartPLS 4 chi tiết nhất
Sau khi đánh giá mô hình đo lường bằng cách chạy PLS-SEM, tiếp tục đánh giá mô hình cấu trúc bằng Boostrapping trên SmartPLS 4
Cách đánh giá độ tin cậy tổng hợp qua chỉ số Composite Reliability trên SmartPLS 4
Chỉ số Composite Reliability là một công cụ quan trọng trong việc đánh giá độ tin cậy tổng hợp của mô hình đo lường trong nghiên cứu khoa học và thống kê. Việc sử dụng và đánh giá chỉ số này đòi hỏi sự cẩn trọng và chính xác để đảm bảo tính chính xác của kết quả nghiên cứu. Nếu được áp dụng đúng cách, chỉ số CR sẽ giúp nâng cao chất lượng của nghiên cứu và phân tích dữ liệu.
Hướng dẫn xử lý biến trung gian (mediator) trên SmartPLS 3 chi tiết từ A–Z
Trong các nghiên cứu định lượng hiện đại, đặc biệt là các mô hình cấu trúc tuyến tính (SEM), biến trung gian (mediator) đóng vai trò quan trọng trong việc lý giải cơ chế tác động giữa biến độc lập và biến phụ thuộc. Thay vì chỉ biết rằng X ảnh hưởng đến Y, nhà nghiên cứu có thể đi sâu hơn để xác định thông qua đâu mà ảnh hưởng đó diễn ra, từ đó củng cố tính học thuật và giá trị thực tiễn của mô hình. Ví dụ, trong lĩnh vực marketing, sự hài lòng của khách hàng thường được xem là biến trung gian giữa chất lượng dịch vụ và lòng trung thành của khách hàng. Việc kiểm định sự tồn tại và mức độ của mối quan hệ trung gian này giúp xác định các điểm chạm then chốt trong chiến lược cải thiện trải nghiệm khách hàng.
Trong bối cảnh đó, phần mềm SmartPLS 3 nổi bật lên như một công cụ phù hợp để kiểm định biến trung gian mediator, đặc biệt trong các tình huống:
- Cỡ mẫu nhỏ,
- Dữ liệu không tuân theo phân phối chuẩn,
- Mô hình mang tính khám phá hoặc định hướng dự báo.
Với giao diện trực quan và khả năng phân tích Bootstrapping mạnh mẽ, SmartPLS trở thành lựa chọn phổ biến trong các nghiên cứu thực nghiệm tại Việt Nam cũng như quốc tế.
Bài viết này sẽ hướng dẫn chi tiết cách xử lý biến trung gian mediator trên SmartPLS 3, từ khâu xây dựng mô hình, chạy bootstrapping, đến cách diễn giải kết quả và trình bày trong báo cáo chương 4–5. Qua đó, người đọc có thể tự tin ứng dụng phương pháp này một cách chính xác và hiệu quả trong luận văn hoặc công trình nghiên cứu của mình.
1. Biến trung gian (mediator) là gì trong mô hình SEM-PLS?
Biến trung gian (mediator) là một khái niệm trung tâm trong các mô hình phân tích cấu trúc (Structural Equation Modeling – SEM), bao gồm cả phương pháp PLS-SEM. Theo định nghĩa kinh điển của Baron và Kenny (1986), một biến trung gian là biến số đóng vai trò trung gian trong mối quan hệ giữa biến độc lập (independent variable – X) và biến phụ thuộc (dependent variable – Y). Cụ thể, X ảnh hưởng đến M (biến trung gian), và M ảnh hưởng đến Y, do đó tác động của X đến Y là gián tiếp thông qua M.
Về sau, Hayes (2013) bổ sung khung lý thuyết hiện đại, cho rằng kiểm định sự trung gian không chỉ đơn thuần dựa vào việc kiểm tra từng bước tuyến tính như Baron & Kenny đề xuất, mà cần dựa vào kiểm định gián tiếp (indirect effect) thông qua bootstrapping – phương pháp đặc biệt phù hợp với PLS-SEM.
Trong mô hình SEM-PLS, biến trung gian (mediator) thường được biểu diễn bằng sơ đồ đường dẫn như sau:

Trong đó:
- A là biến độc lập (X)
- M là biến trung gian (Mediator)
- B là biến phụ thuộc (Y)
Mối quan hệ này có thể có thêm tác động trực tiếp từ A đến B, tùy theo mô hình kiểm định trung gian toàn phần hay trung gian một phần.
Ví dụ minh họa trong lĩnh vực quản trị nhân sự: Chính sách đào tạo (A) ảnh hưởng đến mức độ hài lòng công việc (B) thông qua năng lực được cải thiện (M). Trong trường hợp này, năng lực được cải thiện đóng vai trò là biến trung gian giúp làm rõ “cơ chế” từ chính sách đến kết quả đầu ra.
2. Quy trình kiểm định biến trung gian mediator trong SmartPLS 3
Việc hiểu rõ biến trung gian (mediator) là gì là tiền đề quan trọng để xây dựng mô hình phân tích phù hợp và lựa chọn phương pháp kiểm định chính xác, đặc biệt khi sử dụng SmartPLS 3 trong các nghiên cứu ứng dụng.
Để kiểm định biến trung gian (mediator) một cách chính xác trong mô hình SEM sử dụng SmartPLS 3, người nghiên cứu cần thực hiện theo một quy trình chuẩn bao gồm 3 bước chính: thiết lập mô hình, cấu hình phân tích bootstrapping và trích xuất – diễn giải kết quả.
a) Chuẩn bị dữ liệu và thiết lập mô hình (outer model + inner model)
Bước đầu tiên là đảm bảo dữ liệu đã được chuẩn hóa, mã hóa đúng và không có giá trị thiếu. Trong SmartPLS, mô hình được chia thành hai phần:
- Outer model (Measurement Model): Thiết lập mối quan hệ giữa các biến quan sát và các biến ẩn (latent variables). Xác định rõ các thang đo là phản xạ (reflective) hay hình thành (formative). Điều này ảnh hưởng đến các chỉ số cần kiểm tra về độ tin cậy và giá trị hội tụ/phân biệt.
- Inner model (Structural Model): Xây dựng mối quan hệ giữa các biến ẩn, trong đó xác định rõ biến độc lập (X), biến trung gian (M) và biến phụ thuộc (Y). Liên kết cần được vẽ đầy đủ theo hướng:

- Và nếu muốn kiểm tra trung gian một phần, cần thêm đường dẫn X → Y trực tiếp để đối chiếu.
b) Thiết lập phân tích Bootstrapping
Sau khi hoàn tất mô hình, bước tiếp theo là chạy Bootstrapping để kiểm định thống kê các mối quan hệ.
- Truy cập mục Calculate → Bootstrapping.

- Chọn Number of Samples là 5.000 để có độ tin cậy cao.
- Giữ nguyên phương pháp Bias-Corrected and Accelerated (BCa) hoặc chọn Percentile Bootstrap tùy mục tiêu kiểm định.
- Đảm bảo tick chọn hiển thị Indirect Effects, Total Effects và Confidence Intervals (CI) để phân tích hiệu ứng trung gian.

- Nhấn vào “Start Calculation” để phân tích hiệu ứng trung gian.

Bootstrapping là công cụ chính để kiểm định ý nghĩa thống kê của hiệu ứng gián tiếp (indirect effect) – yếu tố cốt lõi trong phân tích biến trung gian.
c) Chạy mô hình để lấy các chỉ số quan trọng
Sau khi chạy Bootstrapping, SmartPLS sẽ trả về các chỉ số quan trọng cần xem xét để kiểm định biến trung gian:
- Indirect Effect (X → M → Y): hệ số β, giá trị p-value và khoảng tin cậy (Confidence Interval). Đây là chỉ số then chốt để xác định có tồn tại hiện tượng trung gian hay không.
- Direct Effect (X → Y): cho biết mức độ ảnh hưởng trực tiếp sau khi đã có biến trung gian.
- Total Effect (X → Y thông qua cả trực tiếp và gián tiếp): giúp đánh giá tổng tác động của X đến Y.
→ Nếu Indirect Effect có ý nghĩa thống kê (p < 0.05) và Direct Effect không còn ý nghĩa, ta kết luận có trung gian toàn phần (full mediation). Ngược lại, nếu cả hai cùng có ý nghĩa, ta có trung gian một phần (partial mediation).

3. Các chỉ số cần quan tâm trong phân tích biến trung gian mediator
Khi phân tích biến trung gian (mediator) bằng SmartPLS 3, có một số chỉ số quan trọng bạn cần tập trung theo dõi để xác định rõ vai trò và mức độ ảnh hưởng của biến trung gian trong mô hình SEM:
a) Hệ số đường dẫn trực tiếp (Direct Effect)
- Đây là hệ số biểu thị mức độ ảnh hưởng của biến độc lập (X) đến biến phụ thuộc (Y) không thông qua biến trung gian.
- Trong mô hình SEM có mediator, việc giữ lại đường dẫn trực tiếp X → Y là cần thiết để kiểm tra xem hiệu ứng này còn có ý nghĩa hay không khi đã có mediator.
- Nếu hệ số này không còn ý nghĩa thống kê (p > 0.05), và hiệu ứng gián tiếp có ý nghĩa, ta có thể suy luận rằng mối quan hệ giữa X và Y được truyền hoàn toàn qua biến trung gian.
b) Hệ số gián tiếp (Indirect Effect)
- Chính là mối quan hệ trung gian, tức là đường dẫn từ X → M → Y.
- Đây là phần trọng tâm để xác định có tồn tại hiện tượng trung gian hay không.
- Trong SmartPLS, bạn có thể dễ dàng kiểm tra hệ số này bằng cách xem mục Specific Indirect Effects trong phần kết quả Bootstrapping.
- Quan sát hệ số β và giá trị p-value, cùng Confidence Interval (CI) để đánh giá ý nghĩa thống kê.
c) Tổng hiệu ứng (Total Effect)
- Là tổng hợp của Direct Effect và Indirect Effect.
- Nó phản ánh ảnh hưởng tổng thể của biến độc lập X đến biến phụ thuộc Y bao gồm cả ảnh hưởng trực tiếp và gián tiếp thông qua biến trung gian.
- Total Effect = Direct Effect + Indirect Effect
Việc hiểu rõ tổng hiệu ứng giúp nhà nghiên cứu đánh giá mức độ tác động toàn diện của một biến trong mô hình.
d) P-value và khoảng tin cậy (Confidence Interval – CI)
- P-value: giúp xác định xem các mối quan hệ có ý nghĩa thống kê hay không.
- Nếu p < 0.05 → mối quan hệ có ý nghĩa.
- Confidence Interval (CI):
- Quan trọng trong kiểm định bootstrap.
- Nếu khoảng CI không chứa giá trị 0, thì mối quan hệ được coi là có ý nghĩa thống kê.
- Ví dụ: CI = [0.045; 0.317] → Ý nghĩa; CI = [-0.022; 0.194] → Không có ý nghĩa.
Sử dụng kết hợp p-value và CI giúp tăng độ tin cậy khi đánh giá hiệu ứng trung gian.
e) Tự động kiểm định trung gian bằng mục “Specific Indirect Effects” trong SmartPLS
- SmartPLS cung cấp tự động các hiệu ứng gián tiếp cụ thể trong tab kết quả của Bootstrapping → Specific Indirect Effects.
- Bạn không cần tính tay các hệ số, chỉ cần quan sát:
- Hệ số gián tiếp
- p-value
- CI
- Đây là kết quả then chốt để kết luận xem mô hình có biến trung gian hay không, và là cơ sở để xác định trung gian toàn phần hay trung gian một phần.
4. Cách diễn giải kết quả biến trung gian trong SmartPLS
Sau khi chạy mô hình và thu được kết quả từ phần Bootstrapping trong SmartPLS, bước tiếp theo là diễn giải hiệu ứng trung gian (mediation effect) một cách rõ ràng và chính xác. Việc phân biệt giữa trung gian một phần (partial mediation) và trung gian toàn phần (full mediation) là điều then chốt trong báo cáo chương 4 cũng như khi viết thảo luận chương 5.
a) Trung gian một phần (Partial Mediation) là gì?
- Xảy ra khi:
- Cả hiệu ứng trực tiếp (X → Y)và hiệu ứng gián tiếp (X → M → Y) đều có ý nghĩa thống kê (p < 0.05).
- Điều này có nghĩa là biến trung gian chỉ giải thích một phần mối quan hệ giữa X và Y, còn lại vẫn có ảnh hưởng trực tiếp từ X đến Y.
- Đây là dạng trung gian phổ biến trong các nghiên cứu hành vi, tâm lý, marketing.
Ví dụ kết luận:
Biến M đóng vai trò trung gian một phần trong mối quan hệ giữa X và Y, vì cả Direct Effect (β = 0.25; p = 0.012) và Indirect Effect (β = 0.18; p = 0.004) đều có ý nghĩa thống kê.
b) Trung gian toàn phần (Full Mediation) là gì?
- Xảy ra khi:
- Hiệu ứng gián tiếp (X → M → Y)có ý nghĩa thống kê (p < 0.05),
- Nhưng hiệu ứng trực tiếp (X → Y)không còn ý nghĩa (p > 0.05) khi đưa biến trung gian vào mô hình.
- Tức là, toàn bộ ảnh hưởng từ X đến Y được truyền qua M, không còn ảnh hưởng trực tiếp nào.
Ví dụ kết luận:
Mối quan hệ giữa X và Y được trung gian toàn phần bởi M, vì Direct Effect không còn ý nghĩa (β = 0.09; p = 0.274), trong khi Indirect Effect có ý nghĩa (β = 0.21; p = 0.001).
c) Diễn giải theo logic và so sánh hệ số
Để đưa ra kết luận rõ ràng, bạn cần:
- So sánh giá trị β (beta coefficient): để biết mức độ ảnh hưởng.
- So sánh p-value: để đánh giá ý nghĩa thống kê.
- Xem xét CI (Confidence Interval): nếu khoảng tin cậy không chứa 0, mối quan hệ được coi là có ý nghĩa.
Bảng tóm tắt giúp bạn dễ phân loại:
| Trường hợp | Direct Effect | Indirect Effect |
| Có ý nghĩa | Có ý nghĩa | Trung gian một phần |
| Không ý nghĩa | Có ý nghĩa | Trung gian toàn phần |
| Không ý nghĩa | Không ý nghĩa | Không có trung gian |
5. Gợi ý trình bày kết quả biến trung gian trong chương 4 luận văn
Việc trình bày kết quả kiểm định biến trung gian trong chương 4 không chỉ giúp người đọc dễ hiểu mà còn thể hiện tính học thuật và sự chuyên nghiệp trong nghiên cứu. Dưới đây là các gợi ý cụ thể về bảng biểu, mô tả, và cách minh họa bằng sơ đồ mô hình.
a) Gợi ý bảng trình bày:
Bạn nên trình bày các chỉ số quan trọng của kiểm định trung gian (β – hệ số đường dẫn, p-value, Confidence Interval) theo từng loại hiệu ứng. Một bảng ví dụ như sau:
| Hiệu ứng | Đường dẫn | Hệ số β | p-value | Khoảng tin cậy 95% (CI) | Ý nghĩa thống kê |
| Hiệu ứng trực tiếp | X → Y | 0.122 | 0.082 | [-0.015; 0.245] | Không có ý nghĩa |
| Hiệu ứng gián tiếp | X → M → Y | 0.238 | 0.002 | [0.107; 0.356] | Có ý nghĩa |
| Tổng hiệu ứng | X → Y (Total) | 0.36 | 0 | [0.220; 0.488] | Có ý nghĩa |
Lưu ý: Khoảng tin cậy (CI) không chứa 0 ⇒ mối quan hệ có ý nghĩa thống kê.
b) Gợi ý viết mô tả dưới bảng theo phong cách học thuật:
Kết quả kiểm định biến trung gian cho thấy ảnh hưởng gián tiếp từ biến X đến biến Y thông qua biến trung gian M là có ý nghĩa thống kê (β = 0.238, p = 0.002, CI = [0.107; 0.356]). Trong khi đó, hiệu ứng trực tiếp từ X đến Y không có ý nghĩa (β = 0.122, p = 0.082, CI = [-0.015; 0.245]). Điều này cho thấy M đóng vai trò trung gian toàn phần, tức toàn bộ ảnh hưởng từ X đến Y được truyền qua M. Tổng hiệu ứng từ X đến Y vẫn có ý nghĩa thống kê với β = 0.360 (p = 0.000).
c) Sử dụng sơ đồ mô hình minh họa:
Ngoài bảng biểu và mô tả, bạn nên đưa vào sơ đồ minh họa mô hình SEM-PLS với:
- Các đường dẫn được gắn kèm giá trị β và p.
- Đường mũi tên đậm hoặc màu sắc để thể hiện hiệu ứng gián tiếp.
- Nếu có thể, nên vẽ hai mô hình: mô hình trước khi thêm biến trung gian và mô hình sau khi thêm M, để người đọc dễ so sánh sự thay đổi của Direct effect.
Ví dụ sơ đồ minh họa:

d) Tổng kết ngắn gọn trong phần cuối:
Sau bảng và hình, bạn nên viết 1–2 câu chốt lại, ví dụ:
“Kết quả phân tích bằng SmartPLS cho thấy sự hiện diện của biến trung gian M làm giảm hoặc triệt tiêu ảnh hưởng trực tiếp của X đến Y, khẳng định vai trò trung gian toàn phần trong mô hình nghiên cứu.”
6. Một số lưu ý khi xử lý biến trung gian mediator trong SmartPLS
Biến trung gian (mediator) đóng vai trò thiết yếu trong các mô hình SEM, giúp giải thích cơ chế tác động giữa biến độc lập và biến phụ thuộc. Trong SmartPLS – phần mềm phân tích PLS-SEM phổ biến hiện nay – việc xử lý đúng biến trung gian giúp mô hình đạt được cả giá trị học thuật lẫn ứng dụng. Tuy nhiên, nếu không cẩn trọng, người nghiên cứu có thể mắc phải những lỗi sai nghiêm trọng khi kiểm định biến trung gian.
Vậy khi xử lý biến trung gian mediator trong SmartPLS, cần lưu ý những gì? Hãy cùng Xử Lý Số Liệu tổng hợp 5 điểm quan trọng nhất ngay sau đây.
a) Luôn đảm bảo cơ sở lý thuyết khi thêm biến trung gian vào mô hình
Không nên đưa biến trung gian vào mô hình SEM một cách tùy tiện. Một biến trung gian đúng nghĩa phải có cơ sở lý thuyết rõ ràng, hoặc được kiểm chứng qua các nghiên cứu trước đó.
Ví dụ: Nếu nghiên cứu về ảnh hưởng của chất lượng dịch vụ đến lòng trung thành, bạn chỉ nên thêm sự hài lòng làm biến trung gian nếu có lý thuyết hoặc tài liệu học thuật ủng hộ mối quan hệ này.
b) Kiểm tra hiện tượng đa cộng tuyến nếu biến trung gian là formative
Trong trường hợp biến trung gian được đo lường bằng thang đo hình thành (formative), việc kiểm tra multicollinearity (đa cộng tuyến) giữa các chỉ báo là bắt buộc. Chỉ số cần theo dõi là VIF (Variance Inflation Factor):
- VIF < 3.3 → An toàn
- VIF > 5 → Cần xem lại mô hình, cân nhắc loại bỏ biến
SmartPLS có hỗ trợ tính VIF tự động ở phần Outer Model → đừng bỏ qua bước này nếu bạn muốn kết quả đáng tin cậy.
c) So sánh chỉ số R² và Q² để đánh giá sự cải thiện mô hình
Một trong những cách tốt nhất để xác định giá trị của biến trung gian là xem xét tác động của nó đến chất lượng mô hình:
- R² (Hệ số xác định): cho biết mức độ giải thích của mô hình với biến phụ thuộc.
- Q² (Dự báo ngoại mẫu): thể hiện khả năng dự báo.
Nếu R² và Q² tăng lên sau khi thêm mediator, bạn có thể kết luận rằng biến trung gian đang góp phần nâng cao độ phù hợp và giá trị dự báo của mô hình.
d) Không chỉ nhìn vào hiệu ứng gián tiếp (Indirect effect)
Rất nhiều người dùng SmartPLS chỉ kiểm tra Indirect Effect để kết luận về sự trung gian. Đây là một sai lầm! Để phân biệt trung gian một phần và trung gian toàn phần, bạn cần xem:
- Hiệu ứng trực tiếp (Direct effect) có còn ý nghĩa không sau khi thêm biến trung gian.
- So sánh cả Direct, Indirect, và Total effect với p-value tương ứng.
SmartPLS hỗ trợ mục “Specific Indirect Effects” và bảng tổng hợp hiệu ứng → hãy tận dụng để đưa ra kết luận chính xác.
e) Đảm bảo sự logic trong sơ đồ mô hình SEM
Hãy luôn xem lại sơ đồ đường dẫn: các mối quan hệ trong mô hình cần logic về mặt lý thuyết và thực tiễn. Nếu mô hình quá phức tạp hoặc thiếu tính mạch lạc, kết quả kiểm định biến trung gian dễ bị sai lệch hoặc khó diễn giải.
7. Kết luận
Biến trung gian (mediator) đóng vai trò quan trọng trong việc làm rõ cơ chế tác động giữa các biến trong mô hình nghiên cứu. Việc hiểu và xử lý đúng biến trung gian giúp người nghiên cứu không chỉ mô tả mối quan hệ mà còn lý giải được tại sao và như thế nào một yếu tố ảnh hưởng đến yếu tố khác.
Trong phần mềm SmartPLS, quá trình kiểm định biến trung gian diễn ra tương đối trực quan, bao gồm các bước: xây dựng mô hình, thiết lập Bootstrapping, phân tích các chỉ số hiệu ứng trực tiếp, gián tiếp và tổng thể. Khi diễn giải, cần đặc biệt lưu ý sự thay đổi ý nghĩa thống kê của hiệu ứng trực tiếp khi thêm biến trung gian, để xác định đúng loại trung gian: một phần hay toàn phần.
Tầm quan trọng của việc xử lý đúng biến trung gian mediator
- Đảm bảo mô hình nghiên cứu phản ánh đúng lý thuyết và thực tiễn.
- Làm tăng tính thuyết phục của kết quả nghiên cứu, đặc biệt trong luận văn thạc sĩ, nghiên cứu khoa học.
- Giúp luận giải sâu sắc hơn các hàm ý quản trị và đề xuất chính sách dựa trên cơ sở lý luận rõ ràng.
Gợi ý hướng mở rộng mô hình
- Phân tích nhiều biến trung gian trong cùng một mô hình để kiểm tra các cơ chế tác động phức tạp.
- Kết hợp biến điều tiết để kiểm định mô hình trung gian điều tiết (moderated mediation).
- Áp dụng phân tích đa nhóm để so sánh vai trò trung gian ở các nhóm đối tượng khác nhau.
Nếu bạn chưa quen thao tác hoặc chưa tự tin khi xử lý mô hình có biến trung gian trên SmartPLS, hãy cân nhắc sử dụng dịch vụ hỗ trợ từ Xử Lý Số Liệu:
- Hướng dẫn chi tiết quy trình chạy và kiểm định biến trung gian (mediator) bằng SmartPLS.
- Hỗ trợ viết chương 4 và chương 5 một cách khoa học, đầy đủ bảng biểu, dẫn giải theo chuẩn học thuật.
- Cung cấp mẫu phân tích thực tế, giúp bạn dễ dàng tham khảo và áp dụng.
Truy cập ngay: https://xulysolieu.info/dich-vu-smartpls
Xử lý biến trung gian Mediator – Hướng dẫn trên SmartPLS 4
Biến trung gian (mediator) là biến đóng vai trò can thiệp vào mối quan hệ giữa biến độc lập (X) và biến phụ thuộc (Y). Khi chạy SmartPLS 4, bạn có thể sẽ cần xử lý vấn đề biến trung gian.
Bảng Cross-Loading: Đánh giá tính phân biệt trên SmartPLS 4
Giá trị phân biệt (discriminant validity) giúp đánh giá tính duy nhất và khác biệt của các khái niệm nghiên cứu trong mô hình cấu trúc. Phương pháp phổ biến để đánh giá giá trị phân biệt là dựa vào hệ số tải chéo (cross loadings) của các biến quan sát. Bài viết này giải thích cách sử dụng hệ số tải ngoài và tải chéo trong SMARTPLS 4 để đảm bảo rằng mỗi biến quan sát đo lường đúng nhân tố mẹ, từ đó nâng cao độ chính xác và tin cậy của mô hình nghiên cứu.









