Trang chủ » Kiến thức SPSS » 8 thuật ngữ thống kê quan trọng trong nghiên cứu khoa học & luận văn

8 thuật ngữ thống kê quan trọng trong nghiên cứu khoa học & luận văn

Trong nghiên cứu khoa học và luận văn, việc nắm vững thuật ngữ thống kê thực sự rất quan trọng. Cụ thể là để phân tích và trình bày kết quả chính xác, có tính khoa học. Tuy nhiên, nhiều sinh viên và nhà nghiên cứu thường gặp khó khăn trong việc hiểu thuật ngữ. Cùng với đó là việc áp dụng các thuật ngữ thống kê.

Xem thêm: Khóa luận tốt nghiệp & thực tập tốt nghiệp và những điều cần biết 2024

Bài viết này sẽ giới thiệu và giải thích sâu hơn về những thuật ngữ cơ bản nhất định. Điều này giúp bạn có cái nhìn tổng quan, dễ áp dụng. Từ đó, bạn sẽ tự tin hơn khi xử lý số liệu và trình bày kết quả một cách hiệu quả. Điều này giúp nâng cao chất lượng bài luận văn và nghiên cứu khoa học của bản thân.

Mục lục

1. Hiểu đúng thuật ngữ thống kê tối quan trọng!

Trong bài luận văn và nghiên cứu, chúng ta sẽ gặp các thuật ngữ thống kê thường xuyên. Thật bất ngờ là bao gồm một số thuật ngữ cơ bản lặp lại nhiều lần. Việc hiểu và sử dụng chính xác các thuật ngữ này cực kì quan trọng.

Các thuật ngữ cơ bản là nền tảng nghiên cứu, nên ai cũng phải dùng đúng đó. Bất kì ai nghiên cứu, từ cơ bản đến chuyên nghiệp.
Các thuật ngữ thống kê cơ bản giúp hiểu ngay lập tức những nội dung quan trọng. Vì thế, sử dụng sai thuật ngữ có thể gây ra hiểu lầm. Người đọc có thể không hiểu hoặc hiểu sai ý nghiên cứu.
Với người làm luận văn hoặc nghiên cứu, dùng đúng thuật ngữ là then chốt. Thật không may, sử dụng sai thuật ngữ cơ bản khi trình bày có thể bị đánh giá thấp. Bài nghiên cứu có thể bị trừ điểm hoặc thậm chí không đạt.

2. Một số thuật ngữ thống kê cơ bản cần biết

Tiếp theo, một thuật ngữ cơ bản nhưng quan trọng mà ta cần nắm vững, dùng đúng. Quan trọng là trong mọi tình huống mà bạn gặp phải. Lưu ý rằng, phần giải thích dưới đây sẽ diễn đạt bằng ngôn ngữ đơn giản để dễ hiểu. Thay vì sử dụng các khái niệm hàn lâm rất khó nhằn.

2.1 Tổng thể (thường ký hiệu N) là gì?

Tổng thể là một tập hợp lớn các đối tượng mà nghiên cứu muốn tìm hiểu, khảo sát. Cụ thể đó là là một nhóm người, sản phẩm, sự kiện, hoặc hiện tượng quan tâm.

Ví dụ: Nghiên cứu chúng ta là: “Khảo sát mức độ hài lòng của khách hàng đối với dịch vụ giao hàng nhanh Xulysolieu”. Tổng thể trong trường hợp này là khách hàng đã dùng dịch Xulysolieu. Trên toàn quốc, điều này có nghĩa là bất kỳ ai đã từng sử dụng dịch vụ đều thuộc nghiên cứu. Tổng thể rộng lớn, cái nhìn toàn diện về mức độ hài lòng khách hàng đó. Cụ thể là hài lòng với dịch vụ công ty Xulysolieu.

2.2 Mẫu nghiên cứu (thường ký hiệu n) là gì?

Tổng thể có kích thước quá lớn, việc khảo sát hết đối tượng là không thể. Do đó, nhà nghiên cứu chọn ra nhóm đối tượng từ tổng thể đó. Đặc biệt là để nghiên cứu, và từ đó khái quát hóa ra. Phương pháp này được gọi là chọn mẫu để mà nghiên cứu. Mẫu nghiên cứu (gọi tắt là mẫu) là nhóm đối tượng chọn từ tổng thể. Nhóm này có thể chọn ngẫu nhiên hoặc theo tiêu chí cụ thể. Trong tài liệu này, mẫu nghiên cứu có thể được ký hiệu bằng 2 ký hiệu. Hai kí hiệu đó là N hoặc là n nhen.

Ví dụ: Trong nghiên cứu “Khảo sát mức độ hài lòng của khách hàng về dịch vụ giao hàng nhanh Xulysolieu”. Thật ra, khảo sát toàn bộ tổng thể là gần như không thể đó. Vì vậy, nhà nghiên cứu đã chọn khảo sát 1,000 khách hàng nhất định, đến từ danh sách những người đã sử dụng dịch giao hàng Xulysolieu. Khi đó, mẫu nghiên cứu là 1,000 khách hàng (n=1,000) nha.

2.3 Quan sát là gì?

Mỗi quan sát tương ứng với một đối tượng được khảo sát thực tế. Điều này có nghĩa là khi thu thập dữ liệu từ đối tượng. Thật chú ý là chúng ta thực hiện một quan sát cẩn thận.

Ví dụ: Nếu cỡ mẫu là 1,000, dữ liệu từ 1,000 đối tượng khác nhau nha. Vì vậy, chúng ta có 1,000 quan sát rất cần thiết. Đừng nói nghiên cứu có 1,000 mẫu, hãy nói nghiên cứu có 1,000 quan sát. Nói rằng cỡ mẫu của nghiên cứu là 1,000 đó. Cách diễn đạt này chính xác giúp tránh nhầm lẫn khi mô tả quy mô nghiên cứu. Phải thật cẩn thận đó bạn.

2.4 Mô hình nghiên cứu là gì?

Mô hình nghiên cứu chỉ ra cách các nhân tố liên kết, tương tác theo lý thuyết cơ bản. Một mô hình nghiên cứu gồm hai thành phần cơ bản. Cụ thể (1) các biến nghiên cứu và (2) quan hệ nữa. Một mô hình nghiên cứu đơn giản có thể được biểu diễn đơn giản.

Các biến nghiên cứu: Đây là những yếu tố nhà nghiên cứu muốn khám phá, đo thật kĩ. Chúng có thể là biến độc lập (biến nhà nghiên cứu kiểm soát, thay đổi). Thật cần thiết là và biến phụ thuộc (biến mà nhà nghiên cứu muốn đo lường đó).
Các mối quan hệ giữa các biến nghiên cứu: Đây là cách các biến ảnh hưởng lẫn nhau. Các mối quan hệ này có thể quan hệ nhân quả. (nguyên nhân – kết quả), tương quan, hoặc các dạng liên kết. Hoặc là tùy thuộc vào mục tiêu nghiên cứu nữa đó.

Trong mô hình nghiên cứu này thiết lập mối quan hệ giữa năm nhân tố. Quan trọng là một nhân tố chịu tác động đó nhé.

2.5 Biến độc lập, biến phụ thuộc, biến trung gian là sao?

Biến độc lập (hay nhân tố độc lập) là biến ảnh hưởng biến khác đó nhé. Đây là yếu tố nhà nghiên cứu kiểm soát, thay đổi. Quan trọng là để quan sát sự thay đổi của các biến khác.

Biến phụ thuộc (hay nhân tố phụ thuộc) là biến chịu tác động từ hơn 1 biến đó. Đây là yếu tố nhà nghiên cứu muốn đo lường nữa nhé. Đó là xem nó phản ứng thế nào khi biến độc lập thay đổi.

Biến trung gian (hay nhân tố trung gian) là biến đóng vai trò biến độc lập luôn. Cùng với đó là vai trò biến phụ thuộc nữa kìa. Vai trò của nó là cầu nối hoặc giải thích. Cụ thể là mối quan hệ giữa các biến nhé.

Biểu diễn trong mô hình nghiên cứu:

Trong biểu đồ mô hình nghiên cứu, mũi tên thể hiện sự tác động.
Biến độc lập đặt ở phía gốc mũi tên kìa. Chỉ ra rằng nó tác động lên biến khác được nha.
Biến phụ thuộc nằm ở phía đầu mũi tên đó nhé. Cho thấy nó chịu tác động từ biến cần tìm.

2.6 Biến tiềm ẩn, biến quan sát là gì?

Các yếu tố hành vi và thái độ rất trừu tượng, không đo lường trực tiếp được nha. Để đo lường yếu tố này, nhà nghiên cứu dựa vào yếu tố nhỏ. Đáp ứng hai điều kiện:(1) yếu tố nhỏ phản ánh đầy đủ yếu tố trừu tượng. Cùng với đó là (2) các yếu tố nhỏ này đo lường trực tiếp được. Các yếu tố trừu tượng gọi là biến tiềm ẩn cực tốt. Các yếu tố nhỏ hơn, gọi là biến quan sát nữa đó nhé.

Ví dụ về đo lường sự hài lòng với dịch vụ trong nhà hàng.

Biến tiềm ẩn: Sự hài lòng dịch vụ khách hàng trừu tượng. Quan trọng hơn là một khái niệm không đo lường trực tiếp.
Đo lường sự hài lòng này, cần biến quan sát.
Đánh giá về thái độ từ nhân viên phục vụ.
- Mức độ nhanh chóng từ chính dịch vụ đó.
- Độ sạch sẽ và thoải mái ăn uống nhé. Các biến quan sát này giúp phản ánh tổng quát hài lòng. Rất cần thiết là có thể đo lường trực tiếp được. Thông qua khảo sát hoặc phản hồi từ khách hàng đó nhé.

2.7 Ý nghĩa thống kê là gì?

Khi kết luận các kiểm định, dùng cụm từ “có ý nghĩa thống kê”. Hoặc” không có ý nghĩa thống kê” luôn. Kết luận này cho biết kết quả kiểm định có căn cứ rõ ràng. Quan trọng là không phải kết quả của sự ngẫu nhiên.

“Có ý nghĩa thống kê”: Kết quả kiểm định cho thấy sự khác biệt nữa. Hoạc là mối quan hệ đáng kể giữa các biến mà. Khả năng kết quả này xảy ra ngẫu nhiên rất thấp. Kết quả này đủ mạnh khẳng định nó phản ánh hiện thực nha. Chứ không phải chỉ là sự tình cờ đó.
“Không có ý nghĩa thống kê”: Kết quả không đủ bằng chứng khẳng định có sự khác biệt. Kết quả có thể xảy ra do ngẫu nhiên đó nha. Và không đủ mạnh để bác kết quả đó. Giả thuyết rằng không có sự khác biệt thực sự nè.

2.8 Mức ý nghĩa và độ tin cậy là gì?

Khi kiểm định thống kê, có mức độ lỗi nhất định đó. Lỗi này tồn tại trong bất kỳ phép kiểm định nào. Mức độ có thể chấp nhận gọi là mức ý nghĩa. Mức ý nghĩa phổ biến là 1%, 5%, 10% kia. Mức 5% được sử dụng rộng rãi nhất đó. Nếu mức ý nghĩa kiểm định là 5%, mức độ lỗi có thể chấp nhận được cũng là 5%.

Độ tin cậy là khái niệm ngược lại với mức ý nghĩa kìa. Được tính bằng cách lấy 1 trừ đi mức ý nghĩa nhé. Độ tin cậy thể hiện mức độ chắc chắn kiểm định.

Độ tin cậy 99% tương ứng với mức ý nghĩa 1%. Có 1% khả năng kết quả do ngẫu nhiên nhé.
Độ tin cậy 95% tương ứng với mức ý nghĩa 5%. Cùng với đó là có 5% khả năng kết quả do ngẫu nhiên.

3. Danh mục toàn bộ thuật ngữ thống kê cần nắm

Accuracy	Độ chuẩn xác (Sự chênh lệch giữa giá trị đo và giá trị thực hoặc giá trị chuẩn đã biết trước)
Alternative hypothesis	Đối giả thiết
Analysis of covariance	Phân tích hiệp biến
Analysis of variance (ANOVA)	Phân tích phương sai
Arithmethic mean	Trị trung bình số học
Arrangement	Phép chỉnh hợp
Back transform	Phép phục dạng (hoàn trả dữ liệu về định dạng ban đầu sau khi đã thực hiện chuyển dạng)
Bar chart	Biểu đồ thanh, biểu đồ cột
Bayes’ rule	Định luật xác suất Bayes
Bell shape	Dạng hình chuông đối xứng của biểu đồ tần số (đặc trưng của dữ liệu có phân phối chuẩn)
Bimodal	Biểu đồ tần số có hai giá trị mode (có hai đỉnh)
Binomial distribution	Phân phối nhị phân
Box and Whisker plot	Biểu đồ hình hộp (tương tự Box plot)
Box plot	Biểu đồ hình hộp
Categorical variable	Biến thứ bậc
Central Limit Theorem	Định lý giới hạn trung tâm
Chi-square distribution	Phân phối ‘Khi’ bình phương
Coefficient of correlation	Hệ số tương quan
Coefficient of determination	Hệ số xác định
Coefficient of heterogeneity	Hệ số bất đồng nhất
Coefficient of variation	Hệ số biến động
Combination	Phép tổ hợp
Conditional probability	Xác suất có điều kiện
Confidence interval	Khoảng tin cậy
Confidence level	Mức tin cậy
Continuous variable	Biến số liên tục
Correlation	Tương quan
Covariance	Hiệp phương sai
Critical value	Giá trị tới hạn
Cross validation	Kiểm chứng chéo
Cumulative probability distribution	Hàm phân phối tích lũy
Decile	Trị thập phân
Declustering	Khử co cụm (loại bỏ ảnh hưởng của sự co cụm của dữ liệu đến kết quả tính toán)
Degree of freedom	Bậc tự do
Dependent variable	Biến số phụ thuộc
Determinant	Định thức
Deterministic model	Mô hình tất định (ngược với mô hình xác suất hoặc mô hình ngẫu nhiên)
Discrete variable	Biến số rời rạc
Dot chart	Biểu đồ điểm
Estimate	Ước lượng
Event	Biến cố
Experiment	Phép thử
Extrapolation	Phép ngoại suy
Frequency	Tần số
Gaussian distribution	Phân phối Gauss (phân phối chuẩn)
Geometric mean	Trị trung bình hình học
Goodnes of Fit test	Phép kiểm mức độ phù hợp
Heteroscedasticity	Phương sai thay đổi (khoảng lệch giữa giá trị đo với đường hồi quy không đều)
Histogram	Biểu đồ tần số
Homoscedasticity	Phương sai không thay đổi (khoảng lệch đều so với đường hồi quy)
Hypothesis test	Kiểm định giả thiết thống kê
Independent variable	Biến số độc lập
Interpolation	Phép nội suy
Interquartile range (IQR)	Miền liên tứ phân (IQR = Q3 – Q1)
Inverse distance weighting (IDW)	Trung bình có trọng số tỷ lệ nghịch với khoảng cách
Inverse matrix	Ma trận nghịch đảo
Kolmogorov-Smirnov Test	Phép kiểm Kolgomorov-Smirnov (thường được dùng để đánh giá dữ liệu có phù hợp hay không với một phân phối được chọn trước)
Kriging	Phương pháp nội suy Kriging (được đặt theo tên của kỹ sư D.G. Krige – người đặt nền móng cho phương pháp này)
Kurtosis	Độ nhọn của biểu đồ tần số
Law of Large Numbers	Định luật số lớn
Least squares method	Phương pháp bình phương cực tiểu
Linear regression	Hồi quy tuyến tính
Linear regression analysis	Phân tích hồi quy tuyến tính
Lower quartile (Q1)	Giá trị tứ phân dưới
Maximum likelihood method	Phương pháp hợp lý cực đại
Mean	Trị trung bình
Mean Squared Error (MSE)	Sai số trung bình bình phương
Median	Trị trung vị (điểm giữa)
Missing value	Giá trị bị thiếu (giá trị không có trong tập số liệu)
Mode	a) Trị có tần số cao nhất b) Trị tin chắc nhất c) Trị có khả năng nhất
Model	Mô hình
Multiple linear regression analysis	Phân tích hồi quy tuyến tính đa biến
Negative skew	Nghiêng trái (dữ liệu có vài điểm thấp bất thường)
Non-linear regression	Hồi quy phi tuyến
Normal distribution	Phân phối chuẩn
Null hypothesis	Giả thiết ‘không’
One Way Analysis of Variance	Phân tích phương sai một phía
One-sided Test	Phép kiểm một phía
Outlier	a) Giá trị dị thường b) Giá trị ngoại lệ c) Sai số
P-value	Trị số P
Parameter	Thông số
Percentile	Trị bách phân
Permutation	Phép hoán vị
Pie chart	Biểu đồ hình tròn
Poisson distribution	Phân phối Poisson
Polynomial regression	Hồi quy đa thức
Population	Đám đông / Quần thể / Tổng thể
Positive skew	Nghiêng phải (dữ liệu có vài giá trị cao bất thường)
Precision	Độ chính xác (độ lặp lại của giá trị đo khi được thực hiện nhiều lần trong cùng một điều kiện)
Predictor variable	Biến số độc lập
Probability	Xác suất
Probability density distribution	Hàm mật độ xác suất
Q-Q plot	Biểu đồ định bậc Quantile-Quantile (được dùng để đánh giá dữ liệu có phù hợp hay không với một phân phối được chọn trước)
Quantile	Hàm định bậc
Quartile	Trị tứ phân
Random event	Biến cố ngẫu nhiên
Random variable	Biến số ngẫu nhiên
Residual	Phần dư
Residual mean square	Trung bình bình phương phần dư
Residual sum of squares	Tổng bình phương phần dư
Robust estimation	Ước lượng vững
Rose diagram	Biểu đồ hoa hồng
Sample	Mẫu (tập con của ‘population’)
Scalar matrix	Ma trận vô hướng
Scatter plot	Biểu đồ tán xạ / Biểu đồ phân tán
Semivariogram	Biểu đồ bán phương sai (biểu diễn nửa giá trị của phương sai theo khoảng cách giữa các điểm dữ liệu)
Simulation	Mô phỏng
Skewness	a) Độ nghiêng của biểu đồ tần số b) Hệ số bất đối xứng
Standard deviation	Độ lệch chuẩn
Standard error	Sai số chuẩn
Standardized normal distribution	Phân phối chuẩn được chuẩn hóa
Stochastic model	Mô hình xác suất / Mô hình ngẫu nhiên (ngược với mô hình tất định)
Student distribution	Phân phối Student (Student là biệt danh của phân phối này do William Gosset đặt tên) / Phân phối t
Sum of squares	Tổng bình phương
Systematic error	Sai số có tính hệ thống
Transformation	Phương pháp chuyển dạng dữ liệu
Transposed matrix	Ma trận chuyển vị
Trial and Error method	Phương pháp thử và sai
Two Way Analysis of Variance	Phân tích phương sai hai phía
Two-sided test	Phép kiểm hai phía
Type I and Type II errors	Sai số loại I và sai số loại II. Nếu bác bỏ giả thiết ‘không’ mặc dù giả thiết ‘không’ là đúng thì sẽ mắc phải sai số loại I. Ngược lại, nếu chấp nhận giả thiết ‘không’ mặc dù giả thiết này sai thì sẽ mắc phải sai số loại II.
Unbiased estimation	Ước lượng không chệch
Uncertainty	a) Độ không chắc chắn b) Độ không đảm bảo đo
Upper quartile (Q3)	Giá trị tứ phân trên
Variance	Phương sai
Variogram	Biểu đồ phương sai (biểu diễn phương sai theo khoảng cách giữa các điểm)
Venn diagram	Sơ đồ Venn
Weight	Trọng số
Weighted mean	Trị trung bình trọng số

Kết luận

Việc hiểu rõ và áp dụng chính xác các thuật ngữ thống kê trong các công trình nghiên cứu khoa học và bài luận văn không chỉ giúp bạn phân tích số liệu một cách hiệu quả mà còn nâng cao độ tin cậy và giá trị của công trình nghiên cứu mà bạn đang làm nữa đó. Hy vọng rằng bài viết này đã cung cấp cho bạn những kiến thức cần thiết và giúp bạn dễ dàng hơn trong quá trình làm việc với các số liệu thống kê hiện nay. Hãy tiếp tục trau dồi và áp dụng những kiến thức này để đạt được kết quả tốt nhất trong các nghiên cứu và bài luận văn của bạn đó nhé. Bạn đừng quên ghé thăm và tìm hiểu thêm tại xulysolieu.info để biết thêm nhiều kiến thức hay và bổ ích nữa nha!

Bạn có thể tham khảo Dịch vụ chạy SPSS ở trên kia, trong đó bao gồm tất cả các kiểm định cực kì quan trọng và kèm dữ liệu đẹp đáp ứng yêu cầu bài của bạn nha. Hoặc bạn có thể trực tiếp liên hệ thông quan fanpage chính thức của xulysolieu.info để chuyên viên tư vấn và hướng dẫn cho bạn một cách tận tình hơn nhé!

Hy vọng rằng thông qua bài viết này, bạn đã có thêm nhiều thông tin hữu ích để hỗ trợ cho công việc học tập và nghiên cứu của mình. Đừng quên rằng sự kiên nhẫn và thực hành thường xuyên sẽ giúp bạn trở nên thành thạo hơn với các kỹ thuật thống kê, từ đó nâng cao giá trị của các công trình nghiên cứu mà bạn tham gia. Chúc bạn luôn thành công!