8 thuật ngữ thống kê quan trọng trong nghiên cứu khoa học & luận văn

Trong quá trình nghiên cứu khoa học và thực hiện luận văn, việc nắm vững các thuật ngữ thống kê là yếu tố then chốt để phân tích và trình bày kết quả một cách chính xác và khoa học. Tuy nhiên, nhiều sinh viên và nhà nghiên cứu thường gặp khó khăn trong việc hiểu rõ và áp dụng các thuật ngữ này.

Bài viết này sẽ giới thiệu và giải thích chi tiết về những thuật ngữ cơ bản, giúp bạn có cái nhìn tổng quan và dễ dàng áp dụng vào công việc nghiên cứu của mình. Từ đó, bạn sẽ tự tin hơn khi xử lý số liệu và trình bày kết quả, nâng cao chất lượng bài luận văn và nghiên cứu khoa học.

Xem thêm: Khóa luận tốt nghiệp & thực tập tốt nghiệp và những điều cần biết 2024

8 Thuật Ngữ Thống Kê Quan Trọng Trong Nghiên Cứu Khoa Học &Amp; Luận Văn

8 thuật ngữ thống kê quan trọng

1. Tầm quan trọng của hiểu đúng thuật ngữ thống kê

Trong bài luận văn và nghiên cứu, chúng ta sẽ gặp nhiều thuật ngữ thống kê, bao gồm một số thuật ngữ cơ bản được lặp lại nhiều lần. Việc hiểu và sử dụng chính xác những thuật ngữ này là rất quan trọng vì:
  • Các thuật ngữ cơ bản này là nền tảng cho bài nghiên cứu, và bất kỳ ai làm nghiên cứu, từ cấp độ cơ bản đến chuyên nghiệp, đều phải sử dụng đúng.
  • Những thuật ngữ thống kê cơ bản này giúp các nhà nghiên cứu hiểu ngay lập tức nội dung được đề cập. Do đó, nếu sử dụng sai thuật ngữ, người đọc có thể không hiểu hoặc hiểu sai ý định và nội dung mà tác giả muốn truyền đạt.
  • Đối với các bạn đang làm luận văn hoặc nghiên cứu, việc sử dụng đúng thuật ngữ là cực kỳ quan trọng. Sử dụng sai thuật ngữ cơ bản khi trình bày hoặc viết luận có thể dẫn đến việc bài nghiên cứu bị đánh giá thấp, bị trừ điểm hoặc thậm chí không đạt yêu cầu.

2. Một số thuật ngữ thống kê cơ bản

Tiếp theo là một thuật ngữ cơ bản nhưng vô cùng quan trọng mà chúng ta cần nắm vững và sử dụng đúng trong mọi tình huống. Lưu ý rằng, phần giải thích dưới đây sẽ được diễn đạt bằng ngôn ngữ thông thường để dễ dàng hiểu, thay vì sử dụng các khái niệm hàn lâm.

2.1 Tổng thể (thường ký hiệu N)

Tổng thể là một tập hợp lớn các đối tượng mà nghiên cứu của chúng ta muốn tìm hiểu hoặc khảo sát. Đây có thể là một nhóm người, sản phẩm, sự kiện, hoặc hiện tượng mà chúng ta quan tâm đến.
Ví dụ: Nghiên cứu của chúng ta là “Khảo sát mức độ hài lòng của khách hàng đối với dịch vụ giao hàng nhanh của công ty Xulysolieu.” Tổng thể trong trường hợp này là tất cả những người đã và đang sử dụng dịch vụ giao hàng nhanh của công ty Xulysolieu trên toàn quốc. Điều này có nghĩa là bất kỳ ai từng sử dụng dịch vụ này, dù ở đâu, đều thuộc vào tổng thể của nghiên cứu. Tổng thể rộng lớn này giúp chúng ta có cái nhìn toàn diện về mức độ hài lòng của khách hàng đối với dịch vụ của công ty Xulysolieu.

2.2 Mẫu nghiên cứu (thường ký hiệu n)

Tổng thể là một kích thước quá lớn, và khi điều tra đặc tính của tổng thể, chúng ta không thể khảo sát hết tất cả các đối tượng trong đó. Do đó, nhà nghiên cứu chọn ra một nhóm đối tượng từ tổng thể để nghiên cứu, và từ đó khái quát hóa kết quả ra toàn bộ tổng thể. Phương pháp này được gọi là chọn mẫu nghiên cứu. Mẫu nghiên cứu (gọi ngắn gọn là mẫu) là một nhóm đối tượng được chọn ra từ tổng thể để nghiên cứu, có thể được chọn ngẫu nhiên hoặc theo một tiêu chí cụ thể nào đó. Trong tài liệu này, mẫu nghiên cứu có thể được ký hiệu bằng hai ký hiệu là N hoặc n.
Ví dụ: Trong nghiên cứu “Khảo sát mức độ hài lòng của khách hàng đối với dịch vụ giao hàng nhanh của công ty Xulysolieu.” Việc khảo sát toàn bộ tổng thể là gần như không thể, do đó nhà nghiên cứu đã chọn khảo sát 1,000 khách hàng từ danh sách những người đã sử dụng dịch vụ giao hàng nhanh của công ty Xulysolieu. Khi đó, mẫu nghiên cứu là 1,000 khách hàng (n=1,000).
8 Thuat Ngu Thong Ke Quan Trong Trong Nghien Cuu Khoa Hoc Luan Van 1

Tổng thể và Mẫu nghiên cứu

2.3 Quan sát

Mỗi một quan sát tương ứng với một đối tượng khảo sát. Điều này có nghĩa là mỗi khi chúng ta thu thập dữ liệu từ một đối tượng trong mẫu nghiên cứu, chúng ta thực hiện một quan sát.
Ví dụ: Nếu cỡ mẫu là 1,000, điều đó có nghĩa là chúng ta đã thu thập dữ liệu từ 1,000 đối tượng khảo sát khác nhau, và do đó chúng ta có 1,000 quan sát. Vì vậy, chúng ta không nên nói rằng nghiên cứu có 1,000 mẫu, mà nên nói rằng nghiên cứu có 1,000 quan sát hoặc cỡ mẫu của nghiên cứu là 1,000. Cách diễn đạt này chính xác hơn và giúp tránh nhầm lẫn trong việc mô tả quy mô của nghiên cứu.

2.4 Mô hình nghiên cứu

Mô hình nghiên cứu chỉ ra cách thức các nhân tố (biến nghiên cứu) liên kết và tương tác với nhau dựa trên các lý thuyết nền tảng. Một mô hình nghiên cứu gồm hai thành phần cơ bản là: (1) các biến nghiên cứu và (2) các mối quan hệ giữa các biến nghiên cứu. Một mô hình nghiên cứu đơn giản có thể được biểu diễn như sau:
  • Các biến nghiên cứu: Đây là những yếu tố mà nhà nghiên cứu muốn khám phá và đo lường. Chúng có thể là biến độc lập (biến mà nhà nghiên cứu có thể kiểm soát hoặc thay đổi) và biến phụ thuộc (biến mà nhà nghiên cứu muốn đo lường tác động của biến độc lập lên nó).
  • Các mối quan hệ giữa các biến nghiên cứu: Đây là cách thức các biến liên kết và ảnh hưởng lẫn nhau. Các mối quan hệ này có thể là mối quan hệ nhân quả (nguyên nhân – kết quả), tương quan, hoặc các dạng liên kết khác tùy thuộc vào mục tiêu nghiên cứu.
8 Thuat Ngu Thong Ke Quan Trong Trong Nghien Cuu Khoa Hoc Luan Van 2

Mô hình nghiên cứu về sự hài lòng

Trong mô hình nghiên cứu này thiết lập mối quan hệ giữa năm nhân tố với một nhân tố chịu tác động.

2.5 Biến độc lập, biến phụ thuộc, nhân tố

Biến độc lập (hay nhân tố độc lập) là biến có khả năng ảnh hưởng hoặc tác động lên một biến khác trong nghiên cứu. Đây là yếu tố mà nhà nghiên cứu kiểm soát hoặc thay đổi để quan sát sự thay đổi của biến khác.
Biến phụ thuộc (hay nhân tố phụ thuộc) là biến chịu sự tác động từ một hoặc nhiều biến độc lập. Đây là yếu tố mà nhà nghiên cứu muốn đo lường để xem nó phản ứng như thế nào với sự thay đổi của biến độc lập.
Biến trung gian (hay nhân tố trung gian) là biến có thể vừa đóng vai trò là biến độc lập trong một mối quan hệ và đồng thời là biến phụ thuộc trong một mối quan hệ khác. Nó có vai trò làm cầu nối hoặc giải thích mối quan hệ giữa các biến độc lập và biến phụ thuộc.
Biểu diễn trong mô hình nghiên cứu:
  • Trong biểu đồ mô hình nghiên cứu, mũi tên thường được sử dụng để thể hiện sự tác động giữa các biến.
  • Biến độc lập sẽ được đặt ở phía gốc của mũi tên, chỉ ra rằng nó tác động lên biến khác.
  • Biến phụ thuộc sẽ nằm ở phía đầu của mũi tên, cho thấy nó chịu tác động từ biến độc lập.

2.6 Biến tiềm ẩn, biến quan sát

Các yếu tố hành vi và thái độ thường mang tính trừu tượng và không thể đo lường trực tiếp. Để đo lường những yếu tố này, nhà nghiên cứu cần dựa vào các yếu tố nhỏ hơn đáp ứng hai điều kiện: (1) các yếu tố nhỏ này phải phản ánh đầy đủ các đặc điểm của yếu tố trừu tượng, và (2) các yếu tố nhỏ này phải có thể đo lường trực tiếp. Các yếu tố trừu tượng được gọi là biến tiềm ẩn, còn các yếu tố nhỏ hơn được gọi là biến quan sát.
Ví dụ về đo lường sự hài lòng với dịch vụ khách hàng trong một nhà hàng:
  • Biến tiềm ẩn: “Sự hài lòng với dịch vụ khách hàng” là một yếu tố trừu tượng, vì đây là một khái niệm không thể đo lường trực tiếp.
  • Để đo lường sự hài lòng này, chúng ta cần các biến quan sát cụ thể như:
    • Đánh giá về thái độ của nhân viên phục vụ
    • Mức độ nhanh chóng của dịch vụ
    • Độ sạch sẽ và thoải mái của môi trường ăn uống
Các biến quan sát này giúp phản ánh một cách tổng quát về sự hài lòng của khách hàng và có thể đo lường trực tiếp thông qua khảo sát hoặc phản hồi từ khách hàng.

2.7 Ý nghĩa thống kê

Khi kết luận các kiểm định, chúng ta thường sử dụng cụm từ “có ý nghĩa thống kê” hoặc “không có ý nghĩa thống kê”. Kết luận này cho biết rằng kết quả thu được từ phép kiểm định là có căn cứ rõ ràng và không phải là kết quả của sự ngẫu nhiên hay đánh giá định tính.
  • “Có ý nghĩa thống kê”: Điều này có nghĩa là kết quả của phép kiểm định cho thấy có sự khác biệt hoặc mối quan hệ đáng kể giữa các biến nghiên cứu, và khả năng kết quả này xảy ra ngẫu nhiên là rất thấp. Nói cách khác, kết quả này là đủ mạnh để khẳng định rằng nó phản ánh hiện thực hơn là chỉ là sự tình cờ.
  • “Không có ý nghĩa thống kê”: Điều này có nghĩa là không có đủ bằng chứng từ phép kiểm định để khẳng định sự khác biệt hoặc mối quan hệ giữa các biến nghiên cứu. Kết quả có thể xảy ra do ngẫu nhiên và không đủ mạnh để bác bỏ giả thuyết rằng không có sự khác biệt thực sự.

2.8 Mức ý nghĩa và độ tin cậy

Khi thực hiện kiểm định thống kê, luôn có một mức độ lỗi nhất định, và lỗi này tồn tại trong bất kỳ phép kiểm định nào. Mức độ có thể chấp nhận được của kết quả kiểm định được gọi là mức ý nghĩa. Mức ý nghĩa phổ biến trong các ngành nghiên cứu thường là 1%, 5%, và 10%, với mức 5% được sử dụng rộng rãi nhất. Nếu mức ý nghĩa của kiểm định là 5%, điều này có nghĩa là mức độ lỗi có thể chấp nhận của phép kiểm định là 5%.
Độ tin cậy là khái niệm ngược lại với mức ý nghĩa và được tính bằng cách lấy 1 trừ đi mức ý nghĩa. Độ tin cậy thể hiện mức độ chắc chắn của kết quả kiểm định.
  • Độ tin cậy 99% tương ứng với mức ý nghĩa 1%, có nghĩa là có 1% khả năng kết quả là do ngẫu nhiên.
  • Độ tin cậy 95% tương ứng với mức ý nghĩa 5%, nghĩa là có 5% khả năng kết quả là do ngẫu nhiên.

3. Danh mục toàn bộ thuật ngữ thống kê

Accuracy Độ chuẩn xác (Sự chênh lệch giữa giá trị đo và giá trị thực hoặc giá trị chuẩn đã biết trước)
Alternative hypothesis Đối giả thiết
Analysis of covariance Phân tích hiệp biến
Analysis of variance (ANOVA) Phân tích phương sai
Arithmethic mean Trị trung bình số học
Arrangement Phép chỉnh hợp
Back transform Phép phục dạng (hoàn trả dữ liệu về định dạng ban đầu sau khi đã thực hiện chuyển dạng)
Bar chart Biểu đồ thanh, biểu đồ cột
Bayes’ rule Định luật xác suất Bayes
Bell shape Dạng hình chuông đối xứng của biểu đồ tần số (đặc trưng của dữ liệu có phân phối chuẩn)
Bimodal Biểu đồ tần số có hai giá trị mode (có hai đỉnh)
Binomial distribution Phân phối nhị phân
Box and Whisker plot Biểu đồ hình hộp (tương tự Box plot)
Box plot Biểu đồ hình hộp
Categorical variable Biến thứ bậc
Central Limit Theorem Định lý giới hạn trung tâm
Chi-square distribution Phân phối ‘Khi’ bình phương
Coefficient of correlation Hệ số tương quan
Coefficient of determination Hệ số xác định
Coefficient of heterogeneity Hệ số bất đồng nhất
Coefficient of variation Hệ số biến động
Combination Phép tổ hợp
Conditional probability Xác suất có điều kiện
Confidence interval Khoảng tin cậy
Confidence level Mức tin cậy
Continuous variable Biến số liên tục
Correlation Tương quan
Covariance Hiệp phương sai
Critical value Giá trị tới hạn
Cross validation Kiểm chứng chéo
Cumulative probability distribution Hàm phân phối tích lũy
Decile Trị thập phân
Declustering Khử co cụm (loại bỏ ảnh hưởng của sự co cụm của dữ liệu đến kết quả tính toán)
Degree of freedom Bậc tự do
Dependent variable Biến số phụ thuộc
Determinant Định thức
Deterministic model Mô hình tất định (ngược với mô hình xác suất hoặc mô hình ngẫu nhiên)
Discrete variable Biến số rời rạc
Dot chart Biểu đồ điểm
Estimate Ước lượng
Event Biến cố
Experiment Phép thử
Extrapolation Phép ngoại suy
Frequency Tần số
Gaussian distribution Phân phối Gauss (phân phối chuẩn)
Geometric mean Trị trung bình hình học
Goodnes of Fit test Phép kiểm mức độ phù hợp
Heteroscedasticity Phương sai thay đổi (khoảng lệch giữa giá trị đo với đường hồi quy không đều)
Histogram Biểu đồ tần số
Homoscedasticity Phương sai không thay đổi (khoảng lệch đều so với đường hồi quy)
Hypothesis test Kiểm định giả thiết thống kê
Independent variable Biến số độc lập
Interpolation Phép nội suy
Interquartile range (IQR) Miền liên tứ phân (IQR = Q3 – Q1)
Inverse distance weighting (IDW) Trung bình có trọng số tỷ lệ nghịch với khoảng cách
Inverse matrix Ma trận nghịch đảo
Kolmogorov-Smirnov Test Phép kiểm Kolgomorov-Smirnov (thường được dùng để đánh giá dữ liệu có phù hợp hay không với một phân phối được chọn trước)
Kriging Phương pháp nội suy Kriging (được đặt theo tên của kỹ sư D.G. Krige – người đặt nền móng cho phương pháp này)
Kurtosis Độ nhọn của biểu đồ tần số
Law of Large Numbers Định luật số lớn
Least squares method Phương pháp bình phương cực tiểu
Linear regression Hồi quy tuyến tính
Linear regression analysis Phân tích hồi quy tuyến tính
Lower quartile (Q1) Giá trị tứ phân dưới
Maximum likelihood method Phương pháp hợp lý cực đại
Mean Trị trung bình
Mean Squared Error (MSE) Sai số trung bình bình phương
Median Trị trung vị (điểm giữa)
Missing value Giá trị bị thiếu (giá trị không có trong tập số liệu)
Mode a) Trị có tần số cao nhất
b) Trị tin chắc nhất
c) Trị có khả năng nhất
Model Mô hình
Multiple linear regression analysis Phân tích hồi quy tuyến tính đa biến
Negative skew Nghiêng trái (dữ liệu có vài điểm thấp bất thường)
Non-linear regression Hồi quy phi tuyến
Normal distribution Phân phối chuẩn
Null hypothesis Giả thiết ‘không’
One Way Analysis of Variance Phân tích phương sai một phía
One-sided Test Phép kiểm một phía
Outlier a) Giá trị dị thường
b) Giá trị ngoại lệ
c) Sai số
P-value Trị số P
Parameter Thông số
Percentile Trị bách phân
Permutation Phép hoán vị
Pie chart Biểu đồ hình tròn
Poisson distribution Phân phối Poisson
Polynomial regression Hồi quy đa thức
Population Đám đông / Quần thể / Tổng thể
Positive skew Nghiêng phải (dữ liệu có vài giá trị cao bất thường)
Precision Độ chính xác (độ lặp lại của giá trị đo khi được thực hiện nhiều lần trong cùng một điều kiện)
Predictor variable Biến số độc lập
Probability Xác suất
Probability density distribution Hàm mật độ xác suất
Q-Q plot Biểu đồ định bậc Quantile-Quantile (được dùng để đánh giá dữ liệu có phù hợp hay không với một phân phối được chọn trước)
Quantile Hàm định bậc
Quartile Trị tứ phân
Random event Biến cố ngẫu nhiên
Random variable Biến số ngẫu nhiên
Residual Phần dư
Residual mean square Trung bình bình phương phần dư
Residual sum of squares Tổng bình phương phần dư
Robust estimation Ước lượng vững
Rose diagram Biểu đồ hoa hồng
Sample Mẫu (tập con của ‘population’)
Scalar matrix Ma trận vô hướng
Scatter plot Biểu đồ tán xạ / Biểu đồ phân tán
Semivariogram Biểu đồ bán phương sai (biểu diễn nửa giá trị của phương sai theo khoảng cách giữa các điểm dữ liệu)
Simulation Mô phỏng
Skewness a) Độ nghiêng của biểu đồ tần số
b) Hệ số bất đối xứng
Standard deviation Độ lệch chuẩn
Standard error Sai số chuẩn
Standardized normal distribution Phân phối chuẩn được chuẩn hóa
Stochastic model Mô hình xác suất / Mô hình ngẫu nhiên (ngược với mô hình tất định)
Student distribution Phân phối Student (Student là biệt danh của phân phối này do William Gosset đặt tên) / Phân phối t
Sum of squares Tổng bình phương
Systematic error Sai số có tính hệ thống
Transformation Phương pháp chuyển dạng dữ liệu
Transposed matrix Ma trận chuyển vị
Trial and Error method Phương pháp thử và sai
Two Way Analysis of Variance Phân tích phương sai hai phía
Two-sided test Phép kiểm hai phía
Type I and Type II errors Sai số loại I và sai số loại II. Nếu bác bỏ giả thiết ‘không’ mặc dù giả thiết ‘không’ là đúng thì sẽ mắc phải sai số loại I. Ngược lại, nếu chấp nhận giả thiết ‘không’ mặc dù giả thiết này sai thì sẽ mắc phải sai số loại II.
Unbiased estimation Ước lượng không chệch
Uncertainty a) Độ không chắc chắn
b) Độ không đảm bảo đo
Upper quartile (Q3) Giá trị tứ phân trên
Variance Phương sai
Variogram Biểu đồ phương sai (biểu diễn phương sai theo khoảng cách giữa các điểm)
Venn diagram Sơ đồ Venn
Weight Trọng số
Weighted mean Trị trung bình trọng số

Việc hiểu rõ và áp dụng chính xác các thuật ngữ thống kê trong nghiên cứu khoa học và luận văn không chỉ giúp bạn phân tích số liệu một cách hiệu quả mà còn nâng cao độ tin cậy và giá trị của công trình nghiên cứu. Hy vọng rằng bài viết này đã cung cấp cho bạn những kiến thức cần thiết và giúp bạn dễ dàng hơn trong quá trình làm việc với các số liệu thống kê. Hãy tiếp tục trau dồi và áp dụng những kiến thức này để đạt được kết quả tốt nhất trong các nghiên cứu và bài luận văn của bạn.

——

Bạn có thể tham khảo Dịch vụ chạy SPSS, trong đó bao gồm tất cả các kiểm định quan trọng và kèm dữ liệu đẹp đáp ứng yêu cầu bài của bạn. Hoặc bạn có thể trực tiếp liên hệ thông quan fanpage chính thức của xulysolieu.info

Bài viết này hữu ích với bạn?

Bình luận

Bài liên quan
error: Nội dung bản quyền !!