Một số thuật ngữ thống kê luận văn cần biết

 Trong bài luận văn, nghiên cứu chúng ta sẽ sử dụng nhiều thuật ngữ thống kê, trong đó có một số thuật ngữ cơ bản lặp lại rất nhiều lần. Việc hiểu và sử dụng chính xác các thuật ngữ cơ bản này là điều rất cần thiết, bởi vì:

  • Các thuật ngữ cơ bản này đóng vai trò nền tảng trong bài nghiên cứu và bắt buộc mọi người làm nghiên cứu, từ cấp độ cơ bản đến chuyên nghiệp đều phải sử dụng đúng.
  • Đã là những thuật ngữ cơ bản nền tảng, những người làm nghiên cứu với nhau sẽ đọc thuật ngữ và hiểu ngay điều thuật ngữ này nói đến là gì. Do vậy, khi sử dụng sai thuật ngữ, người khác đọc phần trình bày sẽ không hiểu được hoặc hiểu sai ý đồ cũng như nội dung mà tác giả muốn trình bày.
  • Nếu là các bạn đang làm luận văn, làm nghiên cứu thì việc sử dụng đúng thuật ngữ là vô cùng cần thiết, việc sử dụng sai các thuật ngữ cơ bản khi trình bày, viết luận có thể bài nghiên cứu sẽ bị đánh giá thấp, đánh trượt hoặc trừ điểm.

Dưới đây là một thuật ngữ cơ bản nhưng cực kỳ quan trọng mà chúng ta sẽ cần hiểu và sử dụng đúng trong mọi trường hợp. Lưu ý rằng, phần trình bày dưới đây sẽ diễn giải bằng từ ngữ phổ thông để chúng ta hiểu một cách dễ dàng nhất chứ không đi vào các khái niệm hàn lâm.

Một số thuật ngữ thống kê luận văn cần biết

1. Tổng thể (thường ký hiệu N)

Tổng thể là một kích thước rất lớn số lượng người thuộc đối tượng chúng ta cần khảo sát. 

Ví dụ: Nghiên cứu của chúng ta là “Khảo sát thái độ của khách hàng đối với dòng sản phẩm nước hoa hiệu A đã có mặt trên thị trường 5 năm”. Lúc này, tổng thể là tất cả những người đã và đang sử dụng sản phẩm nước hoa A trên toàn Thế giới, bất kỳ ai sử dụng nước hoa hiệu A đều nằm trong tổng thể.

2. Mẫu nghiên cứu (thường ký hiệu n)

Tổng thể là một kích thước quá lớn, khi điều tra đặc tính của tổng thể chúng ta không thể khảo sát hết các đối tượng trong tổng thể đó. Chính vì vậy, nhà nghiên cứu chọn một nhóm đối tượng trong tổng thể để nghiên cứu và từ đó khái quát kết quả ra tổng thể, cách làm như vậy gọi là chọn mẫu nghiên cứu. Mẫu nghiên cứu (gọi ngắn gọn là mẫu) là một nhóm đối tượng được chọn ra từ tổng thể để nghiên cứu, có thể là ngẫu nhiên hoặc theo một tiêu chí nào đó. Trong tài liệu này, mẫu nghiên cứu có thể được sử dụng với hai ký hiệu N hoặc n.

Ví dụ: Ở nghiên cứu “Khảo sát thái độ của khách hàng đối với dòng sản phẩm nước hoa hiệu A đã có mặt trên thị trường 5 năm”. Việc khảo sát với tổng thể là gần như bất khả thi, người nghiên cứu đã chọn khảo sát 1000 khách hàng trong danh sách khách hàng đã mua nước hoa hiệu A. Khi đó mẫu nghiên cứu là 1000 (n=1000).

3. Quan sát

Mỗi một quan sát tương ứng với một đối tượng khảo sát. 

Ví dụ: Cỡ mẫu 1000 nghĩa là chúng ta có 1000 quan sát. Do vậy, chúng ta không được nói nghiên cứu có 1000 mẫu mà phải nói nghiên cứu có 1000 quan sát hoặc cỡ mẫu của nghiên cứu là 1000.

4. Mô hình nghiên cứu

Mô hình nghiên cứu chỉ ra mối quan hệ giữa các nhân tố (biến nghiên cứu) với nhau như thế nào dựa trên các lý thuyết nền tảng… Một mô hình nghiên cứu gồm gồm 2 thành phần cơ bản là: (1) các biến nghiên cứu và (2) các mối quan hệ giữa các biến nghiên cứu. Một mô hình nghiên cứu đơn giản có thể được biểu diễn như sau: 

Biến độc lập, biến phụ thuộc

Trong mô hình nghiên cứu này thiết lập mối quan hệ giữa bốn nhân tố tác động với một nhân tố chịu tác động.

5. Biến độc lập, biến phụ thuộc, nhân tố

Biến độc lập (nhân tố độc lập) là biến tác động lên biến khác. Biến phụ thuộc (nhân tố phụ thuộc) là biến chịu tác động từ một hay nhiều biến độc lập. Biến độc lập và biến phụ thuộc có thể được gọi chung là nhân tố hoặc biến nghiên cứu.

Trong một mô hình nghiên cứu có thể có một biến vừa là biến độc lập vừa là biến phụ thuộc, những biến như vậy gọi là biến trung gian (nhân tố trung gian). Về mặt biểu diễn hình vẽ, mũi tên đại diện cho sự tác động, biến phụ thuộc sẽ ở phía mũi tên hướng vào, biến độc lập sẽ ở phía mũi tên đi ra.

6. Biến tiềm ẩn, biến quan sát

Các yếu tố hành vi, thái độ mang tính trừu tượng và không thể đo lường một cách trực tiếp. Để đo lường được các yếu tố này, nhà nghiên cứu sẽ phải đo chúng thông qua các yếu tố nhỏ thỏa mãn hai điều kiện, (1) các yếu tố nhỏ này phản ánh tương đối đầy đủ tính chất yếu tố trừu tượng, (2) các yếu tố nhỏ này có thể đo lường trực tiếp được. Các yếu tố trừu tượng được gọi là biến tiềm ẩn, các yếu tố nhỏ được gọi là biến quan sát. 

Ví dụ về đo lường động lực làm việc của nhân viên trong một công ty. Biến “động lực làm việc” là biến tiềm ẩn bởi đây là một khái niệm trừu tượng. Chúng ta cần xác định biến này qua các khía cạnh: sự hài lòng với công việc hiện tại, sự chú tâm khi làm việc, mong muốn gắn bó với công ty trong thời gian tới… 

7. Ý nghĩa thống kê

Khi kết luận các kiểm định, chúng ta thường sử dụng cụm từ “có ý nghĩa thống kê” hoặc “không có ý nghĩa thống kê”. Kết luận này nói lên rằng kết quả có được là từ một phép kiểm định định lượng, dựa trên những căn cứ xác định rõ ràng chứ không phải xảy ra do ngẫu nhiên, đánh giá định tính.

8. Mức ý nghĩa và độ tin cậy

Khi thực hiện kiểm định luôn có một mức độ lỗi nhất định, lỗi này luôn luôn tồn tại trong bất kì phép kiểm định nào. Mức độ có thể chấp nhận kết quả kiểm định có ý nghĩa thống kê hay không được gọi là mức ý nghĩa. Trong hầu hết các ngành, mức ý nghĩa thường được sử dụng là 1%, 5% và 10%, trong đó mức 5% được sử dụng rộng rãi nhất. Nói mức ý nghĩa của kiểm định là 5% nghĩa là mức độ lỗi có thể chấp nhận của phép kiểm định đó là 5%.

Ngược lại với mức ý nghĩa là độ tin cậy, độ tin cậy được tính bằng cách lấy 1 trừ đi mức ý nghĩa. Độ tin cậy 99% sẽ tương ứng mức ý nghĩa 1%, độ tin cậy 95% tương ứng mức ý nghĩa 5%... Độ tin cậy thông thường trong kiểm định thống kê là 95%, nghĩa là phép kiểm định đó có độ tin cậy là 95% (5% là các lỗi có thể chấp nhận được).

Mới hơn Cũ hơn