MỘT SỐ THUẬT NGỮ THỐNG KÊ CƠ BẢN

 

MỘT SỐ THUẬT NGỮ THỐNG KÊ CƠ BẢN

Thống kê là một trong những nhánh của toán học được sử dụng để nghiên cứu phân tích dữ liệu. Các phương pháp thống kê được tạo ra để nghiên cứu dữ liệu định lượng lớn và các thuộc tính của chúng. Dưới đây là một số thuật ngữ cơ bản nhưng rất quan trọng mà chúng ta cần tìm hiểu chính xác trong mọi trường hợp.

Đầu tiên khi xây dựng mô hình phân tích, người phân tích bắt đầu thu thập các dữ liệu để đối chiếu với mô hình lý thuyết này. Các dữ liệu phải là những dữ liệu có ích cho việc kiểm chứng các giả thuyết và đã được xác định cụ thể bởi các chỉ báo của các biến số.

1.    Tổng thể (population)

Thường ký hiệu: N

Tổng thể nghiên cứu hay dân số (population) (hay toàn số) tổng số toàn thể các đơn vị nghiên cứu.

Các đơn vị nghiên cứu hay đơn vị phân tích (units of analysis) là các đối tượng của cuộc nghiên cứu còn dân số ở đây được hiểu là tập hợp các yếu tố cấu tạo nên một toàn thể, là tập hợp các đối tượng mà người nghiên cứu nhắm tới.

Tập hợp các sinh viên trong trường đại học, các loại sách trong thư viện, những người dân trong thành phố,… đều là những dân số khác nhau và có thể là đối tượng của các cuộc nghiên cứu.

2.    Mẫu (sample)

Thường ký hiệu: n

Tổng thể có kích thước lớn, khi điều tra đặc tính của tổng thể chúng ta không thể khảo sát hết các đối tượng trong tổng thế đó, do vậy cần chọn một nhóm đối tượng trong tổng thể và khái quát kết quả ra tổng thể. Một nhóm đối tượng đó được gọi là mẫu nghiên cứu.

Mẫu là một tập hợp chọn lựa, được xem có tính cách tiêu biểu và được rút ra từ toàn thể dân số, có thể là ngẫu nhiên hoặc theo một tiêu chí nào đó.

  • Yếu tố mẫu (sampling element): đó là trường hợp hay là đối tượng cuối cùng được chọn trong một mẫu.
  • Đơn vị mẫu (sampling unit): đó có thể là một yếu tố duy nhất của mẫu hoặc là một chùm (cluster) của mẫu, nghĩa là một tập hợp các yếu tố của mẫu.
  • Khung mẫu (sampling frame) là một danh sách đầy đủ tất cả các đơn vị mẫu từ đó mẫu sẽ được rút ra.

Ví dụ: Ở nghiên cứu về hoạt động học tập của sinh viên tại một trường đại học, việc khảo sát tổng thể sẽ tốn nhiều thời gian, công sức và chi phí, người phân tích đã chọn khảo sát 500 sinh viên trong danh sách sinh viên tại trường. Khi đó mẫu nghiên cứu là 500 (n=500)

3.    Quan sát

Mỗi một quan sát tương ứng với một đối tượng khảo sát

Ví dụ: Cỡ mẫu 500 nghĩa là chúng ta có 500 quan sát, do vậy trong nghiên cứu có 500 mẫu thì được gọi là 500 quan sát hoặc cỡ mẫu nghiên cứu là 500.

4.    Mô hình nghiên cứu (thực nghiệm)

Mô hình nghiên cứu là mô hình đề cập đến các mối quan hệ của các biến cụ thể, thông thường, khi sử dụng mô hình thực nghiệm, nhà khoa học muốn dùng kết quả từ mẫu nghiên cứu (sample) để khái quát hóa “kết quả nghiên cứu” cho quần thể (population).

Một mô hình nghiên cứu gồm 2 phần cơ bản là các biến nghiên cứu và các mối quan hệ giữa các biến nghiên cứu.

5.    Biến độc lập, biến phụ thuộc, nhân tố

Biến độc lập (independent variable): là các biến nghiên cứu không chịu sự tác động từ các biến khác, dùng để giải thích cho các biến phụ thuộc.

Biến phụ thuộc (dependent variable): là biến nghiên cứu chịu sự tác động của biến khác (thông qua các lý thuyết được thiết lập)

Biến độc lập và biến phụ thuộc có thể được gọi chung là nhân tố hoặc biến nghiên cứu.

Biến độc lập và phụ thuộc là sự thể hiện quan hệ nhân quả. Biến độc lập giữ vai trò nguyên nhân, còn biến phụ thuộc là kết quả. Khi tác nhân thay đổi thì kết quả thay đổi. Trong một mô hình nghiên cứu có thể có một biến vừa là độc lập vừa là biến phụ thuộc, điều đó phụ thuộc vào quan hệ giữa các biến với nhau.

6.    Biến tiềm ẩn, biến quan sát

Biến tiềm ẩn: Đối với các dạng nghiên cứu hành vi nói chung thì các biến nghiên cứu thường không thể xác định được một cách trực tiếp mà phải thông qua nhiều khía cạnh khác nhau.

Ví dụ: trong nghiên cứu về hành vi học tập đúng đắn của sinh viên tại một trường đại học, người nghiên cứu có thể phải xác định thông qua nhiều khía cạnh khác nhau như: kết quả học tập của sinh viên, tần suất đi học đúng giờ, mức độ chép bài nghe giảng bài của sinh viên trên lớp,…từ đó mới có thể đưa ra được khái niệm về “hành vi học tập đúng đắn”.

Việc đánh giá những yếu tố tiềm ẩn thông qua các khía cạnh đó có thể khảo sát được gọi là biến tiềm ẩn

Biến quan sát: Biến quan sát là các khía cạnh có thể trực tiếp khảo sát đối tượng điều tra. Trên thực tế các biến quan sát là các câu hỏi trong bảng hỏi điều tra, mỗi một câu hỏi điều tra sẽ khảo sát đối tượng điều tra về một khía cạnh nào đó mà họ có thể trả lời một cách rõ ràng.

7.    Ý nghĩa thống kê (statistical significance)

Khi kết luận kiểm định giả thuyết, chúng ta thường dùng cụm từ “có ý nghĩa thống kê” hoặc “không có ý nghĩa thống kê”. Kết quả này nói lên rằng kết quả có được là từ một phép kiểm định giả thuyết nghiên cứu, có dựa trên căn cứ định lượng rõ ràng, không phải xảy ra do ngẫu nhiên, đánh giá định tính.

Ví dụ: Kiểm định t mối tác động từ biến độc lập X lên biến phụ thuộc Y cho giá trị sig=0.01 < 0.05 (mức ý nghĩa 5%). Như vậy, X có tác động lên Y một cách có ý nghĩa thống kê tại mức ý nghĩa 5%.

8.    Mức ý nghĩa và độ tin cậy

Mức ý nghĩa: là mức độ có thể chấp nhận kết quả kiểm định có ý nghĩa thống kê hay không. Khi thực hiện kiểm định luôn có mức độ sai sót nhất định, sai sót này luôn tồn tại trong bất kỳ phép kiểm định nào. Trong hầu hết các ngành, mức ý nghĩa thường được sử dụng là 1%, 5% và 10%, mức 5% được sử dụng rộng rãi nhất. Nói mức ý nghĩa của kiểm định là 5% nghĩa là khi thực hiện cuộc nghiên cứu 100 lần tỉ lệ sai sát cho phép là 5% nghĩa là 5 lần.

Độ tin cậy: ngược lại với mức ý nghĩa, độ tin cậy được tính bằng cách lấy 1 trừ đi mức ý nghĩa. Độ tin cậy 95% sẽ tương ứng với mức ý nghĩa 5%; độ tin cậy 99% sẽ tương ứng mức ý nghĩa là 1%. Độ tin cậy của nghiên cứu là 99%, nghĩa là khi thực hiện lại nghiên cứu 100 lần thì chỉ cho phép sai sót 1 lần (1%)

Nhận xét

Bài đăng phổ biến từ blog này

TẠI SAO PHẢI CHỌN MẪU ?

CRONBACH’S ALPHA LÀ GÌ?

GIỚI THIỆU VỀ POWER BI