Tính giá trị trung bình trong c sát năm 2024

Nhóm Thạc Sĩ ĐH Bách Khoa giới thiệu giá trị trung bình, trung vị, tứ phân vị. Đây là các khái niệm cơ bản trong thống kê, được nhóm trình bày bằng đồ thị rất dễ hiểu. Bây giờ các bạn nhìn vào hình bên dưới nhé.

Tính giá trị trung bình trong c sát năm 2024

Ta có dãy số như sau: 6, 5, 8, 7, 12, 13, 15, 14, 2, 200, 1. Câu hỏi đặt ra là tìm giá trị trung bình, trung vị, tứ phân vị (cái này hơi khó hơn, nên nếu giờ các bạn chưa xem thì để xem dần dần cũng được nhé)

Trước tiên chúng ta sẽ làm việc dễ trước, đó là tìm giá trị trung bình cộng. Giá trị trung bình chính là tổng của tất cả các số, chia cho số lượng số, ở đây số lượng số là 11 số, như vậy giá trị trung bình cộng là (6+5+8+7+12+13+15+14+2+200+1)/11=25.72. Trung bình cộng của 11 số trên là 25.72

Giá trị trung vị

Bước 1: sắp xếp dãy số ở trên theo thứ tự tăng dần, ta được kết quả:1, 2, 5, 6, 7, 8, 12, 13, 14, 15, 200

Bước 2: xem định nghĩa trung vị: Trung vị là giá trị đứng ở vị trí giữa trong một dãy số đã được sắp xếp có thứ tự. Trước và sau trị số trung vị sẽ có 50% quan sát.

Bước 3: như vậy dãy số ở trên có 11 số (1, 2, 5, 6, 7, 8, 12, 13, 14, 15, 200)

Số ở giữa chính sẽ chia đôi bộ số làm 2, bên trái nó có 5 số, bên phải nó có 5 số, như vậy đó chính là số 8. 8 chính là số trung vị của tập hợp ở trên( trung vị cũng còn được gọi là tứ phân vị thứ nhì nhé)

Định nghĩa giá trị trung vị

Đối với một tập dữ liệu, nó có thể được coi là giá trị “giữa”. Đặc điểm cơ bản của giá trị trung vị trong việc mô tả dữ liệu so với giá trị trung bình là nó không bị sai lệch bởi một tỷ lệ nhỏ các giá trị cực lớn hoặc cực nhỏ, và do đó cung cấp một đại diện tốt hơn về giá trị đặc trưng. Trung vị của một danh sách hữu hạn các số là số “ở giữa”, khi các số đó được liệt kê theo thứ tự từ nhỏ nhất đến lớn nhất. Nếu tập dữ liệu có số lượng quan sát lẻ, thì tập ở giữa được chọn. Ví dụ: danh sách bảy số sau 1, 3, 3, 6, 7, 8, 9 có giá trị trung vị là số 6 Một tập hợp số lượng quan sát chẵn không có giá trị giữa riêng biệt và giá trị trung bình thường được xác định là giá trị trung bình của hai giá trị giữa.Ví dụ, tập dữ liệu 1, 2, 3, 4, 5, 6, 8, 9 có giá trị trung vị là 4.5 nghĩa là (4 + 5) / 2

Giá trị tứ phân vị

Định nghĩa: điểm tứ phân vị (quartile) là giá trị bằng số phân chia một nhóm các kết quả quan sát bằng số thành bốn phần, mỗi phần có số liệu quan sát bằng nhau (=25% số kết quả quan sát). Tứ phân vị có 3 giá trị, đó là tứ phân vị thứ nhất (Q1), thứ nhì (Q2) và thứ ba (Q3). Ba giá trị này chia một tập hợp dữ liệu (đã sắp xếp dữ liệu theo trật từ từ bé đến lớn) thành 4 phần có số lượng quan sát đều nhau.

Xem lại dãy số 11 số ở trên của chúng ta (1, 2, 5, 6, 7, 8, 12, 13, 14, 15, 200)

Giá trị tứ phân vị thứ nhất Q1 bằng trung vị phần dưới, phần dưới là các số (1, 2, 5, 6, 7), là số 5

Giá trị tứ phân vị thứ hai Q2 chính bằng giá trị trung vị, chính là số 8

Giá trị tứ phân vị thứ ba Q3 bằng trung vị phần trên(12, 13, 14, 15, 200), là số 14

Cách dùng SPSS để tính giá trị trung bình, trung vị, tứ phân vị

Bước này sẽ dùng SPSS để tính ra giá trị trung bình, trung vị, tứ phân vị đã tính thủ công ở trên

Bước 1: tải file spss về

Bạn có thể tải file về ở đây: trungbinh-trungvi-tuphanvi.sav

Bước 2: dùng thống kê tần số để tính giá trị trung bình, trung vị, tứ phân vị

Bạn mở file SPSS vừa tải ở trên thì được màn hình như sau:

Tính giá trị trung bình trong c sát năm 2024

Tiếp tục vào menu Analyze – Descriptive Statistics – Frequencies

Tính giá trị trung bình trong c sát năm 2024

Trong bảng này, tiếp tục đưa biến VAR00001 qua bên phải, và ấn vào nút Statistics.

Tính giá trị trung bình trong c sát năm 2024

Sau đó tiếp tục chọn mục :

Quartiles: tứ phân vị Mean: trung bình Median: trung vị

Sau đó nhấn OK, kết quả giá trị trung bình, trung vị, tứ phân vị đã được SPSS tính toán tự động như sau:

Tính giá trị trung bình trong c sát năm 2024

Kết quả giá trị trung bình, trung vị, tứ phân vị này hoàn toàn khớp với kết quả tính thủ công ở trên.

Như vậy các bạn đã hiểu được giá trị trung bình, trung vị, tứ phân vị là gì.

So sánh trung bình và trung vị: giá trị trung vị ít bị ảnh hưởng bởi các giá trị ngoại lệ outlier, còn giá trị trung bình bị ảnh hưởng mạnh bởi các giá trị cực lớn, hoặc cực nhỏ trong bộ số liệu.