Lý thuyết Toán 11 Chương 5: Các số đặc trưng đo xu thế trung tâm cho mẫu số liệu ghép nhóm
I. Lý thuyết
1. Số liệu ghép nhóm
- Mẫu số liệu ghép nhóm thường được trình bày dưới dạng bảng thống kê có dạng như sau:
Nhóm |
[u1; u2) |
[u2; u3) |
... |
[uk; uk + 1) |
Tần số |
n1 |
n2 |
... |
nk |
Bảng 1: Bảng tần số ghép nhóm
Chú ý:
• Bảng trên gồm k nhóm [uj; uj + 1) với 1 ≤ j ≤ k, mỗi nhóm gồm một số giá trị được ghép theo một tiêu chí xác định.
• Cỡ mẫu n = n1 + n2 + ... + nk.
• Giá trị chính giữa mỗi nhóm được dùng làm giá trị đại diện cho nhóm ấy. Ví dụ nhóm [u1; u2) có giá trị đại diện là ().
• Hiệu uj + 1 – uj được gọi là độ dài của nhóm [uj; uj + 1).
1.1. Một số quy tắc ghép nhóm của mẫu số liệu
Mỗi mẫu số liệu có thể được ghép nhóm theo nhiều cách khác nhau nhưng thường tuân theo một số quy tắc sau:
- Sử dụng từ k = 5 đến k = 20 nhóm. Cỡ mẫu càng lớn thì càng nhiều nhóm số liệu. Các nhóm có cùng độ dài bằng L thỏa mãn R < k . L, trong đó R là khoảng biến thiên, k là số nhóm.
- Giá trị nhỏ nhất của mẫu thuộc vào nhóm [u1; u2) và càng gần u1 càng tốt. Giá trị lớn nhất của mẫu thuộc nhóm [uk; uk + 1) và càng gần uk + 1 càng tốt.
Chú ý:
• Các đầu mút của các nhóm có thể không là giá trị của mẫu số liệu.
• Ta hay gặp các bảng số liệu ghép nhóm là số nguyên, chẳng hạn như bảng thống kê số lỗi chính tả trong bài kiểm tra giữa học kì 1 môn Ngữ Văn của học sinh khối 11 như sau:
Số lỗi |
[1; 2] |
[3; 4] |
[5; 6] |
[7; 8] |
[9; 10] |
Số bài |
122 |
75 |
14 |
5 |
2 |
Bảng số liệu này không có dạng như Bảng 1. Để thuận lợi cho việc tính các số đặc trưng cho bảng số liệu này, người ta hiệu chỉnh về dạng như Bảng 1 bằng cách thêm và bớt 0,5 đơn vị vào đầu mút bên phải và bên trái của mỗi nhóm số liệu như sau:
Số lỗi |
[0,5; 2,5) |
[2,5; 4,5) |
[4,5; 6,5) |
[6,5; 8,5) |
[8,5; 10,5) |
Số bài |
122 |
75 |
14 |
5 |
2 |
2. Số trung bình
Số trung bình của mẫu số liệu ghép nhóm, kí hiệu x, được tính như sau:
trong đó n = n1 + n2 + ... + nk.
2.1. Ý nghĩa của số trung bình của mẫu số liệu ghép nhóm
- Số trung bình của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho số trung bình của mẫu số liệu gốc. Nó thường dùng để đo xu thế trung tâm của mẫu số liệu.
3. Mốt
- Nhóm chứa mốt của mẫu số liệu ghép nhóm là nhóm có tần số lớn nhất.
- Giả sử nhóm chứa mốt là [um; um + 1), khi đó mốt của mẫu số liệu ghép nhóm, kí hiệu là M0, được xác định bởi công thức
Chú ý:
• Nếu không có nhóm kề trước của nhóm chứa mốt thì nm – 1 = 0. Nếu không có nhóm kề sau của nhóm chứa mốt thì nm + 1 = 0.
* Ý nghĩa của mốt của mẫu số liệu ghép nhóm
- Mốt của mẫu số liệu không ghép nhóm là giá trị có khả năng xuất hiện cao nhất khi lấy mẫu. Mốt của mẫu số liệu sau khi ghép nhóm Mo xấp xỉ với mốt của mẫu số liệu không ghép nhóm. Các giá trị nằm xung quanh Mo thường có khả năng xuất hiện cao hơn các giá trị khác.
- Một mẫu số liệu ghép nhóm có thể có nhiều nhóm chứa mốt và nhiều mốt.
4. Trung vị
4.1. Công thức xác định trung vị của mẫu số liệu ghép nhóm
• Gọi n là cỡ mẫu.
• Giả sử nhóm [um; um + 1) chứa trung vị.
• nm là tần số của nhóm chứa trung vị.
• C = n1 + n2 + ... + nm – 1.
Khi đó, ta có công thức xác định trung vị như sau:
4.2. Ý nghĩa của trung vị của mẫu số liệu ghép nhóm
- Trung vị của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho mẫu số liệu gốc và có thể lấy làm giá trị đại diện cho mẫu số liệu.
5. Tứ phân vị
5.1. Công thức xác định tứ phân vị của mẫu số liệu ghép nhóm
- Tứ phân vị thứ hai của mẫu số liệu ghép nhóm, kí hiệu là Q2, cũng chính là trung vị của mẫu số liệu ghép nhóm.
- Để tìm tứ phân vị thứ nhất của mẫu số liệu ghép nhóm, kí hiệu là Q1, ta thực hiện như sau:
• Giả sử nhóm [um; um + 1) chứa tứ phân vị thứ nhất.
• nm là tần số của nhóm chứa tứ phân vị thứ nhất.
• C = n1 + n2 + ... + nm – 1.
Khi đó,
- Tương tự, để tìm tứ phân vị thứ ba của mẫu số liệu ghép nhóm, kí hiệu là Q3, ta thực hiện như sau:
• Giả sử nhóm [uj; uj + 1) chứa tứ phân vị thứ ba.
• n j là tần số của nhóm chứa tứ phân vị thứ ba.
• C = n1 + n2 + ... + nj – 1.
Khi đó,
Chú ý:
• Nếu tứ phân vị thứ k là ( trong đó xm và xm + 1 thuộc hai nhóm liên tiếp, ví dụ như xm ∈ [uj – 1; uj) và xm + 1 ∈ [uj; uj + 1) thì ta lấy Qk = uj.
5.2. Ý nghĩa của tứ phân vị của mẫu số liệu ghép nhóm
- Ba điểm tứ phân vị chia mẫu số liệu đã sắp xếp theo thứ tự không giảm thành bốn phần đều nhau. Giống như với trung vị, nói chung không thể xác định chính xác các điểm tứ phân vị của mẫu số liệu ghép nhóm.
- Bộ ba tứ phân vị của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho tứ phân vị của mẫu số liệu gốc và được sử dụng làm giá trị đo xu thế trung tâm của mẫu số liệu.
- Tứ phân vị thứ nhất và thứ ba đo xu thế trung tâm của nửa dưới (các dữ liệu nhỏ hơn Q2) và nửa trên (các dữ liệu lớn hơn Q2) của mẫu số liệu.
II. Bài tập tổng hợp Toán 11 Chương 5
Bài 1. Một thư viện thống kê số lượng sách được mượn mỗi ngày trong ba tháng ở bảng sau:
Số sách |
[16; 20] |
[21; 25] |
[26; 30] |
[31; 35] |
[36; 40] |
[41; 45] |
[46; 50] |
Số ngày |
3 |
6 |
15 |
27 |
22 |
14 |
5 |
Hãy ước lượng số trung bình và mốt của mẫu số liệu ghép nhóm trên.
Hướng dẫn giải
Số liệu ở bảng trên được hiệu chỉnh như sau:
Số sách |
[15,5; 20,5) |
[20,5; 25,5) |
[25,5; 30,5) |
[30,5; 35,5) |
[35,5; 40,5) |
[40,5; 45,5) |
[45,5; 50,5) |
Giá trị đại diện |
18 |
23 |
28 |
33 |
38 |
43 |
48 |
Số ngày |
3 |
6 |
15 |
27 |
22 |
14 |
5 |
Số sách được mượn trung bình mỗi ngày xấp xỉ bằng:
(18.3 + 23.6 + 28.15 + 33.27 + 38.33 + 43.14 + 48.5) : 92 = 34,6 (quyển sách)
Vậy nhóm chứa mốt của mẫu số liệu là nhóm [30,5; 35,5).
Do đó um = 30,5; nm – 1 = 15, nm + 1 = 22; um + 1 – um = 35,5 – 30,5 = 5.
Mốt của mẫu số liệu ghép nhóm là:
Vậy số trung bình của nhóm số liệu trên là 34,6 và mốt là 34.
Bài 2. Kết quả đo chiều cao của 200 cây keo 3 năm tuổi ở một nông trường được biểu diễn ở biểu đồ dưới đây.
Hãy ước lượng số trung bình và mốt của mẫu số liệu ghép nhóm trên.
Hướng dẫn giải
Chiều cao của 200 cây keo 3 năm tuổi được thống kê như sau:
Chiều cao |
[8,5; 8,8) |
[8,8; 9,1) |
[9,1; 9,4) |
[9,4; 9,7) |
[9,7; 10) |
Giá trị đại diện |
8,65 |
8,95 |
9,25 |
9,55 |
9,85 |
Số cây |
20 |
35 |
60 |
55 |
30 |
Chiều cao trung bình của 200 cây xấp xỉ bằng:
(8,65.20 + 8,95.35 + 9,25.60 + 9,55.55 + 9,85.30) : 200 = 9,31 (m)
Vậy nhóm chứa mốt của mẫu số liệu là nhóm [9,1; 9,4).
Do đó um = 9,1; nm – 1 = 35, nm + 1 = 55; um + 1 – um = 9,4 – 9,1 = 0,3.
Mốt của mẫu số liệu trên là:
Vậy số trung bình của nhóm số liệu trên là 9,31 và mốt là 9,35.
Bài 1. Kiểm tra điện lượng của một số viên pin tiểu do một hãng sản xuất thu được kết quả sau:
Điện lượng (nghìn mAh) |
[0,9; 0,95) |
[0,95; 1,0) |
[1,0; 1,05) |
[1,05; 1,1) |
[1,1; 1,15) |
Số viên pin |
10 |
20 |
35 |
15 |
5 |
Hãy ước lượng số trung bình, mốt và tứ phân vị của mẫu số liệu ghép nhóm trên.
Hướng dẫn giải
Điện lượng (nghìn mAh) |
[0,9; 0,95) |
[0,95; 1,0) |
[1,0; 1,05) |
[1,05; 1,1) |
[1,1; 1,15) |
Giá trị đại diện |
0,925 |
0,975 |
1,025 |
1,075 |
1,125 |
Số viên pin |
10 |
20 |
35 |
15 |
5 |
Số trung bình của dãy số liệu xấp xỉ bằng:
(0,925.10 + 0,975.20 + 1,025.35 + 1,075.15 + 1,125.5) : 85 = 1,016
Vậy nhóm chứa mốt của dãy số liệu là nhóm [1,0; 1,05).
Mốt của mẫu số liệu trên là:
Gọi x1; x2; x3;....; x85 lần lượt là số viên pin theo thứ tự không giảm.
Do x1,...., x10 ∈ [0,9; 0,95); x11,...., x30 ∈ [0,95; 1,0); x31,...., x65 ∈ [1,0; 1,05);
x66,...., x80 ∈ [1,05; 1,1); x81,...., x85 ∈ [1,1; 1,15).
Tứ phân vị thứ hai của dãy số liệu là ) thuộc nhóm [1,0; 1,05) nên tứ phân vị thứ hai của mẫu số liệu là (1,05-1,0) = 1,02
Tứ phân vị thứ nhất của dãy số liệu là ) thuộc nhóm [0,95; 1,0) nên tứ phân vị thứ nhất của mẫu số liệu là (1,0-0,95) = 0,98
Tứ phân vị thứ ba của dãy số liệu là ) thuộc nhóm [1,0; 1,05) nên tứ phân vị thứ ba của mẫu số liệu là (1,05- 1,0) = 1,048.
Vậy trong mẫu số liệu trên, số trung bình là 1,016, mốt là 1,02, tứ phân vị thứ nhất, thứ hai và thứ ba lần lượt là 0,98; 1,02; 1,048.
Bài 2. Cân nặng của một số lợn con mới sinh thuộc hai giống A và B được cho ở biểu đồ dưới đây (đơn vị: kg).
a) Hãy so sánh cân nặng của lợn con mới sinh giống A và giống B theo số trung bình và trung vị.
b) Hãy ước lượng tứ phân vị thứ nhất và thứ ba của cân nặng lợn con mới sinh giống A và của cân nặng lợn con mới sinh giống B.
Hướng dẫn giải
Cân nặng của lợn con giống A và giống B được thống kê như sau:
Cân nặng (kg) |
[1,0; 1,1) |
[1,1; 1,2) |
[1,2; 1,3) |
[1,3; 1,4) |
Giá trị đại diện |
1,05 |
1,15 |
1,25 |
1,35 |
Số con giống A |
8 |
28 |
32 |
17 |
Số con giống B |
13 |
14 |
24 |
14 |
a) Số cân nặng trung bình của lợn con giống A là:
(1,05.8 + 1,15.28 + 1,25.32 + 1,35.17) : 85 = 1,22 (kg)
Số cân nặng trung bình của lợn con giống B là:
(1,05.13 + 1,15.14 + 1,25.24 + 1,35.14) : 65 = 1,21 (kg)
Vậy cân nặng trung bình của lợn con giống A lớn hơn lợn con giống B theo số trung bình.
Gọi x1; x2; x3;....; x85 lần lượt là số lợn con giống A theo thứ tự không giảm.
Do x1,...., x8 ∈ [1,0; 1,1); x9,...., x36 ∈ [1,1; 1,2); x37,...., x68 ∈ [1,2; 1,3);
x69,...., x85 ∈ [1,3; 1,4).
Trung vị của mẫu số liệu lợn con giống A thuộc nhóm [1,2; 1,3) là:
.(1,3 - 1,2) = 1,22
Gọi y1; y2; y3;....; y65 lần lượt là số lợn con giống B theo thứ tự không giảm.
Do y1,...., y13 ∈ [1,0; 1,1); y14,...., y27 ∈ [1,1; 1,2); y28,...., y51 ∈ [1,2; 1,3);
y52,...., y65 ∈ [1,3; 1,4).
Trung vị của mẫu số liệu lợn con giống B thuộc nhóm [1,2; 1,3) là:
.(1,3 - 1,2) =1,223
Vậy cân nặng trung bình của lợn con giống A nhỏ hơn lợn con giống B theo trung vị.
b) Tứ phân vị thứ nhất của dãy số liệu giống A là) thuộc nhóm [1,1; 1,2) nên tứ phân vị thứ nhất của mẫu số liệu là (1,2 - 1,1) = 1,15
Tứ phân vị thứ ba của dãy số liệu giống A là ) thuộc nhóm [1,2; 1,3) nên tứ phân vị thứ ba của mẫu số liệu là (1,3 - 1,2) = 1,29
Tứ phân vị thứ nhất của dãy số liệu giống B là ) thuộc nhóm [1,1; 1,2) nên tứ phân vị thứ nhất của mẫu số liệu là (1,2 - 1,1) = 1,12
Tứ phân vị thứ ba của dãy số liệu giống B là ) thuộc nhóm [1,2; 1,3) nên tứ phân vị thứ ba của mẫu số liệu là (1,3 - 1,2) = 1,29
Vậy tứ phân vị thứ nhất của lợn con giống A và giống B lần lượt là 1,15 và 1,12;
Tứ phân vị thứ ba của lợn con giống A và giống B lần lượt là 1,29 và 1,29.
Xem thêm các bài tóm tắt lý thuyết Toán 11 Chân trời sáng tạo hay, chi tiết khác:
Lý thuyết Bài 4: Hai mặt phẳng song song
Lý thuyết Bài 5: Phép chiếu song song
Tổng hợp lý thuyết Toán 11 Chương 4
Lý thuyết Bài 1: Số trung bình và mốt của mẫu số liệu ghép nhóm
Lý thuyết Bài 2: Trung vị và tứ phân vị của mẫu số liệu ghép nhóm