Khi phân tích, các nhà thống kê rất quan tâm đến một tiêu chí gọi là độ biến động (variability), hay độ rộng (spread) của tập dữ liệu. Những số đo phổ biến nhất để đo lường tiêu chí này là khoảng phần tư (IQR), phương sai (variance) và độ lệch chuẩn (standard deviation).

Đang xem: độ lệch chuẩn và phương sai

Khoảng giá trị (range)

Khoảng giá trị là sự chênh lệch giữa giá trị lớn nhất và giá trị nhỏ nhấttrong một tập giá trị. Ví dụ, có dãy số sau: 1, 3, 4, 5, 5, 6, 7, 11. Đối với dãy này, khoảng giá trịlà 11-1 (bằng 10).

Khoảng phầntư / Khoảng tứ phân vị (Interquartile Range)

Đây là thước đo dựa trên việc chia mộttập dữ liệu thành 4 phần bằng nhau.

Ba điểm mốc chia tập dữ liệu thành 4phần được ký hiệu lần lượt là Q1, Q2 và Q3.

Q1 là giá trị “ở giữa” của nửa đầu tập dữ liệu “đã được sắp xếp”Q3 là giá trị “ở giữa” của nửa cuối tập dữ liệu “đã được sắp xếp”

IQR là khoảng giữa Q1 và Q3.

Ví dụ, ta có dãy số sau: 1, 2, 3, 4, 5, 6, 7, 8.

*

Q2 là trung vị của toàn bộ tập dữ liệu. Trongví dụ này, ta có tổng số giá trị là chẵn, vì vậy trung vị là trung bình của 2giá trị ở giữa. Do đó Q2 = (4+5)/2 = 4,5. Q1 là giá trị chính giữa của nửa dữliệu đầu tiên. Nửa dữ liệu đầu tiên có tổng số giá chị là chẵn nên Q1 là trungbình của 2 giá trị ở giữa, Q1 = (2+3)/2 = 2,5. Q3 là giá trị giữa của nửa dữ liệuthứ hai. Tương tự như Q1, Q3= (6+7)/2 = 6,5. IQR =Q3-Q1 = 6,5 – 2,5 = 4.

Xem thêm:

Phương sai (Variance)

Trong một tổng thể, phương sai là trung bình cộng của bình phương độ lệch của các giá trị so với trung bình của tổng thể. Phương sai được tính bằng công thức sau.

*

Trong đó

*

là phương sai của tổng thể,

*

là trung bình của tổng thể,

*

là thành phần thứ

*

của tổng thể, và

*

là số thành phần của tổng thể.

Các quan sát từ một mẫu ngẫu nhiên có thể được sử dụng để ước lượng phương sai của tổng thể. Trong trường hợp này, công thức tính phương sai có sự khác biệt một chút so với công thức áp dụng cho Tổng thể.

*

Trong đó

*

 là phương sai của mẫu,

*

là trung bình của mẫu,

*

là phần tử thứ

*

của mẫu, và

*

là số thành phần của mẫu. Ta thấy, so với công thức phương sai của tổng thể, công thức này ta đã chia tổng thu được cho

*

. Mục đích của việc này là nhằm tránh thành kiến trong việc đánh giá phương sai của tổng thể. Nếu bạn cần ước lượng phương sai của một tổng thể mà bạn không biết rõ số lượng mà chỉ có một mẫu ngẫu nhiên, thì đây là công thức bạn cần sử dụng.

Độ lệch chuẩn (standard deviation)

Độ lệch chuẩn là căn bậc hai của phương sai. Do đó, công thức của độ lệch chuẩn của tổng thể là:

*

Trong đó

*

là độ lệch chuẩn của của tổng thể,

*

là trung bình của tổng thể.

*

là phần tử thứ

*

của tổng thể, và

*

là số thành phần của tổng thể.

Xem thêm:

Tương tự, độlệch chuẩn của mẫu được tính bằng công thức:

*

Trong đó,

*

là độ lệch chuẩn của mẫu,

*

là trung bình của mẫu,

*

là thành phần thứ

*

của mẫu, và

*

là tổng số thành phần của mẫu

Tác động của việc thay đổi đơn vị

Đôi khi,các nhà nghiên cứu phải thay đổi đơn vị (phút sang giờ, feet thành mét …).

Nếu bạn cộng thêm mộthằng số vào mỗi giá trị, khoảng cách giữa các giá trị không thay đổi. Kết quảlà, tất cả các số đo độ biến động như (khoảng giá trị, khoảng phần tư, độ lệchchuẩn, và phương sai) vẫn giữ nguyên.Nếu bạn nhân mỗigiá trị với một hằng số khoảng giá trị, khoảng phần tư, độ lệch chuẩn cũng đượcnhân với bấy nhiêu lần. Tuy nhiên phương sai bị tác động lớn hơn. Nó nhân phương sai với bình phương của hằng số đó.

Leave a Reply

Your email address will not be published. Required fields are marked *