Công thức thống kê

Nghĩa là

Giá trị trung bình (trung bình) được tính bằng cách tính tổng tất cả các giá trị trong tập dữ liệu rồi chia tổng cho tổng số giá trị. Nó đại diện cho xu hướng trung tâm của dữ liệu.

Công thức: Giá trị trung bình = (Σx)/n

Địa điểm:

  • Mean là mức trung bình
  • Σx là tổng của tất cả các giá trị trong tập dữ liệu
  • n là tổng số giá trị trong tập dữ liệu
trung tuyến

Trung vị là giá trị ở giữa trong tập dữ liệu khi các giá trị được sắp xếp theo thứ tự tăng dần.

Nếu có số giá trị chẵn thì trung vị là trung bình cộng của hai giá trị ở giữa.

Công thức (Số giá trị lẻ): Median = Giá trị giữa

Công thức (Số giá trị chẵn): Trung vị = (Giá trị tại vị trí n/2 + Giá trị tại vị trí (n/2 + 1)) / 2

Tối thiểu

Giá trị tối thiểu là giá trị nhỏ nhất trong tập dữ liệu.

Công thức: Tối thiểu = Giá trị nhỏ nhất

tối đa

Giá trị tối đa là giá trị lớn nhất trong tập dữ liệu.

Công thức: Tối đa = Giá trị lớn nhất

Phạm vi

Phạm vi là sự khác biệt giữa giá trị tối đa và tối thiểu trong tập dữ liệu. Nó cung cấp thước đo về mức độ lan truyền hoặc tính biến đổi của dữ liệu.

Công thức: Phạm vi = Tối đa - Tối thiểu

Trung bình

Khoảng giữa là mức trung bình của các giá trị tối đa và tối thiểu trong tập dữ liệu.

Công thức: Tầm trung = (Tối đa + Tối thiểu) / 2

Đếm

Số lượng đại diện cho tổng số giá trị trong một tập dữ liệu.

Tổng

Tổng là tổng của tất cả các giá trị trong một tập dữ liệu.

Công thức: Tổng = Σx

Địa điểm:

  • Σx là tổng của tất cả các giá trị trong tập dữ liệu
Phần trăm

Phân vị đại diện cho giá trị mà phần trăm dữ liệu nhất định nằm dưới đó. Nó thường được sử dụng để xác định các điểm dữ liệu cụ thể trong một bản phân phối.

Phần tư

Một tứ phân vị chia tập dữ liệu thành bốn phần bằng nhau, mỗi phần chứa 25% dữ liệu. Các phần tư thường được sử dụng để đánh giá mức độ lan truyền của dữ liệu.

Tổng bình phương

Tổng bình phương là tổng bình phương của sự khác biệt giữa mỗi điểm dữ liệu và giá trị trung bình. Nó là thành phần quan trọng trong việc tính toán phương sai và độ lệch chuẩn.

Công thức: Tổng bình phương = Σ(x - Mean)²

Địa điểm:

  • Σ đại diện cho ký hiệu tổng
  • x là mỗi điểm dữ liệu
  • Mean là giá trị trung bình (trung bình) của tập dữ liệu
Độ lệch chuẩn

Độ lệch chuẩn đo lường mức độ biến đổi hoặc độ phân tán trong tập dữ liệu. Nó cho biết mức độ phân tán của các điểm dữ liệu so với giá trị trung bình.

Công thức: Độ lệch chuẩn = √(Σ(x - Mean)² / (n - 1))

Địa điểm:

  • √ đại diện cho căn bậc hai
  • Σ đại diện cho ký hiệu tổng
  • x là mỗi điểm dữ liệu
  • Mean là giá trị trung bình (trung bình) của tập dữ liệu
  • n là tổng số giá trị trong tập dữ liệu
Cũng đọc:  Biển vs Vịnh: Sự khác biệt và so sánh
Phương sai

Phương sai là thước đo mức độ phân tán hoặc phân tán của tập dữ liệu. Nó là mức trung bình của các chênh lệch bình phương giữa từng điểm dữ liệu và giá trị trung bình.

Công thức (Phương sai dân số): Phương sai (σ²) = Σ(x - Mean)² / N

Địa điểm:

  • Σ đại diện cho ký hiệu tổng
  • x là mỗi điểm dữ liệu
  • Mean là giá trị trung bình (trung bình) của tập dữ liệu
  • N là tổng số giá trị trong dân số

Lưu ý: Khi làm việc với một mẫu dữ liệu, hãy sử dụng công thức phương sai mẫu chia cho (N - 1) thay vì N. Hiệu chỉnh này tính đến độ lệch mẫu.

Điểm Z

Điểm Z đo lường mức độ lệch chuẩn của một điểm dữ liệu so với giá trị trung bình trong phân phối chuẩn chuẩn. Nó được sử dụng để chuẩn hóa dữ liệu và đánh giá vị trí của nó so với giá trị trung bình.

Công thức: Z-Score = (x - Mean) / Độ lệch chuẩn

Địa điểm:

  • x là điểm dữ liệu
  • Mean là giá trị trung bình (trung bình) của tập dữ liệu
  • Độ lệch chuẩn là độ lệch chuẩn của tập dữ liệu
Dải phân vị (IQR)

Phạm vi liên vùng là phạm vi giữa tứ phân vị thứ nhất (phân vị thứ 1 - 25) và phân vị thứ ba (phân vị thứ 3 - 75) trong tập dữ liệu. Nó cung cấp thước đo mức độ lan truyền của 50% dữ liệu ở giữa.

Công thức: IQR = Q3 - Q1

Địa điểm:

  • Q1 là tứ phân vị đầu tiên (phân vị thứ 25)
  • Q3 là tứ phân vị thứ ba (phân vị thứ 75)
Hệ số biến thiên (CV)

Hệ số biến thiên là thước đo tương đối của độ biến thiên và được biểu thị bằng phần trăm. Nó được sử dụng để so sánh độ lệch chuẩn của dữ liệu với giá trị trung bình của nó, giúp nó hữu ích trong việc đánh giá độ biến thiên tương đối giữa các tập dữ liệu với các phương tiện khác nhau.

Công thức: CV = (Độ lệch chuẩn / Giá trị trung bình) * 100%

Skewness

Độ lệch đo lường sự bất đối xứng của phân bố xác suất của một biến ngẫu nhiên có giá trị thực. Nó cho biết dữ liệu bị lệch sang phải hay trái.

Độ lệch dương cho biết phần đuôi phân phối bị lệch sang phải (lệch phải), nghĩa là có nhiều giá trị cực trị hơn ở phía bên phải của phân phối.

Độ lệch âm cho biết đuôi phân phối bị lệch sang trái (nghiêng trái), nghĩa là có nhiều giá trị cực trị hơn ở phía bên trái của phân phối.

Kurtosis

Kurtosis đo lường "độ đuôi" của phân bố xác suất của một biến ngẫu nhiên có giá trị thực. Nó chỉ ra sự hiện diện và mức độ của các ngoại lệ trong dữ liệu.

Độ nhọn dương (leptokurtic) biểu thị đuôi nặng và đỉnh, nghĩa là dữ liệu có nhiều giá trị cực trị hơn và có nhiều đỉnh hơn phân phối chuẩn.

Cũng đọc:  Người bán buôn và Người bán buôn: Sự khác biệt và So sánh

Độ nhọn âm (platykurtic) biểu thị đuôi nhẹ và phân phối phẳng hơn, nghĩa là dữ liệu có ít giá trị cực trị hơn và phẳng hơn phân phối chuẩn.

Hiệp phương sai

Hiệp phương sai đo lường mức độ mà hai biến thay đổi cùng nhau. Nó cho biết các biến có mối quan hệ tuyến tính tích cực hay tiêu cực.

Công thức: Cov(X, Y) = Σ((X - Mean(X)) * (Y - Mean(Y))) / (n - 1)

Địa điểm:

  • Σ đại diện cho ký hiệu tổng
  • X và Y là các biến
  • Giá trị trung bình(X) và Giá trị trung bình(Y) lần lượt là giá trị trung bình của X và Y
  • n là tổng số quan sát

Nếu hiệp phương sai dương, nó biểu thị mối quan hệ tích cực (X có xu hướng tăng khi Y tăng).

Nếu hiệp phương sai âm thì biểu thị mối quan hệ nghịch (X có xu hướng giảm khi Y tăng).

Hệ số tương quan (Pearson's r)

Hệ số tương quan đo lường cường độ và hướng của mối quan hệ tuyến tính giữa hai biến. Đây là phiên bản chuẩn hóa của hiệp phương sai nằm trong khoảng từ -1 đến 1.

Công thức: r = Cov(X, Y) / (Độ lệch chuẩn(X) * Độ lệch chuẩn(Y))

Địa điểm:

  • Cov(X, Y) là hiệp phương sai giữa X và Y
  • Độ lệch chuẩn(X) và Độ lệch chuẩn(Y) lần lượt là độ lệch chuẩn của X và Y

Nếu |r| gần bằng 1, nó biểu thị mối quan hệ tuyến tính mạnh mẽ, với r dương biểu thị mối tương quan dương và r âm biểu thị mối tương quan âm. Nếu |r| gần bằng 0, nó biểu thị mối quan hệ yếu hoặc không có mối quan hệ tuyến tính.

Cập nhật lần cuối: ngày 19 tháng 2024 năm XNUMX

chấm 1
Một yêu cầu?

Tôi đã nỗ lực rất nhiều để viết bài đăng trên blog này nhằm cung cấp giá trị cho bạn. Nó sẽ rất hữu ích cho tôi, nếu bạn cân nhắc chia sẻ nó trên mạng xã hội hoặc với bạn bè/gia đình của bạn. CHIA SẺ LÀ ♥️

Bạn muốn lưu bài viết này cho sau này? Nhấp vào trái tim ở góc dưới cùng bên phải để lưu vào hộp bài viết của riêng bạn!