صيغ الإحصاء

تعني

يتم حساب المتوسط ​​(المتوسط) عن طريق جمع كافة القيم في مجموعة البيانات ثم قسمة المجموع على إجمالي عدد القيم. وهو يمثل الاتجاه المركزي للبيانات.

الصيغة: المتوسط ​​= (Σx) / n

أين:

  • يعني هو المتوسط
  • Σx هو مجموع كل القيم في مجموعة البيانات
  • n هو العدد الإجمالي للقيم في مجموعة البيانات
متوسط

الوسيط هو القيمة الوسطى في مجموعة البيانات عندما يتم ترتيب القيم بترتيب تصاعدي.

إذا كان هناك عدد زوجي من القيم، فإن الوسيط هو متوسط ​​القيمتين الأوسطتين.

الصيغة (عدد فردي من القيم): الوسيط = القيمة الوسطى

الصيغة (عدد زوجي من القيم): الوسيط = (القيمة عند الموضع n/2 + القيمة عند الموضع (n/2 + 1)) / 2

الحد الأدنى

الحد الأدنى هو أصغر قيمة في مجموعة البيانات.

الصيغة: الحد الأدنى = أصغر قيمة

أقصى

الحد الأقصى هو أكبر قيمة في مجموعة البيانات.

الصيغة: الحد الأقصى = القيمة الأكبر

الفترة (من ... إلى)

النطاق هو الفرق بين الحد الأقصى والحد الأدنى للقيم في مجموعة البيانات. ويوفر مقياسًا للانتشار أو التباين في البيانات.

الصيغة: النطاق = الحد الأقصى - الحد الأدنى

المدى المتوسط

المدى المتوسط ​​هو متوسط ​​القيم القصوى والدنيا في مجموعة البيانات.

الصيغة: المدى المتوسط ​​= (الحد الأقصى + الحد الأدنى) / 2

العد التنازلي

يمثل العدد العدد الإجمالي للقيم في مجموعة البيانات.

مجموع

المجموع هو إجمالي جميع القيم في مجموعة البيانات.

الصيغة: المجموع = Σx

أين:

  • Σx هو مجموع كل القيم في مجموعة البيانات
المئوي

تمثل النسبة المئوية القيمة التي تقل عنها نسبة معينة من البيانات. غالبًا ما يتم استخدامه لتحديد نقاط بيانات محددة في التوزيع.

ربعي

يقسم الربع مجموعة البيانات إلى أربعة أجزاء متساوية، بحيث يحتوي كل جزء على 25% من البيانات. غالبًا ما تستخدم الربعيات لتقييم انتشار البيانات.

مجموع المربعات

مجموع المربعات هو مجموع مربعات الاختلافات بين كل نقطة بيانات والمتوسط. وهو عنصر رئيسي في حساب التباين والانحراف المعياري.

الصيغة: مجموع المربعات = Σ(x - المتوسط)²

أين:

  • Σ يمثل رمز الجمع
  • x هي كل نقطة بيانات
  • يعني هو المتوسط ​​(المتوسط) لمجموعة البيانات
الانحراف المعياري

يقيس الانحراف المعياري مقدار التباين أو التشتت في مجموعة البيانات. يشير إلى مدى انتشار نقاط البيانات من المتوسط.

الصيغة: الانحراف المعياري = √(Σ(x - المتوسط)² / (n - 1))

أين:

  • √ يمثل الجذر التربيعي
  • Σ يمثل رمز الجمع
  • x هي كل نقطة بيانات
  • يعني هو المتوسط ​​(المتوسط) لمجموعة البيانات
  • n هو العدد الإجمالي للقيم في مجموعة البيانات
اقرأ أيضا:  قلم جاف مقابل قلم جل: الفرق والمقارنة
التباين

التباين هو مقياس لانتشار أو تشتت مجموعة البيانات. وهو متوسط ​​الفروق التربيعية بين كل نقطة بيانات والمتوسط.

الصيغة (التباين السكاني): التباين (σ²) = Σ(x - المتوسط)² / N

أين:

  • Σ يمثل رمز الجمع
  • x هي كل نقطة بيانات
  • يعني هو المتوسط ​​(المتوسط) لمجموعة البيانات
  • N هو العدد الإجمالي للقيم في السكان

ملاحظة: عند العمل مع عينة من البيانات، استخدم صيغة تباين العينة، التي تقسم على (N - 1) بدلاً من N. ويمثل هذا التصحيح انحياز العينة.

Z- نقاط

تقيس النتيجة Z عدد الانحرافات المعيارية لنقطة البيانات عن المتوسط ​​في التوزيع الطبيعي القياسي. يتم استخدامه لتوحيد البيانات وتقييم موقعها بالنسبة للمتوسط.

الصيغة: Z-Score = (x - المتوسط) / الانحراف المعياري

أين:

  • x هي نقطة البيانات
  • يعني هو المتوسط ​​(المتوسط) لمجموعة البيانات
  • الانحراف المعياري هو الانحراف المعياري لمجموعة البيانات
المدى الربيعي (IQR)

النطاق الربيعي هو النطاق بين الربع الأول (Q1 - المئين الخامس والعشرون) والربيع الثالث (Q25 - المئين الخامس والسبعين) في مجموعة بيانات. وهو يوفر مقياسًا لانتشار الـ 3% الوسطى من البيانات.

الصيغة: معدل الذكاء = Q3 - Q1

أين:

  • Q1 هو الربع الأول (المئوي الخامس والعشرون)
  • Q3 هو الربع الثالث (المئوي 75)
معامل التباين (CV)

معامل التباين هو مقياس نسبي للتباين ويتم التعبير عنه كنسبة مئوية. يتم استخدامه لمقارنة الانحراف المعياري للبيانات بمتوسطها، مما يجعلها مفيدة لتقييم التباين النسبي بين مجموعات البيانات بوسائل مختلفة.

الصيغة: CV = (الانحراف المعياري / المتوسط) * 100%

انحراف

يقيس التواء عدم تناسق التوزيع الاحتمالي لمتغير عشوائي ذي قيمة حقيقية. يشير إلى ما إذا كانت البيانات منحرفة إلى اليمين أو اليسار.

يشير الانحراف الإيجابي إلى أن ذيل التوزيع منحرف إلى اليمين (منحرف إلى اليمين)، مما يعني أن هناك قيمًا أكثر تطرفًا على الجانب الأيمن من التوزيع.

يشير الانحراف السلبي إلى أن ذيل التوزيع منحرف إلى اليسار (منحرف إلى اليسار)، مما يعني أن هناك قيمًا أكثر تطرفًا على الجانب الأيسر من التوزيع.

التفرطح

يقيس التفرطح "ذيل" التوزيع الاحتمالي لمتغير عشوائي ذي قيمة حقيقية. يشير إلى وجود ودرجة القيم المتطرفة في البيانات.

يشير التفرطح الإيجابي (leptokurtic) إلى ذيول ثقيلة وقمة، مما يعني أن البيانات تحتوي على قيم أكثر تطرفًا وأكثر ذروة من التوزيع الطبيعي.

اقرأ أيضا:  Boomer vs Gen-Z: الفرق والمقارنة

يشير التفرطح السلبي (platykurtic) إلى ذيول خفيفة وتوزيع مسطح، مما يعني أن البيانات تحتوي على قيم متطرفة أقل وتكون مسطحة من التوزيع الطبيعي.

التغاير

يقيس التباين الدرجة التي يتغير بها متغيران معًا. يشير إلى ما إذا كانت المتغيرات لها علاقة خطية إيجابية أو سلبية.

الصيغة: Cov(X, Y) = Σ((X - Mean(X)) * (Y - Mean(Y))) / (n - 1)

أين:

  • Σ يمثل رمز الجمع
  • X و Y متغيران
  • المتوسط ​​(X) والمتوسط ​​(Y) هما متوسطان X وY، على التوالي
  • n هو العدد الإجمالي للملاحظات

إذا كان التباين موجبًا، فهذا يشير إلى وجود علاقة إيجابية (X يميل إلى الزيادة عندما يزيد Y).

إذا كان التباين سالبًا، فهذا يشير إلى وجود علاقة سلبية (X يميل إلى الانخفاض عندما يزيد Y).

معامل الارتباط (ص بيرسون)

يقيس معامل الارتباط قوة واتجاه العلاقة الخطية بين متغيرين. إنها نسخة طبيعية من التباين المشترك تتراوح من -1 إلى 1.

الصيغة: r = Cov(X, Y) / (الانحراف المعياري(X) * الانحراف المعياري(Y))

أين:

  • Cov(X, Y) هو التباين بين X وY
  • الانحراف المعياري (X) والانحراف المعياري (Y) هما الانحرافات المعيارية لـ X وY، على التوالي

إذا |ص| بالقرب من 1، فإنه يشير إلى وجود علاقة خطية قوية، حيث يشير r الموجب إلى ارتباط إيجابي ويشير r السالب إلى ارتباط سلبي. إذا |ص| إذا كانت قريبة من 0، فهذا يشير إلى وجود علاقة خطية ضعيفة أو معدومة.

آخر تحديث: 19 يناير 2024

النقطة 1
طلب واحد؟

لقد بذلت الكثير من الجهد في كتابة منشور المدونة هذا لتقديم قيمة لك. سيكون مفيدًا جدًا بالنسبة لي ، إذا كنت تفكر في مشاركته على وسائل التواصل الاجتماعي أو مع أصدقائك / عائلتك. المشاركة هي ♥ ️

هل تريد حفظ هذه المقالة لوقت لاحق؟ انقر فوق القلب الموجود في الزاوية اليمنى السفلية للحفظ في مربع المقالات الخاصة بك!