सांख्यिकी सूत्र

मतलब

माध्य (औसत) की गणना डेटासेट में सभी मानों को जोड़कर और फिर योग को मानों की कुल संख्या से विभाजित करके की जाती है। यह डेटा की केंद्रीय प्रवृत्ति का प्रतिनिधित्व करता है।

सूत्र: माध्य = (Σx) / n

कहा पे:

  • माध्य औसत है
  • Σx डेटासेट में सभी मानों का योग है
  • n डेटासेट में मानों की कुल संख्या है
मंझला

जब मानों को आरोही क्रम में व्यवस्थित किया जाता है तो माध्यिका डेटासेट में मध्य मान होता है।

यदि मानों की संख्या सम है, तो माध्यिका दो मध्य मानों का औसत है।

सूत्र (मानों की विषम संख्या): माध्यिका = मध्य मान

सूत्र (मानों की सम संख्या): माध्यिका = (स्थिति n/2 पर मान + स्थिति पर मान (n/2 + 1)) / 2

न्यूनतम

न्यूनतम किसी डेटासेट में सबसे छोटा मान है।

सूत्र: न्यूनतम = सबसे छोटा मान

अधिकतम

किसी डेटासेट में अधिकतम सबसे बड़ा मान है।

सूत्र: अधिकतम = सबसे बड़ा मान

रेंज

रेंज किसी डेटासेट में अधिकतम और न्यूनतम मानों के बीच का अंतर है। यह डेटा में प्रसार या परिवर्तनशीलता का माप प्रदान करता है।

सूत्र: रेंज = अधिकतम - न्यूनतम

मध्यम-श्रेणी

मिडरेंज किसी डेटासेट में अधिकतम और न्यूनतम मानों का औसत है।

सूत्र: मध्यश्रेणी = (अधिकतम + न्यूनतम) / 2

गिनती

गिनती किसी डेटासेट में मानों की कुल संख्या को दर्शाती है।

राशि

योग किसी डेटासेट में सभी मानों का योग है।

सूत्र: योग = Σx

कहा पे:

  • Σx डेटासेट में सभी मानों का योग है
प्रतिशतता

एक प्रतिशतक उस मान को दर्शाता है जिसके नीचे डेटा का दिया गया प्रतिशत गिरता है। इसका उपयोग अक्सर वितरण में विशिष्ट डेटा बिंदुओं की पहचान करने के लिए किया जाता है।

चतुर्थांश

एक चतुर्थक एक डेटासेट को चार बराबर भागों में विभाजित करता है, प्रत्येक भाग में 25% डेटा होता है। चतुर्थक का उपयोग अक्सर डेटा के प्रसार का आकलन करने के लिए किया जाता है।

वर्गों का योग

वर्गों का योग प्रत्येक डेटा बिंदु और माध्य के बीच अंतर के वर्गों का योग है। यह विचरण और मानक विचलन की गणना में एक प्रमुख घटक है।

सूत्र: वर्गों का योग = Σ(x - माध्य)²

कहा पे:

  • Σ योग चिह्न का प्रतिनिधित्व करता है
  • x प्रत्येक डेटा बिंदु है
  • माध्य डेटासेट का माध्य (औसत) है
मानक विचलन

मानक विचलन किसी डेटासेट में भिन्नता या फैलाव की मात्रा को मापता है। यह इंगित करता है कि डेटा बिंदु माध्य से कितने फैले हुए हैं।

सूत्र: मानक विचलन = √(Σ(x - माध्य)² / (n - 1))

कहा पे:

  • √ वर्गमूल को दर्शाता है
  • Σ योग चिह्न का प्रतिनिधित्व करता है
  • x प्रत्येक डेटा बिंदु है
  • माध्य डेटासेट का माध्य (औसत) है
  • n डेटासेट में मानों की कुल संख्या है
यह भी पढ़ें:  समुद्र बनाम खाड़ी: अंतर और तुलना
झगड़ा

विचरण किसी डेटासेट के प्रसार या फैलाव का माप है। यह प्रत्येक डेटा बिंदु और माध्य के बीच वर्ग अंतर का औसत है।

सूत्र (जनसंख्या भिन्नता): भिन्नता (σ²) = Σ(x - माध्य)² / एन

कहा पे:

  • Σ योग चिह्न का प्रतिनिधित्व करता है
  • x प्रत्येक डेटा बिंदु है
  • माध्य डेटासेट का माध्य (औसत) है
  • एन जनसंख्या में मूल्यों की कुल संख्या है

नोट: डेटा के नमूने के साथ काम करते समय, नमूना विचरण सूत्र का उपयोग करें, जो एन के बजाय (एन - 1) से विभाजित होता है। यह सुधार नमूना पूर्वाग्रह के लिए जिम्मेदार है।

z के स्कोर

Z-स्कोर मापता है कि एक मानक सामान्य वितरण में डेटा बिंदु माध्य से कितने मानक विचलन है। इसका उपयोग डेटा को मानकीकृत करने और माध्य के सापेक्ष उसकी स्थिति का आकलन करने के लिए किया जाता है।

सूत्र: Z-स्कोर = (x - माध्य) / मानक विचलन

कहा पे:

  • x डेटा बिंदु है
  • माध्य डेटासेट का माध्य (औसत) है
  • मानक विचलन डेटासेट का मानक विचलन है
इंटरकार्टाइल रेंज (IQR)

अंतरचतुर्थक श्रेणी किसी डेटासेट में पहले चतुर्थक (Q1 - 25वें प्रतिशतक) और तीसरे चतुर्थक (Q3 - 75वें प्रतिशतक) के बीच की सीमा है। यह डेटा के मध्य 50% के प्रसार का माप प्रदान करता है।

सूत्र: IQR = Q3 - Q1

कहा पे:

  • Q1 पहला चतुर्थक (25वाँ प्रतिशतक) है
  • Q3 तीसरा चतुर्थक (75वाँ प्रतिशतक) है
भिन्नता का गुणांक (सीवी)

भिन्नता का गुणांक परिवर्तनशीलता का एक सापेक्ष माप है और इसे प्रतिशत के रूप में व्यक्त किया जाता है। इसका उपयोग डेटा के मानक विचलन की उसके माध्य से तुलना करने के लिए किया जाता है, जिससे यह विभिन्न साधनों के साथ डेटासेट के बीच सापेक्ष परिवर्तनशीलता का आकलन करने के लिए उपयोगी हो जाता है।

सूत्र: सीवी = (मानक विचलन / माध्य) * 100%

तिरछापन

तिरछापन एक वास्तविक-मूल्यवान यादृच्छिक चर के संभाव्यता वितरण की विषमता को मापता है। यह इंगित करता है कि डेटा दाईं ओर या बाईं ओर झुका हुआ है।

एक सकारात्मक तिरछा संकेत करता है कि वितरण पूंछ दाहिनी ओर तिरछी है (दाईं ओर तिरछी), जिसका अर्थ है कि वितरण के दाहिनी ओर अधिक चरम मान हैं।

एक नकारात्मक तिरछा इंगित करता है कि वितरण पूंछ बाईं ओर तिरछी है (बाएं-तिरछी), जिसका अर्थ है कि वितरण के बाईं ओर अधिक चरम मान हैं।

कुकुदता

कर्टोसिस एक वास्तविक-मूल्यवान यादृच्छिक चर के संभाव्यता वितरण की "पुच्छता" को मापता है। यह डेटा में आउटलेर्स की उपस्थिति और डिग्री को इंगित करता है।

एक सकारात्मक कर्टोसिस (लेप्टोकर्टिक) भारी पूंछ और एक शिखर को इंगित करता है, जिसका अर्थ है कि डेटा में अधिक चरम मूल्य हैं और यह सामान्य वितरण की तुलना में अधिक चरम पर है।

यह भी पढ़ें:  थोक विक्रेता बनाम थोक विक्रेता: अंतर और तुलना

एक नकारात्मक कर्टोसिस (प्लेटीकर्टिक) हल्की पूंछ और एक चापलूसी वितरण को इंगित करता है, जिसका अर्थ है कि डेटा में कम चरम मूल्य हैं और सामान्य वितरण की तुलना में चापलूसी है।

सहप्रसरण

सहप्रसरण उस डिग्री को मापता है जिस तक दो चर एक साथ बदलते हैं। यह इंगित करता है कि चर का सकारात्मक या नकारात्मक रैखिक संबंध है या नहीं।

सूत्र: Cov(X, Y) = Σ((X - माध्य(X)) * (Y - माध्य(Y))) / (n - 1)

कहा पे:

  • Σ योग चिह्न का प्रतिनिधित्व करता है
  • X और Y परिवर्तनशील हैं
  • माध्य(X) और माध्य(Y) क्रमशः X और Y के माध्य हैं
  • n प्रेक्षणों की कुल संख्या है

यदि सहप्रसरण सकारात्मक है, तो यह एक सकारात्मक संबंध को इंगित करता है (Y बढ़ने पर X बढ़ता है)।

यदि सहप्रसरण नकारात्मक है, तो यह एक नकारात्मक संबंध को इंगित करता है (Y बढ़ने पर X घटता है)।

सहसंबंध गुणांक (पियर्सन का आर)

सहसंबंध गुणांक दो चर के बीच रैखिक संबंध की ताकत और दिशा को मापता है। यह सहप्रसरण का एक सामान्यीकृत संस्करण है जो -1 से 1 तक होता है।

सूत्र: r = Cov(X, Y) / (मानक विचलन(X) * मानक विचलन(Y))

कहा पे:

  • Cov(X, Y) X और Y के बीच सहप्रसरण है
  • मानक विचलन(X) और मानक विचलन(Y) क्रमशः X और Y के मानक विचलन हैं

यदि |आर| 1 के करीब है, यह एक मजबूत रैखिक संबंध को इंगित करता है, जिसमें सकारात्मक आर एक सकारात्मक सहसंबंध का संकेत देता है और नकारात्मक आर एक नकारात्मक सहसंबंध का संकेत देता है। यदि |आर| 0 के करीब है, यह कमजोर या कोई रैखिक संबंध नहीं दर्शाता है।

अंतिम अद्यतन: 19 जनवरी, 2024

बिंदु 1
एक अनुरोध?

मैंने आपको मूल्य प्रदान करने के लिए इस ब्लॉग पोस्ट को लिखने में बहुत मेहनत की है। यदि आप इसे सोशल मीडिया पर या अपने मित्रों/परिवार के साथ साझा करने पर विचार करते हैं, तो यह मेरे लिए बहुत उपयोगी होगा। साझा करना है ♥️

क्या आप इस लेख को बाद के लिए सहेजना चाहते हैं? अपने लेख बॉक्स में सहेजने के लिए नीचे दाएं कोने में दिल पर क्लिक करें!