माध्य (औसत) की गणना डेटासेट में सभी मानों को जोड़कर और फिर योग को मानों की कुल संख्या से विभाजित करके की जाती है। यह डेटा की केंद्रीय प्रवृत्ति का प्रतिनिधित्व करता है।
सूत्र: माध्य = (Σx) / n
कहा पे:
- माध्य औसत है
- Σx डेटासेट में सभी मानों का योग है
- n डेटासेट में मानों की कुल संख्या है
जब मानों को आरोही क्रम में व्यवस्थित किया जाता है तो माध्यिका डेटासेट में मध्य मान होता है।
यदि मानों की संख्या सम है, तो माध्यिका दो मध्य मानों का औसत है।
सूत्र (मानों की विषम संख्या): माध्यिका = मध्य मान
सूत्र (मानों की सम संख्या): माध्यिका = (स्थिति n/2 पर मान + स्थिति पर मान (n/2 + 1)) / 2
न्यूनतम किसी डेटासेट में सबसे छोटा मान है।
सूत्र: न्यूनतम = सबसे छोटा मान
किसी डेटासेट में अधिकतम सबसे बड़ा मान है।
सूत्र: अधिकतम = सबसे बड़ा मान
रेंज किसी डेटासेट में अधिकतम और न्यूनतम मानों के बीच का अंतर है। यह डेटा में प्रसार या परिवर्तनशीलता का माप प्रदान करता है।
सूत्र: रेंज = अधिकतम - न्यूनतम
मिडरेंज किसी डेटासेट में अधिकतम और न्यूनतम मानों का औसत है।
सूत्र: मध्यश्रेणी = (अधिकतम + न्यूनतम) / 2
गिनती किसी डेटासेट में मानों की कुल संख्या को दर्शाती है।
योग किसी डेटासेट में सभी मानों का योग है।
सूत्र: योग = Σx
कहा पे:
- Σx डेटासेट में सभी मानों का योग है
एक प्रतिशतक उस मान को दर्शाता है जिसके नीचे डेटा का दिया गया प्रतिशत गिरता है। इसका उपयोग अक्सर वितरण में विशिष्ट डेटा बिंदुओं की पहचान करने के लिए किया जाता है।
एक चतुर्थक एक डेटासेट को चार बराबर भागों में विभाजित करता है, प्रत्येक भाग में 25% डेटा होता है। चतुर्थक का उपयोग अक्सर डेटा के प्रसार का आकलन करने के लिए किया जाता है।
वर्गों का योग प्रत्येक डेटा बिंदु और माध्य के बीच अंतर के वर्गों का योग है। यह विचरण और मानक विचलन की गणना में एक प्रमुख घटक है।
सूत्र: वर्गों का योग = Σ(x - माध्य)²
कहा पे:
- Σ योग चिह्न का प्रतिनिधित्व करता है
- x प्रत्येक डेटा बिंदु है
- माध्य डेटासेट का माध्य (औसत) है
मानक विचलन किसी डेटासेट में भिन्नता या फैलाव की मात्रा को मापता है। यह इंगित करता है कि डेटा बिंदु माध्य से कितने फैले हुए हैं।
सूत्र: मानक विचलन = √(Σ(x - माध्य)² / (n - 1))
कहा पे:
- √ वर्गमूल को दर्शाता है
- Σ योग चिह्न का प्रतिनिधित्व करता है
- x प्रत्येक डेटा बिंदु है
- माध्य डेटासेट का माध्य (औसत) है
- n डेटासेट में मानों की कुल संख्या है
विचरण किसी डेटासेट के प्रसार या फैलाव का माप है। यह प्रत्येक डेटा बिंदु और माध्य के बीच वर्ग अंतर का औसत है।
सूत्र (जनसंख्या भिन्नता): भिन्नता (σ²) = Σ(x - माध्य)² / एन
कहा पे:
- Σ योग चिह्न का प्रतिनिधित्व करता है
- x प्रत्येक डेटा बिंदु है
- माध्य डेटासेट का माध्य (औसत) है
- एन जनसंख्या में मूल्यों की कुल संख्या है
नोट: डेटा के नमूने के साथ काम करते समय, नमूना विचरण सूत्र का उपयोग करें, जो एन के बजाय (एन - 1) से विभाजित होता है। यह सुधार नमूना पूर्वाग्रह के लिए जिम्मेदार है।
Z-स्कोर मापता है कि एक मानक सामान्य वितरण में डेटा बिंदु माध्य से कितने मानक विचलन है। इसका उपयोग डेटा को मानकीकृत करने और माध्य के सापेक्ष उसकी स्थिति का आकलन करने के लिए किया जाता है।
सूत्र: Z-स्कोर = (x - माध्य) / मानक विचलन
कहा पे:
- x डेटा बिंदु है
- माध्य डेटासेट का माध्य (औसत) है
- मानक विचलन डेटासेट का मानक विचलन है
अंतरचतुर्थक श्रेणी किसी डेटासेट में पहले चतुर्थक (Q1 - 25वें प्रतिशतक) और तीसरे चतुर्थक (Q3 - 75वें प्रतिशतक) के बीच की सीमा है। यह डेटा के मध्य 50% के प्रसार का माप प्रदान करता है।
सूत्र: IQR = Q3 - Q1
कहा पे:
- Q1 पहला चतुर्थक (25वाँ प्रतिशतक) है
- Q3 तीसरा चतुर्थक (75वाँ प्रतिशतक) है
भिन्नता का गुणांक परिवर्तनशीलता का एक सापेक्ष माप है और इसे प्रतिशत के रूप में व्यक्त किया जाता है। इसका उपयोग डेटा के मानक विचलन की उसके माध्य से तुलना करने के लिए किया जाता है, जिससे यह विभिन्न साधनों के साथ डेटासेट के बीच सापेक्ष परिवर्तनशीलता का आकलन करने के लिए उपयोगी हो जाता है।
सूत्र: सीवी = (मानक विचलन / माध्य) * 100%
तिरछापन एक वास्तविक-मूल्यवान यादृच्छिक चर के संभाव्यता वितरण की विषमता को मापता है। यह इंगित करता है कि डेटा दाईं ओर या बाईं ओर झुका हुआ है।
एक सकारात्मक तिरछा संकेत करता है कि वितरण पूंछ दाहिनी ओर तिरछी है (दाईं ओर तिरछी), जिसका अर्थ है कि वितरण के दाहिनी ओर अधिक चरम मान हैं।
एक नकारात्मक तिरछा इंगित करता है कि वितरण पूंछ बाईं ओर तिरछी है (बाएं-तिरछी), जिसका अर्थ है कि वितरण के बाईं ओर अधिक चरम मान हैं।
कर्टोसिस एक वास्तविक-मूल्यवान यादृच्छिक चर के संभाव्यता वितरण की "पुच्छता" को मापता है। यह डेटा में आउटलेर्स की उपस्थिति और डिग्री को इंगित करता है।
एक सकारात्मक कर्टोसिस (लेप्टोकर्टिक) भारी पूंछ और एक शिखर को इंगित करता है, जिसका अर्थ है कि डेटा में अधिक चरम मूल्य हैं और यह सामान्य वितरण की तुलना में अधिक चरम पर है।
एक नकारात्मक कर्टोसिस (प्लेटीकर्टिक) हल्की पूंछ और एक चापलूसी वितरण को इंगित करता है, जिसका अर्थ है कि डेटा में कम चरम मूल्य हैं और सामान्य वितरण की तुलना में चापलूसी है।
सहप्रसरण उस डिग्री को मापता है जिस तक दो चर एक साथ बदलते हैं। यह इंगित करता है कि चर का सकारात्मक या नकारात्मक रैखिक संबंध है या नहीं।
सूत्र: Cov(X, Y) = Σ((X - माध्य(X)) * (Y - माध्य(Y))) / (n - 1)
कहा पे:
- Σ योग चिह्न का प्रतिनिधित्व करता है
- X और Y परिवर्तनशील हैं
- माध्य(X) और माध्य(Y) क्रमशः X और Y के माध्य हैं
- n प्रेक्षणों की कुल संख्या है
यदि सहप्रसरण सकारात्मक है, तो यह एक सकारात्मक संबंध को इंगित करता है (Y बढ़ने पर X बढ़ता है)।
यदि सहप्रसरण नकारात्मक है, तो यह एक नकारात्मक संबंध को इंगित करता है (Y बढ़ने पर X घटता है)।
सहसंबंध गुणांक दो चर के बीच रैखिक संबंध की ताकत और दिशा को मापता है। यह सहप्रसरण का एक सामान्यीकृत संस्करण है जो -1 से 1 तक होता है।
सूत्र: r = Cov(X, Y) / (मानक विचलन(X) * मानक विचलन(Y))
कहा पे:
- Cov(X, Y) X और Y के बीच सहप्रसरण है
- मानक विचलन(X) और मानक विचलन(Y) क्रमशः X और Y के मानक विचलन हैं
यदि |आर| 1 के करीब है, यह एक मजबूत रैखिक संबंध को इंगित करता है, जिसमें सकारात्मक आर एक सकारात्मक सहसंबंध का संकेत देता है और नकारात्मक आर एक नकारात्मक सहसंबंध का संकेत देता है। यदि |आर| 0 के करीब है, यह कमजोर या कोई रैखिक संबंध नहीं दर्शाता है।
अंतिम अद्यतन: 19 जनवरी, 2024
एम्मा स्मिथ के पास इरविन वैली कॉलेज से अंग्रेजी में एमए की डिग्री है। वह 2002 से एक पत्रकार हैं और अंग्रेजी भाषा, खेल और कानून पर लेख लिखती हैं। मेरे बारे में उसके बारे में और पढ़ें जैव पृष्ठ.