दिलचस्प

मानक विचलन के लिए सीमा नियम

मानक विचलन के लिए सीमा नियम


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

मानक विचलन और सीमा डेटा सेट के प्रसार के दोनों उपाय हैं। प्रत्येक संख्या हमें अपने तरीके से बताती है कि डेटा कितना फैला हुआ है, क्योंकि वे दोनों भिन्नता के मापक हैं। यद्यपि सीमा और मानक विचलन के बीच एक स्पष्ट संबंध नहीं है, अंगूठे का एक नियम है जो इन दोनों आंकड़ों से संबंधित होने के लिए उपयोगी हो सकता है। इस संबंध को कभी-कभी मानक विचलन के लिए सीमा नियम के रूप में जाना जाता है।

रेंज नियम हमें बताता है कि एक नमूना का मानक विचलन लगभग एक-चौथाई डेटा की सीमा के बराबर है। दूसरे शब्दों में रों = (अधिकतम - न्यूनतम) / 4। यह उपयोग करने के लिए एक बहुत ही सरल सूत्र है, और केवल मानक विचलन के बहुत मोटे अनुमान के रूप में उपयोग किया जाना चाहिए।

एक उदाहरण

रेंज नियम कैसे काम करता है, इसका एक उदाहरण देखने के लिए, हम निम्नलिखित उदाहरण को देखेंगे। मान लें कि हम 12, 12, 14, 15, 16, 18, 18, 20, 20, 25 के डेटा मूल्यों के साथ शुरू करते हैं। इन मूल्यों का मतलब 17 है और मानक 4.1 का विचलन है। यदि इसके बजाय हम पहले अपने डेटा की सीमा को 25 - 12 = 13 के रूप में आंकते हैं और फिर इस संख्या को चार से विभाजित करते हैं तो हमारे पास मानक विचलन का अनुमान 13/4 = 3.25 है। यह संख्या सही मानक विचलन के करीब है और मोटे अनुमान के लिए अच्छा है।

क्यों काम करता है?

ऐसा लग सकता है कि रेंज का नियम थोड़ा अजीब है। यह काम क्यों करता है? क्या यह पूरी तरह से मनमाने ढंग से नहीं लगता है कि यह सीमा को चार से विभाजित कर सकता है? हम एक अलग संख्या से क्यों नहीं विभाजित होंगे? वास्तव में पर्दे के पीछे कुछ गणितीय औचित्य चल रहा है।

एक मानक सामान्य वितरण से घंटी वक्र और संभाव्यता के गुणों को याद करें। एक विशेषता को उन डेटा की मात्रा के साथ करना होता है जो एक निश्चित संख्या में मानक विचलन के भीतर आते हैं:

  • लगभग 68% डेटा औसत से एक मानक विचलन (उच्च या निम्न) के भीतर है।
  • लगभग 95% डेटा औसत से दो मानक विचलन (उच्च या निम्न) के भीतर है।
  • लगभग 99% मतलब से तीन मानक विचलन (उच्च या निम्न) के भीतर है।

संख्या है कि हम उपयोग करेंगे 95% के साथ क्या करना है। हम कह सकते हैं कि माध्य से दो मानक विचलन से नीचे दो मानक विचलन से 95%, हमारे पास 95% डेटा है। इस प्रकार हमारे लगभग सभी सामान्य वितरण एक लाइन सेगमेंट में फैल जाएंगे जो कुल चार मानक विचलन हैं।

सभी डेटा सामान्य रूप से वितरित नहीं होते हैं और घंटी वक्र के आकार के होते हैं। लेकिन अधिकांश डेटा को अच्छी तरह से व्यवहार किया जाता है कि दो मानक विचलन से दूर जाने से लगभग सभी डेटा कैप्चर होता है। हम अनुमान लगाते हैं और कहते हैं कि चार मानक विचलन लगभग सीमा के आकार के होते हैं, और इसलिए चार से विभाजित सीमा मानक विचलन का लगभग अनुमान है।

रेंज नियम के लिए उपयोग करता है

सीमा नियम कई सेटिंग्स में सहायक है। सबसे पहले, यह मानक विचलन का एक बहुत ही त्वरित अनुमान है। मानक विचलन के लिए हमें पहले माध्य ज्ञात करना पड़ता है, फिर इस माध्य को प्रत्येक डेटा बिंदु से घटाते हैं, अंतरों को वर्गबद्ध करते हैं, इन्हें जोड़ते हैं, डेटा बिंदुओं की संख्या से एक से कम विभाजित करते हैं, फिर (अंत में) वर्गमूल लेते हैं। दूसरी ओर, सीमा नियम में केवल एक घटाव और एक विभाजन की आवश्यकता होती है।

अन्य स्थान जहां रेंज नियम सहायक है, जब हमारे पास अधूरी जानकारी होती है। फ़ार्मुलों जैसे कि नमूना आकार निर्धारित करने के लिए तीन टुकड़ों की जानकारी की आवश्यकता होती है: त्रुटि का वांछित मार्जिन, आत्मविश्वास का स्तर और हम जिस आबादी की जांच कर रहे हैं, उसके मानक विचलन। कई बार यह जानना असंभव है कि जनसंख्या मानक विचलन क्या है। सीमा नियम के साथ, हम इस आंकड़े का अनुमान लगा सकते हैं, और फिर जान सकते हैं कि हमें अपना नमूना कितना बड़ा बनाना चाहिए।


Video, Sitemap-Video, Sitemap-Videos