क्रिटिकल ची स्क्वायर मान कैसे ज्ञात करें। दो आवृत्ति वितरणों की तुलना। ची - वर्ग परीक्षण

इस लेख में हम संकेतों के बीच निर्भरता के अध्ययन के बारे में बात करेंगे, या जैसा कि आप चाहें - यादृच्छिक मान, चर। विशेष रूप से, हम देखेंगे कि ची-स्क्वायर परीक्षण का उपयोग करके विशेषताओं के बीच निर्भरता का माप कैसे पेश किया जाए और सहसंबंध गुणांक के साथ इसकी तुलना की जाए।

इसकी आवश्यकता क्यों पड़ सकती है? उदाहरण के लिए, यह समझने के लिए कि क्रेडिट स्कोरिंग का निर्माण करते समय कौन सी विशेषताएँ लक्ष्य चर पर अधिक निर्भर हैं - ग्राहक डिफ़ॉल्ट की संभावना का निर्धारण करना। या, जैसा कि मेरे मामले में, समझें कि ट्रेडिंग रोबोट को प्रोग्राम करने के लिए किन संकेतकों का उपयोग करने की आवश्यकता है।

अलग से, मैं यह नोट करना चाहूंगा कि मैं डेटा विश्लेषण के लिए C# भाषा का उपयोग करता हूं। शायद यह सब पहले से ही R या Python में लागू किया जा चुका है, लेकिन मेरे लिए C# का उपयोग करने से मुझे विषय को विस्तार से समझने में मदद मिलती है, इसके अलावा, यह मेरी पसंदीदा प्रोग्रामिंग भाषा है।

आइये बिल्कुल शुरुआत करते हैं सरल उदाहरण, एक यादृच्छिक संख्या जनरेटर का उपयोग करके एक्सेल में चार कॉलम बनाएं:
एक्स=रैंडबेटीन(-100,100)
वाई =एक्स*10+20
जेड =एक्स*एक्स
टी=रैंडबेटीन(-100,100)

जैसा कि आप देख सकते हैं, वेरिएबल वाईरैखिक रूप से निर्भर एक्स; चर जेडचतुष्कोणीय रूप से निर्भर एक्स; चर एक्सऔर टीस्वतंत्र। मैंने यह चुनाव जानबूझकर किया है, क्योंकि हम अपनी निर्भरता के माप की तुलना सहसंबंध गुणांक से करेंगे। जैसा कि ज्ञात है, दो यादृच्छिक चर के बीच यह बराबर मॉड्यूल 1 है यदि उनके बीच "सबसे कठिन" प्रकार की निर्भरता रैखिक है। दो स्वतंत्र यादृच्छिक चरों के बीच शून्य सहसंबंध है, लेकिन सहसंबंध गुणांक की शून्य तक समानता का अर्थ स्वतंत्रता नहीं है. आगे हम इसे वेरिएबल्स के उदाहरण का उपयोग करके देखेंगे एक्सऔर जेड.

फ़ाइल को data.csv के रूप में सहेजें और पहला अनुमान शुरू करें। सबसे पहले, मानों के बीच सहसंबंध गुणांक की गणना करें। मैंने लेख में कोड नहीं डाला है; यह मेरे जीथब पर है। हमें सभी संभावित जोड़ियों के लिए सहसंबंध मिलता है:

यह देखा जा सकता है कि रैखिक रूप से निर्भर एक्सऔर वाईसहसंबंध गुणांक 1 है. लेकिन एक्सऔर जेडयह 0.01 के बराबर है, हालाँकि हम निर्भरता को स्पष्ट रूप से निर्धारित करते हैं जेड=एक्स*एक्स. स्पष्ट रूप से, हमें एक ऐसे उपाय की आवश्यकता है जो लत को बेहतर ढंग से "महसूस" कर सके। लेकिन ची-स्क्वायर परीक्षण पर आगे बढ़ने से पहले, आइए देखें कि आकस्मिकता मैट्रिक्स क्या है।

एक आकस्मिक मैट्रिक्स बनाने के लिए, हम चर मानों की सीमा को अंतराल (या वर्गीकृत) में विभाजित करते हैं। ऐसा करने के कई तरीके हैं, लेकिन कोई सार्वभौमिक तरीका नहीं है। उनमें से कुछ को अंतरालों में विभाजित किया गया है ताकि उनमें समान संख्या में चर हों, अन्य को समान लंबाई के अंतरालों में विभाजित किया गया है। मैं व्यक्तिगत रूप से इन दृष्टिकोणों को संयोजित करना पसंद करता हूँ। मैंने इस पद्धति का उपयोग करने का निर्णय लिया: मैं वेरिएबल से मैट स्कोर घटाता हूं। अपेक्षाएँ, तो मैं जो प्राप्त करता हूँ उसे रेटिंग से विभाजित करता हूँ मानक विचलन. दूसरे शब्दों में, मैं यादृच्छिक चर को केन्द्रित और सामान्यीकृत करता हूँ। परिणामी मान को एक गुणांक से गुणा किया जाता है (इस उदाहरण में यह 1 है), जिसके बाद सब कुछ निकटतम पूर्ण संख्या में पूर्णांकित किया जाता है। आउटपुट है प्रकार चर int, जो वर्ग पहचानकर्ता है।

तो चलिए अपना संकेत लेते हैं एक्सऔर जेड, हम ऊपर वर्णित तरीके से वर्गीकृत करते हैं, जिसके बाद हम प्रत्येक वर्ग की उपस्थिति की संख्या और संभावनाओं और सुविधाओं के जोड़े की उपस्थिति की संभावनाओं की गणना करते हैं:

यह मात्रा के आधार पर एक मैट्रिक्स है। यहाँ पंक्तियों में - परिवर्तनीय वर्गों की घटनाओं की संख्या एक्स, कॉलम में - चर की कक्षाओं की घटनाओं की संख्या जेड, कोशिकाओं में - एक साथ वर्गों के जोड़े की उपस्थिति की संख्या। उदाहरण के लिए, वेरिएबल के लिए कक्षा 0 865 बार आई एक्स, एक चर के लिए 823 बार जेडऔर वहाँ कभी कोई जोड़ा (0,0) नहीं था। आइए सभी मानों को 3000 से विभाजित करके संभावनाओं की ओर बढ़ें ( कुल गणनाअवलोकन):

हमने सुविधाओं को वर्गीकृत करने के बाद एक आकस्मिकता मैट्रिक्स प्राप्त किया। अब समय है कसौटी पर सोचने का. परिभाषा के अनुसार, यादृच्छिक चर स्वतंत्र होते हैं यदि इन यादृच्छिक चर द्वारा उत्पन्न सिग्मा बीजगणित स्वतंत्र होते हैं। सिग्मा बीजगणित की स्वतंत्रता का तात्पर्य उनसे घटनाओं की जोड़ीवार स्वतंत्रता से है। दो घटनाओं को स्वतंत्र कहा जाता है यदि उनकी संयुक्त घटना की संभावना इन घटनाओं की संभावनाओं के उत्पाद के बराबर है: पिज = पि*पज. यह वह सूत्र है जिसका उपयोग हम मानदंड बनाने के लिए करेंगे।

शून्य परिकल्पना: वर्गीकृत संकेत एक्सऔर जेडस्वतंत्र। इसके समतुल्य: आकस्मिक मैट्रिक्स का वितरण पूरी तरह से चर के वर्गों (पंक्तियों और स्तंभों की संभावनाओं) की घटना की संभावनाओं द्वारा निर्दिष्ट किया जाता है। या यह: मैट्रिक्स कोशिकाएं पंक्तियों और स्तंभों की संगत संभावनाओं के उत्पाद द्वारा पाई जाती हैं। हम निर्माण के लिए शून्य परिकल्पना के इस सूत्रीकरण का उपयोग करेंगे निर्णायक नियम: के बीच महत्वपूर्ण विसंगति पीजऔर पी*पी.जेशून्य परिकल्पना को अस्वीकार करने का आधार होगा।

मान लीजिए कक्षा 0 के एक चर में प्रदर्शित होने की प्रायिकता है एक्स. हमारा कुल एनपर कक्षाएं एक्सऔर एमपर कक्षाएं जेड. यह पता चला है कि मैट्रिक्स वितरण को निर्दिष्ट करने के लिए हमें इन्हें जानने की आवश्यकता है एनऔर एमसम्भावनाएँ लेकिन वास्तव में, अगर हम जानते हैं एन-1के लिए संभावना एक्स, तो बाद वाला 1 में से अन्य का योग घटाकर पाया जाता है। इस प्रकार, आकस्मिकता मैट्रिक्स के वितरण को खोजने के लिए हमें जानना आवश्यक है l=(n-1)+(m-1)मूल्य. या हमारे पास है एल-आयामी पैरामीट्रिक स्पेस, वेक्टर जिससे हमें हमारा वांछित वितरण मिलता है। ची-स्क्वायर आँकड़ा इस तरह दिखेगा:

और, फिशर के प्रमेय के अनुसार, एक ची-स्क्वायर वितरण है n*m-l-1=(n-1)(m-1)स्वतंत्रता की कोटियां।

आइए महत्व स्तर को 0.95 पर सेट करें (या टाइप I त्रुटि की संभावना 0.05 है)। आइए उदाहरण से दिए गए महत्व स्तर और स्वतंत्रता की डिग्री के लिए ची वर्ग वितरण की मात्रा ज्ञात करें (n-1)(m-1)=4*3=12: 21.02606982. चरों के लिए ची-स्क्वायर आँकड़ा स्वयं एक्सऔर जेड 4088.006631 के बराबर है। स्पष्ट है कि स्वतंत्रता की परिकल्पना स्वीकृत नहीं है। ची-स्क्वायर आँकड़ों के थ्रेशोल्ड मान के अनुपात पर विचार करना सुविधाजनक है - इस मामले में यह बराबर है Chi2Coeff=194.4256186. यदि यह अनुपात 1 से कम है तो स्वतंत्रता की परिकल्पना स्वीकार की जाती है; यदि अधिक है तो नहीं। आइए सुविधाओं के सभी युग्मों के लिए यह अनुपात ज्ञात करें:

यहाँ फ़ैक्टर1और फ़ैक्टर2- सुविधा नाम
src_cnt1और src_cnt2- प्रारंभिक सुविधाओं के अद्वितीय मूल्यों की संख्या
mod_cnt1और mod_cnt2- वर्गीकरण के बाद अद्वितीय सुविधा मूल्यों की संख्या
chi2- ची-स्क्वायर आँकड़े
chi2max- 0.95 के महत्व स्तर के लिए ची-स्क्वायर आँकड़ा का थ्रेशोल्ड मान
chi2Coeff- ची-स्क्वायर आँकड़ा और थ्रेशोल्ड मान का अनुपात
ठीक है- सहसंबंध गुणांक

यह देखा जा सकता है कि वे स्वतंत्र हैं (chi2coeff<1) получились следующие пары признаков - (एक्स, टी), (वाई, टी) और ( जेड,टी), जो कि चर के बाद से तार्किक है टीयादृच्छिक रूप से उत्पन्न होता है. चर एक्सऔर जेडनिर्भर, लेकिन रैखिक रूप से निर्भर से कम एक्सऔर वाई, जो तर्कसंगत भी है।

मैंने उस उपयोगिता का कोड पोस्ट किया जो इन संकेतकों की गणना जीथब पर करता है, जहां data.csv फ़ाइल भी है। उपयोगिता इनपुट के रूप में एक सीएसवी फ़ाइल लेती है और कॉलम के सभी जोड़े के बीच निर्भरता की गणना करती है: PtProject.Dependency.exe data.csv

रूसी संघ के शिक्षा और विज्ञान मंत्रालय

इरकुत्स्क शहर की शिक्षा के लिए संघीय एजेंसी

बैकाल स्टेट यूनिवर्सिटी ऑफ़ इकोनॉमिक्स एंड लॉ

सूचना विज्ञान और साइबरनेटिक्स विभाग

ची-स्क्वायर वितरण और उसके अनुप्रयोग

कोलमीकोवा अन्ना एंड्रीवाना

द्वितीय वर्ष का छात्र

समूह IS-09-1

प्राप्त डेटा को संसाधित करने के लिए हम ची-स्क्वायर परीक्षण का उपयोग करते हैं।

ऐसा करने के लिए, हम अनुभवजन्य आवृत्तियों के वितरण की एक तालिका बनाएंगे, अर्थात। वे आवृत्तियाँ जिन्हें हम देखते हैं:

सैद्धांतिक रूप से, हम उम्मीद करते हैं कि आवृत्तियों को समान रूप से वितरित किया जाएगा, अर्थात। आवृत्ति को लड़कों और लड़कियों के बीच आनुपातिक रूप से वितरित किया जाएगा। आइए सैद्धांतिक आवृत्तियों की एक तालिका बनाएं। ऐसा करने के लिए, पंक्ति के योग को कॉलम के योग से गुणा करें और परिणामी संख्या को कुल योग से विभाजित करें।


गणना के लिए अंतिम तालिका इस तरह दिखेगी:

χ2 = ∑(ई - टी)² / टी

n = (R - 1), जहां R तालिका में पंक्तियों की संख्या है।

हमारे मामले में, ची-स्क्वायर = 4.21; एन = 2.

मानदंड के महत्वपूर्ण मानों की तालिका का उपयोग करते हुए, हम पाते हैं: n = 2 और 0.05 के त्रुटि स्तर के साथ, महत्वपूर्ण मान χ2 = 5.99 है।

परिणामी मान क्रिटिकल से कम है, जिसका अर्थ है कि इसे स्वीकार किया जाता है शून्य परिकल्पना.

निष्कर्ष: शिक्षक बच्चे की विशेषताएँ लिखते समय उसके लिंग को महत्व नहीं देते हैं।

आवेदन

χ2 वितरण के महत्वपूर्ण बिंदु

तालिका नंबर एक

निष्कर्ष

लगभग सभी विशिष्टताओं के छात्र उच्च गणित पाठ्यक्रम के अंत में "संभावना सिद्धांत और गणितीय सांख्यिकी" खंड का अध्ययन करते हैं; वास्तव में, वे केवल कुछ बुनियादी अवधारणाओं और परिणामों से परिचित होते हैं, जो स्पष्ट रूप से व्यावहारिक कार्य के लिए पर्याप्त नहीं हैं। छात्रों को विशेष पाठ्यक्रमों में कुछ गणितीय अनुसंधान विधियों से परिचित कराया जाता है (उदाहरण के लिए, "पूर्वानुमान और तकनीकी और आर्थिक योजना", "तकनीकी और आर्थिक विश्लेषण", "उत्पाद गुणवत्ता नियंत्रण", "विपणन", "नियंत्रण", "भविष्यवाणी के गणितीय तरीके ”) ", "सांख्यिकी", आदि - आर्थिक विशिष्टताओं के छात्रों के मामले में), हालांकि, ज्यादातर मामलों में प्रस्तुति प्रकृति में बहुत संक्षिप्त और सूत्रबद्ध होती है। परिणामस्वरूप, व्यावहारिक सांख्यिकी विशेषज्ञों का ज्ञान अपर्याप्त है।

इसलिए, तकनीकी विश्वविद्यालयों में "एप्लाइड स्टैटिस्टिक्स" पाठ्यक्रम का बहुत महत्व है, और आर्थिक विश्वविद्यालयों में "अर्थमिति" पाठ्यक्रम, क्योंकि अर्थमिति, जैसा कि ज्ञात है, विशिष्ट आर्थिक डेटा का सांख्यिकीय विश्लेषण है।

संभाव्यता सिद्धांत और गणितीय आँकड़े व्यावहारिक सांख्यिकी और अर्थमिति के लिए मौलिक ज्ञान प्रदान करते हैं।

वे व्यावहारिक कार्य के लिए विशेषज्ञों के लिए आवश्यक हैं।

मैंने सतत संभाव्य मॉडल को देखा और उदाहरणों के साथ इसका उपयोग दिखाने का प्रयास किया।

ग्रन्थसूची

1. ओर्लोव ए.आई. एप्लाईड स्टैटस्टिक्स। एम.: प्रकाशन गृह "परीक्षा", 2004।

2. गमुरमन वी.ई. संभाव्यता और गणितीय सांख्यिकी का सिद्धांत। एम.: हायर स्कूल, 1999. - 479 पी।

3. अयवोज़्यान एस.ए. संभाव्यता सिद्धांत और अनुप्रयुक्त सांख्यिकी, खंड 1. एम.: यूनिटी, 2001. - 656 पी.

4. खमितोव जी.पी., वेडेर्निकोवा टी.आई. संभावनाएँ और आँकड़े। इरकुत्स्क: बीजीयूईपी, 2006 - 272 पी।

5. एज़ोवा एल.एन. अर्थमिति। इरकुत्स्क: बीजीयूईपी, 2002. - 314 पी।

6. मोस्टेलर एफ. समाधान के साथ पचास मनोरंजक संभाव्य समस्याएं। एम.: नौका, 1975. - 111 पी.

7. मोस्टेलर एफ. संभाव्यता। एम.: मीर, 1969. - 428 पी।

8. याग्लोम ए.एम. संभाव्यता एवं सूचना. एम.: नौका, 1973. - 511 पी.

9. चिस्त्यकोव वी.पी. संभाव्यता सिद्धांत पाठ्यक्रम. एम.: नौका, 1982. - 256 पी.

10. क्रेमर एन.एस.एच. संभाव्यता और गणितीय सांख्यिकी का सिद्धांत। एम.: यूनिटी, 2000. - 543 पी.

11. गणितीय विश्वकोश, खंड 1। एम.: सोवियत इनसाइक्लोपीडिया, 1976. - 655 पी।

12. http://psystat.at.ua/ - मनोविज्ञान और शिक्षाशास्त्र में सांख्यिकी। लेख ची-स्क्वायर परीक्षण.

स्वतंत्रता के काई-स्क्वायर परीक्षण का उपयोग दो श्रेणीगत चरों के बीच संबंध निर्धारित करने के लिए किया जाता है। श्रेणीबद्ध चरों के जोड़े के उदाहरण हैं: वैवाहिक स्थिति बनाम। प्रतिवादी का रोजगार स्तर; कुत्ते की नस्ल बनाम मालिक का पेशा, वेतन स्तर बनाम। एक इंजीनियर की विशेषज्ञता, आदि। स्वतंत्रता की कसौटी की गणना करते समय, परिकल्पना का परीक्षण किया जाता है कि चर के बीच कोई संबंध नहीं है। हम MS EXCEL 2010 CHI2.TEST() फ़ंक्शन और पारंपरिक सूत्रों का उपयोग करके गणना करेंगे।

आइए मान लें कि हमारे पास है नमूना 500 लोगों के सर्वेक्षण के परिणाम का प्रतिनिधित्व करने वाला डेटा। लोगों से 2 प्रश्न पूछे गए: उनकी वैवाहिक स्थिति (विवाहित, नागरिक भागीदारी, रिश्ते में नहीं) और उनके रोजगार के स्तर (पूर्णकालिक, अंशकालिक, अस्थायी रूप से काम नहीं करने वाले, घर पर, सेवानिवृत्त, अध्ययनरत) के बारे में। सभी उत्तर तालिका में रखे गए थे:

इस तालिका को कहा जाता है विशेषताओं की आकस्मिकता तालिका(या कारक तालिका, अंग्रेजी आकस्मिकता तालिका)। तालिका की पंक्तियों और स्तंभों के प्रतिच्छेदन पर स्थित तत्वों को आमतौर पर O ij (अंग्रेजी ऑब्जर्व्ड से, यानी अवलोकन की गई, वास्तविक आवृत्तियों) नामित किया जाता है।

हम इस प्रश्न में रुचि रखते हैं कि "क्या वैवाहिक स्थिति रोजगार को प्रभावित करती है?", अर्थात्। क्या दो वर्गीकरण विधियों के बीच कोई निर्भरता है? नमूने?

पर परिकल्पना परीक्षणइस रूप को आमतौर पर स्वीकार किया जाता है शून्य परिकल्पनाबताता है कि वर्गीकरण विधियों की कोई निर्भरता नहीं है।

आइए मामलों को सीमित करने पर विचार करें। दो श्रेणीगत चरों की पूर्ण निर्भरता का एक उदाहरण निम्नलिखित सर्वेक्षण परिणाम है:

इस मामले में, वैवाहिक स्थिति स्पष्ट रूप से रोजगार निर्धारित करती है (देखें)। उदाहरण फ़ाइल शीट स्पष्टीकरण). इसके विपरीत, पूर्ण स्वतंत्रता का एक उदाहरण एक अन्य सर्वेक्षण परिणाम है:

कृपया ध्यान दें कि इस मामले में रोजगार दर वैवाहिक स्थिति (विवाहित और अविवाहित लोगों के लिए समान) पर निर्भर नहीं करती है। यह बिल्कुल शब्दों से मेल खाता है शून्य परिकल्पना. अगर शून्य परिकल्पनायदि निष्पक्ष है, तो सर्वेक्षण के परिणामों को इस तरह वितरित किया जाना चाहिए कि नियोजित लोगों का प्रतिशत वैवाहिक स्थिति की परवाह किए बिना समान होगा। इसका उपयोग करके, हम उन सर्वेक्षण परिणामों की गणना करते हैं जो इसके अनुरूप हैं शून्य परिकल्पना(सेमी। उदाहरण शीट फ़ाइल उदाहरण).

सबसे पहले, हम संभाव्यता अनुमान की गणना करते हैं कि तत्व नमूनेएक निश्चित अधिभोग होगा (कॉलम यू देखें):

कहाँ साथ- स्तंभों (स्तंभों) की संख्या "वैवाहिक स्थिति" चर के स्तरों की संख्या के बराबर।

फिर हम संभाव्यता अनुमान की गणना करते हैं कि तत्व नमूनेएक निश्चित वैवाहिक स्थिति होगी (पंक्ति v j देखें)।

कहाँ आर- पंक्तियों की संख्या "अधिभोग" चर के स्तरों की संख्या के बराबर।

चर की स्वतंत्रता के मामले में प्रत्येक सेल ई आईजे (अंग्रेजी अपेक्षित, यानी अपेक्षित आवृत्ति से) के लिए सैद्धांतिक आवृत्ति की गणना सूत्र द्वारा की जाती है:
ई आईजे =एन* यू आई * वी जे

यह ज्ञात है कि बड़े n के लिए आँकड़े X 2 0 में लगभग (r-1)(c-1) स्वतंत्रता की डिग्री (df - स्वतंत्रता की डिग्री) है:

यदि आधार पर गणना की जाए नमूनेतब इस आँकड़े का मान "बहुत बड़ा" (सीमा से अधिक) है शून्य परिकल्पनाअस्वीकार कर दिया। थ्रेशोल्ड मान की गणना इसके आधार पर की जाती है, उदाहरण के लिए सूत्र =HI2.OBR.PH(0.05; df) का उपयोग करके।

टिप्पणी: महत्वपूर्ण स्तरआमतौर पर 0.1 के बराबर लिया जाता है; 0.05; 0.01.

पर परिकल्पना परीक्षणइसकी गणना करना भी सुविधाजनक है, जिसकी हम तुलना करते हैं स्तर का महत्व. पी-अर्थ(r-1)*(c-1)=df स्वतंत्रता की डिग्री का उपयोग करके गणना की गई।

यदि संभावना है कि एक यादृच्छिक चर में c (r-1)(c-1) है स्वतंत्रता की कोटियांगणना किए गए आँकड़ों X 2 0 से अधिक मान लेगा, अर्थात। P(Х 2 (r-1)*(c-1) >Х 2 0 ), कम महत्वपूर्ण स्तर, वह शून्य परिकल्पनाअस्वीकार कर दिया।

एमएस एक्सेल में पी-मूल्यसूत्र का उपयोग करके गणना की जा सकती है =HI2.DIST.PH(X 2 0 ;df), निश्चित रूप से, इससे ठीक पहले आँकड़ों X 2 0 के मूल्य की गणना की गई है (यह उदाहरण फ़ाइल में किया गया है)। हालाँकि, CH2.TEST() फ़ंक्शन का उपयोग करना सबसे सुविधाजनक है। इस फ़ंक्शन के तर्क के रूप में, वास्तविक (अवलोकित) और गणना की गई सैद्धांतिक आवृत्तियों (अपेक्षित) वाली श्रेणियों के संदर्भ निर्दिष्ट किए गए हैं।

अगर महत्वपूर्ण स्तर > पी-मूल्य, तो इसका मतलब निष्पक्षता की धारणा से गणना की गई वास्तविक और सैद्धांतिक आवृत्तियों से है शून्य परिकल्पना, गंभीर रूप से भिन्न हैं। इसीलिए, शून्य परिकल्पनाअस्वीकार किया जाना चाहिए.

CH2.TEST() फ़ंक्शन का उपयोग करने से आप प्रक्रिया को तेज़ कर सकते हैं परिकल्पना परीक्षण, क्योंकि मूल्य की गणना करने की कोई आवश्यकता नहीं है आंकड़े. अब CH2.TEST() फ़ंक्शन के परिणाम की तुलना दिए गए फ़ंक्शन से करना पर्याप्त है स्तर का महत्व.

टिप्पणी: फ़ंक्शन CH2.TEST() , अंग्रेजी नाम CHISQ.TEST, MS EXCEL 2010 में दिखाई दिया। MS EXCEL 2007 में उपलब्ध इसके पुराने संस्करण CHISQ.TEST() में समान कार्यक्षमता है। लेकिन, जहां तक ​​CH2.TEST() का सवाल है, आपको सैद्धांतिक आवृत्तियों की गणना स्वयं करने की आवश्यकता है।

में आवेदन पर विचार करेंएमएसएक्सेलसरल परिकल्पनाओं के परीक्षण के लिए पियर्सन ची-स्क्वायर परीक्षण।

प्रायोगिक डेटा प्राप्त करने के बाद (अर्थात जब कुछ हो नमूना) आमतौर पर वितरण कानून का चुनाव किया जाता है जो किसी दिए गए यादृच्छिक चर का सबसे अच्छा वर्णन करता है नमूना. चयनित सैद्धांतिक वितरण कानून द्वारा प्रायोगिक डेटा का कितनी अच्छी तरह वर्णन किया गया है, इसकी जाँच का उपयोग करके किया जाता है समझौते के मानदंड. शून्य परिकल्पना, आमतौर पर वितरण की समानता के बारे में एक परिकल्पना होती है अनियमित परिवर्तनशील वस्तुकुछ सैद्धांतिक कानून.

आइए पहले एप्लिकेशन को देखें पियर्सन का फिट परीक्षण X 2 (ची-स्क्वायर)सरल परिकल्पनाओं के संबंध में (सैद्धांतिक वितरण के मापदंडों को ज्ञात माना जाता है)। तब - , जब केवल वितरण का आकार निर्दिष्ट किया जाता है, और इस वितरण के पैरामीटर और मूल्य आंकड़े एक्स 2 उसी के आधार पर मूल्यांकन/गणना की जाती है नमूने.

टिप्पणी: अंग्रेजी भाषा के साहित्य में, आवेदन प्रक्रिया पियर्सन अच्छाई-की-फिट परीक्षण एक्स 2 एक नाम है फिट परीक्षण की ची-स्क्वायर अच्छाई.

आइए हम परिकल्पनाओं के परीक्षण की प्रक्रिया को याद करें:

  • आधारित नमूनेमान की गणना की जाती है आंकड़े, जो परीक्षण की जा रही परिकल्पना के प्रकार से मेल खाता है। उदाहरण के लिए, प्रयुक्त के लिए टी-सांख्यिकी(यदि ज्ञात नहीं है);
  • सत्य के अधीन शून्य परिकल्पना, इसका वितरण आंकड़ेज्ञात है और संभावनाओं की गणना के लिए इसका उपयोग किया जा सकता है (उदाहरण के लिए, के लिए)। टी-सांख्यिकीयह );
  • के आधार पर गणना की गई नमूनेअर्थ आंकड़ेकिसी दिए गए मान के लिए महत्वपूर्ण मान की तुलना में ();
  • शून्य परिकल्पनायदि मान अस्वीकार करें आंकड़ेक्रिटिकल से अधिक (या यदि यह मान प्राप्त करने की संभावना है आंकड़े() कम महत्वपूर्ण स्तर, जो एक समतुल्य दृष्टिकोण है)।

आइए अमल करें परिकल्पना परीक्षणविभिन्न वितरणों के लिए.

अलग मामला

मान लीजिए दो लोग पासा खेल रहे हैं। प्रत्येक खिलाड़ी के पास पासों का अपना सेट होता है। खिलाड़ी बारी-बारी से एक साथ 3 पासे घुमाते हैं। प्रत्येक राउंड वह जीतता है जो एक समय में सबसे अधिक छक्के लगाता है। परिणाम दर्ज किए गए हैं. खिलाड़ियों में से एक को, 100 राउंड के बाद, संदेह हुआ कि उसके प्रतिद्वंद्वी के पासे असममित थे, क्योंकि वह अक्सर जीतता है (वह अक्सर छक्के लगाता है)। उन्होंने यह विश्लेषण करने का निर्णय लिया कि इतनी संख्या में शत्रुओं के परिणाम कितने संभावित थे।

टिप्पणी: क्योंकि 3 घन हैं, तो आप एक बार में 0 रोल कर सकते हैं; 1; 2 या 3 छक्के, यानी. एक यादृच्छिक चर 4 मान ले सकता है।

संभाव्यता सिद्धांत से हम जानते हैं कि यदि पासे सममित हैं, तो छक्का लगने की संभावना का पालन होता है। इसलिए, 100 राउंड के बाद, छक्कों की आवृत्ति की गणना सूत्र का उपयोग करके की जा सकती है
=BINOM.DIST(A7,3,1/6,FALSE)*100

सूत्र मानता है कि कोशिका में ए7 इसमें एक राउंड में लगाए गए छक्कों की संगत संख्या शामिल है।

टिप्पणी: गणनाएँ दी गई हैं असतत शीट पर उदाहरण फ़ाइल.

तुलना के लिए देखा(देखा गया) और सैद्धांतिक आवृत्तियाँ(अपेक्षित) उपयोग में सुविधाजनक।

यदि देखी गई आवृत्तियाँ सैद्धांतिक वितरण से महत्वपूर्ण रूप से विचलित होती हैं, शून्य परिकल्पनाएक सैद्धांतिक कानून के अनुसार एक यादृच्छिक चर के वितरण के बारे में खारिज कर दिया जाना चाहिए। अर्थात्, यदि प्रतिद्वंद्वी के पासे असममित हैं, तो देखी गई आवृत्तियाँ "काफी भिन्न" होंगी द्विपद वितरण.

हमारे मामले में, पहली नज़र में, आवृत्तियाँ काफी करीब हैं और गणना के बिना एक स्पष्ट निष्कर्ष निकालना मुश्किल है। उपयुक्त पियर्सन गुडनेस-ऑफ-फिट टेस्ट एक्स 2, ताकि व्यक्तिपरक कथन के बजाय "काफ़ी हद तक भिन्न", जिसे तुलना के आधार पर बनाया जा सके हिस्टोग्राम, गणितीय रूप से सही कथन का उपयोग करें।

हम इस तथ्य का उपयोग करते हैं कि के कारण कानून बड़ी संख्या बढ़ती मात्रा के साथ प्रेक्षित आवृत्ति (अवलोकित)। नमूने n सैद्धांतिक कानून के अनुरूप संभाव्यता की ओर प्रवृत्त होता है (हमारे मामले में, द्विपद नियम). हमारे मामले में, नमूना आकार n 100 है।

आइए परिचय कराते हैं परीक्षा आंकड़े, जिसे हम X 2 से निरूपित करते हैं:

जहां O l घटनाओं की देखी गई आवृत्ति है जिसे यादृच्छिक चर ने निश्चित किया है वैध मान, ई एल संगत सैद्धांतिक आवृत्ति (अपेक्षित) है। एल उन मानों की संख्या है जो एक यादृच्छिक चर ले सकता है (हमारे मामले में यह 4 है)।

जैसा कि सूत्र से देखा जा सकता है, यह आंकड़ेसैद्धांतिक आवृत्तियों के साथ प्रेक्षित आवृत्तियों की निकटता का एक माप है, अर्थात। इसका उपयोग इन आवृत्तियों के बीच "दूरियों" का अनुमान लगाने के लिए किया जा सकता है। यदि इन "दूरियों" का योग "बहुत बड़ा" है, तो ये आवृत्तियाँ "काफी भिन्न" हैं। यह स्पष्ट है कि यदि हमारा घन सममित (अर्थात् लागू) है द्विपद नियम ), तो संभावना है कि "दूरियों" का योग "बहुत बड़ा" होगा, छोटा होगा। इस संभाव्यता की गणना करने के लिए हमें वितरण जानने की आवश्यकता है आंकड़ेएक्स 2 ( आंकड़े X 2 की गणना यादृच्छिक आधार पर की गई नमूने, इसलिए यह एक यादृच्छिक चर है और इसलिए, इसका अपना है प्रायिकता वितरण).

बहुआयामी एनालॉग से अभिन्न प्रमेयमोइवरे-लाप्लासयह ज्ञात है कि n->∞ के लिए हमारा यादृच्छिक चर X 2 स्पर्शोन्मुख रूप से L - 1 डिग्री की स्वतंत्रता के साथ है।

तो यदि गणना मूल्य आंकड़ेएक्स 2 (आवृत्तियों के बीच "दूरियों" का योग) एक निश्चित से अधिक होगा सीमा मूल्य, तो हमारे पास अस्वीकार करने का कारण होगा शून्य परिकल्पना. जाँच के समान पैरामीट्रिक परिकल्पनाएँ, सीमा मान के माध्यम से निर्धारित किया गया है महत्वपूर्ण स्तर. यदि संभावना यह है कि X2 आँकड़ा गणना किए गए मान से कम या उसके बराबर मान लेगा ( पी-अर्थ), कम होगा महत्वपूर्ण स्तर, वह शून्य परिकल्पनाअस्वीकार किया जा सकता है.

हमारे मामले में, आँकड़ा मान 22.757 है। संभावना है कि X2 आँकड़ा 22.757 से अधिक या उसके बराबर मान लेगा, बहुत छोटा है (0.000045) और सूत्रों का उपयोग करके गणना की जा सकती है
=CHI2.DIST.PH(22.757,4-1)या
=CHI2.परीक्षण(अवलोकित; अपेक्षित)

टिप्पणी: CHI2.TEST() फ़ंक्शन विशेष रूप से दो श्रेणीबद्ध चर के बीच संबंध का परीक्षण करने के लिए डिज़ाइन किया गया है (देखें)।

प्रायिकता 0.000045 सामान्य से काफी कम है महत्वपूर्ण स्तर 0.05. इसलिए, खिलाड़ी के पास अपने प्रतिद्वंद्वी पर बेईमानी का संदेह करने का हर कारण है ( शून्य परिकल्पनाउसकी ईमानदारी को नकार दिया गया है)।

उपयोग करते समय मानदंड एक्स 2यह सुनिश्चित करना आवश्यक है कि वॉल्यूम नमूने n काफी बड़ा था, अन्यथा वितरण सन्निकटन मान्य नहीं होता आँकड़े एक्स 2. आमतौर पर यह माना जाता है कि इसके लिए यह पर्याप्त है कि देखी गई आवृत्तियाँ (अवलोकित) 5 से अधिक हों। यदि यह मामला नहीं है, तो छोटी आवृत्तियों को एक में जोड़ दिया जाता है या अन्य आवृत्तियों में जोड़ा जाता है, और संयुक्त मान को कुल सौंपा जाता है संभाव्यता और, तदनुसार, स्वतंत्रता की डिग्री की संख्या कम हो जाती है एक्स 2 वितरण.

आवेदन की गुणवत्ता में सुधार करने के लिए मानदंड एक्स 2(), विभाजन अंतराल को कम करना (एल बढ़ाना और, तदनुसार, संख्या बढ़ाना) आवश्यक है स्वतंत्रता की कोटियां), हालाँकि, इसे प्रत्येक अंतराल (db>5) में शामिल टिप्पणियों की संख्या पर सीमा द्वारा रोका जाता है।

लगातार मामला

पियर्सन अच्छाई-की-फिट परीक्षण एक्स 2 के मामले में भी लागू किया जा सकता है।

आइए एक निश्चित पर विचार करें नमूना, जिसमें 200 मान शामिल हैं। शून्य परिकल्पनाबताता है नमूनासे बना ।

टिप्पणी: यादृच्छिक चर सतत शीट पर उदाहरण फ़ाइलसूत्र का उपयोग करके उत्पन्न किया गया =NORM.ST.INV(RAND()). इसलिए, नए मूल्य नमूनेहर बार शीट की पुनर्गणना होने पर उत्पन्न होते हैं।

मौजूदा डेटा सेट उपयुक्त है या नहीं इसका मूल्यांकन दृष्टिगत रूप से किया जा सकता है।

जैसा कि आरेख से देखा जा सकता है, नमूना मान सीधी रेखा के साथ काफी अच्छी तरह फिट बैठते हैं। हालाँकि, जैसा कि के लिए है परिकल्पना परीक्षणउपयुक्त पियर्सन एक्स 2 अच्छाई-की-फिट परीक्षण।

ऐसा करने के लिए, हम यादृच्छिक चर के परिवर्तन की सीमा को 0.5 के चरण के साथ अंतराल में विभाजित करते हैं। आइए प्रेक्षित और सैद्धांतिक आवृत्तियों की गणना करें। हम FREQUENCY() फ़ंक्शन का उपयोग करके देखी गई आवृत्तियों की गणना करते हैं, और NORM.ST.DIST() फ़ंक्शन का उपयोग करके सैद्धांतिक आवृत्तियों की गणना करते हैं।

टिप्पणी: के लिए समान अलग मामला, यह सुनिश्चित करना आवश्यक है नमूनाकाफी बड़ा था, और अंतराल में >5 मान शामिल थे।

आइए X2 आँकड़ा की गणना करें और किसी दिए गए महत्वपूर्ण मान के साथ इसकी तुलना करें महत्वपूर्ण स्तर(0.05). क्योंकि हमने एक यादृच्छिक चर के परिवर्तन की सीमा को 10 अंतरालों में विभाजित किया है, तो स्वतंत्रता की डिग्री की संख्या 9 है। महत्वपूर्ण मूल्य की गणना सूत्र का उपयोग करके की जा सकती है
=CHI2.OBR.PH(0.05;9) या
=CHI2.OBR(1-0.05;9)

उपरोक्त चित्र से पता चलता है कि आँकड़ा मान 8.19 है, जो काफी अधिक है महत्वपूर्ण मानशून्य परिकल्पनाअस्वीकार नहीं किया गया है.

नीचे वह जगह है नमूनाएक असंभावित महत्व प्राप्त कर लिया और उस पर आधारित हो गया मानदंड पियर्सन सहमति एक्स 2शून्य परिकल्पना को अस्वीकार कर दिया गया (भले ही यादृच्छिक मानसूत्र का उपयोग करके उत्पन्न किए गए थे =NORM.ST.INV(RAND()), प्रदान करना नमूनासे मानक सामान्य वितरण).

शून्य परिकल्पनाअस्वीकार कर दिया गया, हालाँकि देखने में डेटा एक सीधी रेखा के काफी करीब स्थित है।

आइए एक उदाहरण के तौर पर भी लेते हैं नमूना U(-3; 3) से. इस मामले में, ग्राफ़ से भी यह स्पष्ट है कि शून्य परिकल्पनाअस्वीकार कर देना चाहिए.

मापदंड पियर्सन सहमति एक्स 2इसकी पुष्टि भी करता है शून्य परिकल्पनाअस्वीकार कर देना चाहिए.

परीक्षण के लिए आँकड़ों में ची-स्क्वायर वितरण सबसे व्यापक रूप से उपयोग किया जाने वाला वितरण है सांख्यिकीय परिकल्पनाएँ. ची-स्क्वायर वितरण के आधार पर, सबसे शक्तिशाली अच्छाई-की-फिट परीक्षणों में से एक का निर्माण किया गया है - पियर्सन ची-स्क्वायर परीक्षण।

सहमति की कसौटी अज्ञात वितरण के कल्पित कानून के बारे में परिकल्पना का परीक्षण करने की कसौटी है।

χ2 (ची-स्क्वायर) परीक्षण का उपयोग विभिन्न वितरणों की परिकल्पना का परीक्षण करने के लिए किया जाता है। यही उनकी गरिमा है.

कसौटी की गणना सूत्र के बराबर है

जहाँ m और m' क्रमशः अनुभवजन्य और सैद्धांतिक आवृत्तियाँ हैं

विचाराधीन वितरण;

n स्वतंत्रता की कोटि की संख्या है।

जाँच करने के लिए, हमें अनुभवजन्य (अवलोकित) और सैद्धांतिक (सामान्य वितरण की धारणा के तहत गणना की गई) आवृत्तियों की तुलना करने की आवश्यकता है।

यदि अनुभवजन्य आवृत्तियाँ पूरी तरह से गणना या अपेक्षित आवृत्तियों के साथ मेल खाती हैं, तो एस (ई - टी) = 0 और χ2 मानदंड भी होगा शून्य के बराबर. यदि एस (ई - टी) शून्य के बराबर नहीं है, तो यह गणना की गई आवृत्तियों और श्रृंखला की अनुभवजन्य आवृत्तियों के बीच विसंगति का संकेत देगा। ऐसे मामलों में, χ2 मानदंड के महत्व का मूल्यांकन करना आवश्यक है, जो सैद्धांतिक रूप से शून्य से अनंत तक भिन्न हो सकता है। यह χ2ф के वास्तव में प्राप्त मूल्य की उसके महत्वपूर्ण मूल्य (χ2st) के साथ तुलना करके किया जाता है। शून्य परिकल्पना, अर्थात यह धारणा कि अनुभवजन्य और सैद्धांतिक या अपेक्षित आवृत्तियों के बीच विसंगति यादृच्छिक है, का खंडन किया जाता है यदि χ2ф इससे अधिक या उसके बराबर है स्वीकृत महत्व स्तर (ए) और स्वतंत्रता की डिग्री की संख्या (एन) के लिए χ2st।

यादृच्छिक चर χ2 के संभावित मानों का वितरण निरंतर और असममित है। यह स्वतंत्रता की डिग्री (एन) और दृष्टिकोण की संख्या पर निर्भर करता है सामान्य वितरणजैसे-जैसे अवलोकनों की संख्या बढ़ती है। इसलिए, मूल्यांकन के लिए χ2 मानदंड का अनुप्रयोग असतत वितरणकुछ त्रुटियों से जुड़ा है जो इसके मूल्य को प्रभावित करते हैं, खासकर छोटे नमूनों में। और अधिक पाने के लिए सटीक अनुमानमें नमूना वितरित किया गया विविधता श्रृंखला, कम से कम 50 विकल्प होने चाहिए। χ2 मानदंड के सही अनुप्रयोग के लिए यह भी आवश्यक है कि चरम कक्षाओं में वेरिएंट की आवृत्तियाँ 5 से कम नहीं होनी चाहिए; यदि उनमें से 5 से कम हैं, तो उन्हें पड़ोसी वर्गों की आवृत्तियों के साथ जोड़ दिया जाता है ताकि कुल राशि 5 से अधिक या उसके बराबर हो। आवृत्तियों के संयोजन के अनुसार, वर्गों (एन) की संख्या घट जाती है। स्वतंत्रता की डिग्री की संख्या भिन्नता की स्वतंत्रता पर प्रतिबंधों की संख्या को ध्यान में रखते हुए, वर्गों की द्वितीयक संख्या द्वारा स्थापित की जाती है।



चूंकि χ2 मानदंड निर्धारित करने की सटीकता काफी हद तक सैद्धांतिक आवृत्तियों (टी) की गणना की सटीकता पर निर्भर करती है, अनुभवजन्य और गणना की गई आवृत्तियों के बीच अंतर प्राप्त करने के लिए अनियंत्रित सैद्धांतिक आवृत्तियों का उपयोग किया जाना चाहिए।

उदाहरण के तौर पर, आइए मानविकी में सांख्यिकीय विधियों के अनुप्रयोग के लिए समर्पित एक वेबसाइट पर प्रकाशित एक अध्ययन को लें।

ची-स्क्वायर परीक्षण आपको आवृत्ति वितरण की तुलना करने की अनुमति देता है, भले ही वे सामान्य रूप से वितरित हों या नहीं।

आवृत्ति से तात्पर्य किसी घटना के घटित होने की संख्या से है। आम तौर पर, घटनाओं की घटना की आवृत्ति से निपटा जाता है जब चर को नामों के पैमाने पर मापा जाता है और आवृत्ति के अलावा उनकी अन्य विशेषताओं का चयन करना असंभव या समस्याग्रस्त होता है। दूसरे शब्दों में, जब एक वेरिएबल होता है गुणवत्ता विशेषताएँ. इसके अलावा, कई शोधकर्ता परीक्षण स्कोर को स्तरों (उच्च, औसत, निम्न) में परिवर्तित करते हैं और इन स्तरों पर लोगों की संख्या का पता लगाने के लिए स्कोर वितरण की तालिकाएँ बनाते हैं। यह साबित करने के लिए कि किसी एक स्तर में (किसी एक श्रेणी में) लोगों की संख्या वास्तव में अधिक (कम) है, ची-स्क्वायर गुणांक का भी उपयोग किया जाता है।

आइए सबसे सरल उदाहरण देखें.

आत्म-सम्मान की पहचान के लिए युवा किशोरों के बीच एक परीक्षण आयोजित किया गया था। परीक्षण स्कोर को तीन स्तरों में परिवर्तित किया गया: उच्च, मध्यम, निम्न। आवृत्तियों को इस प्रकार वितरित किया गया:

उच्च (बी) 27 लोग।

औसत (सी) 12 लोग।

निम्न (एल) 11 लोग

यह स्पष्ट है कि अधिकांश बच्चों में उच्च आत्म-सम्मान होता है, लेकिन इसे सांख्यिकीय रूप से सिद्ध करने की आवश्यकता है। ऐसा करने के लिए, हम ची-स्क्वायर परीक्षण का उपयोग करते हैं।

हमारा कार्य यह जांचना है कि क्या प्राप्त अनुभवजन्य डेटा सैद्धांतिक रूप से समान रूप से संभावित डेटा से भिन्न है। ऐसा करने के लिए, आपको सैद्धांतिक आवृत्तियों को खोजने की आवश्यकता है। हमारे मामले में, सैद्धांतिक आवृत्तियाँ समान रूप से संभावित आवृत्तियाँ हैं, जो सभी आवृत्तियों को जोड़कर और श्रेणियों की संख्या से विभाजित करके पाई जाती हैं।

हमारे मामले में:

(बी + सी + एच)/3 = (27+12+11)/3 = 16.6

ची-स्क्वायर परीक्षण की गणना के लिए सूत्र:

χ2 = ∑(ई - टी)आई / टी

हम तालिका बनाते हैं:

अंतिम कॉलम का योग ज्ञात करें:

अब आपको महत्वपूर्ण मानों की तालिका (परिशिष्ट में तालिका 1) का उपयोग करके मानदंड का महत्वपूर्ण मान ज्ञात करना होगा। ऐसा करने के लिए हमें स्वतंत्रता की डिग्री (एन) की संख्या की आवश्यकता है।

एन = (आर - 1) * (सी - 1)

जहाँ R तालिका में पंक्तियों की संख्या है, C स्तंभों की संख्या है।

हमारे मामले में, केवल एक कॉलम (अर्थात मूल अनुभवजन्य आवृत्तियाँ) और तीन पंक्तियाँ (श्रेणियाँ) हैं, इसलिए सूत्र बदल जाता है - हम कॉलम को बाहर कर देते हैं।

एन = (आर - 1) = 3-1 = 2

त्रुटि संभावना p≤0.05 और n = 2 के लिए, महत्वपूर्ण मान χ2 = 5.99 है।

प्राप्त अनुभवजन्य मूल्य महत्वपूर्ण मूल्य से अधिक है - आवृत्तियों में अंतर महत्वपूर्ण हैं (χ2= 9.64; p≤0.05)।

जैसा कि आप देख सकते हैं, मानदंड की गणना करना बहुत सरल है और इसमें अधिक समय नहीं लगता है। ची-स्क्वायर परीक्षण का व्यावहारिक मूल्य बहुत बड़ा है। प्रश्नावली के उत्तरों का विश्लेषण करते समय यह विधि सबसे मूल्यवान है।


आइए एक अधिक जटिल उदाहरण देखें।

उदाहरण के लिए, एक मनोवैज्ञानिक जानना चाहता है कि क्या यह सच है कि शिक्षक लड़कियों की तुलना में लड़कों के प्रति अधिक पक्षपाती होते हैं। वे। लड़कियों की प्रशंसा करने की अधिक संभावना है। ऐसा करने के लिए, मनोवैज्ञानिक ने तीन शब्दों की घटना की आवृत्ति के लिए शिक्षकों द्वारा लिखे गए छात्रों की विशेषताओं का विश्लेषण किया: "सक्रिय," "मेहनती," "अनुशासित," और शब्दों के पर्यायवाची शब्द भी गिने गए। शब्दों की घटना की आवृत्ति पर डेटा तालिका में दर्ज किया गया था:

प्राप्त डेटा को संसाधित करने के लिए हम ची-स्क्वायर परीक्षण का उपयोग करते हैं।

ऐसा करने के लिए, हम अनुभवजन्य आवृत्तियों के वितरण की एक तालिका बनाएंगे, अर्थात। वे आवृत्तियाँ जिन्हें हम देखते हैं:

सैद्धांतिक रूप से, हम उम्मीद करते हैं कि आवृत्तियों को समान रूप से वितरित किया जाएगा, अर्थात। आवृत्ति को लड़कों और लड़कियों के बीच आनुपातिक रूप से वितरित किया जाएगा। आइए सैद्धांतिक आवृत्तियों की एक तालिका बनाएं। ऐसा करने के लिए, पंक्ति के योग को कॉलम के योग से गुणा करें और परिणामी संख्या को कुल योग से विभाजित करें।

गणना के लिए अंतिम तालिका इस तरह दिखेगी:

χ2 = ∑(ई - टी)आई / टी

n = (R - 1), जहां R तालिका में पंक्तियों की संख्या है।

हमारे मामले में, ची-स्क्वायर = 4.21; एन = 2.

मानदंड के महत्वपूर्ण मानों की तालिका का उपयोग करते हुए, हम पाते हैं: n = 2 और 0.05 के त्रुटि स्तर के साथ, महत्वपूर्ण मान χ2 = 5.99 है।

परिणामी मूल्य महत्वपूर्ण मूल्य से कम है, जिसका अर्थ है कि शून्य परिकल्पना स्वीकार कर ली गई है।

निष्कर्ष: शिक्षक बच्चे की विशेषताएँ लिखते समय उसके लिंग को महत्व नहीं देते हैं।


निष्कर्ष।

के. पियर्सन ने गणितीय सांख्यिकी के विकास में महत्वपूर्ण योगदान दिया ( एक बड़ी संख्या कीबुनियादी सिद्धांत)। पियर्सन की मुख्य दार्शनिक स्थिति इस प्रकार तैयार की गई है: विज्ञान की अवधारणाएँ कृत्रिम निर्माण हैं, संवेदी अनुभव का वर्णन करने और व्यवस्थित करने के साधन; उन्हें वैज्ञानिक वाक्यों में जोड़ने के नियम विज्ञान के व्याकरण द्वारा अलग किए जाते हैं, जो विज्ञान का दर्शन है। सार्वभौमिक अनुशासन - व्यावहारिक सांख्यिकी - हमें असमान अवधारणाओं और घटनाओं को जोड़ने की अनुमति देता है, हालांकि पियर्सन के अनुसार यह व्यक्तिपरक है।

के. पियर्सन के कई निर्माण मानवशास्त्रीय सामग्रियों का उपयोग करके सीधे संबंधित या विकसित किए गए हैं। उन्होंने विज्ञान के सभी क्षेत्रों में उपयोग किए जाने वाले संख्यात्मक वर्गीकरण और सांख्यिकीय मानदंड के कई तरीके विकसित किए।


साहित्य।

1. बोगोलीबोव ए.एन. गणित। यांत्रिकी। जीवनी संदर्भ पुस्तक. - कीव: नौकोवा दुमका, 1983।

2. कोलमोगोरोव ए.एन., युशकेविच ए.पी. (संस्करण)। 19वीं सदी का गणित. - एम.: विज्ञान. - टी. आई.

3. 3. बोरोवकोव ए.ए. गणित के आँकड़े. एम.: नौका, 1994.

4. 8. फेलर वी. संभाव्यता के सिद्धांत और उसके अनुप्रयोगों का परिचय। - एम.: मीर, टी.2, 1984।

5. 9. हरमन जी., मॉडर्न कारक विश्लेषण. - एम.: सांख्यिकी, 1972।



ऊपर