गेम थ्योरी: इतिहास और अनुप्रयोग। अर्थशास्त्र और मानव गतिविधि के अन्य क्षेत्रों में खेल सिद्धांत

प्रस्तावना

इस लेख का उद्देश्य पाठक को इससे परिचित कराना है बुनियादी अवधारणाओंखेल सिद्धांत। लेख से पाठक सीखेंगे कि गेम थ्योरी क्या है और इस पर विचार करेंगे एक संक्षिप्त इतिहासगेम थ्योरी, गेम थ्योरी के बुनियादी सिद्धांतों से परिचित हों, जिसमें गेम के मुख्य प्रकार और उनके प्रतिनिधित्व के रूप शामिल हैं। लेख शास्त्रीय समस्या और गेम थ्योरी की मूलभूत समस्या पर चर्चा करेगा। लेख का अंतिम भाग प्रबंधन निर्णय लेने के लिए गेम थ्योरी का उपयोग करने की समस्याओं और प्रबंधन में गेम थ्योरी के व्यावहारिक अनुप्रयोग पर विचार करने के लिए समर्पित है।

परिचय।

21 शताब्दी। सूचना युग तेजी से बढ़ रहा है सूचना प्रौद्योगिकी, नवाचार और तकनीकी नवाचार। लेकिन सूचना युग क्यों? समाज में होने वाली लगभग सभी प्रक्रियाओं में सूचना महत्वपूर्ण भूमिका क्यों निभाती है? सब कुछ बहुत सरल है. जानकारी हमें अमूल्य समय देती है, और कुछ मामलों में इससे आगे निकलने का अवसर भी देती है। आखिरकार, यह कोई रहस्य नहीं है कि जीवन में आपको अक्सर उन कार्यों से निपटना पड़ता है जिनमें आपको अनिश्चितता की स्थिति में निर्णय लेने की आवश्यकता होती है, आपके कार्यों की प्रतिक्रियाओं के बारे में जानकारी के अभाव में, यानी ऐसी स्थितियां उत्पन्न होती हैं जिनमें दो (या अधिक) पक्ष होते हैं विभिन्न लक्ष्यों का पीछा करते हैं, और प्रत्येक पक्ष की किसी भी कार्रवाई के परिणाम भागीदार की गतिविधियों पर निर्भर करते हैं। ऐसी स्थितियाँ आये दिन उत्पन्न होती रहती हैं। उदाहरण के लिए, शतरंज, चेकर्स, डोमिनोज़ इत्यादि खेलते समय। इस तथ्य के बावजूद कि खेल प्रकृति में मुख्य रूप से मनोरंजक हैं, उनकी प्रकृति से वे संघर्ष स्थितियों से संबंधित हैं जिनमें संघर्ष पहले से ही खेल के लक्ष्य में अंतर्निहित है - भागीदारों में से एक की जीत। साथ ही, प्रत्येक खिलाड़ी की चाल का परिणाम प्रतिद्वंद्वी की प्रतिक्रिया चाल पर निर्भर करता है। अर्थशास्त्र में, संघर्ष की स्थितियाँ बहुत बार घटित होती हैं और विविध प्रकृति की होती हैं, और उनकी संख्या इतनी बड़ी होती है कि कम से कम एक दिन में बाज़ार में उत्पन्न होने वाली सभी संघर्ष स्थितियों को गिनना असंभव है। अर्थव्यवस्था में संघर्ष की स्थितियों में, उदाहरण के लिए, आपूर्तिकर्ता और उपभोक्ता, खरीदार और विक्रेता, बैंक और ग्राहक के बीच संबंध शामिल हैं। उपरोक्त सभी उदाहरणों में, संघर्ष की स्थिति भागीदारों के हितों में अंतर और उनमें से प्रत्येक की इष्टतम निर्णय लेने की इच्छा से उत्पन्न होती है जो उनके लक्ष्यों को सबसे बड़ी सीमा तक साकार करती है। साथ ही, हर किसी को न केवल अपने लक्ष्यों को, बल्कि अपने साथी के लक्ष्यों को भी ध्यान में रखना होगा, और पहले से अज्ञात निर्णयों को भी ध्यान में रखना होगा जो ये भागीदार लेंगे। संघर्ष स्थितियों में समस्याओं को सक्षम रूप से हल करने के लिए वैज्ञानिक रूप से आधारित तरीकों की आवश्यकता होती है। ऐसी विधियाँ गणितीय सिद्धांत द्वारा विकसित की जाती हैं संघर्ष की स्थितियाँ, जिसे कहा जाता है खेल सिद्धांत।

गेम थ्योरी क्या है?

गेम थ्योरी एक जटिल, बहुआयामी अवधारणा है, इसलिए केवल एक परिभाषा का उपयोग करके गेम थ्योरी की व्याख्या करना असंभव लगता है। आइए गेम थ्योरी को परिभाषित करने के तीन दृष्टिकोण देखें।

1.गेम थ्योरी खेलों में इष्टतम रणनीतियों का अध्ययन करने के लिए एक गणितीय विधि है। खेल एक ऐसी प्रक्रिया है जिसमें दो या दो से अधिक पक्ष भाग लेते हैं, अपने हितों की प्राप्ति के लिए लड़ते हैं। प्रत्येक पक्ष का अपना लक्ष्य होता है और वह कुछ रणनीति का उपयोग करता है जिससे जीत या हार हो सकती है - यह अन्य खिलाड़ियों के व्यवहार पर निर्भर करता है। गेम थ्योरी आपको चुनने में मदद करती है सर्वोत्तम रणनीतियाँअन्य प्रतिभागियों, उनके संसाधनों और उनके संभावित कार्यों के बारे में विचारों को ध्यान में रखते हुए।

2. गेम थ्योरी अनुप्रयुक्त गणित, या अधिक सटीक रूप से, संचालन अनुसंधान की एक शाखा है। सबसे अधिक बार, गेम थ्योरी विधियों का उपयोग अर्थशास्त्र में किया जाता है, और अन्य सामाजिक विज्ञानों में थोड़ा कम - समाजशास्त्र, राजनीति विज्ञान, मनोविज्ञान, नैतिकता और अन्य। 1970 के दशक से, जीवविज्ञानियों द्वारा जानवरों के व्यवहार और विकास के सिद्धांत का अध्ययन करने के लिए इसे अपनाया गया है। आर्टिफिशियल इंटेलिजेंस और साइबरनेटिक्स के लिए गेम थ्योरी बहुत महत्वपूर्ण है।

3.सबसे महत्वपूर्ण चरों में से एक जिस पर किसी संगठन की सफलता निर्भर करती है वह है प्रतिस्पर्धात्मकता। जाहिर है, प्रतिस्पर्धियों के कार्यों की भविष्यवाणी करने की क्षमता का मतलब किसी भी संगठन के लिए लाभ है। गेम थ्योरी प्रतिस्पर्धियों पर किसी निर्णय के प्रभाव को मॉडलिंग करने की एक विधि है।

गेम थ्योरी का इतिहास

गणितीय मॉडलिंग में इष्टतम समाधान या रणनीतियाँ 18वीं शताब्दी में प्रस्तावित की गई थीं। अल्पाधिकार स्थितियों के तहत उत्पादन और मूल्य निर्धारण की समस्याओं पर, जो बाद में खेल सिद्धांत के पाठ्यपुस्तक उदाहरण बन गए, 19वीं शताब्दी में विचार किया गया। ए. कौरनॉट और जे. बर्ट्रेंड। 20वीं सदी की शुरुआत में. ई. लास्कर, ई. ज़र्मेलो, ई. बोरेल ने हितों के टकराव के गणितीय सिद्धांत के विचार को सामने रखा।

गणितीय खेल सिद्धांत की उत्पत्ति नवशास्त्रीय अर्थशास्त्र से हुई है। सिद्धांत के गणितीय पहलुओं और अनुप्रयोगों को पहली बार जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न की क्लासिक 1944 की पुस्तक, गेम थ्योरी और इकोनॉमिक बिहेवियर में रेखांकित किया गया था।

जॉन नैश ने कार्नेगी पॉलिटेक्निक इंस्टीट्यूट से दो डिग्री - एक स्नातक और एक मास्टर डिग्री - के साथ स्नातक होने के बाद प्रिंसटन विश्वविद्यालय में प्रवेश किया, जहां उन्होंने जॉन वॉन न्यूमैन के व्याख्यान में भाग लिया। अपने लेखन में, नैश ने "प्रबंधकीय गतिशीलता" के सिद्धांत विकसित किए। गेम थ्योरी की पहली अवधारणाओं में शून्य-राशि वाले खेलों का विश्लेषण किया गया, जहां हारने वाले और जीतने वाले अपने खर्च पर होते हैं। नैश ने विश्लेषण के ऐसे तरीके विकसित किए हैं जिनमें शामिल सभी लोग या तो जीतते हैं या हारते हैं। इन स्थितियों को "नैश संतुलन" या "असहयोगी संतुलन" कहा जाता है; स्थिति में, पार्टियां इष्टतम रणनीति का उपयोग करती हैं, जिससे एक स्थिर संतुलन का निर्माण होता है। यह संतुलन बनाए रखना खिलाड़ियों के लिए फायदेमंद है, क्योंकि कोई भी बदलाव उनकी स्थिति खराब कर देगा। नैश के इन कार्यों ने खेल सिद्धांत के विकास में गंभीर योगदान दिया और आर्थिक मॉडलिंग के गणितीय उपकरणों को संशोधित किया गया। जॉन नैश दिखाते हैं कि प्रतिस्पर्धा के प्रति ए. स्मिथ का क्लासिक दृष्टिकोण, जहां हर कोई अपने लिए है, उप-इष्टतम है। अधिक इष्टतम रणनीतियाँ तब होती हैं जब हर कोई दूसरों के लिए बेहतर करते हुए अपने लिए बेहतर करने का प्रयास करता है। 1949 में, जॉन नैश ने गेम थ्योरी पर एक शोध प्रबंध लिखा और 45 साल बाद उन्हें अर्थशास्त्र में नोबेल पुरस्कार मिला।

हालाँकि गेम थ्योरी मूल रूप से आर्थिक मॉडल से संबंधित थी, यह 1950 के दशक तक गणित के भीतर एक औपचारिक सिद्धांत बना रहा। लेकिन पहले से ही 1950 के दशक से। गेम थ्योरी विधियों को न केवल अर्थशास्त्र में, बल्कि जीव विज्ञान, साइबरनेटिक्स, प्रौद्योगिकी और मानव विज्ञान में भी लागू करने के प्रयास शुरू हो रहे हैं। द्वितीय विश्व युद्ध के दौरान और उसके तुरंत बाद, सेना को गेम थ्योरी में गंभीरता से रुचि हो गई, जिन्होंने इसे रणनीतिक निर्णयों का अध्ययन करने के लिए एक शक्तिशाली उपकरण के रूप में देखा।

1960 - 1970 में उस समय तक प्राप्त महत्वपूर्ण गणितीय परिणामों के बावजूद, गेम थ्योरी में रुचि कम हो रही है। 1980 के दशक के मध्य से। सक्रिय प्रारंभ होता है प्रायोगिक उपयोगगेम थ्योरी, विशेषकर अर्थशास्त्र और प्रबंधन में। पिछले 20-30 वर्षों में, गेम थ्योरी का महत्व और रुचि काफी बढ़ रही है; आधुनिक आर्थिक सिद्धांत के कुछ क्षेत्रों को गेम थ्योरी के उपयोग के बिना प्रस्तुत नहीं किया जा सकता है।

गेम थ्योरी के अनुप्रयोग में एक बड़ा योगदान थॉमस शेलिंग का काम था, नोबेल पुरस्कार विजेताअर्थशास्त्र में 2005 "संघर्ष की रणनीति।" टी. शेलिंग संघर्ष में भाग लेने वालों के व्यवहार की विभिन्न "रणनीतियों" पर विचार करते हैं। ये रणनीतियाँ संघर्ष प्रबंधन रणनीति और संघर्ष विज्ञान और संगठनात्मक संघर्ष प्रबंधन में संघर्ष विश्लेषण के सिद्धांतों से मेल खाती हैं।

गेम थ्योरी के मूल सिद्धांत

आइए गेम थ्योरी की बुनियादी अवधारणाओं से परिचित हों। संघर्ष की स्थिति का गणितीय मॉडल कहलाता है खेल,संघर्ष में शामिल पक्ष - खिलाड़ियों. किसी खेल का वर्णन करने के लिए, आपको पहले उसके प्रतिभागियों (खिलाड़ियों) की पहचान करनी होगी। यह शर्त तब आसानी से पूरी हो जाती है हम बात कर रहे हैंशतरंज आदि जैसे सामान्य खेलों के बारे में। "बाज़ार के खेल" के साथ स्थिति अलग है। यहां सभी खिलाड़ियों को पहचानना हमेशा आसान नहीं होता, यानी। वर्तमान या संभावित प्रतिस्पर्धी। अभ्यास से पता चलता है कि सभी खिलाड़ियों की पहचान करना आवश्यक नहीं है; सबसे महत्वपूर्ण खिलाड़ियों की खोज करना आवश्यक है। खेल आम तौर पर कई अवधियों तक चलते हैं जिसके दौरान खिलाड़ी अनुक्रमिक या एक साथ कार्रवाई करते हैं। नियमों द्वारा प्रदान की गई क्रियाओं में से किसी एक का चुनाव और कार्यान्वयन कहा जाता है प्रगतिखिलाड़ी. चालें व्यक्तिगत और यादृच्छिक हो सकती हैं। व्यक्तिगत कदम- यह खिलाड़ी द्वारा संभावित क्रियाओं में से एक का सचेत चुनाव है (उदाहरण के लिए, शतरंज के खेल में एक चाल)। यादृच्छिक चालएक बेतरतीब ढंग से चुनी गई क्रिया है (उदाहरण के लिए, फेंटे गए डेक से एक कार्ड चुनना)। कार्रवाइयां कीमतों, बिक्री की मात्रा, अनुसंधान और विकास लागत आदि से संबंधित हो सकती हैं। वह अवधि जिसके दौरान खिलाड़ी अपनी चालें चलते हैं, कहलाती है चरणोंखेल. प्रत्येक चरण में चुनी गई चालें अंततः निर्धारित करती हैं "भुगतान"प्रत्येक खिलाड़ी की (जीत या हार), जिसे भौतिक संपत्ति या धन में व्यक्त किया जा सकता है। इस सिद्धांत में एक अन्य अवधारणा खिलाड़ी रणनीति है। रणनीतिएक खिलाड़ी नियमों का एक समूह है जो वर्तमान स्थिति के आधार पर प्रत्येक व्यक्तिगत कदम पर उसकी कार्रवाई का विकल्प निर्धारित करता है। आमतौर पर खेल के दौरान, प्रत्येक व्यक्तिगत चाल के साथ, खिलाड़ी विशिष्ट स्थिति के आधार पर चुनाव करता है। हालाँकि, सैद्धांतिक रूप से यह संभव है कि सभी निर्णय खिलाड़ी द्वारा पहले से ही लिए जाएं (किसी भी स्थिति के जवाब में)। इसका मतलब है कि खिलाड़ी ने एक विशिष्ट रणनीति चुनी है, जिसे नियमों या कार्यक्रम की सूची के रूप में निर्दिष्ट किया जा सकता है। (इस तरह आप कंप्यूटर का उपयोग करके गेम खेल सकते हैं।) दूसरे शब्दों में, रणनीति उन संभावित क्रियाओं को संदर्भित करती है जो खेल के प्रत्येक चरण में खिलाड़ी को एक निश्चित संख्या में से चुनने की अनुमति देती है वैकल्पिक विकल्पएक ऐसा कदम जो उसे अन्य खिलाड़ियों के कार्यों के लिए "सर्वोत्तम प्रतिक्रिया" प्रतीत होता है। रणनीति की अवधारणा के संबंध में, यह ध्यान दिया जाना चाहिए कि खिलाड़ी न केवल उन चरणों के लिए अपने कार्यों को निर्धारित करता है, जिन तक एक विशेष खेल वास्तव में पहुंचा है, बल्कि उन सभी स्थितियों के लिए भी, जिनमें वे भी शामिल हैं जो किसी दिए गए खेल के दौरान उत्पन्न नहीं हो सकती हैं। खेल कहा जाता है भाप से भरा कमरा, यदि इसमें दो खिलाड़ी शामिल हैं, और एकाधिक, यदि खिलाड़ियों की संख्या दो से अधिक है। प्रत्येक औपचारिक खेल के लिए, नियम पेश किए जाते हैं, अर्थात्। स्थितियों की एक प्रणाली जो निर्धारित करती है: 1) खिलाड़ियों के कार्यों के लिए विकल्प; 2) प्रत्येक खिलाड़ी के पास अपने साझेदारों के व्यवहार के बारे में कितनी जानकारी है; 3) कार्यों के प्रत्येक सेट से होने वाला लाभ। आमतौर पर, जीत (या हार) की मात्रा निर्धारित की जा सकती है; उदाहरण के लिए, आप हार का मूल्य शून्य, जीत का मूल्य एक और ड्रा का आधा मान सकते हैं। एक खेल को शून्य-राशि खेल या विरोधी खेल कहा जाता है, यदि खिलाड़ियों में से एक का लाभ दूसरे के नुकसान के बराबर है, यानी, खेल को पूरा करने के लिए, उनमें से एक के मूल्य को इंगित करना पर्याप्त है। यदि हम नामित करते हैं - खिलाड़ियों में से एक की जीत, बी- दूसरे की जीत, फिर शून्य-राशि वाले गेम के लिए बी = -ए,इसलिए, उदाहरण के लिए, इस पर विचार करना पर्याप्त है एक।खेल कहा जाता है अंतिम,यदि प्रत्येक खिलाड़ी के पास रणनीतियों की एक सीमित संख्या है, और अनंत- अन्यथा। के लिए तय करनाखेल, या खोजें खेल समाधान, आपको प्रत्येक खिलाड़ी के लिए एक ऐसी रणनीति चुननी चाहिए जो शर्त को पूरा करती हो इष्टतमता,वे। खिलाड़ियों में से एक को प्राप्त करना होगा अधिकतम जीतजब दूसरा अपनी रणनीति पर अड़ा रहता है. उसी समय, दूसरे खिलाड़ी के पास होना चाहिए न्यूनतम हानि, यदि पहला व्यक्ति अपनी रणनीति पर कायम रहता है। ऐसा रणनीतियाँकहा जाता है इष्टतम. इष्टतम रणनीतियों को भी शर्त पूरी करनी चाहिए वहनीयता, यानी, इस खेल में अपनी रणनीति को छोड़ना किसी भी खिलाड़ी के लिए नुकसानदेह होगा। यदि खेल को कई बार दोहराया जाता है, तो खिलाड़ियों को प्रत्येक विशिष्ट खेल में जीतने और हारने में नहीं, बल्कि इसमें रुचि हो सकती है औसत जीत (हार)सभी बैचों में. उद्देश्य गेम थ्योरी इष्टतम का निर्धारण करना है प्रत्येक खिलाड़ी के लिए रणनीतियाँ. एक इष्टतम रणनीति चुनते समय, यह मान लेना स्वाभाविक है कि दोनों खिलाड़ी अपने हितों के अनुसार उचित व्यवहार करते हैं।

सहयोगी और असहयोगी

खेल को सहकारी कहा जाता है, या गठबंधन, यदि खिलाड़ी समूहों में एकजुट हो सकते हैं, अन्य खिलाड़ियों के प्रति कुछ दायित्व निभा सकते हैं और अपने कार्यों का समन्वय कर सकते हैं। यह गैर-सहकारी खेलों से भिन्न है जिसमें हर किसी को अपने लिए खेलना होता है। मनोरंजक खेल शायद ही कभी सहयोगी होते हैं, लेकिन रोजमर्रा की जिंदगी में ऐसे तंत्र असामान्य नहीं हैं।

अक्सर यह माना जाता है कि जो चीज़ सहकारी खेलों को अलग बनाती है वह है खिलाड़ियों की एक-दूसरे के साथ संवाद करने की क्षमता। सामान्य तौर पर यह सच नहीं है. ऐसे खेल हैं जिनमें संचार की अनुमति है, लेकिन खिलाड़ी व्यक्तिगत लक्ष्यों का पीछा करते हैं, और इसके विपरीत।

दो प्रकार के खेलों में से, असहयोगी खेल स्थितियों का बहुत विस्तार से वर्णन करते हैं और अधिक सटीक परिणाम देते हैं। सहकारी समितियाँ खेल प्रक्रिया पर समग्र रूप से विचार करती हैं।

हाइब्रिड खेलों में सहकारी और गैर-सहकारी खेलों के तत्व शामिल हैं। उदाहरण के लिए, खिलाड़ी समूह बना सकते हैं, लेकिन खेल असहयोगात्मक शैली में खेला जाएगा। इसका मतलब यह है कि प्रत्येक खिलाड़ी अपने समूह के हितों का पीछा करेगा, साथ ही व्यक्तिगत लाभ हासिल करने की कोशिश करेगा।

सममित और असममित

असममित खेल

खेल सममित होगा जब खिलाड़ियों की संबंधित रणनीतियाँ समान होंगी, यानी उनके पास समान भुगतान होंगे। दूसरे शब्दों में, यदि खिलाड़ी स्थान बदल सकते हैं और समान चालों के लिए उनकी जीत नहीं बदलेगी। अध्ययन किए गए कई दो-खिलाड़ियों वाले खेल सममित हैं। विशेष रूप से, ये हैं: "कैदी की दुविधा", "हिरण शिकार"। दाईं ओर के उदाहरण में, पहली नज़र में खेल समान रणनीतियों के कारण सममित लग सकता है, लेकिन ऐसा नहीं है - आखिरकार, रणनीति प्रोफाइल (ए, ए) और (बी, बी) वाले दूसरे खिलाड़ी का भुगतान होगा पहले से अधिक बड़ा हो.

शून्य-योग और गैर-शून्य-योग

शून्य-राशि खेल एक विशेष प्रकार के स्थिर-राशि वाले खेल हैं, अर्थात, जहां खिलाड़ी उपलब्ध संसाधनों, या गेम फंड को बढ़ा या घटा नहीं सकते हैं। इस मामले में, सभी जीतों का योग किसी भी चाल के सभी नुकसानों के योग के बराबर होता है। दाईं ओर देखें - संख्याएँ खिलाड़ियों को भुगतान दर्शाती हैं - और प्रत्येक सेल में उनका योग शून्य है। ऐसे खेलों के उदाहरणों में पोकर शामिल है, जहां कोई अन्य के सभी दांव जीतता है; रिवर्सी, जहां दुश्मन के टुकड़ों को पकड़ लिया जाता है; या साधारण चोरी.

गणितज्ञों द्वारा अध्ययन किए गए कई खेल, जिनमें पहले से उल्लेखित "कैदी की दुविधा" भी शामिल है, एक अलग प्रकार के हैं: गैर-शून्य योग खेलएक खिलाड़ी की जीत का मतलब दूसरे की हार नहीं है, और इसके विपरीत भी। ऐसे गेम का नतीजा शून्य से कम या ज्यादा भी हो सकता है. ऐसे खेलों को शून्य राशि में परिवर्तित किया जा सकता है - यह परिचय द्वारा किया जाता है काल्पनिक खिलाड़ी, जो अधिशेष को "विनियोजित" करता है या धन की कमी को पूरा करता है।

गैर-शून्य योग वाला एक और खेल है व्यापार, जहां प्रत्येक भागीदार को लाभ होता है। इसमें चेकर्स और शतरंज भी शामिल हैं; अंतिम दो में, खिलाड़ी लाभ प्राप्त करते हुए अपने साधारण टुकड़े को मजबूत टुकड़े में बदल सकता है। इन सभी मामलों में, खेल की राशि बढ़ जाती है। चौड़ा प्रसिद्ध उदाहरण, जहां यह घटता है, है युद्ध.

समानांतर और धारावाहिक

समानांतर खेलों में, खिलाड़ी एक साथ चलते हैं, या कम से कम उन्हें तब तक दूसरों की पसंद के बारे में पता नहीं होता है सभीअपना कदम नहीं उठाएंगे. क्रमानुसार, या गतिशीलखेलों में, प्रतिभागी पूर्व निर्धारित या यादृच्छिक क्रम में चालें चल सकते हैं, लेकिन साथ ही उन्हें दूसरों के पिछले कार्यों के बारे में कुछ जानकारी भी प्राप्त होती है। ये जानकारी भी हो सकती है बिल्कुल पूरा नहींउदाहरण के लिए, एक खिलाड़ी अपनी दस रणनीतियों से यह पता लगा सकता है कि उसका प्रतिद्वंद्वी क्या है निश्चित रूप से नहीं चुनापाँचवाँ, दूसरों के बारे में कुछ भी सीखे बिना।

समानांतर और अनुक्रमिक खेलों की प्रस्तुति में अंतर पर ऊपर चर्चा की गई थी। पूर्व को आमतौर पर सामान्य रूप में प्रस्तुत किया जाता है, और बाद को व्यापक रूप में।

पूरी या अधूरी जानकारी के साथ

अनुक्रमिक खेलों का एक महत्वपूर्ण उपसमूह संपूर्ण जानकारी वाले खेल हैं। ऐसे खेल में, प्रतिभागियों को वर्तमान क्षण तक की गई सभी चालों के साथ-साथ अपने विरोधियों की संभावित रणनीतियों के बारे में पता होता है, जो उन्हें कुछ हद तक खेल के बाद के विकास की भविष्यवाणी करने की अनुमति देता है। समानांतर खेलों में पूरी जानकारी उपलब्ध नहीं होती, क्योंकि विरोधियों की वर्तमान चालें अज्ञात होती हैं। गणित में अध्ययन किए जाने वाले अधिकांश खेलों में अधूरी जानकारी शामिल होती है। उदाहरण के लिए, सभी "नमक" कैदी की दुविधाइसकी अपूर्णता में निहित है.

संपूर्ण जानकारी वाले खेलों के उदाहरण: शतरंज, चेकर्स और अन्य।

संपूर्ण जानकारी की अवधारणा को अक्सर समान जानकारी के साथ भ्रमित किया जाता है - उत्तम जानकारी. उत्तरार्द्ध के लिए, विरोधियों के लिए उपलब्ध सभी रणनीतियों को जानना ही पर्याप्त है; उनकी सभी चालों का ज्ञान आवश्यक नहीं है।

अनंत चरणों वाले खेल

वास्तविक दुनिया में खेल, या अर्थशास्त्र में अध्ययन किए गए खेल, टिके रहते हैं अंतिमचालों की संख्या. गणित इतना सीमित नहीं है, और सेट सिद्धांत विशेष रूप से उन खेलों से संबंधित है जो अनिश्चित काल तक जारी रह सकते हैं। इसके अलावा, सभी चालों के अंत तक विजेता और उसकी जीत का निर्धारण नहीं किया जाता है।

इस मामले में आम तौर पर जो कार्य सामने आता है वह इष्टतम समाधान ढूंढना नहीं है, बल्कि कम से कम जीतने की रणनीति ढूंढना है।

अलग और निरंतर खेल

अधिकांश खेलों का अध्ययन किया गया अलग: उनके पास खिलाड़ियों, चालों, घटनाओं, परिणामों आदि की एक सीमित संख्या होती है। हालाँकि, इन घटकों को कई वास्तविक संख्याओं तक बढ़ाया जा सकता है। जिन खेलों में ऐसे तत्व शामिल होते हैं उन्हें अक्सर विभेदक खेल कहा जाता है। वे किसी प्रकार के भौतिक पैमाने (आमतौर पर समय पैमाने) से जुड़े होते हैं, हालांकि उनमें होने वाली घटनाएं प्रकृति में भिन्न हो सकती हैं। विभेदक खेल इंजीनियरिंग और प्रौद्योगिकी, भौतिकी में अपना अनुप्रयोग पाते हैं।

मेटागेम्स

ये ऐसे गेम हैं जिनके परिणामस्वरूप दूसरे गेम के लिए नियमों का एक सेट तैयार होता है (जिसे कहा जाता है)। लक्ष्यया खेल-वस्तु). मेटागेम्स का लक्ष्य दिए गए नियमों की उपयोगिता को बढ़ाना है।

खेल प्रस्तुति प्रपत्र

गेम थ्योरी में खेलों के वर्गीकरण के साथ-साथ खेल की प्रस्तुति का रूप भी बहुत बड़ी भूमिका निभाता है। आमतौर पर, सामान्य या मैट्रिक्स फॉर्मऔर विस्तारित, एक पेड़ के रूप में निर्दिष्ट। एक साधारण खेल के लिए ये फॉर्म चित्र में दिखाए गए हैं। 1ए और 1बी.

नियंत्रण के दायरे के साथ पहला संबंध स्थापित करने के लिए, खेल का वर्णन इस प्रकार किया जा सकता है। समान उत्पाद बनाने वाले दो उद्यमों को एक विकल्प का सामना करना पड़ता है। एक मामले में, वे उच्च कीमत निर्धारित करके बाजार में पैर जमा सकते हैं, जो उन्हें औसत कार्टेल लाभ पीके प्रदान करेगा। भयंकर प्रतिस्पर्धा में प्रवेश करने पर, दोनों को लाभ PW प्राप्त होता है। यदि प्रतिस्पर्धियों में से एक ऊंची कीमत निर्धारित करता है, और दूसरा कम कीमत निर्धारित करता है, तो बाद वाले को एकाधिकार लाभ (पीएम) का एहसास होता है, जबकि दूसरे को नुकसान (पीजी) होता है। उदाहरण के लिए, ऐसी ही स्थिति उत्पन्न हो सकती है, जब दोनों कंपनियों को अपनी कीमत की घोषणा करनी होगी, जिसे बाद में संशोधित नहीं किया जा सकता है।

सख्त शर्तों के अभाव में कम कीमत निर्धारित करना दोनों उद्यमों के लिए फायदेमंद है। "कम कीमत" की रणनीति किसी भी फर्म के लिए प्रमुख है: कोई फर्क नहीं पड़ता कि प्रतिस्पर्धी फर्म कौन सी कीमत चुनती है, कम कीमत निर्धारित करना हमेशा बेहतर होता है। लेकिन इस मामले में, कंपनियों को एक दुविधा का सामना करना पड़ता है, क्योंकि लाभ पीके (जो दोनों खिलाड़ियों के लिए लाभ पीडब्ल्यू से अधिक है) हासिल नहीं किया गया है।

संबंधित भुगतानों के साथ "कम कीमत/कम कीमत" का रणनीतिक संयोजन नैश संतुलन का प्रतिनिधित्व करता है, जिसमें किसी भी खिलाड़ी के लिए चुनी गई रणनीति से अलग हटना नुकसानदेह होता है। संतुलन की यह अवधारणा रणनीतिक स्थितियों को हल करने में मौलिक है, लेकिन कुछ परिस्थितियों में इसमें अभी भी सुधार की आवश्यकता है।

जहां तक ​​उपरोक्त दुविधा का सवाल है, इसका समाधान, विशेष रूप से, खिलाड़ियों की चाल की मौलिकता पर निर्भर करता है। यदि उद्यम के पास अपने रणनीतिक चर (इस मामले में कीमत) पर पुनर्विचार करने का अवसर है, तो खिलाड़ियों के बीच कठोर समझौते के बिना भी समस्या का एक सहकारी समाधान पाया जा सकता है। अंतर्ज्ञान से पता चलता है कि खिलाड़ियों के बीच बार-बार संपर्क से स्वीकार्य "मुआवजा" प्राप्त करने के अवसर पैदा होते हैं। इस प्रकार, कुछ परिस्थितियों में, यदि भविष्य में "मूल्य युद्ध" उत्पन्न हो सकता है, तो मूल्य डंपिंग के माध्यम से अल्पकालिक उच्च लाभ के लिए प्रयास करना अनुचित है।

जैसा कि उल्लेख किया गया है, दोनों चित्र एक ही खेल का वर्णन करते हैं। सामान्य स्थिति में खेल को सामान्य रूप में प्रस्तुत करना "समकालिकता" को दर्शाता है। हालाँकि, इसका मतलब घटनाओं की "एक साथता" नहीं है, बल्कि यह इंगित करता है कि खिलाड़ी की रणनीति का चुनाव प्रतिद्वंद्वी की पसंद की रणनीति की अनदेखी में किया जाता है। विस्तृत रूप में यह स्थिति एक अंडाकार स्थान (सूचना क्षेत्र) के माध्यम से व्यक्त होती है। इस स्थान की अनुपस्थिति में, खेल की स्थिति एक अलग चरित्र लेती है: पहले, एक खिलाड़ी को निर्णय लेना होगा, और दूसरा उसके बाद यह कर सकता है।

गेम थ्योरी में क्लासिक समस्या

आइए गेम थ्योरी में एक क्लासिक समस्या पर विचार करें। हिरण का शिकारगेम थ्योरी से एक सहकारी सममित गेम है जो व्यक्तिगत हितों और सार्वजनिक हितों के बीच संघर्ष का वर्णन करता है। खेल का वर्णन सबसे पहले 1755 में जीन-जैक्स रूसो द्वारा किया गया था:

"यदि वे एक हिरण का शिकार कर रहे थे, तो हर कोई समझता था कि इसके लिए वह अपने पद पर बने रहने के लिए बाध्य था; लेकिन अगर कोई खरगोश शिकारियों में से किसी एक के पास भागता था, तो इसमें कोई संदेह नहीं था कि यह शिकारी, बिना किसी विवेक के, उसका पीछा करना शुरू कर दिया और शिकार को पकड़ लिया, बहुत कम लोगों को इस बात का दुख होगा कि इस तरह उसने अपने साथियों को शिकार से वंचित कर दिया।

हिरण का शिकार मनुष्य को अपने स्वार्थ के लिए प्रलोभित करते हुए सार्वजनिक हित प्रदान करने की चुनौती का एक उत्कृष्ट उदाहरण है। क्या शिकारी को अपने साथियों के साथ रहना चाहिए और पूरी जनजाति को बड़ा शिकार देने के लिए कम अनुकूल अवसर पर दांव लगाना चाहिए, या क्या उसे अपने साथियों को छोड़ देना चाहिए और खुद को एक अधिक विश्वसनीय अवसर पर सौंप देना चाहिए जो उसके अपने परिवार को एक खरगोश देने का वादा करता है?

गेम थ्योरी में मौलिक समस्या

गेम थ्योरी में कैदी की दुविधा नामक एक मूलभूत समस्या पर विचार करें।

कैदी की दुविधागेम थ्योरी में एक मूलभूत समस्या, खिलाड़ी हमेशा एक-दूसरे के साथ सहयोग नहीं करेंगे, भले ही ऐसा करना उनके सर्वोत्तम हित में हो। यह माना जाता है कि खिलाड़ी ("कैदी") दूसरों के लाभ की परवाह किए बिना अपने स्वयं के भुगतान को अधिकतम करेगा। समस्या का सार 1950 में मेरिल फ्लड और मेल्विन ड्रेशर द्वारा तैयार किया गया था। इस दुविधा का नाम गणितज्ञ अल्बर्ट टकर ने दिया था।

कैदी की दुविधा में, विश्वासघात सख्ती से हावी हैसहयोग पर, इसलिए एकमात्र संभावित संतुलन दोनों प्रतिभागियों का विश्वासघात है। सीधे शब्दों में कहें तो, चाहे दूसरा खिलाड़ी कुछ भी करे, विश्वासघात करने पर हर कोई अधिक जीतेगा। चूँकि किसी भी स्थिति में सहयोग करने की तुलना में विश्वासघात करना अधिक लाभदायक है, सभी तर्कसंगत खिलाड़ी विश्वासघात को चुनेंगे।

व्यक्तिगत रूप से तर्कसंगत व्यवहार करते हुए, एक साथ प्रतिभागी एक तर्कहीन निर्णय पर आते हैं: यदि दोनों विश्वासघात करते हैं, तो उन्हें सहयोग करने की तुलना में कुल मिलाकर एक छोटा भुगतान प्राप्त होगा (इस खेल में एकमात्र संतुलन नहीं होता है) पेरेटो-इष्टतमनिर्णय, अर्थात् एक ऐसा निर्णय जिसे अन्य तत्वों की स्थिति खराब किए बिना सुधारा नहीं जा सकता।) यहीं दुविधा है.

बार-बार होने वाली कैदी की दुविधा में, खेल समय-समय पर होता है, और प्रत्येक खिलाड़ी पहले सहयोग न करने के लिए दूसरे को "दंडित" कर सकता है। ऐसे खेल में, सहयोग एक संतुलन बन सकता है, और विश्वासघात करने का प्रोत्साहन सज़ा की धमकी से अधिक हो सकता है।

क्लासिक कैदी की दुविधा

सभी न्यायिक प्रणालियों में, दस्यु (एक संगठित समूह के हिस्से के रूप में अपराध करना) के लिए सज़ा अकेले किए गए समान अपराधों की तुलना में बहुत भारी है (इसलिए वैकल्पिक नाम - "दस्यु की दुविधा")।

कैदी की दुविधा का क्लासिक सूत्रीकरण है:

दो अपराधियों, ए और बी, को समान अपराधों के लिए लगभग एक ही समय में पकड़ा गया था। यह मानने का कारण है कि उन्होंने साजिश के तहत काम किया, और पुलिस, उन्हें एक-दूसरे से अलग करते हुए, उन्हें एक ही सौदे की पेशकश करती है: यदि कोई दूसरे के खिलाफ गवाही देता है, और वह चुप रहता है, तो पहले को जांच में मदद करने के लिए रिहा कर दिया जाता है, और दूसरे को अधिकतम सज़ा कारावास (10 वर्ष) (20 वर्ष) मिलती है। यदि दोनों चुप रहते हैं, तो उनके कृत्य पर हल्के लेख के तहत आरोप लगाया जाता है, और उन्हें 6 महीने (1 वर्ष) की सजा सुनाई जाती है। अगर दोनों एक-दूसरे के खिलाफ गवाही देते हैं तो उन्हें कम से कम 2 साल (5 साल) की सजा मिलती है। प्रत्येक कैदी चुनता है कि चुप रहना है या दूसरे के खिलाफ गवाही देनी है। हालाँकि, उनमें से कोई भी नहीं जानता कि दूसरा क्या करेगा। क्या हो जाएगा?

खेल को निम्नलिखित तालिका के रूप में दर्शाया जा सकता है:

दुविधा तब उत्पन्न होती है जब हम मान लें कि दोनों केवल अपनी जेल की सजा को कम करने के बारे में चिंतित हैं।

आइए एक कैदी के तर्क की कल्पना करें। यदि आपका साथी चुप है, तो उसे धोखा देना और मुक्त हो जाना बेहतर है (अन्यथा - छह महीने जेल में)। यदि साथी गवाही देता है, तो 2 वर्ष (अन्यथा - 10 वर्ष) पाने के लिए उसके विरुद्ध भी गवाही देना बेहतर है। "गवाही देना" रणनीति "चुप रहो" रणनीति पर सख्ती से हावी है। इसी तरह एक और कैदी भी इसी नतीजे पर पहुंचता है.

समूह (इन दो कैदियों) के दृष्टिकोण से, एक-दूसरे के साथ सहयोग करना, चुप रहना और छह-छह महीने का समय लेना सबसे अच्छा है, क्योंकि इससे जेल की कुल अवधि कम हो जाएगी। कोई अन्य समाधान कम लाभदायक होगा.

सामान्यीकृत रूप

  1. खेल में दो खिलाड़ी और एक बैंकर शामिल हैं। प्रत्येक खिलाड़ी के पास 2 कार्ड होते हैं: एक कहता है "सहयोग करें", दूसरा कहता है "दोष" (यह खेल की मानक शब्दावली है)। प्रत्येक खिलाड़ी बैंकर के सामने एक कार्ड उल्टा रखता है (अर्थात, कोई भी किसी और के निर्णय को नहीं जानता है, हालांकि किसी और के निर्णय को जानने से प्रभुत्व विश्लेषण प्रभावित नहीं होता है)। बैंकर कार्ड खोलता है और जीत की राशि बताता है।
  2. यदि दोनों सहयोग करना चुनते हैं, तो दोनों को प्राप्त होता है सी. यदि एक ने "विश्वासघात करना" चुना, तो दूसरे ने "सहयोग करना" चुना - पहले को प्राप्त होता है डी, दूसरा साथ. यदि दोनों ने "विश्वासघात" चुना, तो दोनों को प्राप्त होता है डी.
  3. वेरिएबल C, D, c, d के मान किसी भी चिन्ह के हो सकते हैं (उपरोक्त उदाहरण में, सभी 0 से कम या उसके बराबर हैं)। खेल को कैदी की दुविधा (पीडी) बनाने के लिए असमानता डी > सी > डी > सी को संतुष्ट किया जाना चाहिए।
  4. यदि खेल दोहराया जाता है, यानी लगातार 1 से अधिक बार खेला जाता है, तो सहयोग से कुल भुगतान उस स्थिति में कुल भुगतान से अधिक होना चाहिए जहां एक विश्वासघात करता है और दूसरा नहीं करता है, यानी 2सी > डी + सी .

ये नियम डगलस हॉफ़स्टैटर द्वारा स्थापित किए गए थे और विशिष्ट कैदी की दुविधा का विहित विवरण बनाते हैं।

समान लेकिन भिन्न खेल

हॉफस्टैटर ने सुझाव दिया कि लोग कैदी की दुविधा जैसी समस्याओं को अधिक आसानी से समझते हैं यदि उन्हें एक अलग गेम या ट्रेडिंग प्रक्रिया के रूप में प्रस्तुत किया जाए। एक उदाहरण है " बंद बैग का आदान-प्रदान»:

दो लोग मिलते हैं और बंद बैगों का आदान-प्रदान करते हैं, यह महसूस करते हुए कि उनमें से एक में पैसा है, दूसरे में सामान है। प्रत्येक खिलाड़ी सौदे का सम्मान कर सकता है और जो सहमति हुई थी उसे बैग में रख सकता है, या खाली बैग देकर साथी को धोखा दे सकता है।

इस खेल में हमेशा धोखा होगा सबसे अच्छा समाधान, इसका अर्थ यह भी है कि तर्कसंगत खिलाड़ी इसे कभी नहीं खेलेंगे, और बंद बैग के व्यापार के लिए कोई बाजार नहीं होगा।

रणनीतिक प्रबंधन निर्णय लेने के लिए गेम थ्योरी का अनुप्रयोग

उदाहरणों में एक सैद्धांतिक मूल्य निर्धारण नीति के कार्यान्वयन, नए बाजारों में प्रवेश, सहयोग और संयुक्त उद्यमों के निर्माण, नवाचार के क्षेत्र में नेताओं और कलाकारों की पहचान, ऊर्ध्वाधर एकीकरण आदि से संबंधित निर्णय शामिल हैं। गेम थ्योरी के सिद्धांतों का सैद्धांतिक रूप से सभी प्रकार के निर्णयों के लिए उपयोग किया जा सकता है यदि वे अन्य अभिनेताओं से प्रभावित हों। इन व्यक्तियों या खिलाड़ियों का बाज़ार में प्रतिस्पर्धी होना ज़रूरी नहीं है; उनकी भूमिका उप-आपूर्तिकर्ताओं, अग्रणी ग्राहकों, संगठनों के कर्मचारियों के साथ-साथ कार्य सहयोगियों की भी हो सकती है।

 प्रक्रिया में प्रतिभागियों के बीच महत्वपूर्ण निर्भरता होने पर गेम थ्योरी टूल का उपयोग करना विशेष रूप से उचित है भुगतान के क्षेत्र में. संभावित प्रतिस्पर्धियों के साथ स्थिति चित्र में दिखाई गई है। 2.

 चतुर्भुज 1 और 2 ऐसी स्थिति का वर्णन करें जहां प्रतिस्पर्धियों की प्रतिक्रिया का कंपनी के भुगतान पर महत्वपूर्ण प्रभाव न पड़े। ऐसा उन मामलों में होता है जहां प्रतिस्पर्धी के पास कोई प्रेरणा नहीं होती (फ़ील्ड)। 1 ) या क्षमताएं (फ़ील्ड 2 ) जवाबी हमला। इसलिए, प्रतिस्पर्धियों के प्रेरित कार्यों की रणनीति के विस्तृत विश्लेषण की कोई आवश्यकता नहीं है।

एक समान निष्कर्ष निकलता है, हालांकि एक अलग कारण से, और चतुर्थांश द्वारा प्रतिबिंबित स्थिति के लिए 3 . यहां, प्रतिस्पर्धियों की प्रतिक्रिया का कंपनी पर महत्वपूर्ण प्रभाव पड़ सकता है, लेकिन चूंकि उसके अपने कार्य किसी प्रतिस्पर्धी के भुगतान को बहुत अधिक प्रभावित नहीं कर सकते हैं, तो किसी को उसकी प्रतिक्रिया से डरना नहीं चाहिए। एक उदाहरण बाज़ार में प्रवेश करने का निर्णय है: कुछ परिस्थितियों में, बड़े प्रतिस्पर्धियों के पास छोटी कंपनी के ऐसे निर्णय पर प्रतिक्रिया करने का कोई कारण नहीं होता है।

केवल स्थिति चतुर्थांश में दिखाई गई है 4 (बाजार साझेदारों द्वारा प्रतिशोधात्मक कदमों की संभावना) के लिए गेम थ्योरी प्रावधानों के उपयोग की आवश्यकता होती है। हालाँकि, केवल आवश्यक, लेकिन अपर्याप्त स्थितियाँ, प्रतिस्पर्धियों से मुकाबला करने के लिए गेम थ्योरी ढांचे के अनुप्रयोग को उचित ठहराने के लिए। ऐसी स्थितियाँ होती हैं जब एक रणनीति निस्संदेह अन्य सभी पर हावी हो जाएगी, चाहे प्रतिस्पर्धी कोई भी कदम उठाए। उदाहरण के लिए, यदि हम बाज़ार को लें दवाइयाँ, तो किसी कंपनी के लिए बाज़ार में किसी नए उत्पाद की घोषणा करने वाली पहली कंपनी बनना अक्सर महत्वपूर्ण होता है: "अग्रणी" का लाभ इतना महत्वपूर्ण हो जाता है कि अन्य सभी "खिलाड़ी" केवल नवाचार गतिविधियों को तेज़ी से बढ़ा सकते हैं।

 गेम थ्योरी के दृष्टिकोण से "प्रमुख रणनीति" का एक तुच्छ उदाहरण निम्नलिखित से संबंधित निर्णय है एक नये बाज़ार में प्रवेश.आइए एक ऐसे उद्यम को लें जो किसी भी बाजार में एकाधिकार के रूप में कार्य करता है (उदाहरण के लिए, बाजार में आईबीएम)। व्यक्तिगत कम्प्यूटर्स 80 के दशक की शुरुआत में)। एक अन्य उद्यम, उदाहरण के लिए, कंप्यूटर परिधीय उपकरणों के बाजार में काम कर रहा है, अपने उत्पादन को पुन: कॉन्फ़िगर करके व्यक्तिगत कंप्यूटर बाजार में प्रवेश करने के मुद्दे पर विचार कर रहा है। कोई बाहरी कंपनी बाज़ार में प्रवेश करने या न करने का निर्णय ले सकती है। एक एकाधिकारवादी कंपनी किसी नए प्रतिस्पर्धी के उभरने पर आक्रामक या मैत्रीपूर्ण प्रतिक्रिया कर सकती है। दोनों कंपनियां दो चरणों वाले खेल में प्रवेश करती हैं जिसमें बाहरी कंपनी पहला कदम उठाती है। भुगतान दर्शाने वाली खेल स्थिति चित्र 3 में एक पेड़ के रूप में दिखाई गई है।

 उसी खेल स्थिति को सामान्य रूप में प्रस्तुत किया जा सकता है (चित्र 4)।

यहां दो अवस्थाएं दर्शाई गई हैं - "प्रवेश/अनुकूल प्रतिक्रिया" और "गैर-प्रवेश/आक्रामक प्रतिक्रिया"। जाहिर है, दूसरा संतुलन अस्थिर है। विस्तारित रूप से यह पता चलता है कि एक कंपनी के लिए जो पहले से ही बाजार में पैर जमा चुकी है, एक नए प्रतियोगी के उद्भव पर आक्रामक प्रतिक्रिया करना अनुचित है: आक्रामक व्यवहार के साथ, वर्तमान एकाधिकारवादी को 1 (भुगतान) मिलता है, और मित्रता के साथ व्यवहार - 3. बाहरी कंपनी यह भी जानती है कि एकाधिकारवादी के लिए उसे विस्थापित करने के लिए कार्रवाई शुरू करना तर्कसंगत नहीं है, और इसलिए वह बाजार में प्रवेश करने का निर्णय लेती है। बाहरी कंपनी (-1) के खतरे वाले नुकसान को सहन नहीं करेगी।

ऐसा तर्कसंगत संतुलन "आंशिक रूप से बेहतर" खेल की विशेषता है, जो जानबूझकर बेतुकी चालों को बाहर करता है। व्यवहार में, सिद्धांत रूप में, ऐसी संतुलन अवस्थाओं को खोजना काफी आसान है। किसी भी परिमित खेल के संचालन अनुसंधान के क्षेत्र से एक विशेष एल्गोरिदम का उपयोग करके संतुलन विन्यास की पहचान की जा सकती है। निर्णय लेने वाला इस प्रकार आगे बढ़ता है: सबसे पहले, खेल के अंतिम चरण में "सर्वश्रेष्ठ" चाल का चुनाव किया जाता है, फिर अंतिम चरण में पसंद को ध्यान में रखते हुए, पिछले चरण में "सर्वश्रेष्ठ" चाल का चयन किया जाता है। और इसी तरह, जब तक गेम पेड़ के शुरुआती नोड तक नहीं पहुंच जाता।

गेम थ्योरी-आधारित विश्लेषण से कंपनियां कैसे लाभान्वित हो सकती हैं? उदाहरण के लिए, आईबीएम और टेलेक्स के बीच हितों के टकराव का एक प्रसिद्ध मामला है। बाज़ार में प्रवेश के लिए उत्तरार्द्ध की प्रारंभिक योजनाओं की घोषणा के संबंध में, आईबीएम प्रबंधन की एक "संकट" बैठक आयोजित की गई, जिसमें नए प्रतियोगी को नए बाज़ार में प्रवेश करने के अपने इरादे को छोड़ने के लिए मजबूर करने के उपायों का विश्लेषण किया गया। टेलेक्स को स्पष्ट रूप से इन घटनाओं के बारे में पता चल गया। गेम थ्योरी पर आधारित एक विश्लेषण से पता चला कि उच्च लागत के कारण आईबीएम को होने वाले खतरे निराधार हैं। इससे पता चलता है कि कंपनियों के लिए अपने गेमिंग साझेदारों की संभावित प्रतिक्रियाओं पर विचार करना उपयोगी है। अलग-अलग आर्थिक गणनाएँ, यहाँ तक कि निर्णय लेने के सिद्धांत पर आधारित, अक्सर, वर्णित स्थिति के अनुसार, प्रकृति में सीमित होती हैं। इस प्रकार, एक बाहरी कंपनी "गैर-प्रवेश" कदम चुन सकती है यदि प्रारंभिक विश्लेषण से उसे विश्वास हो जाए कि बाजार में प्रवेश के कारण एकाधिकारवादी की ओर से आक्रामक प्रतिक्रिया होगी। इस मामले में, अपेक्षित मूल्य मानदंड के अनुसार, 0.5 की आक्रामक प्रतिक्रिया की संभावना के साथ "गैर-हस्तक्षेप" कदम चुनना उचित है।

अगला उदाहरणक्षेत्र में कंपनियों के बीच प्रतिद्वंद्विता से जुड़ा हुआ है तकनीकी नेतृत्व.प्रारंभिक स्थिति तब होती है जब उद्यम 1 पहले तकनीकी श्रेष्ठता थी, लेकिन वर्तमान में वित्तीय संसाधन कम हैं वैज्ञानिक अनुसंधानऔर अपने प्रतिस्पर्धियों की तुलना में विकास (आर एंड डी)। दोनों कंपनियों को यह तय करना होगा कि बड़े पूंजी निवेश के माध्यम से अपने संबंधित प्रौद्योगिकी क्षेत्र में वैश्विक बाजार प्रभुत्व हासिल करने का प्रयास किया जाए या नहीं। यदि दोनों प्रतिस्पर्धी व्यवसाय में बड़ी मात्रा में धन निवेश करते हैं, तो उद्यम की सफलता की संभावनाएँ बढ़ जाती हैं 1 बेहतर होगा, हालाँकि इसमें बड़े वित्तीय खर्च (उद्यम की तरह) होंगे 2 ). चित्र में. 5 इस स्थिति को नकारात्मक मूल्यों वाले भुगतानों द्वारा दर्शाया गया है।

उद्यम के लिए 1 यह सर्वोत्तम होगा यदि उद्यम 2 प्रतिस्पर्धा करने से इनकार कर दिया. इस मामले में उसका लाभ 3 (भुगतान) होगा। साथ उच्च संभावनाकंपनी 2 जब उद्यम प्रतियोगिता जीतेगा 1 कम निवेश कार्यक्रम और उद्यम को स्वीकार करेगा 2 - व्यापक. यह स्थिति मैट्रिक्स के ऊपरी दाएँ चतुर्थांश में परिलक्षित होती है।

स्थिति के विश्लेषण से पता चलता है कि संतुलन उद्यम की उच्च अनुसंधान एवं विकास लागत पर होता है 2 और कम उद्यम 1 . किसी भी अन्य परिदृश्य में, प्रतिस्पर्धियों में से एक के पास रणनीतिक संयोजन से विचलित होने का एक कारण होता है: उदाहरण के लिए, एक उद्यम के लिए 1 यदि उद्यम हो तो कम बजट बेहतर है 2 प्रतियोगिता में भाग लेने से इंकार कर देंगे; एक ही समय में उद्यम के लिए 2 यह ज्ञात है कि जब किसी प्रतियोगी की लागत कम होती है, तो उसके लिए अनुसंधान और विकास में निवेश करना लाभदायक होता है।

तकनीकी लाभ वाला एक उद्यम अंततः अपने लिए इष्टतम परिणाम प्राप्त करने के लिए गेम थ्योरी के आधार पर स्थिति का विश्लेषण कर सकता है। एक निश्चित संकेत की मदद से, उसे यह दिखाना होगा कि वह अनुसंधान और विकास पर बड़ा खर्च करने के लिए तैयार है। यदि ऐसा कोई संकेत प्राप्त नहीं होता है, तो उद्यम के लिए 2 यह स्पष्ट है कि उद्यम 1 कम लागत वाला विकल्प चुनता है।

सिग्नल की विश्वसनीयता उद्यम के दायित्वों से प्रमाणित होनी चाहिए। इस मामले में, यह उद्यम का निर्णय हो सकता है 1 नई प्रयोगशालाओं की खरीद या अतिरिक्त अनुसंधान कर्मियों की नियुक्ति पर।

खेल सिद्धांत के दृष्टिकोण से, ऐसे दायित्व खेल के पाठ्यक्रम को बदलने के बराबर हैं: एक साथ निर्णय लेने की स्थिति को क्रमिक चालों की स्थिति से बदल दिया जाता है। कंपनी 1 बड़े व्यय, उद्यम करने के इरादे को दृढ़ता से प्रदर्शित करता है 2 यह कदम दर्ज करता है और उसके पास अब प्रतिद्वंद्विता में भाग लेने का कोई कारण नहीं है। नया संतुलन "उद्यम की गैर-भागीदारी" परिदृश्य से उत्पन्न होता है 2 " और "उद्यम के अनुसंधान और विकास की उच्च लागत 1 ".

 गेम थ्योरी विधियों के अनुप्रयोग के प्रसिद्ध क्षेत्र भी शामिल हैं मूल्य निर्धारण रणनीति, संयुक्त उद्यमों का निर्माण, नए उत्पाद विकास का समय।

गेम थ्योरी के उपयोग में महत्वपूर्ण योगदान आते हैं प्रयोगिक काम. कई सैद्धांतिक गणनाओं पर काम किया जा रहा है प्रयोगशाला की स्थितियाँ, और प्राप्त परिणाम अभ्यासकर्ताओं के लिए एक प्रेरणा के रूप में काम करते हैं। सैद्धांतिक रूप से, यह स्पष्ट किया गया कि किन परिस्थितियों में दो स्वार्थी विचारधारा वाले भागीदारों के लिए सहयोग करना और अपने लिए बेहतर परिणाम प्राप्त करना उचित है।

इस ज्ञान का उपयोग उद्यम अभ्यास में दो कंपनियों को जीत-जीत की स्थिति हासिल करने में मदद करने के लिए किया जा सकता है। आज, गेमिंग-प्रशिक्षित सलाहकार तेजी से और स्पष्ट रूप से उन अवसरों की पहचान करते हैं जिनका लाभ व्यवसाय ग्राहकों, उप-आपूर्तिकर्ताओं, विकास भागीदारों और इसी तरह के स्थिर, दीर्घकालिक अनुबंधों को सुरक्षित करने के लिए उठा सकते हैं।

प्रबंधन में व्यावहारिक अनुप्रयोग की समस्याएं

बेशक, यह बताया जाना चाहिए कि गेम थ्योरी के विश्लेषणात्मक उपकरणों के अनुप्रयोग की कुछ सीमाएँ हैं। निम्नलिखित मामलों में, इसका उपयोग केवल तभी किया जा सकता है जब अतिरिक्त जानकारी प्राप्त हो।

पहले तो,यह वह स्थिति है जब व्यवसायों के पास उस खेल के बारे में अलग-अलग विचार होते हैं जिसे वे खेल रहे हैं, या जब उन्हें एक-दूसरे की क्षमताओं के बारे में पर्याप्त जानकारी नहीं होती है। उदाहरण के लिए, किसी प्रतिस्पर्धी के भुगतान (लागत संरचना) के बारे में अस्पष्ट जानकारी हो सकती है। यदि जानकारी जो बहुत जटिल नहीं है, उसमें अपूर्णता है, तो कुछ अंतरों को ध्यान में रखते हुए, समान मामलों की तुलना करके काम चलाया जा सकता है।

दूसरी बात,गेम थ्योरी को कई संतुलन स्थितियों पर लागू करना कठिन है। यह समस्या एक साथ रणनीतिक निर्णयों वाले सरल खेलों के दौरान भी उत्पन्न हो सकती है।

तीसरा,यदि रणनीतिक निर्णय लेने की स्थिति बहुत जटिल है, तो खिलाड़ी अक्सर अपने लिए सर्वोत्तम विकल्प नहीं चुन सकते हैं। ऊपर चर्चा की गई स्थिति की तुलना में अधिक जटिल बाज़ार प्रवेश स्थिति की कल्पना करना आसान है। उदाहरण के लिए, कई उद्यम अलग-अलग समय पर बाज़ार में प्रवेश कर सकते हैं, या पहले से ही वहां काम कर रहे उद्यमों की प्रतिक्रिया आक्रामक या मैत्रीपूर्ण होने की तुलना में अधिक जटिल हो सकती है।

यह प्रयोगात्मक रूप से सिद्ध हो चुका है कि जब खेल दस या अधिक चरणों तक विस्तारित हो जाता है, तो खिलाड़ी उपयुक्त एल्गोरिदम का उपयोग करने और संतुलन रणनीतियों के साथ खेल जारी रखने में सक्षम नहीं होते हैं।

गेम थ्योरी का प्रयोग बहुत बार नहीं किया जाता है। दुर्भाग्य से, वास्तविक दुनिया की स्थितियाँ अक्सर बहुत जटिल होती हैं और इतनी तेज़ी से बदलती हैं कि सटीक भविष्यवाणी करना असंभव है कि प्रतिस्पर्धी किसी फर्म की बदलती रणनीति पर कैसे प्रतिक्रिया देंगे। हालाँकि, जब प्रतिस्पर्धी निर्णय लेने की स्थिति में विचार करने के लिए सबसे महत्वपूर्ण कारकों की पहचान करने की बात आती है तो गेम थ्योरी उपयोगी होती है। यह जानकारी महत्वपूर्ण है क्योंकि यह प्रबंधन को अतिरिक्त चर या कारकों पर विचार करने की अनुमति देती है जो स्थिति को प्रभावित कर सकते हैं, जिससे निर्णय की प्रभावशीलता बढ़ जाती है।

निष्कर्ष में, इस बात पर विशेष रूप से जोर दिया जाना चाहिए कि गेम थ्योरी ज्ञान का एक बहुत ही जटिल क्षेत्र है। इसे संभालते समय, आपको सावधान रहना चाहिए और इसके उपयोग की सीमाओं को स्पष्ट रूप से जानना चाहिए। बहुत अधिक सरल व्याख्याएँ, कंपनी द्वारा स्वतंत्र रूप से या सलाहकारों की मदद से अपनाए गए, छिपे हुए खतरे से भरे हुए हैं। उनकी जटिलता के कारण, गेम थ्योरी विश्लेषण और परामर्श की सिफारिश केवल विशेष रूप से महत्वपूर्ण समस्या क्षेत्रों के लिए की जाती है। फर्मों के अनुभव से पता चलता है कि बड़े सहयोग समझौतों को तैयार करते समय, एकमुश्त, मौलिक रूप से महत्वपूर्ण योजनाबद्ध रणनीतिक निर्णय लेते समय उपयुक्त उपकरणों का उपयोग बेहतर होता है।

ग्रन्थसूची

1. गेम थ्योरी और आर्थिक व्यवहार, वॉन न्यूमैन जे., मॉर्गनस्टर्न ओ., साइंस पब्लिशिंग हाउस, 1970

2. पेट्रोसियन एल.ए., ज़ेनकेविच एन.ए., सेमिना ई.ए. गेम थ्योरी: पाठ्यपुस्तक। विश्वविद्यालयों के लिए मैनुअल - एम.: उच्चतर। स्कूल, बुक हाउस "यूनिवर्सिटी", 1998

3. दुबिना आई.एन. आर्थिक खेलों के सिद्धांत के मूल सिद्धांत: पाठ्यपुस्तक। - एम.: KNORUS, 2010

4. पत्रिका "प्रॉब्लम्स ऑफ थ्योरी एंड प्रैक्टिस ऑफ मैनेजमेंट" का पुरालेख, रेनर वोल्कर

5. संगठनात्मक प्रणालियों के प्रबंधन में खेल सिद्धांत। दूसरा संस्करण., गुब्को एम.वी., नोविकोव डी.ए. 2005


- जे जे रूसो.लोगों के बीच असमानता की उत्पत्ति और नींव के बारे में तर्क // ग्रंथ / अनुवाद। फ़्रेंच से ए. खयुतिना - एम.: नौका, 1969. - पी. 75.

गेम थ्योरी के अनुप्रयोग का एक मज़ेदार उदाहरण एंथनी पीयर्स की फंतासी पुस्तक "द ब्रेव गोलेम" में है।

ढेर सारा पाठ

ग्रुंडी ने शुरू किया, "मैं आप सभी को जो प्रदर्शित करने जा रहा हूं उसका उद्देश्य आवश्यक संख्या में अंक एकत्र करना है।" स्कोर बहुत भिन्न हो सकते हैं - यह सब खेल में प्रतिभागियों द्वारा लिए गए निर्णयों के संयोजन पर निर्भर करता है। उदाहरण के लिए, मान लीजिए कि प्रत्येक प्रतिभागी अपने साथी खिलाड़ी के विरुद्ध गवाही देता है। इस मामले में, प्रत्येक प्रतिभागी को एक अंक से सम्मानित किया जा सकता है!
- एक बिंदु! - सी विच ने खेल में अप्रत्याशित रुचि दिखाते हुए कहा। जाहिर है, जादूगरनी यह सुनिश्चित करना चाहती थी कि गोलेम के पास राक्षस ज़ैंथ को उससे खुश करने का कोई मौका नहीं है।
- अब मान लेते हैं कि खेल में भाग लेने वाला प्रत्येक प्रतिभागी अपने मित्र के विरुद्ध गवाही नहीं देता है! - ग्रुंडी ने जारी रखा। - इस मामले में, प्रत्येक व्यक्ति को तीन अंक दिए जा सकते हैं। मैं विशेष रूप से ध्यान देना चाहता हूं कि जब तक सभी प्रतिभागी समान तरीके से कार्य करते हैं, उन्हें समान संख्या में अंक दिए जाते हैं। किसी को भी दूसरे पर कोई लाभ नहीं है।
- तीन अंक! - दूसरी चुड़ैल ने कहा।
- लेकिन अब हमें यह सुझाव देने का अधिकार है कि एक खिलाड़ी दूसरे के खिलाफ गवाही देने लगा, लेकिन दूसरा अभी भी चुप है! - ग्रुंडी ने कहा। - इस मामले में, जो यह गवाही देता है उसे एक बार में पांच अंक मिलते हैं, और जो चुप रहता है उसे एक भी अंक नहीं मिलता है!
- हाँ! - दोनों चुड़ैलों ने एक स्वर में कहा, अपने होठों को हिंसक तरीके से चाटते हुए। साफ था कि इन दोनों को साफ तौर पर पांच अंक मिलने वाले थे.
- मैं अपना चश्मा खोता रहा! - राक्षस चिल्लाया। - लेकिन आपने केवल स्थिति की रूपरेखा तैयार की है, और इसे हल करने का कोई तरीका अभी तक प्रस्तुत नहीं किया है! तो आपकी रणनीति क्या है? समय बर्बाद करने की कोई जरूरत नहीं!
- रुको, अब मैं सब कुछ समझाता हूँ! - ग्रुंडी ने कहा। “हम चार में से प्रत्येक - हममें से दो गोलेम और दो चुड़ैलें हैं - अपने विरोधियों के खिलाफ लड़ेंगे। निःसंदेह, चुड़ैलें किसी भी बात में किसी के सामने झुकने की कोशिश नहीं करेंगी...
- निश्चित रूप से! - दोनों चुड़ैलें फिर एक स्वर में बोलीं। उन्होंने एक नज़र में गोलेम को पूरी तरह से समझ लिया!
"और दूसरा गोलेम मेरी रणनीति का पालन करेगा," ग्रुंडी ने शांति से जारी रखा। उसने अपने दोहरे की ओर देखा। - बिल्कुल, आप जानते हैं?
- हाँ यकीनन! मैं आपकी प्रतिलिपि हूँ! मैं अच्छी तरह समझता हूँ कि आप क्या सोचते हैं!
- यह बहुत बढ़िया बात है! उस स्थिति में, आइए पहला कदम उठाएं ताकि दानव स्वयं सब कुछ देख सके। प्रत्येक लड़ाई में कई राउंड होंगे ताकि पूरी रणनीति पूरी तरह से साकार हो सके और एक संपूर्ण प्रणाली का आभास दे सके। शायद मुझे शुरुआत करनी चाहिए.

– अब हममें से प्रत्येक को कागज के अपने टुकड़ों पर निशान लगाना होगा! - गोलेम डायन की ओर मुड़ गया। – सबसे पहले आपको एक मुस्कुराता हुआ चेहरा बनाना चाहिए. इसका मतलब यह होगा कि हम किसी साथी कैदी के खिलाफ गवाही नहीं देंगे. आप एक उदास चेहरा भी बना सकते हैं, जिसका अर्थ है कि हम केवल अपने बारे में सोचते हैं और अपने साथी के खिलाफ आवश्यक सबूत दे रहे हैं। हम दोनों को यह एहसास है कि अगर कोई वैसा न हो तो बेहतर होगा, लेकिन दूसरी ओर, एक मुस्कुराते हुए चेहरे की तुलना में एक डूबे हुए चेहरे को कुछ फायदे मिलते हैं! लेकिन मुद्दा यह है कि हममें से हर कोई नहीं जानता कि दूसरा क्या चुनेगा! हमें तब तक पता नहीं चलेगा जब तक हमारा खेलने वाला साथी अपनी ड्राइंग का खुलासा नहीं करता!
- शुरू करो, कमीने! - डायन ने शाप दिया। वह, हमेशा की तरह, अपमानजनक विशेषणों के बिना नहीं रह सकती थी!
- तैयार! - ग्रुंडी ने अपने कागज के टुकड़े पर एक बड़ा मुस्कुराता हुआ चेहरा बनाते हुए कहा, ताकि चुड़ैल यह न देख सके कि उसने वहां क्या बनाया है। डायन ने अपनी चाल चली, और मुँह भी बनाया। किसी को यह सोचना चाहिए कि उसने निश्चित रूप से एक निर्दयी चेहरा दिखाया है!
ग्रुंडी ने घोषणा की, "ठीक है, अब हमें बस एक-दूसरे को अपने चित्र दिखाना है।" पीछे मुड़कर उसने चित्र को जनता के लिए खोला और उसे सभी दिशाओं में दिखाया ताकि सभी लोग चित्र को देख सकें। कुछ नाराज होकर बड़बड़ाते हुए सी विच ने वैसा ही किया।
जैसा कि ग्रुंडी ने उम्मीद की थी, डायन के चित्र से एक क्रोधित, असंतुष्ट चेहरा दिखाई दिया।
"अब आप, प्रिय दर्शकों," ग्रुंडी ने गंभीरता से कहा, "देखें कि चुड़ैल ने मेरे खिलाफ गवाही देने का फैसला किया है।" मैं ऐसा नहीं करने जा रहा हूं. इस प्रकार, सी विच को पांच अंक मिलते हैं। और, तदनुसार, मुझे एक भी अंक नहीं मिलता है। और यहां…
दर्शकों की कतारों में फिर से हल्का सा शोर गूंज उठा। हर किसी को स्पष्ट रूप से गोलेम के प्रति सहानुभूति थी और वह पूरी लगन से चाहता था कि समुद्री चुड़ैल हार जाए।
लेकिन खेल तो अभी शुरू हुआ है! यदि केवल उनकी रणनीति सही होती...
- अब हम दूसरे दौर में आगे बढ़ सकते हैं! - ग्रुंडी ने गंभीरता से घोषणा की। - हमें चालें दोबारा दोहरानी होंगी। हर कोई वह चेहरा बनाता है जो उनके सबसे करीब होता है!
और उन्होंने वैसा ही किया. ग्रुंडी का चेहरा अब उदास, असंतुष्ट था।
जैसे ही खिलाड़ियों ने अपने चित्र दिखाए, दर्शकों ने देखा कि वे दोनों अब क्रोधित चेहरे बना रहे थे।
- प्रत्येक को दो अंक! - ग्रुंडी ने कहा।
- सात दो मेरे पक्ष में! - डायन खुशी से चिल्लाई। "तुम यहाँ से नहीं निकलोगे, कमीने!"
- चलो फिर से शुरु करते हैं! - ग्रुंडी ने कहा। उन्होंने एक और चित्र बनाया और उसे जनता को दिखाया। फिर वही गुस्से वाले चेहरे.
- हममें से प्रत्येक ने पिछले कदम को दोहराया, स्वार्थी व्यवहार किया, और इसलिए, मुझे ऐसा लगता है, किसी को अंक न देना ही बेहतर है! - गोलेम ने कहा।
- लेकिन मैं अभी भी खेल का नेतृत्व करता हूँ! - डायन ने खुशी से हाथ मलते हुए कहा।
- ठीक है, शोर मत करो! - ग्रुंडी ने कहा। - खेल ख़त्म नहीं हुआ है. चलो देखते हैं क्या होता हैं! तो, प्रिय दर्शकों, हम चौथा दौर शुरू कर रहे हैं!
खिलाड़ियों ने फिर से चित्र बनाए और दर्शकों को दिखाया कि उन्होंने अपनी शीट पर क्या बनाया है। कागज की दोनों शीटों ने दर्शकों को फिर से वही बुरे चेहरे दिखाए।
- आठ - तीन! - डायन बुरी हंसी फूटते हुए चिल्लाई। "तुमने अपनी मूर्खतापूर्ण रणनीति से अपनी कब्र खोद ली, गोलेम!"
- पाँचवाँ दौर! - ग्रुंडी चिल्लाया। वही हुआ जो पिछले राउंड में हुआ था - चेहरे फिर गुस्से में थे, केवल स्कोर बदल गया - यह जादूगरनी के पक्ष में नौ-चार हो गया।
– अब आखिरी, छठा राउंड! - ग्रुंडी ने घोषणा की। उनकी प्रारंभिक गणना से पता चला कि यह विशेष दौर भाग्यवादी बन जाना चाहिए। अब सिद्धांत की पुष्टि या खंडन अभ्यास द्वारा किया जाना था।
कागज पर पेंसिल की कुछ तेज और घबराहट भरी हरकतें - और दोनों चित्र लोगों की आंखों के सामने आ गए। फिर दो चेहरे, अब खुले दाँतों से भी!
– दस – पाँच मेरे पक्ष में! मेरा खेल! मैं जीता! - समुद्री चुड़ैल चिल्लाई।

"आप वास्तव में जीत गए," ग्रुंडी ने निराशा से सहमति व्यक्त की। श्रोतागण अत्यंत मौन थे।
राक्षस ने कुछ कहने के लिए अपने होंठ हिलाये।

- लेकिन हमारी प्रतिस्पर्धा अभी ख़त्म नहीं हुई है! - ग्रुंडी जोर से चिल्लाया। - यह खेल का केवल पहला भाग था।
- तुम्हें अनंत काल दो! - दानव ज़ैंथ अप्रसन्नता से बड़बड़ाया।
- यह सही है! - ग्रुंडी ने शांति से कहा। – लेकिन एक राउंड से कुछ हल नहीं होता, केवल कार्यप्रणाली ही सर्वोत्तम परिणाम का संकेत देती है।
गोलेम अब दूसरी चुड़ैल के पास पहुंचा।
- मैं इस राउंड को किसी अन्य प्रतिद्वंद्वी के साथ खेलना चाहूंगा! - उसने घोषणा की थी। - हम में से प्रत्येक चेहरे का चित्रण करेगा, जैसा कि पिछली बार था, फिर हम प्रदर्शित करेंगे कि हमने जनता के सामने क्या आकर्षित किया है!
तो उन्होंने ऐसा ही किया. परिणाम पिछली बार जैसा ही था - ग्रुंडी ने एक मुस्कुराता हुआ चेहरा बनाया, और चुड़ैल ने सिर्फ एक खोपड़ी बनाई। उसने ग्रुंडी को पीछे छोड़ते हुए तुरंत पूरे पांच अंक की बढ़त हासिल कर ली।
शेष पांच राउंड उन परिणामों के साथ समाप्त हुए जिनकी उम्मीद की जा सकती थी। एक बार फिर स्कोर सी विच के पक्ष में दस-पांच था।
- गोलेम, मुझे आपकी रणनीति सचमुच पसंद आई! - डायन हँसी।
- तो, ​​आपने खेल के दो राउंड देख लिए हैं, प्रिय दर्शकों! - ग्रुंडी ने कहा। "इस प्रकार, मैंने दस अंक बनाए, और मेरे प्रतिद्वंद्वियों ने बीस अंक बनाए!"
दर्शक, जो अंक भी गिन रहे थे, शोकपूर्वक सिर हिलाया। उनकी गिनती गोलेम से मेल खाती थी। केवल फ्रैक्टो नाम का बादल ही बहुत प्रसन्न लग रहा था, हालाँकि, निश्चित रूप से, उसे चुड़ैल से भी सहानुभूति नहीं थी।
लेकिन रॅपन्ज़ेल गोलेम को देखकर मुस्कुराई - वह उस पर विश्वास करती रही। अब शायद वह अकेली बची होगी जिसने उस पर विश्वास किया। ग्रुंडी को उम्मीद थी कि वह इस असीम भरोसे को सही ठहराएंगे।
अब ग्रुंडी अपने तीसरे प्रतिद्वंद्वी - अपने डबल - के पास पहुंचे। वह उनका अंतिम प्रतिद्वंद्वी होना था। गोलेम्स ने कागज पर तेजी से अपनी पेंसिलें लिखकर कागज के टुकड़े जनता को दिखाए। सभी ने दो हँसते हुए चेहरे देखे।
- कृपया ध्यान दें, प्रिय दर्शकों, हममें से प्रत्येक ने एक अच्छा सेलमेट बनना चुना! - ग्रुंडी ने कहा। "और इसलिए हममें से किसी को भी इस खेल में अपने विरोधियों पर आवश्यक लाभ नहीं मिला।" तो हम दोनों को तीन अंक मिलते हैं और अगले दौर में आगे बढ़ते हैं!
दूसरा दौर शुरू हो गया है. नतीजा पिछली बार जैसा ही रहा. फिर बाकी राउंड. और प्रत्येक राउंड में, दोनों विरोधियों ने फिर से तीन अंक बनाए! यह बिल्कुल अविश्वसनीय था, लेकिन जनता जो कुछ भी हो रहा था उसकी पुष्टि करने के लिए तैयार थी।

अंत में, यह दौर समाप्त हो गया, और ग्रुंडी ने, जल्दी से कागज पर अपनी पेंसिल चलाकर, परिणाम की गणना करना शुरू कर दिया। अंत में उन्होंने गंभीरता से घोषणा की:
-अट्ठारह से अठारह! कुल मिलाकर, मैंने अट्ठाईस अंक बनाए, जबकि मेरे विरोधियों ने अड़तीस अंक बनाए!
"तो आप हार गए," सी विच ने ख़ुशी से घोषणा की। - इस प्रकार, हम में से एक विजेता बन जाएगा!
- शायद! - ग्रुंडी ने शांति से जवाब दिया। अब एक और महत्वपूर्ण क्षण आया. यदि सब कुछ योजना के अनुसार हुआ तो...
- हमें इस मामले को ख़त्म करना होगा! - दूसरा गोलेम चिल्लाया। "मुझे अभी भी दो समुद्री चुड़ैलों से लड़ना है!" अभी खेल खत्म नहीं हुआ!
- हाँ, बिल्कुल, आगे बढ़ें! - ग्रुंडी ने कहा। - लेकिन केवल रणनीति द्वारा निर्देशित रहें!
- हाँ यकीनन! - अपने दोहरे को आश्वासन दिया।
यह गोलेम एक चुड़ैल के पास पहुंचा और दौरा शुरू हुआ। यह उसी परिणाम के साथ समाप्त हुआ जिसके साथ ग्रुंडी स्वयं एक समान दौर से बाहर आए थे - स्कोर जादूगरनी के पक्ष में दस से पांच था। चुड़ैल वास्तव में अवर्णनीय खुशी से झूम उठी, और दर्शक उदास होकर चुप हो गए। दानव ज़ैंथ कुछ थका हुआ लग रहा था, जो बहुत अच्छा शगुन नहीं था।
अब अंतिम दौर का समय था - एक चुड़ैल को दूसरी से लड़ना था। प्रत्येक के पास बीस अंक थे, जिन्हें वह गोलेम्स से लड़कर प्राप्त करने में सक्षम थी।
"और अब, यदि आप मुझे कम से कम कुछ अतिरिक्त अंक प्राप्त करने की अनुमति दें..." सी विच ने षड्यंत्रपूर्वक अपने दोहरे से फुसफुसाया।
ग्रुंडी ने शांत रहने की कोशिश की, कम से कम बाहरी तौर पर, हालाँकि उसकी आत्मा में परस्पर विरोधी भावनाओं का तूफान चल रहा था। उनकी किस्मत अब इस बात पर निर्भर थी कि उन्होंने दोनों चुड़ैलों के संभावित व्यवहार की कितनी सही भविष्यवाणी की थी - आखिरकार, उनका चरित्र, संक्षेप में, एक ही था!
अब शायद सबसे महत्वपूर्ण क्षण आ गया है। लेकिन अगर वह गलत था तो क्या होगा?
- आख़िर मैं तुम्हें क्यों छोड़ दूं! - दूसरी चुड़ैल पहली पर टेढ़ी-मेढ़ी बोली। - मैं स्वयं अधिक अंक प्राप्त करना चाहता हूँ और यहाँ से निकलना चाहता हूँ!
आवेदक चिल्लाया, "ठीक है, अगर तुम इतना निर्लज्ज व्यवहार कर रहे हो," तो मैं तुम्हें इतना पीटूंगा कि तुम फिर मेरे जैसे नहीं रहोगे!
चुड़ैलों ने एक-दूसरे को घृणित दृष्टि से देखते हुए, उनके चित्र बनाए और उन्हें जनता को दिखाया। बेशक, दो खोपड़ियों के अलावा और कुछ नहीं हो सकता था! प्रत्येक ने एक अंक अर्जित किया।
चुड़ैलों ने एक-दूसरे को श्राप देते हुए दूसरा दौर शुरू किया। परिणाम फिर से वही है - फिर से दो अनाड़ी ढंग से खींची गई खोपड़ियाँ। इस प्रकार चुड़ैलों ने एक और अंक अर्जित किया। जनता ने लगन से सब कुछ रिकॉर्ड किया।
यह आगे भी जारी रहा. जब राउंड ख़त्म हुआ, तो थकी हुई चुड़ैलों को पता चला कि उनमें से प्रत्येक ने छह अंक अर्जित किए हैं। फिर से ड्रा करें!
- अब आइए परिणामों की गणना करें और हर चीज़ की तुलना करें! - ग्रुंडी ने विजयी भाव से कहा। - प्रत्येक चुड़ैल ने छब्बीस अंक बनाए, और गोलेम्स ने अट्ठाईस अंक बनाए। तो हमारे पास क्या है? और हमारे पास परिणाम है कि गोलेम्स के पास अधिक अंक हैं!
दर्शकों की कतार में आश्चर्य की सांस दौड़ गई। उत्साहित दर्शकों ने गिनती की सटीकता की जांच करते हुए, अपने कागज के टुकड़ों पर संख्याओं के कॉलम लिखना शुरू कर दिया। इस दौरान, कई लोगों ने स्कोर किए गए अंकों की संख्या की गिनती नहीं की, यह मानते हुए कि उन्हें खेल का परिणाम पहले से ही पता था। दोनों चुड़ैलें आक्रोश से गुर्राने लगीं, यह स्पष्ट नहीं है कि जो कुछ हुआ उसके लिए उन्होंने वास्तव में किसे दोषी ठहराया। राक्षस ज़ांट की आँखें फिर से सावधान आग से चमक उठीं। उनका भरोसा उचित था!
"प्रिय दर्शकों, मैं आपसे इस तथ्य पर ध्यान देने के लिए कहता हूं," ग्रुंडी ने अपना हाथ उठाया, और मांग की कि दर्शक शांत हो जाएं, "कि किसी भी गोलेम्स ने एक भी राउंड नहीं जीता।" लेकिन अंतिम जीत फिर भी हममें से एक, गोलेम्स की ही होगी। यदि प्रतिस्पर्धा जारी रही तो परिणाम अधिक स्पष्ट होंगे! मेरे प्रिय दर्शकों, मैं कहना चाहता हूं कि शाश्वत द्वंद्व में मेरी रणनीति हमेशा विजयी होगी!
ग्रुंडी जो कह रहा था उसे दानव ज़ैंथ ने दिलचस्पी से सुना। अंत में, भाप के बादल छोड़ते हुए, उसने अपना मुँह खोला:
- आपकी रणनीति वास्तव में क्या है?
- मैं इसे कहता हूं "दृढ़ रहें लेकिन निष्पक्ष रहें"! - ग्रुंडी ने समझाया। - मैं ईमानदारी से खेल शुरू करता हूं, लेकिन फिर मैं हारना शुरू कर देता हूं क्योंकि मुझे बहुत विशिष्ट साझेदार मिलते हैं। इसलिए, पहले दौर में, जब यह पता चलता है कि समुद्री चुड़ैल मेरे खिलाफ गवाही देना शुरू कर देती है, तो मैं स्वचालित रूप से दूसरे दौर में हारा हुआ रह जाता हूं - और यह अंत तक जारी रहता है। यदि डायन खेल खेलने की अपनी रणनीति बदल दे तो परिणाम भिन्न हो सकते हैं। लेकिन चूंकि उसे इसकी भनक तक नहीं लगी, इसलिए हमने पिछले पैटर्न के अनुसार खेलना जारी रखा। जब मैंने अपने डबल के साथ खेलना शुरू किया, तो उसने मेरे साथ अच्छा व्यवहार किया और खेल के अगले दौर में मैंने भी उसके साथ अच्छा व्यवहार किया। इसलिए, हमारा खेल भी अलग और कुछ हद तक नीरस रहा, क्योंकि हम रणनीति बदलना नहीं चाहते थे...
- लेकिन आपने एक भी राउंड नहीं जीता! - राक्षस ने आश्चर्य से आपत्ति जताई।
- हाँ, और इन चुड़ैलों ने एक भी राउंड नहीं हारा है! - ग्रुंडी ने पुष्टि की। - लेकिन जीत स्वचालित रूप से उस व्यक्ति को नहीं मिलती जिसके पास शेष राउंड हैं। जीत उसे मिलती है जो सबसे अधिक अंक अर्जित करता है, लेकिन यह बिल्कुल अलग मामला है! जब मैं चुड़ैलों के साथ खेलता था तब की तुलना में जब मैं अपने डबल के साथ खेलता था तो मैं अधिक अंक अर्जित करने में सफल रहता था। उनके स्वार्थी रवैये ने उन्हें क्षणिक जीत दिला दी, लेकिन लंबी अवधि में, यह पता चला कि इसी वजह से वे दोनों पूरा गेम हार गए। ऐसा अक्सर होता है!

नॉलेज बेस में अपना अच्छा काम भेजना आसान है। नीचे दिए गए फॉर्म का उपयोग करें

अच्छा कामसाइट पर">

छात्र, स्नातक छात्र, युवा वैज्ञानिक जो अपने अध्ययन और कार्य में ज्ञान आधार का उपयोग करते हैं, आपके बहुत आभारी होंगे।

प्रकाशित किया गया http://www.allbest.ru/

संघीय संचार एजेंसी

साइबेरियाई स्टेट यूनिवर्सिटीदूरसंचार और कंप्यूटर विज्ञान

विशेषज्ञों के पुनर्प्रशिक्षण के लिए अंतर्क्षेत्रीय केंद्र

परीक्षा

अनुशासन: संस्थागत अर्थशास्त्र

द्वारा पूरा किया गया: लापिना ई.एन.

समूह: ईबीटी-52

विकल्प:4

नोवोसिबिर्स्क, 2016

परिचय

दुनिया भर में कोई भी व्यक्ति प्रतिदिन कुछ न कुछ कार्य करता है, किसी न किसी चीज़ में अपने लिए चुनाव करता है। कोई भी कार्य करने के लिए, किसी व्यक्ति को उनके परिणामों के बारे में सोचने की ज़रूरत होती है, सबसे सही, तर्कसंगत चुनने की ज़रूरत होती है संभव समाधान. चुनाव किसी के अपने या समूह के हितों के आधार पर किया जाना चाहिए, यह इस पर निर्भर करता है कि निर्णय किस पर लागू होता है (एक व्यक्ति या एक समूह, समग्र रूप से संगठन)।

व्यवस्था बनाए रखने और विनिमय की अनिश्चितता को कम करने के लिए लोगों द्वारा संस्थाएँ बनाई जाती हैं। वे लोगों के व्यवहार में पूर्वानुमेयता प्रदान करते हैं। संस्थाएँ हमें अपनी सोचने की क्षमता को बचाने की अनुमति देती हैं, क्योंकि नियमों को सीखने के बाद, हम बाहरी वातावरण को समझने और समझने की कोशिश किए बिना उसके अनुकूल हो सकते हैं। पेट्रोसियन एल.ए., ज़ेनकेविच एन.ए., शेवकोप्लायस ई.वी.: गेम थ्योरी: पाठ्यपुस्तक। प्रकाशक: बीएचवी, 2012.-पी.18.

संस्थाएँ समाज में "खेल के नियम" हैं, या, अधिक औपचारिक रूप से, मानव निर्मित सीमाएँ हैं जो लोगों के बीच संबंधों को व्यवस्थित करती हैं। लैबस्कर एल.जी., यशचेंको एन.ए.: अर्थशास्त्र में गेम थ्योरी। समस्या समाधान के साथ कार्यशाला. ट्यूटोरियल. प्रकाशक: नॉरस, 2014.-पी.21. लोगों के बीच बार-बार होने वाली बातचीत से उत्पन्न होने वाली समस्याओं को हल करने के लिए संस्थाएँ उभरती हैं। साथ ही, उन्हें न केवल समस्या का समाधान करना होगा, बल्कि इसे हल करने पर खर्च होने वाले संसाधनों को भी कम करना होगा।

गेम थ्योरी खेलों में इष्टतम रणनीतियों का अध्ययन करने के लिए एक गणितीय विधि है। खेल एक ऐसी प्रक्रिया है जिसमें दो या दो से अधिक पक्ष भाग लेते हैं, अपने हितों को साकार करने के लिए लड़ते हैं। प्रत्येक पक्ष का अपना लक्ष्य होता है और वह कुछ रणनीति का उपयोग करता है जिससे जीत या हार हो सकती है - यह उसके व्यवहार और अन्य खिलाड़ियों के व्यवहार पर निर्भर करता है। गेम थ्योरी कुछ कारकों को ध्यान में रखते हुए सबसे अधिक लाभदायक रणनीतियों को चुनने में मदद करती है:

1. अन्य प्रतिभागियों के बारे में विचार;

2. प्रतिभागियों के संसाधन;

3. प्रतिभागियों के अपेक्षित कार्य।

खेल सिद्धांत में, यह माना जाता है कि प्रत्येक खिलाड़ी के लिए उपलब्ध भुगतान कार्य और रणनीतियों का सेट आम तौर पर ज्ञात होता है, यानी। प्रत्येक खिलाड़ी अपने स्वयं के भुगतान फ़ंक्शन और अपने निपटान में रणनीतियों के सेट के साथ-साथ अन्य सभी खिलाड़ियों के भुगतान कार्यों और रणनीतियों को जानता है, और इस जानकारी के अनुसार अपना व्यवहार बनाता है।

विषय की प्रासंगिकता व्यवहार में खेल सिद्धांत के अनुप्रयोगों की विस्तृत श्रृंखला (जीव विज्ञान, समाजशास्त्र, गणित, प्रबंधन, आदि) में निहित है। विशेष रूप से अर्थशास्त्र में - ऐसे क्षणों में जब वे काम नहीं करते हैं सैद्धांतिक आधारशास्त्रीय आर्थिक सिद्धांत में पसंद के सिद्धांत, उदाहरण के लिए, इस तथ्य में शामिल हैं कि उपभोक्ता अपनी पसंद तर्कसंगत रूप से बनाता है, वह किसी दिए गए बाजार की स्थिति और किसी विशेष उत्पाद के बारे में पूरी तरह से जानता है।

अध्याय 1. खेल सिद्धांत की सैद्धांतिक नींव

1.1 खेल सिद्धांत की अवधारणा

जैसा कि ऊपर उल्लेख किया गया है, गेम थ्योरी गणित की एक शाखा है जो संघर्ष की स्थितियों में इष्टतम निर्णय लेने के लिए औपचारिक मॉडल का अध्ययन करती है। इस मामले में, संघर्ष को एक ऐसी घटना के रूप में समझा जाता है जिसमें विभिन्न पक्ष शामिल होते हैं, जो इन हितों के अनुसार उनके लिए उपलब्ध कार्यों को चुनने के लिए विभिन्न हितों और अवसरों से संपन्न होते हैं। प्रत्येक पक्ष का अपना लक्ष्य होता है और वह कुछ रणनीति का उपयोग करता है जिससे जीत या हार हो सकती है - यह अन्य खिलाड़ियों के व्यवहार पर निर्भर करता है। गेम थ्योरी अन्य प्रतिभागियों, उनके संसाधनों और उनके संभावित कार्यों के बारे में विचारों को ध्यान में रखते हुए सर्वोत्तम रणनीतियों को चुनने में मदद करती है

गेम थ्योरी की उत्पत्ति नवशास्त्रीय अर्थशास्त्र से हुई है। सिद्धांत के गणितीय पहलुओं और अनुप्रयोगों को पहली बार जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न की क्लासिक 1944 की पुस्तक, गेम थ्योरी और इकोनॉमिक बिहेवियर में रेखांकित किया गया था।

खेल वास्तविक संघर्ष की स्थिति का एक सरलीकृत औपचारिक मॉडल है। गणितीय रूप से, औपचारिकीकरण का अर्थ है कि खेल के दौरान पार्टियों के कार्यों के लिए कुछ नियम विकसित किए गए हैं: पार्टियों के कार्यों के लिए विकल्प; इस विकल्प के लिए खेल का परिणाम; प्रत्येक पक्ष के पास अन्य सभी दलों के व्यवहार के बारे में कितनी जानकारी है।

ऐसी स्थितियाँ जिनमें दो पक्षों के हित टकराते हैं और किसी एक पक्ष द्वारा किए गए किसी भी ऑपरेशन का परिणाम दूसरे पक्ष के कार्यों पर निर्भर करता है, संघर्ष की स्थितियाँ कहलाती हैं।

खिलाड़ी खेल की स्थिति में पार्टियों में से एक है। खिलाड़ी की रणनीति खेल की प्रत्येक संभावित स्थिति में उसकी कार्रवाई के नियम हैं। गेम थ्योरी में प्रभुत्व एक ऐसी स्थिति है जिसमें एक निश्चित खिलाड़ी की रणनीतियों में से एक दूसरे की तुलना में अधिक लाभ देती है, भले ही उसके विरोधियों के कार्यों की परवाह किए बिना। प्रोतासोव आई.डी. खेल सिद्धांत और संचालन अनुसंधान: पाठ्यपुस्तक। भत्ता. - एम.: हेलिओस एआरवी, 2013.-पी.121।

समन्वय खेल में केंद्र बिंदु संतुलन है, जिसे बातचीत में सभी प्रतिभागियों द्वारा सामान्य ज्ञान के आधार पर चुना जाता है जो उन्हें अपनी पसंद का समन्वय करने में मदद करता है। केंद्र बिंदु की अवधारणा पुरस्कार विजेता द्वारा प्रस्तुत की गई थी नोबेल पुरस्कार 2005 में अर्थशास्त्री थॉमस शेलिंग द्वारा 1957 में लिखा गया एक लेख जो उनकी प्रसिद्ध पुस्तक द स्ट्रैटेजी ऑफ कॉन्फ्लिक्ट (1960) का तीसरा अध्याय बन गया।

यदि किसी खिलाड़ी के लिए सख्ती से प्रभावी रणनीति है, तो वह खेल में किसी भी नैश संतुलन में इसका उपयोग करेगा। यदि सभी खिलाड़ियों के पास कड़ाई से प्रभावी रणनीतियाँ हैं, तो खेल में एक अद्वितीय नैश संतुलन होता है। हालाँकि, यह संतुलन आवश्यक रूप से पेरेटो कुशल नहीं होगा, अर्थात। असंतुलन के परिणाम सभी खिलाड़ियों को अधिक लाभ प्रदान कर सकते हैं। इस स्थिति का एक उत्कृष्ट उदाहरण प्रिज़नर्स डिलेमा गेम है। नैश संतुलन रणनीतियों का एक सेट है (प्रत्येक खिलाड़ी के लिए एक) ताकि किसी भी खिलाड़ी को अपनी रणनीति से विचलित होने का प्रोत्साहन न मिले। वह स्थिति पेरेटो कुशल होगी यदि कोई भी खिलाड़ी दूसरे खिलाड़ी की स्थिति खराब किए बिना अपनी स्थिति में सुधार नहीं कर सकता है।

यह स्टैकेलबर्ग संतुलन का भी उल्लेख करने योग्य है। स्टैकेलबर्ग संतुलन एक ऐसी स्थिति है जहां कोई भी खिलाड़ी अपने भुगतान को एकतरफा नहीं बढ़ा सकता है, और निर्णय पहले एक खिलाड़ी द्वारा किए जाते हैं और दूसरे खिलाड़ी को ज्ञात हो जाते हैं। प्रमुख रणनीतियों के संतुलन और नैश संतुलन के विपरीत, इस प्रकार का संतुलन हमेशा मौजूद रहता है।

गेम थ्योरी की व्याख्या दो तरीकों से की जा सकती है: मैट्रिक्स और ग्राफिक। मैट्रिक्स विधिनीचे दर्शाया जाएगा, जहां संस्थानों के उद्भव के लिए अग्रणी स्थितियों पर विचार किया जाएगा।

ग्राफिकल प्रतिनिधित्व के उदाहरण के लिए, आइए निम्नलिखित स्थिति को देखें जहां गायों को चराने के लिए एक चारागाह है। आइए अब प्रश्न पूछें: गायों की कितनी संख्या होने पर, इस चरागाह का उपयोग इष्टतम होगा? सीमांत अनुकूलन सिद्धांत के अनुसार, जो सीमांत लागत और सीमांत राजस्व के समीकरण को मानता है, इसका उत्तर दिया जाना चाहिए कि गायों की इष्टतम संख्या वह होगी जिस पर अंतिम गाय, वीएमपी, को चराने से सीमांत उत्पाद का मूल्य होगा। एक गाय की कीमत के बराबर हो, सी. इस चरागाह के निजी स्वामित्व की शर्तों के तहत, इस सिद्धांत का पालन किया जाएगा, क्योंकि व्यक्तिगत मालिक प्रत्येक अतिरिक्त गाय से जुड़े लाभों और लागतों की तुलना करेगा, और उनकी संख्या, ईपी, पर निर्णय लेगा, जिस पर सकारात्मक प्राप्त करने की संभावना होगी चरागाह पर गायों को चराने से किराया, आरपी, समाप्त हो जाएगा, और, तदनुसार, इस किराए की अधिकतम सीमा तक पहुंच जाएगी (छवि 1)। इसे नीचे दिए गए समीकरण में संक्षेपित किया गया है, जिससे सीमांत सिद्धांत कुल उत्पाद, वीटीपी और कुल लागत के मूल्य के बीच अंतर को अधिकतम करता है, यानी गाय की लागत गायों की संख्या से गुणा होती है

वीएमपी (एन*) = सी अधिकतम वीटीपी (एन) - सीएन (1)

चित्र 1. - गायों की अधिकतम और औसत चराई के मूल्य का ग्राफ़

हालाँकि, चरागाह तक मुफ्त पहुंच की स्थिति में, यानी, उस पर विशेष अधिकारों की अनुपस्थिति में, सीमांत अनुकूलन सिद्धांत का पालन नहीं किया जाएगा और चरागाह पर गायों की संख्या इष्टतम मूल्य, ईपी से अधिक हो जाएगी, और बिंदु तक पहुंच जाएगी। गाय चराने से प्राप्त औसत उत्पाद के मूल्य, वीएपी और गाय की लागत की समानता। परिणामस्वरूप, यूरोपीय संघ की निःशुल्क पहुंच की शर्तों के तहत गायों की एक नई संतुलन संख्या होगी। इस मामले में, गायों को चराने से उनकी इष्टतम संख्या, ईपी तक पहुंचने तक बनाया गया सकारात्मक किराया, आरपी, अतिरिक्त गायों पर बर्बाद हो जाएगा और, बिंदु ईसी तक पहुंचने पर, संचय के परिणामस्वरूप शून्य के बराबर हो जाएगा। मापांक में इसके बराबर ऋणात्मक किराया। इसे नीचे दिए गए समीकरणों में संक्षेपित किया गया है:

वीटीपी (एन")/एन"=सी?वीटीपी (एन")-सीएन"=0;

1.2 मानव जीवन की स्थितियों और क्षेत्रों की विविधता जिसमें गेम थ्योरी लागू होती है

जीवन में, विरोधी पक्षों के बीच टकराव के कई उदाहरण हैं, जो विरोधी हितों का पीछा करने वाले दो सक्रिय दलों के साथ संघर्ष का रूप ले लेते हैं।

उदाहरण के लिए, जब भरोसे की बात आती है तो ऐसी स्थितियाँ उत्पन्न होती हैं। प्रतिपक्ष के कार्यों का अपेक्षाओं के साथ अनुपालन उन स्थितियों में विशेष रूप से महत्वपूर्ण हो जाता है जहां किसी व्यक्ति द्वारा लिए गए निर्णयों का जोखिम प्रतिपक्ष के कार्यों से निर्धारित होता है। गेम थ्योरी मॉडल इसका सबसे अच्छा उदाहरण हैं: एक खिलाड़ी की किसी विशेष रणनीति का चुनाव दूसरे खिलाड़ी के कार्यों पर निर्भर करता है। ट्रस्ट "दूसरों के कुछ कार्यों की अपेक्षा है जो व्यक्ति की पसंद को प्रभावित करती है, जब व्यक्ति को दूसरों के कार्यों के ज्ञात होने से पहले कार्य करना शुरू करना चाहिए।" आइए हम बाज़ार में लेन-देन के संबंध को अवैयक्तिक रूप में विश्वास (व्यक्तियों के बीच संबंधों को विनियमित करने वाले एक मानक के रूप में विश्वास) के साथ जोड़ने पर जोर दें, क्योंकि लेन-देन में भाग लेने वालों का दायरा व्यक्तिगत रूप से परिचित लोगों तक सीमित नहीं होना चाहिए। निम्नलिखित मॉडल प्रीपेमेंट (छवि 2) का उपयोग करके सबसे सरल बाजार लेनदेन को पूरा करने के लिए एक अवैयक्तिकृत रूप में ट्रस्ट के अस्तित्व की आवश्यकता को सत्यापित करने में मदद करता है।

चित्र 2

मान लीजिए कि खरीदार को कई विक्रेताओं का सामना करना पड़ता है और वह अपने पिछले व्यावसायिक अनुभव से धोखाधड़ी की संभावना जानता है (1 - पी)। आइए मान p की गणना करें जैसे कि लेनदेन होता है, यानी "अग्रिम भुगतान करना" एक क्रमिक रूप से स्थिर रणनीति है।

ईयू (अग्रिम भुगतान करें) = 10पी - 5(1 - आर) = 15पी - 5,

ईयू(अग्रिम भुगतान न करें) = 0.15पी - -5 > 0, पी>1/3।

दूसरे शब्दों में, यदि विक्रेताओं पर खरीदार के विश्वास का स्तर 33.3% से कम है, तो दी गई शर्तों के तहत पूर्व भुगतान के साथ लेनदेन असंभव हो जाता है। दूसरे शब्दों में, पी = 1/3 विश्वास का महत्वपूर्ण, न्यूनतम आवश्यक स्तर है।

परिणामों को सामान्य बनाने के लिए, हम खरीदार की जीत (10) और हार (--5) के विशिष्ट मूल्यों को जी और एल प्रतीकों से बदल देते हैं। फिर, खेल की पिछली संरचना के साथ, लेनदेन होगा

लाभ के सापेक्ष हानि की मात्रा जितनी अधिक होगी, लेन-देन के पक्षों के बीच विश्वास का स्तर उतना ही अधिक होना चाहिए। जेम्स कोलमैन ने लेन-देन की शर्तों पर विश्वास की आवश्यकता की निर्भरता को इस प्रकार दर्शाया (चित्र 3)।

चित्र तीन

विश्वास के न्यूनतम आवश्यक स्तर पर परिकलित डेटा की पुष्टि अनुभवजन्य रूप से की जाती है। इस प्रकार, विकसित बाजार अर्थव्यवस्था वाले देशों में अवैयक्तिक विश्वास का स्तर, इस प्रश्न का उत्तर देकर मापा जाता है: "आपके आधार पर" निजी अनुभव, क्या आपको लगता है कि आपके आस-पास के लोगों पर भरोसा किया जा सकता है? ", डेनमार्क 24 में 94%, जर्मनी में 90, ग्रेट ब्रिटेन में 88, फ़्रांस में 84, उत्तरी इटली में 72 और दक्षिण में 65% थी। दक्षिणी इटली में, जहां माफिया परंपरागत रूप से मजबूत है, भरोसे का निम्न स्तर संकेत है। यह कोई संयोग नहीं है कि माफिया शोधकर्ताओं में से एक, डी. गैम्बेटा, इसके उद्भव की आलोचनात्मक रूप से व्याख्या करते हैं कम स्तरइटली के दक्षिणी क्षेत्रों में विश्वास और इसलिए, विश्वास के विकल्प की आवश्यकता है, जो "तीसरे पक्ष" के हस्तक्षेप का रूप लेता है जिस पर लेनदेन के दोनों पक्षों द्वारा भरोसा किया जाता है।

गेम थ्योरी का एक और उल्लेखनीय उदाहरण खनिज भंडार के विकास के लिए एक निवेशक और राज्य के बीच अनुबंध है।

इस उदाहरण को स्पष्ट करने के लिए, आइए कुर्सियों की बिक्री और खरीद के लिए एक अनुबंध लें, इस तथ्य को ध्यान में रखते हुए कि उनमें छिपे खजाने की उपस्थिति प्रश्न में है। हम इस तथ्य को ध्यान में रखते हुए एक उदाहरण प्रस्तुत करेंगे कि खेल सिद्धांत के ढांचे के भीतर, दो प्रतिभागियों के साथ एक खेल में एक तीसरे खिलाड़ी, "प्रकृति" को पेश करके अनुबंध के पक्षों के इरादों के बाहरी कारकों को ध्यान में रखा जाता है ( चित्र 4).

चित्र 4

खेल की विस्तारित रूप में प्रस्तुति से निम्नानुसार, खेल में चार परिणामों के बजाय छह हैं। और अगर मंच चालक के कार्यों पर ओस्ताप की जीत की निर्भरता की समस्या का समाधान ओस्ताप के विश्वास के किसी भी गैर-शून्य स्तर की उपस्थिति में होता है, तो कुर्सियों में खजाने की उपस्थिति पर ओस्ताप की जीत की निर्भरता की समस्या अनसुलझी बनी हुई है, जो संयोगवश, उपन्यास के अंत से पुष्ट होती है।

1.3 खेलों को दोहराने में संभावित रणनीतियाँ

1. मिश्रित रणनीतियाँ। जब खिलाड़ी खुद को बार-बार एक निश्चित पसंद की स्थिति में पाते हैं, तो उनकी बातचीत काफी जटिल हो जाती है। वे अपनी समग्र जीत को अधिकतम करने के लिए रणनीतियों को संयोजित करने का जोखिम उठा सकते हैं। आइए इसे एक मॉडल का उपयोग करके दिखाएं जो सेंट्रल बैंक द्वारा अपनाई गई मौद्रिक नीति के संबंध में सेंट्रल बैंक (सीबी) और एक आर्थिक एजेंट के बीच संबंध का वर्णन करता है।

सेंट्रल बैंक या तो सख्त मौद्रिक नीति पर ध्यान केंद्रित करता है, मुद्रास्फीति को एक निश्चित स्तर (पी0) पर बनाए रखने की कोशिश करता है, या उत्सर्जन पर और, परिणामस्वरूप, मुद्रास्फीति की दर (पी1) में वृद्धि करता है। बदले में, आर्थिक एजेंट अपनी मुद्रास्फीति अपेक्षाओं के आधार पर कार्य करता है (अपने उत्पादों के लिए कीमतें निर्धारित करता है, वस्तुओं और सेवाओं की खरीद पर निर्णय लेता है, आदि), जिसे अपनाई गई नीति के परिणामस्वरूप या तो पुष्टि की जा सकती है या पुष्टि नहीं की जा सकती है। सेंट्रल बैंक. यदि p1 > पुनः है, तो सेंट्रल बैंक को सिग्नियोरेज और मुद्रास्फीति कर से लाभ प्राप्त होता है। यदि पीई = पी1, तो केंद्रीय बैंक को सिग्नियोरेज से राजस्व में कमी के कारण नुकसान होता है, और आर्थिक एजेंटों को मुद्रास्फीति कर का खामियाजा भुगतना पड़ता है। यदि pe = p0, तो यथास्थिति बनी रहती है और कोई भी हारा नहीं है। अंत में, यदि pe > p0, तो केवल आर्थिक एजेंटों को नुकसान होता है: उत्पादक - उन उत्पादों की मांग में कमी के कारण जो अनुचित रूप से अधिक महंगे हो गए हैं, उपभोक्ता - अनुचित भंडार के निर्माण के कारण।

प्रस्तावित मॉडल में, एकल इंटरैक्शन के दौरान, एजेंटों के पास प्रमुख रणनीतियाँ नहीं होती हैं, और कोई नैश संतुलन नहीं होता है। जब बातचीत कई बार दोहराई जाती है, और यह वास्तव में इस तरह की बातचीत है जो वास्तविक स्थितियों के लिए विशिष्ट है, तो दोनों प्रतिभागी अपने निपटान में दोनों रणनीतियों का उपयोग कर सकते हैं। क्या किसी विशेष क्रम में वैकल्पिक रणनीतियाँ खिलाड़ियों को उनकी उपयोगिता को अधिकतम करने की अनुमति देती हैं, अर्थात, एक मिश्रित रणनीति नैश संतुलन प्राप्त करने के लिए: एक ऐसा परिणाम जिसमें कोई भी खिलाड़ी अपनी रणनीति को एकतरफा बदलकर अपना भुगतान नहीं बढ़ा सकता है? आइए मान लें कि सेंट्रल बैंक संभाव्यता P1 (मामलों के P1% में) के साथ एक सख्त मौद्रिक नीति अपनाता है, और संभाव्यता (1 - P1) के साथ मुद्रास्फीति नीति अपनाता है। फिर, जब कोई आर्थिक एजेंट गैर-मुद्रास्फीति संबंधी अपेक्षाओं (पीई = पी0) को चुनता है, तो सेंट्रल बैंक बराबर लाभ प्राप्त करने की उम्मीद कर सकता है

सिद्धांत खेल रणनीति

ईयू(सीबी) = पी1 0+,

1 (1 - पी1) = 1- -पी1

आर्थिक एजेंट की मुद्रास्फीति संबंधी अपेक्षाओं के मामले में, केंद्रीय बैंक को लाभ होगा

ईयू(सीबी) = पी10 + (1 - पी1)(-2) = 2पी1 - 2।

अब मान लेते हैं कि एक आर्थिक एजेंट की संभाव्यता P2 (मामलों के P2% में) के साथ गैर-मुद्रास्फीति संबंधी अपेक्षाएं हैं, और संभाव्यता (1 - P2) के साथ मुद्रास्फीति संबंधी अपेक्षाएं हैं। अतः केन्द्रीय बैंक की अपेक्षित उपयोगिता होगी

EU(CB) = Р2(1 - Р1) + (1 - Р2)(2Р1-2) = =ЗР2-ЗР1 Р2+2Р1 - 2 (चित्र 5)।

चित्र 5

एक आर्थिक एजेंट के लिए भी ऐसी ही गणना दी जाएगी

EU (e.a.) = P1(P2- 1) + (1 - P1)(-P2-2) = 2P1P2 + P1- P2-2.

यदि हम इन भावों को निम्नलिखित रूप में पुनः लिखें

ईयू(सीबी) = पीएल(2-3पी2) + ЗР2-2

EU(e.a.)= =P2(2P1-1) +P1-2,

फिर यह देखना आसान है कि कब

सेंट्रल बैंक की जीत उसकी अपनी नीति और कब पर निर्भर नहीं करती

आर्थिक एजेंट का लाभ उसकी अपेक्षाओं पर निर्भर नहीं करता है।

दूसरे शब्दों में, मिश्रित रणनीतियों में नैश संतुलन 2/3 मामलों में आर्थिक एजेंट द्वारा गैर-मुद्रास्फीति संबंधी अपेक्षाओं का गठन और आधे मामलों में सेंट्रल बैंक द्वारा एक सख्त मौद्रिक नीति का कार्यान्वयन होगा। पाया गया संतुलन प्राप्त करने योग्य है बशर्ते कि आर्थिक एजेंट तर्कसंगत तरीके से उम्मीदें बनाते हैं, न कि पिछली अवधि में मुद्रास्फीति की उम्मीदों के आधार पर, पिछली अवधि की पूर्वानुमान त्रुटि के लिए समायोजित। नतीजतन, सेंट्रल बैंक की नीति में बदलाव आर्थिक एजेंटों के व्यवहार को केवल उस हद तक प्रभावित करते हैं, जब वे अप्रत्याशित और अप्रत्याशित होते हैं। 50% मामलों में सख्त और 50% मामलों में नरम मौद्रिक नीति अपनाने की सेंट्रल बैंक की रणनीति अप्रत्याशितता का माहौल बनाने के साथ पूरी तरह से सुसंगत है।

2. विकासवादी-स्थिर रणनीति। एक विकासात्मक रूप से स्थिर रणनीति एक ऐसी रणनीति है जिसका उपयोग यदि अधिकांश व्यक्तियों द्वारा किया जाता है, तो कोई भी वैकल्पिक रणनीति किसी तंत्र के माध्यम से इसका स्थान नहीं ले सकती है प्राकृतिक चयन, भले ही बाद वाला अधिक पेरेटो कुशल हो।

एक प्रकार के दोहराए जाने वाले खेल ऐसी स्थितियाँ हैं जब कोई व्यक्ति बार-बार खुद को पसंद की एक निश्चित स्थिति में पाता है, लेकिन उसका प्रतिपक्ष स्थिर नहीं होता है, और प्रत्येक अवधि में व्यक्ति एक नए समकक्ष के साथ बातचीत करता है। इसलिए, किसी प्रतिपक्ष द्वारा एक या दूसरी रणनीति चुनने की संभावना मिश्रित रणनीति के विन्यास पर नहीं, बल्कि प्रत्येक प्रतिपक्ष की प्राथमिकताओं पर निर्भर करेगी। विशेष रूप से, यह माना जाता है कि से कुल गणनाएन संभावित समकक्ष एन (एन/एन%) हमेशा रणनीति ए चुनते हैं, और एम (एम/एन%) हमेशा रणनीति बी चुनते हैं। यह एक नए प्रकार के संतुलन, विकासवादी रूप से स्थिर रणनीतियों को प्राप्त करने के लिए आवश्यक शर्तें बनाता है। एक विकासवादी स्थिर रणनीति (ESS - Evolutionary Stable Strategy) वह रणनीति बन जाती है जिसमें यदि एक निश्चित जनसंख्या के सभी सदस्य इसका उपयोग करते हैं, तो कोई भी वैकल्पिक रणनीति प्राकृतिक चयन के तंत्र के माध्यम से इसे विस्थापित नहीं कर सकती है। आइए एक उदाहरण के रूप में समन्वय समस्या के सबसे सरल संस्करण पर विचार करें: दो कारें एक संकरी सड़क से गुजर रही हैं। यह माना जाता है कि किसी दिए गए क्षेत्र में, बाएँ और दाएँ हाथ के यातायात मानक समान हैं (या कि सड़क के नियमों का हमेशा पालन नहीं किया जाता है)। कार A कई कारों की ओर बढ़ रही है जिनसे उसे गुजरना है। यदि दोनों कारें यात्रा की दिशा में सड़क के बाईं ओर चलते हुए बाईं ओर मुड़ जाती हैं, तो वे बिना किसी समस्या के गुजर जाती हैं। यदि दोनों कारों को दाहिनी ओर ले जाया जाए तो भी यही होता है। जब एक कार दाईं ओर मुड़ती है, और दूसरी बाईं ओर और इसके विपरीत, तो वे एक-दूसरे को पार नहीं कर पाएंगे (चित्र 6)।

चित्र 6

तो, मोटर चालक ए को मोटर चालकों बी का अनुमानित प्रतिशत पता है जो व्यवस्थित रूप से बाएं मुड़ते हैं (पी) और मोटर चालक बी का प्रतिशत जो दाएं मुड़ते हैं (1 - पी)। मोटर चालक ए के लिए क्रमिक रूप से स्थिर होने के लिए "सही लें" रणनीति की स्थिति इस प्रकार तैयार की गई है: ईयू (दाएं) > ईयू (बाएं), या

0पी+ 1(1 - पी) > 1पी+ 0(1 - पी),

आर कहां से आता है< 1/2. Таким образом, при превышении доли автомобилистов во встречном потоке, принимающих вправо, уровня 50% эволюционно-стабильной стратегией становится «принять вправо» -- сворачивать на правую обочину при каждом разъезде.

में सामान्य रूप से देखेंविकासात्मक रूप से स्थिर रणनीति की आवश्यकताएँ इस प्रकार लिखी गई हैं। संभावना पी के साथ समकक्षों द्वारा उपयोग की जाने वाली रणनीति I, खिलाड़ी के लिए क्रमिक रूप से स्थिर है यदि और केवल यदि निम्नलिखित शर्तें पूरी होती हैं

ईयू(आई, पी) > ईयू(जे, पी),

जो समान है

pU(I, I) + (l -p)U(I,J)>pU(J,I) + (1 - p)U(J,J) (3)

जो होता है:

यू(आई, आई)> यू(जे, आई)

यू(आई, आई) = यू(जे, आई)

यू(आई, जे) > यू(जे, जे),

जहां - यू (आई, आई) रणनीति I चुनते समय खिलाड़ी का भुगतान, यदि प्रतिपक्ष रणनीति I चुनता है; यू (जे, आई) - रणनीति जे चुनते समय खिलाड़ी का भुगतान, यदि प्रतिपक्ष रणनीति I चुनता है, आदि।

चित्र 7

आप इन स्थितियों को चित्रमय रूप में भी प्रस्तुत कर सकते हैं। आइए हम ऊर्ध्वाधर अक्ष के साथ एक रणनीति या किसी अन्य को चुनने की अपेक्षित उपयोगिता और क्षैतिज अक्ष के साथ दोनों रणनीतियों को चुनने वाले खिलाड़ियों की कुल आबादी में व्यक्तियों के अनुपात की योजना बनाएं। फिर हमें निम्नलिखित ग्राफ मिलता है (गुजरती हुई दो कारों के मॉडल से लिया गया मान), चित्र में दिखाया गया है। 7.

आंकड़े से यह पता चलता है कि "बाएं ले जाएं" और "दाएं ले जाएं" दोनों के विकासवादी रूप से स्थिर रणनीति बनने की समान संभावना है, जब तक कि उनमें से कोई भी ड्राइवरों की "आबादी" के आधे से अधिक को कवर नहीं करता है। यदि कोई रणनीति इस सीमा को पार कर जाती है, तो यह धीरे-धीरे लेकिन अनिवार्य रूप से दूसरी रणनीति को विस्थापित कर देगी और ड्राइवरों की पूरी आबादी को कवर कर लेगी। तथ्य यह है कि यदि रणनीति 50% का आंकड़ा पार कर जाती है, तो किसी भी ड्राइवर के लिए युद्धाभ्यास में इसका उपयोग करना लाभदायक हो जाता है, जो बदले में, अन्य ड्राइवरों के लिए इस रणनीति के आकर्षण को और बढ़ा देता है। सख्त रूप में, यह कथन इस तरह दिखेगा:

डीपी/डीटी = जी , जी">0 (4)

बार-बार खेले जाने वाले खेलों के विश्लेषण का मुख्य परिणाम संतुलन बिंदुओं की संख्या में वृद्धि और इसके आधार पर समन्वय, सहयोग, अनुकूलता और निष्पक्षता की समस्याओं का समाधान है। कैदियों की दुविधा में भी, बार-बार बातचीत करने के लिए संक्रमण हमें तर्कसंगतता के मानदंड और खिलाड़ियों के बीच जानकारी के आदान-प्रदान पर प्रतिबंध से परे जाने के बिना, पेरेटो इष्टतम परिणाम ("अपराध से इनकार") प्राप्त करने की अनुमति देता है। यह बिल्कुल "सामान्य प्रमेय" का अर्थ है: कोई भी परिणाम जो व्यक्तिगत रूप से व्यक्ति के लिए उपयुक्त हो, दोहराए गए खेल की संरचना में जाने पर संतुलन बन सकता है। कैदियों की दुविधा की स्थिति में, कुछ शर्तों के तहत संतुलन का परिणाम या तो एक सरल "पहचान नहीं" रणनीति या कई मिश्रित रणनीतियाँ हो सकती है। मिश्रित और विकासवादी रणनीतियों के बीच, हम निम्नलिखित पर ध्यान देते हैं: टिट-फॉर-टू-टैट्स - अपराध से इनकार करने के साथ शुरू करें और केवल तभी अपराध स्वीकार करें जब प्रतिपक्ष ने लगातार दो पिछली अवधियों में अपराध स्वीकार किया हो; डाउइंग एक रणनीति है जो इस धारणा पर आधारित है कि खेल की शुरुआत में प्रतिपक्षी द्वारा "अपराध से इनकार करें" और "स्वीकार करें" रणनीतियों का उपयोग करने की समान संभावना है। इसके अलावा, प्रतिपक्ष की ओर से अपराध के प्रत्येक इनकार को प्रोत्साहित किया जाता है, और प्रत्येक प्रवेश को अगली अवधि में "अपराध स्वीकार करें" रणनीति चुनकर दंडित किया जाता है; परीक्षक - अपराध स्वीकार करने से शुरुआत करें, और यदि प्रतिपक्ष भी अपराध स्वीकार करता है, तो अगली अवधि में अपराध से इनकार करें।

निष्कर्ष

निष्कर्ष में, आधुनिक आर्थिक परिस्थितियों में गेम थ्योरी का उपयोग करने की आवश्यकता के बारे में निबंध का निष्कर्ष निकाला जा सकता है।

विकल्प (पसंद) की स्थितियों में, निर्णय लेना और एक या दूसरी रणनीति चुनना अक्सर आसान नहीं होता है। संचालन अनुसंधान उपयुक्त के उपयोग के माध्यम से अनुमति देता है गणितीय तरीकेकिसी विशेष रणनीति की उपयुक्तता के बारे में सोच-समझकर निर्णय लें। गेम थ्योरी, जिसमें मैट्रिक्स गेम को हल करने के तरीकों का एक शस्त्रागार है, आपको कई तरीकों का उपयोग करके इन समस्याओं को प्रभावी ढंग से हल करने और उनमें से सबसे प्रभावी लोगों का चयन करने की अनुमति देता है, साथ ही प्रारंभिक गेम मैट्रिक्स को सरल बनाता है।

निबंध ने गेम थ्योरी की बुनियादी रणनीतियों के व्यावहारिक अनुप्रयोग को चित्रित किया और सबसे अधिक उपयोग की जाने वाली और अक्सर लागू की जाने वाली रणनीतियों और बुनियादी अवधारणाओं का अध्ययन करते हुए उचित निष्कर्ष निकाले।

प्रयुक्त संदर्भों की सूची

1. पेट्रोसियन एल.ए., ज़ेनकेविच एन.ए., शेवकोप्लायस ई.वी.: गेम थ्योरी: पाठ्यपुस्तक। प्रकाशक: बीएचवी, 2012.-212 पी।

2. लैबस्कर एल.जी., यशचेंको एन.ए.: अर्थशास्त्र में गेम थ्योरी। समस्या समाधान के साथ कार्यशाला. ट्यूटोरियल। प्रकाशक: नॉरस, 2014.-125 पी।

3. नेलबफ, दीक्षित: गेम थ्योरी। व्यवसाय और जीवन में रणनीतिक सोच की कला। प्रकाशक: मान, इवानोव और फ़ेबर, 2015 .- 99 पी।

4. ओलेनिक ए.एन. संस्थागत अर्थशास्त्र। पाठ्यपुस्तक, मॉस्को इंफ्रा-एम, 2013.-78पी।

5. प्रोतासोव आई.डी. खेल सिद्धांत और संचालन अनुसंधान: पाठ्यपुस्तक। भत्ता. - एम.: हेलिओस एआरवी, 2013.-100 पी।

6. समरोव के.एल. अंक शास्त्र। "गेम थ्योरी के तत्व", एलएलसी "रिज़ॉल्वेंटा", 2011.-211 पी अनुभाग के लिए शैक्षिक और पद्धति संबंधी मैनुअल।

7. शिकिन ई.वी. प्रबंधन में गणितीय तरीके और मॉडल: पाठ्यपुस्तक। पूर्व छात्रों के लिए मैनुअल। विशेषज्ञ. विश्वविद्यालयों - एम.: डेलो, 2014.-201 पी।

Allbest.ru पर पोस्ट किया गया

...

समान दस्तावेज़

    मानव जीवन की विभिन्न परिस्थितियाँ और क्षेत्र जिनमें गेम थ्योरी लागू होती है। आधुनिक आर्थिक परिस्थितियों में गेम थ्योरी का उपयोग करने की आवश्यकता। गेम थ्योरी का प्रयोग कर संस्थाओं की आवश्यकता सिद्ध करना। विकासवादी स्थिर रणनीति.

    पाठ्यक्रम कार्य, 11/28/2013 को जोड़ा गया

    खेलों के सार की विशेषताएं - ऐसी स्थितियाँ जिनमें कई विषय होते हैं जो जानते हैं कि उनके कार्य अन्य विषयों के व्यवहार को प्रभावित करते हैं। खेल सिद्धांत के लक्ष्य. खिलाड़ियों के तर्कसंगत व्यवहार के लिए सिफारिशों का विकास, इष्टतम रणनीति का निर्धारण।

    प्रस्तुति, 03/31/2011 को जोड़ा गया

    लिखित अंतर्राष्ट्रीय व्यापारहेक्शर-ओहलिन। सैमुएलसन का कारक मूल्य समकारी प्रमेय। "उत्पाद जीवन चक्र" का सिद्धांत। माइकल पोर्टर का सिद्धांत: प्रतिस्पर्धात्मक लाभ का एक सिद्धांत। सेवा उत्पादन के अंतर्राष्ट्रीयकरण का एक उदार सिद्धांत।

    परीक्षण, 05/12/2009 को जोड़ा गया

    समष्टि अर्थशास्त्र। उपभोग का सिद्धांत. सिद्धांत का औचित्य. उपभोग के वस्तुनिष्ठ और व्यक्तिपरक कारक। उपभोग का कीनेसियन सिद्धांत. उपभोग फलन की ग्राफिक व्याख्या। वस्तुओं और सेवाओं के लिए मांग उत्पन्न करना।

    परीक्षण, 06/23/2007 जोड़ा गया

    कीनेसियन और मुद्रावादी सिद्धांतों का विचलन। में आंतरिक स्थिरता बाजार अर्थव्यवस्था. वित्तीय नीति का प्रभाव और अर्थव्यवस्था में धन की भूमिका। वस्तुओं और सेवाओं की कीमतों में परिवर्तन। धन संचलन की गति का निर्धारण. धन का मात्रा सिद्धांत.

    परीक्षण, 01/16/2011 जोड़ा गया

    अंतर्राष्ट्रीय व्यापार की अवधारणा. अंतर्राष्ट्रीय व्यापार का शास्त्रीय सिद्धांत। तुलनात्मक लाभ का सिद्धांत. अंतर्राष्ट्रीय व्यापार का व्यापारीवादी सिद्धांत। पूर्ण लाभ का सिद्धांत. हेक्सचर का सिद्धांत - ओहलिन - सैमुएलसन। लियोन्टीव का सिद्धांत.

    सार, 01/16/2008 जोड़ा गया

    आर्थिक सिद्धांत का उद्भव. एक विज्ञान के रूप में आर्थिक इतिहास। आर्थिक सिद्धांत का विषय और विधि। आर्थिक सिद्धांत मौलिक रूप से अनुभवजन्य विज्ञान है, अर्थात यह वास्तविक जीवन के तथ्यों पर आधारित है। आर्थिक सिद्धांत: कार्य, अनुसंधान विधियाँ।

    पाठ्यक्रम कार्य, 12/16/2003 जोड़ा गया

    विभिन्न ऐतिहासिक युगों में पैदा हुए घरेलू और विदेशी अर्थशास्त्रियों के विभिन्न प्रकार के आर्थिक सिद्धांत, प्रत्येक सिद्धांत के पक्ष और विपक्ष। मानव आर्थिक सोच के विकास के चरण। आर्थिक सिद्धांत के विकास की विशेषताएं।

    परीक्षण, 12/22/2009 जोड़ा गया

    श्रम की अवधारणा, इसका सार और विशेषताएं, मनुष्य के विकास में इसकी भूमिका और अर्थव्यवस्था में इसका स्थान। आधुनिक आर्थिक सिद्धांत में मनुष्य का स्थान. आर्थिक प्रणालियाँ, उनकी किस्में और पसंद का समन्वय। सूक्ष्मअर्थशास्त्र के अध्ययन का विषय और तरीके।

    व्याख्यान का पाठ्यक्रम, 02/10/2009 जोड़ा गया

    आर्थिक संबंधों की प्रणाली में एक उपभोक्ता, निर्माता, प्रबंधक के रूप में मनुष्य। अर्थशास्त्र में मानव व्यवहार के अध्ययन के लिए आर्थिक, मनोवैज्ञानिक और समाजशास्त्रीय दृष्टिकोण की तुलना। आर्थिक सिद्धांत में मानव मॉडल की विविधता।

खेल सिद्धांत - संघर्ष स्थितियों (हितों के टकराव) को हल करने के लिए गणितीय तरीकों का एक सेट। गेम थ्योरी में गेम कहा जाता है संघर्ष की स्थिति का गणितीय मॉडल। खेल सिद्धांत में विशेष रुचि का विषय अनिश्चितता की स्थिति में खेल प्रतिभागियों की निर्णय लेने की रणनीतियों का अध्ययन है। अनिश्चितता इस तथ्य से उत्पन्न होती है कि दो या दो से अधिक पार्टियाँ विरोधी लक्ष्यों का पीछा करती हैं, और प्रत्येक पार्टी की किसी भी कार्रवाई का परिणाम साझेदार की चाल पर निर्भर करता है। साथ ही, प्रत्येक पक्ष इष्टतम निर्णय लेने का प्रयास करता है जो निर्धारित लक्ष्यों को अधिकतम सीमा तक साकार करता है।

गेम थ्योरी को अर्थशास्त्र में सबसे अधिक लगातार लागू किया जाता है, जहां संघर्ष की स्थिति उत्पन्न होती है, उदाहरण के लिए, आपूर्तिकर्ता और उपभोक्ता, खरीदार और विक्रेता, बैंक और ग्राहक के बीच संबंधों में। गेम थ्योरी का अनुप्रयोग राजनीति, समाजशास्त्र, जीव विज्ञान और सैन्य कला में भी पाया जा सकता है।

गेम थ्योरी के इतिहास से

गेम थ्योरी का इतिहास एक स्वतंत्र अनुशासन के रूप में 1944 में शुरुआत हुई, जब जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने "द थ्योरी ऑफ गेम्स एंड इकोनॉमिक बिहेवियर" पुस्तक प्रकाशित की। हालाँकि गेम थ्योरी के उदाहरण पहले भी सामने आ चुके हैं: मृत पति की संपत्ति को उसकी पत्नियों के बीच बांटने पर बेबीलोनियाई तल्मूड का ग्रंथ, 18वीं सदी में कार्ड गेम, 20वीं सदी की शुरुआत में शतरंज के सिद्धांत का विकास सदी, 1928 वर्ष में उसी जॉन वॉन न्यूमैन के मिनिमैक्स प्रमेय का प्रमाण, जिसके बिना कोई खेल सिद्धांत नहीं होता।

20वीं सदी के 50 के दशक में मेल्विन ड्रेशर और मेरिल फ्लड से रैंड कॉर्पोरेशनकैदी की दुविधा को प्रयोगात्मक रूप से लागू करने वाले पहले व्यक्ति जॉन नैश ने दो-व्यक्ति खेलों में संतुलन की स्थिति पर अपने कार्यों में नैश संतुलन की अवधारणा विकसित की।

1965 में, रेइनहार्ड साल्टेन ने "द ट्रीटमेंट ऑफ ओलिगोपॉली इन गेम थ्योरी ऑन डिमांड" ("स्पीलथियोरेटिस बेहैंडलुंग ईन्स ओलिगोमोडेल्स मिट नचफ्रागेट्राघेइट") नामक पुस्तक प्रकाशित की, जिसके साथ अर्थशास्त्र में गेम थ्योरी के अनुप्रयोग को एक नया रूप मिला। प्रेरक शक्ति. गेम थ्योरी के विकास में एक कदम आगे जॉन मेनार्ड स्मिथ के काम, "इवोल्यूशनरी स्टेबल स्ट्रैटेजी" (1974) से जुड़ा है। कैदी की दुविधा को रॉबर्ट एक्सेलरोड की 1984 की पुस्तक द इवोल्यूशन ऑफ कोऑपरेशन में लोकप्रिय बनाया गया था। 1994 में, जॉन नैश, जॉन हरसैनी और रेनहार्ड सेल्टेन को गेम थ्योरी में उनके योगदान के लिए नोबेल पुरस्कार से सम्मानित किया गया था।

जीवन और व्यवसाय में खेल सिद्धांत

आइए हम संघर्ष की स्थिति (हितों के टकराव) के सार पर अधिक विस्तार से ध्यान दें, जैसा कि आगे के मॉडलिंग के लिए गेम थ्योरी में समझा जाता है। विभिन्न स्थितियाँजीवन और व्यवसाय में. मान लीजिए कि एक व्यक्ति ऐसी स्थिति में है जो कई संभावित परिणामों में से एक की ओर ले जाता है, और इन परिणामों के संबंध में व्यक्ति की कुछ व्यक्तिगत प्राथमिकताएँ होती हैं। हालाँकि, वह कुछ हद तक उन चरों को नियंत्रित कर सकता है जो परिणाम निर्धारित करते हैं, लेकिन उसके पास उन पर पूर्ण शक्ति नहीं है। कभी-कभी नियंत्रण कई व्यक्तियों के हाथों में होता है, जिनकी, उनकी तरह, संभावित परिणामों के संबंध में कुछ प्राथमिकताएँ होती हैं, लेकिन सामान्य तौर पर इन व्यक्तियों के हित सुसंगत नहीं होते हैं। अन्य मामलों में, अंतिम परिणाम संयोग (जिसे कानूनी विज्ञान में कभी-कभी कहा जाता है) दोनों पर निर्भर हो सकता है प्राकृतिक आपदाएं), और अन्य व्यक्तियों से। गेम थ्योरी ऐसी स्थितियों के अवलोकन को व्यवस्थित करती है और ऐसी स्थितियों में बुद्धिमान कार्यों का मार्गदर्शन करने के लिए सामान्य सिद्धांतों का निर्माण करती है।

कुछ मायनों में, "गेम थ्योरी" नाम दुर्भाग्यपूर्ण है, क्योंकि यह बताता है कि गेम थ्योरी केवल पार्लर गेम में होने वाले सामाजिक रूप से महत्वहीन मुठभेड़ों से संबंधित है, लेकिन फिर भी सिद्धांत का बहुत व्यापक अर्थ है।

निम्नलिखित आर्थिक स्थिति गेम थ्योरी के अनुप्रयोग का अंदाजा दे सकती है। मान लीजिए कि कई उद्यमी हैं, जिनमें से प्रत्येक अधिकतम लाभ प्राप्त करने का प्रयास करता है, जबकि इस लाभ को निर्धारित करने वाले चर पर केवल सीमित शक्ति होती है। एक उद्यमी के पास उन चरों पर कोई शक्ति नहीं होती है जिन्हें दूसरा उद्यमी नियंत्रित करता है, लेकिन जो पहले की आय को बहुत प्रभावित कर सकते हैं। इस स्थिति को एक खेल के रूप में मानने से निम्नलिखित आपत्ति उत्पन्न हो सकती है। गेम मॉडल में, यह माना जाता है कि प्रत्येक उद्यमी संभावित विकल्पों की श्रेणी में से और इनके साथ एक विकल्प चुनता है एकल चुनावमुनाफ़ा तय होता है. जाहिर है, वास्तविकता में ऐसा लगभग नहीं हो सकता है, क्योंकि इस मामले में उद्योग में जटिल प्रबंधन तंत्र की आवश्यकता नहीं होगी। इन निर्णयों में बस कई निर्णय और संशोधन होते हैं जो अन्य प्रतिभागियों द्वारा चुने गए विकल्पों पर निर्भर करते हैं आर्थिक प्रणाली(खिलाड़ियों द्वारा)। लेकिन सिद्धांत रूप में कोई यह कल्पना कर सकता है कि कोई प्रशासक प्रत्येक समस्या के उत्पन्न होने पर उसे हल करने के बजाय सभी संभावित आकस्मिकताओं का अनुमान लगाता है और प्रत्येक मामले में की जाने वाली कार्रवाई का विवरण देता है।

परिभाषा के अनुसार, एक सैन्य संघर्ष, हितों का टकराव है जिसमें किसी भी पक्ष का परिणाम निर्धारित करने वाले चर पर पूर्ण नियंत्रण नहीं होता है, जो लड़ाई की एक श्रृंखला द्वारा तय किया जाता है। आप परिणाम को आसानी से जीत या हार मान सकते हैं और उन्हें संख्यात्मक मान 1 और 0 निर्दिष्ट कर सकते हैं।

सबसे सरल संघर्ष स्थितियों में से एक, जिसे गेम थ्योरी में लिखा और हल किया जा सकता है, एक द्वंद्व है, जो क्रमशः दो खिलाड़ियों 1 और 2 के बीच का संघर्ष है। पीऔर क्यूशॉट्स. प्रत्येक खिलाड़ी के लिए एक फ़ंक्शन होता है जो खिलाड़ी के शॉट की संभावना को दर्शाता है मैंएक समय में टीऐसा प्रहार करेगा जो घातक होगा।

परिणामस्वरूप, खेल सिद्धांत हितों के टकराव के एक निश्चित वर्ग के निम्नलिखित सूत्रीकरण पर आता है: वहाँ हैं एनखिलाड़ियों को, और प्रत्येक को सौ विशिष्ट सेटों में से एक विकल्प चुनने की आवश्यकता होती है, और विकल्प चुनते समय, खिलाड़ी को अन्य खिलाड़ियों की पसंद के बारे में कोई जानकारी नहीं होती है। खिलाड़ी के संभावित चयन क्षेत्र में "हुकुम का इक्का चलाना", "कारों के बजाय टैंक बनाना", या जैसे तत्व शामिल हो सकते हैं सामान्य अर्थ में, एक रणनीति जो उन सभी कार्रवाइयों को परिभाषित करती है जिन्हें सभी संभावित परिस्थितियों में उठाए जाने की आवश्यकता है। प्रत्येक खिलाड़ी को एक कार्य का सामना करना पड़ता है: उसे क्या विकल्प चुनना चाहिए ताकि परिणाम पर उसका निजी प्रभाव उसे सबसे बड़ी संभावित जीत दिला सके?

खेल सिद्धांत में गणितीय मॉडल और समस्याओं का औपचारिकीकरण

जैसा कि हम पहले ही नोट कर चुके हैं, खेल संघर्ष की स्थिति का एक गणितीय मॉडल है और निम्नलिखित घटकों की आवश्यकता है:

  1. इच्छुक पार्टियाँ;
  2. प्रत्येक पक्ष पर संभावित कार्रवाई;
  3. पार्टियों के हित.

खेल में रुचि रखने वाले पक्षों को खिलाड़ी कहा जाता है , उनमें से प्रत्येक कम से कम दो कार्रवाई कर सकता है (यदि खिलाड़ी के पास अपने निपटान में केवल एक ही कार्रवाई है, तो वह वास्तव में खेल में भाग नहीं लेता है, क्योंकि यह पहले से ज्ञात है कि वह क्या करेगा)। खेल के परिणाम को जीत कहा जाता है .

वास्तविक संघर्ष की स्थिति हमेशा नहीं होती, लेकिन खेल (गेम थ्योरी की अवधारणा में) हमेशा उसी के अनुसार आगे बढ़ता है निश्चित नियम , जो सटीक रूप से निर्धारित करता है:

  1. खिलाड़ियों के कार्यों के लिए विकल्प;
  2. प्रत्येक खिलाड़ी के पास अपने साथी के व्यवहार के बारे में कितनी जानकारी है;
  3. कार्यों के प्रत्येक सेट से मिलने वाला प्रतिफल।

औपचारिक खेलों के उदाहरणों में फुटबॉल, कार्ड खेल, शतरंज।

लेकिन अर्थशास्त्र में, खिलाड़ी के व्यवहार का एक मॉडल उभरता है, उदाहरण के लिए, जब कई कंपनियां बाजार में अधिक लाभप्रद स्थान लेने का प्रयास करती हैं, तो कई व्यक्ति कुछ अच्छे (संसाधन, वित्त) को आपस में बांटने की कोशिश करते हैं ताकि हर किसी को जितना संभव हो सके उतना मिल सके। . अर्थव्यवस्था में संघर्ष की स्थितियों में खिलाड़ी, जिन्हें एक खेल के रूप में तैयार किया जा सकता है, कंपनियां, बैंक, व्यक्ति और अन्य आर्थिक एजेंट हैं। बदले में, युद्ध की स्थिति में, गेम मॉडल का उपयोग किया जाता है, उदाहरण के लिए, अधिक चुनने में सर्वोत्तम हथियार(मौजूदा या संभावित से) दुश्मन को हराने या हमले से बचाने के लिए।

खेल की विशेषता परिणाम की अनिश्चितता है . अनिश्चितता के कारणों को निम्नलिखित समूहों में विभाजित किया जा सकता है:

  1. संयोजक (शतरंज के रूप में);
  2. यादृच्छिक कारकों का प्रभाव (जैसे खेल "हेड्स या टेल्स", पासा, कार्ड गेम में);
  3. रणनीतिक (खिलाड़ी को नहीं पता कि दुश्मन क्या कार्रवाई करेगा)।

खिलाड़ी की रणनीति नियमों का एक समूह है जो वर्तमान स्थिति के आधार पर प्रत्येक कदम पर उसके कार्यों को निर्धारित करता है।

गेम थ्योरी का उद्देश्य प्रत्येक खिलाड़ी के लिए इष्टतम रणनीति निर्धारित करना है। ऐसी रणनीति निर्धारित करने का अर्थ है खेल को हल करना। रणनीति की इष्टतमता यह तब प्राप्त होता है जब एक खिलाड़ी को अधिकतम जीत हासिल करनी चाहिए, जबकि दूसरा अपनी रणनीति पर कायम रहता है। और यदि पहला खिलाड़ी अपनी रणनीति पर अड़ा रहता है तो दूसरे खिलाड़ी को कम से कम नुकसान होना चाहिए।

खेलों का वर्गीकरण

  1. खिलाड़ियों की संख्या के आधार पर वर्गीकरण (दो या दो से अधिक व्यक्तियों का खेल). दो-व्यक्ति गेम सभी गेम थ्योरी में एक केंद्रीय स्थान रखते हैं। दो-व्यक्ति खेलों के लिए गेम थ्योरी की मूल अवधारणा संतुलन के बहुत महत्वपूर्ण विचार का सामान्यीकरण है जो स्वाभाविक रूप से दो-व्यक्ति खेलों में प्रकट होता है। जहाँ तक खेलों का सवाल है एनव्यक्तियों, तो खेल सिद्धांत का एक हिस्सा उन खेलों के लिए समर्पित है जिनमें खिलाड़ियों के बीच सहयोग निषिद्ध है। गेम थ्योरी के दूसरे भाग में एनव्यक्तियों का मानना ​​है कि खिलाड़ी आपसी लाभ के लिए सहयोग कर सकते हैं (गैर-सहकारी और सहकारी खेलों पर इस पैराग्राफ में बाद में देखें)।
  2. खिलाड़ियों की संख्या और उनकी रणनीतियों के आधार पर वर्गीकरण (रणनीतियों की संख्या कम से कम दो है, अनंत हो सकती है)।
  3. जानकारी की मात्रा के आधार पर वर्गीकरण पिछली चालों के सापेक्ष: पूरी जानकारी और अधूरी जानकारी वाले खेल। माना कि खिलाड़ी 1 - खरीदार और खिलाड़ी 2 - विक्रेता हैं। यदि खिलाड़ी 1 को खिलाड़ी 2 के कार्यों के बारे में पूरी जानकारी नहीं है, तो खिलाड़ी 1 उन दो विकल्पों के बीच अंतर नहीं कर सकता है जिनके बीच उसे चुनाव करना होगा। उदाहरण के लिए, किसी उत्पाद के दो प्रकारों के बीच चयन करना और यह न जानना कि, कुछ विशेषताओं के अनुसार, उत्पाद क्या है बदतर उत्पाद बी, खिलाड़ी 1 को विकल्पों के बीच अंतर दिखाई नहीं दे सकता है।
  4. जीत के विभाजन के सिद्धांतों के अनुसार वर्गीकरण : एक तरफ सहयोगात्मक, गठबंधन और दूसरी तरफ असहयोगी, गैर-गठबंधन। में असहयोगी खेल , या अन्यथा - असहयोगी खेल , खिलाड़ी यह जाने बिना कि दूसरा खिलाड़ी कौन सी रणनीति चुनेगा, एक साथ रणनीतियाँ चुनते हैं। खिलाड़ियों के बीच संचार असंभव है. में सहकारी खेल , या अन्यथा - गठबंधन का खेल , खिलाड़ी गठबंधन बना सकते हैं और अपनी जीत बढ़ाने के लिए सामूहिक कार्रवाई कर सकते हैं।
  5. परिमित दो-व्यक्ति शून्य-राशि खेल या विरोधी खेल संपूर्ण जानकारी वाला एक रणनीतिक खेल है, जिसमें विरोधी हितों वाले पक्ष शामिल होते हैं। विरोधी खेल हैं मैट्रिक्स खेल .

गेम थ्योरी का एक उत्कृष्ट उदाहरण कैदी की दुविधा है।

दोनों संदिग्धों को हिरासत में ले लिया गया और एक दूसरे से अलग कर दिया गया। जिला अटॉर्नी आश्वस्त है कि उन्होंने गंभीर अपराध किया है, लेकिन मुकदमे में उन पर आरोप लगाने के लिए उनके पास पर्याप्त सबूत नहीं हैं। वह प्रत्येक कैदी से कहता है कि उसके पास दो विकल्प हैं: पुलिस जो अपराध मानती है उसे कबूल कर ले या अपराध कबूल न कर ले। यदि दोनों कबूल नहीं करते हैं, तो डीए उन पर कुछ छोटे अपराध का आरोप लगाएगा, जैसे छोटी चोरी या हथियार का अवैध कब्ज़ा, और उन दोनों को एक छोटी सजा मिलेगी। यदि वे दोनों कबूल करते हैं, तो उन पर मुकदमा चलाया जाएगा, लेकिन वह कड़ी सजा की मांग नहीं करेंगे। यदि एक कबूल करता है और दूसरा नहीं करता है, तो जिसने कबूल किया है उसे एक साथी के प्रत्यर्पण के लिए उसकी सजा कम कर दी जाएगी, जबकि जो कायम रहेगा उसे "पूरी तरह" मिलेगा।

यदि इस रणनीतिक कार्य को निष्कर्ष के रूप में तैयार किया जाता है, तो यह निम्नलिखित तक सीमित हो जाता है:

इस प्रकार, यदि दोनों कैदी कबूल नहीं करते हैं, तो उन्हें 1 वर्ष की सजा मिलेगी। यदि दोनों कबूल करते हैं, तो प्रत्येक को 8 वर्ष की सजा मिलेगी। और यदि एक कबूल करता है, और दूसरा नहीं कबूल करता है, तो जिसने कबूल किया है उसे तीन महीने की जेल होगी, और जो कबूल नहीं करेगा उसे 10 साल मिलेंगे। उपरोक्त मैट्रिक्स कैदी की दुविधा को सही ढंग से दर्शाता है: हर किसी को इस सवाल का सामना करना पड़ता है कि कबूल करना है या नहीं। जिला अटॉर्नी कैदियों को जो गेम ऑफर करता है वह है असहयोगी खेल या अन्यथा - असहयोगी खेल . यदि दोनों कैदियों को सहयोग करने का अवसर मिले (अर्थात्) खेल सहकारी होगा वरना गठबंधन का खेल ), तो दोनों कबूल नहीं करेंगे और प्रत्येक को एक वर्ष की जेल होगी।

गेम थ्योरी के गणितीय उपकरणों का उपयोग करने के उदाहरण

अब हम खेलों के सामान्य वर्गों के उदाहरणों के समाधान पर विचार करने के लिए आगे बढ़ते हैं, जिसके लिए खेल सिद्धांत में अनुसंधान और समाधान विधियां हैं।

दो व्यक्तियों के असहयोगी (गैर-सहकारी) खेल की औपचारिकता का एक उदाहरण

पिछले पैराग्राफ में, हमने पहले ही एक गैर-सहकारी (गैर-सहकारी) गेम (कैदी की दुविधा) का एक उदाहरण देखा था। आइए अपने कौशल को मजबूत करें। आर्थर कॉनन डॉयल द्वारा लिखित "द एडवेंचर्स ऑफ शेरलॉक होम्स" से प्रेरित एक क्लासिक कथानक भी इसके लिए उपयुक्त है। बेशक, कोई आपत्ति कर सकता है: उदाहरण जीवन से नहीं है, बल्कि साहित्य से है, लेकिन कॉनन डॉयल ने खुद को विज्ञान कथा लेखक के रूप में स्थापित नहीं किया है! क्लासिक इसलिए भी क्योंकि यह कार्य ऑस्कर मॉर्गनस्टर्न द्वारा पूरा किया गया था, जैसा कि हम पहले ही स्थापित कर चुके हैं, गेम थ्योरी के संस्थापकों में से एक।

उदाहरण 1।"द एडवेंचर्स ऑफ शेरलॉक होम्स" के एक अंश का संक्षिप्त सारांश दिया जाएगा। गेम थ्योरी की प्रसिद्ध अवधारणाओं के अनुसार, संघर्ष की स्थिति का एक मॉडल बनाएं और गेम को औपचारिक रूप से लिखें।

शेरलॉक होम्स का इरादा प्रोफेसर मोरियार्टी से बचने के लिए महाद्वीप (यूरोपीय) तक पहुंचने के लक्ष्य के साथ लंदन से डोवर तक यात्रा करने का है, जो उसका पीछा कर रहा है। ट्रेन में चढ़ने के बाद, उन्होंने स्टेशन के प्लेटफार्म पर प्रोफेसर मोरियार्टी को देखा। शर्लक होम्स स्वीकार करते हैं कि मोरियार्टी एक विशेष ट्रेन चुन सकते हैं और उससे आगे निकल सकते हैं। शर्लक होम्स के पास दो विकल्प हैं: डोवर की यात्रा जारी रखें या कैंटरबरी स्टेशन पर उतरें, जो उसके मार्ग पर एकमात्र मध्यवर्ती स्टेशन है। हम स्वीकार करते हैं कि उसका प्रतिद्वंद्वी होम्स की क्षमताओं को निर्धारित करने के लिए पर्याप्त बुद्धिमान है, इसलिए उसके पास वही दो विकल्प हैं। दोनों विरोधियों को ट्रेन से उतरने के लिए एक स्टेशन चुनना होगा, बिना यह जाने कि उनमें से प्रत्येक क्या निर्णय लेगा। यदि, निर्णय लेने के परिणामस्वरूप, दोनों एक ही स्टेशन पर पहुँचते हैं, तो हम निश्चित रूप से मान सकते हैं कि शर्लक होम्स को प्रोफेसर मोरियार्टी द्वारा मार दिया जाएगा। यदि शर्लक होम्स सुरक्षित रूप से डोवर पहुँच जाता है, तो वह बच जाएगा।

समाधान। कॉनन डॉयल के नायकों को हम खेल में भागीदार अर्थात खिलाड़ी मान सकते हैं। हर खिलाड़ी के लिए उपलब्ध मैं (मैं=1,2) दो शुद्ध रणनीतियाँ:

  • डोवर पर उतरें (रणनीति एसi1 ( मैं=1,2) );
  • किसी मध्यवर्ती स्टेशन पर उतरें (रणनीति) एसi2 ( मैं=1,2) )

दोनों खिलाड़ियों में से प्रत्येक कौन सी रणनीति चुनता है, इसके आधार पर जोड़ी के रूप में रणनीतियों का एक विशेष संयोजन बनाया जाएगा एस = (एस1 , एस 2 ) .

प्रत्येक संयोजन को एक घटना से जोड़ा जा सकता है - प्रोफेसर मोरियार्टी द्वारा शर्लक होम्स की हत्या के प्रयास का परिणाम। हम संभावित घटनाओं के साथ इस गेम का एक मैट्रिक्स बनाते हैं।

प्रत्येक घटना के अंतर्गत प्रोफेसर मोरियार्टी के अधिग्रहण को दर्शाने वाला एक सूचकांक है, और इसकी गणना होम्स की मुक्ति के आधार पर की जाती है। दोनों नायक एक ही समय में रणनीति चुनते हैं, बिना यह जाने कि दुश्मन क्या चुनेगा। इस प्रकार, खेल असहयोगी है क्योंकि, सबसे पहले, खिलाड़ी अलग-अलग ट्रेनों में हैं, और दूसरे, उनके हित परस्पर विरोधी हैं।

सहकारी (गठबंधन) खेल की औपचारिकता और समाधान का एक उदाहरण एनव्यक्तियों

इस बिंदु पर, व्यावहारिक भाग, यानी, एक उदाहरण समस्या को हल करने की प्रक्रिया, एक सैद्धांतिक भाग से पहले होगी, जिसमें हम सहकारी (गैर-सहकारी) खेलों को हल करने के लिए गेम सिद्धांत की अवधारणाओं से परिचित हो जाएंगे। इस कार्य के लिए, गेम थ्योरी सुझाव देती है:

  • विशिष्ट कार्य (सीधे शब्दों में कहें तो, यह खिलाड़ियों को एक गठबंधन में एकजुट करने के लाभ की भयावहता को दर्शाता है);
  • योगात्मकता की अवधारणा (मात्राओं की संपत्ति, जिसमें यह तथ्य शामिल है कि संपूर्ण वस्तु के अनुरूप मात्रा का मूल्य वस्तु के विभाजन के एक निश्चित वर्ग में उसके भागों के अनुरूप मात्राओं के मूल्यों के योग के बराबर है भागों में) और विशेषता फ़ंक्शन की सुपरएडिटिविटी (संपूर्ण वस्तु के अनुरूप मात्रा का मान उसके भागों के अनुरूप मात्राओं के मानों के योग से अधिक है)।

विशेषता फ़ंक्शन की सुपरएडिटिविटी से पता चलता है कि गठबंधन में शामिल होना खिलाड़ियों के लिए फायदेमंद है, क्योंकि इस मामले में गठबंधन के भुगतान का मूल्य खिलाड़ियों की संख्या के साथ बढ़ता है।

खेल को औपचारिक बनाने के लिए, हमें उपरोक्त अवधारणाओं के लिए औपचारिक नोटेशन पेश करने की आवश्यकता है।

खेल के लिए एनआइए हम इसके सभी खिलाड़ियों के सेट को इस प्रकार निरूपित करें एन= (1,2,...,n) समुच्चय का कोई गैर-रिक्त उपसमुच्चय एनआइए इसे इस रूप में निरूपित करें टी(स्वयं सहित एनऔर सभी उपसमुच्चय एक तत्व से बने हैं)। साइट पर एक पाठ है " सेट और सेट पर संचालन", जो लिंक पर क्लिक करने पर एक नई विंडो में खुलती है।

चारित्रिक फलन को इस प्रकार दर्शाया गया है वीऔर इसकी परिभाषा के क्षेत्र में सेट के संभावित उपसमुच्चय शामिल हैं एन. वी(टी) - एक विशेष उपसमुच्चय के लिए विशेषता फ़ंक्शन का मूल्य, उदाहरण के लिए, एक गठबंधन द्वारा प्राप्त आय, संभवतः एक खिलाड़ी से युक्त। यह महत्वपूर्ण है क्योंकि गेम थ्योरी के लिए सभी असंबद्ध गठबंधनों के विशिष्ट कार्य के मूल्यों के लिए सुपरएडिटिविटी की उपस्थिति की जाँच करना आवश्यक है।

दो गैर-रिक्त उपसमुच्चय गठबंधनों के लिए टी1 और टी2 सहकारी (गठबंधन) खेल के विशिष्ट कार्य की संवेदनशीलता इस प्रकार लिखी गई है:

और सुपरएडिटिविटी इस प्रकार है:

उदाहरण 2.तीन संगीत विद्यालय के छात्र विभिन्न क्लबों में अंशकालिक काम करते हैं; उन्हें क्लब के आगंतुकों से अपनी आय प्राप्त होती है। सहकारी खेलों को हल करने के लिए गेम थ्योरी की अवधारणाओं का उपयोग करके निर्धारित करें कि क्या उनके लिए सेना में शामिल होना लाभदायक है (यदि हां, तो किन परिस्थितियों में)। एननिम्नलिखित प्रारंभिक डेटा वाले व्यक्ति।

औसतन, प्रति शाम उनका राजस्व था:

  • वायलिन वादक के पास 600 इकाइयाँ हैं;
  • गिटारवादक के पास 700 इकाइयाँ हैं;
  • गायक के पास 900 इकाइयाँ हैं।

राजस्व बढ़ाने के प्रयास में, छात्रों ने कई महीनों के दौरान विभिन्न समूह बनाए। परिणामों से पता चला कि टीम बनाकर, वे अपना शाम का राजस्व बढ़ा सकते हैं:

  • वायलिन वादक + गिटारवादक ने 1500 इकाइयाँ अर्जित कीं;
  • वायलिन वादक + गायक ने 1800 इकाइयाँ अर्जित कीं;
  • गिटारवादक + गायक ने 1900 इकाइयाँ अर्जित कीं;
  • वायलिन वादक + गिटारवादक + गायक ने 3000 इकाइयाँ अर्जित कीं।

समाधान। इस उदाहरण में, खेल में खिलाड़ियों की संख्या एन= 3, इसलिए, खेल के विशिष्ट कार्य की परिभाषा के क्षेत्र में सभी खिलाड़ियों के सेट के 2³ = 8 संभावित उपसमुच्चय शामिल हैं। आइए सभी संभावित गठबंधनों की सूची बनाएं टी:

  • एक तत्व के गठबंधन, जिनमें से प्रत्येक में एक खिलाड़ी होता है - एक संगीतकार: टी{1} , टी{2} , टी{3} ;
  • दो तत्वों का गठबंधन: टी{1,2} , टी{1,3} , टी{2,3} ;
  • का गठबंधन तीन तत्व: टी{1,2,3} .

हम प्रत्येक खिलाड़ी को एक क्रमांक निर्दिष्ट करेंगे:

  • वायलिन वादक - प्रथम वादक;
  • गिटारवादक - दूसरा खिलाड़ी;
  • गायक - तीसरा खिलाड़ी।

समस्या डेटा के आधार पर, हम गेम के विशिष्ट कार्य का निर्धारण करते हैं वी:

v(T(1)) = 600 ; v(T(2)) = 700 ; v(T(3)) = 900 ; विशेषता फ़ंक्शन के ये मान क्रमशः पहले, दूसरे और तीसरे खिलाड़ियों के भुगतान के आधार पर निर्धारित किए जाते हैं, जब वे गठबंधन में एकजुट नहीं होते हैं;

v(T(1,2)) = 1500 ; v(T(1,3)) = 1800 ; v(T(2,3)) = 1900 ; विशेषता फ़ंक्शन के ये मान गठबंधन में एकजुट खिलाड़ियों की प्रत्येक जोड़ी के राजस्व से निर्धारित होते हैं;

v(T(1,2,3)) = 3000 ; विशेषता फ़ंक्शन का यह मान उस स्थिति में औसत राजस्व द्वारा निर्धारित किया जाता है जब खिलाड़ी तीन में एकजुट होते हैं।

इस प्रकार, हमने खिलाड़ियों के सभी संभावित गठबंधनों को सूचीबद्ध किया है; उनमें से आठ हैं, जैसा कि होना चाहिए, क्योंकि खेल के विशिष्ट कार्य की परिभाषा के क्षेत्र में सभी खिलाड़ियों के सेट के ठीक आठ संभावित उपसमूह शामिल हैं। गेम थ्योरी की यही आवश्यकता है, क्योंकि हमें सभी असंयुक्त गठबंधनों के विशिष्ट कार्य के मूल्यों के लिए सुपरएडिटिविटी की उपस्थिति की जांच करने की आवश्यकता है।

इस उदाहरण में सुपरएडिटिविटी की शर्तें कैसे संतुष्ट हैं? आइए निर्धारित करें कि खिलाड़ी असंयुक्त गठबंधन कैसे बनाते हैं टी1 और टी2 . यदि कुछ खिलाड़ी किसी गठबंधन का हिस्सा हैं टी1 , तो अन्य सभी खिलाड़ी गठबंधन का हिस्सा हैं टी2 और परिभाषा के अनुसार, यह गठबंधन खिलाड़ियों के पूरे सेट और सेट के अंतर के रूप में बनता है टी1 . तो अगर टी1 - एक खिलाड़ी का गठबंधन, फिर गठबंधन में टी2 गठबंधन में दूसरे और तीसरे खिलाड़ी होंगे टी1 पहले और तीसरे खिलाड़ी होंगे, फिर गठबंधन टी2 इसमें केवल दूसरा खिलाड़ी शामिल होगा, इत्यादि।

3.4.1. गेम थ्योरी की बुनियादी अवधारणाएँ

वर्तमान में, उत्पादन, आर्थिक या में समस्याओं के कई समाधान हैं वाणिज्यिक गतिविधियाँनिर्णय लेने वाले के व्यक्तिपरक गुणों पर निर्भर करता है। अनिश्चितता की स्थिति में निर्णय चुनते समय, मनमानी का तत्व और इसलिए जोखिम हमेशा अपरिहार्य होता है।

खेल और सांख्यिकीय निर्णयों का सिद्धांत पूर्ण या आंशिक अनिश्चितता की स्थितियों में निर्णय लेने की समस्याओं से संबंधित है। अनिश्चितता दूसरे पक्ष के विरोध का रूप ले सकती है, जो विरोधी लक्ष्यों का पीछा करता है, कुछ कार्यों या राज्यों में हस्तक्षेप करता है बाहरी वातावरण. ऐसे मामलों में, विपरीत पक्ष के व्यवहार के संभावित विकल्पों को ध्यान में रखना आवश्यक है।

दोनों पक्षों के लिए संभावित व्यवहार विकल्प और विकल्पों और राज्यों के प्रत्येक संयोजन के लिए उनके परिणामों को फॉर्म में दर्शाया जा सकता है गणित का मॉडलजिसे खेल कहा जाता है.संघर्ष के दोनों पक्ष आपसी कार्रवाइयों की सटीक भविष्यवाणी नहीं कर सकते। इतनी अनिश्चितता के बावजूद, संघर्ष के प्रत्येक पक्ष को निर्णय लेना होता है।

खेल सिद्धांत- संघर्ष स्थितियों का एक गणितीय सिद्धांत है। इस सिद्धांत की मुख्य सीमाएँ दुश्मन की पूर्ण ("आदर्श") तर्कसंगतता की धारणा और संघर्ष को हल करते समय सबसे सतर्क "पुनर्बीमा" निर्णय को अपनाना हैं।

परस्पर विरोधी दलों को बुलाया जाता है खिलाड़ियों, खेल का एक कार्यान्वयन दल, खेल का परिणाम - जीतना या हारना.

इस कदम परगेम थ्योरी में नियमों और उसके कार्यान्वयन द्वारा प्रदान की गई क्रियाओं में से एक का चुनाव होता है।

व्यक्तिगत रूप सेकार्रवाई और उसके कार्यान्वयन के लिए संभावित विकल्पों में से एक के बारे में खिलाड़ी की सचेत पसंद को कॉल करें।

यादृच्छिक चालकिसी खिलाड़ी की पसंद को कॉल करें, जो खिलाड़ी के स्वैच्छिक निर्णय से नहीं, बल्कि कार्रवाई और उसके कार्यान्वयन के संभावित विकल्पों में से एक के यादृच्छिक चयन (सिक्का उछालना, कार्ड बांटना आदि) के कुछ तंत्र द्वारा किया जाता है।

खिलाड़ी की रणनीतिनियमों का एक समूह है जो खेल के दौरान उत्पन्न होने वाली स्थिति के आधार पर, इस खिलाड़ी की प्रत्येक व्यक्तिगत चाल के लिए कार्रवाई की पसंद निर्धारित करता है

इष्टतम रणनीतिप्लेयर एक ऐसी रणनीति है, जो व्यक्तिगत और यादृच्छिक चालों वाले खेल में कई बार दोहराए जाने पर, खिलाड़ी को यथासंभव अधिकतम प्रदान करती है औसतजीत (या, वही, न्यूनतम संभव औसतनुकसान)।

परिणामों की अनिश्चितता पैदा करने वाले कारणों के आधार पर खेलों को निम्नलिखित मुख्य समूहों में विभाजित किया जा सकता है:

- मिश्रितऐसे खेल जिनमें नियम, सिद्धांत रूप में, प्रत्येक खिलाड़ी को व्यवहार के लिए सभी विभिन्न विकल्पों का विश्लेषण करने और, इन विकल्पों की तुलना करके, सर्वश्रेष्ठ को चुनने में सक्षम बनाते हैं। यहां अनिश्चितता यह है कि बहुत सारे विकल्प हैं जिनका विश्लेषण करने की आवश्यकता है।

- जुआऐसे खेल जिनमें यादृच्छिक कारकों के प्रभाव के कारण परिणाम अनिश्चित होता है।

- सामरिकऐसे खेल जिनमें परिणाम की अनिश्चितता इस तथ्य के कारण होती है कि निर्णय लेते समय प्रत्येक खिलाड़ी को यह नहीं पता होता है कि खेल में अन्य प्रतिभागी किस रणनीति का पालन करेंगे, क्योंकि प्रतिद्वंद्वी (साझेदार) के बाद के कार्यों के बारे में कोई जानकारी नहीं है ).

- खेल को युगल कहा जाता है, यदि खेल में दो खिलाड़ी शामिल हैं।

- खेल को एकाधिक कहा जाता है, यदि खेल में दो से अधिक खिलाड़ी हैं।

- खेल को शून्य योग कहा जाता है, यदि प्रत्येक खिलाड़ी दूसरे की कीमत पर जीतता है, और एक पक्ष की जीत और हार का योग दूसरे के बराबर है।

- शून्य-राशि युगल खेलबुलाया विरोधी खेल.

- खेल को परिमित कहा जाता है, यदि प्रत्येक खिलाड़ी के पास रणनीतियों की केवल एक सीमित संख्या है। अन्यथा यह एक खेल है अनंत।

- एक कदम खेलजब खिलाड़ी किसी एक रणनीति को चुनता है और एक चाल चलता है।

- मल्टी-स्टेप गेम मेंखिलाड़ी अपने लक्ष्यों को प्राप्त करने के लिए कई कदम उठाते हैं, जो खेल के नियमों द्वारा सीमित हो सकते हैं या तब तक जारी रह सकते हैं जब तक कि किसी खिलाड़ी के पास खेल जारी रखने के लिए कोई संसाधन न बचे।

- व्यवसायिक खेलविभिन्न संगठनों और उद्यमों में संगठनात्मक और आर्थिक बातचीत का अनुकरण करें। गेम सिमुलेशन के फायदे खत्म वास्तविक वस्तुहैं:

लिए गए निर्णयों के परिणामों की दृश्यता;

परिवर्तनीय समय पैमाना;

सेटिंग्स में बदलाव के साथ मौजूदा अनुभव की पुनरावृत्ति;

घटनाओं और वस्तुओं का परिवर्तनशील कवरेज।

खेल मॉडल के तत्वहैं:

- खेल के प्रतिभागी.

- खेल के नियम।

- सूचना सारणी,प्रतिरूपित प्रणाली की स्थिति और गति को प्रतिबिंबित करना।

खेलों का वर्गीकरण और समूहीकरण करने से आपको खोजने की अनुमति मिलती है सामान्य तरीकेनिर्णय लेने में विकल्पों की खोज करना, गतिविधि के विभिन्न क्षेत्रों में संघर्ष स्थितियों के विकास के दौरान कार्रवाई के सबसे तर्कसंगत तरीके पर सिफारिशें विकसित करना।

3.4.2. खेल के उद्देश्य निर्धारित करना

एक परिमित शून्य-राशि युग्म खेल पर विचार करें। खिलाड़ी A के पास m रणनीतियाँ (A 1 A 2 A m) हैं, और खिलाड़ी B के पास n रणनीतियाँ (B 1, B 2 Bn) हैं। ऐसे खेल को आयाम mxn का खेल कहा जाता है। मान लीजिए कि a ij ऐसी स्थिति में खिलाड़ी A का भुगतान है जहां खिलाड़ी A ने रणनीति A i चुनी है, और खिलाड़ी B ने रणनीति B j चुनी है। इस स्थिति में खिलाड़ी का भुगतान b ij द्वारा दर्शाया जाएगा। एक शून्य-राशि वाला खेल, इसलिए, a ij = - b ij। विश्लेषण करने के लिए, खिलाड़ियों में से केवल एक के भुगतान को जानना पर्याप्त है, ए का कहना है।

यदि खेल में केवल व्यक्तिगत चालें शामिल हैं, तो रणनीति का चुनाव (ए आई, बी जे) विशिष्ट रूप से खेल के परिणाम को निर्धारित करता है। यदि खेल में यादृच्छिक चालें भी शामिल हैं, तो अपेक्षित जीत औसत मूल्य (गणितीय अपेक्षा) है।

आइए मान लें कि ij का मान रणनीतियों की प्रत्येक जोड़ी (A i, B j) के लिए जाना जाता है। आइए एक आयताकार तालिका बनाएं, जिसकी पंक्तियाँ खिलाड़ी A की रणनीतियों के अनुरूप हों, और कॉलम खिलाड़ी B की रणनीतियों के अनुरूप हों। इस तालिका को कहा जाता है भुगतान मैट्रिक्स.

खिलाड़ी ए का लक्ष्य अपनी जीत को अधिकतम करना है, और खिलाड़ी बी का लक्ष्य अपने नुकसान को कम करना है।

इस प्रकार, भुगतान मैट्रिक्स इस प्रकार दिखता है:

कार्य यह निर्धारित करना है:

1) रणनीतियों ए 1 ए 2 ए एम में से खिलाड़ी ए की सर्वोत्तम (इष्टतम) रणनीति;

2) रणनीतियों बी 1, बी 2 बीएन से खिलाड़ी बी की सर्वोत्तम (इष्टतम) रणनीति।

समस्या को हल करने के लिए, सिद्धांत लागू किया जाता है जिसके अनुसार खेल में भाग लेने वाले समान रूप से बुद्धिमान होते हैं और उनमें से प्रत्येक अपने लक्ष्य को प्राप्त करने के लिए सब कुछ करता है।

3.4.3. खेल की समस्याओं को हल करने के तरीके

मिनिमैक्स सिद्धांत

आइए हम खिलाड़ी A की प्रत्येक रणनीति का क्रमिक रूप से विश्लेषण करें। यदि खिलाड़ी A रणनीति A 1 चुनता है, तो खिलाड़ी B ऐसी रणनीति B j चुन सकता है, जिसमें खिलाड़ी A का भुगतान सबसे छोटी संख्या 1j के बराबर होगा। आइए इसे 1 से निरूपित करें:

यानी, एक 1 - न्यूनतम मूल्यपहली पंक्ति के सभी नंबरों से.

इसे सभी पंक्तियों तक बढ़ाया जा सकता है. इसलिए, खिलाड़ी ए को वह रणनीति चुननी होगी जिसके लिए संख्या ए आई अधिकतम है।

वैल्यू ए एक गारंटीकृत जीत है जिसे खिलाड़ी बी के किसी भी व्यवहार के लिए खिलाड़ी अपने लिए सुरक्षित कर सकता है। वैल्यू ए को खेल की कम कीमत कहा जाता है।

खिलाड़ी बी अपने नुकसान को कम करने में रुचि रखता है, यानी खिलाड़ी ए की जीत को न्यूनतम तक कम करना चाहता है। इष्टतम रणनीति चुनने के लिए, उसे प्रत्येक कॉलम में अधिकतम भुगतान मूल्य ढूंढना होगा और उनमें से सबसे छोटे का चयन करना होगा।

आइए प्रत्येक कॉलम में अधिकतम मान को b j से निरूपित करें:

आइए हम bj के सबसे छोटे मान को b के रूप में निरूपित करें।

बी = न्यूनतम अधिकतम ए आईजे

b को खेल की ऊपरी सीमा कहा जाता है। वह सिद्धांत जो यह निर्देश देता है कि खिलाड़ी उचित रणनीतियाँ चुनें, मिनिमैक्स सिद्धांत कहलाता है।

ऐसे मैट्रिक्स गेम हैं जिनके लिए गेम की कम कीमत ऊपरी कीमत के बराबर होती है; ऐसे गेम को सैडल पॉइंट गेम कहा जाता है। इस मामले में, g=a=b को खेल का शुद्ध मूल्य कहा जाता है, और इस मूल्य को प्राप्त करने की अनुमति देने वाली रणनीतियों A * i, B * j को इष्टतम कहा जाता है। जोड़ी (ए * आई, बी * जे) को मैट्रिक्स का सैडल पॉइंट कहा जाता है, क्योंकि तत्व ए आईजे = जी एक साथ आई-पंक्ति में न्यूनतम और जे-कॉलम में अधिकतम है। इष्टतम रणनीतियाँ ए * आई, बी * जे, और शुद्ध मूल्य शुद्ध रणनीतियों में खेल का समाधान हैं, अर्थात, यादृच्छिक चयन तंत्र को शामिल किए बिना।

उदाहरण 1।

एक भुगतान मैट्रिक्स दिया जाए. गेम का समाधान ढूंढें, यानी गेम की निचली और ऊपरी कीमतें और न्यूनतम रणनीतियां निर्धारित करें।

यहाँ a 1 =min a 1 j =min(5,3,8,2) =2

ए =अधिकतम न्यूनतम ए आईजे = अधिकतम(2,1,4) =4

बी = न्यूनतम अधिकतम ए आईजे = न्यूनतम(9,6,8,7) =6

इस प्रकार, खेल की निचली कीमत (ए=4) रणनीति ए 3 से मेल खाती है। इस रणनीति को चुनकर, खिलाड़ी ए को खिलाड़ी बी के किसी भी व्यवहार के लिए कम से कम 4 का भुगतान प्राप्त होगा। खेल की ऊपरी कीमत (बी= 6) खिलाड़ी बी की रणनीति से मेल खाती है। ये रणनीतियाँ मिनिमैक्स हैं। यदि दोनों पक्ष इन रणनीतियों का पालन करते हैं, तो भुगतान 4 (33) होगा।

उदाहरण 2.

भुगतान मैट्रिक्स दिया गया है. खेल की निचली और ऊपरी कीमतें ज्ञात करें।

ए =अधिकतम न्यूनतम ए आईजे = अधिकतम(1,2,3) =3

बी = न्यूनतम अधिकतम ए आईजे = न्यूनतम(5,6,3) =3

इसलिए, a =b=g=3. काठी बिंदु जोड़ी (ए * 3, बी * 3) है। यदि किसी मैट्रिक्स गेम में सैडल पॉइंट होता है, तो इसका समाधान मिनिमैक्स सिद्धांत का उपयोग करके पाया जाता है।

मिश्रित रणनीति वाले खेलों को हल करना

यदि भुगतान मैट्रिक्स में सैडल पॉइंट नहीं है (a मिश्रित रणनीति.

मिश्रित रणनीतियों का उपयोग करने के लिए निम्नलिखित शर्तों की आवश्यकता होती है:

1) गेम में कोई सैडल पॉइंट नहीं है।

2) खिलाड़ी संगत संभावनाओं के साथ शुद्ध रणनीतियों के यादृच्छिक मिश्रण का उपयोग करते हैं।

3) खेल को समान परिस्थितियों में कई बार दोहराया जाता है।

4) प्रत्येक चाल के दौरान, खिलाड़ी को दूसरे खिलाड़ी द्वारा चुनी गई रणनीति के बारे में सूचित नहीं किया जाता है।

5) खेल के परिणामों का औसत निकालने की अनुमति है।

गेम थ्योरी में यह सिद्ध है कि प्रत्येक शून्य-राशि युग्मित गेम में कम से कम एक मिश्रित रणनीति समाधान होता है, जिसका अर्थ है कि प्रत्येक परिमित गेम की लागत g होती है। जी - प्रति गेम औसत जीत, संतोषजनक स्थिति ए<=g<=b . Оптимальное решение игры в смешанных стратегиях обладает следующим свойством: каждый из игроков не заинтересован в отходе от своей оптимальной смешанной стратегии.

खिलाड़ियों की इष्टतम मिश्रित रणनीतियों में उनकी रणनीतियों को सक्रिय कहा जाता है।

सक्रिय रणनीतियों पर प्रमेय.

एक इष्टतम मिश्रित रणनीति का अनुप्रयोग एक खिलाड़ी को खेल की लागत के बराबर अधिकतम औसत जीत (या न्यूनतम औसत हानि) प्रदान करता है, भले ही दूसरा खिलाड़ी क्या कार्रवाई करता है, जब तक कि वह सीमा से आगे नहीं जाता है उनकी सक्रिय रणनीतियाँ।

आइए निम्नलिखित संकेतन का परिचय दें:

पी 1 पी 2 ... पी एम - खिलाड़ी ए द्वारा रणनीतियों ए 1 ए 2 ..... ए एम का उपयोग करने की संभावना;

Q 1 Q 2 …Q n खिलाड़ी B द्वारा रणनीतियों B 1, B 2….. Bn का उपयोग करने की संभावना

हम खिलाड़ी A की मिश्रित रणनीति को इस प्रकार लिखते हैं:

ए 1 ए 2…. पूर्वाह्न

Р 1 Р 2 ... Р एम

हम खिलाड़ी B की मिश्रित रणनीति को इस प्रकार लिखते हैं:

बी 1 बी 2…. बटालियन

भुगतान मैट्रिक्स ए को जानकर, आप औसत जीत (गणितीय अपेक्षा) एम (ए, पी, क्यू) निर्धारित कर सकते हैं:

एम(ए,पी,क्यू)=एस सा आईजे पी आई क्यू जे

खिलाड़ी ए की औसत जीत:

ए =अधिकतम न्यूनतमएम(ए,पी,क्यू)

खिलाड़ी बी की औसत हानि:

बी = न्यूनतम अधिकतमएम(ए,पी,क्यू)

आइए हम इष्टतम मिश्रित रणनीतियों के अनुरूप वैक्टर को पी ए * और क्यू बी * द्वारा निरूपित करें जिसके तहत:

अधिकतम न्यूनतमएम(ए,पी,क्यू) = न्यूनतम अधिकतमएम(ए,पी,क्यू)= एम(ए,पी ए * ,क्यू बी *)

इस मामले में, निम्नलिखित शर्त पूरी होती है:

अधिकतमएम(ए,पी,क्यू बी *)<=maxМ(А,P А * ,Q В *)<= maxМ(А,P А * ,Q)

किसी गेम को हल करने का अर्थ है गेम की कीमत और इष्टतम रणनीतियों का पता लगाना।

खेल की कीमतें और इष्टतम रणनीतियाँ निर्धारित करने के लिए ज्यामितीय विधि

(गेम 2X2 के लिए)

लंबाई 1 का एक खंड भुज अक्ष पर अंकित है। इस खंड का बायां छोर रणनीति ए 1 से मेल खाता है, दायां छोर रणनीति ए 2 से मेल खाता है।

Y-अक्ष जीत को 11 और 12 दर्शाता है।

जीत ए 21 और ए 22 को बिंदु 1 से कोटि अक्ष के समानांतर एक रेखा के साथ प्लॉट किया गया है।

यदि खिलाड़ी बी रणनीति बी 1 का उपयोग करता है, तो हम अंक ए 11 और ए 21 को जोड़ते हैं, यदि बी 2, तो ए 12 और ए 22।

औसत जीत को बिंदु N द्वारा दर्शाया जाता है, जो सीधी रेखाओं B 1 B 1 और B 2 B 2 का प्रतिच्छेदन बिंदु है। इस बिंदु का भुज P 2 के बराबर है, और खेल की कीमत का कोटि g है।

पिछली तकनीक की तुलना में लाभ 55% है।



ऊपर