कैसे मशीन लर्निंग के लिए अर्थहीन बातें भी अर्थपूर्ण हो जाती हैं ?

  डीप-मास्टरिंग तकनीक आत्मविश्वास से उन चित्रों को समझती है जो बकवास हैं, वैज्ञानिक और आत्मनिर्भर-उपयोग विकल्पों के लिए एक संभावित समस्या हो सकती है। एक डीप-फोटो क्लासिफायरियर 90 प्रतिशत से अधिक आत्म विश्वास के साथ फोटो प्रशिक्षण निर्धारित कर सकता है, आम तौर पर किसी वस्तु के बजाय चित्र सीमाओं का भी उपयोग करता है।

  सभी के लिए तंत्रिका नेटवर्क पूरा कर सकते हैं, फिर भी हम निश्चित रूप से यह नहीं समझते हैं कि वे किस तरह से कार्य करते हैं।  निश्चित रूप से, हम उन्हें शोध के लिए प्रोग्राम करेंगे, लेकिन डिवाइस की चयन-निर्माण प्रक्रिया को समझना एक विचित्र, जटिल नमूने के साथ एक फैंसी पहेली की तरह ही रहता है जिसमें आवश्यक टुकड़ों के बड़े पैमाने पर अभी तक समस्या को हल नहीं किया गया है।

  उदाहरण के लिए, यदि कोई मॉडल बताई गई पहेली की तस्वीर को वर्गीकृत करना चाहता है, तो  चिंताजनक बात यह है कि शत्रुतापूर्ण हमलों, या अतिरिक्त रन-ऑफ-द-मिल आँकड़े या प्रसंस्करण समस्याओं की संभावनाएं आदि बनी हुई है।  लेकिन एमआईटी वैज्ञानिकों के माध्यम से हाल ही में पहचानी गई एक नई, अधिक फैली हुई विफलता की चुनौती का कोई अन्य मकसद हो सकता है... "अति व्याख्या", जिसमें एल्गोरिदम जानकारी के आधार पर सुनिश्चित भविष्यवाणियां करते हैं जो लोगों को महसूस नहीं करते हैं, जैसे यादृच्छिक पैटर्न या फोटोग्राफ की सीमाएं।

  यह मुख्य रूप से अत्यधिक-दांव वाले वातावरण के लिए अधिक चिंताजनक हो सकता है, जैसे कि सेल्फ-ड्राइविंग वाहनों के लिए स्प्लिट -2 डी का चयन, और बीमारियों के लिए वैज्ञानिक निदान जो मौके पर अधिक ध्यान देना चाहते हैं।  स्वायत्त मोटर्स विशेष रूप से उन प्रणालियों पर बारीकी से निर्भर करती हैं जो पर्यावरण को सही ढंग से समझ सकती हैं और फिर संक्षिप्त, सुरक्षित विकल्प बनाती हैं।  नेटवर्क ने ट्रैफिक लाइट और सड़क के संकेतों और लक्षणों को वर्गीकृत करने के लिए विशिष्ट पृष्ठभूमि, किनारों, या आकाश की अनूठी शैलियों का उपयोग किया - भले ही तस्वीर के अंदर या बाहर की हो।

  समूह ने निर्धारित किया कि सीआईएफएआर -10 और इमेजनेट जैसे प्रसिद्ध डेटासेट पर कुशल तंत्रिका नेटवर्क अतिव्याख्या से पीड़ित हैं।  उदाहरण के तौर पर CIFAR-10 पर प्रशिक्षित मॉडल ने आत्मविश्वास से भरी भविष्यवाणियां कीं, तब भी जब एंटर किए हुए चित्र का नब्बे प्रतिशत गायब हो गया हो, और बाकी का लोगों के लिए अनावश्यक है।

  "अतिव्याख्या एक डेटासेट समस्या है जो डेटासेट में उन निरर्थक संकेतों के परिणामस्वरूप होती है।  इन उच्च-आत्मविश्वास वाली छवियों को पहचानने योग्य नहीं हैं, लेकिन इनमें सीमाओं सहित महत्वहीन क्षेत्रों में 10 प्रतिशत से कम प्रामाणिक चित्र शामिल हैं।  हमने पाया कि वे चित्र मनुष्यों के लिए अर्थहीन थे, फिर भी मॉडल अभी भी उन्हें उच्च आत्मविश्वास के साथ वर्गीकृत कर सकते हैं, "ब्रैंडन कार्टर, एमआईटी कंप्यूटर साइंस और आर्टिफिशियल इंटेलिजेंस लेबोरेटरी पीएचडी छात्र और अध्ययन के बारे में एक पेपर पर मुख्य लेखक कहते हैं।

  डीप-इमेज क्लासिफायर का व्यापक रूप से उपयोग किया जाता है।  चिकित्सा पूर्वानुमान और स्वतंत्र कार उत्पादन को बढ़ावा देने के अलावा, सुरक्षा, गेमिंग और यहां तक ​​कि एक ऐप में उपयोग के मामले हैं जो आपको बताते हैं कि कोई कुत्ता खतरनाक है या नहीं, इस तथ्य के कारण हमें हर समय आश्वासन की आवश्यकता होती है।  संवाद में तकनीक समुदाय के लिए "जांच" करने के लिए पूर्व-वर्गीकृत चित्रों के ढेर से अलग-अलग चित्रों को संसाधित करके काम करती है।

  छवि प्रकार कठिन है, क्योंकि सिस्टम-स्टडीइंग मॉडल में इन निरर्थक विसरित संकेतकों पर कुंडी लगाने की क्षमता होती है।  फिर, जब फोटो क्लासिफायर इमेजनेट के साथ डेटासेट पर कुशल होते हैं, तो वे उन संकेतों के आधार पर भरोसेमंद भविष्यवाणियां कर सकते हैं।

  यद्यपि इन निरर्थक संकेतों के परिणामस्वरूप वास्तविक दुनिया के अंदर मॉडल की नाजुकता हो सकती है, सिग्नल वास्तव में डेटासेट के भीतर मान्य हैं, जिसका अर्थ है कि उस सटीकता के आधार पर नियमित मूल्यांकन रणनीतियों के उपयोग की पहचान नहीं की जा सकती है।

  एक विशिष्ट प्रविष्टि पर संस्करण की भविष्यवाणी के उद्देश्य की खोज करने के लिए, उपहार अध्ययन के अंदर के तरीके पूरी तस्वीर और समय के साथ शुरू होते हैं और फिर पूछते हैं, मैं इस तस्वीर से क्या हटा सकता हूं?  अनिवार्य रूप से, यह तस्वीर की रक्षा करना जारी रखता है, जब तक कि आप सबसे छोटे टुकड़े के साथ नहीं छोड़े जाते जो अभी भी एक सुनिश्चित निर्णय लेने में सक्षम हो सकता है।

  उस पड़ाव के लिए, उन रणनीतियों को एक प्रकार के सत्यापन मानदंड के रूप में लागू करना भी संभव है।  उदाहरण के लिए, यदि आपके पास एक स्वायत्त ड्राइविंग वाहन है जो स्टॉप लक्षणों का पता लगाने के लिए एक प्रशिक्षित सिस्टम-लर्निंग दृष्टिकोण का उपयोग करता है, तो आप उस विधि का परीक्षण सबसे छोटे एंटर सबसेट का पता लगाने के माध्यम से कर सकते हैं जो फ़ॉरेस्ट सिग्नल का गठन करता है।  यदि इसमें एक वृक्ष विभाग, दिन का एक विशेष समय, या कुछ ऐसा शामिल है, जो अब जंगल का संकेत नहीं है, तो आप चिंतित हो सकते हैं कि कार संभवतः एक ऐसी जगह पर रुक जाएगी जहां यह अस्तित्व में हैं ही नहीं।

  हालांकि ऐसा लग सकता है कि मॉडल यहां संभावित अपराधी है, डेटासेट को दोष देने की अधिक संभावना है।  "यह सवाल है कि हम डेटासेट को इस तरह से कैसे विनियमित करेंगे जिससे फैशन को अधिक सावधानी से नकल करने के लिए सिखाया जा सके कि मानव छवियों को वर्गीकृत करने के बारे में कैसे सोच सकता है और इसके परिणामस्वरूप, किसी भी भाग्य के साथ, इन वास्तविक-अंतर्राष्ट्रीय घटनाओं में बेहतर सामान्यीकरण करें, जैसे  पर्याप्त उपयोग और वैज्ञानिक पूर्वानुमान, ताकि फैशन में यह निरर्थक आचरण न हो, ”कार्टर कहते हैं।

  इसका अर्थ अधिक नियंत्रित वातावरण में डेटासेट बनाना भी हो सकता है।  वर्तमान में, यह केवल तस्वीरें हैं जिन्हें सार्वजनिक डोमेन से निकाला जा सकता है जिन्हें बाद में लेबल किया जा सकता है।  लेकिन अगर आप आइटम पहचान करना चाहते हैं, उदाहरण के लिए, शायद एक गैर-सूचनात्मक इतिहास वाले ऑब्जेक्ट्स वाले मॉडल को पढ़ाना आवश्यक है।

  यह काम श्मिट फ्यूचर्स और नेशनल इंस्टीट्यूट ऑफ हेल्थ के माध्यम से समर्थित हो गया है।  कार्टर ने सिद्धार्थ जैन और जोनास मुलर, अमेज़ॅन के वैज्ञानिकों और एमआईटी प्रोफेसर डेविड गिफोर्ड के साथ  यह लेख लिखा था।  वे तंत्रिका सूचना प्रसंस्करण प्रणालियों पर 2021 के सम्मेलन में चित्रों की आपूर्ति कर रहे हैं।

टिप्पणियाँ

एक टिप्पणी भेजें