कैसे मशीन लर्निंग के लिए अर्थहीन बातें भी अर्थपूर्ण हो जाती हैं ?
डीप-मास्टरिंग तकनीक आत्मविश्वास से उन चित्रों को समझती है जो बकवास हैं, वैज्ञानिक और आत्मनिर्भर-उपयोग विकल्पों के लिए एक संभावित समस्या हो सकती है। एक डीप-फोटो क्लासिफायरियर 90 प्रतिशत से अधिक आत्म विश्वास के साथ फोटो प्रशिक्षण निर्धारित कर सकता है, आम तौर पर किसी वस्तु के बजाय चित्र सीमाओं का भी उपयोग करता है।
सभी के लिए तंत्रिका नेटवर्क पूरा कर सकते हैं, फिर भी हम निश्चित रूप से यह नहीं समझते हैं कि वे किस तरह से कार्य करते हैं। निश्चित रूप से, हम उन्हें शोध के लिए प्रोग्राम करेंगे, लेकिन डिवाइस की चयन-निर्माण प्रक्रिया को समझना एक विचित्र, जटिल नमूने के साथ एक फैंसी पहेली की तरह ही रहता है जिसमें आवश्यक टुकड़ों के बड़े पैमाने पर अभी तक समस्या को हल नहीं किया गया है।
उदाहरण के लिए, यदि कोई मॉडल बताई गई पहेली की तस्वीर को वर्गीकृत करना चाहता है, तो चिंताजनक बात यह है कि शत्रुतापूर्ण हमलों, या अतिरिक्त रन-ऑफ-द-मिल आँकड़े या प्रसंस्करण समस्याओं की संभावनाएं आदि बनी हुई है। लेकिन एमआईटी वैज्ञानिकों के माध्यम से हाल ही में पहचानी गई एक नई, अधिक फैली हुई विफलता की चुनौती का कोई अन्य मकसद हो सकता है... "अति व्याख्या", जिसमें एल्गोरिदम जानकारी के आधार पर सुनिश्चित भविष्यवाणियां करते हैं जो लोगों को महसूस नहीं करते हैं, जैसे यादृच्छिक पैटर्न या फोटोग्राफ की सीमाएं।
यह मुख्य रूप से अत्यधिक-दांव वाले वातावरण के लिए अधिक चिंताजनक हो सकता है, जैसे कि सेल्फ-ड्राइविंग वाहनों के लिए स्प्लिट -2 डी का चयन, और बीमारियों के लिए वैज्ञानिक निदान जो मौके पर अधिक ध्यान देना चाहते हैं। स्वायत्त मोटर्स विशेष रूप से उन प्रणालियों पर बारीकी से निर्भर करती हैं जो पर्यावरण को सही ढंग से समझ सकती हैं और फिर संक्षिप्त, सुरक्षित विकल्प बनाती हैं। नेटवर्क ने ट्रैफिक लाइट और सड़क के संकेतों और लक्षणों को वर्गीकृत करने के लिए विशिष्ट पृष्ठभूमि, किनारों, या आकाश की अनूठी शैलियों का उपयोग किया - भले ही तस्वीर के अंदर या बाहर की हो।
समूह ने निर्धारित किया कि सीआईएफएआर -10 और इमेजनेट जैसे प्रसिद्ध डेटासेट पर कुशल तंत्रिका नेटवर्क अतिव्याख्या से पीड़ित हैं। उदाहरण के तौर पर CIFAR-10 पर प्रशिक्षित मॉडल ने आत्मविश्वास से भरी भविष्यवाणियां कीं, तब भी जब एंटर किए हुए चित्र का नब्बे प्रतिशत गायब हो गया हो, और बाकी का लोगों के लिए अनावश्यक है।
"अतिव्याख्या एक डेटासेट समस्या है जो डेटासेट में उन निरर्थक संकेतों के परिणामस्वरूप होती है। इन उच्च-आत्मविश्वास वाली छवियों को पहचानने योग्य नहीं हैं, लेकिन इनमें सीमाओं सहित महत्वहीन क्षेत्रों में 10 प्रतिशत से कम प्रामाणिक चित्र शामिल हैं। हमने पाया कि वे चित्र मनुष्यों के लिए अर्थहीन थे, फिर भी मॉडल अभी भी उन्हें उच्च आत्मविश्वास के साथ वर्गीकृत कर सकते हैं, "ब्रैंडन कार्टर, एमआईटी कंप्यूटर साइंस और आर्टिफिशियल इंटेलिजेंस लेबोरेटरी पीएचडी छात्र और अध्ययन के बारे में एक पेपर पर मुख्य लेखक कहते हैं।
डीप-इमेज क्लासिफायर का व्यापक रूप से उपयोग किया जाता है। चिकित्सा पूर्वानुमान और स्वतंत्र कार उत्पादन को बढ़ावा देने के अलावा, सुरक्षा, गेमिंग और यहां तक कि एक ऐप में उपयोग के मामले हैं जो आपको बताते हैं कि कोई कुत्ता खतरनाक है या नहीं, इस तथ्य के कारण हमें हर समय आश्वासन की आवश्यकता होती है। संवाद में तकनीक समुदाय के लिए "जांच" करने के लिए पूर्व-वर्गीकृत चित्रों के ढेर से अलग-अलग चित्रों को संसाधित करके काम करती है।
छवि प्रकार कठिन है, क्योंकि सिस्टम-स्टडीइंग मॉडल में इन निरर्थक विसरित संकेतकों पर कुंडी लगाने की क्षमता होती है। फिर, जब फोटो क्लासिफायर इमेजनेट के साथ डेटासेट पर कुशल होते हैं, तो वे उन संकेतों के आधार पर भरोसेमंद भविष्यवाणियां कर सकते हैं।
यद्यपि इन निरर्थक संकेतों के परिणामस्वरूप वास्तविक दुनिया के अंदर मॉडल की नाजुकता हो सकती है, सिग्नल वास्तव में डेटासेट के भीतर मान्य हैं, जिसका अर्थ है कि उस सटीकता के आधार पर नियमित मूल्यांकन रणनीतियों के उपयोग की पहचान नहीं की जा सकती है।
एक विशिष्ट प्रविष्टि पर संस्करण की भविष्यवाणी के उद्देश्य की खोज करने के लिए, उपहार अध्ययन के अंदर के तरीके पूरी तस्वीर और समय के साथ शुरू होते हैं और फिर पूछते हैं, मैं इस तस्वीर से क्या हटा सकता हूं? अनिवार्य रूप से, यह तस्वीर की रक्षा करना जारी रखता है, जब तक कि आप सबसे छोटे टुकड़े के साथ नहीं छोड़े जाते जो अभी भी एक सुनिश्चित निर्णय लेने में सक्षम हो सकता है।
उस पड़ाव के लिए, उन रणनीतियों को एक प्रकार के सत्यापन मानदंड के रूप में लागू करना भी संभव है। उदाहरण के लिए, यदि आपके पास एक स्वायत्त ड्राइविंग वाहन है जो स्टॉप लक्षणों का पता लगाने के लिए एक प्रशिक्षित सिस्टम-लर्निंग दृष्टिकोण का उपयोग करता है, तो आप उस विधि का परीक्षण सबसे छोटे एंटर सबसेट का पता लगाने के माध्यम से कर सकते हैं जो फ़ॉरेस्ट सिग्नल का गठन करता है। यदि इसमें एक वृक्ष विभाग, दिन का एक विशेष समय, या कुछ ऐसा शामिल है, जो अब जंगल का संकेत नहीं है, तो आप चिंतित हो सकते हैं कि कार संभवतः एक ऐसी जगह पर रुक जाएगी जहां यह अस्तित्व में हैं ही नहीं।
हालांकि ऐसा लग सकता है कि मॉडल यहां संभावित अपराधी है, डेटासेट को दोष देने की अधिक संभावना है। "यह सवाल है कि हम डेटासेट को इस तरह से कैसे विनियमित करेंगे जिससे फैशन को अधिक सावधानी से नकल करने के लिए सिखाया जा सके कि मानव छवियों को वर्गीकृत करने के बारे में कैसे सोच सकता है और इसके परिणामस्वरूप, किसी भी भाग्य के साथ, इन वास्तविक-अंतर्राष्ट्रीय घटनाओं में बेहतर सामान्यीकरण करें, जैसे पर्याप्त उपयोग और वैज्ञानिक पूर्वानुमान, ताकि फैशन में यह निरर्थक आचरण न हो, ”कार्टर कहते हैं।
इसका अर्थ अधिक नियंत्रित वातावरण में डेटासेट बनाना भी हो सकता है। वर्तमान में, यह केवल तस्वीरें हैं जिन्हें सार्वजनिक डोमेन से निकाला जा सकता है जिन्हें बाद में लेबल किया जा सकता है। लेकिन अगर आप आइटम पहचान करना चाहते हैं, उदाहरण के लिए, शायद एक गैर-सूचनात्मक इतिहास वाले ऑब्जेक्ट्स वाले मॉडल को पढ़ाना आवश्यक है।


Fantastic.
जवाब देंहटाएं