पैंटोग्राफ सुरक्षा स्थिति का पता लगाने के लिए बेहतर योलोव3 एल्गोरिथम
2022-08-02 09:13अमूर्त:  ;पेंटोग्राफ एक महत्वपूर्ण घटक है जो रोलिंग स्टॉक को बिजली आपूर्ति ग्रिड से जोड़ता है, इसलिए रोलिंग स्टॉक के सुचारू और स्थिर संचालन के लिए पैंटोग्राफ की सुरक्षा स्थिति महत्वपूर्ण है।
इस पत्र में, फ्रेम द्वारा फ्रेम का विश्लेषण करके, ऑन-बोर्ड वीडियो मॉनिटरिंग सिस्टम द्वारा मॉनिटर किए गए पैंटोग्राफ वीडियो इमेज, पैंटोग्राफ की सुरक्षा स्थिति की निगरानी रीयल-टाइम में योलोव3 टारगेट रिकग्निशन एल्गोरिदम को संशोधित करके की जाती है, जो उद्योग में संरचनात्मक पहचान के लिए व्यापक रूप से उपयोग किया जाता है। एक ही समय में पेंटोग्राफ की असामान्यताएं, चिंगारी और विदेशी वस्तु घुसपैठ। प्रयोगों ने सिद्ध किया है कि टीएनयूओ ऑन-बोर्ड बुद्धिमान विश्लेषण सर्वर पर एक चैनल 40fps तक पहुंच सकता है। व्यापक पहचान सटीकता नक्शा @0.5 98% प्राप्त कर सकती है, वास्तविक समय और अपेक्षाकृत सटीक पहचान परिणाम प्राप्त कर सकती है।
1. पैंटोग्राफ की बुद्धिमान निगरानी
गहन शिक्षा पर आधारित आज के विशिष्ट लक्ष्य पहचान एल्गोरिदम दो-चरण एल्गोरिदम हैं जैसे कि तेज़ आर-सीएनएन एल्गोरिथ्म और एकल-चरण एल्गोरिदम जैसे कि योलोव3
एल्गोरिथ्म। योलो एल्गोरिथ्म को आर-की तुलना में उम्मीदवार फ्रेम की अग्रिम गणना करने की आवश्यकता नहीं है। सीएनएन नेटवर्क, जो कम्प्यूटेशनल प्रयास को कम करता है और तेजी से कम्प्यूटेशनल गति प्राप्त कर सकता है। और योलोव3
एल्गोरिथ्म मान्यता नेटवर्क भाग में तीन शाखाएं होने से योलो
एल्गोरिथ्म की पिछली पीढ़ी के बहु-स्तरीय पहचान की कमी को सुधारता है, जो तीन पैमानों पर लक्ष्य पहचान की समस्या का सामना कर सकता है: छोटा, मध्यम और बड़ा। इसके अलावा, योलोव3
एल्गोरिथ्म में बेहतर इंजीनियरिंग समर्थन है और बड़ी संख्या में अनुप्रयोगों में औद्योगिक सम्मान में उपयोग किया जाता है। इसलिए, इस पत्र में,
2. पैंटोग्राफ सुरक्षा स्थिति पहचान एल्गोरिथम निर्माण
2.1 लक्ष्य अमूर्तता
पेंटोग्राफ सुरक्षा स्थिति का पता लगाने को पेंटोग्राफ संरचना असामान्यता का पता लगाने, पैंटोग्राफ आग का पता लगाने, विदेशी वस्तु घुसपैठ का पता लगाने आदि में विभाजित किया जा सकता है। उनमें से पैंटोग्राफ संरचना असामान्यता को कार्बन स्लाइड प्लेट विरूपण, झुकाव, बाएं और दाएं धनुष कोण फ्रैक्चर, बाएं और में विभाजित किया जा सकता है। दायां धनुष कोण गायब है, आदि। मानक, असामान्य अवस्थाएं चित्र 1बी-एफ में दिखाई जाती हैं।
चित्र 1 पैंटोग्राफ सुरक्षा स्थिति और एल्गोरिदम लेबलिंग मानक
लक्ष्य पहचान एल्गोरिथ्म का उपयोग करने के लिए, पैंटोग्राफ की सुरक्षा स्थिति का पता लगाने के लिए पहचान लक्ष्य को अमूर्त करना सबसे पहले आवश्यक है, और अमूर्त पहचान लक्ष्य चित्र 1 में दिखाया गया है। सामान्य स्थिति और असामान्य स्थिति में पैंटोग्राफ समान रूप से लेबल किए जाते हैं। सामान्य अवस्था में धनुष डिस्क और धनुष कोण जैसे लक्ष्य और असामान्य स्थिति में धनुष डिस्क और धनुष कोण और चिंगारी और विदेशी वस्तुओं को चिह्नित किया जाता है। फिर लेबल किए गए डेटा को एक समय में पेंटोग्राफ की सभी सुरक्षा अवस्थाओं की पहचान करने के लिए प्रशिक्षण के लिए एक एकीकृत मॉडल में रखा जाता है।
2.2 गण मन न्यूरल नेटवर्क-आधारित डेटासेट डेटा एन्हांसमेंट
पता लगाने के लक्ष्य को परिभाषित करने के बाद, हमें गहन शिक्षण विधियों का उपयोग करके पैंटोग्राफ के विभिन्न राज्यों के लिए डेटासेट से आवश्यक सुविधाओं को सीखने के लिए अपने स्वयं के पैंटोग्राफ सुरक्षा स्थिति डेटासेट बनाने की आवश्यकता है। इस पत्र में एल्गोरिथम निर्माण के लिए आवश्यक डेटा सेट को कई मॉडलों के ऑल वेदर पैंटोग्राफ वीडियो सर्विलांस से इंटरसेप्ट किया गया है। डेटा विशेषताओं पर पर्यावरण के प्रभाव को कम करने के लिए, डेटा सामग्री तैयार करने की प्रक्रिया में काम करने की स्थिति जैसे रोशनी, रोड़ा, बादल दिन, बारिश और बर्फ, प्रवेश और निकास आदि पर पूरी तरह से विचार किया जाता है। डेटा में पैंटोग्राफ फॉल्ट बताता है कि सभी वीडियो निगरानी चित्रों से आते हैं जब मोटर ट्रेन के प्राथमिक रनिंग फॉर्म में पैंटोग्राफ फॉल्ट होता है।
यह देखते हुए कि वास्तविक परिचालन स्थितियों में कुछ दोष प्रकार कम बार-बार होते हैं, जिसके परिणामस्वरूप अपर्याप्त डेटा तैयारी हो सकती है। श्रेणी डेटा के बीच असंतुलन लक्ष्य पहचान के प्रभाव को महत्वपूर्ण रूप से प्रभावित करेगा, इसलिए यह पेपर डेटा की विभिन्न श्रेणियों के लिए गण मन न्यूरल नेटवर्क-आधारित डेटा एन्हांसमेंट विधि को अपनाता है।
जनरेटिव एडवरसैरियल नेटवर्क गण मन में दो मॉडल होते हैं, एक जनरेटिव मॉडल और एक डिस्क्रिमिनेटिव मॉडल। जनरेटिव मॉडल का कार्य ऐसे उदाहरण उत्पन्न करना है जो स्वाभाविक रूप से यथार्थवादी और मूल डेटा के समान दिखते हैं। विवेकशील मॉडल का कार्य यह निर्धारित करना है कि क्या दिया गया उदाहरण स्वाभाविक रूप से वास्तविक या कृत्रिम रूप से नकली प्रतीत होता है।  ;
इसे शून्य-राशि के खेल के रूप में देखा जा सकता है। जनरेटर विवेचक को मूर्ख बनाने की कोशिश करता है, और विवेचक जनरेटर द्वारा मूर्ख नहीं बनने की कोशिश करता है। मॉडलों को वैकल्पिक अनुकूलन द्वारा प्रशिक्षित किया जाता है, और दोनों मॉडलों में सुधार किया जा सकता है। इन दो नेटवर्कों के आधार पर, जेनरेटर नेटवर्क का उपयोग छवि उत्पन्न करने के लिए किया जाता है, जो एक यादृच्छिक शोर z प्राप्त करता है और इस शोर से चित्र का कारण बनता है, जिसे G(z) के रूप में नोट किया जाता है। डिस्क्रिमिनेटर एक भेदभावपूर्ण नेटवर्क है जो यह निर्धारित करता है कि कोई छवि है या नहीं"असली"या नहीं। इसका इनपुट x है, x एक तस्वीर का प्रतिनिधित्व करता है, और आउटपुट D(x) इस संभावना को दर्शाता है कि x एक वास्तविक तस्वीर है। यदि यह 1 है, तो इसका मतलब 100% सटीक चित्र है, और यदि आउटपुट 0 है, तो सटीक चित्र होना असंभव है। तब गण मन नेटवर्क को चित्र 2 में योजनाबद्ध रूप से दिखाया गया है। x वास्तविक डेटा है, और सटीक डेटा पडाटा (x) वितरण के अनुरूप है। Z शोर डेटा है, और शोर डेटा पी.जे (z) वितरण के अनुरूप है, जैसे गॉसियन या एक समान वितरण। फिर शोर z से नमूनाकरण किया जाता है, और डेटा x = G (z) G पास करने के बाद उत्पन्न होता है। फिर, वास्तविक डेटा को क्लासिफायर D में फीड किया जाता है, और एक सिग्मॉइड फ़ंक्शन उत्पन्न जानकारी का अनुसरण करता है, और आउटपुट निर्धारित करता है श्रेणी।
  ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ; चित्र 2 गण मन नेटवर्क सिद्धांत का योजनाबद्ध आरेख
इमेज-टू-इमेज ट्रांसफ़ॉर्मेशन दृष्टि और ग्राफ़िक्स समस्याओं का एक वर्ग है जिसका लक्ष्य संरेखित छवि जोड़े के प्रशिक्षण सेट का उपयोग करके इनपुट और आउटपुट छवियों के बीच मैपिंग सीखना है। हमारा लक्ष्य जी: एक्स मैपिंग → को जानना है, जैसे कि जी (एक्स) से तस्वीरों का वितरण प्रतिकूल हानि का उपयोग करते हुए वितरण वाई से अप्रभेद्य है। चूंकि यह मैपिंग अत्यधिक कम-विवश है, इसलिए हम इसे एक व्युत्क्रम मैपिंग F: Y → के साथ जोड़ते हैं और F(G(X)) ≈ X (और इसके विपरीत) को आगे बढ़ाने के लिए एक चक्रीय स्थिरता हानि का परिचय देते हैं। कई कार्यों पर गुणात्मक परिणाम दिए जाते हैं जहां युग्मित प्रशिक्षण डेटा मौजूद नहीं होता है, जिसमें संग्रह विधि परिवर्तन, ऑब्जेक्ट मॉर्फिंग, मौसमी परिवर्तन और फोटो एन्हांसमेंट शामिल हैं। जहाँ तक संभव हो, ऐसे दृश्यों का चयन किया जाता है जो अलग-अलग फ़ीचर इमेज वाले होते हुए समान या समान हों। उदाहरण के लिए, उसी दृश्य में, कैमरा गंदा है और गंदा नहीं है; कैमरे में बारिश और बारिश नहीं होने की तस्वीरें हैं। प्रशिक्षण के परिणामों से, हम देख सकते हैं कि यदि चयनित दो चित्र स्थान में बहुत भिन्न हैं, तो शामिल की गई अन्य सुविधाएँ बहुत अधिक हैं, जो प्रशिक्षण प्रभाव और छवि निर्माण की गुणवत्ता को प्रभावित करेंगी। और यदि चयनित समान दृश्यों से उत्पन्न छवियां स्वीकार्य गुणवत्ता की हैं, तो डेटा वृद्धि का प्रभाव चित्र 3 में दिखाया गया है।
  ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ; चित्र 3 डेटा सेट वृद्धि प्रभाव
इसके अलावा, यह पेपर डेटा सेट का विस्तार करने के लिए एक ओवरसैंपलिंग विधि को भी अपनाता है, जो कि योलोव3 नेटवर्क के साथ संयुक्त है, डेटा एन्हांसमेंट माध्यम, रैंडम पैकेट क्रॉपिंग, रैंडम फ़्लिपिंग, क्रोमा ट्रांसफ़ॉर्मेशन और अन्य ऑपरेशन के साथ आता है;  ;
एल्गोरिथम की अनुकूलन क्षमता को बढ़ाने और व्यावहारिक उपयोग के परिनियोजन चरण में वस्तुओं का पता लगाने के लिए उच्च मजबूती प्रदान करने के लिए डेटा को प्रभावी ढंग से विस्तारित किया जाता है। हालाँकि, बाएँ और दाएँ धनुष कोणों के बीच अंतर करने के लिए, इस पेपर के एल्गोरिथ्म में यादृच्छिक फ्लिप और रोटेशन स्विच बंद हैं।
2.3 योलोव3 नेटवर्क पर आधारित पहचान एल्गोरिथम का अनुकूलन
योलोव3 का बैकबोन लेखक की डार्कनेट 53 संरचना का उपयोग करता है, जो गहरे नेटवर्क के प्रशिक्षण को संभव बनाते हुए दृढ़ तंत्रिका नेटवर्क (सीएनएन ) और अवशिष्ट संरचना नेटवर्क (रेसनेट ) को मिलाकर धीरे-धीरे गायब होने और ढाल विस्फोट की समस्याओं को हल कर सकता है। इसके अलावा, एल्गोरिथ्म को पहले से उम्मीदवार बॉक्स की गणना करने की आवश्यकता नहीं है। फिर भी, यह 9 समूहों और तीन पैमानों का चयन करके, और इन 9 समूहों को समान रूप से इन तीन पैमानों पर वितरित करके, एक प्राथमिक बॉन्डिंगबॉक्स प्राप्त करता है। हालाँकि, पैमाने की समस्या के कारण, योलो एल्गोरिथ्म की सटीकता लक्ष्य पहचान एल्गोरिदम में सबसे अच्छी नहीं है, विशेष रूप से छोटे लक्ष्यों का पता लगाने में। उच्च गति को बनाए रखते हुए योलोव3 एल्गोरिथ्म की पहचान सटीकता में सुधार करने के लिए, योलोव3 की रीढ़ को संशोधित किया गया है। डार्कनेट53 की अवशिष्ट इकाई में चैनल ध्यान एसई मॉड्यूल जोड़ने के लिए विशिष्ट विधि है। परिवर्तन से पहले और बाद में अवशिष्ट नेटवर्क इकाई की संरचना को चित्र 4 में दिखाया गया है।
  ;   ;   ;   ;   ;   ;   ;   ;   ;चित्रा 4 संशोधन से पहले और बाद में एसई मॉड्यूल की अवशिष्ट संरचना
एसई मॉड्यूल सेनेट से आता है, जो निचोड़-और-उत्तेजना नेटवर्क के लिए खड़ा है, इमेजनेट 2017 वर्गीकरण प्रतियोगिता चैम्पियनशिप प्राप्त की, इसकी प्रभावशीलता और कार्यान्वयन में आसानी के लिए मान्यता प्राप्त है, और आसानी से मौजूदा नेटवर्क मॉडल ढांचे में लोड किया जा सकता है। सेनेट मुख्य रूप से सीखता है चैनलों के बीच सहसंबंध और चैनलों के लिए ध्यान को फ़िल्टर करता है, जो गणना को थोड़ा बढ़ाता है, लेकिन प्रभाव बेहतर होता है। डार्कनेट के बैकबोन हिस्से में कुल 23 अवशिष्ट मॉड्यूल इकाइयां हैं। इस पत्र में, कुछ अवशिष्ट इकाइयों के लिए मूल आर ई इकाइयाँ से -आर ई इकाइयों में परिवर्तित हो जाती हैं। छोटे और मध्यम लक्ष्यों के लिए योलोव3 नेटवर्क की पहचान क्षमता में सुधार करने के लिए, हमने जिन अवशिष्ट इकाइयों को बदला है, वे भी इन दो शाखाओं में स्थित हैं। से मॉड्यूल द्वारा परिवर्तित योलोव3 का समग्र नेटवर्क आर्किटेक्चर चित्र 5 में दिखाया गया है।
चित्र 5 योलोव3 नेटवर्क संरचना आरेख
रिकग्निशन नेटवर्क पार्ट में, योलोव3 को अप-सैंपलिंग और क्रॉस-लेयर कैस्केडिंग द्वारा डिटेक्शन परिणामों के तीन अलग-अलग पैमानों को आउटपुट करने के लिए अधिक शक्तिशाली बनाया गया है। हानि फ़ंक्शन डिज़ाइन भाग में, लक्ष्य विश्वास, श्रेणी और स्थिति को क्रॉस-एन्ट्रॉपी हानि फ़ंक्शन द्वारा तुरंत सीखा जाता है, और हानि फ़ंक्शन समीकरण 1 में दिखाया गया है।
3. प्रायोगिक परिणाम विश्लेषण
3.1 टिएनुओ के बुद्धिमान विश्लेषण सर्वर का परिचय
अधिकांश मौजूदा इन-व्हीकल वीडियो सर्विलांस सिस्टम में केवल वीडियो मॉनिटरिंग और स्टोरेज फ़ंक्शंस हैं, लेकिन बुद्धिमान ऑनलाइन विश्लेषण की क्षमता नहीं है। इस पेपर के हार्डवेयर को शेडोंग टिएनुओ इंटेलिजेंट कंपनी द्वारा विकसित ऑनबोर्ड इंटेलिजेंट एनालिसिस सर्वर की मदद से लागू किया गया है, जैसा कि चित्र 6 में दिखाया गया है। होस्ट हुआवेई के स्व-विकसित दा विंची आर्किटेक्चर एआई स्मार्ट चिप एटलस 3000 से लैस है, जो कर सकता है अधिकांश परिदृश्यों में अभिनव विश्लेषण अनुप्रयोगों के साथ सामना करें और 720p वीडियो के 16 चैनलों के डिकोडिंग और बुद्धिमान विश्लेषण कार्यों को महसूस करें। और परीक्षण के परिणाम वास्तविक समय में चालक की कैब या मैकेनिक को प्रेषित किए जा सकते हैं ताकि परीक्षण के परिणामों की मैन्युअल रूप से समीक्षा की जा सके और सुरक्षा के उपाय किए जा सकें। यह पेपर एकल कैमरा वीडियो चैनल चलाते समय 60fps की कम्प्यूटेशनल गति प्राप्त करने के लिए इस हार्डवेयर का उपयोग करता है। कई वीडियो के 4 चैनलों का एक साथ विश्लेषण भी 25fps की गणना गति सुनिश्चित कर सकता है, जो मल्टी-चैनल वीडियो के वास्तविक समय के बुद्धिमान विश्लेषण की मांग को महसूस कर सकता है।
चित्र 6 बुद्धिमान विश्लेषण सर्वर और इंटरफ़ेस आरेख
3.2 पेंटोग्राफ राज्य पहचान परिणाम
पेंटोग्राफ की सुरक्षा स्थिति का पता लगाने के लिए, यह पेपर अपने स्वयं के पैंटोग्राफ सुरक्षा स्थिति डेटासेट का निर्माण करता है, जिसमें पैंटोग्राफ के विभिन्न रूपों के 2388 चित्र होते हैं, जिसमें सामान्य स्थिति में पैंटोग्राफ और विभिन्न कार्य परिस्थितियों में असामान्य स्थिति में पैंटोग्राफ निगरानी चित्र शामिल हैं। लेबल किए गए डेटासेट को डार्कनेट फ्रेमवर्क का उपयोग करके प्रशिक्षित किया जाता है, और प्रशिक्षण प्रक्रिया को चित्र 7 में दिखाया गया है। यह आंकड़े से देखा जा सकता है कि 12000 पुनरावृत्तियों के बाद प्रशिक्षण हानि स्थिर रहती है, और मॉडल स्थानीय इष्टतम में गिर सकता है। सीखने की दर को 20000 पुनरावृत्तियों पर एक बार समायोजित किया जाता है, और नुकसान 0.1 से नीचे चला जाता है। 20,000 पुनरावृत्तियों से आगे कम्प्यूटेशनल सटीकता में सुधार महत्वपूर्ण नहीं है, और संबंधित एमएपी प्लॉट मॉडल की सामान्यीकरण क्षमता में मामूली कमी दर्शाता है। प्रशिक्षण हानि और एमएपी पर विचार करने के लिए,
चित्र 4 पैंटोग्राफ सुरक्षा राज्य पहचान प्रशिक्षण प्रक्रिया
बुद्धिमान विश्लेषण मेजबान के लिए प्रशिक्षित मॉडल को तैनात करने के लिए, प्रशिक्षित मॉडल को हुआवेई दा विंची आर्किटेक्चर द्वारा समर्थित ओम प्रारूप में परिवर्तित करने की आवश्यकता है, रूपांतरण प्रक्रिया में सटीकता की थोड़ी हानि के साथ, लेकिन सभी स्वीकार्य सीमा के भीतर।
4. सारांश और संभावना
यह पेपर रीयल-टाइम वीडियो निगरानी के माध्यम से संरचनात्मक असामान्यताओं, स्पार्क्स और विदेशी वस्तु घुसपैठ सहित पेंटोग्राफ की सुरक्षा स्थिति का पता लगाने के लिए योलोव3 एल्गोरिदम का उपयोग करता है, पहचान की सटीकता सुनिश्चित करते समय पहचान की गति को ध्यान में रखते हुए वास्तविक की आवश्यकताओं को पूरा करता है- समय विश्लेषण। यह पैंटोग्राफ सुरक्षा निरीक्षण में ऑनबोर्ड बुद्धिमान विश्लेषण प्रणाली का उपयोग करने के लिए नए विचार प्रदान करता है।