मोबाइल वीडियो निगरानी प्रणाली

पैंटोग्राफ सुरक्षा स्थिति का पता लगाने के लिए बेहतर योलोव3 एल्गोरिथम

2022-08-02 09:13

अमूर्त:  ;पेंटोग्राफ एक महत्वपूर्ण घटक है जो रोलिंग स्टॉक को बिजली आपूर्ति ग्रिड से जोड़ता है, इसलिए रोलिंग स्टॉक के सुचारू और स्थिर संचालन के लिए पैंटोग्राफ की सुरक्षा स्थिति महत्वपूर्ण है।


इस पत्र में, फ्रेम द्वारा फ्रेम का विश्लेषण करके, ऑन-बोर्ड वीडियो मॉनिटरिंग सिस्टम द्वारा मॉनिटर किए गए पैंटोग्राफ वीडियो इमेज, पैंटोग्राफ की सुरक्षा स्थिति की निगरानी रीयल-टाइम में योलोव3 टारगेट रिकग्निशन एल्गोरिदम को संशोधित करके की जाती है, जो उद्योग में संरचनात्मक पहचान के लिए व्यापक रूप से उपयोग किया जाता है। एक ही समय में पेंटोग्राफ की असामान्यताएं, चिंगारी और विदेशी वस्तु घुसपैठ। प्रयोगों ने सिद्ध किया है कि टीएनयूओ ऑन-बोर्ड बुद्धिमान विश्लेषण सर्वर पर एक चैनल 40fps तक पहुंच सकता है। व्यापक पहचान सटीकता नक्शा @0.5 98% प्राप्त कर सकती है, वास्तविक समय और अपेक्षाकृत सटीक पहचान परिणाम प्राप्त कर सकती है।


1. पैंटोग्राफ की बुद्धिमान निगरानी


गहन शिक्षा पर आधारित आज के विशिष्ट लक्ष्य पहचान एल्गोरिदम दो-चरण एल्गोरिदम हैं जैसे कि तेज़ आर-सीएनएन एल्गोरिथ्म और एकल-चरण एल्गोरिदम जैसे कि योलोव3 एल्गोरिथ्म। योलो एल्गोरिथ्म को आर-की तुलना में उम्मीदवार फ्रेम की अग्रिम गणना करने की आवश्यकता नहीं है। सीएनएन नेटवर्क, जो कम्प्यूटेशनल प्रयास को कम करता है और तेजी से कम्प्यूटेशनल गति प्राप्त कर सकता है। और योलोव3 एल्गोरिथ्म मान्यता नेटवर्क भाग में तीन शाखाएं होने से योलो एल्गोरिथ्म की पिछली पीढ़ी के बहु-स्तरीय पहचान की कमी को सुधारता है, जो तीन पैमानों पर लक्ष्य पहचान की समस्या का सामना कर सकता है: छोटा, मध्यम और बड़ा। इसके अलावा, योलोव3 एल्गोरिथ्म में बेहतर इंजीनियरिंग समर्थन है और बड़ी संख्या में अनुप्रयोगों में औद्योगिक सम्मान में उपयोग किया जाता है। इसलिए, इस पत्र में,


2. पैंटोग्राफ सुरक्षा स्थिति पहचान एल्गोरिथम निर्माण


2.1 लक्ष्य अमूर्तता


पेंटोग्राफ सुरक्षा स्थिति का पता लगाने को पेंटोग्राफ संरचना असामान्यता का पता लगाने, पैंटोग्राफ आग का पता लगाने, विदेशी वस्तु घुसपैठ का पता लगाने आदि में विभाजित किया जा सकता है। उनमें से पैंटोग्राफ संरचना असामान्यता को कार्बन स्लाइड प्लेट विरूपण, झुकाव, बाएं और दाएं धनुष कोण फ्रैक्चर, बाएं और में विभाजित किया जा सकता है। दायां धनुष कोण गायब है, आदि। मानक, असामान्य अवस्थाएं चित्र 1बी-एफ में दिखाई जाती हैं।

pantograph

चित्र 1 पैंटोग्राफ सुरक्षा स्थिति और एल्गोरिदम लेबलिंग मानक


लक्ष्य पहचान एल्गोरिथ्म का उपयोग करने के लिए, पैंटोग्राफ की सुरक्षा स्थिति का पता लगाने के लिए पहचान लक्ष्य को अमूर्त करना सबसे पहले आवश्यक है, और अमूर्त पहचान लक्ष्य चित्र 1 में दिखाया गया है। सामान्य स्थिति और असामान्य स्थिति में पैंटोग्राफ समान रूप से लेबल किए जाते हैं। सामान्य अवस्था में धनुष डिस्क और धनुष कोण जैसे लक्ष्य और असामान्य स्थिति में धनुष डिस्क और धनुष कोण और चिंगारी और विदेशी वस्तुओं को चिह्नित किया जाता है। फिर लेबल किए गए डेटा को एक समय में पेंटोग्राफ की सभी सुरक्षा अवस्थाओं की पहचान करने के लिए प्रशिक्षण के लिए एक एकीकृत मॉडल में रखा जाता है।


2.2 गण मन न्यूरल नेटवर्क-आधारित डेटासेट डेटा एन्हांसमेंट


पता लगाने के लक्ष्य को परिभाषित करने के बाद, हमें गहन शिक्षण विधियों का उपयोग करके पैंटोग्राफ के विभिन्न राज्यों के लिए डेटासेट से आवश्यक सुविधाओं को सीखने के लिए अपने स्वयं के पैंटोग्राफ सुरक्षा स्थिति डेटासेट बनाने की आवश्यकता है। इस पत्र में एल्गोरिथम निर्माण के लिए आवश्यक डेटा सेट को कई मॉडलों के ऑल वेदर पैंटोग्राफ वीडियो सर्विलांस से इंटरसेप्ट किया गया है। डेटा विशेषताओं पर पर्यावरण के प्रभाव को कम करने के लिए, डेटा सामग्री तैयार करने की प्रक्रिया में काम करने की स्थिति जैसे रोशनी, रोड़ा, बादल दिन, बारिश और बर्फ, प्रवेश और निकास आदि पर पूरी तरह से विचार किया जाता है। डेटा में पैंटोग्राफ फॉल्ट बताता है कि सभी वीडियो निगरानी चित्रों से आते हैं जब मोटर ट्रेन के प्राथमिक रनिंग फॉर्म में पैंटोग्राफ फॉल्ट होता है।


यह देखते हुए कि वास्तविक परिचालन स्थितियों में कुछ दोष प्रकार कम बार-बार होते हैं, जिसके परिणामस्वरूप अपर्याप्त डेटा तैयारी हो सकती है। श्रेणी डेटा के बीच असंतुलन लक्ष्य पहचान के प्रभाव को महत्वपूर्ण रूप से प्रभावित करेगा, इसलिए यह पेपर डेटा की विभिन्न श्रेणियों के लिए गण मन न्यूरल नेटवर्क-आधारित डेटा एन्हांसमेंट विधि को अपनाता है।


जनरेटिव एडवरसैरियल नेटवर्क गण मन में दो मॉडल होते हैं, एक जनरेटिव मॉडल और एक डिस्क्रिमिनेटिव मॉडल। जनरेटिव मॉडल का कार्य ऐसे उदाहरण उत्पन्न करना है जो स्वाभाविक रूप से यथार्थवादी और मूल डेटा के समान दिखते हैं। विवेकशील मॉडल का कार्य यह निर्धारित करना है कि क्या दिया गया उदाहरण स्वाभाविक रूप से वास्तविक या कृत्रिम रूप से नकली प्रतीत होता है।  ;


इसे शून्य-राशि के खेल के रूप में देखा जा सकता है। जनरेटर विवेचक को मूर्ख बनाने की कोशिश करता है, और विवेचक जनरेटर द्वारा मूर्ख नहीं बनने की कोशिश करता है। मॉडलों को वैकल्पिक अनुकूलन द्वारा प्रशिक्षित किया जाता है, और दोनों मॉडलों में सुधार किया जा सकता है। इन दो नेटवर्कों के आधार पर, जेनरेटर नेटवर्क का उपयोग छवि उत्पन्न करने के लिए किया जाता है, जो एक यादृच्छिक शोर z प्राप्त करता है और इस शोर से चित्र का कारण बनता है, जिसे G(z) के रूप में नोट किया जाता है। डिस्क्रिमिनेटर एक भेदभावपूर्ण नेटवर्क है जो यह निर्धारित करता है कि कोई छवि है या नहीं"असली"या नहीं। इसका इनपुट x है, x एक तस्वीर का प्रतिनिधित्व करता है, और आउटपुट D(x) इस संभावना को दर्शाता है कि x एक वास्तविक तस्वीर है। यदि यह 1 है, तो इसका मतलब 100% सटीक चित्र है, और यदि आउटपुट 0 है, तो सटीक चित्र होना असंभव है। तब गण मन नेटवर्क को चित्र 2 में योजनाबद्ध रूप से दिखाया गया है। x वास्तविक डेटा है, और सटीक डेटा पडाटा (x) वितरण के अनुरूप है। Z शोर डेटा है, और शोर डेटा पी.जे (z) वितरण के अनुरूप है, जैसे गॉसियन या एक समान वितरण। फिर शोर z से नमूनाकरण किया जाता है, और डेटा x = G (z) G पास करने के बाद उत्पन्न होता है। फिर, वास्तविक डेटा को क्लासिफायर D में फीड किया जाता है, और एक सिग्मॉइड फ़ंक्शन उत्पन्न जानकारी का अनुसरण करता है, और आउटपुट निर्धारित करता है श्रेणी।

video surveillance

  ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ; चित्र 2 गण मन नेटवर्क सिद्धांत का योजनाबद्ध आरेख


इमेज-टू-इमेज ट्रांसफ़ॉर्मेशन दृष्टि और ग्राफ़िक्स समस्याओं का एक वर्ग है जिसका लक्ष्य संरेखित छवि जोड़े के प्रशिक्षण सेट का उपयोग करके इनपुट और आउटपुट छवियों के बीच मैपिंग सीखना है। हमारा लक्ष्य जी: एक्स मैपिंग → को जानना है, जैसे कि जी (एक्स) से तस्वीरों का वितरण प्रतिकूल हानि का उपयोग करते हुए वितरण वाई से अप्रभेद्य है। चूंकि यह मैपिंग अत्यधिक कम-विवश है, इसलिए हम इसे एक व्युत्क्रम मैपिंग F: Y → के साथ जोड़ते हैं और F(G(X)) ≈ X (और इसके विपरीत) को आगे बढ़ाने के लिए एक चक्रीय स्थिरता हानि का परिचय देते हैं। कई कार्यों पर गुणात्मक परिणाम दिए जाते हैं जहां युग्मित प्रशिक्षण डेटा मौजूद नहीं होता है, जिसमें संग्रह विधि परिवर्तन, ऑब्जेक्ट मॉर्फिंग, मौसमी परिवर्तन और फोटो एन्हांसमेंट शामिल हैं। जहाँ तक संभव हो, ऐसे दृश्यों का चयन किया जाता है जो अलग-अलग फ़ीचर इमेज वाले होते हुए समान या समान हों। उदाहरण के लिए, उसी दृश्य में, कैमरा गंदा है और गंदा नहीं है; कैमरे में बारिश और बारिश नहीं होने की तस्वीरें हैं। प्रशिक्षण के परिणामों से, हम देख सकते हैं कि यदि चयनित दो चित्र स्थान में बहुत भिन्न हैं, तो शामिल की गई अन्य सुविधाएँ बहुत अधिक हैं, जो प्रशिक्षण प्रभाव और छवि निर्माण की गुणवत्ता को प्रभावित करेंगी। और यदि चयनित समान दृश्यों से उत्पन्न छवियां स्वीकार्य गुणवत्ता की हैं, तो डेटा वृद्धि का प्रभाव चित्र 3 में दिखाया गया है।

pantograph cctv

  ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ;   ; चित्र 3 डेटा सेट वृद्धि प्रभाव


इसके अलावा, यह पेपर डेटा सेट का विस्तार करने के लिए एक ओवरसैंपलिंग विधि को भी अपनाता है, जो कि योलोव3 नेटवर्क के साथ संयुक्त है, डेटा एन्हांसमेंट माध्यम, रैंडम पैकेट क्रॉपिंग, रैंडम फ़्लिपिंग, क्रोमा ट्रांसफ़ॉर्मेशन और अन्य ऑपरेशन के साथ आता है;  ;


एल्गोरिथम की अनुकूलन क्षमता को बढ़ाने और व्यावहारिक उपयोग के परिनियोजन चरण में वस्तुओं का पता लगाने के लिए उच्च मजबूती प्रदान करने के लिए डेटा को प्रभावी ढंग से विस्तारित किया जाता है। हालाँकि, बाएँ और दाएँ धनुष कोणों के बीच अंतर करने के लिए, इस पेपर के एल्गोरिथ्म में यादृच्छिक फ्लिप और रोटेशन स्विच बंद हैं।


2.3 योलोव3 नेटवर्क पर आधारित पहचान एल्गोरिथम का अनुकूलन


योलोव3 का बैकबोन लेखक की डार्कनेट 53 संरचना का उपयोग करता है, जो गहरे नेटवर्क के प्रशिक्षण को संभव बनाते हुए दृढ़ तंत्रिका नेटवर्क (सीएनएन ) और अवशिष्ट संरचना नेटवर्क (रेसनेट ) को मिलाकर धीरे-धीरे गायब होने और ढाल विस्फोट की समस्याओं को हल कर सकता है। इसके अलावा, एल्गोरिथ्म को पहले से उम्मीदवार बॉक्स की गणना करने की आवश्यकता नहीं है। फिर भी, यह 9 समूहों और तीन पैमानों का चयन करके, और इन 9 समूहों को समान रूप से इन तीन पैमानों पर वितरित करके, एक प्राथमिक बॉन्डिंगबॉक्स प्राप्त करता है। हालाँकि, पैमाने की समस्या के कारण, योलो एल्गोरिथ्म की सटीकता लक्ष्य पहचान एल्गोरिदम में सबसे अच्छी नहीं है, विशेष रूप से छोटे लक्ष्यों का पता लगाने में। उच्च गति को बनाए रखते हुए योलोव3 एल्गोरिथ्म की पहचान सटीकता में सुधार करने के लिए, योलोव3 की रीढ़ को संशोधित किया गया है। डार्कनेट53 की अवशिष्ट इकाई में चैनल ध्यान एसई मॉड्यूल जोड़ने के लिए विशिष्ट विधि है। परिवर्तन से पहले और बाद में अवशिष्ट नेटवर्क इकाई की संरचना को चित्र 4 में दिखाया गया है।

pantograph

  ;   ;   ;   ;   ;   ;   ;   ;   ;चित्रा 4 संशोधन से पहले और बाद में एसई मॉड्यूल की अवशिष्ट संरचना


एसई मॉड्यूल सेनेट से आता है, जो निचोड़-और-उत्तेजना नेटवर्क के लिए खड़ा है, इमेजनेट 2017 वर्गीकरण प्रतियोगिता चैम्पियनशिप प्राप्त की, इसकी प्रभावशीलता और कार्यान्वयन में आसानी के लिए मान्यता प्राप्त है, और आसानी से मौजूदा नेटवर्क मॉडल ढांचे में लोड किया जा सकता है। सेनेट मुख्य रूप से सीखता है चैनलों के बीच सहसंबंध और चैनलों के लिए ध्यान को फ़िल्टर करता है, जो गणना को थोड़ा बढ़ाता है, लेकिन प्रभाव बेहतर होता है। डार्कनेट के बैकबोन हिस्से में कुल 23 अवशिष्ट मॉड्यूल इकाइयां हैं। इस पत्र में, कुछ अवशिष्ट इकाइयों के लिए मूल आर ई इकाइयाँ से -आर ई इकाइयों में परिवर्तित हो जाती हैं। छोटे और मध्यम लक्ष्यों के लिए योलोव3 नेटवर्क की पहचान क्षमता में सुधार करने के लिए, हमने जिन अवशिष्ट इकाइयों को बदला है, वे भी इन दो शाखाओं में स्थित हैं। से मॉड्यूल द्वारा परिवर्तित योलोव3 का समग्र नेटवर्क आर्किटेक्चर चित्र 5 में दिखाया गया है।

video surveillance

चित्र 5 योलोव3 नेटवर्क संरचना आरेख


रिकग्निशन नेटवर्क पार्ट में, योलोव3 को अप-सैंपलिंग और क्रॉस-लेयर कैस्केडिंग द्वारा डिटेक्शन परिणामों के तीन अलग-अलग पैमानों को आउटपुट करने के लिए अधिक शक्तिशाली बनाया गया है। हानि फ़ंक्शन डिज़ाइन भाग में, लक्ष्य विश्वास, श्रेणी और स्थिति को क्रॉस-एन्ट्रॉपी हानि फ़ंक्शन द्वारा तुरंत सीखा जाता है, और हानि फ़ंक्शन समीकरण 1 में दिखाया गया है।

pantograph cctv

3. प्रायोगिक परिणाम विश्लेषण


3.1 टिएनुओ के बुद्धिमान विश्लेषण सर्वर का परिचय


अधिकांश मौजूदा इन-व्हीकल वीडियो सर्विलांस सिस्टम में केवल वीडियो मॉनिटरिंग और स्टोरेज फ़ंक्शंस हैं, लेकिन बुद्धिमान ऑनलाइन विश्लेषण की क्षमता नहीं है। इस पेपर के हार्डवेयर को शेडोंग टिएनुओ इंटेलिजेंट कंपनी द्वारा विकसित ऑनबोर्ड इंटेलिजेंट एनालिसिस सर्वर की मदद से लागू किया गया है, जैसा कि चित्र 6 में दिखाया गया है। होस्ट हुआवेई के स्व-विकसित दा विंची आर्किटेक्चर एआई स्मार्ट चिप एटलस 3000 से लैस है, जो कर सकता है अधिकांश परिदृश्यों में अभिनव विश्लेषण अनुप्रयोगों के साथ सामना करें और 720p वीडियो के 16 चैनलों के डिकोडिंग और बुद्धिमान विश्लेषण कार्यों को महसूस करें। और परीक्षण के परिणाम वास्तविक समय में चालक की कैब या मैकेनिक को प्रेषित किए जा सकते हैं ताकि परीक्षण के परिणामों की मैन्युअल रूप से समीक्षा की जा सके और सुरक्षा के उपाय किए जा सकें। यह पेपर एकल कैमरा वीडियो चैनल चलाते समय 60fps की कम्प्यूटेशनल गति प्राप्त करने के लिए इस हार्डवेयर का उपयोग करता है। कई वीडियो के 4 चैनलों का एक साथ विश्लेषण भी 25fps की गणना गति सुनिश्चित कर सकता है, जो मल्टी-चैनल वीडियो के वास्तविक समय के बुद्धिमान विश्लेषण की मांग को महसूस कर सकता है।

pantograph

चित्र 6 बुद्धिमान विश्लेषण सर्वर और इंटरफ़ेस आरेख


3.2 पेंटोग्राफ राज्य पहचान परिणाम


पेंटोग्राफ की सुरक्षा स्थिति का पता लगाने के लिए, यह पेपर अपने स्वयं के पैंटोग्राफ सुरक्षा स्थिति डेटासेट का निर्माण करता है, जिसमें पैंटोग्राफ के विभिन्न रूपों के 2388 चित्र होते हैं, जिसमें सामान्य स्थिति में पैंटोग्राफ और विभिन्न कार्य परिस्थितियों में असामान्य स्थिति में पैंटोग्राफ निगरानी चित्र शामिल हैं। लेबल किए गए डेटासेट को डार्कनेट फ्रेमवर्क का उपयोग करके प्रशिक्षित किया जाता है, और प्रशिक्षण प्रक्रिया को चित्र 7 में दिखाया गया है। यह आंकड़े से देखा जा सकता है कि 12000 पुनरावृत्तियों के बाद प्रशिक्षण हानि स्थिर रहती है, और मॉडल स्थानीय इष्टतम में गिर सकता है। सीखने की दर को 20000 पुनरावृत्तियों पर एक बार समायोजित किया जाता है, और नुकसान 0.1 से नीचे चला जाता है। 20,000 पुनरावृत्तियों से आगे कम्प्यूटेशनल सटीकता में सुधार महत्वपूर्ण नहीं है, और संबंधित एमएपी प्लॉट मॉडल की सामान्यीकरण क्षमता में मामूली कमी दर्शाता है। प्रशिक्षण हानि और एमएपी पर विचार करने के लिए,

video surveillance

चित्र 4 पैंटोग्राफ सुरक्षा राज्य पहचान प्रशिक्षण प्रक्रिया


बुद्धिमान विश्लेषण मेजबान के लिए प्रशिक्षित मॉडल को तैनात करने के लिए, प्रशिक्षित मॉडल को हुआवेई दा विंची आर्किटेक्चर द्वारा समर्थित ओम प्रारूप में परिवर्तित करने की आवश्यकता है, रूपांतरण प्रक्रिया में सटीकता की थोड़ी हानि के साथ, लेकिन सभी स्वीकार्य सीमा के भीतर।

pantograph cctv


4. सारांश और संभावना


यह पेपर रीयल-टाइम वीडियो निगरानी के माध्यम से संरचनात्मक असामान्यताओं, स्पार्क्स और विदेशी वस्तु घुसपैठ सहित पेंटोग्राफ की सुरक्षा स्थिति का पता लगाने के लिए योलोव3 एल्गोरिदम का उपयोग करता है, पहचान की सटीकता सुनिश्चित करते समय पहचान की गति को ध्यान में रखते हुए वास्तविक की आवश्यकताओं को पूरा करता है- समय विश्लेषण। यह पैंटोग्राफ सुरक्षा निरीक्षण में ऑनबोर्ड बुद्धिमान विश्लेषण प्रणाली का उपयोग करने के लिए नए विचार प्रदान करता है।

नवीनतम मूल्य प्राप्त करें? हम जितनी जल्दी हो सके जवाब देंगे (12 घंटे के भीतर)
This field is required
This field is required
Required and valid email address
This field is required
This field is required
For a better browsing experience, we recommend that you use Chrome, Firefox, Safari and Edge browsers.