logo

Shanghai Neardi Technology Co., Ltd. sales@neardi.com 86-021-20952021

Shanghai Neardi Technology Co., Ltd. कंपनी प्रोफ़ाइल
समाचार
घर > समाचार >
कंपनी के बारे में समाचार एल्गोरिथ्म लॉजिक से चिप-साइड डिप्लोयमेंट तक: योलो ऑब्जेक्ट डिटेक्शन का विकास और रॉकचिप का अभ्यास

एल्गोरिथ्म लॉजिक से चिप-साइड डिप्लोयमेंट तक: योलो ऑब्जेक्ट डिटेक्शन का विकास और रॉकचिप का अभ्यास

2026-01-12
Latest company news about एल्गोरिथ्म लॉजिक से चिप-साइड डिप्लोयमेंट तक: योलो ऑब्जेक्ट डिटेक्शन का विकास और रॉकचिप का अभ्यास

एक चौराहे पर खड़े होकर, आपको अपने मस्तिष्क के लिए केवल एक क्षणभंगुर नज़र की आवश्यकता है जो तुरंत आपके दृष्टि क्षेत्र में सब कुछ लेबल कर सके: वह लाल बस स्टेशन में आ रही है, फुटपाथ पर बच्चा दौड़ रहा है, और एक भोजन वितरण स्कूटर तेजी से किनारे से गुजर रहा है। यह लगभग सहज प्रतिक्रिया एक समय कंप्यूटर के लिए सीखना बेहद कठिन था। ऐसा तब तक था जब तक YOLO साथ नहीं आया। आप केवल एक बार देखते हैं - जिस समय एक छवि कैप्चर की जाती है, वर्गीकरण और स्थानीयकरण एक साथ पूरा हो जाता है। इसने ऑब्जेक्ट डिटेक्शन को संपूर्ण खोजों को अलविदा कहने की अनुमति दी और, मानव अंतर्ज्ञान की तरह, वास्तविक समय की सोच के सार के साथ मशीनों को वास्तव में संपन्न किया।

के बारे में नवीनतम कंपनी की खबर एल्गोरिथ्म लॉजिक से चिप-साइड डिप्लोयमेंट तक: योलो ऑब्जेक्ट डिटेक्शन का विकास और रॉकचिप का अभ्यास  0

दृश्य "अंतर्ज्ञान": योलो का प्रतिगमन दर्शन

YOLO के जन्म से पहले, कंप्यूटर विज़न के क्षेत्र में लंबे समय से दो-चरणीय वास्तुकला का वर्चस्व था। उस समय, किसी वस्तु का पता लगाने के लिए, एक एल्गोरिदम को पहले हजारों क्षेत्र प्रस्तावों को निकालना पड़ता था, और फिर उन्हें एक-एक करके वर्गीकृत करना पड़ता था। YOLO की प्रतिभा इसमें निहित है कि इसने इस बोझिल "प्रस्ताव-फिर-सत्यापन" प्रक्रिया को पूरी तरह से पलट दिया और वर्गीकरण कार्य से ऑब्जेक्ट डिटेक्शन को एंड-टू-एंड रिग्रेशन समस्या में पुनर्निर्मित किया।

जब आप YOLO नेटवर्क में एक छवि इनपुट करते हैं, तो यह छवि को सीधे S*S ग्रिड में विभाजित करके गॉर्डियन गाँठ को काट देता है। प्रत्येक ग्रिड न केवल छवि का एक टुकड़ा है, बल्कि नेटवर्क आउटपुट टेंसर में एक फीचर बिंदु भी है।

के बारे में नवीनतम कंपनी की खबर एल्गोरिथ्म लॉजिक से चिप-साइड डिप्लोयमेंट तक: योलो ऑब्जेक्ट डिटेक्शन का विकास और रॉकचिप का अभ्यास  1

एकीकृत टेंसर भविष्यवाणी: प्रत्येक ग्रिड सीधे कई बाउंडिंग बॉक्स की समन्वय जानकारी (एक्स, वाई, डब्ल्यू, एच) की भविष्यवाणी करता है, साथ ही एक आत्मविश्वास स्कोर भी बताता है कि कोई वस्तु यहां मौजूद है या नहीं।

समानांतर वर्गीकरण और स्थानीयकरण: निर्देशांक की भविष्यवाणी करते समय, प्रत्येक ग्रिड वर्ग संभावनाओं के एक सेट की भी गणना करता है। इसका मतलब यह है कि तंत्रिका नेटवर्क की एक ही परत के आउटपुट के भीतर स्थानीयकरण और वर्गीकरण पूरी तरह से समानांतर तरीके से पूरा किया जाता है।

वैश्विक फ़ीचर युग्मन: नेटवर्क के एंड-टू-एंड डिज़ाइन के लिए धन्यवाद, निर्णय लेते समय इसकी संपूर्ण छवि की वैश्विक जानकारी तक पहुंच होती है। पारंपरिक एल्गोरिदम की तुलना में जो केवल स्थानीय क्षेत्र के प्रस्तावों पर ध्यान केंद्रित करते हैं, YOLO का ऐसा "बड़ा-चित्र दृश्य" इसे पृष्ठभूमि शोर को अधिक सटीक रूप से पहचानने में सक्षम बनाता है, जिससे अनियमित आकार के बादलों को पक्षियों के रूप में गलत वर्गीकृत करने की संभावना कम हो जाती है।

औद्योगिक एआई विजन में योलो

बहुत से लोग सोचते हैं कि एआई दूर की बात है, लेकिन ईमानदारी से कहूं तो, योलो लंबे समय से हमारे द्वारा अनदेखे कोनों में "जमकर प्रतिस्पर्धा" कर रहा है।

स्मार्ट निर्माण स्थल: धूल से भरे या बेहद खराब रोशनी वाले सुरंग निर्माण स्थलों में, YOLOv9 बेहद मजबूत फीचर निष्कर्षण क्षमताओं को प्रदर्शित करता है।

व्यवहार अनुपालन का पता लगाना: यह न केवल सुरक्षा हेलमेट और परावर्तक जैकेट की उपस्थिति या अनुपस्थिति की पहचान कर सकता है, बल्कि विस्तृत विशेषताओं के माध्यम से यह भी निर्धारित कर सकता है कि क्या वे ठीक से पहने गए हैं (उदाहरण के लिए, हेलमेट का पट्टा बांधा गया है या जिपर पूरी तरह से ज़िप किया गया है)।

उच्च-समवर्ती प्रसंस्करण: यह प्रति फ्रेम 50 से अधिक लोगों का बड़े पैमाने पर वास्तविक समय में पता लगाने का समर्थन करता है। इन्फ्रारेड इमेजिंग तकनीक के साथ मिलकर, यह "मैन्युअल मॉनिटरिंग" से "24/7 स्वचालित प्रारंभिक चेतावनी" तक की छलांग का एहसास कराता है।

के बारे में नवीनतम कंपनी की खबर एल्गोरिथ्म लॉजिक से चिप-साइड डिप्लोयमेंट तक: योलो ऑब्जेक्ट डिटेक्शन का विकास और रॉकचिप का अभ्यास  2

शहरी शासन: शहरी प्रबंधन और व्यापक शासन परिदृश्य एल्गोरिदम की हस्तक्षेप-विरोधी क्षमता पर उच्च आवश्यकताएं लगाते हैं।

स्थैतिक शासन: ऐतिहासिक छवि तुलना और सिमेंटिक विभाजन के संयोजन से, सिस्टम नव-निर्मित अवैध संरचनाओं, कचरा संचय या व्यवसाय के लिए सड़क पर कब्जे की सटीक पहचान कर सकता है, और यहां तक ​​कि उल्लंघन के क्षेत्र और मात्रा को स्वचालित रूप से निर्धारित कर सकता है।

गतिशील सुरक्षा: पोज़ रिकग्निशन (ओपनपोज़/योलो-पोज़) के आधार पर, सिस्टम "जमीन पर गिरने वाले व्यक्ति" जैसे असामान्य व्यवहारों को संवेदनशील रूप से पकड़ सकता है और आपातकालीन चिकित्सा प्रणालियों से जुड़ सकता है। घनी भीड़ में, यह वास्तविक समय में भीड़ घनत्व की निगरानी करने और भगदड़ के जोखिम को रोकने के लिए घनत्व क्लस्टरिंग एल्गोरिदम (डीबीएससीएएन) का उपयोग करता है।

के बारे में नवीनतम कंपनी की खबर एल्गोरिथ्म लॉजिक से चिप-साइड डिप्लोयमेंट तक: योलो ऑब्जेक्ट डिटेक्शन का विकास और रॉकचिप का अभ्यास  3

बिजली निरीक्षण:मल्टीमॉडल फ्यूजनभूमिगत केबल सुरंगों या उच्च-वोल्टेज ट्रांसमिशन टावरों जैसे उच्च जोखिम वाले क्षेत्रों में: लिडार पॉइंट क्लाउड और इन्फ्रारेड थर्मल इमेजिंग को फ्यूज करके, यह 30 मीटर की दूरी से ट्रांसफार्मर असामान्य हीटिंग, अरेस्टर लीकेज करंट या टावर झुकाव (0.1 डिग्री की सटीकता के साथ) का गैर-संपर्क पता लगा सकता है।

स्वचालित दोष निर्णय: केबल क्षति और ब्रैकेट जंग जैसे छोटे छिपे हुए खतरों के लिए, पहचान सटीकता 92% से अधिक है, जो संचालन और रखरखाव दक्षता में काफी सुधार करती है और कर्मियों की सुरक्षा सुनिश्चित करती है।

के बारे में नवीनतम कंपनी की खबर एल्गोरिथ्म लॉजिक से चिप-साइड डिप्लोयमेंट तक: योलो ऑब्जेक्ट डिटेक्शन का विकास और रॉकचिप का अभ्यास  4

जंगल की आग की रोकथाम: बड़े क्षेत्र, अनियमित आकार के धुएं और आग का पता लगाने के लिए, YOLO अल्ट्रा-फास्ट प्रतिक्रिया क्षमता प्रदर्शित करता है।

सटीक धुआं और आग की पहचान: छवि सुविधाओं और थर्मल विकिरण डेटा को मिलाकर, यह बादलों और वनस्पति छाया के खिलाफ बेहद मजबूत हस्तक्षेप-विरोधी क्षमता के साथ, 2 सेकंड के भीतर जंगल की आग, कैंपफायर या खेत में जलने की पहचान कर सकता है।

स्थिति जागरूकता: जीआईएस भौगोलिक जानकारी और यादृच्छिक वन मॉडल को एकीकृत करते हुए, सिस्टम न केवल आग का पता लगा सकता है, बल्कि हवा की गति और इलाके के आधार पर प्रसार की प्रवृत्ति की भविष्यवाणी भी कर सकता है, जो ऑन-साइट शेड्यूलिंग के लिए दृश्य मानचित्र प्रदान करता है।

आरके3588/आरके3576 के लिए अंतिम कंप्यूटिंग पावर अनुकूलन

ईमानदारी से कहूँ तो, ग्राफ़िक्स कार्ड पर बेंचमार्किंग केवल एक वार्म-अप है। जो चीज़ वास्तव में YOLO को तैनात और कार्यान्वित करने में सक्षम बनाती है, वह है इसे रॉकचिप के RK3588 या RK3576 जैसे चिप-आकार वाले SoCs में पोर्ट करना। यह केवल एक साधारण कोड माइग्रेशन नहीं है, बल्कि कंप्यूटिंग शक्ति, बैंडविड्थ और मेमोरी का "अत्यधिक शोषण" है। इन SoC प्लेटफ़ॉर्म पर मिलीसेकंड-स्तरीय ऑब्जेक्ट डिटेक्शन प्राप्त करने के लिए, आमतौर पर निम्नलिखित चरणों की आवश्यकता होती है:

मॉडल का "अनुवाद करें":चिप की NPU (न्यूरल प्रोसेसिंग यूनिट) की अपनी विशिष्टताएँ हैं और यह PyTorch की मूल .pt प्रशिक्षण फ़ाइलों की व्याख्या नहीं कर सकती है। आरकेएनएन-टूलकिट2 का उपयोग करते हुए, मॉडल को ओएनएनएक्स प्रारूप में परिवर्तित किया जाता है, फिर अलग किया जाता है और .rknn प्रारूप में पुनर्निर्मित किया जाता है जिसे चिप समझ सकता है - जटिल ऑपरेटरों को एनपीयू द्वारा पसंदीदा गणना पथों में पुन: व्यवस्थित किया जाता है।

संपीड़न के माध्यम से "स्लिम डाउन"।: नेटिव एफपी32 (32-बिट फ्लोटिंग-पॉइंट) मॉडल में बड़ी संख्या में पैरामीटर होते हैं, जो एम्बेडेड चिप्स के बैंडविड्थ और भंडारण पर भारी बोझ डालते हैं। क्वांटाइजेशन एल्गोरिदम वजन और सक्रियण को 32-बिट से 8-बिट तक संपीड़ित करता है, जिससे मेमोरी का उपयोग पूरे 75% तक कम हो जाता है। यह न केवल डीडीआर बैंडविड्थ दबाव को कम करता है बल्कि कम्प्यूटेशनल बिजली की खपत को भी प्रभावी ढंग से कम करता है।

"डेटा स्थानांतरण" अनुकूलन: भले ही मॉडल पर्याप्त तेज़ हो, फिर भी यदि सीपीयू मेमोरी में वीडियो स्ट्रीम को स्थानांतरित करने में व्यस्त है तो एनपीयू "निष्क्रिय रहेगा"। एक मिलीसेकंड की बर्बादी से बचने के लिए, आईएसपी, जीपीयू और एनपीयू के बीच वीडियो मेमोरी में वीडियो स्ट्रीम डेटा साझा करने को सक्षम करने के लिए डीएमए-बीयूएफ शून्य-कॉपी तकनीक का उपयोग किया जाता है, जो सीपीयू कॉपी ओवरहेड को पूरी तरह से समाप्त कर देता है। अतुल्यकालिक अनुमान के लिए समानांतर तर्क के साथ संयुक्त, अगला फ्रेम पहले से ही प्रसंस्करण के लिए कतारबद्ध है जबकि वर्तमान फ्रेम अभी भी कनवल्शन ऑपरेशन से गुजर रहा है। यह निर्बाध समन्वय ही वास्तविक समय की वीडियो स्ट्रीम को चिप पर सुचारू रूप से चलाने की अनुमति देता है।

कौन सा YOLO संस्करण आपकी "आवश्यक पसंद" है?

एम्बेडेड उपकरणों पर तैनाती करते समय, संस्करण का चुनाव केवल "नवीनतम का पीछा करना" के बारे में नहीं है; इसके बजाय, इसमें कंप्यूटिंग पावर ओवरहेड, ऑपरेटर संगतता और विशिष्ट कार्यों की सटीकता आवश्यकताओं को संतुलित करने की आवश्यकता होती है।

के बारे में नवीनतम कंपनी की खबर एल्गोरिथ्म लॉजिक से चिप-साइड डिप्लोयमेंट तक: योलो ऑब्जेक्ट डिटेक्शन का विकास और रॉकचिप का अभ्यास  5
इंजीनियरिंग बेंचमार्क: YOLOv5

सबसे परिपक्व पारिस्थितिकी तंत्र वाले संस्करण के रूप में, YOLOv5 औद्योगिक क्षेत्र में अत्यधिक उच्च स्थिरता और तैनाती कवरेज का दावा करता है।

  • तकनीकी सुविधाओं: लचीली वास्तुकला के साथ एंकर-आधारित तंत्र को अपनाता है (नैनो से लेकर विशाल तक कई पैमानों में उपलब्ध)।
  • परिनियोजन लाभ: रॉकचिप की आरकेएनएन टूलचेन उत्कृष्ट ऑपरेटर अनुकूलता के साथ इसके लिए सबसे व्यापक समर्थन प्रदान करती है, जो इसे तेजी से प्रोजेक्ट परिनियोजन और उच्च स्थिरता के लिए पहली पसंद बनाती है।
सर्वांगीण वास्तुकला: YOLOv8

YOLOv8 एक एंकर-मुक्त तंत्र पेश करता है, जो पता लगाने, विभाजन और मुद्रा अनुमान (पोज़) के लिए एक एकीकृत वास्तुकला प्राप्त करता है।

  • तकनीकी सुविधाओं: सुविधा प्रवाह को बढ़ाने के लिए C2f मॉड्यूल का उपयोग करता है और डिकौपल्ड हेड के माध्यम से प्रतिगमन सटीकता में सुधार करता है।
  • परिनियोजन लाभ: यह बहु-कार्य समानता (उदाहरण के लिए, एक साथ ऑब्जेक्ट का पता लगाना और मानव कुंजी बिंदु निष्कर्षण) को संभालते समय सटीकता और गति के बीच एक उत्कृष्ट संतुलन बनाता है, जिससे यह वर्तमान में आरके 3588 जैसे उच्च-प्रदर्शन SoCs पर मुख्यधारा का समाधान बन जाता है।
एंड-टू-एंड प्रदर्शन छलांग: YOLOv10

YOLOv10 ने रीयल-टाइम डिटेक्शन में पोस्ट-प्रोसेसिंग बाधा को संबोधित करने में महत्वपूर्ण प्रगति की है।

  • तकनीकी सुविधाओं: एक एनएमएस-मुक्त (गैर-अधिकतम दमन-मुक्त) रणनीति का परिचय देता है, जो एक-से-अनेक और एक-से-एक मिलान के संरेखण डिजाइन के माध्यम से अनुमान विलंबता में गैर-नियतत्ववाद को समाप्त करता है।
  • परिनियोजन लाभ: किनारे पर, एनएमएस अक्सर सीपीयू समय की खपत का एक महत्वपूर्ण हिस्सा होता है। YOLOv10 इस प्रदर्शन हानि को पूरी तरह से हल करता है, जिससे एसओसी हार्डवेयर पर बेहतर रैखिक स्थिरता प्रदर्शित करने के लिए अनुमान प्रक्रिया सक्षम हो जाती है।
उच्च परिशुद्धता विकास: YOLOv11 और वज्रV1

ये जटिल परिदृश्यों के लिए नवीनतम तकनीकी पुनरावृत्तियों का प्रतिनिधित्व करते हैं, जो बारीक विशेषताओं को पकड़ने पर ध्यान केंद्रित करते हैं।

  • तकनीकी सुविधाओं: YOLOv11 हल्के ध्यान तंत्र (C3k2/C2PSA) को अनुकूलित करता है, जबकि वज्रV1 को इस आधार पर किनारे के उपकरणों के लिए गहराई से अनुकूलित किया गया है। मुख्य कनवल्शन को चौड़ा करके और निम्न-रैंक निर्देशित डिज़ाइन को अपनाकर, यह जटिल वातावरण में मजबूती में काफी सुधार करता है।
  • परिनियोजन लाभ: सघन वस्तु का पता लगाने, रोड़ा परिदृश्यों और उच्च-परिशुद्धता मुद्रा धारणा (जैसे, सुरक्षा हेलमेट पहनने का विवरण, बारीक-बारीक कार्रवाई पहचान) में इसके विशिष्ट फायदे हैं, जो आज तक एम्बेडेड उपकरणों पर YOLO परिवार द्वारा प्राप्त पहचान सटीकता की उच्चतम ऊपरी सीमा का प्रतिनिधित्व करता है।

एल्गोरिदम के विकास ने धारणा की सीमा को कम कर दिया है, जबकि चिप्स के लोकप्रिय होने ने बुद्धिमत्ता की सीमाओं का विस्तार किया है।

कार्यक्रम
संपर्क
संपर्क: Mr. Cola
अब संपर्क करें
हमें मेल करें