تذكر 86 مليون دولار الماسح الضوئي للوحة الترخيص الذي قمت بنسخه؟ اشتعلت مع شخص ما.

تذكر 86 مليون دولار الماسح الضوئي للوحة الترخيص الذي قمت بنسخه؟ اشتعلت مع شخص ما.

قبل بضعة أسابيع ، نشرت ما اعتقدت في ذلك الوقت أنه مقال غير ضار إلى حد ما: كيف قمت بتكرار مشروع بقيمة 86 مليون دولار في 57 سطرًا من التعليمات البرمجية.

سوف أعترف - لقد كانت مطالبة بنقرة واحدة. كنت أقول في الأساس إنني أعدت إنتاج نفس تقنية مسح لوحة الترخيص والتحقق من صحتها التي دفعت الشرطة في فيكتوريا ، أستراليا ثمنها للتو 86 مليون دولار.

منذ ذلك الحين ، كانت ردود الفعل ساحقة. تلقت مقالتي أكثر من 100000 زيارة في اليوم الأول ، وللوهلة الأخيرة يوجد حوالي 450.000. لقد دُعيت للتحدث في برامج حوارية إذاعية محلية وفي مؤتمر في كاليفورنيا. أعتقد أن شخصًا ما قد أخطأ في قراءة فيكتوريا ، أستراليا باسم فيكتوريا ، كولومبيا البريطانية.

على الرغم من أنني رفضت هذه العروض بأدب ، فقد التقيت لتناول القهوة مع العديد من المطورين المحليين والشركات ذات الأسماء الكبيرة على حد سواء. لقد كانت مثيرة بشكل لا يصدق.

رأى معظم القراء ذلك على حقيقته: دليل على المفهوم لإثارة النقاش حول استخدام التكنولوجيا مفتوحة المصدر والإنفاق الحكومي ورغبة رجل واحد في بناء أشياء رائعة من أريكته.

لقد أشار Pedants إلى نقص التدريب والدعم وتكاليف تكنولوجيا المعلومات للمؤسسات المعتادة ، لكن الأمر لا يستحق أي وقت لاستكشافها. أفضل أن أقضي هذا المنشور في النظر إلى نتائجي وكيف يمكن للآخرين تعزيز دقتهم.

قبل أن نتعمق في النتائج ، أود أن أتطرق إلى شيء واحد أشعر أنه ضاع في المنشور الأصلي. بدأ مفهوم هذا المشروع منفصلاً تمامًا عن مشروع BlueNet الذي تبلغ تكلفته 86 مليون دولار. لم تكن بأي حال من الأحوال محاولة للتغلب عليها.

بدأ الأمر بالفكر المزعج أنه نظرًا لوجود OpenCV وأن موقع VicRoads يحتوي على فحوصات لوحة ترخيص ، يجب أن تكون هناك طريقة للجمع بين الاثنين أو استخدام شيء أفضل.

فقط عندما بدأت كتابتي ، عثرت على BlueNet. أثناء اكتشاف BlueNet وسعره أعطاني زاوية تحريرية رائعة ، حيث تم كتابة الكود بالفعل. لا بد أن يكون هناك بعض التناقضات بين المشاريع.

أعتقد أيضًا أن جزءًا من سبب هذا الانفجار هو التوقيت المناسب لتقرير عن الإنفاق الحكومي المهدر على تكنولوجيا المعلومات في أستراليا. ارتفعت فاتورة تكنولوجيا المعلومات للحكومة الفيدرالية من 5.9 مليار دولار إلى 10 مليارات دولار ، وقدمت قيمة مشكوك فيها لهذا الانفجار. سارع الباحثون الإعلاميون الذين اتصلوا بي إلى الربط بين الاثنين ، لكن هذا ليس شيئًا أنا سريع التشجيع.

إخلاء المسؤولية

بروح الشفافية ، يجب أن أعلن عن شيء مفقود أيضًا من المنشور الأصلي. صاحب العمل السابق قدم مشاريع تكنولوجيا معلومات أصغر (أقل من مليون دولار) لشرطة فيكتوريا وغيرها من الهيئات الحكومية. نتيجة لذلك ، خضعت لفحوصات الشرطة وأكملت النماذج المطلوبة لأصبح مقاولًا في VicPol.

قد يعني هذا أن لديّ فأس لطحن أو لدي بعض المعرفة الداخلية المحددة ، ولكن بدلاً من ذلك أنا فخور بالمشاريع التي قدمناها. كانوا على حد سواء في الوقت المحدد والميزانية.

تصور النتائج

ما يلي هو تمثيل بالفيديو لنتائجي ، تم تكوينه في After Effects لقليل من المرح. لقد سجلت لقطات اختبار مختلفة ، وكان هذا هو المقطع الأكثر نجاحًا.

سأخوض في التفاصيل حول إعدادات الكاميرا المثالية ، ومناطق الكشف ، والمزيد بعد الفيديو. سيساعدك هذا على فهم أفضل لما جعل فيديو iPhone هذا الذي التقطته من خلال الزجاج الأمامي فيديو أفضل من كونتور HD بزاوية من النافذة الجانبية.

معضلة أخلاقية

إذا شاهدت الرسم البطل لهذه المقالة أو شاهدت الفيديو أعلاه ، فربما تكون قد لاحظت تطورًا مثيرًا للاهتمام: لقد ألقيت القبض على شخص ما .

على وجه التحديد ، ضبطت شخصًا يقود سيارة مع تسجيل مُلغى من عام 2016. كان من الممكن أن يحدث هذا لأسباب عديدة ، أكثرها براءة هو ممارسة إعادة البيع المراوغة.

في بعض الأحيان ، عندما لا يتم البيع الخاص للسيارة بواسطة الكتاب ، لا يجوز للمشتري والبائع إكمال التحويل الرسمي للتسجيل. هذا يوفر على المشتري مئات الدولارات ، لكن السيارة لا تزال مسجلة لدى البائع. ليس من المستغرب أن يقوم البائع بإلغاء التسجيل والحصول على استرداد مخصص للأشهر المتبقية ، بقيمة مئات الدولارات أيضًا.

بدلاً من ذلك ، قد يكون سائق السيارة هو المجرم الذي نشك في أنه كذلك.

لذلك ، على الرغم من أنني قمت على سبيل المزاح بتسمية واش لوحة المشروع عندما قمت بإعداده على جهاز الكمبيوتر الخاص بي ، فأنا الآن أواجه لغزًا يتمثل في الإبلاغ عما رأيته.

في النهاية ، تم اكتشاف السائق باستخدام نموذج أولي لجهاز للشرطة فقط. لكن القيادة على تسجيل عام 2016 (ملغى ، غير منتهي الصلاحية) هي خطوة متعمدة للغاية. همم.

رجوع إلى النتائج

من بين العديد من ردود الفعل على مقالتي ، كان قدرًا كبيرًا من التعليقات حرفية ومشكوكًا فيها. منذ أن قلت إنني قمت بتكرار البرنامج ، فقد أكدوا أنه يجب أن يكون لدي مركز دعم وضمانات وكتيبات تدريب. حتى أن أحدهم حاول تكرار نتائجي وضرب العوائق الحتمية لجودة الصورة والمواد المصدر.

لهذا السبب ، أشار البعض إلى أنني اخترت صوري المصدر. لذلك لا يسعني إلا أن أقول ، "حسنًا ، دوه".

عندما أنشأت دليلي الأولي للمفهوم (مرة أخرى ، مع التركيز على التحقق من صحة فكرة ، وليس تكرار BlueNet) ، استخدمت مجموعة عينة صغيرة من أقل من عشر صور. نظرًا لأن إعداد الكاميرا هو أحد العوامل ، إن لم يكن أهمها ، في ALPR ، فقد قمت باختيارها للحصول على خصائص مثالية تعزز التعرف.

في نهاية اليوم ، من السهل جدًا أخذ إثبات هش للمفهوم وكسره. يأتي الابتكار والتحدي الحقيقيان من أخذ إثبات المفهوم وإنجاحه . طوال مسيرتي المهنية ، أخبرني العديد من كبار المطورين أنه لا يمكن إنجاز الأشياء أو على الأقل لا يمكن القيام بها في الوقت المناسب. في بعض الأحيان كانوا على حق. في كثير من الأحيان ، كانوا فقط يكرهون المخاطرة.

"لا شيء مستحيل حتى يتم إثبات ذلك."

كثير من الناس ينبذون هذا الاقتباس ، وربما تكون قد رأيت أو سمعت أحد تجسيداته من قبل. بالنسبة لي ، فإنه يلخص بدقة عقلية التنمية الصحية ، حيث يكون إطلاق الأفكار والتحقق منها أمرًا إلزاميًا تقريبًا لفهمها.

إعدادات كاميرا ALPR المثلى

هذا المشروع مثير للغاية ومختلف بالنسبة لي لأنه يحتوي على مقياس نجاح واضح - ما إذا كان البرنامج يتعرف على اللوحة. يمكن أن يحدث هذا فقط مع مجموعة من الأجهزة والبرامج وحلول الشبكات. بعد نشر مقالتي الأصلية ، قدم الأشخاص الذين يبيعون كاميرات ALPR النصائح بسرعة.

تقريب بصري

الحل الأكثر وضوحًا في الإدراك المتأخر هو استخدام الزوم البصري. على الرغم من أنني أستكشف عوامل مهمة أخرى أدناه ، إلا أن أيا منها لا يؤدي إلى مثل هذه الزيادة الهائلة في الاعتراف بهذا الشكل. بشكل عام ، يتم تعويض حلول ALPR الاحترافية بزاوية ، ويتم تدريبها على مكان وجود لوحة الترخيص ، وتكبيرها في المنطقة لزيادة الوضوح.

هذا يعني أنه كلما زاد التكبير ، زاد عدد وحدات البكسل للعب بها .

كانت جميع الكاميرات التي كانت تحت تصرفي ذات عدسة ثابتة. كان من بينهم:

  • كاميرا أكشن كونتور عالية الدقة. صدرت هذه في عام 2009 ، وأنا أستخدم نفسي لتسجيل تنقلاتي بالدراجة وإعادة تشغيل تجربة الاقتراب من الموت كل أسبوع.
  • كاميرا فوجي فيلم X100S (تشتهر بأنها عدسة أساسية ثابتة)
  • جهاز iPhone 6+ الخاص بي

تم تسجيل التشغيل التجريبي المميز على هاتفي. كانت الطريقة الوحيدة لدي لتكرار الزوم البصري هي استخدام تطبيق للتسجيل بدقة 3K بدلاً من 1080 بكسل ، ثم التكبير والتصغير رقميًا. مرة أخرى ، المزيد من وحدات البكسل للعب بها.

زاوية وتحديد المواقع

غالبًا ما يُشار إلى زاوية الرؤية البالغة 30 درجة كمعيار للتعرف المثالي على اللوحة. هذا مهم للغاية عندما تعلم أن BlueNet يستخدم مجموعة من الكاميرات. من المنطقي أيضًا أن تفكر في ما ستراه الكاميرا الأمامية بشكل عام - ليس كثيرًا.

إذا كان عليّ أن أخمن ، فسأقول أن المصفوفة ذات الاتجاه الأمامي ستكون الإعداد المثالي. ستتكون من كاميرا واحدة مركز ميت مدبب على النحو الوارد أعلاه ، واثنان خارج المركز عند 30 درجة لكل جانب ، وكاميرا خلفية واحدة. تأتي القيمة في توجيه معظم الكاميرات إلى الأمام من وقت رد الفعل المتزايد إذا كانت السيارة تسير في الاتجاه المعاكس. سيسمح ذلك بإجراء مسح ضوئي وعملية واستدارة أسرع مما لو التقطت الكاميرات الخلفية سيارة مشبوهة بالفعل على بعد عشرة أمتار من سيارة الشرطة.

جمبال

عند تكوين الفيديو ، فكرت في تثبيت اللقطات. وبدلاً من ذلك ، اخترت أن أظهر الركوب الوعر لما كان عليه. ما رأيته هو أنني أحمل هاتفي بالقرب من الزجاج الأمامي بينما كانت زوجتي تقود السيارة. تحقق من تلك الطريقة العلمية الصارمة.

عوامل مهمة أخرى

معدل الإطار

اكتشفت كل من محاولة تكرار مشروعي وتسجيلاتي منذ ذلك الحين نفس الاعتقاد الخاطئ بأن معدل إطارات عينات ALPR قد يكون مرتبطًا بالنجاح. في تجربتي ، هذا لم يفعل شيئًا سوى دورات النفايات. بدلاً من ذلك ، ما هو مهم للغاية هو سرعة الغالق التي تنشئ لقطات واضحة ونقية تغذي الخوارزمية جيدًا.

لكنني كنت أختبر أيضًا لقطات منخفضة السرعة إلى حد ما. على الأكثر ، خلقت مركبتان تمران ببعضهما البعض في منطقة 60 كم / ساعة فرقًا تفاضليًا 120 كم / ساعة. BlueNet ، من ناحية أخرى ، يمكن أن تعمل بسرعة 200 كم / ساعة.

كطريقة لحل هذه المشكلة ، اقترح أحد الزملاء اكتشاف الكائنات ومعالجتها خارج النطاق. حدد سيارة وارسم مربعًا محيطًا. انتظر حتى يصل إلى زاوية التعرف المثالية والتكبير. ثم التقط سلسلة من الصور للمعالجة غير المتزامنة.

لقد بحثت في استخدام OpenCV (node-opencv) للتعرف على الكائنات ، لكنني وجدت شيئًا أبسط مثل اكتشاف الوجه ، حيث يستغرق ما بين 600-800 مللي ثانية. ليس فقط أقل من مثالي لاستخدامي ، ولكنه سيئ جدًا بشكل عام.

يأتي قطار الضجيج TensorFlow للإنقاذ. يمكن تشغيلها على الجهاز ، وهناك أمثلة لمشاريع تحدد مركبات متعددة لكل إطار بسرعة مذهلة تبلغ 27.7 إطارًا في الثانية. يمكن أن يعرض هذا الإصدار تقديرات السرعة. لا قيمة لها من الناحية القانونية ، ولكنها ربما تكون مفيدة في ضبط الأمن اليومي (لا يوجد معيار fps في الملف التمهيدي).

لشرح بشكل أفضل كيف يمكن أن يقترن التعرف على السيارة عالي الأداء مع تقنيات ALPR الأبطأ ، قمت بإنشاء فيديو آخر في After Effects. أتخيل أن الاثنين العاملين جنبًا إلى جنب سيبدو مثل هذا:

معدل الإطار مقابل سرعة الغالق

يتأثر مظهر مختلف لمعدل الإطارات إلى حد كبير بسرعة الغالق ، وبشكل أكثر تحديدًا ، مشكلات الغالق الدوار التي تصيب مسجلات الأفلام الرقمية المبكرة أو المنخفضة. فيما يلي لقطة من بعض لقطات Contour HD. يمكنك أن ترى عند 60 كم / ساعة فقط مشكلة المصراع الدوار تجعل اللقطات غير قابلة للاستخدام إلى حد ما من وجهة نظر ALPR.

لم ينتج عن ضبط معدل الإطارات على كل من Contour HD و iPhone الخاص بي تشويشًا أقل بشكل ملحوظ. من الناحية النظرية ، يجب أن تنتج سرعة غالق أعلى صورًا أكثر وضوحًا ووضوحًا. سيصبحون مهمين بشكل متزايد إذا كنت ستطارد معيار BlueNet 200 كم / ساعة. من الناحية المثالية ، يؤدي تقليل التشويش وتقليل تشويه الغالق المتداول إلى قراءة أفضل.

افتح إصدار ALPR

كان أحد الاكتشافات الأكثر إثارة للاهتمام هو أن نسخة node-openalpr التي كنت أستخدمها قديمة وليست بنفس قوة حل الملكية الخاص بها. في حين أن أحد متطلبات المصدر المفتوح كان بالتأكيد عاملاً ، كان من المدهش مدى دقة النسخة السحابية في قراءة الإطارات التي لم أتمكن حتى من تحديد لوحة عليها.

بيانات تدريب البلد ALPR

لقد وجدت أيضًا أن حزمة node-openalpr الرئيسية يتم ضبطها افتراضيًا على معالجة بلد الولايات المتحدة دون أي طريقة لتجاوزها. يجب عليك سحب مفترق طرق شخص آخر لأسفل مما يسمح لك بعد ذلك بتوفير معلمة بلد إضافية.

لكن هذا لا يساعد دائمًا. باستخدام الخوارزمية الافتراضية للولايات المتحدة ، تمكنت من تحقيق معظم النتائج. أدى تحديد مجموعة البيانات الأسترالية إلى خفض عدد قراءات اللوحة الناجحة إلى النصف ، وتمكنت فقط من العثور على واحدة أو اثنتين لم تستطع خوارزمية الولايات المتحدة العثور عليها. أدى توفير مجموعة "لوحة عريضة أسترالية" منفصلة إلى خفض العدد إلى النصف مرة أخرى وإدخال لوحة إضافية واحدة.

من الواضح أن هناك الكثير مما هو مرغوب فيه عندما يتعلق الأمر بمجموعات البيانات الأسترالية لـ ALPR ، وأعتقد أن العدد الهائل من أنماط اللوحات المتاحة في فيكتوريا هو عامل مساهم.

مستو الاعوجاج

يأتي Open ALPR مزودًا بأداة معينة لتقليل تأثير التشويه من زاوية الكاميرا ومشكلات المصراع المتداول. يشير الالتواء المستوي إلى طريقة يتم فيها تمرير الإحداثيات إلى المكتبة لإمالة الصورة وترجمتها وتدويرها حتى تشبه إلى حد بعيد لوحة مستقيمة.

في تجربتي المحدودة في الاختبار ، لم أتمكن من العثور على انفتال مستوٍ يعمل في جميع السرعات. عندما تفكر في دوران الغالق ، فمن المنطقي أن التشويه يزداد بالنسبة لسرعة السيارة. أتخيل أن تغذية مقياس التسارع أو بيانات سرعة GPS كمعامل قد يعمل. أو ، كما تعلم ، احصل على كاميرا ليست قمامة تمامًا.

ما يفعله الآخرون في الصناعة

تواصل العديد من القراء بعد آخر مشاركة لتبادل خبراتهم وأفكارهم. ربما كان أحد الحلول الأكثر إثارة للاهتمام التي شاركتها معي هو شركة Auror في نيوزيلندا.

يستخدمون كاميرات ALPR ثابتة في محطات الوقود للإبلاغ عن الأشخاص الذين يسرقون البنزين. هذا في حد ذاته ليس جديدًا وثوريًا. ولكن عند اقترانهم بشبكتهم ، يمكنهم تلقائيًا إصدار تنبيه عند عودة المخالفين المعروفين ، أو استهداف محطات البنزين في المنطقة.

أبدى المطورون المستقلون في إسرائيل وجنوب إفريقيا والأرجنتين اهتمامًا ببناء إصداراتهم الخاصة من BlueNet. من المحتمل أن يكون أداء البعض أفضل من البعض الآخر ، حيث تستخدم أماكن مثل إسرائيل لوحات ترخيص مكونة من سبعة أرقام بدون أحرف أبجدية.

الماخذ الرئيسية

هناك الكثير مما تعلمته في الأسابيع القليلة الماضية من الانغماس في المشاركة في منشور واحد. بينما كان هناك الكثير من المنتقدين ، فإنني أقدر حقًا الدعم والمعرفة اللذين تم إرسالهما طريقي.

هناك الكثير من التحديات التي ستواجهها في محاولة بناء حل ALPR الخاص بك ، ولكن لحسن الحظ ، تم حل الكثير منها.

لوضع الأمور في نصابها ، أنا مصمم ومطور الواجهة الأمامية. لقد أمضيت حوالي عشر ساعات الآن على لقطات وكود ، وثماني ساعات أخرى في إنتاج الفيديو ، وعشر ساعات أخرى على الأقل في عمليات الكتابة وحدها. لقد حققت ما حققته بالوقوف على أكتاف العمالقة. أقوم بتثبيت مكتبات بناها أشخاص أذكياء ولدي نصائح مفيدة من الأشخاص الذين يبيعون هذه الكاميرات لكسب لقمة العيش.

لا يزال السؤال البالغ 86 مليون دولار قائمًا - إذا كان بإمكانك بناء حل نصف arsed يقوم بعمل جيد من خلال الوقوف على أكتاف العمالقة ، فما مقدار الأموال الإضافية التي يجب أن تضخها للقيام بعمل جيد حقًا ؟

الحل الذي قدمته ليس في نفس النظام الشمسي مثل الماسح الضوئي الدقيق بنسبة 99.999٪ الذي يتوقعه بعض المعلقين على الإنترنت. ولكن بعد ذلك مرة أخرى ، يتعين على BlueNet فقط تحقيق هدف الدقة بنسبة 95٪.

لذا ، إذا كان مبلغ المليون دولار يصل بك إلى دقة 80٪ ، وربما تصل بك 10 ملايين دولار إلى دقة تصل إلى 90٪ - متى تتوقف عن الإنفاق؟ علاوة على ذلك ، بالنظر إلى أن التكنولوجيا قد أثبتت تطبيقات تجارية هنا في أوقيانوسيا ، ما مقدار أموال دافعي الضرائب التي يجب أن تُصرف في حل الملكية قريب المصدر عندما يمكن أن تستفيد الشركات الناشئة المحلية؟ من المفترض أن تكون أستراليا "دولة إبداعية" بعد كل شيء.