Leichtgewichtige Objekterkennung für kleine Erzproben basierend auf paralleler Dual-Attention

SUN Guodong ,  

LIU Mingxuan ,  

LI Shicheng ,  

WU Bo ,  

摘要

Angesichts der Probleme hoher Rechenkomplexität, geringer Merkmalsrobustheit und eingeschränkter Klassifikatorleistung bei traditionellen Zielerkennungsmethoden in der Körnungsdetektion von Erz schlägt dieser Artikel einen Algorithmus zur Objekterkennung mit kleinen Stichproben vor, der darauf abzielt, die Beschriftungs- und Berechnungskosten zu senken und die Generalisierungsfähigkeit des Modells in datenarmen Szenarien zu verbessern. Das Design basiert auf dem CenterNet2-Framework und verwendet ein leichtes VoVNet als Backbone, um die Erkennungsgeschwindigkeit zu gewährleisten; die Kerninnovation ist die Entwicklung eines parallelen Dual-Attention-Merkmalsfusionmoduls, bei dem das kanalübergreifende Aufmerksamkeitsmodul die Kanal-Dimensionen neu kalibriert und das räumliche Gruppenaufmerksamkeitsmodul sich auf die Schlüsselbereiche des Objekts konzentriert. Diese beiden Module arbeiten synergistisch, um die diskriminative Merkmalsfusion zu verstärken und die Abfragebilddetektion präzise zu steuern. Getestet auf einem Erz-Datensatz erzielte das vorgeschlagene Modell eine mittlere Genauigkeit (AP) von 55,2 %, AP50 und AP75 von 78,5 % bzw. 66,9 %, eine Inferenzgeschwindigkeit von 57 Frames pro Sekunde (FPS), wobei die Parameter des Aufmerksamkeitsmoduls nur 16,1 Megabyte (MB) betragen, was ein hervorragendes Gleichgewicht zwischen Genauigkeit und Effizienz zeigt. Experimente zeigen, dass die Methode die Wahrnehmungsleistung bei der Körnungsdetektion von Erzen mit kleinen Stichproben effektiv verbessert und ein hohes Potenzial für den Einsatz an der Edge besitzt, wodurch eine zuverlässige technische Lösung für die Echtzeiterkennung unter rechenbegrenzten Bedingungen im intelligenten Bergbau bereitgestellt wird.

关键词

Computervision; Objekterkennung mit kleinen Stichproben; Leichtgewichtigkeit; Erzbilder; Echtzeiterkennung

阅读全文