Hintergrund :
Zum Auftakt unserer Artikelserie im Lixo Journal Club möchten wir Ihnen den Artikel ZeroWaste: Toward Automated Waste Recycling von Bashkirova et al. vorstellen, der auf der "2022 Conference on Computer Vision and Pattern recognition" präsentiert wurde!
Dies ist eine besondere Art von Artikel, da er nicht eine neue Architektur oder eine Verlustberechnung verbessert, sondern einen neuen Datensatz für die Erkennung und Segmentierung von Objekten auf Bildern von Abfallentsorgungsanlagen veröffentlicht.
Warum haben wir diesen Artikel gewählt?
Der ZeroWaste-Datensatz ist der erste frei zugängliche Datensatz, der Bilder von Sortieranlagen liefert, insbesondere von einem Förderer (Laufband), der Papier ("faserig" im Vokabular der Industrie) enthält. Diese Bilder unterscheiden sich von bekannten Datensätzen wie COCO oder PASCAL VOC.
Die Objekte auf dem Bild sind stark verzerrt, zerfetzt, übereinander und ineinander verschachtelt. Diese Vielfalt nimmt ständig zu, da jeden Tag neue Produkte und Verpackungen auf den Markt kommen.
Daher stellt diese Art von Datensatz ein großes Problem dar, wenn bestimmte Klassen unterrepräsentiert sind. Die Annotation ist außerdem extrem zeitaufwendig und technisch so anspruchsvoll, dass sie die Aufsicht von Experten aus der Abfallindustrie erfordert.
Aus all diesen Gründen sind diese gelabelten Bilder sehr wertvoll, entweder um ein bestehendes Modell zu verbessern oder um gezielt neue Ideen zu testen.
Inwiefern ist das innovativ?
Das Hauptziel dieses Artikels ist es, Forschern einen Datensatz zur Verfügung zu stellen, damit sie die Probleme der Sortierzentren angehen und neue Algorithmen entwickeln können, um diese Herausforderungen zu überwinden.
In ihrem Artikel veröffentlichen sie :
- ein vollständig gelabelter Datensatz ;
- einen nicht gelabelten Datensatz für das halbüberwachte Lernen ;
- ein um Objekte aus TACO (Trash Annotation in COntext) erweiterter Datensatz zur Bekämpfung von "class imbalance".
Der Artikel bietet außerdem eine Referenzgrundlage für die Segmentierung von Instanzen mithilfe von Mask-RCNN, TridentNet und DeepLabV3+.
Wo liegen ihre Grenzen?
Das Erfassen von Bildern
Ihre Modelle haben Mühe, die Leistung zu erreichen, die wir in den üblichen Artikeln über die Erkennung von Objekten oder die Segmentierung von Instanzen sehen. Sie liegen auch unter der Leistung, die wir bei einem ähnlichen Förderer haben. Eine mögliche Erklärung ist das Bildaufnahmeprotokoll, das sie verwenden.
Bei Lixo verwenden wir eine Kamera, die näher am Förderband ist, mit hellerem Licht, um die Unschärfe zu reduzieren und die Bildqualität zu verbessern. Wir glauben, dass der Algorithmus zur Beseitigung der Unschärfe (SRN-Deblur) und die Entfernung des Fischauges, die sie anwenden mussten, um ihre endgültigen Bilder zu erhalten, die Bildqualität verringern. Diese Transformationen sind der Grund für die schlechtere Leistung des Modells bei kleinen Objekten.
Taxonomie
Die zweite große Einschränkung ist die verwendete Klassentaxonomie. Aus der Sicht eines Fachmanns für Abfallwirtschaft wäre sie viel zu begrenzt: Es gibt nicht genug Klassen, um einen Abfallstrom genau zu klassifizieren. Bei Lixo haben wir eine viel detailliertere Klassentaxonomie. Beispielsweise unterscheiden wir jeden Kunststoff nach seinem Harz (helles PET, farbiges PET, HDPE usw.), um eine echte Vorstellung von der Qualität des Abfalls und seinem Wiederverwertungswert zu erhalten.
Schlussfolgerung
Zusammenfassend lässt sich sagen, dass wir es großartig finden, dass sich Forscher an Universitäten mit der Abfallwirtschaft beschäftigen, und wir sind sehr gespannt darauf, was sie zu diesem Bereich beitragen können.
Ihr Ansatz zeigt aber auch, wie wichtig es ist, mit den Bedürfnissen der Kunden Schritt zu halten. Denn Kunden aus der Abfallwirtschaft wollen nicht nur "Verunreinigungen" identifizieren, sondern auch den Anteil der Verunreinigungen in einem bestimmten Strom verstehen. Dieser Anteil, ob er nun als % der Gesamtobjekte oder als % der Masse angegeben wird, erfordert die Erkennung von 100 % der Objekte auf dem Bild.
Lixo glänzt, indem es seinen Kunden beides (Identifizierung von Schadstoffen + Zielmaterial) liefert, und wir glauben, dass dies einen riesigen Unterschied bei der Analyse von Abfallströmen macht!
Weitere Informationen :
- ZeroWaste dataset: Towards Deformable Object Segmentation in Cluttered Scenes, Dina Bashkirova, Mohamed Abdelfattah, Ziliang Zhu, James Akl, Fadi Alladkani, Ping HuVitaly Ablavsky, Berk Calli, Sarah Adel Bargal and Kate Saenko (2021)