
Интерактивная обработка изображений для робастного распознавания геометрических примитивов
https://doi.org/10.31854/1813-324X-2025-11-2-41-48
EDN: SCTROE
Аннотация
Распознавание геометрических примитивов используется при обработке изображений для решения задач, связанных с машинным обучением, сокращением области анализа и уменьшением вычислительной сложности. Одной из проблем распознавания примитивов является зависимость результатов обработки от таких внешних факторов как: широкий диапазон изменения яркости, контрастности, наличие помех, посторонних объектов или загрязнения. Отдельной задачей является определение геометрического положения примитива на изображении, которое определяется смещением, поворотом и масштабом или параметрами более сложной математической модели трансформации. Интерактивный способ обработки позволяет обеспечить робастность к пространственно-яркостным искажениям и различным помехам.
Целью настоящей статьи является повышение качества распознавания геометрических примитивов на изображениях за счет интерактивной обработки.
Сущность предлагаемого решения заключается в проведении двух этапов: этап предварительной обработки в интерактивном режиме и этап оценки геометрических параметров примитива с автоматическим удалением импульсных помех. На первом этапе выбирается порог для детектирования контура примитива и ограничение области анализа (выбор фрагмента) на изображении. Определение этих параметров проводится с помощью графического интерфейса в интерактивном режиме (например, изменение порога детектирования практически мгновенно отображает распознанные контуры на изображении). На втором этапе в соответствии с формой примитива выделяется область интереса, что убирает импульсные помехи (контурные точки, не принадлежащие примитиву), а по точкам в области интереса оцениваются параметры примитива методом наименьших квадратов. Разработанный алгоритм имеет реализацию в виде программы с графическим интерфейсом. Эксперименты для проверки разработанного алгоритма показали удовлетворительное распознавание геометрического примитива «окружность» на различных типах изображений, содержащих дорожный знак, частицу полимерного геля, феррулу оптического адаптера. Научная новизна решения состоит в возможности распознавания примитивов, которое робастно к пространственно-яркостным преобразованиям (масштабу, смещениям, неравномерности яркости и т. д.) и другим помехам.
Теоретическая значимость состоит в расширении возможностей методов распознавания за счет интерактивного выбора параметров на этапе предобработки.
Практическая значимость заключается в упрощении алгоритмов обработки изображений, которые используются при решении прикладных задач (подготовки данных машинного обучения, обработка методами оптической микрометрии), не требующих распознавания в режиме реального времени.
Ключевые слова
Об авторе
А. А. ДиязитдиноваРоссия
кандидат технических наук, доцент кафедры информационных систем и технологий Поволжского государственного университета телекоммуникаций и информатики
Список литературы
1. Шульга Т.Э., Солопекин Д.А. Распознавание дорожных знаков российского образца с использованием нейронных сетей // Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2024. № 2. С. 85–94. DOI:10.24143/2072-9502-2024-2-85-94. EDN:LTLMXA
2. Rajesh R., Rajeev K., Suchithra K., Lekhesh V.P., Gopakumar V., Ragesh N.K. Coherence vector of Oriented Gradients for traffic sign recognition using Neural Networks // Proceedings of the International Joint Conference on Neural Networks (San Jose, USA, 31 July ‒ 05 August 2011). IEEE, 2011. PP. 907–910. DOI:10.1109/IJCNN.2011.6033318. EDN:PKQGGB
3. Атавуллаева Ш.Ш., Ферапонтов Н.Б., Тробов Х.Т., Турсунова Г.Х., Джураева Р.А. Определение состава растворов смесей электролитов методом оптической микрометрии // Universum: химия и биология. 2024. № 11-2(125). С. 46‒51. DOI:10.32743/UniChem.2024.125.11.18355. EDN:HYSJJG
4. Токмачев М.Г. Методика оценки объема гранулы полимерного геля в оптической микрометрии // Компьютерная оптика. 2023. Т. 47. № 6. С. 968–971. DOI:10.18287/2412-6179-CO-1271. EDN:OJTKGA
5. Bourdine A.V., Pashin S.S., Zaitseva E.S., Vasilets A.A., Antonov S.A. Fast and simple method for estimation of the in-sertion loss at the connection of singlemode optical fibers with contaminated ferrule end faces // Proceedings of the XVIIth International Scientific and Technical Conference "Optical Technologies for Telecommunications" (Kazan, Russian Federation, 19–21 November 2019). SPIE, 2020. Vol. 11516. P. 115161O. DOI:10.1117/12.2566456. EDN:GGNEOJ
6. Пашин С.С. Исследование потенциальных возможностей оценивания коэффициента передачи основной моды на основе анализа перекрытия радиального распределения полей в дискретном представлении // Инфокоммуникационные технологии. 2021. Т. 19. № 2. С. 172–178. DOI:10.18469/ikt.2021.19.2.05. EDN:QIKRUK
7. Canny J. A Computational Approach to Edge Detection // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1986. Vol. PAMI-8. Iss. 6. PP. 679–698. DOI:10.1109/TPAMI.1986.4767851
8. Chochia P.A. Image segmentation via contour tracking in application to the analysis of the photographs of electronic microcircuits // Journal of Communications Technology and Electronics. 2010. Vol. 55. Iss. 12. PP. 1466–1473. DOI:10.1134/S1064226910120193
9. Boykov Y., Jolly M.-P. Interactive Organ Segmentation Using Graph Cuts // Proceedings of the 3rd International Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI 2000, Pittsburgh, USA, 11‒14 October 2000). Lecture Notes in Computer Science. Berlin, Heidelberg: Springer, 2000. Vol. 1935. PP. 276–286. DOI:10.1007/978-3-540-40899-4_28
10. Пашин С.С. Разработка методов контроля параметров передачи разъемных соединений оптических волокон кабелей связи. Дис. … канд. техн. наук. Самара: Поволжский государственный университет телекоммуникаций и информатики, 2022. 221 с. EDN:KBOFZL
11. Konushin A., Shakhuro V. Traffic sign recognition // Graphics and Media Lab. UTL: https://graphics.cs.msu.ru/projects/traffic-sign-recognition.html (дата обращения 05.01.2025)
12. Каретин А.Н. МНК для апроксимации данных окружностью. 2010. URL: https://mykaralw.narod.ru/articles/mnk_circle.pdf (дата обращения 05.01.2025)
Рецензия
Для цитирования:
Диязитдинова А.А. Интерактивная обработка изображений для робастного распознавания геометрических примитивов. Труды учебных заведений связи. 2025;11(2):41-48. https://doi.org/10.31854/1813-324X-2025-11-2-41-48. EDN: SCTROE
For citation:
Diyazitdinova A.A. Interactive Image Processing for Robust Geometric Primitives Recognition. Proceedings of Telecommunication Universities. 2025;11(2):41-48. (In Russ.) https://doi.org/10.31854/1813-324X-2025-11-2-41-48. EDN: SCTROE