Виявля́ння об'є́ктів (англ.object detection) — це комп'ютерна технологія, пов'язана з комп'ютерним баченням та обробкою зображень, яка має справу з виявлянням примірників семантичних об'єктів певного класу (таких як люди, будівлі чи автомобілі) у цифрових зображеннях та відео.[1] До добре досліджених областей виявляння об'єктів належать виявляння облич та виявляння пішоходів[en]. Виявляння об'єктів має застосування у багатьох сферах комп'ютерного бачення, включно з пошуком зображень[en] та відеоспостереженням.
Кожен клас об'єктів має свої ознаки, які допомагають у його класифікуванні — наприклад, усі кола круглі. Виявляння класу об'єктів використовує ці особливі ознаки. Наприклад, при пошуку кіл шукають об'єкти, що перебувають на певній відстані від якоїсь точки (тобто центру). Подібним чином, при пошуку квадратів потрібні об'єкти, які мають перпендикулярні кути та мають однакову довжину сторін. Подібний підхід використовують для встановлювання облич, де можливо знаходити очі, ніс і губи, а також такі ознаки, як колір шкіри та відстань між очима.
Методи
Методи виявляння об'єктів зазвичай належать або до нейромережних, або до ненейронних підходів. Для ненейронних підходів стає необхідним спочатку визначити ознаки за допомогою одного з наведених нижче методів, а потім використовувати метод, такий як опорновекторні машини (ОВМ, англ.SVM), щоби здійснювати класифікування. З іншого боку, нейронні методики здатні здійснювати наскрізне виявляння об'єктів без спеціального визначення ознак, і зазвичай ґрунтуються на згорткових нейронних мережах (ЗНМ, англ.CNN).
↑Alsanabani, Ala; Ahmed, Mohammed; AL Smadi, Ahmad (2020). Vehicle Counting Using Detecting-Tracking Combinations: A Comparative Analysis. 2020 the 4th International Conference on Video and Image Processing. с. 48—54. doi:10.1145/3447450.3447458. ISBN9781450389075. S2CID233194604. (англ.)
↑Redmon, Joseph (2016). You only look once: Unified, real-time object detection. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. arXiv:1506.02640. Bibcode:2015arXiv150602640R. (англ.)
↑Redmon, Joseph (2017). YOLO9000: better, faster, stronger. arXiv:1612.08242 [cs.CV]. (англ.)
↑Redmon, Joseph (2018). Yolov3: An incremental improvement. arXiv:1804.02767 [cs.CV]. (англ.)
↑Wang, Chien-Yao (2021). Scaled-YOLOv4: Scaling Cross Stage Partial Network. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). arXiv:2011.08036. Bibcode:2020arXiv201108036W. (англ.)
↑Zhang, Shifeng (2018). Single-Shot Refinement Neural Network for Object Detection. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. с. 4203—4212. arXiv:1711.06897. Bibcode:2017arXiv171106897Z. (англ.)
Перекладач повинен розуміти, що відповідальність за кінцевий вміст статті у Вікіпедії несе саме автор редагувань. Онлайн-переклад надається лише як корисний інструмент перегляду вмісту зрозумілою мовою. Не використовуйте невичитаний і невідкоригований машинний переклад у статтях української Вікіпедії!
Машинний переклад Google є корисною відправною точкою для перекладу, але перекладачам необхідно виправляти помилки та підтверджувати точність перекладу, а не просто скопіювати машинний переклад до української Вікіпедії.
Не перекладайте текст, який видається недостовірним або неякісним. Якщо можливо, перевірте текст за посиланнями, поданими в іншомовній статті.