Алгоритм Текномо–Фернандеса є ефективним алгоритмом для створення фонового зображення заданої відеопослідовності.
Припускаючи, що фонове зображення відображається на більшій частині відео, алгоритм може створити хороше фонове зображення відео за час , використовуючи лише невелику кількість бінарних операцій і бітових операцій, які потребують невеликої кількості пам’яті та мають вбудовані оператори, які є в багатьох мовах програмування, таких як C, C++ і Java . [1][2][3]
Історія
Відстеження людей на відео зазвичай включає віднімання фону, щоб відокремити передній план від фону. Таким чином, після виділення зображень переднього плану, їх можна використати для необхідних алгоритмів поставленої задачі (наприклад, для відстеження руху, відстеження об’єктів і розпізнавання обличчя ). [1]
Однак для віднімання фону потрібно, щоб фонове зображення вже було доступним, і, на жаль, це не завжди так. Традиційно фонове зображення шукається вручну або автоматично серед зображень з відео, коли на них немає об’єктів. Нещодавно була запропонована автоматична генерація фону за допомогою виявлення об’єктів, медіальної фільтрації, медоїдної фільтрації, апроксимованої медіанної фільтрації, лінійного прогностичного фільтра, непараметричної моделі, фільтра Калмана та адаптивного згладжування ; однак більшість цих методів мають високу обчислювальну складність і ресурсомісткі. [4]
Алгоритм Текномо-Фернандеса також є алгоритмом автоматичного створення фону. Однак його перевагою є лише швидкість обчислення за час , який залежить від роздільної здатності зображення, а його точність досягається в межах керованої кількості кадрів. Щоб створити фонове зображення, потрібно лише принаймні три кадри з відео, якщо припустити, що для кожного пікселя фон є у більшості кадрів. Крім того, це може працювати як для сірих, так і для кольорових відео.
Припущення
Камера нерухома.
Освітленість середовища змінюється лише повільно відносно рухів людей у сцені.
Люди не проводять більшу частину часу в одному місці.
Однак, як правило, алгоритм безумовно працюватиме, якщо виконується таке єдине важливе припущення:
Для кожної позиції пікселя більшість значень пікселів у всьому відео містить піксельне значення фактичного фонового зображення у цій позиції. [1]
Поки кожна частина фону відображається в більшій частині відео, фонове зображення повністю не повинно з’являтися в жодному з його кадрів. Очікується, що алгоритм працюватиме точно. [1]
Створення фонового зображення
Рівняння
Вісім можливових значень трьох бінарних зображень і їх булева функція S
0
0
0
0
1
1
1
1
0
0
1
1
0
0
1
1
0
1
0
1
0
1
0
1
0
0
0
1
0
1
1
1
Для трьох бінарних кадрів з послідовності зображень (відео) , , і , фонове зображення отримують з рівняння , де це виключна диз'юнкція (XOR). [1]
Булева функція дорівнює одиниці, коли кількість одиниць перевищує половину кількості зображень, так що [1]
Таким чином, для 3 зображень фонове зображення може бути прийнято як значення 1 у S, або[1]
Алгоритм створення фону
На першому рівні три кадри вибираються випадковим чином із послідовності зображень для створення фонового зображення шляхом їх комбінування за допомогою першого рівняння. Це дає краще фонове зображення на другому рівні. Процедуру повторюють до бажаного рівня . [1]
Теоретична точність
На рівні , ймовірність , що передбачений модальний біт є фактичним модальним бітом, представлена рівнянням . У таблиці нижче подано обчислені значення ймовірності на кількох рівнях із використанням різних початкових ймовірностей. Можна помітити, що навіть якщо модальний біт у розглянутій позиції знаходиться на 60% кадрів, ймовірність визначення точного модального біта вже перевищує 99% на 6 рівні. [1]
Просторова складність
Потреба в просторі алгоритма Текномо–Фернандеса визначається функцією , яка залежить від роздільної здатності зображення, числа кадрів у відео та потрібну кількість рівнів. Проте через те, що , ймовірно, не перевищить 6, складність простору зменшується до . [1]
Часова складність
Весь алгоритм відпрацбовує за час , який залежить тільки від роздільної здатності зображення.
Обчислення модального біта для кожного біта можна виконати за час , в той час як обчислення для всього фонового зображення з трьох заданих зображень можна виконати за час . Кількість зображень для обробки в рівнів є . Однак, оскільки , то це насправді , таким чином алгоритм виконується за час . [1]
Варіанти
Розроблено варіант алгоритму Текномо–Фернандеса, який включає метод Монте-Карло під назвою CRF. Було реалізовано дві різні конфігурації CRF: CRF9,2 і CRF81,1. Експерименти на деяких кольорових відеопослідовностях показали, що конфігурації CRF перевершують алгоритм Текномо–Фернандеса з точки зору точності. Однак алгоритм Текномо–Фернандеса залишається більш ефективним з точки зору часу обробки. [5]
↑ абвгдежиклмTeknomo, Kardi; Fernandez, Proceso (2015). Background Image Generation Using Boolean Operations. arXiv:1510.00889 [cs.CV].
↑Abu, Patricia Angela; Fernandez, Proceso (2014). Performance Comparison of the Teknomo-Fernandez Algorithm on the RGB and HSV Colour Spaces. 2014 International Conference on Humanoid, Nanotechnology, Information Technology, Communication and Control, Environment and Management (HNICEM). с. 1—6. doi:10.1109/HNICEM.2014.7016262. ISBN978-1-4799-4020-2.
Chu, Varian Sherwin B. (2013). Background image reconstruction using random frame sampling and logical bit operations (Дипломна робота). Ateneo de Manila University.
Abu, Patricia Angela R. (2015). Improving the Teknomo-Fernandez Background Image Modeling Algorithm for Foreground Segmentation (Дипломна робота). Ateneo de Manila University.