Распазнаванне твараў: што гэта такое, як яно працуе і якія здольнасці беларускіх сілавікоў
Многіх беларусаў затрымалі праз тое, што яны «засвяціліся» на пратэстах. Расказваем, як працуе сістэма распазнавання твараў, што могуць беларускія спецслужбы і ці абараняюць ад ідэнтыфікацыі кепка і акуляры.
Распазнаванне твараў — гэта сапраўдная навука
Раней распазнаваннем твараў займаліся крыміналісты, якія мелі ўласныя методыкі, і рабілася гэта ўручную, што патрабавала шмат часу. На самых ранніх этапах развіцця камп'ютары не маглі распазнаваць твары, бо ім не хапала магутнасці.
Першыя эксперыменты па распазнаванні твараў з дапамогай камп'ютараў у 1960-я праводзіла група даследчыкаў з ЗША на замову спецслужбаў. Мэта была ў тым, каб праверыць, ці можа быць увогуле магчымым камп'ютарнае распазнаванне твараў, якое на той момант ніколі не рэалізоўвалася. Методыка была ў тым, што даследчыкі абазначалі рукамі «апорныя пункты», як нос або скулы, пасля праграма паварочвала здымкі і вылічвала адлегласці між апорнымі пунктамі. Вынік быў станоўчы.
Такім чынам даследчыкі даказалі, што камп'ютар увогуле здольны да распазнавання твараў (і робіць гэта хутчэй за людзей) і далі штуршок гэтаму кірунку — найперш для мэтаў крыміналістыкі. Але рабілася гэта ўсё яшчэ марудна (апрацоўвалася да 40 фота ў гадзіну) і патрабавала шмат ручной працы.
Толькі на самым пачатку 90-х даследчыкі распрацавалі сістэму, якая дазваляла распазнаваць твары цалкам аўтаматычна, але дакладнасць была далёкай ад ідэалу, ды і твар мусіў быць сфатаграфаваны ў анфас і цалкам нерухома. Сістэмы распазнавання твараў увайшлі ў шырокі ўжытак толькі ў сярэдзіне 2000-х і пры гэтым моцна прасунуліся. Face Recognition Challenge, праведзены ў 2006-м, паказаў, што алгарытмы сталі ў 100 разоў больш дакладнымі з 1995 года — то-бок усяго за дзесяць гадоў.
У 2010-м Facebook паказаў уласную тэхналогію распазнавання твараў, якая аўтаматычна пазначала людзей на фота. А ў 2017-м выйшаў першы ў свеце смартфон, які можна было разблакаваць з дапамогай твару — Apple X з функцыяй Face ID. Кітай яшчэ ў 2006-м пачаў праграму па развіцці тэхналогій распазнавання твараў і збудаваў самую прасунутую сістэму сачэння за сваімі грамадзянамі ў свеце, якая дагэтуль удасканальваецца.
Як гэта працуе цяпер?
Цяпер распазнаванне твараў мае вельмі высокую дакладнасць. Каб гэта зрабіць, спатрэбілася 60 гадоў няспыннай працы і павелічэнне магутнасці камп'ютараў на некалькі парадкаў. Гэтыя сістэмы дагэтуль далёкія ад ідэалу, але працуюць у сотні тысяч разоў лепей, чым на досвітку гэтай навукі.
Распазнаванне твараў робяць сістэмы, як правіла, зробленыя з дапамогай нейрасетак. Прычым не адной нейрасеткі, а некалькіх, аб'яднаных у адну, кожная з якіх выконвае сваю функцыю і перадае інфармацыю далей. Гэта наглядна паказана ў відэа.
Задача першай з нейрасетак — знайсці на фота твары ўвогуле. Яна шукае нейкія ўніверсальныя параметры любога твару чалавека і спрабуе выдзеліць іх унутры выявы.
Наступная нейрасетка спрабуе зразумець, наколькі «якасныя» гэтыя выявы. У выпадку з тварамі: вельмі груба кажучы, наколькі яны блізкія да «фота чалавека анфас з добрым асвятленнем», бо якраз так бачная максімальная колькасць унікальных параметраў твару. Прыклад добрага фота — здымак на пашпарт ці на візу. Гэта трэба для таго, каб не перадаваць далей зусім няякасныя (фота з нейкага боку ў руху, да прыкладу) або памылкова адшуканыя фота людзей, бо нейрасеткі ўсё ж не зусім дакладныя.
Наступная нейрасетка азначае адмысловыя пункты на фота, якія называюць «антрапаметрычнымі» або «знакавымі». У розных сістэмах розная іх колькасць — звычайна ад 20 да 60 (але бывае і болей). Гэта пункты на элементах твару, якія ў выніку могуць адназначна вылучыць твар сярод іншых з той ці іншай дакладнасцю.
Наступная нейрасетка на аснове выніковай выявы і антрапаметрычных пунктаў фармуе нейкі набор лічбаў, вектар. Гэта набор з соцень лічбаў, якія характарызуюць канкрэтна гэты твар.
У выніку, калі вы загружаеце дзве выявы нейкіх твараў, сістэма фармуе з іх лікі, якія пры параўнанні паказваюць, наколькі гэтыя твары падобныя для алгарытмаў. Вы атрымліваеце значэнне ў адсотках, якое кажа, наколькі, па меркаванні нейрасеткі, вялікая імавернасць таго, што на дзвюх (ці болей) выявах адзін і той жа чалавек. Калі пройдзеная мяжа ў нейкі адсотак, то людзі лічацца аднолькавымі.
Такім чынам, з такім дасканалым алгарытмам распазнавання нейрасетцы не важны макіяж або пахудзенне ці атлусценне. Акрамя таго, на вынік ніяк не ўплывае прычоска. Нейрасетка таксама здольная супаставіць твары, калі яны зацемненыя або бачныя не цалкам (да прыкладу, чалавек у акулярах), але тады дакладнасць значна падае. Узрост часам уплывае на падабенства, але алгарытмы ў шмат якіх выпадках здольныя знаходзіць людзей з розніцай у колькі заўгодна гадоў.
Але бываюць і «фальшывыя пазітыўныя» ці «негатыўныя» вынікі. То-бок нейрасеткам нельга давяраць на 100%, дзеля чаго звычайна выкарыстоўваецца шматступеньчатая сістэма праверкі асобы: у ЕС гэта фотафіксацыя і фіксацыя адбіткаў пальцаў пры запыце на атрыманне нейкага дакумента (візы, ДНЖ, новага пашпарта і г. д.).
Тэхналогіі развіваюцца, і неўзабаве будзе магчыма распазнаваць твары людзей нават у выпадку, калі яны зрабілі сабе пластычную аперацыю. Бо на твары ёсць шэраг нязменных рысаў, унікальных для кожнага чалавека (адлегласць паміж вачыма, адлегласць ад вуха да вуха, пераноссе, форма і памер вачэй).
«Кейс Эрыка Клентана»
Але ці дастаткова маскі і акуляраў, каб надзейна схавацца ад распазнавання? Не заўжды. Для гэтага мы раскажам пра адзін адметны выпадак, калі для гэтага не спатрэбілася нават дапамога спецслужбаў. У англамоўных артыкулах гэты выпадак назвалі Eric Clanton case.
Бойкі паміж крайнімі кансерватарамі і актывістамі руху «антыфа» (прадстаўнікі крайне левых, якія вядуць вулічнае супрацьстаянне з крайне правымі) — гэта звыклая справа. Звычайна для гэтага людзі ўзбройваюцца бутафорскімі шчытамі з ДСП і дубінкамі, а таксама надзяваюць на галовы шлемы. Гэта частка своеасаблівага «пратэснага перформансу» ў ЗША, як і пагромы падчас дэманстрацый у Францыі ці Грэцыі. Паліцыя да гэтага таксама гатовая і ведае, што рабіць, але звычайна не ўмешваецца, пакуль справы не набываюць сур'ёзнага характару.
На адной з чарговых дэманстрацый у Берклі 15 красавіка 2017 года, у якой сутыкнуліся крайнія кансерватары і «антыфа» ў ЗША, з'явіўся мужчына, які спадцішка біў людзей цяжкім роварным замком і збягаў. У выніку некалькі чалавек атрымалі траўмы, з іх аднаму спатрэбілася шпіталізацыя. Мужчына быў у масцы і ў акулярах, якія, здавалася б, цалкам баранілі яго ад ідэнтыфікацыі. Але за справу ўзяліся карыстальнікі «ценявога» форуму 4chan: іх абурыла, што гэты чалавек выкарыстоўваў даволі небяспечную зброю супраць бяззбройных людзей і проста збягаў.
Яны сабралі ўсе магчымыя фота гэтага чалавека, праглядзеўшы сотні здымкаў і відэа відавочцаў. Ім трапіўся вось гэты чалавек, які незадоўга быў ля месца дэманстрацыі і меў падобны заплечнік.
Таксама ў тых, хто шукаў гэтага чалавека, была частка фота, на якой было відаць, што чалавек носіць бараду. Звярнулі ўвагу на ягоныя боты і акуляры. І супаставілі гэта з фота з сацыяльных сетак чалавека, адшукаўшы шэраг супадзенняў.
У выніку ўдалося адшукаць фота, дзе чалавек з фота быў у тых жа ботах, што і на дэманстрацыі, і ў тых жа акулярах. Таксама ў яго барада і такая ж форма твару. Падазраваным аказаўся Эрык Клентан, выкладчык філасофіі ў Diablo Valley College. Пасля гэтага мужчыну арыштавалі і асудзілі на тры гады ўмоўнага тэрміну, а таксама звольнілі з каледжа.
А якія магчымасці ёсць у беларускіх спецслужбаў?
Насамрэч, яны моцна адстаюць ад замежных калег, але сістэма працуе. Па-першае, існуюць «звычайныя» камеры, якія пакуль не падключаныя ні да якой сістэмы аўтаматычнага распазнавання твараў, і іх большасць (у сталіцы такіх, напрыклад, 6 тысяч). Усё ж у параўнанні з Масквой ці Пекінам грошы ў запуск і абслугоўванне сістэмы аўтаматычнага распазнавання твараў укладаюцца малыя (абслугоўванне адной «разумнай» камеры абыходзілася ў 2020-м у 50-60 даляраў штогод). «Простыя» камеры, да прыкладу, ёсць на кожным доме ля пад'ездаў: у іх нізкая якасць відэа, але яны дазваляюць прасачыць шлях падазраванага па нейкай мясцовасці пры правядзенні аператыўна-вышуковых мерапрыемстваў.
Таксама існуе сістэма, якая падтрымлівае аўтаматычнае распазнаванне ўжо вядомых твараў — тое, што часта называюць «сістэмай Kipod», хоць у рэчаіснасці абслугоўвае яе ўжо іншая кампанія, а сайт арыгінальнага «Кіпода» не працуе. Такіх камер у Беларусі, па звестках МУС ад красавіка 2023-га, троху болей за 1100 і ўсе яны ў Мінску, але спецслужбы кажуць, што хацелі б павялічыць іх колькасць у пяць разоў. На 2020 год камеры распазнавалі твары з дакладнасцю 94% і маглі распазнаць да 20 чалавек у кадры, але якая дакладнасць новай сістэмы — незразумела.
Таксама не да канца зразумела, якія яе рэальныя магчымасці. Дырэктар Synesis, кампаніі, якая абслугоўвала раней Kipod, казаў, што сістэма мела абмежаваныя магчымасці і не магла распазнаваць усіх грамадзянаў Беларусі нават тэарэтычна, бо проста не пацягнула б такі аб'ём звестак пра столькі людзей у такой колькасці пунктаў адначасова. У яе можна загрузіць абмежаваную колькасць асобаў, якіх яна можа адсочваць і ідэнтыфікаваць. У любым разе гэта тысячы або дзясяткі тысячаў чалавек.
Новая сістэма пакуль трымаецца ў таямніцы, і яе магчымасці незразумелыя. Магчыма, распазнаванне для патрэбаў крыміналістыкі дагэтуль робіцца ў ручным рэжыме: бяруцца скрыншоты з камераў, на якіх чалавек «засвяціўся», а спецслужбіст уручную «прабівае» іх па базе АІС «Пашпарт», у якой ёсць фота ўсіх беларусаў. Падобная сістэма ёсць і ў «Кіберпартызанаў».
Але калі чалавек не быў распазнаны аўтаматычна і не засвяціў твар, то яго маршрут пры жаданні могуць адсачыць па розных пунктах. Тады імавернасць паспяховай ідэнтыфікацыі будзе значна вышэйшай.
Якія фоты звычайна выкарыстоўваюць для пошуку пратэстоўцаў? Былы супрацоўнік ГУБАЗіКа Станіслаў Лупаносаў расказваў, што гэта відэа, знятыя ціхарамі, запісы з гарадскіх камер і фота, зробленыя ў РУУС пры затрыманні людзей.
Па яго словах, калі трэба ідэнтыфікаваць чалавека, то стоп-кадр з камеры звяраюць з пашпартнымі фота ці здымкамі ў базе ДАІ.
«Ідэнтыфікацыя ідзе толькі па твары, па адзенні і па паходцы не адбываецца», — апісваў Лупаносаў.
Разам з тым нядаўна быў суд, на якім жыхарку Жлобіна асудзілі за ўдзел у пратэстах, пазнаўшы па кашулі. Пры аглядзе канфіскаванай у дзяўчыны кашулі і супастаўленні яе з відэафайламі камер відэаназірання суд вызначыў, што якраз у ёй яна была ў той вечар на акцыі пратэсту. Але ў гэтым кейсе наўрад ці кашуля стала першапачатковай зачэпкай.
Каго можа ці не можа распазнаць сістэма?
Сістэма не можа распазнаць чалавека, калі закрытыя антрапаметрычныя пункты на твары. Самы просты варыянт — камплект з маскі, якая цалкам закрывае нос і рот, ці вялікага рэспіратара, кепкі і цёмных акуляраў, якія шчыльна прылягаюць да твару. Таксама гэта можа быць маска на ўвесь твар або балаклава. Важна не змяняць гэтую канструкцыю на працягу ўсяго маршруту пад камерамі і не пераадзявацца там, дзе ёсць камеры.
Пры гэтым крыміналісты здольныя выдзеліць пастфактум яшчэ шмат прыкметаў, па якіх можна распазнаць чалавека. Да прыкладу, форма галавы і прычоскі, «пасадка» і колер вачэй, татуіроўкі, «дэвайсы» і аксесуары, паўсядзённае адзенне.
Але нават у самым базавым варыянце на пошук кожнага асобнага чалавека патрабуецца болей часу. І ў натоўпе гэта значна змяншае імавернасць, што чалавека адшукаюць, бо аўтаматычны пошук у такім выпадку не працуе, а шукаць уручную нашмат складаней і даражэй проста фінансава.
Але ж у нашы дні і ў нашай краіне немагчыма хадзіць у масцы пастаянна. Пандэмія скончылася, і кожны чалавек у масцы на вуліцы імгненна прыцягне да сябе ўвагу міліцыі. Дый ніякі чалавек не здольны ідэальна пралічыць размяшчэнне відэакамер ды іншыя, не звязаныя з відэаназіраннем, фактары.
На жаль, рэальнасць такая, што ў таталітарных краінах у эпоху развітога відэаназірання чалавек, на гэты момант жыхар гарадоў, робіцца татальна падкантрольны ўладам, якія здольныя адсочваць кожнае яго перамяшчэнне і амаль кожнае дзеянне ў вулічнай прасторы.
«Наша Нiва» — бастыён беларушчыны
ПАДТРЫМАЦЬМесенджары, камеры, жучкі. Як спецслужбы могуць праслухоўваць беларусаў і чаго асцерагацца?
За масквічамі сочаць адразу чатыры алгарытмы распазнавання асоб. Адзін з іх — скандальна вядомы беларускі
Затрымліваюць людзей, у якіх адшукалі фота з пратэстаў у Google Photos. Як абараніць сябе — пакрокавы гайд
Каментары