Навука і тэхналогіі33

Як гэта працуе: машынны пераклад з розных моваў

7 студзеня 1954 года ў штаб-кватэры карпарацыі IBM у Нью-Ёрку адбыўся так званы «Джорджтаўнскі эксперымент», падчас якога быў паспяхова прадэманстраваны цалкам аўтаматычны пераклад некалькіх дзясяткаў розных сказаў з рускай мовы на ангельскую.

Той пераклад быў вельмі просты: у слоўніку было ўсяго 250 словаў і 6 правілаў, таму сістэма магла перакласці толькі некалькі самых прымітыўных фраз. Але мэтай было прыцягненне ўвагі да машыннага перакладу і дэманстрацыя яго перспектыўнасці.

Цяпер, дзякуючы інтэрнэту, кожнае незнаёмае слова ці сказ можна за некалькі секунд перакласці на родную мову, і гэты пераклад атрымаецца даволі дакладны. Што ж змянілася з тых часоў? Які цяпер прынцып працы аўтаматычных перакладчыкаў і якая будучыня ў жывых перакладчыкаў-прафесіяналаў?

Сучасныя анлайн-перакладчыкі (самы вядомы з якіх — Google Translate) выкарыстоўваюць статыстычны машынны пераклад, у працэсе якога камп’ютарная праграма аналізуе велізарны масіў тэкстаў, перакладзеных людзьмі, і перакладае слоўнік і граматыку адной мовы на іншую ў лічбавым фармаце. Гучыць складана? Давайце разбірацца.

Велізарны масіў тэкстаў складаецца з вялікай колькасці моўных пар — тэкстаў, якія маюць дзве дакладныя моўныя версіі (перакладзеныя чалавекам). У якасці такіх тэкстаў звычайна выкарыстоўваюцца афіцыйныя дакументы шматмоўных краін, дзе пераклад дакументацыі ёсць абавязковым на ўсе дзяржаўныя мовы. Такія пераклады заўсёды найбольш дасканалыя, бо дзяржаўныя дакументы вырашаюць лёс асобных людзей і краіны ў цэлым. Таксама вельмі карыснымі аказаліся шматмоўныя дакументы, якія выпускаюцца ААН. 

Аналізуючы пары розных тэкстаў, сістэма «вучыцца», засвойваючы з кожным разам усё больш новых правілаў. Такім чынам будуецца мадэль мовы.

Таксама кожная сістэма аўтаматычнага перакладу мае мадэль перакладу — «слоўнік», у якім для ўсіх словаў і фраз на адной мове пералічаныя магчымыя пераклады на іншую мову з указаннем верагоднасці гэтых перакладаў. Мадэлі перакладу для кожнай пары моваў утрымліваюць мільёны пар слоў і словазлучэнняў.

Калі вы перакладаеце з англійскай мовы на беларускую, задзейнічаюцца дзве моўныя пары: беларуская-руская і руская-англійская. То бок спачатку тэкст перакладаецца с англійскай на рускую, а потым — з рускай на беларускую.

Такі шлях найбольш рацыянальны, бо дакументаў, якія б мелі дасканалыя англійскую і беларускую версіі — няшмат, і просты пераклад з англійскай на беларускую атрымліваўся б вельмі няякасным праз недастатковую «навучанасць» сістэмы.

Непасрэдна перакладам займаецца дэкодар — алгарытм, які праводзіць аналіз тэксту і для кожнага слова падбірае ўсе варыянты перакладу, упарадкоўваючы іх па змяншэнні верагоднасці. Затым усе атрыманыя варыянты дэкодар ацэньвае з дапамогай мадэлі мовы на частату ўжывання і выбірае прапанову з найлепшым спалучэннем верагоднасці і частаты.

На жаль, цяпер няма сэрвісу аўтаматычнага перакладу, які б мог перакласці тэкст з такой жа дакладнасцю, як і чалавек-перакладчык. Але ўжо цяпер некаторыя кампаніі ўкараняюць у машынны пераклад нейронныя сеткі, якія значна паляпшаюць яго якасць.

Таму можна меркаваць, што з цягам часу спецыялісты-перакладчыкі будуць патрэбныя толькі для стварэння складаных мастацкіх перакладаў, што значна скароціць колькасць людзей, занятых у гэтай сферы. Але наўрад ці гэта вельмі блізкая перспектыва. А як лічыце вы?

Чытайце таксама: Наступная рэвалюцыя ў інфарматыцы — нейронныя сеткі (распавядаем пра нейронныя сеткі простымі словамі)

Каментары3

Як склаўся лёс хлопца з вядомага жыццесцвярджальнага фота студэнцкага маршу-2020?6

Як склаўся лёс хлопца з вядомага жыццесцвярджальнага фота студэнцкага маршу-2020?

Усе навіны →
Усе навіны

Падпісанне міру з Украінай «заўтра» падтрымалі б 79% расіян3

Дзмітрый Мядзведзеў назваў умову спынення вайны ва Украіне5

У Ашмянах сёння было мінус 8,8°С2

Вядомая спявачка выйграла права карыстацца сваім імем у Аўстраліі

Беларусы адкрылі ў Варшаве салон кухняў, але кліенты так і не дачакаліся сваіх заказаў

Вядомага трэнера па ўсходніх адзінаборствах судзяць за жаданне ваяваць за Украіну2

Канапацкая сцвярджае, што яе каманда збірае ў дзень мінімум па чатыры тысячы подпісаў8

Памятаеце міністра спорту Качана, які ўляпаўся ў туалетны скандал? Яго цяперашняя пасада не ўражвае3

Цягнік Мінск — Гомель прыбыў на канцавую станцыю са спазненнем на чатыры з паловай гадзіны

больш чытаных навін
больш лайканых навін

Як склаўся лёс хлопца з вядомага жыццесцвярджальнага фота студэнцкага маршу-2020?6

Як склаўся лёс хлопца з вядомага жыццесцвярджальнага фота студэнцкага маршу-2020?

Галоўнае
Усе навіны →