Štučny intelekt užo praz dva hady moža vyčarpać resursy z adkrytych krynic
Krynicaj dla navučańnia novych madelaŭ mohuć stać pryvatnyja danyja. Heta dazvolić pratrymacca da kanca dziesiacihodździa.
Vyniki novaha daśledavańnia pakazvajuć, što sistemy štučnaha intelektu (ŠI) mohuć vykarystać usie jakasnyja ahulnadastupnyja danyja, jakija raźmieščany ŭ interniecie, u pieryjad pamiž 2026 i 2032-m hadami, što moža pryvieści da adnosnaj stahnacyi ŭ hetaj vobłaści.
U svaich acenkach daśledčyki vykarystoŭvali veb-indeks Google. Pa ich padlikach, u ciapierašni čas isnuje kala 250 miljardaŭ veb-staronak, jakija źmiaščajuć 7 Kb tekstu na staronku. Kab sprahnazavać rost dastupnaha zapasu danych navukoŭcy praviali analiz trafiku internet-pratakoła (IP) — patoku dadzienych u sietcy – i aktyŭnaści karystalnikaŭ u internecie.
Raźliki pakazali, što infarmacyja z nadziejnych krynic skončycca ŭ lepšym vypadku da 2032 hoda, u horšym — užo praz dva hady, u 2026-m.
Kali razhladać danyja nizkaj jakaści, jakija pryvodziać da vydačy paradaŭ kštałtu dadavańnia kleju ŭ picu ci ŭžyvańnia ŭ ježu kamieńnia, jak heta było ŭ vypadku z štučnym intelektam Gemini ad Google, jaki dla adkazaŭ vykarystoŭvaŭ pasty na Reddit i artykuły z satyryčnaha sajta The Onion, to jany skončacca pamiž 2030 i 2050-m hadami.
Pytańnie adnosna zdolnaści raspracoŭščykaŭ va ŭmovach niedachopu novych danych pavysić efiektyŭnaść svaich madelej zastajecca adkrytym. Aŭtary bačać niekalki mahčymych sposabaŭ jaho vyrašeńnia.
Pieršy — vykarystańnie pryvatnych danych. Pa słovach adnaho z aŭtaraŭ daśledavańnia Pabła Viljałobasa (Pablo Villalobos) z centra Epoch IA (ZŠA), kali ŭ kampanij atrymajecca ich vykarystać, i pry hetym kaštoŭnaść pryvatnych danych budzie supastaŭnaja z kaštoŭnaściu ahulnadastupnych danych, to całkam vierahodna, što stvaralniki ŠI pratrymajucca da kanca dziesiacihodździa.
Ale vykarystańnie pryvatnych danych, jakija abaronieny aŭtarskim pravam ci pravam na tajamnicu asabistaha žyćcia, moža mieć jurydyčnyja prablemy. Viadomy vypadki, kali stvaralniki kantentu padavali ŭ sud na takija kampanii, jak Microsoft, OpenAI i Stability AI, vykazvajučy pratest niesankcyjanavanamu vykarystańniu ich tekstaŭ dla navučańnia madelaŭ ŠI. Rašeńniem prablemy mahła b stać vypłata raspracoŭščykami niejrasietak uznaharodžańnia aŭtaram kantentu.
Inšym varyjantam moža być vykarystańnie sintetyčnych danych — štučna zhienieravanych. Takija danyja paśpiachova ŭžyvalisia tolki ŭ sistemach navučańnia hulniam, prahramavańniu i matematycy.
Daśledčyki adznačajuć, što niedachop danych — nie adzinaja prablema na šlachu dalejšaha ŭdaskanaleńnia ŠI. Na im jość i inšyja vuzkija miescy — rost enierhaspažyvańnia, vydatki na navučańnie i dastupnaść abstalavańnia. Tak, pa danych Mižnarodnaha enierhietyčnaha ahienctva, pošuk u Google z vykarystańniem ChatGPT spažyvaje amal u 10 razoŭ bolš elektryčnaści, čym tradycyjny.
Kamientary