Novaja pryłada štučnaha intelektu Point-E dazvalaje karystalnikam stvarać 3D-abjekty, vykarystoŭvajučy tolki tekstavyja padkazki

Čarhovaj prystupkaj, jakuju zachopić śviet štučnaha intelektu, mohuć stać hienieratary 3D-madelaŭ. Kampanija OpenAI prezientavała prahramu z adkrytym zychodnym kodam Point-E, jakaja ŭjaŭlaje saboj sistemu mašynnaha navučańnia, što stvaraje 3D-abjekt pa tekstavaj padkazcy.

22.12.2022 / 21:18

Vyjava: OpenAI, TechCrunch

Zhodna z dakumientam, apublikavanym razam z bazaj koda, Point-E moža stvarać 3D-madeli za adnu-dźvie chviliny na adnym hrafičnym pracesary Nvidia V100.

Vydańnie TechCrunch paviedamlaje, što Point-E nie stvaraje 3D-abjekty ŭ tradycyjnym razumieńni. Chutčej, jon stvaraje «vobłaki kropak» abo dyskretnyja nabory kropak danych u prastory, jakija ŭjaŭlajuć saboj trochmiernuju formu — adsiul i nazva. (Point z anhlijskaj aznačaje «kropka», a litara «E» — heta skaračeńnie ad «efiektyŭnaść», tamu što heta byccam by chutčej, čym papiarednija padychody da hienieracyi 3D-abjektaŭ.) Vobłaki kropak lahčej sintezavać z punktu hledžańnia vyličeńniaŭ, ale jany nie fiksujuć drobnaziarnisty abjekt formy abo tekstury. Heta klučavoje abmiežavańnie Point-E na ciapierašni čas.

Kab abyści hetaje abmiežavańnie, kamanda Point-E navučyła dadatkovuju sistemu štučnaha intelektu pieraŭtvarać vobłaki kropak Point-E u sietki — nabory viaršyniaŭ, rebraŭ i hraniaŭ, jakija vyznačajuć abjekt i zvyčajna vykarystoŭvajucca ŭ 3D-madelavańni i dyzajnie. Ale ŭ artykule jany adznačajuć, što madel moža časam prapuskać peŭnyja častki abjektaŭ, što pryvodzić da «błokavych» ci skažonych formaŭ.

Aproč madeli hienieracyi sietak, jakaja staić asobna, Point-E składajecca ź dźviuch madelaŭ: madeli «tekst-u-malunak» i madeli «malunak-u-3D». Madel pieraŭtvareńnia tekstu ŭ malunak padobnaja da takich hienieratyŭnych mastackich sistem, jak ułasnyja DALL-E 2 i Stable Diffusion ad OpenAI. Jana była navučana na admysłovych vyjavach, kab zrazumieć suviazi pamiž słovami i vizualnymi paniaćciami. Madeli pieraŭtvareńnia vyjavy ŭ 3D, ź inšaha boku, byli «skormlenyja» nabory malunkaŭ u pary z 3D-abjektami, kab madel navučyłasia efiektyŭna pierachodzić pamiž imi.

Pry atrymańni tekstavaj padkazki — naprykład, «šaściareńka dla 3D-druku, adna šaściareńka dyjamietram 3 dziujmy i taŭščynioj paŭdziujma» — madel pieraŭtvareńnia tekstu ŭ malunak stvaraje sintetyčny vizualizavany abjekt, što padajecca ŭ madel «malunak-u-3D», jakaja ŭ svaju čarhu ŭžo stvaraje vobłaka kropak.

Pracuje heta pakul nie idealna — madel «malunak-u-3D» časam nie moža zrazumieć vidarys z madeli «tekst-u-malunak», što pryvodzić da formy, jakaja nie adpaviadaje tekstavaj padkazcy. Tym nie mienš, heta na paradak chutčej, čym papiarednija samyja sučasnyja pryłady — prynamsi, pavodle kamandy OpenAI.

Prykłady pamyłak madelavańnia / Vyjava: OpenAI, TechCrunch

Daśledčyki OpenAI adznačajuć, što vobłaki kropak Point-E možna vykarystoŭvać dla stvareńnia abjektaŭ realnaha śvietu, naprykład, z dapamohaj 3D-druku. A z dadatkovaj dapracoŭkaj i jak tolki madeli stanuć krychu bolš adšlifavanymi, jany taksama mohuć znajści svoj šlach u raspracoŭcy hulniaŭ i animacyi.

OpenAI nie pieršaja kampanija, jakaja ŭstupiła ŭ baraćbu za raspracoŭku 3D-hienierataraŭ. Raniej sioleta Google vypuściła DreamFusion, pašyranuju viersiju Dream Fields, hienieratyŭnaj 3D-sistemy, jakuju kampanija prezientavała jašče ŭ 2021 hodzie. U adroźnieńnie ad Dream Fields, DreamFusion nie patrabuje papiaredniaha navučańnia — heta aznačaje, što jana moža stvarać 3D-reprezientacyi abjektaŭ biez 3D-danych.

U ciapierašni čas usie pohlady skiravanyja na hienieratary 2D-mastactva, ale štučny intelekt, jaki sintezuje 3D-madeli, moža stać nastupnym bujnym razburalnikam haliny. 3D-madeli šyroka vykarystoŭvajucca ŭ kino i telebačańni, dyzajnie interjeraŭ, architektury i roznych halinach navuki. Architekturnyja firmy vykarystoŭvajuć ich, naprykład, dla demanstracyi prapanavanych budynkaŭ i łandšaftaŭ, u toj čas jak inžyniery vykarystoŭvajuć madeli ŭ jakaści prajektaŭ novych pryład, transpartnych srodkaŭ i zbudavańniaŭ.

Kanviertacyja abłokaŭ kropak u sietki / Vyjava: OpenAI, TechCrunch

Stvareńnie 3D-madelaŭ zvyčajna zajmaje niekatory čas — ad niekalkich hadzin da niekalkich dzion. Pryłada štučnaha intelektu, kštałtu Point-E, mahła b źmianić heta. Pytańnie ŭ tym, jakija sprečki ab intelektualnaj ułasnaści mohuć uźniknuć z časam. Isnuje vialiki rynak 3D-madelaŭ ź niekalkimi internet-placoŭkami, u tym liku CGStudio i CreativeMarket, jakija dazvalajuć mastakam i dyzajnieram pradavać stvorany imi kantent.

Takim čynam, kali Point-E pryžyviecca i jaho madeli źjaviacca na rynkach, mastaki-madelisty mohuć pratestavać, pakazvajučy na ​​dokazy taho, što sučasny hienieratyŭny štučny intelekt šmat u čym zapazyčvaje z navučalnych danych: u vypadku Point-E — ź isnujučych 3D-madelaŭ. Jak i DALL-E 2, Point-E nie zhadvaje i nie cytuje vykanaŭcaŭ, jakija mahli paŭpłyvać na jaho pracy. OpenAI pakidaje hetuju prablemu na inšy dzień.

Pa słovach daśledčykaŭ, jany čakajuć, što Point-E budzie pakutavać ad inšych prablem, takich jak praduziataść, uspadkavanaja ad navučalnych danych, a taksama vykarystańnie pryłady dla stvareńnia «niebiaśpiečnych abjektaŭ». Mahčyma, tamu jany aściarožna charaktaryzujuć Point-E jak «adpraŭny punkt», jaki, jak jany spadziajucca, natchnić na «dalejšuju pracu» ŭ halinie sintezu tekstu ŭ 3D.

Nashaniva.com