Keeawayt
- DALL·E on uusi hermoverkko, joka voi piirtää kuvia tekstin perusteella.
- Verkko on yksi kasvava määrä tekoälyprojekteja, jotka voivat jäljitellä ihmisten luovaa tulosta.
- Asiantuntijat sanovat, että tekoälyn piirtämät kuvat eivät ole alkuperäisiä luomuksia.
Siirry, Picasso. Uusi hermoverkko voi piirtää kuvia tekstin perusteella.
DALL·E, taiteilija Salvador Dalín ja Pixarin WALL·E:n nimien portti, voi ottaa minkä tahansa tekstin ja luoda siitä kuvan. Järjestelmä käyttää neuroverkkoa, joka on koulutettu miljardeihin kuviin ja tekstiesimerkkeihin. Se on yksi kasvava määrä tekoälyprojekteja, jotka voivat jäljitellä, mutta ei kopioida, ihmisten luovaa tulosta.
"Koska luonnollinen kieli kehittyy jatkuvasti ja on hyvin riippuvainen kontekstuaalisista vivahteista, koneen opettaminen ymmärtämään kieltä tarpeeksi hyvin kuvan piirtämiseksi on erittäin merkittävä saavutus", Tamara Schwartz, kyberturvallisuuden professori York College of Pennsylvaniassa, sanoi sähköpostihaastattelussa. "Kuvittele poliisin luonnospiirtäjä, joka on harvinainen lahjakkuus, jolla on kyky luoda kuva todistajan kuvauksen perusteella."
Big datan käyttö kuvien tuottamiseen
DALL-E:n loi tekoälytutkimusyhtiö OpenAI, ja se toimii keräämällä v altavia määriä tietoa Internetistä. Tiedot käsitellään sitten luonnollisen kielen mallilla ja opetetaan tuottamaan kuvia tekstistä. DALL-E toimii samalla tavalla kuin äskettäin julkaistu GPT-3, OpenAI:n luoma kielimalli, jota voidaan kehottaa luomaan alkuperäisiä tekstikohtia. GPT-3 opetettiin käyttämällä puoli biljoonaa sanaa Internet-tekstiä, ja se voi tuottaa yllättävän todenmukaista tekstiä.
Koneen opettaminen ymmärtämään kieltä tarpeeksi hyvin kuvan piirtämistä varten on erittäin merkittävä saavutus.
Michael Yurushkin, tietotiedeyrityksen BroutonLabin perustaja ja teknologiajohtaja, sanoi sähköpostihaastattelussa, että DALL-E on "yksi ihmiskunnan harvoista onnistuneista töistä jäljitellä luovuuttamme ja mielikuvitustamme". Hän lisäsi: "On helpompi ymmärtää, kuinka tekoäly ennustaa jotain käymällä läpi asiaankuuluvia tietoja, mutta on vaikeampaa ymmärtää, kuinka se pystyy luomaan piirustuksia asioista, joista se ei ole koskaan "kuullut".
Schwartz kiinnittää huomiota siihen, että tekoäly ei luo tietoa, vaan pikemminkin ottaa kielidataa ja muuntaa ne kuviksi.
"Alkuperäinen luovuus tulee ihmisestä, joka rakensi tehtävän", Schwartz sanoi. "Tekoälyssä on jonkin verran "luovuutta", koska se kokeilee erilaisia datayhdistelmiä ja valitsee sitten useista mahdollisista tulosteista. Ihminen kuitenkin tutkii ulostuloja ja opettaa tekoälyä valitsemaan monista yhdistelmistä."
Robotitiivityö?
Kone voi kokeilla tätä datan ja objektin yhdistelmää paljon nopeammin kuin taiteilija ihminen. Schwartz huomautti, että DALL-E voisi jonain päivänä tehdä yhteistyötä etsivän kanssa, joka yrittää rekonstruoida rikospaikan luonnoksen avulla silminnäkijän todistajanlausuntojen perusteella.
"Kun todistajat antavat lausuntonsa, tietokone voisi ottaa puhutun, luonnollisen kielen tiedon ja luoda piirustuksen paikasta tai useita piirroksia paikasta", hän sanoi. "Nämä visualisoinnit voitaisiin sitten integroida tarkemman kuvan luomiseksi kadonneista todisteista. Tätä visualisointia voitaisiin rikastaa yhdistämällä aiemmat kuvat rikosta edeltäneestä sijainnista."
Useat muut tekoälypohjaiset ohjelmat voivat tuottaa taidetta. Esimerkiksi Ai-Da käyttää taiteen luomiseen robottikäsivarsijärjestelmää ja kasvojentunnistustekniikkaa yhdistettynä tekoälyyn. Järjestelmä voi analysoida koneen eteen asetettua kuvaa, joka syötetään algoritmiin, joka tuottaa robotin käsivarren liikkeet.
Ihmistaiteilijoiden ei kuitenkaan pitäisi olla huolissaan siitä, että robottiherrat korvaavat heidät, väitti Ahmed Elgammal, Rutgersin yliopiston taiteen ja tekoälyn laboratorion johtaja The New York Timesissa viime vuonna.
"Vaikka taiteen määritelmä kehittyy jatkuvasti, se on ytimessä kommunikaatiomuoto ihmisten välillä", hän kirjoitti. "Ilman inhimillistä taiteilijaa koneen takana, tekoäly ei voi tehdä muuta kuin leikkiä muodolla, tarkoittaapa se sitten pikseleiden manipulointia näytöllä tai nuotteja musiikissa. Nämä toiminnot voivat olla mukaansatempaavia ja havainnollisesti kiehtovia, mutta niillä ei ole merkitystä ilman keskinäistä vuorovaikutusta. taiteilija ja yleisö."
Katsottuani DALL-E:n töitä ymmärrän Elgammalin näkemyksen, että tekoälyn luomat kuvat eivät ole taidetta. Toisa alta ne ovat parempia kuin mikään taide, jonka voisin luoda. Joten todella, mitä eroa on?