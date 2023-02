În lumea inteligenței artificiale se desfășoară în prezent o cursă de prezentare a noilor produse. Nu demult, Google a anunțat că intenționează să lanseze Bard, un chatbot de căutare bazat pe modelul său brevetat de LLM (Large Language Model). Tot recent, Microsoft a organizat un eveniment în care a dezvăluit o nouă generație de browser web cu o interfață Bing ultra-performantă, bazată pe ChatGPT.

Deși majoritatea marilor companii de tehnologie și-au dezvoltat în secret de ani de zile propriile instrumente de inteligență artificială generativă, acești giganți se străduiesc să-și demonstreze abilitățile după lansarea publică și succesul exploziv al programului ChatGPT, creat de OpenAI, care a atras peste 30 de milioane de utilizatori în două luni, analizează Charlie Warzel pentru The Atlantic.

Succesul obținut de OpenAI este un semnal evident pentru liderii din domeniul tehnologiei că programele capabile să învețe reprezintă următoarea frontieră a internetului comercial.

Promotorii AI vă vor spune, de asemenea, că AI generativă este destinată să înlocuiască nu doar motoarele de căutare, ci și munca creativă, munca de birou, să compună documente, să rezolve teme, să facă rezumate, sau chiar să predea.

Astfel spus, ea va restructura și va reinventa lumea.

În prezent, este dificil să deosebim exagerările de entuziasmul autentic, dar având în vedere miliardele de dolari care se investesc în această tehnologie, merită să ne întrebăm: Cum va arăta lumea dacă susținătorii AI au dreptate?

Dacă această schimbare de paradigmă produsă de inteligența artificială va avea loc, o abilitate esențială a secolului XXI ar putea fi aceea de a comunica eficient cu mașinile. Iar deocamdată, acest proces implică scrierea – sau, în limbajul tech, conceperea de comenzi pentru AI.

Programele generatoare de imagini precum DALL-E 2 și Midjourney și instrumentele de generare de text precum ChatGPT sunt prezentate drept un mijloc de creație. Dar, pentru a crea, trebuie să știi cum să ghidezi mașinile către rezultatul dorit.

A-i cere programului ChatGPT să facă o fișă de lectură de cinci paragrafe despre Ferma animalelor va produce rezultate slabe, greșite chiar. Dar dacă scrieți dumneavoastră paragraful introductiv și cereți programului să completeze eseul, mașina va primi un context valoros.

O variantă și mai bună ar fi să-i dați instrucțiuni programului: „Compune o fișă de lectură de cinci paragrafe, pentru nivelul de educație superioară, utilizând un mod de exprimare elegant, care să se bazeze pe istoria romanului alegoric satiric Ferma animalelor. Fă referire la lucrarea ‘Why I write’ a lui Orwell și explică alegerile stilistice ale autorului în roman“.

Rezultatul va fi mult mai sofisticat și mai convingător.

Instrucțiunile bune nu sunt doar clare. Ele par să reflecte o înțelegere mai profundă a programului pe care încercați să îl utilizați. Un mod de a înțelege procesul compunerii de instrucțiuni prin sistemul încercare și eroare îl reprezintă încercarea de a afla de unde se inspiră programul și cum organizează și indexează AI informațiile pe care le are la dispoziție.

În ciuda faptului că îmi câștig existența ca scriitor, de obicei sunt mult prea vag când dau instrucțiuni programelor DALL-E 2 și Midjourney. Când l-am pus pe nepotul meu în vârstă de 8 ani să se joace cu Midjourney, vara trecută, imaginația lui a inventat scene încântătoare, cum ar fi un purice care face surf pe un tsunami luptându-se cu o viespe gigantică, dar, chiar și împreună, nu am reușit să formulăm comenzi potrivite care să dea viață viziunii sale specifice.

În primul rând, puricele său nu semăna destul de mult cu un personaj de desene animate; apoi, modificările pe care le-am adus eu au făcut ca totul să devină hiperrealist și prea înfricoșător pentru el.

Îi lipsea limbajul stilistic pentru a comunica cu programul și, aparent, și mie la fel.

Pentru a-i ajuta pe cei ca mine și nepotul meu, a apărut deja o industrie a celor capabili să comunice în mod eficient cu mașinile. Pe PromptBase, o piață de desfacere pentru creatorii de comenzi, puteți achiziționa câteva rânduri de text pe care să le utilizați cu orice programe generative-AI.

Unele dintre cele mai populare comenzi disponibile includ generarea de „randări 3D de emoji făcuți din argilă“ pentru DALL-E 2 sau crearea de logo-uri elegante și moderne prin intermediul Midjourney.

Există comenzi care promit să genereze noi logo-uri pentru echipele sportive și îmbunătățiri ale textului, cum ar fi Sentence Expander. Pentru $3,99, Book Summarizer promite o comandă care va ajuta la „extragerea informațiilor esențiale și a celor care trebuie reținute dintr-o carte“.

Al șaselea cel mai popular vânzător de pe PromptBase, un creator de comenzi din Spania, cunoscut sub numele de Imagineer, mi-a spus că pentru el, crearea de comenzi este deocamdată o slujbă secundară, care i-a adus puțin peste 800 de euro din septembrie.

„Pentru mine, este aproape ca un joc“, mi-a explicat. „Îmi place să mă gândesc la aceste comenzi ca la niște mici comori“.

Capacitatea lui de a compune instrucțiuni este sporită de faptul că are cunoștințe de design, ilustrație și fotografie. Când l-am întrebat de ce se consideră bun la formularea de astfel de comenzi, a sugerat că este vorba de un amestec de abilități naturale și strategie.

„Mi-am dat seama că mă pricepeam mai bine să comunic cu Midjourney decât cu alți oameni“, a spus el. Iar cu Midjourney a ajuns la rezultate excelente cu mai puțin efort decât atunci când folosea DALL-E 2 și Stable Diffusion, o altă variantă de program.

Imagineer a afirmat că cel mai important element al unei comenzi bune este iterația. O comandă bună „generează rezultate consecvente și previzibile, iar acest lucru îl obții generând o mulțime de imagini și studiind variațiile atunci când modifici unele cuvinte sau parametri“, mi s-a explicat.

Expertiza în domeniu este esențială și pentru programele generatoare de text. Dan Shipper, antreprenor și scriitor, folosește ChatGPT de la lansarea sa, în noiembrie, pentru a-l ajuta să compună articole pentru blog, al căror principal subiect este acum viitorul instrumentelor de inteligență artificială.

Atunci când trebuie să descrie un concept (de exemplu, teoria filozofică a utilitarismului, pentru o postare despre regele criptomonedelor căzut în dizgrație, Sam Bankman-Fried), el va cere programului ChatGPT să facă un rezumat de câteva fraze al celor mai importante idei, destinat publicului larg.

După ce inteligența artificială furnizează textul, Shipper îl revizuiește, îl verifică pentru a se asigura că este corect și apoi îl îmbunătățește cu propriile sale înflorituri retorice.

„Mă ajută să sar peste o etapă – dar numai dacă am cunoștințe pe subiect, astfel încât să pot formula o comandă bună și apoi să verific produsul obținut“, mi-a spus el.

Shipper a comparat formularea de instrucțiuni pentru ChatGPT cu gestionarea unui tânăr angajat, deștept și dornic de afirmare: programul ce generează text este strălucit, dar și lipsit de experiență și, prin urmare, sunt mari șanse să comită greșeli – subtile, dar cruciale.

De asemenea, este expert în a spune prostii atunci când nu are răspunsul. Pentru a crea o comandă bună, e nevoie de pricepere și experiență, calități pe care Shipper le atribuie unui bun manager.

În ziua în care am stat de vorbă, mi-a dat ca exemplu Shipper, a cerut programului ChatGPT să îi alcătuiască un rezumat amănunțit pentru un articol lung la care lucra.

„Am scris mai multe paragrafe și am spus: ‘Acestea sunt toate lucrurile, citatele și ideile pe care le-am colectat. Apoi, sub asta, am scris: Poți te rog să le aranjezi sub formă de schiță pentru un eseu?“.

Cu cât instrucțiunile incluse în comandă sunt mai detaliate, cu atât mai bun este rezultatul, a declarat Shipper.

Uneori, compunerea comenzii în sine generează o anumită bucurie. Meg Conley, o scriitoare care folosește programe de inteligență artificială în timpul liber, consideră că formularea de instrucțiuni reprezintă o provocare asemănătoare cu elaborarea unui eseu convingător:

„Foarte dificil. În cea mai mare parte, se soldează cu un eșec. Și devine bucurie pură atunci când cuvintele se îmbină în sfârșit într-o formă care seamănă puțin cu ideea pe care o ai tu în cap“, a scris ea pe Twitter, în noiembrie.

În cazul ei, e emoționant și din motive personale: Conley suferă de o maladie care o împiedică să vizualizeze imagini. După lansarea programului Midjourney, ea a stat frecvent trează până noaptea târziu, descriind lucruri din imaginația ei și perfecționându-și sugestiile până când imaginea rezultată corespundea.

Cel mai important, mi-a spus ea, este să ai cunoștințe despre programul pe care-l utilizezi. Fiecare este conceput și antrenat în mod diferit, ceea ce îi conferă o estetică și un limbaj unic, la fel cum oamenii ce vorbesc aceeași limbă au dialecte regionale și ciudățenii culturale.

„La fel cum operele literare diferă de lucrările cu caracter tehnic sau academice, există diferite moduri de a folosi limbajul, în funcție de audiență“, mi-a spus ea. „Cunosc persoane care sunt foarte pricepuți cu DALL-E 2, care pare să recompenseze capacitatea de a apela la referințe și combinații de elemente. Modul în care conceptualizez eu lumea corespunde mai mult cu modul în care funcționează programul Midjourney“, a spus ea.

De-a lungul timpului, Conley s-a obișnuit cu ordinea operațiunilor din respectivul program. „Am învățat importanța ordinii cuvintelor în instrucțiunile pe care le formulez“, mi-a explicat ea. „În Midjourney, dacă tastezi cuvântul fată înaintea adjectivului roșu, se va concentra mai mult pe fată decât pe culoarea roșu. Când ai instrucțiuni mai lungi, e ca un puzzle și înveți căror termeni să le dai mai multă importanță“.

Unii profesori sugerează deja că formularea comenzilor reprezintă o abilitate de care elevii lor ar putea avea nevoie în carieră. Ethan Mollick, profesor la Universitatea din Pennsylvania, al cărui domeniu de predare este inovația și antreprenoriatul, și-a revizuit programa după lansarea ChatGPT.

Într-unul dintre noile sale cursuri, Mollick cere studenților săi să își imagineze că ChatGPT este tot un student și să educe chatbotul, cerându-i să scrie un eseu pe o anumită temă.

La fel ca un profesor în timpul orelor de curs, elevii trebuie să ajute inteligența artificială să își perfecționeze eseul până când programul pare să stăpânească suficient de bine subiectul. Mollick speră că acest exercițiu îi va ajuta pe studenți să învețe prin explicații, cu avantajul suplimentar de a se obișnui să redacteze comenzi eficiente.

După cum spune Mollick, formularea de instrucțiuni pentru AI e un amestec între lingvistică și modalități de rezolvare a problemelor.

„Redactarea unor comenzi înseamnă programare în limbaj literar, cu rezultate ciudate și aleatorii“, mi-a spus el. „Cred că o comandă bine formulată recompensează probabil pe cei cu o gândire divergentă, care găsesc modalități de a experimenta rapid. Cred că îi recompensează pe oamenii care au curiozități profunde“.

Recompensează, de asemenea, și pe cei care au cunoștințe tehnice mai avansate. O imagine izbitoare pe care am descoperit-o pe serverul Discord al Midjourney a fost generată prin intermediul următoarei comenzi, extrem de detaliată:

„în stilul picturii metafizice, desen în creion colorat Smooth Shading & Blending, un răsărit de soare se reflectă într-un iaz într-o pădure deasă, crengile unei sălcii atârnă pe marginea iazului, melancolie, emoții intense, perspectivă profundă, iluminare naturală, ultradetaliat, contrast foarte ridicat, detalii complexe, fotografie, raytracing, octane rendering, unreal engine –ar 3:2 –s 999 –chaos 50 –v 4 –v 4 -“

Pe lângă cerințele detaliate incluse, comenzile eficiente tind să dezvăluie o conștientizare a abilităților programului pe care utilizatorul încearcă să le utilizeze. Octane Render și Unreal Engine sunt aplicații de animație digitală care produc grafică 3D pe calculator. Elemente precum — v4 sunt instrucțiuni pentru Midjourney de a utiliza versiunea mai nouă, mai performantă și mai experimentală a programului.

Unele dintre cele mai bune comenzi pentru imagini fotorealiste cer programului să imite un anumit tip de cameră sau de obiectiv; altele demonstrează o cunoaștere practică a istoriei artei sau a unui anumit stil artistic.

Aceasta amintește de primele zile ale motoarelor de căutare, când cei cu expertiză în simboluri logice, autori, cuvinte cheie, surse și căutări pe intervale de timp puteau genera rezultate mai bune.

Motoarele de căutare, desigur, nu mai necesită foarte multe cunoștințe. Pentru a impulsiona utilizarea lor și a răspunde nevoilor utilizatorilor, instrumentele Google au devenit mai performante, facilitând obținerea unui rezultat de înaltă calitate chiar și în cazul unei interogări simple sau neclare.

Mollick a sugerat că știința compunerii de comenzi ar putea fi pur și simplu un substitut – o modalitate rudimentară prin care să interacționăm cu AI până când aceasta va fi capabilă să priceapă ce îi cerem din instrucțiuni simple sau din alte mijloace, necunoscute deocamdată.

S-ar putea să aibă dreptate. Cei care au văzut primele testări ale programelor generatoare de text GPT-4 de la OpenAI (care nu sunt publice) vorbesc despre acestea ca despre ceva desprins din domeniul științifico-fantasticului și sugerează că următorul pas va face să se renunțe la vechile versiuni.

Iar recent, Microsoft a dezvăluit o interfață cu care, potrivit companiei, utilizatorii vor ajunge în cele din urmă să converseze așa cum o fac cu un asistent personal. În loc să căutați „Cât de mare este o Honda Odyssey?“ și „Dimensiunile canapelei IKEA Klippan“, ați putea cere chatbotului să vă rezolve întreaga problemă: Pot transporta canapeaua Klippan produsă de IKEA cu automobilul meu, Honda Odyssey 2019, dacă voi rabata scaunele?

Crearea de comenzi pentru AI ar putea fi doar o punte care să ne ducă în noua lume a oricărui program cu capacitate creativă care va mai apărea pe piață, dar, deocamdată, este dificil de apreciat cât de mult să crezi actuala propagandă.

Până la schimbarea paradigmei, rămân atras de formularea comenzilor pentru astfel de programe, care sunt de obicei mult mai interesante decât rezultatele pe care le generează. Atunci când oamenii împărtășesc arta sau textul generat de AI, o fac adesea împreună cu șirul de instrucțiuni care i-au dat viață.

A experimenta cu acele instrucțiuni, studiind rezultatul final, este revelator, chiar intim. Este ca și cum ai avea acces în creierul unei persoane pentru a vedea cum pune cap la cap segmente de informații, cum rezolvă o problemă sau cum își folosește creativitatea pentru a produce ceva surprinzător.

La fel ca scrisul și codarea înainte de aceasta, crearea de comenzi pentru AI reprezintă o formă emergentă de raționament. Ea se află undeva la intersecția dintre conversație și căutare, dintre programare și limbajul uzual. Este singurul element al acestui viitor nesigur și în schimbare rapidă care reflectă clar caracter uman.

