Kaip „Area4Labs“ naudoja dirbtinį intelektą, kad sukurtų paprastų muzikos scenų žemėlapius

Nuotrauka sukurta AI.
AI kupina teorinių ažiotažų, tačiau „Area4Labs“ taiko AI, kad sukurtų tikrus tiesioginių laidų planavimo sprendimus.
Toliau pateikiami „Area4Labs“, „Hearby“ kompanijos ir sparčiai augančios koncertų atradimo žaidėjai.
„Area4Labs“ stačia galva neria į dirbtinį intelektą ir ištyrė daugybę teoriškai įdomių galimybių. Tačiau mes taip pat kuriame konkrečius sprendimus, kurie pritraukia rimtų partnerysčių ir keičia žaidimą, kad būtų rodomi pasirodymai ir koncertų atradimai. Šiame straipsnyje pateiksiu jums apie tai, ką šiuo metu kuriame naudodami atradimų platformą ir programą „Hearby“.
Maždaug prieš trejus metus pradėjome taikyti dirbtinį intelektą savo mėgstamiems iššūkiams – nustatyti renginiuose grojančias grupes ir sukurti bendrosios paskirties renginių svetainės grandiklį. Žvelgiant atgal, šios problemos buvo viliojančios, tačiau jos buvo per daug ambicingos tuo metu turimoms technologijoms, be to, pirmiausia turėjome daug išmokti.
Dabar, kai turime šiek tiek ridos, dirbame su išplėstomis tų pačių galimybių versijomis: kaip rasti įvykius (įsigijimas) ir kaip sužinoti, kokie jie iš tikrųjų yra (klasifikacija). Įvykių paieška apima LLM, o klasifikacija naudoja statistinį modelį. Taip pat peržiūrime savo neuroninio tinklo juostos identifikavimo projektą.
Visame pasaulyje organizacijos rūšiuoja ažiotažą nuo realybės ir sugalvoja būdus, kaip išvengti arba užpildyti trūkumus, kad dabar būtų galima atlikti tikrą darbą.
GPT-4 yra labai įspūdingas, tačiau priversti jį atlikti ką nors į faktus orientuoto ir naudingo yra iššūkis. Pavyzdžiui, paprašius „geriausių vietų Bostone“, gausite dalinį ir pasenusį sąrašą. Tai puikus sąrašas, tačiau jame taip pat yra uždarų vietų ir nepasakoma, kas vyksta šį vakarą. Kad pridėtų žmogišką įspūdį, jis bus perkeltas į tikrąjį žmonių kuruojamą „Geriausių sąrašų sąrašą“, kuris yra tinkamas žinių rinkiniui, bet nieko, ko negalėtumėte rasti „Google“.
Aparatinė įranga šiems modeliams apmokyti yra nepaprastai brangi, todėl tai paliekama didelių korporacijų, tokių kaip „Google“, „Facebook“, „OpenAI“ ir „Amazon“, rankose, jau nekalbant apie sunkumus gauti švarius, etiškai gautus duomenis.
Tačiau šios uždaros durys dabar atsidaro dėl (palyginti) neseniai pažengusio tobulėjimo. Dėl to bendros paskirties modelius gali sukurti didelė organizacija, o vėliau juos įsigyti mažesnės grupės ir pakoreguoti, kad atitiktų specialius interesus ar poreikius.
Pasidalinsiu kai kuriais pastebėjimais, kai kovosime su šiomis problemomis, pradedant nuo:
- Tai nėra taip puiku, kaip manote
- Jums reikia švarių duomenų, kad galėtumėte išmokti (ir daug jų)
- Prižiūrimų ir neprižiūrimų bedugnė
- Keistas darbas, apie kurį niekada negirdėjote: „Prompt Engineer“
Pirmas pastebėjimas: tai nėra taip puiku, kaip manote
AI gali atlikti įspūdingas užduotis ir nesugebėti atlikti paprastų dalykų, kuriuos galėtų valdyti 5 metų vaikas (arba šuo). Apmaudu, kad kartais ChatGPT pateikia nuoseklų, naudingą atsakymą, bet kartais tiesiog grąžina šlamštą arba tiesiog atsisako atsakyti.
Atrodo paprasta įtraukti į faktų duomenų bazę, tačiau tai kerta dvi paradigmas: kompiuterinę informaciją ir žmogaus kalbą. Taigi, iššūkis, kaip ir žmonėms, yra aprašyti duomenų bazę ar užduotį žmonių kalba. Ši užduotis yra lygiai tokia gremėzdiška, kaip ir skamba, nes visi žinome bandydami paaiškinti kitam žmogui kažką sudėtingo.
Antras pastebėjimas: norint išmokti (ir daug jų), reikia švarių duomenų.
Modeliai turi mokytis iš jau išvalytų ir suskirstytų į kategorijas duomenų, kuriuos sunku rasti ir kuriais pasitikėti. Šiuos duomenis reikia gauti etiškai. Reikalingas kiekis – milijonai duomenų taškų – tai per daug. LLM pateikia iš anksto paruoštą modelį, kurį galima pritaikyti ir (arba) išplėsti, o tai palengvina šią apkrovą, bet nepašalina.
Trečia: prižiūrimas prieš neprižiūrimą
Prižiūrimas mokymasis prieš neprižiūrimą paprasčiausiai reiškia, ar modelis mokomas pagal suskirstytus duomenis (ty žinomas teisingas atsakymas), ar paliekamas jį išsiaiškinti atsitiktiniu būdu.
Rasti įvykius yra gana paprasta – pradedame nuo to, kur žinome, kad rasime muzikos renginius, pvz., bilietų pardavimo API, vietų svetainių rinkimą arba mažų vietų savaitės ar mėnesio tvarkaraščius.
Bet kaip dėl renginių, kurie reklamuojami atskirai ir be konteksto? Kavinės plakatas ar Google rezultatas? API įvykis, kuris nėra suskirstytas į kategorijas? Ar tai muzika, teatras, sportas ar šeima?
Jei matote „AC/DC prieš Led Zeppelin“, tiksliai žinote, kas tai yra – kokia muzika ir tikriausiai kokia vieta, minia ir atmosfera. Ir jei matote „Arsenal prieš Manchester United“, taip pat tiksliai žinote, kas tai yra. Tačiau gaila dirbtinio intelekto, kuris turi tai išsiaiškinti.
Iššūkis yra surinkti pakankamai renginių ir grupių ir visiškai juos suprasti, įskaitant tai, kokie įvykiai vyksta ir kokio tipo grupė ką groja – tada naudokite šią informaciją mašininio mokymosi modeliui parengti. Viską apsunkina tai, kad muzikos scenos skiriasi priklausomai nuo miesto ir net žanro. Jungtinėje Karalystėje populiarios tribute grupės; JAV, mažiau. Niujorke apmokytas modelis tikriausiai bus ne toks tikslus sujungdamas ir skirstydamas grupes Mančesteryje.
Galiausiai keistas darbas, apie kurį niekada negirdėjote: „Prompt Engineer“
Man, kaip visą gyvenimą trunkančiam programuotojui, būtinybė išversti idėjas, sąvokas ir reikalavimus į natūralią žmonių kalbą, norint gauti geriausius LLM, pavyzdžiui, ChatGPT, rezultatus, man yra nenatūraliausias. Esu įpratęs tai daryti įvairiomis kompiuterinėmis kalbomis, bet priešingai – keista. Neseniai pamačiau žavų AI meno kūrinį, kurį galiu apibūdinti tik kaip gražią oranžinę skraidančią viščiuką. Tik 2024-aisiais šie žodžiai netgi sutampa.
Bet kaip buvo sukurtas šis menas? AI menininkas sukūrė raginimą, tiksliai nurodydamas norimo vaizdo tipą ir toną. Gautas menas yra patrauklus ir unikalus.
Jei reikia daugiau į programinę įrangą panašių poreikių, tai yra Prompt Engineer darbas. Jie sugalvoja „ChatGPT“ raginimą, kuriame nurodoma ne tik ko norima, bet ir kaip tai gauti bei kokį toną naudoti. Naudodami LLM, kaip ir džiną butelyje, (tikriausiai) gausite tai, ko prašote, ir tai gali jus nustebinti.
Pirmą žingsnį šioje srityje pradėjome nuo teksto į SQL, o tai reiškia, kad kompiuterio problemą reikėjo suformuluoti kaip žmogaus kalbos direktyvą, kad kompiuteris galėtų ją „suprasti“ į kalbą orientuotose struktūrose. Mūsų vartojimui raginimas gali būti:
„Raskite įvykius ieškodami įvykių duomenų bazės lentelėje pagal vietą, tada ieškodami vietos lentelėje „Vietos“. Ypatingą dėmesį skirkite miestui ir nepainiokite miesto su grupės pavadinimu, nes kartais jie yra vienodi. Labai svarbu pirmiausia grąžinti greičiausius rezultatus. Pateikite rezultatus draugiško vadovo stiliumi.
Jei gerai pagalvoji, suformuluoti problemą žmonių kalba, kad kompiuteris ją suprastų, yra gana ironiškas darbas. Šiuo metu ieškome būdų, kaip optimizuoti savo duomenų bazę šiam pokalbių naudojimui, įskaitant OpenSearch ir vektorinių duomenų bazių peržiūrą.
Kai tyrinėjame tai vis daugiau ir kartais atsitrenkiame į varginančius sienas su šia neįtikėtina technologija, stengiuosi prisiminti, kad esame augimo fazėje, o augimas nėra linijinis. Mokymasis yra nepatogus, bet galutiniai rezultatai bus to verti.
Džiaugiuosi galimybėmis, kurias turi dirbtinis intelektas, kaip naudingą įrankį mūsų gyvenimui pagerinti, ir esu optimistas, kad galime jį panaudoti paaukštindami paprastų žmonių muziką.