Kaip Hearby naudoja AI pokalbius, kad padėtų gerbėjams rasti jiems patinkančios muzikos
„ChatGPT“ yra įspūdingas, tačiau jį sunku pritaikyti sprendžiant realias problemas. „Area4 Labs“ ir „Hearby“ kuria naudodami AI technologiją, kad sukurtų duomenimis pagrįstą tiesioginių įvykių konsjeržą.
Tai yra iš Hearby, sparčiai augančio koncertų atradimo žaidėjo ir DMN partnerio. Mėgaukitės!
Visas atskleidimas: „Traukinys“, kai tai taikoma „Chat“ technologijai, yra tas pats „traukinys“, kurį galėtume taikyti katėms. Tai yra, mes prašome jų daryti tai, ką jie vis tiek ketino daryti taip, kad jiems nepatiktų, ir tada sugalvojame, kaip džiaugtis tuo, ką jie padarė.
Tai buvo didžiausia mūsų pamoka kuriant „Ask Hearby“, mūsų AI pokalbių roboto muzikos konsjeržą. Šiame straipsnyje pateiksiu jums mūsų AI nuotykio užkulisius.
„Hearby“ siekiame naudoti technologijas, kad surastume ir patobulintume paprastų žmonių muziką ir padėtume žmonėms rasti nuostabią muziką, paslėptą jų apylinkėse. Nesvarbu, ar ieškote naktinio klubavimo, nemokamo klasikinio koncerto ar muzikos, kad vaikas nenusiviltų, viskas yra ten. Galbūt nesuvokiate, kad šalia esančiame pramonės parke, Liverpulio laivų statykloje arba Londono sendaikčių parduotuvėje yra puiki muzikos salė.
Norime, kad žmonės tyrinėtų ir rastų jiems patinkančią muziką, todėl daug laiko skyrėme investuodami į greitos paieškos technologijas, duomenimis pagrįstus filtrus ir žemėlapių vizualizacijas. Tada įbėgome tiesiai į „Per daug daiktų“ sieną.
Įeikite į pokalbių robotą, kuris leidžia gerbėjams greitai pereiti į priekį ir pasakyti, ko nori, neatliekant visų varginančių paieškos, filtravimo ir rezultatų peržiūros veiksmų. Tai daug darbo dėl to, kas turėtų būti smagu.
Tačiau mano patirtis su pokalbių robotais buvo didelė, todėl norėjome padaryti ką nors įdomesnio.
Pagrindinis mūsų gaminio reikalavimas buvo „būk naudingas ir neerzink“. Taip, mums prireikė daug laiko, kol tai gavome, ir kelis kartus per daug kartų nukritome nuo drakono. Tačiau buvo įdomu pamatyti, kaip veikia ši visur paplitusi technologija ir paskatinti daugiau idėjų bei svajonių. Iš esmės tai yra didelės kalbos modelio (LLM) naudojimo bandymas, ir aš užgniaužęs kvapą pasakysiu, kad galimybės yra neribotos.
Tai užtruko, bet po kelių bandymų pagaliau turime ką nors naudingo ir linksmo. Taigi čia yra užkulisiai apie tai, ką bandėme ir kas neveikė – ir kas galiausiai pavyko.
-
- Treniruokis, treniruokis ir dar kartą treniruokis.
- Duok man visus duomenis! Daugiau duomenų!
- Hibridai: kiek technologijų galime čia sutalpinti?
- Tai sumuštinis.
Taigi, pirmiausia, šiek tiek daugiau apie mokymą, kai kalbama apie mašininį mokymąsi.
Man reikia iškelti mokymo temą, iš dalies dėl savo dailaus pavadinimo, bet ir dėl to, kad ji yra visko, ką girdite apie AI, apačioje.
Norėdami išmokyti ML, pirmiausia pasirenkame neuroninio tinklo architektūrą, tada suteikiame jai daugybę duomenų elementų, pažymėtų teisingais atsakymais (pavyzdžiui, katė / šuo, marškinėliai / sijonas, pėsčiasis / stulpas). Šio tipo prižiūrimas mokymasis yra brangus skaičiavimo galia, reikalaujantis didžiulio kiekio etiškai gautų, tiksliai pažymėtų duomenų. Mokymas leidžia ML architektūrai – sluoksniams ir grįžtamojo ryšio kilpoms, sudarančius neuroninį tinklą – prisitaikyti, kad būtų sukurtos maksimaliai tikslios prognozės. Pavyzdžiui: „99 % tikimybė, kad šis vaizdas yra katė“.
Užsiėmimas ne tik kate/šuniu, bet ir tikrai svarbiu dalyku greitai tampa brangus ir atima daug laiko. Visiems, išskyrus didžiausius žaidėjus, dideliems duomenų rinkiniams tai yra gana sudėtinga. Įveskite LLM, kurie yra paruošti naudoti didžiulius žmogaus teksto kiekius, kad galėtų naudoti visus.
Tai suteikia mūsų pokalbių drakono galių: gebėjimas „suprasti“ žmonių kalbą, suprasti, ko klausiama, ir sukurti nuostabius atsakymus žmonių kalba. Dėl temos, ar yra realus žmogiškasis sąvokų supratimas, galiu pradėti ginčą tuščiame kambaryje (todėl aš ten neisiu). Mūsų tikslams tai nesvarbu, kol išvestis tiksli, naudinga, vertinga, saugi ir patikima.
Tai atveda mane prie mūsų iššūkio: kaip priversti jau išmokytas pokalbių technologijas daryti tai, ko norime.
Už nedidelę pinigų sumą ir didelį malonumą galite užsiprenumeruoti Open AI's ChatGPT, kuri mielai parašys jums laišką močiutei, kursinį darbą arba gana padorų romaną – bent jau geriau nei bet ką aš galiu parašyti. . Nesvarbu, ar tai bejėgė, ar perkamiausia, tai yra žiūrovo akyse, bet man labiau patinka tai fantastiška priemonė, padedanti paskatinti kūrybiškumą.
Bet kad ir kaip tai įspūdinga, šie paruošti atsakymai yra atskiri, o tokio tipo pokalbių robotas, kurį norėjome sukurti, yra pokalbis, kuris vystosi mums einant, atsižvelgiant į kontekstą ir neformalumą, paremtą tiksliu įvykiu, vieta, ir juostos duomenis. Taigi iššūkis yra tai, kaip sukurti kalba pagrįstą modelį, kuris įtrauktų šiuos išorinius duomenis ir panaudotų juos atsakymuose, ir kaip sukurti pokalbį jam progresuojant (atmintis).
Duomenys! Duok man visus duomenis!
Iššūkis yra įtraukti mūsų duomenis į „ChatGPT“, kad būtų galima pateikti atsakymus. „Įprastoje“ programoje tai yra programavimo reikalas. Tačiau LLM yra kitoks: o ne programavimas, o informacija turi būti pagrįsta tekstu, kad būtų priimta.
Keista, bet nelabai, kai prisimename, kad tai kalbos modelis. Būtent taip mes klausomės, gauname naują informaciją, ją suprantame ir naudojame informuodami savo veiksmus. Tiesą sakant, naujausi modeliai taip pat leidžia naudoti kitas įvesties formas, ne tik įvedant tekstą. Bet štai kur mes pradėjome, taigi nuo to ir pradėjome.
Pradėjome nuo teksto į sql, kuriame žodžiais aprašome, kaip rasti atsakymus į klausimus naudojant mūsų duomenų bazės lenteles. Taigi, iš esmės, pasakymas programuotojui, kaip suformuluoti duomenų bazės užklausas. Tai skambėjo taip beprotiškai ir neįtikėtinai, kad manėme, kad tai gali iš tikrųjų veikti.
Kartais tai darydavo, bet dažniausiai susipykdavo, išsigalvodavo dalykų arba ignoruodavo mus. Arba visa tai, kas išdėstyta aukščiau. Jei vėl galvojate apie katę, aš esu su jumis.
Atneškite hibridus.
Taigi, mes perėjome prie duomenų bazės hibridizavimo ir paieškos, naudodami ChatGPT, kad sužinotume apie kalbos galimybes. Tarp daugelio iššūkių:
(1) Žinodami, apie ką gerbėjas klausia – įvykis? Vieta? Kaimynystė? Žanras? Žmogus?
(2) Raskite duomenis mūsų duomenų bazėje naudodami neaiškią paiešką – pokalbio esmė ta, kad ventiliatorius to nedaro turėti būti konkretiems.
(3) Perkelkite duomenis į „ChatGPT“ žodžiais – tai viskas, ką ji supranta.
(4) Gaukite žmonėms paruoštą atsakymą iš „ChatGPT“.
(5) Papildykite atsakymą nuorodomis ir vaizdais.
Greitai supratome, kad turime patvirtinti, kad tai naudoja mūsų duomenis, o ne kreipiasi kitur, o tai LLM terminais vadinama temperatūra. Arba, žmogiškai kalbant, neišsigalvokite!
Tai sumuštinis
Po kelių bandymų gavome veiksmingą technologijų sumuštinį: Bert NER, kad suprastų, ko klausia gerbėjas; specializuoti modeliai, skirti aptikti esminę, bet išskirtinę informaciją, pvz., neoficialias datas („po 3 savaičių“); vektorinė duomenų bazė, skirta neaiškiam žmogaus klausimui paversti kažkuo konkrečiu, kurį galime užduoti savo jau turimoms paieškos galimybėms; sluoksnis, skirtas paieškos atsakymui į ChatGPT pateikti žodžiais, o tada metodas, skirtas ChatGPT atsakymui gauti žmonių kalba. Ir galiausiai sluoksnis, papildantis jį vaizdais ir nuorodomis.
Voila! Jei visa tai skamba šiek tiek daug, suprantu. Tačiau mums buvo malonu matyti, kad gerbėjas gali užduoti pagrįstą klausimą: „Kas šįvakar vyksta Londone? arba „Kur aš galiu nuvežti tetą Nelly džiazo priešpiečių?” ir gauti patikimą atsakymą, kuris turi prasmę.
Įdomiau yra tai, kad gerbėjas gali paklausti neprotinga Klauskite ir gaukite atsakymą apie muzikos renginius ar vietas ir paaiškinimą, kodėl, arba, jei tai per toli, tiesiog pagrįstą atsakymą į temą. Ir, kad šiek tiek nuramintumėte, kai kurie klausimai įveda apsauginius turėklus: „Aš negaliu jums tuo padėti“.
Pirmyn!
Be mūsų pokalbių roboto, kuris bus paleistas vėliau šiais metais, mes dirbame su keletu kitų AI pastangų, daugiausia mašininio mokymosi ir klasifikavimo srityse. Jie skirti gerbėjams išryškinti muzikos sceną ir paskatinti juos tyrinėti bei ieškoti naujos muzikos ir vietų. Išlipkite nuo sofų ir į vietas!
Pokalbių robotas mums buvo labai įdomi ekskursija į LLM, kurios turi didžiulį potencialą pakeisti mūsų gyvenimą su programine įranga. Taigi, tikiuosi, kad tai šiek tiek nušvietė šią galingą technologiją.
Mes sutelkiame dėmesį į muziką ir naudojame šiuos neįtikėtinus įrankius, kad pakeltume paprastų žmonių muziką. Vis dėlto tikiuosi, kad tai suteikė jums idėjų, kaip tokios technologijos galėtų padėti jūsų muzikos pasaulyje – vietose, kur norite, kad žmonės greičiau pasiektų reikalą, turėtų neoficialią prieigą prie geresnės informacijos arba galėtų tyrinėti ir išplėsti idėją skrydžio metu.