
Piktybiški veikėjai piktnaudžiauja generatyviais AI muzikos įrankiais kurdami homofobines, rasistines ir propagandines dainas ir skelbia vadovus, mokančius kitiems, kaip tai padaryti.
Pasak „ActiveFence“, paslaugos, valdančios pasitikėjimo ir saugos operacijas internetinėse platformose, nuo kovo mėnesio „neapykantą kurstančiose“ bendruomenėse smarkiai paplito pokalbiai apie būdus, kaip netinkamai panaudoti AI muzikos kūrimo įrankius rašant įžeidžiančias dainas, skirtas mažumų grupėms. Dirbtinio intelekto sukurtomis dainomis, kuriomis dalijamasi šiuose forumuose ir diskusijų lentose, siekiama kurstyti neapykantą etninėms, lyčių, rasinėms ir religinėms grupėms, teigia „ActiveFence“ tyrėjai savo ataskaitoje, kartu švenčiant kankinystės, savęs žalojimo ir terorizmo aktus.
Neapykantos ir žalingos dainos vargu ar yra naujas reiškinys. Tačiau baiminamasi, kad atsiradus lengvai naudojamiems nemokamiems muzikos kūrimo įrankiams, juos dideliu mastu gamins žmonės, kurie anksčiau neturėjo priemonių ar žinių – kaip ir vaizdo, balso, vaizdo įrašų. ir tekstų generatoriai paspartino dezinformacijos, dezinformacijos ir neapykantos kurstymo kurstymą.
„Tai yra tendencijos, kurios stiprėja, nes vis daugiau vartotojų mokosi kurti šias dainas ir dalintis jomis su kitais“, – interviu TechCrunch sakė Noamas Schwartzas, „ActiveFence“ įkūrėjas ir generalinis direktorius. „Grėsmės dalyviai greitai nustato konkrečius pažeidžiamumus, kad galėtų įvairiais būdais piktnaudžiauti šiomis platformomis ir generuoti kenkėjišką turinį.
Kurti „neapykantos“ dainas
Generatyvūs AI muzikos įrankiai, pvz., „Udio“ ir „Suno“, leidžia vartotojams pridėti tinkintus tekstus prie sukurtų dainų. Apsaugos priemonės platformose išfiltruoja įprastus užgauliojimus ir menkinimus, tačiau, pasak „ActiveFence“, vartotojai išsiaiškino sprendimus.
Viename ataskaitoje paminėtame pavyzdyje baltųjų viršenybės šalininkų forumų naudotojai dalijosi fonetine mažumų rašyba ir įžeidžiančiais terminais, pvz., „jooz“ vietoj „žydai“ ir „sakyk tan“ vietoj „šėtonas“, kuriuos jie naudodavo apeiti turinio filtrus. . Kai kurie naudotojai siūlė keisti tarpus ir rašybą, kai kalbama apie smurtinius veiksmus, pvz., „mano išžaginimas“ pakeisti į „pelkinė beždžionė“.
„TechCrunch“ išbandė kelis iš šių sprendimų „Udio“ ir „Suno“ – dviejuose populiariausiuose įrankiuose, skirtuose dirbtinio intelekto sukurtai muzikai kurti ir dalytis. Suno juos visus išleido, o Udio užblokavo kai kuriuos, bet ne visus, įžeidžiančius homofonus.
El. paštu „Udio“ atstovas „TechCrunch“ pasakė, kad bendrovė draudžia naudoti savo platformą neapykantos kurstymui. Suno neatsakė į mūsų prašymą pakomentuoti.
Bendruomenėse, kurias apžiūrėjo, „ActiveFence“ rado nuorodas į dirbtinio intelekto sukurtas dainas, kuriose papūgaujama sąmokslo teorijos apie žydus ir pasisakoma už jų masines žudynes; dainos, kuriose yra šūkių, susijusių su teroristinėmis grupuotėmis ISIS ir Al-Qaeda; ir dainos, šlovinančios seksualinį smurtą prieš moteris.
Dainos poveikis
Schwartzas teigia, kad dainos – priešingai, tarkime, tekstas – turi emocinį įtampą, todėl jos yra stipri neapykantos grupių ir politinio karo jėga. Jis atkreipia dėmesį į „Rock Against Communism“ – baltojo jėgos roko koncertų seriją JK 7-ojo dešimtmečio pabaigoje ir devintojo dešimtmečio pradžioje, iš kurių atsirado ištisus antisemitinės ir rasistinės „neapykantos“ muzikos porūšius.
„AI daro žalingą turinį patrauklesnį – pagalvokite apie ką nors, pamokslaujantį žalingą pasakojimą apie tam tikrą populiaciją, o tada įsivaizduokite, kad kažkas sukuria rimuotą dainą, kurią visiems būtų lengva dainuoti ir prisiminti“, – sakė jis. „Jie stiprina grupės solidarumą, indoktrinuoja periferinių grupių narius, taip pat yra naudojami šokiruoti ir įžeisti nesusijusius interneto vartotojus.
Schwartz ragina muzikos generavimo platformas įdiegti prevencijos priemones ir atlikti išsamesnius saugos vertinimus. „Raudonoji komanda gali atskleisti kai kuriuos iš šių pažeidžiamumų ir tai galima padaryti imituojant grėsmės veikėjų elgesį“, – sakė Schwartzas. „Šiuo atveju taip pat gali būti naudingas geresnis įvesties ir išvesties moderavimas, nes tai leis platformoms blokuoti turinį prieš dalijantis juo su vartotoju.”
Tačiau pataisymai gali pasirodyti trumpalaikiai, nes vartotojai atskleidžia naujus moderavimo nugalėjimo metodus. Pavyzdžiui, kai kurios dirbtinio intelekto sukurtos teroristinės propagandos dainos, kurias nustatė „ActiveFence“, buvo sukurtos naudojant arabų kalbos eufemizmus ir transliteracijas – eufemizmų, kurių muzikos generatoriai neaptiko, tikriausiai todėl, kad jų filtrai arabų kalba nėra stiprūs.
Dirbtinio intelekto sukurta neapykantos kupina muzika gali pasklisti toli ir plačiai, jei ji seka kitų dirbtinio intelekto sukurtų medijų pėdomis. „Wired“ anksčiau šiais metais dokumentavo, kaip dirbtiniu intelektu manipuliuotas Adolfo Hitlerio klipas surinko daugiau nei 15 milijonų X peržiūrų po to, kai juo pasidalijo kraštutinių dešiniųjų sąmokslo influenceris.
Be kitų ekspertų, JT patariamoji institucija išreiškė susirūpinimą, kad rasistinis, antisemitinis, islamofobinis ir ksenofobinis turinys gali būti padidintas generatyvaus AI.
„Generatyvios dirbtinio intelekto paslaugos leidžia vartotojams, kuriems trūksta išteklių arba kūrybinių ir techninių įgūdžių, kurti patrauklų turinį ir skleisti idėjas, kurios gali konkuruoti dėl dėmesio pasaulinėje idėjų rinkoje“, – sakė Schwartzas. „Ir grėsmės veikėjai, atradę šių naujų paslaugų siūlomą kūrybinį potencialą, stengiasi apeiti nuosaikumą ir išvengti aptikimo – ir jiems pasisekė.