
„Stability AI“, startuolis, sukurtas dirbtiniu intelektu varomo meno generatoriaus „Stable Diffusion“, išleido atvirą AI modelį, skirtą garsams ir dainoms generuoti.
Generatyvusis modelis, vadinamas „Stable Audio Open“, parengtas naudojant ~486 000 pavyzdžių iš nemokamų muzikos bibliotekų „FreeSound“ ir „FreeSound“ ir nemokamos muzikos archyvo, apima tekstinį aprašymą (pvz., „Roko ritmas grojamas apdorotoje studijoje, sesijos būgnų skambėjimas akustiniame rinkinyje“) ir išvestis. iki 47 sekundžių trukmės įrašas.
„Stability AI“ teigia, kad modelis gali būti naudojamas kuriant būgnų ritmus, instrumentų rifus, aplinkos triukšmą ir „gamybos elementus“ vaizdo įrašams, filmams ir TV laidoms, taip pat „redaguoti“ esamas dainas arba pritaikyti vienos dainos stilių (pvz. džiazas) kitam.
„Pagrindinis šio atvirojo kodo leidimo pranašumas yra tas, kad vartotojai gali tiksliai suderinti modelį pagal savo pasirinktinius garso duomenis“, – rašo „Stability AI“ savo įmonės tinklaraštyje. „Pavyzdžiui, būgnininkas galėtų tiksliai suderinti savo būgnų įrašų pavyzdžius, kad sukurtų naujus ritmus.
Tačiau „Stable Audio Open“ turi savo apribojimų. Jis negali sukurti pilnų dainų, melodijų ar vokalo – bent jau ne gerų. „Stability AI“ teigia, kad jis nėra tam optimizuotas, ir siūlo vartotojams, ieškantiems tie galimybių pasirinkti aukščiausios kokybės „Stable Audio“ paslaugą.
„Stable Audio Open“ taip pat negali būti naudojamas komerciniais tikslais; paslaugų teikimo sąlygos tai draudžia. Ir jis neveikia vienodai gerai įvairiuose muzikiniuose stiliuose ir kultūrose arba su aprašymu kitomis kalbomis nei anglų – dėl šališkumo Stabilumo AI kaltina treniruočių duomenis.
„Duomenų šaltiniui gali trūkti įvairovės, o visos kultūros nėra vienodai atstovaujamos duomenų rinkinyje“, – modelio aprašyme rašo „Stability AI“. „Sukurti modelio pavyzdžiai atspindės mokymo duomenų paklaidas.”
Stabilumo dirbtinis intelektas, kuris ilgą laiką stengėsi pakeisti savo reklamuojamą verslą, neseniai tapo ginčų objektu po to, kai jos generatyvaus garso viceprezidentas Edas Newtonas-Rexas atsistatydino dėl nesutikimo su bendrovės pozicija, kad generatyvių AI modelių mokymas apie autorių teisių saugomus kūrinius yra „sąžiningas“. naudoti“. Atrodo, kad „Stable Audio Open“ yra bandymas pakeisti šį pasakojimą, tuo pat metu ne itin subtiliai reklamuojant mokamus „Stability AI“ produktus.