LAJMI I FUNDIT:

A mundet AI-ja ta krijojë një yll muzikor?

A mundet AI-ja ta krijojë një yll muzikor?
Ilustrimi nga: Raj Dhunna / The Financial Times

Nga: Ludovic Hunter-Tilney, kritik i muzikës / The Financial Times
Përkthimi (i pjesshëm): Telegrafi.com

Jemi te klonimet mashtruese [deepfake] të zërit. Teknologjia prapa kësaj nuk është e re, por përparimet e shpejta në saktësi dhe në qasje, kanë bërë që imitimi i zërit – nga AI-ja – të bëhet viral gjatë këtij viti. Softueri Vall-E i Microsoft-it pretendon se është në gjendje ta imitojë një person, duke u bazuar në vetëm tre sekonda të një audioje. Edhe pse ende nuk është publikuar, programet me aftësi të ngjashme shumë lehtë mund të sigurohen.

Shkëndija e parë u shfaq në janar, kur kompania e re e teknologjisë, ElevenLabs, në internet e lëshoi ​​një gjenerator të fuqishëm të zërit. Zërat e falsifikuar të të famshmëve vërshuan menjëherë nëpër rrjetet sociale. SwiftiesTikTok sajoi mesazhe imagjinare të frymëzuara nga Taylor Swift (“Hej, jam Taylor, nëse po e kalon një ditë të keqe, dije se të duan”). Në anën tjetër, trollët 4chan krijuan klipe të rrejshme të audiove të të famshmëve që thoshin gjëra të urryera.


Gjeneruesit e tjerë të zërit kopjojnë këndimin dhe të folurit. Në mesin e modeleve të panumërta që qarkullojnë në mediat sociale, është Rihanna sintetike, por me tingull bindës që këndon [këngën] Cuff It të Beyonce. Armiqtë e ringjallur në mënyrë digjitale, Biggie Smalls dhe Tupac Shakur, bëjnë paqe në një version të përbashkët të këngës rep, “N****s in Paris” [nga Kanye West dhe Jay-Z]. David Guetta e bëri një “Emin-AI-em”.

Një mjegull e errët ligjore mbulon klonimin e zërit. Tingulli i zërit të një këngëtari, timbri i tij, nuk e ka të njëjtën mbrojtje ligjore si fjalët dhe meloditë që këndojnë. Zëri i tyre mund të jetë pasuria e tyre, por frekuenca e zërit nuk është e tyre – për t}i pasur ata të drejta të autorit. Ndaj, duket se jam i lirë ta bëj, ose të përpiqem ta bëj një model të AI-së me tonet e paimitueshme të këngëtarit tim të preferuar.

Ndryshe nga reperët e famshëm dhe yjet e pop-it, që janë objektivat kryesore të klonimit, zgjedhja ime është një krijues i vjetër: Tom Waits, një shtyllë e jetës sime muzikore, që nga ditët e mia studentore.

Përveçse jam adhurues, një arsye për ta zgjedhur është stili i tij i veçantë i të kënduarit. Një tjetër arsye është mungesa e ndonjë muzike të re prej tij: albumi i tij i fundit doli më 2011. Prandaj, ia caktova vetes sfidën e përdorimit të mjeteve gjeneruese në internet, për ta vendosur AI-në te Tom Waitsi.

Si me çdo detyrë të panjohur të këtyre ditëve, dera e parë është një tutorial në YouTube. Aty e gjej një ekspert të teknologjisë, Roberto Nickson, duke e demonstruar fuqinë e gjeneratorëve të zërit, me një imitim të çuditshëm të Kanye Westit që u bë viral në fund të marsit. E zgjodhi zërin e reperit sepse është adhurues i tij, por edhe pasi ishte modeli më i mirë i zërit që mund të gjente në atë kohë.

Me një ritëm që e gjeti në YouTube, vargjet me zë të Nicksonit e bëjnë reperin të duket se kërkon falje për reagimet tronditëse antisemitike të vitit të kaluar. “E sulmova një fe të tërë, për shkak të injorancës sime”, bën rep Nicksoni, me maskën vokale të Westit. (Në fakt, vitin e kaluar reperi tha se nuk i vinte keq për komentet e veta.)

“Kur e bëra atë video, këto modele të mësimit të makinerive ishin të reja”, më thotë Nickson në një video-telefonatë, i ulur prapa një mikrofoni në studion e tij të xhirimeve në Sharlotë të Karolinës së Veriut. 37-vjeçari është sipërmarrës i teknologjisë.

Çështjet etike shtrohen edhe nga klonimi i zërit. Nickson, i cili nuk është afrikano-amerikan, u kritikua në internet për përdorimin e një zëri të amerikanit me ngjyrë.

I udhëhequr nga mësimet e tij, regjistrohem si anëtar i një qendre të AI-së në Discord, platformë kjo e mediave sociale. Aty mund të gjesh modele të vokaleve dhe lidhjet me mjetet e programimit për përpunimin e tyre.

Këto mjete kanë emra të paqartë, si so-vits-svc, dhe fillimisht duken vështira, megjithëse është e mundur t’i përdorni pa përvojë programimi. Modelet e zërit janë formuluar nga vokalet pa sfond muzikor, të marra nga incizimet, që kthehen në grupe të dhënash. Duhen disa orë për përpunim, për ta krijuar një zë bindës muzikor. Modeluesit i referohen kësaj si “stërvitje”.

Në Discord është një zë i Tom Waitsit. Por, modeli im nuk funksionon. Dera tjetër është një faqe interneti.

Voicify.ai i krijon zërat për përdoruesit. U krijua nga Aditya Bansal, student i shkencave kompjuterike në Universitetin e Southamptonit. Vuri re se po rriten si kërpudhat versionet e këngëve të krijuara nga inteligjenca artificiale, dhe brenda një jave e hapi faqen e internetit.

“Për shkak se teknologjia është mjaft e re, ka shumë njerëz që punojnë me të dhe përpiqen ta nxjerrin një produkt, kështu që më duhej ta bëja shpejt”, thotë 20-vjeçari, në një video-telefonatë.

Atë e kanë kontaktuar edhe kompanitë diskografike, duke dashur të kenë modele të artistëve të tyre për këngët demo, të cilat përdoren si skica përpara procesit të plotë të incizimit.

Nuk tregon se sa fiton. “Është shumë”, thotë ai me buzëqeshjen që kalon nga turpi në gëzim.

Për ta krijuar zërin, shkoj në një faqe tjetër për të nxjerrë skedarët zanorë të këngëve të Waitsit, nga albumi i tij Rain Dogs, të cilat më pas i fus në Voicify.ai. Disa orë më vonë, është gati Waitsi im i AI-së. E testoj atë me këngën Dancing Queen nga Abba. Me të vërtetë tingëllon thuajse Tom Waits e ka bërë një version të Abba-s. Më pas vjen pengesa më e ndërlikuar, për ta bërë një këngë të re.

Një pengesë e mundshme është ligji. Në vitin 1990, Waitsi e fitoi një rast historik gjyqësor në ShBA, kundër kompanisë Frito-Lay – prodhues i patatinave të misrit Doritos – për përdorimin e një imituesi me zë të ashpër në një reklamë. A mund të zbatohet e njëjta gjë për klonet e vokalit me AI? Shoqata e Industrisë së Incizimeve të Amerikës, pohon se trajnimi algoritmik i zërit cenon të drejtat autoriale të artistëve, si përdorimi im i këngëve të albumit Rain Dogs. Por, kjo mund të kundërshtohet me argumentet që mbrojnë paroditë dhe imitimet.

“Nëse shkoni në gjyq, çështja është se a po përpiqeni të fitoni para prej saj, apo se është një parodi virale që e bëni për qëllime legjitime?”, thotë Dr. Luke McDonagh nga Shkolla Ekonomike e Londrës, ekspert për të drejtat e pronësisë intelektuale. “Nëse e bëni për të fituar para, atëherë ligji do t’jua ndalojë, sepse jeni duke e përdorur imazhin e markës, zërin e personalitetit të dikujt tjetër. Do të kapet nga ligji, në një farë mënyre, por nuk është domosdo çështje për të drejtat e autorit”.

Për fat të mirë, nga pikëpamja e tarifave ligjore imitimi im me AI të Waitsit nuk do ta përsërisë rastin Waits vs Frito-Lay.

Për tekstet, shkoj te ChatGPT, te çetboti i AI-së i lansuar nëntorin e kaluar nga laboratori kërkimor OpenAI.

“Tastet e pianos janë dëmtuar dhe lodhur / Teksa i godet me dorën e gërryer / Tymi rrotullohet rreth gotës së tij të uiskit / Një profet i një vendi të harruar”, thotë një varg. Ky varg i ngathët, u prodhua me shpejtësi të jashtëzakonshme nga analizimi i temave lirike uatsiane që gjenden në internet.

Për melodi, shkoj te Boomy, një krijues i muzikës me AI. Që nga lansimi në Kaliforni në vitin 2019, pretendon se ka gjeneruar më shumë se 15 milionë këngë, të cilat i llogarit si 14 për qind të muzikës së incizuar në botë. Në fillim të këtij muaji, Spotify u raportua se i kishte fshirë dhjetëra-mijëra këngë të prodhuara nga Boomy, nga katalogu i vet, pas akuzave për botët që shtojnë artificialisht numrat e transmetimit.

Për ta krijuar një këngë, e zgjidhni një stil dhe më pas i vendosni parametrat bazikë, si tingulli dhe ritmi i daulles. Nuk ka mundësi për ta zgjedhur stilin e një artisti të emëruar. Pasi u përpoqa për ta bërë muzikën sa më të këndshme që të jetë e mundur, përfundoj me një gjë të çuditshme të nxitur nga ritmi me një bas i zhurmshëm.

Është një buton për t’i shtuar vokal. Pastaj kthehet në Voicify.ai për ta përforcuar këngën. Rezultatet janë monstruoze. Eksperimenti im me gjenerimin e zërit të AI-së është zhbërë nga një e metë njerëzore: nuk di të këndoj.

Duhet të keni aftësi muzikore për ta bërë një këngë me AI. Klonet e zërit kërkojnë që një person i vërtetë ta këndojë melodinë ose të bëjë rep të fjalëve. Kur një grup rok i quajtur Breezer e publikoi një album imagjinar të Oasis-it – muajin e kaluar, me emrin “Aisis” – e përdorën një klon zëri për të kopjuar Liam Gallagherit, por i shkruan dhe i interpretuan vetë këngët. “Tingëlloj si një mega”, shkroi Gallagheri i vërtetë në Twitter, pasi e dëgjoi.

Artistët janë të ndarë. Muzikantja elektronike Grimes, një teknologe e përkushtuar, po e krijon softuerin e saj imitues të zërit, për t’u përdorur nga adhuruesit, me kusht që t’i ndajnë me të honorarët. Në anën tjetër, Sting kohët e fundit lëshoi një paralajmërim të gardës së vjetër për “betejën” për të mbrojtur “kapitalin tonë njerëzor kundër AI-së”.

“Njerëzit kanë të drejtë të shqetësohen”, thotë Holly Herndon. Muzikantja elektronike amerikane që jeton në Berlin, është figurë inovative në muzikën kompjuterike dhe ajo e përdori një sistem incizimi të personalizuar të AI-së, për albumin e saj të vitit 2019, Proto.

Pothuajse çdo fazë e zhvillimit teknologjik, në historinë e muzikës së incizuar, është shoqëruar me parashikime të tmerrshme. Rritja e radios në vitet 1920, shtoi ankthin për dëmtimin e muzikës lajv. Përhapja e makinerive të daulleve në vitet 1980, u pa me nervozizëm nga bateristët. Në asnjërin rast këto parashikime nuk dolën të sakta.

“Disa artistë u bënë virtuozë me makineritë e baterive, sintetizuesit dhe semplat”, thotë Herndon.

Muzika pop është mediumi që ka shpenzuar burimet më imagjinative për tingullin e zërit, gjatë shekullit të kaluar. Që nga përdorimi i mikrofonave elektrikë në studiot e incizimit në vitin 1925, këngëtarët ishin pikat qendrore në incizime, si yjet e Hollivudit në ekran. Vokali i tyre është krijuar për të hyrë në kokën tonë. Megjithatë, këngëtarët e famshëm janë gjithashtu shumë larg, fshihen prapa famës.

Kjo është arsyeja se pse yjet e popit kanë ndjekës të shumtë në mediat sociale. Kjo është gjithashtu arsyeja se pse adhuruesit e tyre ecin me teknologjinë e gjenerimit të zërit me AI. Aftësia për ta bërë idhullin të të këndojë ose të flasë, kjo e çon iluzionin e popit në nivelin tjetër logjik. Por, zotëruesit e zërave më të famshëm në botë, mund të ngushëllohen. Për të gjitha falsifikimet me inteligjencë artificiale, përbërësi që mungon në çdo akt të suksesshëm të imitimit është talenti i modës së vjetër – të paktën tash për tash. /Telegrafi/