Creami una canzone basata “su una tranquillizzante melodia di violino sostenuta da un riff di chitarra distorta”. Con questa prima, semplice istruzione parte la presentazione di MusicLM, un modello di creazione di musica ad alta fedeltà basato su linguaggio naturale, capace di generare canzoni a partire da descrizioni e istruzioni testuali con prestazioni di gran lunga superiori a quelle di sistemi già esistenti sia in termini di qualità audio sia di aderenza alla descrizione fornita dal testo. Così lo descrivono i suoi creatori. Sì, ma qual è la notizia, essendo tutti noi subissati da due mesi da ChatGPT, da Dall-E, dai loro dintorni e contorni e dalle comprensibili polemiche e preoccupazioni che ruotano intorno ai dati sui quali si fonda l’addestramento dei modelli di AI generativi? Le notizie, in effetti, sono due: MusicLM è di Google Google non prevede di renderlo disponibile. La seconda notizia contiene un risvolto interessante proprio in merito alle polemiche di cui sopra: mi riferisco alla "palestra" in cui MusicLM è stato finora addestrato. Si tratta del Free Music Archive, la cui base dati utilizzata è stata pari a 280.000 ore di musica. Che, moltiplicato per 60 (minuti) e diviso per 3,5 (minuti), dà circa 4.800.000 brani. Non male, ma non necessariamente moltissimo. Oggi diremmo: l'equivalente di nuova musica caricata in streaming lungo circa 48 giorni. E come funziona, l’esperimento? Beh, se lo avessimo scoperto senza l’overdose da GPT, la sorpresa sarebbe stata totale. Comunque ci sono episodi impressionanti. Ciascuno giudichi da sé: qui c’è qualche prova da ascoltare, basata su “prompt” come “un pezzo reggae lento imperniato su basso e batteria, chitarra elettrica sostenuta, bonghi acuti e squillanti, voce rilassata dal tono disinvolto, molto espressiva”. Oppure, più semplicemente, come “un pezzo death metal basato su fisarmonica”. Ma tornando ai risvolti industriali, strategici e legali dell’intelligenza artificiale di tipo generativo, è al documento pubblicato dagli sviluppatori di MusicLM che vale la pena dare un’occhiata. E’ pubblico, non è avvincente come una storia di Don Winslow, ma c’è sostanza soprattutto laddove i suoi autori ammettono candidamente quali sono le criticità del progetto. Nel documento si legge, tra l’altro, che “I campioni generati rifletteranno i pregiudizi (bias) presenti nei dati usati per l’addestramento, sollevando la questione dell’appropriatezza della generazione di musica appartenente a culture sotto-rappresentate in questa base dati, mentre allo stesso tempo emergono preoccupazioni circa l’appropriazione culturale. Riconosciamo il rischio di una potenziale appropriazione indebita di contenuti creativi associati al caso d’uso. Abbiamo riscontrato che solo una piccola frazione di esempi è stata memorizzata con esattezza, mentre per l’1% dei campioni abbiamo potuto identificare una corrispondenza approssimativa”. Domande? Io ne avrei parecchie, più nel senso di curiosità che di altro. Ma la sensazione è che stavolta l’industria musicale sia un po’ più reattiva che in passato, quando è capitato che i buoi fossero fuori dal recinto da ormai troppo tempo. Vedremo.