Sign in / Join
0

Acustica Audio NOVA, l'ibrido tra Volterra e deep neural network per i plug-in


Con l'uscita dell'ultimo plug-in Yellow, dedicato alla compressione valvolare e alla saturazione valvolare, Acustica Audio introduce la nuova tecnologia ibrida NOVA per riprodurre il comportamento analogico non lineare con elevata accuratezza. Scopriamo di cosa si tratta.

 

NOVA è stato progettato per risolvere un problema specifico di modeling: preservare l’identità dell’hardware analogico ai livelli operativi bassi e nominali, mantenendo al tempo stesso un comportamento sonoro credibile, continuo e musicalmente ricco quando il segnale viene spinto verso una saturazione più elevata.

Nell’hardware reale, infatti, un dispositivo può risultare estremamente lineare e delicato a bassi livelli, diventando progressivamente meno lineare con l’aumentare del segnale, fino a entrare in una regione in cui saturazione, distorsione armonica e dipendenza dal livello diventano parte integrante del suo carattere sonoro. Poiché molti processori analogici vengono utilizzati lungo tutto questo intervallo — da interventi impercettibili fino a colorazioni evidenti — è fondamentale che un modello resti coerente in ogni condizione. NOVA nasce proprio per evitare discrepanze tra questi comportamenti, garantendo coerenza timbrica sia in condizioni conservative sia in saturazione spinta.

Nebula e Volterra

Nebula, introdotto nel 2005 e commercializzato dal 2007, nasce con l’obiettivo di estendere la convoluzione dinamica oltre i sistemi lineari, applicandola anche a comportamenti non lineari tramite la modellazione basata su Volterra. A differenza della convoluzione tradizionale — adatta a sistemi lineari tempo-invarianti — l’hardware analogico presenta risposte che variano in funzione del livello, dello stato operativo e di fenomeni di memoria.

L’approccio Volterra generalizza la risposta impulsiva introducendo kernel di ordine superiore, permettendo di rappresentare sistemi debolmente o moderatamente non lineari. In ambito audio, questo consente di organizzare il comportamento dei dispositivi in base a diverse condizioni operative, riproducendo con maggiore realismo la generazione armonica, la non linearità progressiva e la dipendenza dal livello. Volterra si è dimostrata estremamente versatile, trovando applicazione in riverberi, equalizzatori, compressori, catene di altoparlanti, microfoni e preamplificatori. Il suo punto di forza è la precisione nella regione a basso e medio livello, dove la fedeltà è cruciale: piccole variazioni in risposta in frequenza, fase o contenuto armonico possono alterare significativamente l’identità percepita del dispositivo. Tuttavia, quando la non linearità aumenta, emergono limiti pratici: la complessità cresce rapidamente, il numero di coefficienti aumenta e il costo computazionale diventa elevato. Di conseguenza, la rappresentazione accurata di saturazioni intense e contenuti armonici complessi diventa più difficile.

Il modeling neurale

Per affrontare queste limitazioni, sono stati introdotti modeling con network neurali profondi (deep neural network), in particolare architetture ispirate a WaveNet, addestrate direttamente sulle relazioni ingresso-uscita dei dispositivi. Questi modelli eccellono nella riproduzione di comportamenti altamente non lineari, come saturazione densa, clipping progressivo e interazioni armoniche complesse. Dal punto di vista musicale, questo è fondamentale: molti circuiti analogici non aggiungono semplicemente una colorazione fissa, ma modificano il loro comportamento in modo dinamico e progressivo. I modelli neurali riescono a catturare questa evoluzione con grande fluidità ed espressività, risultando particolarmente efficaci in contesti come preamplificatori per chitarra o stadi di distorsione. Tuttavia, un approccio puramente neurale presenta difficoltà nel mantenere una perfetta aderenza all’hardware nelle condizioni di basso livello. Aspetti come il bilanciamento spettrale, la fase e le transizioni sottili tra segnale pulito e distorto possono risultare meno stabili, soprattutto in presenza di rumore nei dati di misurazione.

L’architettura ibrida NOVA

NOVA combina i due approcci in un’architettura ibrida, sfruttando i punti di forza di ciascuno. Il modello Volterra garantisce precisione strutturale, stabilità e fedeltà ai bassi livelli, mentre il modello neurale interviene nelle regioni più non lineari, dove è richiesta una saturazione ricca e progressiva. La transizione tra i due non è gestita da soglie rigide, ma avviene in modo continuo e adattivo. I due modelli operano simultaneamente, contribuendo in proporzione diversa a seconda del segnale. Questo approccio evita discontinuità e permette una risposta coerente anche all’interno della stessa forma d’onda. Quando il segnale è debole, domina il contributo Volterra, assicurando precisione timbrica e stabilità. Con l’aumentare dell’intensità, cresce progressivamente il ruolo del modello neurale, che arricchisce il contenuto armonico e gestisce le non linearità più complesse. Allo stesso tempo, il ramo Volterra continua a fornire una base stabile, mantenendo il modello ancorato al comportamento reale dell’hardware.

Sinergia tra i modelli

Il sistema non va interpretato come un semplice passaggio tra due motori, ma come un’interazione coordinata. Il contributo di ciascun modello varia dinamicamente in base alle condizioni del segnale, anche su scale temporali molto brevi. Il risultato è un sistema capace di mantenere una risposta in frequenza e in fase estremamente fedele all’unità originale, pur generando una saturazione armonica ricca e naturale. Questo consente di ottenere un suono pieno e musicale senza compromettere l’equilibrio tonale.

Acustica Audio NOVA: in verde il contributo della distorsione armonica di Volterra, in bianco quella del deep neural network

Conclusione

NOVA rappresenta una sintesi tra la tradizione di Nebula e le più recenti tecniche di modeling neurale. Integrando kernel Volterra e deep neural network in un’unica architettura, riesce a riprodurre sia la precisione dei comportamenti a basso livello sia la complessità espressiva delle saturazioni più spinte. L’obiettivo finale non è la tecnologia in sé, ma un’esperienza sonora più fedele, flessibile e musicalmente convincente, capace di riflettere il comportamento reale dell’hardware analogico lungo tutto il suo range operativo.