Libri scontati fino al 50%? Acquista ora

,

Tecniche di sintesi: Phase Vocoder

Phase Vocoder

Il Phase Vocoder รจ uno dei piรน noti metodi di analisi/risintesi dello spettro sonoro che sviluppa, in ambito digitale, i concetti giร  adottati con il VOCODER di Homer Dudley. Tradizionalmente adottato per i segnali vocali, il Phase Vocoder, similmente al dispositivo analogico, รจ strutturato in due sezioni utili rispettivamente allโ€™analisi e alla sintesi.

Le origini negli anni Sessanta

Una prima versione del Phase Vocoder รจ stata sviluppata nel 1966 da James Flanagan e Roger Golden, ricercatori ai Laboratori Bell, dove Dudley aveva messo a punto il Vocoder. Il principio da cui partirono i due ricercatori era che facendo passare un segnale sonoro attraverso una batteria di filtri in parallelo non si comprometteva la qualitร  del segnale in uscita. Su questa intuizione, in veritร , si fonda anche il Vocoder. Mentre questโ€™ultimo consentiva, per ciascun filtro, esclusivamente la trasmissione dei valori di ampiezza, la tecnica adottata da Flanagan e Golden si estendeva anche alla trasmissione della fase, da cui il nome Phase Vocoder.

Le simulazioni con IBM-7094

In realtร , rispetto alle intenzioni iniziali, il risultato finale della ricerca non fu soddisfacente. Riuscirono nellโ€™intento di migliorare il processo di sintesi, quindi la qualitร  del segnale sonoro, tuttavia lโ€™insieme dei dati raccolti durante il processo di analisi restituivano un file con dimensione maggiore di quella del segnale originale. Sul piano pratico questo comportava un notevole sforzo computazionale. La prima simulazione al computer fu condotta con un IBM 7094 e un software realizzato con il linguaggio BLODI-B, sviluppato appositamente per processare segnali di parlato digitalizzato.
La difficoltร  nella gestione dei dati rese difficile, per diversi anni, lโ€™utilizzo del Phase Vocoder. In seguito, verso la metร  degli anni Settanta, il ricercatore Portnoff sviluppรฒ un Phase Vocoder ancora piรน efficiente implementando al suo interno la Fast Fourier Transform.

Analisi e sintesi con il Phase Vocoder

Come nel VOCODER, anche nel Phase Vocoder il passaggio del segnale originale avviene allโ€™interno di una batteria di filtri posti in parallelo, tale da coprire lโ€™intera larghezza di banda del segnale originale. In questo caso i filtri permettono di misurare sia lโ€™ampiezza sia la fase di ciascun suono sinusoidale per ciascuna banda di frequenza. Questa si definisce la fase di analisi. Da questi valori si ricavano due inviluppi: per lโ€™ampiezza e per la frequenza. Durante la fase di sintesi, i dati ottenuti con lโ€™analisi si possono sia lasciare invariati (in questo modo, teoricamente, avremo un segnale identico a quello originale), sia modificarli (ad esempio agendo sui due inviluppi), per ottenere risultati timbrici differenti.

La fase di analisi del Phase Vocoder

Ai fini del risultato finale, la fase dellโ€™analisi รจ di estrema importanza, per questo รจ necessario prestare particolare attenzione allโ€™insieme dei parametri definiti dallโ€™utente. La scelta di questi parametri (Frame Size โ€“ Window โ€“ FFT Size โ€“ Hop Size), andrebbe valutata sia in base alle qualitร  intrinseche al segnale originale, sia in base alle caratteristiche che dovrebbe avere il suono risintetizzato. In generale vale ricordare la regola che migliore sarร  lโ€™analisi e tanto piรน simile allโ€™originale sarร  il suono sintetizzato. La fase di analisi si svolge prendendo in considerazione due elementi in particolare: la frequenza e il tempo. Per quanto riguarda la frequenza, bisogna ricordare che durante lโ€™analisi lo spettro del segnale originale viene suddiviso in canali di frequenza, dove la larghezza di banda di ciascun canale si calcola suddividendo la frequenza di campionamento per il frame size. Il numero dei canali, che รจ strettamente connesso alle caratteristiche del segnale originale, รจ ottenuto suddividendo la frequenza di campionamento per la frequenza fondamentale del segnale.

Dimensioni del Frame (Frame Size)

La grandezza del frame รจ uno dei parametri piรน importanti per lo svolgimento di una buona analisi. Va ad incidere, in particolare, sulla frequenza e sul tempo. La dimensione di ciascun frame, che si misura in numero di campioni utilizzati, sarร  obbligatoriamente un numero intero potenza di 2 (64, 128, 256 campioni, etc.). Per quanto riguarda la frequenza, possiamo dire che dalla grandezza del frame dipende il numero di frequenze del segnale originale conservate, quindi la sua risoluzione in termini di frequenza. In altri termini vuol dire che piรน alto รจ il valore del Frame Size piรน alto sarร  anche il numero delle frequenze, e viceversa. Se volessimo, ad esempio, analizzare un suono che viaggia su ottave molto basse, dove รจ piรน difficoltosa la selezione delle frequenze, allora tenderemo ad impostare un Frame Size abbastanza alto per avere una maggiore accuratezza delle frequenze presenti. Lโ€™importanza di questo parametro agisce anche sulla risoluzione del tempo. Se in precedenza si รจ detto che lo spettro viene suddiviso in canali di frequenza, va aggiunto che il segnale originale viene suddiviso anche in porzioni di tempo. A differenza del caso precedente, perรฒ, per ottenere una buona risoluzione temporale รจ necessario mantenere basso il valore del Frame, per motivi che vedremo in seguito. Per il momento รจ sufficiente ricordare che in base al Frame Size, piรน dettagliata sarร  lโ€™analisi delle frequenze, piรน grossolana sarร  quella del tempo e viceversa.

Tipologia di finestra (Window Type)

La scelta del tipo di finestra diventa molto importante quando si desidera fare unโ€™analisi molto accurata, visto che ciascuna finestra tende ad introdurre delle distorsioni, quindi ad alterare il processo di analisi. Solitamente, oggi, qualsiasi Phase Vocoder permette la scelta di finestre standard come quella di Hamming, Hanning, Gaussian troncata, Blanckman-Harris o Kaiser.

Dimensioni della FFT (FFT Size)

La scelta di questo valore dipende dal grado di trasformazione che vogliamo esercitare sul segnale originale. Il valore deve essere un numero intero potenza di due, in maniera che sia almeno il doppio del Frame Size. Dal momento che la grandezza della FFT incide sulle prestazioni del processore e dal momento che il suo valore รจ strettamente connesso a quello del Fram Size, capiamo quanto la scelta di questโ€™ultimo sia importante anche per la FFT.

Fattore Hop (Hop Size)

Il fattore HOP รจ definito anche fattore di sovrapposizione delle finestre. Determina il numero di campioni che, durante lโ€™analisi, vengono saltati ogni qualvolta viene effettuata una nuova misurazione dello spettro. Quanto piรน รจ piccolo questo valore tanto piรน sovrapposte saranno le finestre successive. Non va dimenticato che per la risintesi รจ necessario un numero minimo di sovrapposizioni (circa otto).

Applicazioni del Phase Vocoder

Al di lร  di quanto possa essere approfondito lo studio di questi parametri o il ragionamento sulla loro scelta, non bisogna dimenticare unโ€™indicazione di carattere generale tuttโ€™altro che indifferente: non esistono dei valori che si possano considerare indicati per qualsiasi situazione. Certamente allโ€™interno di certi range possiamo trovare dei valori che si possono considerare accettabili per una maggiore varietร  di situazioni ma resta il fatto che ogni segnale sonoro in ingresso richiede unโ€™analisi studiata caso per caso. Pur essendo un metodo molto utilizzato perchรฉ efficiente, va sottolineato che il Phase Vocoder รจ anche tra i metodi piรน impegnativi in termini di computazione, per questo si sono sviluppate anche diverse modalitร  che consentono di ridurre le dimensioni del file di analisi.
Tra i tanti compositori che hanno fatto uso del Phase Vocoder, ricordiamo in particolare Charles Dodge e Trevor Wishart, che piรน di altri hanno dimostrato interessanti applicazioni musicali di questo metodo. Mark Dolson, infine, verso gli inizi degli anni Ottanta, si รจ occupato di implementare la tecnica del Phase Vocoder anche all’interno del Sistema CARL di Richard Moore e Gareth Loy.

Se vuoi approfondire questo argomento, ti suggerisco la lettura dei seguenti argomenti: John Gordon, John Strawn, An Introduction to the Phase Vocoder, Proceedings, CCRMA, Department of Music, Stanford University, February 1987. Poi James Flanagan, Roger Golden, Phase Vocoder, The Bell System Technical Journal, Novembre 1966. Infine Curtis Roads, The Computer Music Tutorial, MIT Press, 2004.


Commenti

Lascia un commento

Il tuo indirizzo email non sarร  pubblicato. I campi obbligatori sono contrassegnati *

Questo sito utilizza Akismet per ridurre lo spam. Scopri come vengono elaborati i dati derivati dai commenti.

Ultimi articoli