di Andrea Capra

Dopo anni in cui sono stati fatti passi da gigante nel campo “video” (basti pensare al rapido cammino della risoluzione che ha portato all’alta definizione o al 3D) il Centro Ricerche e Innovazione Tecnologica RAI di Torino ha sentito l’esigenza di investire anche sull’audio pensando ad una sonda microfonica in grado di compiere le stesse operazioni che attualmente compie una videocamera: aprire sull’intera scena o stringere su un particolare avendo la possibilità di ruotare a 360° il puntamento.

Vista la complessità della realizzazione era necessario un partner scientifico in grado di sviluppare il prodotto, partner trovato nell’equipe del Prof. Angelo Farina del Dipartimento di Ingegneria Industriale dell’Università di Parma. Il gruppo di ricerca è, infatti, attivo da diversi anni nelle sperimentazioni sull’audio multicanale con particolare attenzione alle sonde microfoniche.

Gli sviluppatori

L. Scopece
A. Farina
A. Capra
L. Chiesi
Campanini

 

 

 

 

 

 

 

 

 

 

Il sistema

In questi anni la ricerca ha fatto enormi passi in avanti sulle tecnologie utili a registrare e riprodurre le proprietà spaziali del suono. La maggior parte degli approcci proposti fa uso di grandi array di microfoni o di altoparlanti e processano il suono attraverso complesse teorie matematiche basate su varie modifiche del classico principio di Huygens. Questi metodi si fondano sulla rappresentazione matematica del campo sonoro che viene decomposto in onde piane (Wave Field Synthesis) o armoniche sferiche (Ambisonics). In fase di riproduzione del segnale registrato, i segnali da inviare ad ogni cassa vengono ottenuti utilizzando le corrispondenti teorie matematiche. Qualsiasi metodo si utilizzi, alla fine si può pensare all’intero processo come la sintesi di un certo numero di microfoni virtuali, ciascuno di essi utilizzato per dare segnale ad una cassa nel sistema di riproduzione.

Nel caso della sonda 3D-VMS l’obiettivo è quello di sintetizzare microfoni virtuali partendo dal campionamento spaziale del suono attorno ad un punto prefissato mediante un array di capsule microfoniche e processarne il suono in modo da esaltare le componenti d’interesse o cancellare le componenti indesiderate. Per fare ciò si è deciso di non utilizzare alcuna rappresentazione matematica del campo sonoro, concentrando gli sforzi verso una soluzione “numerica” in grado di fornire direttamente i coefficienti dei filtri digitali necessari per sintetizzare microfoni virtuali con qualsiasi direttività e qualsiasi puntamento nello spazio. Nonostante questo tipo di approccio, almeno in teoria, possa funzionare con qualsiasi geometria dell’array di microfoni, si è scelto di utilizzare una geometria sferica su cui disporre 32 capsule.

I pezzi che compongono il cuore del sistema sono essenzialmente due: la sonda microfonica a 32 capsule e un computer che gestisca sia il processing del segnale sia l’interfaccia grafica.

L’array microfonico scelto è l’ Eigenmike (Figura 1), prodotto dall’azienda americana “mh acoustics”, dotato di preamplificatori microfonici e convertitori analogico-digitale incapsulati in una sfera di 8.5 cm di diametro. Il microfono è collegato al computer tramite una scheda audio firewire e le consegna i 32 segnali attraverso un cavo di rete CAT-5; questa caratteristica permette di installare il microfono anche a 130 metri di distanza dal punto in cui si trova l’unità di controllo, ideale quindi per l’utilizzo in campo broadcast.

Figura 1: Sonda microfonica Eigenmike.

E’ noto che per usare un sistema in produzioni audio-video occorre che tale sistema sia robusto, affidabile, senza complessità che ne rallentino l’utilizzo. Dall’altro lato, per poter eseguire l’elevato numero di filtraggi (convoluzioni) necessario alla sintesi dei microfoni virtuali, occorre un sistema efficiente, con grande potenza di calcolo e bassissima latenza. Per questo motivo tutto il processing dei segnali viene eseguito su una macchina con processore QuadCore. Questa unità di processamento può essere utilizzata come “black box”, cioè come unità che esegue solo il filtraggio, priva di interfaccia grafica e accessibile in remoto da un computer portatile di controllo, o come sistema completo che esegua il filtraggio e fornisca all’utente l’interfaccia grafica necessaria ad utilizzare la sonda microfonica.

I segnali processati si possono prelevare da una porta ADAT e da un’uscita stereo analogica presenti sulla scheda audio.

Per poter sintetizzare il microfono desiderato nella direzione giusta è stata creata un’interfaccia grafica ad hoc che permette il il trascinamento dei puntatori tramite il mouse su una foto a 360° o uno streaming video proveniente da una telecamera panoramica. Con un click e il movimento del mouse si possono trascinare i puntatori sintetizzando microfoni virtuali che puntino alla zona desiderata (Figura 2); tramite la rotella di scorrimento si può variare la direttività del microfono selezionato in modo continuo e graduale creando una sorta di zoom sonoro che vada dall’omnidirezionale al cardioide del 6° ordine (Figura 3).

Figura 2: GUI di controllo della sonda 3D-VMS.

Campi di applicazione

Sono stati condotti molti esperimenti per capire i limiti di utilizzo, testando la sonda in vari ambienti, condizioni acustiche e sorgenti sonore. Il sistema è stato testato presso importanti teatri durante opere liriche (Teatro Regio di Torino, Teatro Costanzi di Roma) e opere teatrali (Teatro Piccolo di Milano), in studi televisivi (Studi RAI di Corso Sempione – Milano) e sale da conferenza. Il microfono è stato utilizzato anche in ambiente esterno per riprendere suoni della natura e rumori ambientali come il rumore di auto o treni.

Ma per far comprendere ai lettori le potenzialità del sistema microfonico 3D-VMS diamo qualche esempio di possibili campi di applicazione, in cui la dinamicità e la marcata direttività risultino un salto di qualità nel campo della registrazione.

– Ripresa orchestrale

Posizionando la sonda appena dietro e sopra al direttore d’orchestra si può pensare di puntare 6 dei 7 microfoni virtuali a disposizione verso una posizione ben precisa del palco e seguire dinamicamente con il settimo un soggetto che canta o suona muovendosi sulla scena. Un’altra possibilità potrebbe essere quella di fissare 3 o 5 microfoni frontalmente e ai lati e i due rimanenti in posizione “rear” per catturare un formato surround standard che possa andare da un 5.0 a un 7.0. Per ottenere il canale addizionale “.1” (LFE) possono essere eseguiti vari tipi di bass management  dei principali canali o può essere sintetizzato un microfono omnidirezionale filtrato tra i 20 Hz e i 500 Hz.

– Ripresa di eventi sportivi

Si potrebbe pensare di raggiungere un effetto surround realistico posizionando la sonda presso le linee laterali e, simultaneamente, riprendere i suoni di ciò che sta succedendo sul campo di gara. Ad esempio immaginiamo di registrare in uno stadio durante una partita di calcio: oltre all’effetto surround dei cori dei tifosi si potrebbe usare un microfono virtuale per seguire in tempo reale la palla captandone il suono mentre impatta contro il palo, la traversa, i piedi dei giocatori. Questo conferirebbe alla ripresa il realismo utile a coinvolgere maggiormente lo spettatore. Ma avere a bordocampo un microfono come questo potrebbe essere utile per captare cosa i giocatori si dicono, anche quando parlano sottovoce, puntando un microfono molto direttivo verso la loro bocca.

– Ripresa di eventi teatrali

In teatro è possibile riprende gli attori che si muovono sul palco e contemporaneamente ottenere un surround standard: basta puntare cinque microfoni virtuali in posizioni fisse ( ad esempio +30°, -30°, 0°, +110°, -110°) e utilizzare i due rimanenti per seguire gli attori sulla scena. Questi microfoni “spot” vengono poi mixati all’interno del mix surround assicurando per tutta la durata della ripresa una ottima presenza delle voci.

– Ripresa in studi televisivi

In uno studio televisivo c’è tutto il necessario per appendere uno o più sonde in modo da creare microfoni virtuali molto direttivi che puntino alla bocca di ogni singolo partecipante all’evento televisivo, escludendo così tutti quei rumori indesiderati che in un contesto del genere sono acusticamente ingombranti: il rumore delle luci motorizzate, il rumore dell’aria condizionata, le voci dei tecnici e degli operatori. In pratica si possono registrare segnali paragonabili a quelli dei microfoni wireless senza il bisogno di farli indossare ad ogni partecipante. Se poi ci dovesse essere un intervento da parte di qualche ospite nel pubblico basta attivare un microfono virtuale aggiuntivo puntandolo su di lui, senza aspettare che un tecnico gli consegni un microfono wireless.

– Ripresa di una scena per riprodurla in un ambiente differente

A causa dell’altissima sensibilità di microfoni molto direttivi risulta rischioso utilizzare il sistema 3D-VMS per rinforzare il suono di una sala o di un teatro. Se infatti cercassimo di consegnare il suono di uno o più microfoni direttamente alle casse presenti nel luogo in cui è posizionata la sonda microfonica, puntando per errore il microfono virtuale in direzione delle casse otterremmo sicuramente larsen dannosi e fastidiosi.

Nonostante questo il sistema ha dimostrato un ottimo funzionamento anche in tempo reale ogni qual volta il suono catturato dai microfoni virtuali viene riprodotto in un ambiente differente da quello di ripresa. Ciò succede, per esempio, in applicazioni di videoconferenza o durante show televisivi in occasione di un collegamento esterno.

Un ulteriore vantaggio del sistema 3D-VMS è la possibilità di selezionare l’orientazione e la direttività dei microfoni virtuali durante la fase di post-produzione. Durante l’evento viene registrato l’intero set di 32 segnali provenienti dalle 32 capsule in un file “wave64”, un formato multicanale in cui è possibile superare il limite di 2GB. Contemporaneamente viene registrato un video che copra lo spazio a 360°, utilizzando una telecamera panoramica posta accanto alla sonda microfonica. E’ così possibile, durante la fase di post-produzione, riposizionare i microfoni virtuali ridefinendone anche la direttività, utilizzando la scena sul video panoramico registrato che permette di seguire le sorgenti sonore durante i loro movimenti esattamente come è già stato descritto per le applicazioni “live”. In pratica è come ridefinire il posizionamento e il tipo di microfoni dopo che l’evento è stato registrato: un sogno per tutti gli ingegneri del suono. E’ infine importante sottolineare che In tempo reale non è possibile ottenere da un’unica sonda più di sette microfoni ma in post-produzione è possibile ottenerne quanti se ne desiderino.

Figura 3: Direttività di cardioidi di ordine elevato.

Considerazioni finali

Il sistema 3D-VMS si presenta come una vera innovazione nel campo della ripresa multicanale e broadcast, portando a compimento il cammino iniziato negli anni ’70 con il microfono Soundfield. La sua possibilità di agire sul puntamento e sulla direttività dei microfoni virtuali che genera lo rende utile ad un infinito numero di applicazioni che spaziano dalla ripresa televisiva alla ripresa musicale surround, dalla conferenza alla ripresa di eventi sportivi.

Allo stato attuale il sistema non è ancora in commercio ma l’intenzione è quella di inserirlo a breve nel complesso mondo dei sistemi di ripresa microfonica per sottoporlo così al giudizio insindacabile del mercato.

Utilizzo della sonda 3D-VMS presso il Teatro Regio di Torino.

Punti deboli

La sonda è molto sensibile al rumore del vento e, purtroppo, non è dotata di una cuffia che la protegga adeguatamente. Questa mancanza è data dal fatto che la temperatura della sonda cresce molto durante l’utilizzo ed ha bisogno di uno scambio termico con l’ambiente circostante che mantenga sotto controllo il calore sviluppato dall’elettronica posta internamente alla sonda stessa. Per ovviare a questo è stato costruito “artigianalmente” una cuffia antivento ingombrante ma in grado di lasciare al microfono il necessario volume d’aria per il suo raffreddamento.

Un ulteriore “mancanza” che verrà colmata a breve, è l’assenza di generazione del time-code, caratteristica importante per tutte le applicazioni broadcast.

Addendum (aprile 2013) Il Centro Ricerche Rai di Toino continua lo sviluppo di VMS e ne ha parlato nei documenti informativi Elettronica e Telecomunicazioni di Aprile 2013