La localizzazione delle frequenze sull’asse verticale

Struttura primaria dello strumento di additiva

Cap. 2 : La localizzazione delle frequenze sull’asse verticale

2.1 La teorizzazione

Come accennato nella premessa a questa ricerca, il postulato da verificare è :

ad ognuno dei tre campi frequenziali, o di altezze percepite, principali (grave, medio ed acuto) il nostro sistema uditivo-percettivo associa una posizione sull’asse verticale (y)  delle coordinate tridimensionali  in relazione al campo frequenziale, o di altezze, interessato : le frequenze gravi vengono lette verso lo 0 dell’asse y, quelle medie nel punto mediano e quelle acute all’apice positivo dello stesso asse”.

Coordinate tridimensionali dello spazio                                      Localizzazione delle frequenze sull’asse y

Quando parlo di “lettura”  del campo frequenziale, e/o delle altezze, o, equivalentemente di percezione di queste sull’asse verticale y, intendo non quale parte del nostro corpo mettano eventualmente in vibrazione, o cose similari, bensì, da dove, geograficamente, noi “sentiamo” arrivare il suono. Le virgolette su sentiamo sono d’obbligo in quanto abbiamo detto si tratta di un fenomeno di percezione, quindi di una interpretazione da noi data di un evento fisico e come tale va vissuta.

In effetti, quanto affermato nel postulato di partenza, può trovare in parte una convalidazione scientifica se ci riferiamo alle mappe tonotopiche precedentemente descritte ed, in cui, il cervello conserva ogni frequenza per lui caratteristica in un gruppo di cellule tra loro vicine richiamandone il posizionamento all’atto del loro riconoscimento. Se la teoria seconda la quale le frequenze acute sono “scritte” in alto nell’area 41 di Brodmann (corteccia celebrale uditiva) e via, via più in basso quelle gravi, la relazione con quanto detto nel postulato  è se non altro affascinante.

Riferendoci, invece, alla funzione di trasferimento HRTF (esposta a proposito della teoria duplex), ci si potrebbe chiedere, data la capacità di comportarsi come “filtro” da parte del nostro corpo ed in particolare dei padiglioni uditivi, della testa e del tronco, se questa caratteristica non intervenga anche nella localizzazione del suono non solo per il diverso posizionamento della sorgente sonora, ma, anche per il suo diverso contenuto frequenziale. Cioè se suoni con altezza percepita diversa e stesso posizionamento nello spazio tridimensionale vengano “tradotti” in una sorta di “immagini uditive” (simili a quelle teorizzate da McAdams e Bregman) differenti e legate al compito di una localizzazione spaziale per così dire “immaginaria” correlata, per l’appunto, solo alla loro differenza in termini di frequenza.

Entrambe costituiscono delle tesi affascinanti ma che, a parte la possibile lettura data dell’evento “localizzazione in base al contenuto frequenziale”, non rientrano nelle finalità di questa sperimentazione per la quale l’unico obbiettivo è verificare o meno il postulato dato in partenza.

2.2 Cosa ci aspetta

Certo è molto più semplice pretendere da un ascoltatore che ci dica se la sorgente sonora sia posta a destra piuttosto che a sinistra, in alto piuttosto che in basso o , anche, a che distanza essa si trovi e se sia collocata avanti o dietro. Questa è, difatti, un’esperienza uditiva giornaliera ed ormai acquisita anche nelle migliaia di anni d’evoluzione della specie umana. Cosa più complessa e delicata, cercare di ricevere una risposta sul quesito che ci siamo posti perché ciò richiede un indice di attenzione all’ascolto non solo più alto, ma, anche che richiami delle sovrastrutture mentali ed analitiche più articolate. La strada più efficace, per ovviare a questa problematica, è fare affidamento sull’intuito che ognuno di noi possiede e lasciare, quindi, che l’ascoltatore sottoposto alla sperimentazione, metta in gioco il suo attraverso alcuni semplici protocolli di sperimentazione più avanti descritti.

Le attese derivanti dalla sperimentazione sono la semplice verifica o disconoscimento, tramite raccolta di dati e loro lettura statistica, della teorizzazione di partenza. Bisogna ora decidere quale sia il limite statistico-percentuale sotto il quale si debba considerare fallita la tesi iniziale.

In questa valutazione entrano in gioco due fattori :

  1. puramente matematico : sarebbe normale porre questo limite a valori inferiori al 51% (il 50% rappresenta l’eguale possibilità che un evento sia vero o falso, per cui, perché esso sia sicuramente vero accorre superare tale limite)
  2. contestualizzazione della sperimentazione : non dimentichiamo che stiamo trattando argomenti legati alla percezione uditiva ed, in cui, entrano in gioco fattori emotivi, psicologici etc… oltre alle possibili variazioni ambientali in fase di sperimentazione. Tutto ciò tende, a mio parere, ad abbassare il limite su posto di 51% in maniera matematicamente non quantificabile (come accade in molte altre esperienze psicoacustiche) e che io ho determinato (per buon senso) attorno al 40%

A supporto di questa mia scelta richiamo quello che accade in una esperienza similare che riguarda la percezione emotiva degli intervalli musicali come, ad esempio, la sesta. Per una parte (statisticamente rilevante ma quasi sempre inferiore al 50%)  questo rappresenta uno “slancio verso un qualcosa”, un “balzo emozionale” ma, il restante della torta statistica, lo vive come un “vuoto”, un qualcosa che da solo non ha significato emozionale. E’ dunque non vera tutta la teorizzazione sulla percezione degli intervalli musicali, delle armonia, dei “colori” espressi diversamente a seconda della posizione della tonalità all’interno del suo circolo o, anche, della diversa colorazione che alcuni di noi associano a timbri diversi?

Potrebbe anche essere, forse un giorno si scoprirà che tutto è frutto di “trip” da parte di intellettuali del settore o quanto altro, per me , per ora, rimangano dati reali matematicamente descrivibili anche se non in termini di assoluto.

Un ultimo spunto di riflessione riguarda il numero di test da eseguire perché si possa supporre anche qui una verità statistica. Di solito più è alto tale numero e maggiore attendibilità ha la sperimentazione bisogna anche, però fare i conti con la realtà delle cose e col tempo a disposizione.

Difatti, mentre una quantità anche di 100 test eseguiti o più, magari con persone di diversa estrazione sociale, culturale ed anche di provenienze diverse, sarebbe, secondo me, un minimo auspicabile, per il momento ci accontenteremo di un numero nettamente inferiore ben sapendo che, così facendo, avremmo solo delle maschere di tendenza dell’evento.

2.3 Protocolli di realizzazione

Protocolli ambientali : di solito nelle sperimentazioni di tipo scientifico si cerca di creare un ambiente, atto a contenere l’esperimento, di tipo funzionale allo scopo e tutti i test si eseguono nell’ambiente scelto. Nel nostro caso, il punto saliente è la verifica di una esperienza percettiva vissuta nel quotidiano e, quindi, in situazioni ambientali le più disparate. Ho, perciò, optato per non creare quell’unico ambiente da laboratorio (che avrebbe contraddetto la “quotidianità” intesa come costante nella filosofia dell’esperimento ma, nel contempo, variabile perché facente parte del vissuto personale dei partecipanti al test). Vi sono, comunque, delle condizioni minime da rispettare e di cui tenere conto anche in fase di analisi dei dati :

  1. La grandezza e le caratteristiche della stanza in cui si ascoltano i suoni del test dovrebbero essere tali da non indurre particolari fenomeni di riverberazione (indicativamente  T60  tra 0.6 e 0.9 sec ) soprattutto per quello che riguarda le prime riflessioni indotte dall’ambiente che possono essere responsabili di punti di localizzazione della sorgente sonora “virtuali”. Anche la presenza di picchi di risonanza ambientali estremamente caratterizzanti dovrebbe essere evitata e, se non altro, segnalata sulla scheda relativa al test.
  2. I test sono stati pensati per una riproduzione tramite altoparlanti anche se l’uso di ear monitor o cuffiette (per altro accaduto durante i test) può aprire un ulteriore fronte analitico. In ogni caso, la qualità minima richiesta agli ascolti è di una risposta in frequenza che vada almeno da 80 hz ai 10 khz , quella ottimale è da 40 hz ai 20 khz. Anche il posizionamento degli altoparlanti è importante : essi si devono trovare ad altezza delle orecchie ed ad una distanza dall’ascoltatore che ho determinato, per esperienza, in H*4 ove H e l’altezza della cassa acustica contenente gli altoparlanti. Ciò per evitare, soprattutto nei casi di casse con woofer o bass reflex, middle range e tweeter, un marcato effetto di provenienza di suoni con range frequenziale diverso se l’ascoltatore fosse troppo vicino ad esse (rispettare tale condizione anche nel caso di disposizione orizzontale e non verticale della casse come alcune volte capita di fare).
  3. L’ascoltatore deve essere posto al centro del campo irradiante delle casse (punto di stereo) anche se, la quasi totalità dei suoni usati sono monofonici. Questo per evitare il più possibili eventuali riflessioni anomale soprattutto nel caso di sinusoidi pure.

Protocolli di esecuzione : l’esecuzione della sperimentazione necessita di una riflessione su almeno due punti salienti :

  1. L’ascolto di ognuno dei singoli files (tracce audio nel caso della riproduzione tramite CD audio) deve essere singolo, ovvero, non si deve ripetere la traccia già ascoltata. Ciò ha lo scopo di ottenere una informazione , da parte dell’ascoltatore, quanto più è vicina è possibile ad una reazione di tipo “istintiva” quale è quella che viviamo normalmente nella vita quotidiana quando percepiamo la provenienza di un evento acustico nel nostro ambiente. La eventuale ripetizione potrebbe, in qualche modo, compromettere l’istintività nella percezione filtrando l’esperienza attraverso parametri analitici i quali ci allontanerebbero dalla ricerca della naturalezza della stessa.
  2. Deve essere prevista una regia del suono durante l’esecuzione per poter rendere percettivamente uguali i volumi delle singole tracce dei tre CD del test. Difatti, le ampiezze dei singoli suoni utilizzati per l’esperienza, sono le stesse dato che sarebbe stato si possibile adattarle alle curve di Fletcher-Munson ma, impossibile modularle a seconda della diversa risposta ambientale e degli altoparlanti (soprattutto quelli di tipo consumer) che presentano caratteristiche di risposta in frequenza notevolmente diverse da tipo a tipo. Ho, perciò, scelto di ottenere il livellamento del loudness percepito in maniera “artigianale” ricorrendo, per l’appunto, alla regia del suono operata o dall’esecutore della sperimentazione o da un tecnico.

2.4 Costruzione dei suoni e loro tipologia, famiglie di appartenenza

Nella fase di costruzione dei suoni si è dovuto tenere conto delle domande a cui il test deve rispondere partendo dalla relazione suono-localizazione, vale a dire :

  1. Se vi è correlazione con la tipologia dei suoni, ovvero, sintetici e naturali
  2. Se, tra quelli sintetici, vi è differenza tra quelli puramente sinusoidali e quelli a spettro più complesso
  3. Se vi è correlazione con la morfologia del suono

A tale proposito ho sintetizzato una serie di suoni tale che potessero darmi indicazioni valide rispetto a quanto su esposto :

a ) suoni puramente sinusoidali

b ) suoni armonici ottenuti dall’additiva di 4 sinusoidi con ampiezza decrescente di 3 db per armonica ( vicina alla dente di sega)

c) suoni inarmonici tanto a spettro compresso che espanso ottenuti dall’additiva di 8 sinusoidi con ampiezza decrescente di 3 db ed esponente armonico pari a 0.332 per lo spettro compresso e 2.215 per quello espanso, a quest’ultimo sono stati sfalsati nel tempo la produzione delle parziali gravi e quelle acute.

Morfologicamente le differenziazioni riguardano :

a ) suoni ad attacco percussivo

b ) suoni ad attacco lungo

c ) suoni di breve durata (circa 0.5 sec)

d ) suoni di media-lunga durata (circa 2sec)

Le frequenze usate come riferimento per le fondamentali dei suoni sintetici sono :

BasseMedieAlte
40 – 80 – 100 hz160 – 200 – 400 hz1 – 2 – 3 – 4 – 6 – 8 khz

Nelle frequenze alte ho usato più suoni di riferimento per accertare se vi fosse una “caduta” della sensazione espressa dalla relazione frequenza acuta-posizione alta del suono ed, eventualmente, dove fosse collocata.

Suoni percussivi                                                                         Suoni ad attacco lungo

Strumento per la sinusoide ad attacco percussivo                                           Strumento per la sinusoide ad attacco lungo

Strumento per l’additiva a 4 armoniche                                              Strumento per l’additiva a 8 parziali

Struttura primaria dello strumento di additiva

Struttura primaria dello strumento di additiva

Un altro quesito deriva dalla “correlazione temporale” tra due suoni :

  • Se vi è differenza nella localizzazione dello stesso suono ascoltato da solo oppure in successione o sovrapposizione con un altro

Allo scopo ho posto suoni di altezze differenti nella stessa traccia (CD3).

Per quello che riguarda i suoni di carattere naturale ho usato dei campioni di piano, di batteria essendo, questi, strumenti che abbracciano tutta la gamma spettrale. Infine ho inserito (ultima traccia degli ascolti) una pop-song e, nella fattispecie, Englishman in New York di Sting. Quest’ultima è stata scelta per la sua forte connotazione nel contenere tutte le possibili informazioni frequenziali in maniera più che evidente ed ha la finalità di sottoporre all’attenzione dell’ascoltatore un ensemble di spettri complessi ma anche estremamente familiari.

Anche le “famiglie di appartenenza” riferite alla tipologia di ascoltatori e degli ascolti usati durante l’esperienza mi hanno condotto a formulare i seguenti quesiti :

  • Se vi è differenziazione nelle risposte al test tra musicisti e non musicisti
  • Se la tipologia degli ascolti usati nell’esperienza determini variazioni sostanziali nell’andamento complessivo del test

Così, nel questionario fornito agli ascoltatori, sono previste tanto la descrizione del tipo di lavoro svolto che degli ascolti usati durante il test.

2.5 Analisi dei dati

Protocolli di analisi : nella fase di analisi dei dati raccolti tramite i test, è stata compiuta una suddivisione per “famiglie di appartenenza” . Si sono, così, avute i seguenti gruppi di analisi :

  1. Schede ascoltatori musicisti
  2. Schede ascoltatori non musicisti
  3. Schede “out of control”

Al primo gruppo appartengono quegli ascoltatori il cui lavoro primario ricade nel campo della musica, mentre, al secondo, tutti gli altri. Il gruppo “out of control” riunisce quelle situazioni, tanto riguardanti i musicisti che i non musicisti, per le quali vi è stata una difficoltà obbiettiva di determinazione di validità del test, sia essa dovuta a problematiche legate alla fisiologia dell’udito che ad una condizione di qualità di ascolto non rientrante in quella minima necessaria espressa nei protocolli di realizzazione del test. I risultati delle schede dei singoli gruppi (suddivise per numerica del Cd di ascolto e frequenze) sono, quindi, confluiti in un foglio Excel ove sono stati elaborati i dati finali per “famiglie di appartenenza”, morfologia dei suoni, tipo di spettro e frequenza degli stessi, ottenendone anche dei grafici.

Analisi dei dati : ricordiamo che : il Cd1 contiene suoni puramente sinusoidali, il Cd2 suoni armonici con 4 armoniche. In entrambi i Cd sono presenti suoni lunghi o corti e ad attacco percussivo o con inviluppo lungo. In ogni caso si tratta di suoni singoli, ovvero, ascoltati in successione temporale. Nel Cd3 vi è una prima parte contenente suoni singoli a spettro inarmonico compresso o espanso per, poi, passare a quelli sinusoidali ma con due suoni anche sovrapposti, ovvero ascoltati anche insieme (definiti Mix). Nella seconda parte abbiamo i suoni di strumenti reali (anche in sovrapposizione) ed, infine, la traccia del brano pop.

Cd1 e 2 :

Le percentuali esaminate si riferiscono all’avvenuta localizzazione di quel gruppo di frequenze.

  1. Morfologia  : i tipi morfologici esaminati riguardano tanto la lunghezza dei suoni (suddivisi in suoni corti di circa 0.5 sec e lunghi di circa 2sec) che l’attacco (di tipo percussivo o ad inviluppo d’ingresso lungo). Di seguito i dati ricavati con relativi grafici e deduzioni analitiche :

Riferendoci al parametro “lunghezza del suono” è possibile dedurre dal grafico un andamento che favorisce la localizzazione delle frequenze sull’asse y leggermente maggiore per i suoni con durata lunga rispetto a quelli corti. Questo è vero soprattutto per le frequenze basse e le medie e diventa leggermente in controtendenza per quelle alte. Le percentuali di indecisione sono pressoché le stesse per entrambi i tipi di suoni.

Corta LFLunga LFCorta MFLunga MFCorta HFLunga HFCorta IndecisiLunga Indecisi
38,2 %43,6 %38,2 %44,1 %77,2 %75, 4 %1,1 %0,9 %

Osservando il comportamento statistico in caso di una diversa morfologia di attacco, il trend manifestato a proposito della lunghezza dei suoni sembra essere confermato. Difatti, anche più marcatamente che nel grafico precedente, i suoni ad attacco lungo sembrano più facilmente collocabili rispetto a quelli ad attacco percussivo. Anche qui vi è una differenziazione sulla gamma delle frequenze alte in cui le percentuali sono grosso modo le stesse, ma sempre con una leggera preminenza di quelle ad attacco percussivo.

Attacco percussivo LFAttacco lungo LFAttacco percussivo MFAttacco lungo MFAttacco percussivo HFAttacco lungo LF
32,8 %49 %35,7 %46,5 %76,7 %75,9 %

Da questi primi dati si può teorizzare che vi sia una maggior facilità nella localizzazione di eventi non percussivi ed a durata medio-lunga rispetto a quelli percussivi e corti. La causa o le cause, sebbene non sia questo lo scopo di questo studio, potrebbero essere da ricercare o nella conformazione del nostro sistema uditivo-percettivo o, anche, nel nostro tempo di latenza nella risposta analitica agli eventi sonori. Entrambe potrebbero essere valide, in particolare la seconda, in quanto tale latenza è sicuramente maggiore quando si tratta di affrontare analisi in qualche maniera “nuove” per noi come quella presa in considerazione. Difatti, per esperienza personale ed avendo già “assimilato” interiormente questo tipo di localizzazione dei suoni, a me risulta, per esempio, in eguale misura facile determinare tale posizionamento al di là che i suoni siano corti o lunghi e con diverso attacco.

  • Famiglie : le “famiglie” prese in considerazione sono di due tipologie, ovvero, quelle per categoria di appartenenza lavorativa (musicisti e non) e per qualità di ascolti usati durante il test (professionali, discreti o consumer). Ecco i relativi grafici e deduzioni analitiche:

Qui vengono poste in risalto le differenze tra il gruppo dei musicisti e quelli dei non-musicisti. Come si può osservare vi è una eguaglianza nei dati riguardanti le frequenze gravi ( 40,9% per entrambi) mentre vi è una discreta diversificazione per gli altri due gruppi frequenziali. Nelle medie abbiamo il quasi 47% dei musicisti con risposte ad esito positivo contro i 30,5% dei non musicisti e, nelle alte frequenze, si ha un ribaltamento del trend col 73,8 dei musicisti contro il circa 81% dei non musicisti. Gli indecisi nelle risposte hanno percentuali analoghe di circa l’ 1 %.

 LFMFHFIndecisi
Musicisti40.9 %46.9 %73.8 %1 %
Non musicisti40.9 %30.5 %80.9 %1 %

Per le tipologie di ascolti usati nell’esperienza devo dire che il dato che concerne gli ascolti discreti non è significativo a livello statistico in quanto vi è stato un solo soggetto che ha usufruito di ascolti di questo tipo e, quindi, le percentuali sono puramente indicative e non verranno prese in questa sede in considerazione. Le percentuali di riscontro positive sulle risposte, osservando il grafico, sono diversificate anche qui a seconda dei gruppi di

frequenze presi in considerazione. Sulle basse abbiamo una maggiore percentuale (47.5 %) degli ascolti consumer rispetto a quelli professionali (circa 40%). Nella gamma media vi è pressochè una  eguaglianza con circa il 42 % tanto per il tipo professionale che per quello consumer. Infine, nella gamma delle alte frequenze, gli ascolti professionali raggiungono il 91 % contro l’ 82 % dei consumer.

 LFMFHF
Professionali39.7 %41.6 %91 %
Discreti20.8 %29.1 %29.1 %
Consumer47.5 %42.5 %82.4 %

A dire il vero, osservando il trend di questi dati, mi sarei aspettato che i musicisti percepissero più facilmente questo tipo di localizzazione, cosa che in effetti non è stata. Sta, forse, ad indicare un’indipendenza della percezione dalla tipologia di lavoro? In parte credo di sì, anche se, avendo esaminate singolarmente le schede dati, nei musicisti pare che un grosso ruolo lo giochi lo strumento usato. Ad esempio, i o le cantanti, pare abbiano, insieme ai tecnici di missaggio, una maggior propensione alla localizzazione delle frequenze sull’asse y rispetto ai chitarristi, bassisti, compositori e pianisti . Anche qui le motivazioni potrebbero essere molteplici e, comunque, da verificare. A quanto risulta anche la tipologia di ascolto è ininfluente, nel nostro caso, se non per le frequenze alte ove, probabilmente, vi una maggiore facilità di riproduzione sugli ascolti professionali rispetto ai consumer.

  • Suoni sintetici sinusoidali e a spettro complesso armonico : tra le tipologie di suoni usate durante il test, due di esse derivano da puri suoni sinusoidali (Cd1) mentre, l’altra, dalla additiva di quattro sinusoidi riscalate in ampiezza e con rapporti armonici tra loro (Cd2). Questi i dati ricavati :

Le quantità di risposte di localizzazione per diversi gruppi di frequenze ( LF = basse, MF = medie, HF = alte) indicano che, per le frequenze medie, vi è una maggiore incidenza statistica nel Cd2 (suoni a spettro complesso) rispetto al Cd1 (suoni sinusoidali). Condizione quasi di parità, invece, per il gruppo delle basse ed alte frequenze.

 LFMFHF
Cd18577312
Cd28291311

In questa prima fase analitica sulla tipologia sonora basata sulle diversità di spettro, i risultati indicano una localizzazione insensibile al fatto che lo stesso spettro sia puramente sinusoidale o complesso armonico. Ricordiamo che si tratta, comunque, di suoni di sintesi, per cui, sarà interessante sovrapporre questi dati con quelli ricavati dal Cd3 (suoni a spettro complesso inarmonici e suoni naturali). A questo proposito riepilogo di seguito le percentuali per gruppi di frequenza dei primi due CD ottenute dalla medie dei risultati esposti nella tabella per famiglie (musicisti e non) :

LFMFHFIndecisi
40.9 %38.7 %77.3 %1 %

Cd3 :

  1. Suoni sintetici  a spettro complesso inarmonico : qui si è utilizzata una additiva di otto sinusoidi riscalate in ampiezza e con rapporto spettrale compresso per le prime 12 tracce (attacco percussivo e suono lungo), mentre, per la tredicesima traccia, lo spettro è espanso con attacchi sfalsati, temporalmente, per due gruppi di armonici differenti (4 + 4). Questa traccia, data la sua costruzione, può indurre l’ascoltatore alla percezione di due suoni contemporanei : uno grave (primo gruppo di 4 parziali) e l’altro acuto (secondo gruppo di 4 parziali) ed assume anche valenza (la risposta da dare è ancora unica e non molteplice come dalla traccia 14 in poi) di controllo sulla scelta che l’ascoltatore compie su quale gruppo frequenziale discriminare nella risposta data. Per alcuni sarà il gruppo a frequenza bassa, per altri quello a frequenza alta a seconda della facilità di riconoscimento della localizzazione.

Come si può notare dal grafico, in questo caso, le percentuali salgono in favore del gruppo delle frequenze basse ( 45.5 % contro il 40.9 % dei primi due Cd) e medie ( 49 % contro 38.7 % dei Cd1 e 2), mentre, si ha un calo sulle frequenze alte ( 71.4 % contro il 77.3 % del Cd1 e 2). Aumentano leggermente gli indecisi rispetto ai Cd precedenti.

 LFMFHFIndecisi
Cd3 Inarmonici45.5 %49 %71.4 %3.1 %
Cd1-240.9 %38.7 %77.3 %1 %

Questa comparazione ci porta a pensare che gli spettri inarmonici siano localizzati più esattamente di quelli armonici soprattutto nella gamma bassa e media, ma che inducano anche una maggiore indecisione. In quella alta, il risultato è ribaltato (anche se relativamente) e, forse, connesso ad una maggiore difficoltà di correlazione delle parziali, di questo tipo di spettro, con fondamentali acute.

La traccia 13 (spettro espanso) ha indotto, curiosamente, la quasi totalità degli ascoltatori a porla tra le frequenze medie, quasi a cercare una “media frequenziale” tra le componenti gravi ed acute in essa presenti.

  • Suoni misti di sintesi (mix) : nel terzo Cd sono contenute tre tracce con eventi sonori prodotti dapprima in tempi separati e poi sovrapposti. Le frequenze dei due suoni sono distanziate in maniera tale da avere, ad esempio, basse ed alte insieme o basse,medie ed alte etc…, così che compaiono punti di riferimento nella localizzazione degli stessi eventi sonori : ascolto un suono lo colloco nello spazio e, per comparazione, colloco anche il secondo in riferimento al primo. Sarà interessante stabilire se questa comparazione confermi, magari anche aumentando le percentuali relative, o disconosca i dati finora raccolti. Di seguito l’analisi :

Quello che risalta già a prima vista è un notevole abbassamento della percentuale del gruppo frequenze alte (56.8 %) ed anche un aumento degli indecisi (6.7 %). Gli altri due gruppi frequenziali si attestano sul 50 % delle basse ed il 54.7 % delle medie. Ricavando una percentuale relativa ai suoni singoli e data dalla somma dei valori per gruppo di frequenze della tabella precedente ( paragrafo Cd3 suoni sintetici a carattere inarmonico) divisa per due, possiamo confrontare questi dati con quelli ottenuti dai suoni mix.

 LFMFHFIndecisi
Suoni Singoli43.2 %44.3 %74.3 %2 %
Mix50 %54.7 %56.8 %6.7 %

E’ abbastanza evidente un notevole incremento nelle percentuali dei gruppi LF e MF ( si arriva fino al 10 % in più) , mentre, per le HF la situazione è nettamente capovolta anche se ben al sopra della soglia minima da noi stabilita come accettabile (40 %). Sono aumentati di più di tre volte gli indecisi forse dovuto alla non comune abitudine di discriminare più eventi simultaneamente. Rimango un po’ perplesso sul dato delle HF che, evidentemente, da sole producono una maggiore chiarezza nella localizzazione rispetto a quando sovrapposte o accompagnate da altre informazioni di frequenza nettamente diversa.

  • Strumenti reali : le ultime tre tracce del Cd3 contengono suoni di strumenti di uso corrente e, più precisamente, una traccia con suoni di piano acustico, una con suoni di batteria acustica ed, infine, una pop song. Le tracce di piano e batteria sono state costruite sulla maniera dei suoni mix facendo, quindi, ascoltare prima suoni singoli di varie altezze e poi sovrapposti temporalmente. Il pezzo pop contiene, logicamente, l’insieme delle varie e possibili frequenze di uso musicale tradizionale. Anche in questo caso il dato interessante sarà il confronto con le situazioni precedenti tanto di suoni singoli che mix però di tipo sintetico.

Le MF subiscono una notevole impennata mai raggiunta prima (76.4 %) mentre le LF si attestano grosso modo sul 47 % . Si riconfermano sia il trend negativo per HF, che toccano il punto più basso col 49 %, che la crescita della percentuale degli indecisi (9.1 %).

 LFMFHFIndecisi
Suoni Singoli43.2 %44.3 %74.3 %2 %
Mix50 %54.7 %56.8 %6.7 %
Strumenti reali47 %76.4 %49 %9.1 %

Comparando i dati in tabella si può affermare che la sovrapposizione temporale dei suoni favorisce in maniera significativa soprattutto quelli del gruppo MF ed, in particolare, con gli strumenti reali. Può essere lecito desumere che questo gruppo frequenziale sia più facilmente localizzabile sull’asse y perché contiene frequenze che più facilmente rientrano nella quotidianità tanto di ascolti musicali che di background sonoro della nostra giornata. Le LF si attestano, anche se con un lieve calo, sul dato dei suoni mix confermando la loro maggiore riconoscibilità all’interno di più eventi simultanei. Rimane la percentuale delle HF, sempre più in calo, che pare confermare che, al contrario delle MF, queste siano più confuse in un ensemble frequenziale rispetto alla loro percezione da eventi singoli. Così anche la quantità di indecisi conferma la difficoltà di discriminazione dei singoli eventi all’interno di un gruppo sovrapposto di essi e, forse, dovuto ad una “latenza” nella risposta dell’ascoltatore comune (sia esso anche musicista) all’analisi di più eventi concomitanti. Un’ultima considerazione va fatta alla eventuale differenziazione tra suoni sintetici e naturali : in effetti, non pare, se non per la gamma delle frequenze medie, che l’ascoltare dei suoni di strumenti acustici rispetto a quelli sintetici aiuti più di tanto la loro localizzazione sull’asse y. Bisogna, però, ribadire, come affermato in precedenza, che la maggior parte degli eventi sonori del nostro quotidiano rientrano nella gamma media o medio-bassa, almeno quelli a più grande intensità percepita.

I dati delle schede Out of control : ricordiamo che in questo gruppo rientrano “quelle situazioni, tanto riguardanti i musicisti che i non musicisti, per le quali vi è stata una difficoltà obbiettiva di determinazione di validità del test, sia essa dovuta a problematiche legate alla fisiologia dell’udito che ad una condizione di qualità di ascolto non rientrante in quella minima necessaria espressa nei protocolli di realizzazione del test”. Anche qui sono stati calcolati, come visto in precedenza, i vari dati e, per brevità ed essendo ininfluenti sul risultato complessivo finale, riporto solo le percentuali complessive. Esse sono relative alle tre schede prese in considerazione.

LFMFHFIndecisi
35.7 %35 %50 %3.2 %

Le medie delle LF e MF sono similari e al di sotto dello standard minimo (40 %) che ci siamo posti come accettabile per prendere come veritiero il postulato iniziale sulla localizzazione sull’asse y. Discorso inverso nel caso delle HF che, comunque anche in questo caso, confermano una maggiore facilità medio-statistica di localizzazione, mentre, le percentuali di indecisione si mantengono ancora basse. In ogni caso, mi sento di poter affermare che, sia pure in presenza di “handicap” fisici o logistici, il trend statistico sembra favorire la tesi di veridicità del postulato sulla localizzazione.

Percentuali conclusive : qui vengono esposti i dati finali ricavati dalle medie dei Cd1-2-3 (senza considerare gli “out of control”). Possiamo avere, così, un quadro complessivo del fenomeno.

LFMFHFIndecisi
44.9 %53.5 %66.4 %4.2 %

Tutti i dati superano il 40 % (limite minimo perché il postulato iniziale sia verificato) e questo rende veritiero il postulato da me esposto come base per questo studio. Si può dire che la maggiore facilità di localizzazione sull’asse y dei gruppi frequenziali segua quest’ordine :

  1. HF : queste, nonostante come si sia visto, creino qualche problema di localizzazione quando sono concomitanti ad altri eventi sonori, sono le frequenze che danno all’ascoltatore maggiore chiarezza nel loro posizionamento. Le motivazioni di ciò sono forse da cercare nel nostro sistema uditivo-percettivo e potrebbero essere ulteriore fonte di studi.
  2. MF : anche qui superiamo il 50 % , il che, rende il dato significativo anche al di là delle considerazioni sulle problematiche della statistica in campo percettivo (già discusse nel paragrafo “Cosa ci si aspetta”). Quindi, insieme a quello delle HF, quasi un valore statistico assoluto di affermazione della teorizzazione sulla localizzazione. Per le MF in particolare, il dato rilevato potrebbe trovare spiegazione, come su affermato, nel fatto che queste siano frequenze più facilmente “vivibili” nel nostro quotidiano e, perciò, a noi più familiari e con cui, di conseguenza, abbiamo già fatto i conti con la loro localizzazione seppure istintiva.
  3. LF : la percentuale del 44.9 % che qui ritroviamo supera di quasi 5 punti la soglia minima imposta il che rende anche questo gruppo a tutto titolo rientrante nella veridicità del postulato che ci siamo posti di verificare. In effetti, questo gruppo, pare che sia quello che crea maggiori problemi nella loro localizzazione ed, pure in questo caso, la risposta a questo quesito potrebbe risiedere nella costruzione del nostro sistema percettivo-uditivo ed anche nell’area 41 di Brodman.

Un’ultima considerazione, che conferma comunque la veridicità della teorizzazione iniziale, è da fare se andassimo a considerare statisticamente accettabili anche le schede “out of control”. Ricavandone la media pesata ( in rapporto al numero di schede ) il risultato finale si abbasserebbe ma di talmente poco da poter essere considerato sempre al di sopra del nostro famigerato 40 % anche per il gruppo LF che è quello a percentuale più bassa. 

Lascia un commento