Penginderaan suara

 Penginderaan Suara: Pendahuluan

Bab ini terbagi atas tiga bagian. Pada bagian pertama akan dilihat bagaimana telinga manusia mengubah gelombang suara menjadi sinyal elektrik yang kemudian diterjemahkan oleh otak. Pada bagian kedua akan dianalisa bagaimana otak mengindera suara. Digunakan kata “indera” karena persepsi suara adalah penerjemahan yang subjektif oleh alat pendengar. Untuk mendukung poin ini, bagian ketiga akan memperlihatkan beberapa mekanisme yang mengubah persepsi suara ketika beberapa parameter berubah, seperti posisi sumber suara terhadap pendengar.

Telinga Manusia

Telinga manusia bertindak sebagai transduser energi akustik, pertama menjadi energi mekanik kemudian menjadi energi listrik. Setelah energi dikonversi dari mekanik menjadi elektrik oleh telinga, impuls listrik mencapai otak melalui sistem syaraf. Disini impuls tersebut diproses sehingga terjadi persepsi suara dan terdengar suara.

Alat pendengaran dibagi menjadi tiga area: telinga eksternal, telinga tengah, dan telinga dalam.

Gambar 2.1 Telinga manusia

Menganalisa bagaimana ketiga area ini bekerja membuat kita bisa memahami mekanisme persepsi suara dan menentukan parameter yang perlu diubah untuk mendapatkan hasil yang diinginkan. Sebagai contoh, ambil kasus ketika sedang mixing suatu track dimana suara flute terdengar nyaring beberapa kali diantara instrumen lainnya. Bila kita menginginkan suara flute menjadi sayup atau samar-samar kita bisa mengubah suaranya dengan menghilangkan frekuensi tingginya. Sebentar lagi kita akan melihat bagaimana salah satu faktor paling penting dalam menentukan arah suara adalah melalui kandungan frekuensi tingginya. Dengan kata lain, lebih mudah untuk mengetahui arah suara dengan kandungan frekuensi tinggi, bukan dengan kandungan frekuensi rendahnya. Jadi, bila kita menginginkan suara flute untuk hadir tetapi terdengar jauh dalam mix, kita bisa mengubah panoramic potentiometer ke kanan dan meningkatkan frekuensi tinggi (tanpa mengubah sifat alamiah suara secara berlebihan).

2.2.1 Telinga luar

Organ pertama yang menerima suara ketika mencapai telinga disebut dengan pinna. Organ ini memiliki luas permukaan yang besar sehingga memungkinkan porsi yang lebar dari gelombang untuk diterima. Untuk mendapatkan permukaan yang lebih luas bisa dengan menangkupkan tangan pada telinga seperti ketika kita ingin mendengar sesuatu dengan lebih jelas. Suara direfleksikan oleh pinna dan disalurkan menuju canal telinga yang panjangnya sekitar 3 cm.

Frekuensi resonansi dari kanal telinga – ada suatu rumus empiris yang memberikan frekuensi resonansi suatu tabung, dalam kasus ini berbentuk kanal telinga. Hasil dari perhitungan ini penting untuk dipahami.

Rumus tersebut menyatakan bahwa suatu tabung dengan panjang l dipenuhi dengan udara, memiliki frekuensi resonansi sekitar:

Persamaan 2.1 Perhitungan frekuensi resonansi kanal telinga

mengingat panjang kanal telinga sekitar 3 cm maka didapat panjang gelombang 12 cm.

\lambda=4 l=12 cm

Dengan mengetahui panjang gelombang kita bisa menghitung nilai frekuensi resonansi:

v=\lambda f\Longrightarrow f=\frac{v}{\lambda}=\frac{344m/s}{0,12m}\simeq 3 kHz

Dari perhitungan diatas kita menemukan bahwa frekuensi resonansi dari telinga manusia adalah sekitar 3000 Hz atau 3 kHz. Ini berarti ketika grup frekuensi sekitar 3 kHz mencapai telinga, kanal telinga beresonansi sehingga frekuensi mengalami amplifikasi natural. Berikutnya kita akan melihat bagaimana nilai ini sering diterapkan dalam sound engineering.

2.2.2 Telinga tengah

Kanal telinga berakhir pada sebuah membran drum telinga yang bergetar bersama dengan suara yang tiba di telinga. Di sisi yang berlawanan dari drum telinga ada tiga tulang kecil yang disebut: incus (atau anvil), stapes (atau stirrup), dan malleus (atau hammer). Fungsi masing-masing adalah untuk mengamplifikasi getaran dari drum telinga dan mentransfernya ke cochlea, tulang kecil lainnya yang fungsinya akan dijelaskan nanti. Amplifikasi ini perlu mengingat bahwa meski drum telinga adalah membran yang tipis, cochlea dipenuhi dengan cairan padat sehingga bergetar jauh lebih tidak mudah. Tiga tulang kecil disambung dengan ligamen yang memilik fungsi lain selain amplifikasi yaitu untuk mencegah drum telinga mengikuti getaran terlalu besar sehingga mencegah kerusakan yang bisa terjadi akibat tingkat tekanan suara yang tinggi. Bukaan di telinga tengah berlanjut ke eustachian tube yang mencapai oral cavity. Fungsinya adalah untuk memberikan saluran keluaran untuk menyeimbangkan tekanan atmosferik pada kedua sisi drum telinga (sehingga ketika berenang, sebaiknya kita menutup hidung dan menghempaskan nafas kuat-kuat untuk membangun tekanan dalam telinga untuk menyeimbangi tekanan luar telinga).

2.2.3. Telinga dalam

Bagian telinga dalam mengkonversi energi mekanik menjadi impuls listrik yang dikirim ke otak untuk diproses sebagai suara. Tulang kecil terakhir dari tiga tulang kecil yang disebut diatas, stapes, berkontak dengan cochlea melalui membran yang disebut oval window. Cochlea adalah tulang yang berbentuk seperti cangkang bekicot mengandung cairan (memiliki tiga kanal sirkular mengarah ke tiga arah ruang. Indera keseimbangan datang dari cochlea). Cairan ini menerima getaran dari stapes melalui oval window dan melanjutkannya ke organ utama yang mengkonversi energi mekanik menjadi impuls listrik: organ Corti.

Dalam organ Corti kita menemukam basilar membrane yang memiliki ribuan rambut pada permukaannya, sekitar 4000 lebih tepatnya, semuanya bergetar bersamaan dengan getaran fluida. Setiap kumpulan rambut berhubungan dengan sistem syaraf yang mengubah getaran yang diterima dari fluida menjadi impuls listrik. Alasan mengapa telinga manusia mengindera frekuensi secara logaritmik adalah karena sifat alamiah dari membran. Grup rambut, atau disebut critical band, sensitif terhadap 1/3 dari frekuensi satu oktaf. Dengan kata lain basilar membrane terbagi menjadi beberapa sektor, setiap sektornya sensitif terhadap band frekuensi tertentu (masing-masing 1/3 oktaf dalam frekuensi) sehingga bertingkah laku seperti semacam spectrum analyzer. Setiap kali suara meningkat satu oktaf, sektor yang sama jauh dengan yang sebelumnya terstimulasi sehingga memiliki karakter logaritmik.

Persepsi Suara Oleh Otak

Tanpa berbicara terlalu filosofis, untuk mudahnya dapat dikatakan persepi suara adalah perihal yang subjektif, sama seperti persepsi realitas secara keseluruhan. Suara secara diri sendirinya adalah suara, tetapi persepsi kita akan suara bervariasi, mengingat kebergantungannya terhadap variabel tak terhitung, antara lain: posisi kita terhadap suara, kondisi alat pendengaran kita, dan terutama bagaimana otak kita menginterpretasikan suara.

Sama seperti penglihatan memiliki persepsi yang terbatas akan cahaya, pendengaran juga hanya mampu mengindera sebagian dari gelombang akustik yang mengelilingi kita sehingga memberikan kita pengalaman audio yang parsial. Gelombang yang diterima lebih dibuat rumit oleh otak yang menginterpretasikan suara yang harus diprosesnya. Kita akan mendeskripsikan tingkah laku suara dari sudut pandang persepsi dan mendemonstrasikan bagaimana kondisi tertentu kemampuan interpretatif otak beraksi dan menginterpretasi realita alih-alih mereproduksinya secara akurat. Contoh yang baik diberikan dalam bahasan berikut yaitu beatings.

Beatings

Ketika kita mendengar dua suara dengan frekuensi yang sedikit berbeda, kita mempersepsi suatu suara ekstra. Suara ini mirip dengan kedua sumber suara tetapi kita juga bisa mendengar suatu irama (atau beat) yang lajunya ditentukan oleh frekuensi kedua suara. Bila dua frekuensi ini terlalu jauh berbeda, otak kita tidak lagi mempersepsi irama ini. Hal ini karena untuk mempersepsi kedua suara sebagai beating atau irama, keduanya harus menstimulasi grup rambut yang menempati critical band yang sama. Frekuensi irama sama dengan jumlah kali kedua sinusoid dalam keseragaman fase dan kesenjangan fase. Sebagai contoh, dua frekuensi 400 Hz dan 405 Hz menghasilkan osilasi yang baru sehingga kita mendengar irama.

Gambar 2.2 Jumlah dua sinusoid 400 Hz dan 405 Hz


Volume dan penginderaan frekuensi, distorsi, dan masking

( no konten )




Efek Doppler

Fenomena ini terjadi ketika sumber suara atau pendengar bergerak. Contoh klasik adalah sirene ambulans yang mendekat dan menjauh.

Gambar 2.3 Efek Doppler

Kita lihat gambar dimana ambulans diam dan sirene mengeluarkan suara pada frekuensi tertentu sehingga menghasilkan gelombang dengan interval yang konstan. Ketika kendaraan bergerak mendekati pendengar, sirene yang sama menghasilkan gelombang dengan interval yang lebih dekat dibandingkan ketika kendaraan diam. Ini karena pergerakan membuat gelombang terkompres. Karena gelombang lebih rapat satu sama lain, terdengar frekuensi yang lebih tinggi atau dengan kata lain suara yang lebih akut. Ketika kendaraan lewat dan menjauh, jarak antara gelombang bertambah sehingga pendengar mendengar suara dengan frekuensi lebih rendah.


Efek Haas

Haas effect atau efek Haas adalah fenomena yang terjadi ketika otak mempersepsi suara. Kita tinjau suatu suara yang dihasilkan satu sumber dan pendengar berada dalam ruangan dengan jarak tertentu dari sumber. Pertama pendengar akan dicapai oleh sinyal yang datang paling langsung dari sumber suara dan kemudian oleh refleksi sinyal yang memantul dari tembok. Delay atau tunda ini terjadi karena suara pantulan menempuh jalur yang lebih panjang untuk mencapai pendengar daripada suara langsung. Bila kedua sinyal tiba dengan sedikit tunda diantaranya, keduanya dipersepsi otak sebagai satu suara saja dari satu arah saja. Arah yang diidentifikasikan oleh otak sebagai sumber suara adalah yang dimiliki suara yang mencapai telinga lebih dahulu (hal ini berlaku meskipun intensitas gelombang kedua lebih besar dari yang pertama) sehingga efek ini juga disebut precedence effect atau efek pendahulu. Efek ini terjadi ketika tunda diantara kedua sinyal cukup singkat, antara 30-35 ms. Interval ini disebut juga dengan zona Haas.

Persamaan 2.2 Zona Haas
0 – 35ms

Ketika tunda antara kedua sinyal keluar dari batas zona Haas kita mendengar dua suara yang berbeda dan mulai memasuki daerah echo atau gema, dimana pendengar mendengar kedua suara sebagai suara yang terpisah.

Equal Loudness Contour


Kurva isofonik adalah grafik yang penting untuk membantu kita memahami bagaimana telinga manusia berespon terhadap frekuensi berbeda. Kurva ini ditemukan dengan memproses data statistik. Suatu subset populasi dipapar terhadap serangkaian suara yang dihasilkan dalam ruangan anechoic. Ruangan anechoic dirancang untuk mengurangi pantulan sebanyak mungkin agar suara yang didengar hanyalah suara langsung. Kurva ini mengindikasikan bagaimana telinga manusia bereaksi berbeda terhadap frekuensi berbeda, dalam hubungannya dengan intensitas dari suara yang dipersepsi. Kita asumsikan suatu sumber suara yang menghasilkan gelombang sinusoid yang memiliki frekuensi variabel pada amplitudo yang konstan. Ketika suara memiliki amplitudo 80 dB SPL, pendengar mengindera frekuensi rendah sebagai suara dengan volume yang sangat rendah dan ketika frekuensi dinaikkan pendengar mengindera peningkatan dalam volume (meskipun suara yang dihasilkan tetap berada pada 80 dB SPL). Tingkah laku ini terjadi karena telinga manusia mengindera intensitas suar a berbeda-beda pada frekuensi yang berubah. Kurva isofonik mengindikasikan tingkat dBspl yang dibutuhkan untuk mempersepsi suara pada volume yang sama sepanjang kurva. Frekuensi referensi untuk setiap kurva adalah 1 kHz, dan pada frekuensi ini nilai dBspl sama dengan nilai yang mengidentifikasikan suatu kurva, dandisebut phone. Sebagai contoh, kurva isofonik 40-phone adalah kurva yang memiliki amplitudo 40 dB SPL pada 1 kHz. Kurva isofonik diberikan dalam gambar berikut:


Gambar 2.4 Kurva isofonik

Sebagai contoh kita melihat kurva 80 phone dan mengikutinya dari frekuensi rendah hingga tinggi. Pada 20 Hz terlihat bahwa perlu dihasilkan tekanan suara sebesar 118 dB SPL. Ini menunjukkan kepada kita bagaimana telinga manusia kurang sensitif terhadap frekuensi rendah. Ketika kurva diamati mengikuti frekuensi tingginya dapat dilihat agar telinga mempersepsi volume yang sama dibutuhkan tekanan suara yang lebih rendah. Pada 1 kHz terlihat nilai referensi kurva isofonik yang kita gunakan, yaitu 80 dB SPL. Lebih dari nilai ini dapat dilihat terjadi nilai minimum pada 3 kHz, dan agar telinga mempersepsi tingkat suara yang sama sinyal 3 kHz tersebut harus memiliki tekanan 70 dB SPL. Ketika nilai ini dibandingkan dengan nilai pada frekuensi 20 Hz dapat dilihat ada perbedaan sebesar 50 dBspl, jumlah yang besar dalam istilah suara. Nilai minimum ini dikarenakan frekuensi resonansi kanal telinga bernilai 3 kHz sehingga frekuensi ini sudah terdengar pada tingkat dB SPL yang rendah.. Diatas 3 kHz kurva kembali meningkat menunjukkan tingkat dB SPL yang dibutuhkan untuk mempersepsi suara dengan volume yang sama pada frekuensi yang tinggi. Setiap kurva mengidentifikasikan nilai phone yang terpisah sesuai dengan perubahan pada tingkah laku telinga manusia ketika tingkat tekanan suara berubah. Dapat dilihat juga pada tingkat tekanan suara yang tinggi, kurva isofonik hampir rata.

Tip:

Kendali volume pada sistem home amplifier diregulasi oleh laju kurva ini. Ketika volume sangat rendah, aktivasi kekerasan amplifier menyebabkan peningkatan pada frekuensi rendah, menyamai amplitudo frekuensi yang lain. Penyamaan ini terjadi secara alamiah pada telinga pada volume yang tinggi, sehingga mengaktivasi kekerasan tidak akan berpengaruh.

2.8.1 Deskripsi kurva isofonik

2.8.1.1 Ambang batas pendengaran (0 phone)

Kurva isofonik yang paling rendah disebut ambang batas audibilitas (pendengaran) dan mengindikasi perubahan tekanan terkecil yang bisa dideteksi telinga pada frekuensi yang berbeda. Penting untuk mengingat kurva-kurva ini berdasarkan data statistik sehingga nilai referensi ini bisa berubah untuk setiap orang. Beberapa nilai referensi berdasarkan kurva ini bisa berguna untuk kepraktisan.

Tabel 2.1. Beberapa nilai referensi untuk kurva ambang batas pendengaran

Zona Frekuensi

Hz

dBspl

Referensi

1000

5

Frekuensi rendah

50

42

Frekuensi tinggi

10000

15

2.8.1.2 Ambang batas rasa sakit (140 phone)

Tekanan suara dengan nilai diatas kurva 140 phone dipersepsi sebagai rasa sakit nyata oleh telinga dan bisa menyebabkan kerusakan ireversibel bila terpapar dalam waktu yang lama.

Volume mixdown yang ideal adalah sekitar 80-90 phone. Pada nilai ini volume frekuensi cukup seimbang. Bila mixdown dilakukan pada volume yang terlalu rendah, misal 40 phone, kita akan mendengar frekuensi rendah yang lebih sedikit dan tergoda untuk menambahkannya menggunakan ekualisasi. Namun, ketika didengar kembali pada 80 phone, terdengar terlalu banyak frekuensi rendah.

Psychoacoustic

Psikoakustik mempelajari cara otak menerjemahkan suara. Pengetahuan yang baik tentang mekanisme ini sangat diperlukan dalam sound engineering, dimana dengan manipulasi yang tepat, dapat dihasilkan efek suara yang sangat rumit. Salah satu faktor yang penting ketika memproses suara adalah otak menerjemahkan dua saluran informasi suara sekaligus; yang masuk telinga kiri dan yang masuk telinga kanan. Terkadang, perbedaan (tipis) antara kedua sinyal inilah yang menghadirkan informasi baru yang terasosiasi dengan komposisi dua gelombang suara. Dalam kasus ini kita berbicara mengenai suara stereophonic sound. Ketika kedua sinyal tiba pada saat yang tepat sama disebut monophonic sound.

2.9.1 Lingkungan

Suara dari suatu instrumen berubah sebagai fungsi dari lingkungan. Seluruh pantulan awal masuk ke zona Haas dan memberikan karakter kepada aspek “ruangan” dari instrumen.

2.9.2 Supresi pewarnaan

Dua sinyal yang datang dari sumber suara yang sama menciptakan perbedaan fase yang diinterpretasikan oleh otak. Jika sinyal ini didengar melalui satu telinga saja, ia akan terdengar tidak menyenangkan, sedangkan ketika didengar melalui kedua telinga akan menciptakan efek yang menyenangkan.

2.9.3 Ilusi oktaf

Kita telah melihat bahwa ketika suatu not yang dimainkan, muncul frekuensi fundamental beserta harmoniknya. Otak mampu merekonstruksi frekuensi fundamental dengan hanya mendengar harmoniknya saja. Sebagai contoh suatu radio pantai memiliki speaker yang kecil dan sedang memainkan lagu hit terbaru. Radio tersebut memainkan lagu dengan pita frekuensi yang sangat tereduksi tetapi telinga masih bisa mendengar kandungan bass dikarenakan kemampuan otak merekonstruksi frekuensi fundamental berdasarkan informasi harmoniknya.

2.9.4 Cocktail party effect

Cocktail party effect atau efek pesta cocktail adalah kemampuan otak untuk mendengarkan satu sinyal spesifik diantara sekumpulan suara yang tumpang tindih. Sebaga contoh ketika kita pergi keluar untuk makan malam di restoran favorit yang sedang ramai. Meskipun ada suara latar belakang yang ramai dan tidak jelas, kita masih bisa mendengar atau merinci suatu suara spesifik diantara kerumunan suara tersebut, seperti perbincangan yang terjadi di meja lain.

Lokalisasi Sumber Suara

Kita mengambil kasus sumber suara aktif dan pendengar dalam posisi seperti gambar berikut:

Gambar 2.5 Inter-arrival time

Sinyal yang sampai ke telinga berbeda satu sama lain. Perbedaan utama adalah:

2.10.1 Perbedaan waktu (fase)
Pada gambar sebelumnya kita melihat bagaimana jarak antar kedua telinga dari sumber suara berbeda. Ini menyebabkan perbedaan pada waktu tiba, yang disebut inter-arrival time atau waktu tiba antara, dari setiap sinyal ke masing-masing telinga (dalam kasus di atas, sinyal tiba di telinga kanan lebih dahulu daripada telinga kiri).
Secara alamiah ini berarti terjadi perbedaan fase, karena tunda waktu dan perbedaan fase memiliki hubungan yang intrinsik.

2.10.2 Perbedaan amplitudo
Amplitudo dari kedua sinyal berbeda karena amplitudo berkurang dengan bertambahnya jarak, dan karena sinyal mencapai telinga terjauh dengan mengelilingi rintangan yang berupa kepala maka terjadi kehilangan energi.

2.10.3 Perbedaan kandungan harmonik
Dengan referensi ke gambar sebelumnya, kita dapat melihat bahwa salah satu dari kedua gelombang harus memutari kepala untuk mencapai telinga terjauh. Ini menyebabkan hilangnya frekuensi tinggi karena difraksi. Frekuensi tinggi tidak bisa melewati rintangan kepala sehingga menyebabkan perbedaan kandungan frekuensi ketika memasuki telinga. Hal inilah yang menyebabkan mengapa sulit untuk menentukan arah suara frekuensi rendah; karena frekuensi rendah bisa mengelilingi rintangan tanpa kehilangan energi dalam jumlah yang signifikan sehingga suara yang mencapai telinga hampir identik. Dalam situasi dimana sumber suara berada tepat dibelakang pendengar, arahnya dapat ditentukan karena kekurangan frekuensi tinggi terindera; frekuensi tinggi tersebut teratenuasi oleh pinna.

Binaural Fusion

Ini adalah kemampuan otak untuk memadukan dua sinyal serupa yang sampai ke telinga; sinyal baru yang terindera bisa dikatakan sebagai sinyal baru yang tidak eksis secara nyata. Sebagai contohnya suatu xylophone. Kita mainkan suatu melodi dan merekamnya pada satu track dan memainkan melodi yang sama tetapi dengan sedikit perbedaan dan merekamnya pada track lain. Ketika kedua rekaman ini diputar ulang, satu melodi melalui channel kiri dan satu melalui channel kanan, terindera melodi ketiga yang merupakan perpaduan dari kedua melodi sebelumnya tetapi sebenarnya tidak nyata. Ini adalah salah satu rahasia dari keajaiban musik; masing-masing instrumen memainkan melodinya masing-masing dan bila kita perhatikan kita bisa memisahkan masing-masing instrumen dan mendengarnya, bahkan ketika semua instrumen bermain secara bersamaan. Tetapi bisa dikatakan bahwa pada saat itu kita mengindera yang tidak nyata: kombinasi dari semua suara menciptakan harmoni. Dan pada saat itulah musik terlahirkan.



Spektrum Frekuensi Pendengaran

( no kenten )