Pendahuluan

Apakah Suara Itu?

Satu definisi yang bisa kita berikan adalah kita mengindera suara ketika terjadi variasi tekanan udara terhadap suatu nilai yang konstan. Ketika variasi ini diulang secara siklus dalam suatu rentang waktu, suara terindera. Suara membutuhkan suatu medium untuk dapat berjalan. Udara adalah salah satu medium tersebut. Partikel udara yang satu memindahkan getaran yang dihasilkan sumber suara ke partikel udara lainnya, sehingga menyebarkan suara ke ruang. Ini berarti medium apapun, baik itu padat, cair, atau gas, dapat memindahkan suara, dengan kecepatan perjalanan yang berbeda bergantung terhadap densitasnya. Kita menggunakan udara sebagai medium referensi.

Menurut Azhar [1], suara dihasilkan melalui dua buah proses yaitu Generation dan Filtering. Pada proses Generation, suara pertama kali akan diproduksi melalui bergetarnya pita suara (vocal cord dan vocal fold) yang berada di larynx untuk menghasilkan bunyi periodik. Bunyi periodik yang sifatnya konstan tersebut kemudian disaring melalui vocal tract (juga disebut dengan istilah resonator suara atau articulator) yang terdiri dari lidah (tongue), gigi (teeth), bibir (lips), langit-langit (palate) dan lain-lain sehingga bunyi tersebut dapat menjadi bunyi keluaran (output) berupa bunyi vokal (vowel) dan atau bunyi konsonan (consonant) yang membentuk kata-kata yang memiliki arti yang yang nantinya dapat

dianalisa untu

k voice recognition.

Propagasi Suara

Bab ini mengenalkan suara sebagai entitas fisik dan menggambarkan karakteristik utamanya. Juga akan dilihat suara-suara elementer yang menjadi penyusun suara-suara kompleks. Terakhir akan dideskripsikan bagaimana suara berlaku ketika berinteraksi dengan rintangan pada jalurnya.

Azhar [1] juga menyebutkan bahwa pada prinsipnya suara terdiri dari beberapa komponen yaitu, pitch, formant dan spectogram yang dapat digunakan untuk mengidentifikasi karakteristik suara seseorang untuk kepentingan voice recognition. Penjelasan dari masing-masing komponen tersebut menurut Azhar [1] adalah sbb :

1.Pitch.

Frekuensi getar dari pita suara juga disebut dengan istilah frekuensi fundamental (dasar) dengan notasi F0. Masing-masing orang memiliki pitch yang khas (habitual pitch) yang sangat dipengaruhi oleh aspek fisiologis larynx manusia. Pada kondisi pembicaraan normal, level habitual pitch berkisar pada 50 s/d 250 Hz untuk laku-laki dan 120 s/d 500 Hz untuk perempuan. Frekuensi F0 ini berubah secara konstan dan memberikan informasi linguistik seseorang seperti pembeda antara intonasi dan emosi. Analisa pitch dapat digunakan untuk melakukan voice recognition terhadap suara seseorang yaitu melalui analisa statistik terhadap nilai minimum pitch, maximum pitch dan mean pitch.

2. Formant

Formant adalah frekuensi-frekuensi resonansi dari filter, yaitu vocal tract (articulator) yang meneruskan dan memfilter bunyi keluaran (output) berupa kata-kata yang memiliki makna. Secara umum, frekuensi-frekuensi formant bersifat tidak terbatas namun, untuk mengidentifikasi seseorang paling tidak ada 3 (tiga) format yang dianalisa yaitu, Formant 1 (F1), Formant 2 dan Formant 3 (F3).

3. Spectrogram.

Adalah representasi spectral (warna suara) yang bervariasi terhadap waktu yang menunjukkan tingkat density (intensitas energi) spektral. Dengan kata lain spectogram adalah bentuk visualisasi dari masing-masing nilai formant yang dilengkapi dengan level energi yang bervariasi terhadap waktu. Level energi yang dikenal dengan dengan istilah formant bandwidth. Pada kasus-kasus yang bersifat pemalsuan suara dengan teknik pitch shift atau si subyek (tersangka) berusaha untuk menghilangkan karakter suara aslinya, maka formant badwidht dapat digunakan untuk memetakan atau mengidentifikasi suara aslinya. Dikarenakan spectogram memuat hal-hal yang bersifat detil, maka spectogram oleh beberapa ahli dikenal dengan istilah sidik jari suara (voice fingerprint). Spectogram membentuk pola umum yang khas dalam pengucapan kata dan pola khusus masing-masing formant dalam pengucapan suku kata, sehingga spectogram juga digunakan untuk melakukan analisa identifikasi suara seseorang. Jika durasi rekaman unkown cukup panjang, maka analisa spectogram juga dapat digunakan untuk mempercepat pemilihan pengucapan kata-kata yang akan dianalisa dalam rangka untuk mendapatkan jumlah minimal 20 kata untuk menunjukkan kecocokkan suara suspect (tidak dikenal) dengan suara asli (dikenal) atau pembanding.

Rekaman suara dimungkinkan mengandung noise. Dalam pengertian umum, noise adalah suatu gangguan yang “didengar” orang lain, namun dalam istilah telekomunikasi kata noise juga dipakai untuk istilah gangguan yang menimbulkan kebisingan yang dapat didengar suatu sistem. Noise dapat terjadi dengan berbagai macam cara, misalnya rekaman suara barang bukti terdapat bocoran yang terjadi karena pada saat rekaman diperoleh tersangka berada pada lokasi dimana terdapat suara-suara yang saling bercampur. Pada prinsipnya, noise jenis ini tidak dapat dihilangkan tetapi dapat dikurangi keberadaan pada sumbernya (rekaman suara barang bukti).

Suara disebarkan di udara melalui tubrukan beruntun antara partikel. Sebagai contoh, kita menggunakan suatu loudspeaker sebagai sumber suara. Membran loudspeaker bergerak mundur dan maju mengikuti amplitudo dari sinyal elektrik yang diterimanya, sehingga membuat partikel udara bergerak melalui kompresi dan dilatasi

Gambar 1.1 Kompresi (C = compression) dan dilatasi (R = rarefaksi) partikel udara

Sekarang kita ikuti suara yang tersebar dari loudspeaker. Sebagai permulaan kita asumsikan bahwa kompresi terjadi ke arah kanan diikuti dilatasi ke arah kiri

Gambar 1.2 Pergerakan loudspeaker

Loudspeaker bergerak dan mendorong partikel udara di sisi kanan (fase A) menyebabkan kompresi. Partikel ini kemudian mendorong partikel di sebelahnya dan memindahkan energi yang diterima dari loudspeaker. Loudspeaker kemudian bergerak lagi dan menyebabkan kompresi di arah yang berlawanan, dengan kata lain terjadi dilatasi ke arah kiri (fase B) sehingga membentuk kesenjangan udara yang dipenuhi partikel udara yang paling dekat. Partikel ini kemudian membentuk kesenjangan di sisi kanan, dan seterusnya. Proses ini menyebabkan partikel memindahkan energi dengan osilasi tanpa bergerak secara fisik sesuai dengan arah suara

Sebagai contoh, sebuah tutup botol anggur mengambang di suatu kolam air dan batu dilemparkan ke dalamnya. Tutup botol akan naik dan turun sesuai dengan gelombang yang menyebar tetapi tidak akan bergerak sesuai dengan arah gelombang.

Bila loudspeaker digerakkan oleh sinyal sinusoid, tekanan atmosferik yang berada di dekatnya juga akan memiliki laju sinusoid.

Gambar 1.3 Laju sinusoidal dari tekanan atmosferik</p

Sifat Suara

Sebelumnya kita melihat bagaimana tekanan atmosferik yang berdekatan dengan loudspeaker dapat digambarkan sebagai suatu gelombang. Gelombang bisa memiliki bentuk yang sangat rumit, tetapi setiap gelombang dapat dianggap sebagai perpanjangan dari suatu gelombang yang sederhana: sinusoid, yang dapat diekspresikan dengan persamaan berikut:

Persamaan 1.1 Persamaan sinusoid

$y=A sin(x)$

Gambar berikut menunjukkan suatu sinusoid

Gambar 1.4 Gelombang sinusoid

Sinusoid memiliki serangkaian sifat:

Frekuensi (f)
Periode (T)
Panjang gelombang (λ)
Amplitudo (A)
Fase (φ)
Kecepatan (v)

1.4.1 Frekuensi

Frekuensi adalah jumlah siklus yang dibuat suatu gelombang dalam satu detik. Satu siklus terdiri dari satu semi-gelombang positif dan satu semi-gelombang negatif. Ukurannya adalah Hertz/Hz (1/sec). Suatu gelombang frekuensi 1 Hz menyelesaikan satu siklus setiap 1 detik. Gambar berikut memperlihatkan frekuensi sinusoid 5 Hz

Gambar 1.5 Frekuensi sinusoid 5 Hz

1.4.2 Periode

Periode adalah waktu yang dibutuhkan untuk menyelesaikan satu siklus penuh

Persamaan 1.2 Persamaan periode

$T=\frac{1}{f}$

Gambar berikut memperlihatkan panjang suatu periode sinusoid

Gambar 1.6 Periode sinusoid

1.4.3 Panjang Gelombang

Panjang gelombang adalah jarak antara dua titik yang berhubungan (contoh dua titik maksimum yang berurutan) sepanjang gelombang. Nilainya dapat dihitung menggunakan persamaan:

Persamaan 1.3 Persamaan panjang gelombang sinusoid

$\lambda=\frac{c}{f}$

dimana

c = kecepatan suara dalam medium referensi (kecepatan suara di udara 344 m/sec)

Sebagai contoh perhitungan, suatu gelombang berfrekuensi 1 Hz berjalan melalui udara. Menggunakan persamaan diatas kita menemukan:

Persamaan 1.4 Perhitungan kecepatan suara

$c=\lambda f\Longrightarrow\frac{344m/s}{s}=1=344m$

dengan kata lain, untuk setiap siklus, gelombang 1 Hz menyebar sepanjang 344 m, setara dengan ukuran dua kali stadium sepakbola (nantinya kita akan lihat, telinga manusia mulai mengindera suara pada frekuensi lebih besar dari 20-30 Hz, yang setara dengan panjang gelombang 15-18 meter)

Gambar berikutnya memperlihatkan panjang gelombang sinusoid

Gambar 1.7 Panjang gelombang sinusoid

1.4.4 Amplitudo

Amplitudo adalah unit yang mengukur jarak antara titik ekuilibrium dengan titik maksimum dari gelombang. Amplitudo yang lebih besar menunjukkan volume lebih tinggi. Ada dua jenis pengukuran amplitudo. Pertama adalah peak amplitude yang merupakan kuantitas absolut. Ini adalah pengukuran titik amplitudo tertinggi yang dicapai gelombang. Kedua adalah pengukuran amplitudo sesuai dengan pendengaran manusia dan disebut amplitudo efektif (RMS, Root Mean Square) dengan persamaan:

Persamaan 1.5 Persamaan amplitudo efektif

$A_e=\frac{A}{\surd2}$

Gambar berikut menunjukkan amplitudo dari sinusoid

Gambar 1.7 Amplitudo sinusoid

1.4.5 Fase

Unit ini selalu menunjukkan hubungan antara dua gelombang. Untuk memahami konsep ini perlu dijelaskan bagaimana gelombang sinusoid terbentuk. Gambar berikut digunakan:

Gambar 1.8 Grafik fase

Bayangkan titik A bergerak berlawanan arah jarum jam sepanjang keliling lingkaran mulai dari titik 0o. Jika α adalah sudut, bagian terproyeksi titik A pada sumbu X dan Y adalah:

$y=sin(a)$

$x=cos(a)$

Sehingga, apa yang kita lihat di grafik pertama adalah panjang proyeksi titik A pada sumbu Y, dengan sudut yang terus berubah. Sekarang bayangkan titik A bergerak searah jarum jam. Proyeksinya pada sumbu Y negatif pada awalnya dan berbentuk seperti grafik kedua. Dengan ini, frekuensi bisa diinterpretasikan sebagai jumlah kali titik A membuat satu siklus penuh dalam satu detik. Amplitudo maksimum selalu terletak pada sudut 90o tanpa dipengaruhi frekuensi. Fase juga bisa dikatakan tidak dipengaruhi frekuensi. Persamaan yang menghubungkan fase dan waktu adalah:

Persamaan 1.6 Persamaan hubungan antara fase dan waktu

$\phi=2\pi f\Delta t$

Contoh 1.1 Hubungan antara fase dan delay

Persamaan ini berguna untuk menghitung delay. Sebagai contoh, berapa delay yang dibutuhkan agar dua buah gelombang sinusoid 100 Hz tiba dengan perbedaan phase 90o

Persamaan 1.7 Perhitungan delay antara dua sinusoid

$90=2\pi 100\Delta t\Longrightarrow\Delta t=\frac{90}{360\ast100}=2.5ms$

1.4.6. Kecepatan

Sebelumnya kita menyebut bahwa kecepatan suara melalui udara adalah 344 m/sec. Semakin padat medium yang digunakan, semakin cepat suara menyebar. Kecepatan penyebaran suara bergantung kepada densitas dari medium. Setiap medium memiliki kecepatan suaranya masing-masing yang ditentukan pada temperatur konstan 23/24oC. Ini bertindak sebagai nilai referensi karena ketika temperatur berubah-ubah, maka karakteristik dan kecepatan suara dalam medium berubah-ubah. Ketika medium menjadi lebih hangat, energi kinetik ditransfer ke partikelnya. Ketika partikel berhubungan dengan gelombang, partikel medium bereaksi lebih cepat terhadap rangsangan sehingga menyebarkan energi suara yang diterima dengan lebih cepat. Dengan kata lain; kecepatan suara medium bertambah. Rata-rata terjadi perubahan 0.6 m/sec untuk setiap perubahan suhu medium satu derajat.

1.5 Kombinasi Sinusoid

Sinusoid adalah bentuk gelombang yang paling sederhana, tetapi juga paling tidak menarik dari segi aestetika suara.

Mari kita membuatnya lebih menarik dengan membuatnya lebih rumit. Telah disebutkan bahwa gelombang apapun dapat diuraikan menjadi kombinasi (jumlah) dari gelombang-gelombang sinusoid dengan amplitudo dan fase yang tepat. Penemuan luar biasa ini didapatkan oleh seorang ahli matematika dari Perancis, Jean Baptiste Fourier (1768-1830). Sebagai contoh, kita gunakan dua gelombang yang in-phase (berada dalam kesamaan fase). Jika kita kembali ke contoh suatu titik yang bergerak mengelilingi lingkaran berlawanan arah jarum jam, selanjutnya kita bayangkan dua gelombang yang bersumber dari dua titik pada saat yang sama dan berjalan dengan kecepatan yang sama.

Gambar 1.9 Jumlah dan perbedaan sinusoid

Dapat kita lihat jumlah dua sinusoid tersebut adalah sinusoid dengan ukuran dua kali dari penyusunnya. Bagaimana dengan karakter suaranya? Kita mendengar suara yang memiliki frekuensi yang sama dengan sinusoid penyusunnya tetapi dengan amplitudo dua kalinya, sehingga meningkatkan volume yang kita dengar. Berapa banyak volume ditingkatkan? Tidak tepat dua kalinya, justru sedikit lebih rendah.

Apa yang terjadi ketika kita menambahkan dua gelombang berfrekuensi sama tetapi berada out of phase (kesenjangan fase) (bayangkan dua titik yang sama, satu berjalan berlawanan jarum jam, satu searah jarum jam)? Hasilnya dapat dilihat pada gambar diatas.

Selanjutnya kita ambil dua gelombang yang memiliki kesenjangan fase 90o tetapi dengan frekuensi yang berbeda (satu dua kalinya yang lain).

Gambar kedua gelombang tersebut dapat dilihat sebagai berikut:

Gambar 1.10 Perbandingan dua sinusoid

Satu ciri khas dari suara adalah suara dapat dijumlahkan tanpa interferensi antara gelombang. Dengan menjumlahkan dua suara sebelumnya kita mendapatkan suara yang baru. Ketika kita mendengarkannya kita dapat mengidentifikasikan masing-masing komponennya.

Gambar 1.11 Penjumlahan dua sinusoid

Representasi Waktu-Frekuensi

Mungkin ini adalah konsep paling penting untuk memahami sifat alamiah suara. Pendekatan matematis subjek ini bisa sangat rumit, sehingga dalam kasus kita cukuplah untuk menekankan konsep-konsep utamanya dan tidak menyebutkan detail yang biasa tersedia dalam konteks sains.

Grafik yang telah kita amati sejauh ini menggambarkan hubungan amplitudo terhadap waktu, dan mendeskripsikan laju amplitudo terhadap perubahan waktu. Sekarang kita akan menggunakan pendekatan yang berbeda dan melihat bagaimana mendapatkan hubungan amplitudo terhadap frekuensi.

Dalam kasus sinusoid murni dengan persamaan kita dapat mengatakan bahwa frekuensi f dan amplitudo A adalah konstan. Dalam gambar berikut kita melihat pada sisi kiri representasi umum dari sinusoid secara amplitudo-waktu. Gambar pada sisi kanan atas menunjukkan sinusoid yang sama secara amplitudo dan frekuensi, sementara dua sinusoid dari contoh sebelumnya digambarkan di sisi kanan bawah:

Gambar 1.12 Representasi waktu-frekuensi

Sehingga sinusoid dapat dilihat, dalam diagram amplitudo-frekuensi, sebagai segmen yang panjangnya berkorelasi dengan amplitudonya dan terletak pada frekuensinya (kalimat ini adalah penyederhanaan dari keadaan sesungguhnya).

Sekarang kita gabung semua hal ini. Bayangkan suatu suara yang kompleks, yang terdiri dari semua sinusoid dari 20 Hz hingga 20 kHz (ini adalah kurang lebih rentang frekuensi yang bisa diindera telinga manusia). Suara tersebut diperlihatkan gambar berikut:

Gambar 1.13 Laju sinyal suara yang kompleks

Spektrum frekuensinya bervariasi menurut waktu dan bila kita mengambil “foto” dari spektrum pada suatu instan kita mendapatkan grafik berikut yang menghubungkan amplitudo dan frekuensi pada saat kita mengambil foto:

Gambar 1.14 Spektrum frekuensi sinyal suara yang kompleks

Suatu suara tidak pernah diam tetapi terus berubah menurut waktu. Ini berarti bahwa setiap amplitudo sinusoid berubah sehingga bentuk grafik yang mewakili spektrum juga berubah. Ini menjelaskan apa yang kita lihat ketika kita memperhatikan analisa spektrum dengan LED-nya yang menyala-nyala. LED itu sebenarnya menunjukkan amplitudo dari sinusoid-sinusoid dalam spektrum. Hal ini menjelaskan tingkah laku graphic equalizer: amplifikasi atau atenuasi amplitudo sinusoid. Interval 20 Hz – 20 kHz adalah kontinyu, sehingga dalam equalizer setiap kursor mengendalikan amplitudo dari satu frequency band. Semakin banyak kursor yang ada, semakin sempit bandwith yang dikendalikan. Dalam kasus ideal teoris kursor tak terhingga, masing-masing akan mengendalikan amplitudo dari satu sinusoid.

Kandungan Harmonik Gelombang

Apa yang telah kita bahas sejauh ini mengenai sinusoid adalah landasan untuk selanjutnya membentuk dunia suara kita. Sinusoid murni tidak ada dalam kehidupan nyata. Suara nyata diperkaya oleh harmonik.

Sebagai contoh, kita amati apa yang terjadi ketika senar ke-5 dari suatu gitar dipetik oleh gitaris. Tentu akan dihasilkan nada A. Tapi apa yang sebenarnya terjadi?

Senar mulai berosilasi pada frekuensi 440 Hz. Jadi kenapa tidak terdengar suara sinusoid sederhana melainkan suatu suara yang rumit? Banyak sebab yang menjadi jawaban untuk pertanyaan ini. Yang dapat dipastikan adalah kandungan harmonik dari not yang dimainkan tidak sama dengan sinusoid sederhana. Saat suatu not dimainkan pada instrumen, frekuensi yang berkorespondensi dengan not tersebut dihasilkan dan disebut fundamental harmonics (harmonik fundamental). Bersama dengan harmonik fundamental ini harmonik lainnya juga dihasilkan, dimana semuanya merupakan perkalian integer dari frekuensi not dengan amplitudo yang semakin menurun. Bersama dengan not A, sinusoid berikut juga terbentuk:

440 Hz harmonik fundamental (harmonik pertama)
880 Hz harmonik kedua
1320 Hz harmonik ketiga
… … …
n*440 Hz harmonik ke-n

Tingkah laku ini bergantuk kepada kenyataan bahwa senar yang dipetik oleh gitaris tidak hanya berosilasi pada frekuensi fundamental tetapi juga pada frekuensi harmonik, seperti yang ditunjukkan gambar berikut:

Gambar 1.15 Osilasi harmonik dari senar yang bergetar

Seperti telah kita katakan, harmonik pertama disebut fundamental, dan memberikan karakter pada not yang kita indera. Hal ini karena harmonik pertama memiliki amplitudo paling besar. Harmonik kedua memiliki frekuensi dua kali lipat dari fundamental, yang berarti senar bergetar seperti pada gambar, tumpang tindih dengan harmonik fundamental.

Mungkin Anda sudah memahami bahwa bila kita menambahkan satu oktaf pada suatu not maka didapatkan not yang sama, dalam kasus ini adalah not A, dengan bunyi lebih tinggi (coba memainkannya pada piano). Sehingga harmonik kedua adalah not yang sama dengan fundamental dan menambahkan warmth pada suara. Harmonik ketiga sudah bukan A sehingga memperkaya suara dengan cara yang berbeda.

Pada gambar bisa kita lihat bagaimana harmonik berurutan dihasilkan dan bagaimana amplitudo masing-masing harmonik tersebut berkurang seiring dengan meningkatnya frekuensi. Dengan kata lain, ketika senar gitar dipetik, harmonik yang membentuk suara secara signifikan berjumlah sekitar 10. Lebih dari titik ini, amplitudo dari harmonik lainnya menjadi tidak signifikan ketika dibandingkan dengan amplitudo dari fundamentalnya. Kita juga bisa melihat pada tengah senar terdapat lebih banyak frekuensi rendah, sementara pada sisi senar frekuensi tinggi lebih dominan. Ini penting diketahui ketika memposisikan mikrofon; untuk mendapatkan suara dengan frekuensi yang tinggi dari snare drum maka mikrofon diarahkan lebih dekat ke pinggir, sementara untuk mendapatkan suara dengan frekuensi yang lebih rendah mikrofon diposisikan ke tengah.

Amplifier gitar dapat dibuat dengan menggunakan valve atau transistor dan kedua bentuk tersebut memiliki kekuatannya masing-masing. Transistor cenderung menekankan harmonik ketiga sedangkan valve cenderung menekankan harmonik kedua.

Bentuk Gelombang

1.8.1 Sinusoid murni

Sinusoid murni telah dijelaskan sebelumnya. Gelombang sinusoid diindera sebagai nada frekuensi yang sama dengan frekuensi sinusoid. Gelombang ini mudah untuk dihasilkan secara elektronik dan sering digunakan sebagai instrumen pengukuran.

1.8.2 Sawtooth wave

Sawtooth wave (gelombang gerigi) mengandung semua harmonik, dimana amplitudo dari setiap harmonik adalah setengah dari harmonik sebelumnya.

Gambar 1.16 Sawtooth wave

f = 1f, 2f, 3f, 4f, …, nf

A = 1, 1/2, 1/3, 1/4, …, 1/n

1.8.3 Square wave

Square wave atau gelombang kotak memiliki laju gelombang dan kandungan harmonik seperti yang digambarkan berikut:

Gambar 1.17 Square wave

Kita dapat melihat kandungan harmonik dari square wave murni terdiri dari harmonik genap. Amplitudonya menurun pada laju 1/f. Secara empiris, hal ini berarti harmonik kedua (harmonik yang memiliki tiga kali lipat frekuensi harmonik fundamental, karena harmonik yang memiliki dua kali lipat frekuensi tidak ada) memiliki amplitudo 1/3 dari harmonik fundamental, harmonik ketiga memiliki 1/5, dst.

f = 1f, 3f, 5f, dst

A = 1, 1/3, 1/5, dst

1.8.4 Triangular wave

Triangular wave memiliki kandungan harmonik yang mirip dengan square wave. Perbedaannya adalah penurunan amplitudo terjadi dengan laju 1/f2.

Gambar 1.18 Triangular wave

f = 1f, 3f, 5f, dst

A = 1, 1/9, 1/25, dst

1.8.5 Hypertone

Perbedaan utama antara harmonik dan hypertone adalah hypertone tidak berhubungan secara eksplisit dengan frekuensi fundamental sementara harmonik adalah perkalian integernya. Hypertone bergantung kepada instrumen musik yang menghasilkannya dan menambahkan karakter suara meskipun amplitudonya lebih lemah daripada amplitudo harmonik.

Envelope

Sound envelope atau sarung suara adalah laju amplitudo suatu suara dari saat dihasilkan hingga memudar. Untuk mengenalkan konsep ini kita menggunakan contoh instrumen senar, sekali lagi sebuah gitar.

Saat gitaris memainkan suatu not, kita mengindera hentakan pertama dari not tersebut hingga not tersebut memudar. Laju amplitudo dari not disebut dengan ADSR envelope (akronim dari kata-kata Attack, Decay, Sustain, dan Release), dan memiliki tingkah laku yang bisa diaplikasikan ke suara dan instrumen manapun.

Deskripsi keempat tahap tersebut lebih jelas:

Attack: amplitudo dengan cepat mencapai nilai tertingginya
Decay: setelah attack, sebagian energi hilang dan amplitudo berkurang
Sustain: amplitudo bertahan pada tingkat yang hampir konstan untuk selang waktu tertentu
Release: amplitudo berkurang secara kontinyu hingga habis

Berikut adalah contoh dari ADSR envelope. Gelombang dari suatu suara dibatasi oleh suatu kurva yang menyelimuti laju amplitudo dan disebut dengan envelope dalam istilah matematika. Gelombang berbentuk simetris, sehingga kita hanya perlu mengambil bagian positif dari grafik.

Gambar 1.19 ADSR envelope

Dalam gambar juga telah dijelaskan bahwa bagian awal dari suara memiliki lebih banyak frekuensi tinggi, yang memudar dengan lebih cepat. Secara umum pada tahap sustain amplitudo dari frekuensi tinggi telah berkurang sedangkan frekuensi rendah masih hadir.

Berikutnya adalah gambar ADSR envelope dari suara gitar:

Gambar 1.20 ADSR envelope dari suara gitar

Seperti yang telah disebutkan, pola ini bisa diaplikasikan ke sebagian besar instrumen musik dan suara pada umumnya. Yang bervariasi adalah seberapa lama setiap tahap berlangsung. Sebagai perbandingan suatu snare drum memiliki tahap attack dan decay yang sangat singkat, sedangkan suatu biola memiliki tahap attack dan decay yang jauh lebih panjang.

Pada umumnya tahap attack-decay adalah tahap yang paling mempengaruhi karakter dari suara. Hal ini juga yang digunakan teknik sintesis suara modern dimana tahap attack-decay merupakan sample asli dari instrumen yang dimainkan dan tahap sustain-release diproduksi secara sintesis. Tujuannya ada dua: pertama untuk membuat instrumen sintetik terdengar sedekat mungkin dengan aslinya, kedua untuk mendapatkan derajat kendali yang lebih besar pada instrumen tersebut. Sebagai contoh simulasi efek vibrato mudah didapatkan dengan suara sintetik sementara susah diproduksi bila menggunakan sample suara asli.

Tingkah Laku Suara

Di bagian ini kita melihat bagaimana suara berlaku ketika berinteraksi dengan rintangan pada jalurnya. Pada umumnya kelakukan interaksi ini bergantung kepada bahan dan dimensi dari rintangan serta kandungan frekuensi dari suara.

Tingkah laku yang akan kita lihat berlaku untuk gelombang pada umumnya tetapi kita akan berkonsentrasi pada gelombang suara saja. Tingkah laku antara lain:

Refleksi atau pantulan
Difraksi atau penyebaran
Refraksi atau pembiasan
Absorpsi atau penyerapan

1.10.1 Refleksi

Sebagai referensi, mari kita lihat gambar yang menunjukkan gelombang suara mengenai suatu permukaan dan memantul darinya. Penting untuk menyadari bahwa gelombang yang dihasilkan kompresi dan dilatasi tegak lurus terhadap arah perambatan gelombang.

Gambar 1.21 Refleksi

Suatu gelombang yang mengenai permukaan rata dengan sudut α (antara garis normal dengan permukaan dan arah suara) dipantulkan dengan sudut pantulan α derajat. Dalam gambar kita melihat contoh dari permukaan rata kemudian permukaan konkaf atau kelung dimana semua pantulan mengumpul pada titik fokus dari permukaan berlekuk.

Permukaan konkaf dihindari dalam akustik karena cenderung memfokuskan suara pada titik tertentu sehingga menyebabkan distribusi suara yang buruk tetapi dapat digunakan untuk pembuatan mikrofon direksional karena menyebabkan sinyal (termasuk sinyal lemah) bisa ditangkap

Sebaliknya, permukaan konveks atau cembung menyebarkan suara dan digunakan untuk meningkatkan akustik dari lingkungan.

Ketika gelombang memantul dari permukaan konveks, perpanjangan nirnyata dari pantulan gelombang melewati titik fokus permukaan.

1.10.2 Refleksi dalam ruangan

Gambar 1.22 Pantulan dalam ruangan

Ketika suatu suara terdifusi atau tersebar dalam ruangan, suara tersebut mencapai pendengar dengan berbagai cara. Sinyal pertama yang tiba di telinga pendengar adalah yang paling kuat dan paling langsung, dengan kata lain sinyal yang melewati jalur tersingkat antara sumber suara dengan pendengar. Setelah sinyal langsung, tiba sinyal yang terpantul hanya sekali sehingga memiliki amplitudo lebih kecil dibandingkan dengan sinyal langsung. Ini dikarenakan energi yang hilang ketika refleksi terjadi. Sinyal ini disebut dengan early reflections atau pantulan awal (dikenal juga dengan precocious sound). Setelah delay lebih lanjut datang sinyal yang telah mengalami lebih dari satu pantulan dengan amplitudo yang lebih inferior dibandingkan pantulan awal. Sinyal-sinyal ini disebut reverb cluster karena dianggap bukan sebagai pantulan-pantulan yang terpisah tetapi sebagai suatu kumpulan. Gambar diatas memperlihatkan distribusi sinyal ini dalam waktu dan amplitudonya.

1.10.3 Refraksi

Istilah ini merujuk kepada fenomena dimana gelombang yang melintasi dua medium dengan densitas yang berbeda berubah arah saat melintas. Tingkah laku ini bisa dijelaskan dengan mudah ketika mengingat kecepatan suara pada medium dengan densitas yang berbeda.

Kita sekarang tahu suara merambat lebih cepat dalam medium lebih padat. Sebagai contoh suatu gelombang mengenai dinding yang terlihat dalam gambar:

Gambar 1.23 Refraksi

Dinding memiliki kepadatan lebih tinggi daripada udara sehingga gelombang yang mulai mempenetrasi dinding bergerak lebih cepat daripada yang diluar dinding. Ketika gelombang memasuki dinding, gelombang yang sama memiliki bagian yang lebih cepat (bagian yang sudah ada dalam dinding) dan bagian yang lebih lambat (yang masih berada di luar dinding). Ketika semua gelombang telah memasuki dinding sepenuhnya, arah perambatannya mengalami perubahan sudut. Keluar dari dinding, fenomena yang sama terjadi tetapi secara terbalik, dan gelombang kembali ke arah originalnya.

Sekarang kita melihat bagaimana fenomena ini menjadi relevan dalam konser udara terbuka dimana kondisi berubah sepanjang hari, sehingga memodifikasi difusi suara di udara lingkungan.

Gambar 1.24 Refraksi udara terbuka

Di pagi hari lapisan atas (udara dingin) memiliki densitas lebih besar dibandingkan lapisan bawah (udara hangat) sehingga suara cenderung bergerak ke atas seperti ditunjukkan gambar (gambar pertama)

Di sore hari situasi sebaliknya terjadi dan lapisan lebih padat (udara dingin) menjadi inferior. Hal ini menyebabkan udara bergerak ke bawah sebagaimana ditunjukkan gambar (gambar kedua). Hal ini harus dipertimbangkan dengan hati-hati ketika mengorganisir suatu konser udara terbuka karena proses pemasangan yang lama terjadi berjam-jam sebelum konser dimulai sehingga kondisi atmosferik telah berubah ketika dimulai.

1.10.4 Difraksi

Cara terbaik dan paling langsung untuk menjelaskan fenomena ini adalah bahwa fenomena ini terjadi ketika suara mengelak suatu rintangan. Hal ini sangat bergantung kepada kandungan frekuensi mengingat suara dengan panjang gelombang yang besar (frekuensi rendah) mudah menembus rintangan yang lebih kecil daripada panjang gelombang suara. Ini adalah salah satu alasan mengapa frekuensi pertama yang teratenuasi adalah frekuensi tinggi sementara frekuensi rendah terdifusi pada jarak lebih panjang.

1.10.5 Absorpsi

Absorpsi dapat dideskripsikan sebagai konversi energi akustik menjadi energi termal oleh permukaan. Dengan kata lain, ketika suara melintasi rintangan, terjadi transfer energi yang kemudian dilepas sebagai panas.

Pada umumnya keempat fenomena ini terjadi semuanya ketika suara bertemu dengan rintangan. Gambar berikut mengilustrasikan situasi yang umum:

Gambar 1.25 Refleksi, difusi, refraksi, dan absorpsi bersamaan

Sumber :

[1] M. N. Al-Azhar, Audio Forensic: Theory And Analysis. Pusat Laboratorium Forensik Polri Bidang Fisika Dan Komputer Forensik, 2011.

Cyber Library

Translaslator

Cari Blog Ini

Teori Suara : Forensika Audio