Selasa, 24 Oktober 2017

Kompresi Audio

M. Fadil Fidrian
57414184
4IA10


Kompresi audio adalah salah satu bentuk kompresi data yang bertujuan untuk mengecilkan ukuran file audio dengan teknik, yaitu:

1. Kompresi Audio Lossless: Kompresi lossless audio menghasilkan representasi data digital yang dapat diperluas ke tepat digital duplikat dari stream audio asli dan menghasilkan 50-60% dari ukuran asli.

  • Kesulitan: Sulit untuk menjaga semua data dalam aliran audio dan mencapai kompresi substansial. Nilai-nilai dari audio sample berubah sangat cepat.
  • Kriteria Evaluasi: Lossless audio codec tidak mempunyai masalah kualitas suara,
  • Penggunaannya dapat difokuskan pada:  Kecepatan kompresi dan dekompresi ,Tingkat kompresi Ketahanan dan koreksi kesalahan, Dukungan produk  Loseless → format : FLAC
  • Pengguna : audio engineer, audiophiles

2. Kompresi Audio Lossy: Inovasi dari kompresi audio lossy adalah menggunakan psychoacoustics untuk mengakui bahwa tidak semua data dalam aliran audio dapat dirasakan oleh sistem pendengaran manusia. Kompresi lossy biasanya mencapai kompresi yang jauh lebih besar daripada kompresi lossless (data dari 5 persen menjadi 20 persen dari aliran asli).

  • Kekurangan: Data akan dihapus selama kompresi lossy dan tidak dapat dipulihkan oleh dekompresi Kompresi lossy dapat mengakibatkan pengurangan persepsi kualitas audio yang berkisar dari tidak ada sampai parah Ciri-ciri Dari Metode Kompresi Lossy Pada Audio Adaptive Differetial Pulse Code Modulation, contohnya CCITT G.721,16 tau 32 Kbit/sec – Melakukan encode dua atau lebih sinyal yang berbeda, perbedaan kuantisasi pada encode tersebut adalah kehilangan sinyal data suara. – Mengadaptasi terhadap kuantisasi terhadap beberapa bit dapat digunakan asalkan isi data sinyal suara sedikit. Linier Predective Coding (LPC) difungsikan untuk menyesuaikan sinyal data yang ada dengan sinyal suara manusia, kemudian mengirimkan parameter model suara tersebut ketempat tujuan, seperti sebuah computer yang dapat berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps. o Code Excited Linear Predicator (CELP) bekerja mirip seperti LPC, tetapi ada tambahan CELP dapat memancarkan data suara yang salah, sedangkan PLC tidak, contohnya mutu percakapan audio pada kecepatan 4,8 kbps.
  • Kriteria Evaluasi: Algoritma kompresi Lossy memiliki kekurangan dari segi suara, karena ada penghapusan data yang tidak masuk dalam ambang batas pendengaran manusia, sehingga lebih ditujukan pada : Persepsi kualitas audio,Kompresi faktor ,Kecepatan kompresi dan dekompresi Latency algoritma (kritis untuk aplikasi streaming real-time)  Lossy →format : Vorbis, MP3

Metode Kompresi Audio
- Metode Transformasi
Menggunakan algoritma seperti MDCT (Modified Discreate Cosine Transform) untuk mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat didengar oleh manusia (20 Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz dan 96 dB.
- Metode Waktu
Menggunakan LPC (Linier Predictive Coding) yaitu digunakan untuk speech (pidato), dimana LPC akan menyesuaikan sinyal data pada suara manusia, kemudian mengirimkannya ke pendengar.  Jadi seperti layaknya komputer yang berbicara dengan  bahasa manusia dengan kecepatan 2,4 kbps.

Teknik kompresi audio dengan format MPEG (Moving Picture Expert Group)
MPEG-1 menggunakan bandwidth 1,5 Mbits/sec untuk audio dan video, dimana 1,2 Mbits/sec digunakan untuk video sedangkan 0,3 Mbits/sec digunakan untuk audio. Nilai 0,3 Mbits/sec ini lebih kecil dibandingkan dengan bandwidth yang dibutuhkan oleh CD Audio yang tidak terkompres sebesar 44100 samples/sec x 16 bits/sample * 2 channel > 1,4 Mbits/sec yang hanya terdiri dari suara saja. Untuk ratio kompresi 6:1 untuk 16 bit stereo dengan frekuensi 48kHz dan bitrate 256 kbps CBR akan menghasilkan ukuran file terkompresi kira-kira 12.763 KB, sedangkan ukuran file tidak terkompresinya adalah 75.576 KB. MPEG-1 audio mendukung frekuensi dari 8kHz, 11kHz, 12kHz, 16kHz, 22kHz, 24 kHz, 32 kHz, 44kHz, dan 48 kHz.  Juga mampu bekerja pada mode mono (single audio channel), dual audio channel, stereo, dan joint-stereo.

Algoritma MPEG Audio

  • Menggunakan filter untuk membagi sinyal audio: misalnya pada 48 KHz, suara dibagi menjadi 32 subband 
  • Memberikan pembatas pada masing-masing frekuensi yang telah dibagi-bagi, jika tidak akan terjadi intermodulasi (tabrakan frekuensi)
  • Jika sinyal suara terlalu rendah, maka tidak dilakukan encode pada sinyal suara tersebut
  • Diberikan bit paritas yang digunakan untuk mengecek apakah data tersebut rusak atau tidak. Apabila rusak, maka bit tersebut akan digantikan bit yang jenisnya sama dengan bit terdekatnya

Kompresi Audio MP3
Asal-usul MP3 dimulai dari penelitian IIS-FHG (Institut Integriette Schaltungen-Fraunhofer Gesellschaft), sebuah lembaga penelitian terapan di Munich, Jerman dalam penelitian coding audio perceptual.  Penelitian tersebut menghasilkan suatu algoritma yang menjadi standard sebagai ISO-MPEG Audio Layer-3 (MP3).

Format Header MP3 
File MP3 terdiri dari dua bagian data yaitu:

  • Header : berfungsi sebagai tanda pengenal bagi file MP3 agar dapat dibaca oleh MP3 player yang berukuran 4 byte Beberapa karakteristik yang dibaca komputer adalah bit ID, bit layer, bit sampling frequency dan bit mode.
  • Data audio : berisi data file mp3.

Teknik kompresi MP3 
Beberapa karakteristik dari MP3 memanfaatkan kelemahan pendengaran manusia, diantaranya:

  • Model psikoakustik: Adalah model yang menggambarkan karakteristik pendengaran manusia. Salah satu karakteristik pendengaran manusia adalah memiliki batas frekuensi 20 Hz s/d 20 KHz, dimana suara yang memiliki frekuensi yang berada dibawah ambang batas ini tidak dapat didengar manusia, sehingga tidak perlu dikodekan. 

·   Auditory masking: Manusia tidak mampu mendengarkan suara pada frekuensi tertentu dengan amplitudo yang jauh lebih tinggi.

·     Critical band: Merupakan daerah frekuensi tertentu dimana pendengaran manusia lebih peka pada frekuensi-frekuensi rendah. Sehingga alokasi bit dan alokasi sub-band pada filter critical band lebih banyak dibandingkan frekuensi lebih tinggi.

·   Joint stereo: Terkadang dual channel stereo mengirimkan informasi yang sama. Dengan joint stereo, informasi yang sama ini cukup ditempatkan dalam salah satu channel saja dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil.

Beberapa persyaratan dari suatu encoder/decoder MP3:

  • Ukuran file terkompresi harus sekecil mungkin
  • Kualitas suara file yang telah terkompresi haruslah sedekat mungkin dengan file asli yang belum dikompresi
  • Tingkat kesulitan rendah, sehingga dapat direalisasikan dengan aplikasi yang mudah dibuat dan perangkat keras yang "sederhana" dengan konsumsi daya yang rendah

Sumber:
http://pengetahuan.blog.widyatama.ac.id/2017/01/10/kompresi-audio-dan-video/
lecturer.ukdw.ac.id/anton/download/multimedia8.pdf