Penjelasan Mengenai Hi-Res Audio

1) Apa sih Hi-Res Audio itu ?

Dari wiki :
“High-resolution audio, also known as High-definition audio or HD audio, is a marketing term used by some recorded-music retailers and high-fidelity sound reproduction equipment vendors It refers to higher than 44.1 kHz sample rate and/or higher that 16-bit linear bit depth.


Sony Corporation, the maker of the legendary Walkman® was granted registration of the trademark logo “Hi-Res AUDIO” and made their intellectual property available to the rest of the high-resolution community, as they come together to nurture this new market segment. Consumer audio products that came with the “Hi-Res AUDIO” logo indicate that the product meet the specification required for an high resolution audio product, as defined by Japan Electronics and Information Technology Industries Association (JEITA).”
So basically, “Hi-Res Audio” itu term marketing dari consortium perusahaan elektronik/audio Jepang
Walaupun ga ada definisi yang precise dari consortium tersebut. secara umum mereka mengartikan bahwa Hi-Res Audio itu adalah produk audio dengan sample rate diatas 44.1Khz (standard CD audio) dan/atau bit depth diatas 16 bit
Jadi kalo ada file music dengan sample rate diatas 44.1Khz. itu udah “Hi-Res Audio”, begitu juga kalo misalnya ada file music dengan sample rate “hanya” 44.1Khz tapi bit depthnya diatas 16 bit, disebut Hi-Res Audio juga.
Produk (hardware) yang bisa memutar files dengan sample rate diatas 44.1Khz dan/atau bit depth diatas 16 bit tersebut (dan gw asumsikan membayar fee ke consortium tersebut) akan dapat menggunakan logo “Hi-Res Audio” berwarna hitam kuning seperti yang kita kenal itu.


2) Apa sih sample rate 44.1Khz ? And why should I care ?

Simpelnya gini : Kuping kita standarnya bisa mendengar frekuensi suara dari 20Hz ke 20Khz. For the sake of arguments, kadang2 frekuensi atasnya dinaikin ke 22Khz.
Dibawah 20Hz ga kedenger, diatas 20kHz (atau 22Khz) ga kedengeran juga - dan saat kita semakin tua, kita pasti akan kehilangan kemampuan mendengar suara di frekuensi tinggi, (More on this later.)

Menurut Nyquist Theorem untuk merekam seluruh frekuensi suara yang bisa kita dengar itu , kurang lebih butuh 2x lipat / double rate

Makanya dengan asumsi kuping bisa denger sampai 22kHz, yang dibutuhkan adalah ke 44.1kHz (angka ini dipilih karena lebih gede dari 44kHz - yg dibutuhkan untuk rekam frekuensi 22kHz - dan karena kompatibel dengan sistem PAL yang di pake di Eropa & NTSC yang dipake di Amrik)
Remember : untuk ngerekam SELURUH range frekuensi suara yang bisa kita denger, butuhnya hanya 44.1kHz
Kalo gitu 44.1kHz (standar rekaman CD) ato maksimal ke 48kHz (standar rekaman DVD) udah cukup dong ? Kalo diatas itu toh ga kedengeran juga ama kuping ??
Err... yes & no.
Untuk playback, yes, 44.1kHz (standar CD Audio) atau 48kHz (standar DVD) udah cukup.
Problemnya, banyak lagu/album yang sudah diremaster dan dirilis secara digital dengan format yang "lebih tinggi" (ie 24/96 - 24/192 - dll). In this case, maybe ga ada pilihan lain selain "terpaksa" mendownload format yang "lebih tinggi" tersebut untuk menikmati hasil yang lebih enak di kuping.
LINK PENTING BELOW !! :
Ini Link untuk ngetest sound frequency yang bisa didenger oleh kuping lu sendiri :
http://www.audiocheck.net/audiotests_frequencycheckhigh.php <-- ini ngetest sound dari 22Khz turun ke 8Khz

3) Apa itu Bit Depth ? And why should I care ??

Sebenernya apa sih 16bit / 24bit etc dll dst nya di audio file itu ?
16 bit dll itu = bit depth = seberapa banyak informasi yang ada dalam tiap sample (point in time dalam recording/playback *kalo ga salah terjemahin * (baca https://en.wikipedia.org/wiki/Audio_bit_depth & https://en.wikipedia.org/wiki/Sampling_(signal_processing) )
Dalam dunia audio kita, yang kepake ato yg jadi efek dari bit depth ini adalah terutama “Dynamic Range “ (baca : https://en.wikipedia.org/wiki/Dynamic_range atau nonton https://www.youtube.com/watch?v=_hRE2RKUV2E
Simpelnya, Dynamic Range adalah jarak (dalam decibel) antara suara paling kecil dalam suatu lagu/audio file ke suara paling nyaring di lagu/audio file tersebut.
suara berbisik ------------------- (DYNAMIC RANGE ) -------------------- suara teriak
kira2 begitulah ilustrasinya diatas.
Secara matematis, dynamic range dari file dengan bit depth 16 bit mentok di 96db, tapi dengan proses dithering (https://en.wikipedia.org/wiki/Dither) dynamic range file 16bit bisa mencapai 120db
Pertanyaannya, apa sih artinya Dynamic Range 120db itu ??
GOOD QUESTION !!
Here’s the answer : “ 120dB is greater than the difference between a mosquito somewhere in the same room and a jackhammer a foot away.... or the difference between a deserted 'soundproof' room and a sound loud enough to cause hearing damage in seconds.” --
Jadi suatu file audio dengan dynamic range 120db, suara terkecilnya kira2 seperti bunyi nyamuk yang ada didalam satu ruangan dengan kita DAN suara ternyaringnya adalah kira2 sebanding dengan suara orang pake jackhammer pas disamping kita
 Bayanginnya gini aja supaya gampang, suara terkecilnya adalah suara nyamuk yang ada didalam ruangan yang sama dengan kita

Dan suara ternyaringnya ada suara jackhammer pas disamping kita
Abis nonton ulang videonya Lachlan dan dapat penjelasan lebih simple lagi . Gini, dalam kegiatan sehari2 kita kan pasti ada noise. Bahkan kalau lagi dikamar mau tidur pun ada suara ac/white noise , lagi di depan komputer juga ada bunyi kipasnya etc. 

Ilustrasi dynamic range 96db (angka mentoknya file 16bit) itu kurang lebih seperti ini ,  bayangkan kita lagi dalam perpustakaan sunyi dan gk boleh berisik, tapi pasti tetep ada background noise (bunyi benda) kita anggap aja noise floor (suara noise terkecil itu) di 30db. Nah , dynamic range 96db artinya suara ternyaringnya di perpus itu 96db lebih kencang dari suara terkecil atau ekuivalen dengan suara mesin pesawat jet pas disamping kita.

Kalau Rekaman 24bit ?


Dynamic rangenya 144 db. Artinya kalau suara terkecil di 30db, berarti suara terkencangnya 144 db lebih gede, atau ekuivalen dengan suara launching roket space shuttle
Sekedar ilustrasi, suatu lagu klasik yang recordingnya bagus, akan punya dynamic range sekitar 60+ db (artinya dalam lagu tersebut, suara ternyaring - katakanlah suara gong ato organ ato apalah - lebih loud 60 db dibanding suara terkecil - katakanlah suara flute/violin solo )
Jadi dengan penjelasan ttg dynamic range diatas, harusnya udah obvious banget 16 bit recording itu sudah lebih dari cukup untuk kita dengar.
Rasanya ga ada ada lagu yg dynamic rangenya diatas 120db deh, gendang telinga meledak kalo beda suara terkecil & ternyaringnya diatas itu XD




TL;DR Dynamic Range :

Anggeplah audio yang kita dengerin itu kayak maen futsal 3 vs 3.
Ibaratnya, dynamic range 16 bit bit depth itu sama kayak lapangan futsal biasa, udah lebih dari cukup untuk maen 3 vs 3.
Diatas 16 bit - katakanlah 24 bit - kita maen futsal 3 vs 3 di lapangan futsal biasa, tapi lapangan futsalnya ditaroh ditengah2 lapangan bola/football. Iya bener, space yang tersedia lebih gede, tapi kan mubazir ga kepake ?





LINK PENTING BELOW !! :
Link untuk test sendiri dynamic range (dalam decibel)
Puter filenya pake headphone/iem/earbud yang biasa dipake dengan volume normal yg biasa dipake aja.
Jadi akan 2 suara yang diputer, suara pertama adalah hiss / pink noise untuk referensi volume suara normal
Setelah itu akan ada suara narator yang ngomong “My voice is now playing at full scale level”
Setelah itu hiss lagi (dengan volume normal / reference point)
Setelah itu suara narator dengan volume -6db (minus 6db) dari volume reference point
Trus turun ke -12db (minus 12db) dari volume reference point
Trus turun -18db (minus 18db) dari volume reference point
Dst dst
Things to note:
Rekaman 16bit standar aja dynamic rangenya 96db, kalo pake dithering bisa sampai 120db
File yg diputer di test itu adalah 16 bit = 96db Dynamic Rangenya.
Jadi bayangin sendiri aja kalo ada lagu full DR 96db gimana rasanya tuh lagu, dari suara paling quitest sampai suara loudestnya
==============================================================

CONCLUSION :

a) “Hi-Res Audio” itu term marketing, dipakai oleh produsen produk untuk push (or pull ?) produk2nya di market.
b) Sampling rate diatas 48Khz = mubazir – ga akan kedengeran juga oleh kuping kita
c) 16 bit Bit Depth udah lebih dari cukup dynamic rangenya untuk menikmati lagu, I don’t think there’s any song yang dynamic rangenya diatas 120db
Bit Depth & Sample Rate diatas 16bit / 44.1kHz itu kepake saat recording/mastering, supaya sound engineers dll yg gawe disitu punya “headroom, noise floor & convenience” saat kerja.
Setelah proses mastering & recording selesai, toh akan diconvert balik jadi 16/44.1kHz saat “burn” ke CD
d) Disini gw ga bilang mp3 320kbps itu = hires ya. Mo diterawang dari bumi bulat ato bumi datar pun udah ketauan mp3 itu lossy - ya pasti beda dengan format lossless. Bedanya seberapa besar ? Tergantung kuping (& maybe gears ?). It’s subtle, untuk casual listening (sambil ngerjain yang laen gitu) harusnya sih ga berasa. Kalo lagi konsen dengerin ya harusnya berasa (tipis2 ).
Yang gw catet di doc ini adalah bahwa all things being equal (ie master lagu yang sama etc etc), kuping kita cukup dengan lossless 16/44.1 atau 16/48. Diatas itu ya overkill. That’s it.
Tambahan :
Sedikit caveat - all things being equal, format CD/DVD (16 bit/44.1kHz - 16 bit/48kHz) sudah pas untuk apa yg bisa ditangkap kuping kita.
Yang perlu dicermati, yang bikin lebih enak itu bukan formatnya (misalnya 16/44.1 vs 24/96), tapi karena lagu/album tersebut telah diremaster - telah dipoles lagi sebelum dirilis kembali.
Bottom line, bukan format 24 bit / 96kHz etc nya yang bikin lebih bagus, tapi proses masteringnya.
===============================================================

AFTERWORDS / ADDITIONAL LINKS :

1) Penjelasan bit depth & sample rate
Untuk ilustrasinya, vid ini bagus : https://www.youtube.com/watch?v=BNVVq-iVPy8 <-- jelasin bit depth & sample rate, great vid, nonton ini aja udah cukup untuk menjelaskan apa itu bit depth & sampling rate
2) Vid Lachlan yg jelasin bit depth myth http://www.youtube.com/watch?v=nLEhfieoMq8
3) Page pembahasan lebih technical tentang bit depth & samping rate : http://people.xiph.org/~xiphmont/demo/neil-young.html
4) Vid Lachlan ttg meta study (meneliti kembali hasil2 penelitian audio yang ada, diliat apakah ada error dll) ttg audio studies yang sudah ada
Watch that vid pls, it’s good.
Untrained ears bisa nebak lossy/lossless secara akurat 51%
Trained ears (ie dikasih contekan harus perhatiin bagian mana dari lagu2 untuk bedain lossy / lossless) bisa nebak lossy/lossless secara akurat 62%
Kalo digabung trained ears & untrained ears, hasilnya tebakan 52% bener
Sama aja kayak tebak2 ngasal
So again, logo hires = marketing untuk naikin harga jual, ga ada benefit untuk kita, purely placebo effect doang.
5) Additional links tentang subjek ini :
6) So what is Loudness War ? Penjelasan singkat, tepat, padat, jelas dari youtube http://www.youtube.com/watch?v=3Gmex_4hreQ
7) Rant nya Tyll di innerfidelity tentang mastering disini http://www.innerfidelity.com/content/its-masters-damit
Awal2nya bagus pas si JJ & Poppy Crum ngomong Pas si Ethan Winer ngomong juga bagus, cuman agak technical
Yang bagus dari presentasi si Ethan di bagian Bit Reduction, start dari menit 45:50 di clipnya Dia puter sampel lagu 24 bit, dan diturunin terus bit ratenya.
Coba dengerin pake headphone deh. Di kuping gw 24 ke 16 ga kedengeran ada perubahan apa2, baru mulai ada noise dll 10- 8 bit kebawah.
Then again, noise / hiss di 8 bit itu yah practically sama aja dengan hiss kalo puter kaset jadul/magnetic tape.
9) Pscychoacoustic
Psychoacoustics ALIAS Apaan sih mp3 ???
Gini, seperti udah dijelasin diatas, teorinya kuping manusia bisa denger frekuensi antara 20Hz - 20.000Hz (20KHz). TAPI, semakin tua kita, semakin sulit menangkap suara diatas 16Khz , bisa dicoba sendiri pake headphone/earphone kamu disini :
Sedangkan frekuensi terendah yang masih kita dengar & masih bisa disebut "musical" itu di 12Hz, ini pun hanya dicoba di dalam suasana / situasi lab test yg ideal banget.
Tones antara 4Hz - 16Hz bukannya kita denger, tapi kita rasakan (ie getaran subwoofer)
Lah terus hubungannya teori diatas ama mp3 apaan coba ? Bosen nih bacanya !!!!
Sabar, ini MP3 dari wiki : The compression works by reducing accuracy of certain parts of sound that are considered to be beyond the auditory resolution ability of most people. This method is commonly referred to as perceptual coding. It uses psychoacoustic models to discard or reduce precision of components less audible to human hearing, and then records the remaining information in an efficient manner.
Nah, jadi kompresi mp3 itu ngebuang ato ngompres ato ngasih prioritas rendah ke bunyi2an yg diluar frekuensi normal manusia. Yg difokusin itu ke frekuensi2 yang kita artikan sebagai "bagus". Tentu saja makin gede kompresi, makin banyak yg di cut off, makanya kuping kaleng kita pun akan bisa ngebedain mp3 320 ama mp3 64
Sidenote: ini wiki tentang perceptual coding ato psychoacoustic :
The psychoacoustic model provides for high quality lossy signal compression by describing which parts of a given digital audio signal can be removed (or aggressively compressed) safely — that is, without significant losses in the (consciously) perceived quality of the sound. It can explain how a sharp clap of the hands might seem painfully loud in a quiet library, but is hardly noticeable after a car backfires on a busy, urban street.
This provides great benefit to the overall compression ratio, and psychoacoustic analysis routinely leads to compressed music files that are 1/10th to 1/12th the size of high quality masters, but with discernibly less proportional quality loss. Such compression is a feature of nearly all modern lossy audio compression formats. Some of these formats include Dolby Digital (AC-3), MP3, Ogg Vorbis, AAC, WMA, MPEG-1 Layer II (used for digital audio broadcasting in several countries) and ATRAC, the compression used in MiniDisc and some Walkman models.
Psychoacoustics is based heavily on human anatomy, especially the ear's limitations in perceiving sound as outlined previously. To summarize, these limitations are:
· Absolute threshold of hearing ---> http://en.wikipedia.org/wiki/Absolute_threshold_of_hearing
Given that the ear will not be at peak perceptive capacity when dealing with these limitations, a compression algorithm can assign a lower priority to sounds outside the range of human hearing. By carefully shifting bits away from the unimportant components and toward the important ones, the algorithm ensures that the sounds a listener is most likely to perceive are of the highest quality.
10) SideNote : Kalo mo ngetest seberapa bagus pendengaran kamu sekarang, coba mampir kesini deh http://hearingtest.online/
Sumber : Dokumen grup audio kere hore (fb) yang dibuat oleh : Rudy Walalangi

Komentar

Postingan Populer