tubidy

Pada titik tertentu, setiap orang harus mempelajari cara kerja file audio. Pengetahuan ini mungkin tampak sepele atau tidak penting, tetapi dapat berguna saat merekam musik, membuat podcast, atau mengoptimalkan perpustakaan musik Anda.

Posting ini akan mengeksplorasi berbagai faktor yang mempengaruhi kualitas audio dan ukuran file audio. Mencapai keseimbangan sempurna antara keduanya tidak mudah, tetapi Anda harus cukup tahu untuk merasa nyaman dan bereksperimen sendiri pada akhirnya.

Catatan: Jika anda ingin download lagu mp3 dari Youtube untuk bahan praktek, bisa menggunakan salah satu website download mp3 seperti oktagon.co.id.

  1. Tingkat Sampel

Dalam kehidupan nyata, suara adalah gelombang. Ketika seseorang berbicara atau bertepuk tangan, yang sebenarnya Anda dengar adalah perubahan tekanan yang menjalar di udara dan akhirnya mengenai gendang telinga Anda.

Tapi bagaimana kita menangkap suara itu dan mengubahnya menjadi data digital? Kita tidak bisa hanya merekam gelombang suara penuh sebagaimana adanya; sebagai gantinya, kita harus mengambil “snapshot” suara secara berkala dari waktu ke waktu. Saat Anda memainkan semuanya kembali secara berurutan, Anda mendapatkan perkiraan rekreasi dari suara aslinya.

Setiap snapshot disebut sampel, dan interval yang digunakan di antara setiap snapshot disebut sample rate . Untuk mendefinisikannya, ini adalah jumlah snapshot digital yang diambil per detik dalam file audio oleh konverter analog ke digital. Sampling rate diukur dalam Hertz, sehingga dapat dinyatakan sebagai frekuensi.

Semakin pendek intervalnya, semakin cepat frekuensinya. Frekuensi yang lebih cepat menghasilkan rekaman yang lebih akurat tetapi juga membutuhkan lebih banyak data untuk menyimpan setiap detik rekaman suara.

Misalnya, audio berkualitas CD menggunakan frekuensi sampel 44,1 kHz (atau 44.100 sampel per detik), sedangkan audio berkualitas TV dan DVD menggunakan frekuensi sampel 48 kHz. Mengingat rekaman audio mono terkompresi 10 menit, yang pertama mungkin 51,7 MB sedangkan yang terakhir akan menjadi 56,3 MB.

Anda dapat turun ke 32 kHz untuk rekaman suara saja dan tidak mengalami banyak penurunan kualitas, tetapi tetap berpegang pada 44,1 kHz jika musik terlibat atau jika Anda membutuhkan kualitas terbaik. Turun ke 22,05 kHz akan terdengar lebih dekat ke radio AM.

  1. Kecepatan bit

Bitrate tidak sama dengan sample rate. Banyak orang cenderung menyamakan keduanya, tetapi penting untuk tidak melakukannya. Pertama-tama, jika sample rate adalah seberapa sering snapshot suara diambil, maka bit depth adalah berapa banyak data yang direkam selama setiap snapshot.

Sebagai ilustrasi, bayangkan gelombang suara sebagai aliran air, dan Anda mencoba untuk menangkap (yaitu, merekam) air itu dengan ember. Tingkat sampel adalah seberapa sering Anda mencelupkan ember ke dalam aliran, sedangkan kedalaman bit adalah ukuran ember Anda. Pengukuran untuk kedalaman bit adalah bit. Untuk setiap peningkatan satu bit, akurasi perekaman menjadi dua kali lipat.

Semakin tinggi kedalaman bit, semakin banyak data yang ditangkap per sampel. Ini mengarah pada perekaman yang lebih akurat dengan mengorbankan lebih banyak ruang yang dibutuhkan untuk menyimpan data itu.

Tetapi jika Anda mengurangi kedalaman bit terlalu banyak, data suara akan hilang. CD audio menggunakan 16 bit per sampel, sedangkan cakram DVD dan Blu-ray menggunakan 24 bit untuk setiap sampel.

Bitrate adalah berapa banyak data suara aktual yang diproses (dinyatakan dalam kilobit per detik). Untuk mendapatkan bitrate, Anda mengalikan sample rate dengan kedalaman bit. File audio CD dengan laju sampel 44,1 kHz dan kedalaman 16-bit akan memiliki laju bit terkompresi 44100*16, yaitu 705,6 kbps.

Untuk memberi Anda gambaran tentang perbedaan ukuran file, mari pertimbangkan lagu tanpa kompresi berdurasi lima menit yang direkam dalam audio stereo dua saluran

  • 1kHz/16-bit: 44100*16*2 = 1411200 bit per detik (1,4 Mbps)
  • 192kHz/24-bit: 192000*24*2 = 9216000 bit per detik (9,2Mbps)

Menggunakan bitrate yang dihitung, kalikan dengan panjang rekaman

1,4*300 = 420Mb atau 52,5 MB

9.2*300 = 2760Mb atau 345 MB

Jadi audio yang direkam dalam 192kHz/24-bit akan memakan ruang enam kali lebih banyak, tetapi semuanya bermuara pada apa yang ingin Anda lakukan dengan rekaman audio. Terkadang kecepatan bit penuh tidak diperlukan dalam snapshot tertentu, seperti saat ada keheningan.

Dalam hal ini, Anda dapat menggunakan variabel bitrate (VBR) yang didukung oleh MP3, OGG, AAC, dan WMA. Di masa lalu, VBR tidak didukung secara luas, tetapi saat ini tidak terlalu menjadi masalah.

  1. Stereo vs. Mono

Poin ini cukup mudah, jadi saya akan membuatnya singkat. Mono berarti satu saluran, sedangkan Stereo berarti dua saluran. Dua saluran dalam file audio stereo dapat disebut sebagai saluran “kiri” dan “kanan”.

Dengan sepasang headphone, Anda dapat mendengar salah satu saluran stereo di satu telinga dan saluran stereo lainnya di telinga lainnya. Saat mendengarkan file audio mono, Anda akan mendengar saluran yang sama persis di kedua telinga.

Dalam arti tertentu, file audio stereo pada dasarnya adalah dua file audio mono dalam satu, yang berarti bahwa file audio stereo selalu dua kali lebih besar dari file audio mono, dengan asumsi laju sampel, kedalaman bit, suara sumber, dll. adalah sama antara keduanya. Jadi cara termudah untuk langsung memotong ukuran file audio menjadi dua adalah dengan mengubahnya dari stereo ke mono.

Untuk rekaman suara saja, mono hampir selalu disukai karena menghasilkan suara yang kuat, jernih, dan jelas. Tetapi jika Anda ingin merekam dua atau lebih vokalis dalam satu ruangan dengan akustik yang unik, vokalnya harus stereo.

Demikian pula, rekaman podcast bisa menjadi mono juga. Namun, dalam rekaman musik, stereolah yang membuat banyak musik terdengar lebih tiga dimensi, seolah-olah musik itu diputar di sekitar Anda daripada di Anda (yaitu, mono terdengar lebih datar).