Audio Forensik: Teori dan Metode Analisis

Source: http://www.bozemandailychronicle.com
Audio Forensik adalah salah satu dari cabang ilmu digital forensik yang sudah pernah saya bahas sebelumnya. Audio Forensik adalah ilmu yang terkait dengan pengolahan barang bukti digital berupa rekaman suara dari suatu tindakan kejahatan. Rekaman suara tersebut harus dianalisis untuk menentukan dan mengenali identitas speaker (pembicara) di dalam rekaman tersebut. 

Pengungkapan identitas dari pembicara dikenal dengan istilah voice recognition.Teknik yang digunakan adalah dengan membandingkan suara dari barang bukti digital (unknown samples) dengan suara yang sudah diketahui (known samples) secara komprehensif. Jika terdapat kecocokan (identik) antara unknown samples dan known samples, maka dapat disimpulkan bahwa barang bukti digital adalah benar suara dari known samples tersebut.


A. TEORI SUARA
Suara dihasilkan melalui proses Generation dan Filtering. Generation adalah proses dimana suara pertama kali diproduksi melalui bergetarnya pita suara (vocal cord atau vocal ford) yang berada di laring (larynx) untuk menghasilkan bunyi periodik. Bunyi periodik yang bersifat konstan tersebut kemudian difilterisasi melaui vocal tract (disebut juga dengan isilah resonator suara atau articulator) yang mencakup lidah (tongue), gigi (teeth), bibir (lips), langit-langit (palate) dan lain-lain sehingga bunyi tersebut dapat menjadi bunyi keluaran berupa bunyi vocal (vowel) dan atau bunyi konsonan (consonant) yang membentuk kata-kata yang memiliki arti sehingga nantinya dapat dianalisis untuk keperluan voice recognition. (Al Ahzar, 2012)

B.  KOMPONEN DARI SUARA
Suara terdiri atas beberapa komponen, yaitu pitch, forman dan spektogram. (Al Azhar, 2012).
  • Pitch
    Pitch adalah tinggi rendah nada dalam suatu bunyian. Pada suara manusia, pitch dihasilkan oleh frekuensi getar yang disebut juga frekuensi fundamental (dasar) dan memiliki notasi 0 (Al Azhar, 2012). Sifat pitch sangat khas pada setiap orang dan hal ini dipengaruhi oleh kondisi fisiologis masing-masing manusia. Pada kondisi percakapan normal tingkat kekhasan pitch pada laki-laki berkisar antara 50-250Hz sedangkan pada wanita sekitar 120-500 Hz.

    Analisis pitch dilakukan dengan menganalisa statistik yang meliputi, minimum pitch, rata-rata pitch dan maksimum pitch. Meski begitu analisis pitch ini tidak berpengaruh banyak ketika kondisi suara seorang yang berbicara di rekaman berbeda dengan kondisi pengambilan suara pembanding. (Al Azhar 2012)
  • Forman
    Forman adalah harmonisasi dari nada-nada yang dihasilkan dari resonansi (Jeans, 1938), Asosiasi Akustik Amerika mendefinisikan forman sebagai jangkauan dari frekuensi pada suara spektrum yang relatif dan maksimal. Ilmu pengetahuan tentang pengucapan dan fonetik menyebutkan bahwa forman adalah suatu hal yang berhubungan dengan resonansi akustik pada vocal tract manusia. Intinya adalah, forman terkait dengan frekuensi yang tercipta akibat terjadinya harmonisasi dan resonasi pada suara vocal tract manusia.

    Secara umum frekuensi forman tidak memiliki batas, biasanya tergambar mulai dari formant 1 (F1) hingga Formant 5 (F5) namun untuk suara manusia yang biasanya diidentifikasi hanyalah sebatas Forman 3; F1, F2 dan F3.
  • Spektogram
    Spektogram merupakan representasi spektral yang bervariasi terhadap waktu yang menunjukkan tingkat intensitas energi spektral (Al Azhar,2012). Sedangkan en.wikipedia.org menyatakan bahwa spektogram merupakan representasi visual dari spektrum atau frekuensi suara  atau sinyal yang berubah seiring waktu akibat variabel lainnya. Intinya spektogram adalah bentuk visualisasi dari masing-masing nilai forman yang dilengkapi dengan tingkat energi yang bervariasi terhadap waktu. Tingkatan energi ini disebut dengan Forman Bandwidth (Al Azhar, 2012)

    Pada kasus pemalsuan pitch dengan teknik pitch shift, forman bandwidth dapat digunakan untuk memetakan dan mengidentifikasi suara aslinya sehingga beberapa ahli menyebutnya sebagai sidik jari suara (voice fingerprints). Meski begitu, ada pertentangan dalam penyebutan forman bandwidth sebagai voice fingerprints. Hal ini disebabkan forman bandwidth pada suatu orang dapat berbeda-beda meski mereka mengucapkan kata yang sama sedangkan sidik jari seharusnya tidak berubah. Namun para ahli tersebut sepakat bahwa analisis spektogram penting dilakukan saat analisis suara karena menampilkan visualisasi detail dari forman berikut bandwidthnya.
C.  METODOLOGI
Metodologi yang bisa dipakai untuk menganalisis suara diantaranya
  1. Bedasarkan Standard Operating Procedure (SOP) 12 tentang Analisis Audio Forensic dari Digital Forensic Analyst Team (DFAT) Puslabfor yang salah satunya mengacu pada Spectographic Voic Identification: A Forensic Survey yang dikeluarkan oleh Federal Bureau of Investigation (FBI), Amerika Serikat
    Berikut adalah metodologi atau prosedur yang dilakukan untuk menganalisis rekaman suara berdasarkan SOP 12 DFAT
    • Acquisition
      Aquisition atau proses akuisisi adalah proses untuk mengakuisisi barang bukti digital. Mencatat segala informasi terkait dengan barang bukti digital mulai dari spesifikasi hardware hingga pada pemerolehan file image dari barang bukti tersebut. Proses pemerolehan image dari barang bukti harus dipastikan keasliannya dengan membandingkan hash file asli dengan hash image file. Selanjutnya di dalam proses akuisisi juga penyidik perlu mendapatkan suara pembanding (known samples) dari tersangka yang dicurigai sebagai pemilik suara pada rekaman (unknown samples). Proses perekaman suara pembanding harus dengan video yang menunjukkan subyek sedang berbicara. Sumber suara harus jelas dan resmi disertai persetujuan dan penandatanganan nota kesepakatan dari subyek yang suaranya akan dianalisis.
    • Audio Enhancement
      Proses enhancement adalah proses peningkatan kualitas suara agar suara yang diakuisisi bebas dari noise atau unwanted sound lainnya.
    • Decoding
      Decoding adalah proses pembuatan transkip rekaman suara dan dilakukan minimal oleh dua orang pemeriksa. Transkip rekaman harus mencantumkan label subyek (misal subyek 1, subyek 2 dan seterusnya) dan waktu (dalam jam:menit:detik) yang sesuai dengan berjalannya rekaman. Jika suara percakapan dalam rekaman terdengar tidak jelas maka ditulis "tidak jelas" agar hasil transkrip hanya berisi percakapan yang jelas dan dapat dipahami pengucapan kata-katanya.
    • Voice Recognition
      Proses ini dilakukan untuk memastikan apakah suara pada barang bukti rekaman identik dengan suara pembanding atau tidak. Pada proses ini analisis yang dilakukan adalah analisis pitch, forman, formant bandwidth dan spektogram. Dipersyaratkan minimal 20 kata yang memiliki kesamaan antara suara barang bukti dan suara pembanding.
  2. Menurut Edward John Primeau, CCI, CFC
    Edward John Primeau, CCI, CFC atau yang dikenal sebagai Ed Primeau adalah seorang ahli forensik spesialis Audio Forensik dan Video Forensik yang sudah berpengalaman selama 30 tahun menangani kasus yang berhubungan dengan audio dan video forensik. Didalam situsnya, "http://www.audioforensicexpert.com/" Ed menulis metode dalam melakukan proses audio forensik:
    • Forensic Audio Enhancement
      Audio enhancement adalah proses meningkatkan kejelasan dari rekaman suara yang diperoleh. Tujuan dari audio enhancement adalah meningkatkan intelligibity atau kejelasan dari suara yang ada di dalam rekaman, menghilangkan noise dan menguatkan suara yang ingin diidentifikasi. Proses Audio Enhancement menggunakan teknik pendengaran kritis dan analisis frekuensi untuk menentukan persoalan utamanya.
    • Forensic Audio Authentication
      Proses Audio Authentication adalah proses untuk menganalisa bahwa rekaman suara yang didapatkan tidak mengalami penambahan atau pengurangan sebelumnya. Artinya rekaman yang didapat adalah asli dan original yang diakuisisi langsung dari media rekamnya.
    • Voice Identification
      Voice identification adalah proses untuk membandingkan suara rekaman (uknown samples) dengan suara rekaman pembanding (known samples) untuk ditemukan kesesuaian di antaranya. Metode ini menganalisa menggunakan pendengaran kritis, analisis frekuensi dan gelombang suara, serta menggunakan software voice biometrics.
    • Forensic Audio Transcription
      Forensic Audio Transcription adalah dokumentasi yang komplit dari rekaman dan kata-kata yang diucapkan pada barang bukti digital.
  3. Menurut Robert C. Maher, Ph.D.,P.E.
    Robert C. Maher adalah seorang professor sekaligus kepala departemen Electrical & Computer Engineering di Universitas Negeri Montana. Beliau juga Profesor teknologi musik. Sebagai seorang profesor, Profesor Maher memiliki keahlian di bidang Pemrosesan sinyal digital, teknik audio dan musik akustik, serta analis Audio Forensik. Beliau menuliskan 3 metode pemrosesan suara pada Audio Forensik,
    • Authenticity
      Analis Audio forensik harus memastikan bahwa rekaman suara dihasilkan oleh proses yang terawasi dan terkendali, yang terjaga dokumentasinya sebagaimana chain-of-custody dan dilakukan dengan kehati-hatian ketika menganalisa audio tersebut.
    • Enhancement
      Enhancement dilakukan untuk menghilangkan gangguan-gangguan suara seperti noise, distorsi, equalisasi yang buruk atau gaung yang berlebihan. Yang paling sering dilakukan pada proses enhancement adalah mengurangi noise sehingga dapat meningkatkan kejelasan dari pegucapan kata di dalam rekaman yang mana hal ini akan sangat membantu dalam penyusunan transkip percakapan dari rekama tersebut.
    • Interpretation
      Proses selanjutnya adalah interpretasi atau penerjemahan dari audio yang sedang dianalisa. Pada kasus rekaman pembicaraan, aspek ini lebih mengarah pada persiapan transkip percakapan, identifikasi pembicara dalam rekaman, identifikasi suara-suara latar belakang pembicaraan.
D. REFERENSI
  1. Al Azhar, M. Nuh (2012).Digital Forensik, Panduan Melakukan Investigasi Komputer. Salemba Infotek
  2. Anonim. Spectogram.https://en.wikipedia.org/wiki/Spectrogram#cite_note-1.diakses tanggal 20 Oktober 2016
  3. Anonim. Formant. https://en.wikipedia.org/wiki/Formant#cite_note-2. diakses tanggal 20 Oktober 2016
  4. Primeau, Edward John. http://www.audioforensicexpert.com/. diakses tanggal 20 Oktober 2016
  5. Maher, Robert C  (2009). Audio Forensics Examination.IEEE Signal Processing Magazine. Diunduh tanggal 19 Oktober 2016

No comments:

Post a Comment