Sebelum mengetahui lebih lanjut tentang Speech Recognition, saya ingin membahas sedikit tentang Voice Recognition. Sesuai dengan arti katanya (voice = suara dan recognition = pengenalan) maka dapat kita katakan bahwa voice recognition adalah identifikasi atau pengenalan melalui suara. Voice recognition sendiri merupakan aplikasi dari Biometric Recognition (sistem pengenalan atau identifikasi seseorang berdasarkan karakteristik biologis khusus yang dimiliki oleh orang tersebut). Ada juga aplikasi biometric lainnya seperti retinal scan, fingerprint, dan face recognition. >>Ok balik lagi ke Speech recognition! :P
Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker recognition. Bedanya, speech recognition adalah proses pengenalan kata yang diucapkan seseorang oleh computer (tidak terpaku pada jenis suara dan identitas orang tersebut), sedangkan speaker recognition adalah pengenalan identitas seseorang dari suaranya (misal intonasi, tingkat kedalaman suara, dan lain sebagainya). Jelas beda bukan?? Yang satu berdasarkan ‘kata’ (speech) yang satu berdasarkan ‘pembicara’ (speaker).
Voice recognition dibagi menjadi dua jenis, yaitu speech recognition dan speaker recognition. Bedanya, speech recognition adalah proses pengenalan kata yang diucapkan seseorang oleh computer (tidak terpaku pada jenis suara dan identitas orang tersebut), sedangkan speaker recognition adalah pengenalan identitas seseorang dari suaranya (misal intonasi, tingkat kedalaman suara, dan lain sebagainya). Jelas beda bukan?? Yang satu berdasarkan ‘kata’ (speech) yang satu berdasarkan ‘pembicara’ (speaker).
Terdapat 4 langkah utama dalam sistem pengenalan suara:
- Penerimaan data input.
- Ekstraksi, yaitu penyimpanan data masukan sekaligus pembuatan database untuk template.
- Pembandingan/pencocokan, yaitu tahap pencocokan data baru dengan data suara (pencocokan tata bahasa) pada template.
- Validasi identitas pengguna.
Jadi saya simpulkan kembali bahwa Speech recognition adalah proses computer dalam mengenali apa yang diucapkan seseorang berdasarkan intonasi suara yang dikonversi ke dalam bentuk digital print. Proses awalnya adalah mengkonversi data spectrum suara ke dalam bentuk digital dan mengubah dalam bentuk diskrit. Contoh implementasi untuk speech recognition misalnya perintah suara untuk menjalankan aplikasi computer (contoh pada aplikasi Microsoft Voice dan Microsoft Dictation).
Mungkin segitu dulu kali ya penjelasannya, lebih lanjut lagi saya baca artikel-artikel terkait lainnya dulu.. hehe ^^
Sumber :
http://www.informatika.org/~rinaldi/Stmik/2007-2008/Makalah2008/MakalahIF2251-2008-077.pdf
http://en.wikipedia.org/wiki/Speech_recognition
Mungkin segitu dulu kali ya penjelasannya, lebih lanjut lagi saya baca artikel-artikel terkait lainnya dulu.. hehe ^^
Sumber :
http://www.informatika.org/~rinaldi/Stmik/2007-2008/Makalah2008/MakalahIF2251-2008-077.pdf
http://en.wikipedia.org/wiki/Speech_recognition