ARTIKEL KECERDASAN BUATAN, SPEECH RECOGNITION
ARTIKEL KECERDASAN BUATAN
(Pengenalan Ucapan speech recognition)
Nama Kelompok :
1. Aditya Gunawan 161021401478
2. Lexy Alfano Lumiling 161011400103
3. Wijang Hidayat Tarug 161021401424
Banyak hal yang kelihatannya sulit untuk kecerdasan manusia, tetapi untuk Informatika relatif tidak bermasalah. Seperti contoh: mentransformasikan persamaan, menyelesaikan persamaan integral, membuat permainan catur atau Backgammon. Di sisi lain, hal yang bagi manusia kelihatannya menuntut sedikit kecerdasan, sampai sekarang masih sulit untuk direalisasikan dalam Informatika. Seperti contoh: Pengenalan Objek/Muka, bermain sepak bola.
Walaupun AI memiliki konotasi fiksi ilmiah yang kuat, AI membentuk cabang yang sangat penting pada ilmu komputer, berhubungan dengan perilaku, pembelajaran dan adaptasi yang cerdas dalam sebuah mesin. Penelitian dalam AI menyangkut pembuatan mesin dan program komputer untuk mengotomatisasikan tugas-tugas yang membutuhkan perilaku cerdas. Termasuk contohnya adalah pengendalian, perencanaan dan penjadwalan, kemampuan untuk menjawab diagnosa dan pertanyaan pelanggan, serta pengenalan tulisan tangan, suara dan wajah. Hal-hal seperti itu telah menjadi disiplin ilmu tersendiri, yang memusatkan perhatian pada penyediaan solusi masalah kehidupan yang nyata. Sistem AI sekarang ini sering digunakan dalam bidang ekonomi, sains, obat-obatan, teknik dan militer, seperti yang telah dibangun dalam beberapa aplikasi perangkat lunak komputer rumah dan video game.
Kecerdasan buatan ini bukan hanya ingin mengerti apa itu sistem kecerdasan, tetapi juga mengkonstruksinya.
Tidak ada definisi yang memuaskan untuk 'kecerdasan':
1. kecerdasan: kemampuan untuk memperoleh pengetahuan dan menggunakannya
2. atau kecerdasan yaitu apa yang diukur oleh sebuah 'Test Kecerdasan'
B. PAHAM PEMIKIRAN.
Secara garis besar, AI terbagi ke dalam dua paham pemikiran yaitu AI Konvensional dan Kecerdasan Komputasional (CI, Computational Intelligence). AI konvensional kebanyakan melibatkan metode-metode yang sekarang diklasifiksikan sebagai pembelajaran mesin, yang ditandai dengan formalisme dan analisis statistik. Dikenal juga sebagai AI simbolis, AIlogis, AI murni dan AI cara lama (GOFAI, Good Old Fashioned Artificial Intelligence). Metode-metodenya meliputi:
1. Sistem pakar: menerapkan kapabilitas pertimbangan untuk mencapai kesimpulan. Sebuah sistem pakar dapat memproses sejumlah besar informasi yang diketahui dan menyediakan kesimpulan-kesimpulan berdasarkan pada informasi-informasi tersebut.
2. Petimbangan berdasar kasus
3. Jaringan Bayesian
4. AI berdasar tingkah laku: metode modular pada pembentukan sistem AI secara manual
Kecerdasan komputasional melibatkan pengembangan atau pembelajaran iteratif (misalnya penalaan parameter seperti dalam sistem koneksionis. Pembelajaran ini berdasarkan pada data empiris dan diasosiasikan dengan AI non-simbolis, AI yang tak teratur dan perhitungan lunak. Metode-metode pokoknya meliputi:
1. Jaringan Saraf: sistem dengan kemampuan pengenalan pola yang sangat kuat
2. Sistem Fuzzy: teknik-teknik untuk pertimbangan di bawah ketidakpastian, telah digunakan secara meluas dalam industri modern dan sistem kendali produk konsumen.
3. Komputasi Evolusioner: menerapkan konsep-konsep yang terinspirasi secara biologis seperti populasi, mutasi dan “survival of the fittest” untuk menghasilkan pemecahan masalah yang lebih baik.
Metode-metode ini terutama dibagi menjadi algoritme evolusioner (misalnya algoritme genetik) dan kecerdasan berkelompok (misalnya algoritme semut)
Dengan sistem cerdas hibrid, percobaan-percobaan dibuat untuk menggabungkan kedua kelompok ini. Aturan inferensi pakar dapat dibangkitkan melalui jaringan saraf atau aturan produksi dari pembelajaran statistik seperti dalam ACT-R. Sebuah pendekatan baru yang menjanjikan disebutkan bahwa penguatan kecerdasan mencoba untuk mencapai kecerdasan buatan dalam proses pengembangan evolusioner sebagai efek samping dari penguatan kecerdasan manusia melalui teknologi.
C. SEJARAH KECERDASAN BUATAN.
Pada awal abad 17, René Descartes mengemukakan bahwa tubuh hewan bukanlah apa-apa melainkan hanya mesin-mesin yang rumit. Blaise Pascal menciptakan mesin penghitung digital mekanis pertama pada 1642. Pada 19, Charles Babbage dan Ada Lovelace bekerja pada mesin penghitung mekanis yang dapat diprogram.
Bertrand Russell dan Alfred North Whitehead menerbitkan Principia Mathematica, yang merombak logika formal. Warren McCulloch dan Walter Pitts menerbitkan "Kalkulus Logis Gagasan yang tetap ada dalam Aktivitas " pada 1943 yang meletakkan fondasi untuk jaringan saraf.
Tahun 1950-an adalah periode usaha aktif dalam AI. Program AI pertama yang bekerja ditulis pada 1951 untuk menjalankan mesin Ferranti Mark I di University of Manchester(UK): sebuah program permainan naskah yang ditulis oleh Christopher Strachey dan program permainan catur yang ditulis oleh Dietrich Prinz. John McCarthy membuat istilah "kecerdasan buatan " pada konferensi pertama yang disediakan untuk pokok persoalan ini, pada 1956. Dia juga menemukan bahasa pemrograman Lisp. Alan Turingmemperkenalkan "Turing test" sebagai sebuah cara untuk mengoperasionalkan test perilaku cerdas. Joseph Weizenbaum membangun ELIZA, sebuah chatterbot yang menerapkan psikoterapi Rogerian.
Selama tahun 1960-an dan 1970-an, Joel Moses mendemonstrasikan kekuatan pertimbangan simbolis untuk mengintegrasikan masalah di dalam program Macsyma, program berbasis pengetahuan yang sukses pertama kali dalam bidang matematika. Marvin Minsky dan Seymour Papert menerbitkan Perceptrons, yang mendemostrasikan batas jaringan saraf sederhana dan Alain Colmerauer mengembangkan bahasa komputer Prolog. Ted Shortliffe mendemonstrasikan kekuatan sistem berbasis aturan untuk representasi pengetahuan dan inferensi dalam diagnosa dan terapi medis yang kadangkala disebut sebagai sistem pakar pertama. Hans Moravec mengembangkan kendaraan terkendali komputer pertama untuk mengatasi jalan berintang yang kusut secara mandiri.
Pada tahun 1980-an, jaringan saraf digunakan secara meluas dengan algoritme perambatan balik, pertama kali diterangkan oleh Paul John Werbos pada 1974. Pada tahun 1982, para ahli fisika seperti Hopfield menggunakan teknik-teknik statistika untuk menganalisis sifat-sifat penyimpanan dan optimasi pada jaringan saraf. Para ahli psikologi, David Rumelhart dan Geoff Hinton, melanjutkan penelitian mengenai model jaringan saraf pada memori. Pada tahun 1985-an sedikitnya empat kelompok riset menemukan kembali algoritme pembelajaran propagansi balik (Back-Propagation learning). Algoritme ini berhasil diimplementasikan ke dalam ilmu komputer dan psikologi. Tahun 1990-an ditandai perolehan besar dalam berbagai bidang AI dan demonstrasi berbagai macam aplikasi. Lebih khusus Deep Blue, sebuah komputer permainan catur, mengalahkan Garry Kasparovdalam sebuah pertandingan 6 game yang terkenal pada tahun 1997. DARPA menyatakan bahwa biaya yang disimpan melalui penerapan metode AI untuk unit penjadwalan dalam Perang Teluk pertama telah mengganti seluruh investasi dalam penelitian AI sejak tahun 1950 pada pemerintah AS.
Tantangan Hebat DARPA, yang dimulai pada 2004 dan berlanjut hingga hari ini, adalah sebuah pacuan untuk hadiah $2 juta dimana kendaraan dikemudikan sendiri tanpa komunikasi dengan manusia, menggunakan GPS, komputer dan susunan sensor yang canggih, melintasi beberapa ratus mil daerah gurun yang menantang.
D. SUDUT PANDANG KECERDASAN BUATAN
Pengertian kecerdasan buatan dapat di pandang dari berbagai sudut pandang, antara lain :
1. Sudut Pandang KecerdasanKecerdasan buatan mampu membuat mesin menjadi cerdas (berbuat seperti yang dilakukan manusia)
2. Sudut Pandang PenelitianKecerdasan buatan adalah studi bagaimana membuat komputer dapat melakukan sesuatu sebaik yang dilakukan manusia
3. Sudut Pandang Bisnis Kecerdasan buatan adalah kumpulan peralatan yang sangat powerful dan metodologis dalam menyelesaikan masalah bisnis
4. Sudut Pandang Pemrogram Kecerdasan buatan meliputi studi tentang pemrograman simbolik, problem solving, dan pencarian (searching)
E. DUA BAGIAN UTAMA KECERDSAN BUATAN (AI)
1. Basis Pengetahuan (knowledge base) berisi fakta-fakta, teori, pemikiran dan hubungan komponen satu dengan yang lainnya
2. Motor Inferensi (inference engine) Kemampuan menarik kesimpulan berdasar pengalaman. Berkaitan dengan representasi dan duplikasi proses tersebut melalui mesin
F. KONSEP KECERDASAN BUATAN
Ada beberapa konsep yang harus dipahami dalam kecerdasan buatan, diantaranya:
1. Turing Test Metode Pengujian Kecerdasan (Alan Turing).
2. Proses uji ini melibatkan seorang penanya (manusia) dan dua obyek yang ditanyai.
3. Pemrosesan Simbolik
4. Komputer semula didisain untuk memproses bilangan/angka-angka (pemrosesan numerik).
5. Sementara manusia dalam berpikir dan menyelesaikan masalah lebih bersifat simbolik, tidak didasarkan kepada sejumlah rumus atau melakukan komputasi matematis.
6. Sifat penting dari AI adalah bahwa AI merupakan bagian dari ilmu komputer yang melakukan proses secara simbolik dan non-algoritmik dalam penyelesain masalah.
7. Heuristic Suatu strategi untuk melakukan proses pencarian (search) ruang problem secara efektif, yang memandu proses pencarian yang kita lakukan di sepanjang jalur yang memiliki kemungkinan sukses paling besar.
8. Inferensi (Penarikan Kesimpulan) AI mencoba membuat mesin memiliki kemampuan berpikir atau mempertimbangkan (reasoning), termasuk didalamnya proses (inferencing) berdasarkan fakta-fakta dan aturan dengan menggunakan metode heuristik, dll
9. Pencocokan Pola (Pattern Matching) Berusaha untuk menjelaskan obyek, kejadian (events)atau proses, dalam hubungan logik atau komputasional.
G. TUJUAN KECERDASAN BUATAN
1. Membuat komputer lebih cerdas
2. Mengerti tentang kecerdasan
3. Membuat mesin lebih berguna
A. PENGENALAN UCAPAN (SPEECH RECOGNITION)
Speech Recognition merupakan salah satu bentuk dari kecerdasan buatan. Menurut Wikipedia, yang disebut kecerdasan buatan ialah kecerdasan yang ditambahkan kepada suatu sistem yang bisa diatur dalam konteks ilmiah. Jadi, dengan fitur pengenalan ucapan, sebuah sistem komputer dapat menerjemahkan perkataan yang diucapkan oleh manusia menjadi perintah program.
Bagaimana cara kerja pengenalan ucapan?
Pengenalan ucapan atau Speech Recognition (SR), adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan.Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah komando untuk melakukan suatu pekerjaan, misalnya penekanan tombol pada telepon genggam yang dilakukan secara otomatis dengan komando suara.
Alat pengenal ucapan, yang sering disebut dengan speech recognizer, membutuhkan sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan dalam komputer, dan kemudian digunakan sebagai basis data dalam mencocokkan kata yang diucapkan selanjutnya.
Pengenalan ucapan dalam perkembangan teknologinya merupakan bagian dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi menjadi dua, yaitu pengenalan pembicara (identifikasi suara berdasarkan orang yang berbicara) dan pengenalan ucapan (identifikasi suara berdasarkan kata yang diucapkan).
Jenis-jenis pengenalan ucapan
Berdasarkan kemampuan dalam mengenal kata yang diucapkan, terdapat 5 jenis pengenalan kata, yaitu:
1. Kata-kata yang terisolasi Proses pengidentifikasian kata yang hanya dapat mengenal kata yang diucapkan jika kata tersebut memiliki jeda waktu pengucapan antar kata.
2. Kata-kata yang berhubungan Proses pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih singkat.
3. Kata-kata yang berkelanjutan Proses pengidentifikasian kata yang sudah lebih maju karena dapat mengenal kata-kata yang diucapkan secara berkesinambungan dengan jeda waktu yang sangat sedikit, sehingga pengguna perangkat ini dapat mengucapkan kata-kata secara natural.
4. Kata-kata spontan Proses pengidentifikasian kata yang dapat mengenal kata/kalimat yang diucapkan secara spontan.
5. Verifikasi atau identifikasi suara Proses pengidentifikasian kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicara.
Perangkat keras yang dibutuhkan
1. Sound Card
2. Microphone
3. Computer/processor
B. SKEMA UTAMA DAN ALGORITMA SPEECH RECOGNITION
Terdapat 4 langkah utama dalam sistem pengenalan suara:
1. Penerimaan data input
2. Ekstraksi, yaitu penyimpanan data masukan sekaligus pembuatan databaseuntuk template.
3. Pembandingan / pencocokan, yaitu tahap pencocokan data baru dengan datasuara (pencocokan tata bahasa) pada template.
4. Validasi identitas pengguna.
1. Skema Speech Recogition
Secara umum, speech recognizer memproses sinyal suara yang masuk danmenyimpannya dalam bentuk digital. Hasit proses digitalisasi tersebut kemudiandikonversi dalam bentuk spektrum suara yang akan dianalisa denganmembandingkannya dengan template suara pada database sistem
2. Spektrum Suara
Sebelumnya, data suara masukan dipilah-pilah dan diproses satu per satu berdasarkanurutannya. Pemilahan ini dilakukan agar proses analisis dapat dilakukan secara paralel. Proses yang pertama kali dilakukan ialah memproses gelombang kontinuspektrum suara ke dalam bentuk diskrit. Langkah berikutnya ialah proses kalkulasiyang dibagi menjadi dua bagian:
a. Transformasi gelombang diskrit menjadi array data.
b. Untuk masing-masing elemen pada aiTay data, hitung "ketinggian"gelombang(frekuensi).Objek permasaiahan yang akan dibagi adalah masukan berukuran n, berupadata diskrit gelombang suara.
Ketika mengkonversi gelombang suara ke dalam bentuk diskrit, gelombangdiperlebar dengan cara memperinci berdasarkan waktu. Hal ini dilakukan agar prosesalgontma seianjutnya (pencocokan) lebih mudah diiakukan. Namun, efek buruknyaialah array of array data yang terbentuk akan lebih banyak.
Contoh Hasil konversi Sinyal Diskrit
Dari tiap elemen array data tersebut, dikonversi ke dalam bentuk bilangan biner. Data biner tersebut yang nantinya akan dibandingkan dengan template data suara.Proses divide and conquer:
a. Pilih sebuah angkaN, dimana N merupakan bilangan bulat kelipatan 2.Bilanganini berfungsi untuk menghitung jumlah elemen transformasi FFT.
b. Bagi dua data diskrit secara (dengan menerapkan algoritma divide and conquer)menjadi data diskrit yang lebih kecii berukuran N = N,.N2.
c. Objek data dimasukkan ke dalam table (sebagai elemen tabel).
d. Untuk setiap elemen data, dicocokkan dengan data pada template (pada datatemplate juga dilakukan pemrosesan digitaiisasi menjadi data diskrit, dengancara yang sama dengan proses digitaiisasi data masukan bam yang ingindicocokkan).
e. Setiap upa masalah disatukan kembali dan dianalisis secara keseluruhan,kecocokan dari segi tata bahasa dan apakah data yang diucapkan sesuai dengankata yang tersedia pada template data.
f. Verifikasi data. Jika sesuai, proses iebih lanjut, sesuai dengan aplikasi yangmengimplementasikan algoritma ini.
C. IMPLEMENTASI SPEECH RECOGNITION
1. Bidang komunikasi
a. Komando Suara
Komando Suara adalah suatu program pada komputer yang melakukan perintah berdasarkan komando suara dari pengguna. Contohnya pada aplikasi Microsoft Voice yang berbasis bahasa Inggris.
b. Pendiktean
Pendiktean adalah sebuah proses mendikte yang sekarang ini banyak dimanfaatkan dalam pembuatan laporan atau penelitian. Contohnya pada aplikasi Microsoft Dictation yang merupakan aplikasi yang dapat menuliskan apa yang diucapkan oleh pengguna secara otomatis.
c. Telepon
Pada telepon, teknologi pengenal ucapan digunakan pada proses penekanan tombol otomatis yang dapat menelpon nomor tujuan dengan komando suara.
2. Bidang kesehatan
Alat pengenal ucapan banyak digunakan dalam bidang kesehatan untuk membantu para penyandang cacat dalam beraktivitas. Contohnya pada aplikasi Antarmuka Suara Pengguna atauVoice User Interface (VUI) yang menggunakan teknologi pengenal ucapan.
3. Bidang militer
a. Pelatihan Penerbangan
Aplikasi alat pengenal ucapan dalam bidang militer adalah pada pengatur lalu-lintas udaraatau yang dikenal dengan Air Traffic Controllers (ATC) yang dipakai oleh para pilot untuk mendapatkan keterangan mengenai keadaan lalu-lintas udara seperti radar, cuaca, dan navigasi. Alat pengenal ucapan digunakan sebagai pengganti operator yang memberikan informasi kepada pilot.
b. Helikopter
Aplikasi alat pengenal ucapan pada helikopter digunakan untuk berkomunikasi lewat radio dan menyesuaikan sistem navigasi
.
D. KELEBIHAN DAN KEKURANGAN
Kelebihan:
1. Cepat: Teknologi ini mempercepat transmisi informasi dan umpan balik dari transmisi tersebut.
2. Mudah digunakan: Komando dapat dilakukan tanpa perangkat keras.
Kekurangan:
1. Rawan terhadap gangguan: Karena proses ini masih berbasis frekuensi, sulit untuk memisahkan gangguan/noise dari sinyal suara
2. Jumlah kata yang dapat dikenal terbatas: Hal ini disebabkan pengenal ucapan bekerja dengan cara mencari kemiripan dengan basis data yang dimiliki.
A. KESIMPULAN
Speech recognition merupakan salah satu jenis biometric recognition, yaitu proses komputer mengenali apa yang diucapkan seseorang berdasarkan intonasi suarayang dikonversikan ke dalam bentuk digital print. Pengenalan pola suara adalah salahsatu aplikasi yang berkembang saat ini. Sistem ini mengijinkan kita untuk berkomunikasi antara manusia dengan memasukkan data ke komputer. Salah satufungsinya ialah untuk meningkatkan efisiensi industri manufaktur, mengontrol mesindengan berbicara pada mesin itu.Algoritma yang diimplementasikan untuk masalh pengenalan suara ini adalahalgoritma divide and conquer. Proses awalnya ialah mengkonversi data spektrumsuara ke dalam bentuk digital dan mengubah dalam bentuk diskrit. Dari bentuk diskrititulah yang kemudian mengaplikasika algoritma divide and conquer untukmengoptimalkan waktu pencocokan (kompleksitas berkurang). Contoh aplikasi yangmenerapkan speech recognition antara lain Microsoft Voice dan Microsoft Dictation.
Daftar Pustaka:
Apolloni, Bruno, Harpri (2003). Neural Nets. Springer-Verlag. hlm. 3. ISBN 3540202277.
Baecker, Ronald M, Jonathan Grudin, William A. X. Buxton, Saul Greenberg (1995). Human-Computer Interaction : Toward the Year 2000 (Second Edition). Morgan Kauffman Publishers, Inc. hlm. 546. ISBN 1558602461.
Benesty, Jacob, M. Mohan Sondhi, dan Yiteng Huang (2008). Handbook of Speech Processing. Springer-Verlag. hlm. 6.ISBN 159904840X.
Jelinek, Frederick (1997). Statistical Methods For Speech Recognition. Massachusetts Institute of Technology. hlm. 17.ISBN 0262100665.
Waibel, Alex dan Kai-Fu Lee (1990). Readings in Speech Recognition. Morgan Kauffman Publishers, Inc. hlm. 1 & 267.ISBN 1558601244.
(Pengenalan Ucapan speech recognition)
Nama Kelompok :
1. Aditya Gunawan 161021401478
2. Lexy Alfano Lumiling 161011400103
3. Wijang Hidayat Tarug 161021401424
BAB I
PENDAHULUAN
A. LATAR BELAKANG
Kecerdasan buatan adalah kecerdasan yang ditambahkan kepada suatu sistem yang bisa diatur dalam konteks ilmiah atau bisa disebut juga intelegensi artifisial (bahasa Inggris: Artificial Intelligence) atau hanya disingkat AI, didefinisikan sebagai kecerdasan entitas ilmiah.Andreas Kaplan dan Michael Haenlein mendefinisikan kecerdasan buatan sebagai “kemampuan sistem untuk menafsirkan data eksternal dengan benar, untuk belajar dari data tersebut, dan menggunakan pembelajaran tersebut guna mencapai tujuan dan tugas tertentu melalui adaptasi yang fleksibel”.[1] Sistem seperti ini umumnya dianggap komputer. Kecerdasan diciptakan dan dimasukkan ke dalam suatu mesin (komputer) agar dapat melakukan pekerjaan seperti yang dapat dilakukan manusia. Beberapa macam bidang yang menggunakan kecerdasan buatan antara lain sistem pakar, permainan komputer (games), logika fuzzy, jaringan saraf tiruan dan robotika.Banyak hal yang kelihatannya sulit untuk kecerdasan manusia, tetapi untuk Informatika relatif tidak bermasalah. Seperti contoh: mentransformasikan persamaan, menyelesaikan persamaan integral, membuat permainan catur atau Backgammon. Di sisi lain, hal yang bagi manusia kelihatannya menuntut sedikit kecerdasan, sampai sekarang masih sulit untuk direalisasikan dalam Informatika. Seperti contoh: Pengenalan Objek/Muka, bermain sepak bola.
Walaupun AI memiliki konotasi fiksi ilmiah yang kuat, AI membentuk cabang yang sangat penting pada ilmu komputer, berhubungan dengan perilaku, pembelajaran dan adaptasi yang cerdas dalam sebuah mesin. Penelitian dalam AI menyangkut pembuatan mesin dan program komputer untuk mengotomatisasikan tugas-tugas yang membutuhkan perilaku cerdas. Termasuk contohnya adalah pengendalian, perencanaan dan penjadwalan, kemampuan untuk menjawab diagnosa dan pertanyaan pelanggan, serta pengenalan tulisan tangan, suara dan wajah. Hal-hal seperti itu telah menjadi disiplin ilmu tersendiri, yang memusatkan perhatian pada penyediaan solusi masalah kehidupan yang nyata. Sistem AI sekarang ini sering digunakan dalam bidang ekonomi, sains, obat-obatan, teknik dan militer, seperti yang telah dibangun dalam beberapa aplikasi perangkat lunak komputer rumah dan video game.
Kecerdasan buatan ini bukan hanya ingin mengerti apa itu sistem kecerdasan, tetapi juga mengkonstruksinya.
Tidak ada definisi yang memuaskan untuk 'kecerdasan':
1. kecerdasan: kemampuan untuk memperoleh pengetahuan dan menggunakannya
2. atau kecerdasan yaitu apa yang diukur oleh sebuah 'Test Kecerdasan'
B. PAHAM PEMIKIRAN.
Secara garis besar, AI terbagi ke dalam dua paham pemikiran yaitu AI Konvensional dan Kecerdasan Komputasional (CI, Computational Intelligence). AI konvensional kebanyakan melibatkan metode-metode yang sekarang diklasifiksikan sebagai pembelajaran mesin, yang ditandai dengan formalisme dan analisis statistik. Dikenal juga sebagai AI simbolis, AIlogis, AI murni dan AI cara lama (GOFAI, Good Old Fashioned Artificial Intelligence). Metode-metodenya meliputi:
1. Sistem pakar: menerapkan kapabilitas pertimbangan untuk mencapai kesimpulan. Sebuah sistem pakar dapat memproses sejumlah besar informasi yang diketahui dan menyediakan kesimpulan-kesimpulan berdasarkan pada informasi-informasi tersebut.
2. Petimbangan berdasar kasus
3. Jaringan Bayesian
4. AI berdasar tingkah laku: metode modular pada pembentukan sistem AI secara manual
Kecerdasan komputasional melibatkan pengembangan atau pembelajaran iteratif (misalnya penalaan parameter seperti dalam sistem koneksionis. Pembelajaran ini berdasarkan pada data empiris dan diasosiasikan dengan AI non-simbolis, AI yang tak teratur dan perhitungan lunak. Metode-metode pokoknya meliputi:
1. Jaringan Saraf: sistem dengan kemampuan pengenalan pola yang sangat kuat
2. Sistem Fuzzy: teknik-teknik untuk pertimbangan di bawah ketidakpastian, telah digunakan secara meluas dalam industri modern dan sistem kendali produk konsumen.
3. Komputasi Evolusioner: menerapkan konsep-konsep yang terinspirasi secara biologis seperti populasi, mutasi dan “survival of the fittest” untuk menghasilkan pemecahan masalah yang lebih baik.
Metode-metode ini terutama dibagi menjadi algoritme evolusioner (misalnya algoritme genetik) dan kecerdasan berkelompok (misalnya algoritme semut)
Dengan sistem cerdas hibrid, percobaan-percobaan dibuat untuk menggabungkan kedua kelompok ini. Aturan inferensi pakar dapat dibangkitkan melalui jaringan saraf atau aturan produksi dari pembelajaran statistik seperti dalam ACT-R. Sebuah pendekatan baru yang menjanjikan disebutkan bahwa penguatan kecerdasan mencoba untuk mencapai kecerdasan buatan dalam proses pengembangan evolusioner sebagai efek samping dari penguatan kecerdasan manusia melalui teknologi.
C. SEJARAH KECERDASAN BUATAN.
Pada awal abad 17, René Descartes mengemukakan bahwa tubuh hewan bukanlah apa-apa melainkan hanya mesin-mesin yang rumit. Blaise Pascal menciptakan mesin penghitung digital mekanis pertama pada 1642. Pada 19, Charles Babbage dan Ada Lovelace bekerja pada mesin penghitung mekanis yang dapat diprogram.
Bertrand Russell dan Alfred North Whitehead menerbitkan Principia Mathematica, yang merombak logika formal. Warren McCulloch dan Walter Pitts menerbitkan "Kalkulus Logis Gagasan yang tetap ada dalam Aktivitas " pada 1943 yang meletakkan fondasi untuk jaringan saraf.
Tahun 1950-an adalah periode usaha aktif dalam AI. Program AI pertama yang bekerja ditulis pada 1951 untuk menjalankan mesin Ferranti Mark I di University of Manchester(UK): sebuah program permainan naskah yang ditulis oleh Christopher Strachey dan program permainan catur yang ditulis oleh Dietrich Prinz. John McCarthy membuat istilah "kecerdasan buatan " pada konferensi pertama yang disediakan untuk pokok persoalan ini, pada 1956. Dia juga menemukan bahasa pemrograman Lisp. Alan Turingmemperkenalkan "Turing test" sebagai sebuah cara untuk mengoperasionalkan test perilaku cerdas. Joseph Weizenbaum membangun ELIZA, sebuah chatterbot yang menerapkan psikoterapi Rogerian.
Selama tahun 1960-an dan 1970-an, Joel Moses mendemonstrasikan kekuatan pertimbangan simbolis untuk mengintegrasikan masalah di dalam program Macsyma, program berbasis pengetahuan yang sukses pertama kali dalam bidang matematika. Marvin Minsky dan Seymour Papert menerbitkan Perceptrons, yang mendemostrasikan batas jaringan saraf sederhana dan Alain Colmerauer mengembangkan bahasa komputer Prolog. Ted Shortliffe mendemonstrasikan kekuatan sistem berbasis aturan untuk representasi pengetahuan dan inferensi dalam diagnosa dan terapi medis yang kadangkala disebut sebagai sistem pakar pertama. Hans Moravec mengembangkan kendaraan terkendali komputer pertama untuk mengatasi jalan berintang yang kusut secara mandiri.
Pada tahun 1980-an, jaringan saraf digunakan secara meluas dengan algoritme perambatan balik, pertama kali diterangkan oleh Paul John Werbos pada 1974. Pada tahun 1982, para ahli fisika seperti Hopfield menggunakan teknik-teknik statistika untuk menganalisis sifat-sifat penyimpanan dan optimasi pada jaringan saraf. Para ahli psikologi, David Rumelhart dan Geoff Hinton, melanjutkan penelitian mengenai model jaringan saraf pada memori. Pada tahun 1985-an sedikitnya empat kelompok riset menemukan kembali algoritme pembelajaran propagansi balik (Back-Propagation learning). Algoritme ini berhasil diimplementasikan ke dalam ilmu komputer dan psikologi. Tahun 1990-an ditandai perolehan besar dalam berbagai bidang AI dan demonstrasi berbagai macam aplikasi. Lebih khusus Deep Blue, sebuah komputer permainan catur, mengalahkan Garry Kasparovdalam sebuah pertandingan 6 game yang terkenal pada tahun 1997. DARPA menyatakan bahwa biaya yang disimpan melalui penerapan metode AI untuk unit penjadwalan dalam Perang Teluk pertama telah mengganti seluruh investasi dalam penelitian AI sejak tahun 1950 pada pemerintah AS.
Tantangan Hebat DARPA, yang dimulai pada 2004 dan berlanjut hingga hari ini, adalah sebuah pacuan untuk hadiah $2 juta dimana kendaraan dikemudikan sendiri tanpa komunikasi dengan manusia, menggunakan GPS, komputer dan susunan sensor yang canggih, melintasi beberapa ratus mil daerah gurun yang menantang.
D. SUDUT PANDANG KECERDASAN BUATAN
Pengertian kecerdasan buatan dapat di pandang dari berbagai sudut pandang, antara lain :
1. Sudut Pandang KecerdasanKecerdasan buatan mampu membuat mesin menjadi cerdas (berbuat seperti yang dilakukan manusia)
2. Sudut Pandang PenelitianKecerdasan buatan adalah studi bagaimana membuat komputer dapat melakukan sesuatu sebaik yang dilakukan manusia
3. Sudut Pandang Bisnis Kecerdasan buatan adalah kumpulan peralatan yang sangat powerful dan metodologis dalam menyelesaikan masalah bisnis
4. Sudut Pandang Pemrogram Kecerdasan buatan meliputi studi tentang pemrograman simbolik, problem solving, dan pencarian (searching)
E. DUA BAGIAN UTAMA KECERDSAN BUATAN (AI)
1. Basis Pengetahuan (knowledge base) berisi fakta-fakta, teori, pemikiran dan hubungan komponen satu dengan yang lainnya
2. Motor Inferensi (inference engine) Kemampuan menarik kesimpulan berdasar pengalaman. Berkaitan dengan representasi dan duplikasi proses tersebut melalui mesin
F. KONSEP KECERDASAN BUATAN
Ada beberapa konsep yang harus dipahami dalam kecerdasan buatan, diantaranya:
1. Turing Test Metode Pengujian Kecerdasan (Alan Turing).
2. Proses uji ini melibatkan seorang penanya (manusia) dan dua obyek yang ditanyai.
3. Pemrosesan Simbolik
4. Komputer semula didisain untuk memproses bilangan/angka-angka (pemrosesan numerik).
5. Sementara manusia dalam berpikir dan menyelesaikan masalah lebih bersifat simbolik, tidak didasarkan kepada sejumlah rumus atau melakukan komputasi matematis.
6. Sifat penting dari AI adalah bahwa AI merupakan bagian dari ilmu komputer yang melakukan proses secara simbolik dan non-algoritmik dalam penyelesain masalah.
7. Heuristic Suatu strategi untuk melakukan proses pencarian (search) ruang problem secara efektif, yang memandu proses pencarian yang kita lakukan di sepanjang jalur yang memiliki kemungkinan sukses paling besar.
8. Inferensi (Penarikan Kesimpulan) AI mencoba membuat mesin memiliki kemampuan berpikir atau mempertimbangkan (reasoning), termasuk didalamnya proses (inferencing) berdasarkan fakta-fakta dan aturan dengan menggunakan metode heuristik, dll
9. Pencocokan Pola (Pattern Matching) Berusaha untuk menjelaskan obyek, kejadian (events)atau proses, dalam hubungan logik atau komputasional.
G. TUJUAN KECERDASAN BUATAN
1. Membuat komputer lebih cerdas
2. Mengerti tentang kecerdasan
3. Membuat mesin lebih berguna
BAB 2
PEMBAHASAN
A. PENGENALAN UCAPAN (SPEECH RECOGNITION)
Speech Recognition merupakan salah satu bentuk dari kecerdasan buatan. Menurut Wikipedia, yang disebut kecerdasan buatan ialah kecerdasan yang ditambahkan kepada suatu sistem yang bisa diatur dalam konteks ilmiah. Jadi, dengan fitur pengenalan ucapan, sebuah sistem komputer dapat menerjemahkan perkataan yang diucapkan oleh manusia menjadi perintah program.
Bagaimana cara kerja pengenalan ucapan?
Pengenalan ucapan atau Speech Recognition (SR), adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan.Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah komando untuk melakukan suatu pekerjaan, misalnya penekanan tombol pada telepon genggam yang dilakukan secara otomatis dengan komando suara.
Alat pengenal ucapan, yang sering disebut dengan speech recognizer, membutuhkan sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan dalam komputer, dan kemudian digunakan sebagai basis data dalam mencocokkan kata yang diucapkan selanjutnya.
Pengenalan ucapan dalam perkembangan teknologinya merupakan bagian dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi menjadi dua, yaitu pengenalan pembicara (identifikasi suara berdasarkan orang yang berbicara) dan pengenalan ucapan (identifikasi suara berdasarkan kata yang diucapkan).
Jenis-jenis pengenalan ucapan
Berdasarkan kemampuan dalam mengenal kata yang diucapkan, terdapat 5 jenis pengenalan kata, yaitu:
1. Kata-kata yang terisolasi Proses pengidentifikasian kata yang hanya dapat mengenal kata yang diucapkan jika kata tersebut memiliki jeda waktu pengucapan antar kata.
2. Kata-kata yang berhubungan Proses pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih singkat.
3. Kata-kata yang berkelanjutan Proses pengidentifikasian kata yang sudah lebih maju karena dapat mengenal kata-kata yang diucapkan secara berkesinambungan dengan jeda waktu yang sangat sedikit, sehingga pengguna perangkat ini dapat mengucapkan kata-kata secara natural.
4. Kata-kata spontan Proses pengidentifikasian kata yang dapat mengenal kata/kalimat yang diucapkan secara spontan.
5. Verifikasi atau identifikasi suara Proses pengidentifikasian kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicara.
Perangkat keras yang dibutuhkan
1. Sound Card
2. Microphone
3. Computer/processor
B. SKEMA UTAMA DAN ALGORITMA SPEECH RECOGNITION
Terdapat 4 langkah utama dalam sistem pengenalan suara:
1. Penerimaan data input
2. Ekstraksi, yaitu penyimpanan data masukan sekaligus pembuatan databaseuntuk template.
3. Pembandingan / pencocokan, yaitu tahap pencocokan data baru dengan datasuara (pencocokan tata bahasa) pada template.
4. Validasi identitas pengguna.
1. Skema Speech Recogition
Secara umum, speech recognizer memproses sinyal suara yang masuk danmenyimpannya dalam bentuk digital. Hasit proses digitalisasi tersebut kemudiandikonversi dalam bentuk spektrum suara yang akan dianalisa denganmembandingkannya dengan template suara pada database sistem
2. Spektrum Suara
Sebelumnya, data suara masukan dipilah-pilah dan diproses satu per satu berdasarkanurutannya. Pemilahan ini dilakukan agar proses analisis dapat dilakukan secara paralel. Proses yang pertama kali dilakukan ialah memproses gelombang kontinuspektrum suara ke dalam bentuk diskrit. Langkah berikutnya ialah proses kalkulasiyang dibagi menjadi dua bagian:
a. Transformasi gelombang diskrit menjadi array data.
b. Untuk masing-masing elemen pada aiTay data, hitung "ketinggian"gelombang(frekuensi).Objek permasaiahan yang akan dibagi adalah masukan berukuran n, berupadata diskrit gelombang suara.
Ketika mengkonversi gelombang suara ke dalam bentuk diskrit, gelombangdiperlebar dengan cara memperinci berdasarkan waktu. Hal ini dilakukan agar prosesalgontma seianjutnya (pencocokan) lebih mudah diiakukan. Namun, efek buruknyaialah array of array data yang terbentuk akan lebih banyak.
Contoh Hasil konversi Sinyal Diskrit
Dari tiap elemen array data tersebut, dikonversi ke dalam bentuk bilangan biner. Data biner tersebut yang nantinya akan dibandingkan dengan template data suara.Proses divide and conquer:
a. Pilih sebuah angkaN, dimana N merupakan bilangan bulat kelipatan 2.Bilanganini berfungsi untuk menghitung jumlah elemen transformasi FFT.
b. Bagi dua data diskrit secara (dengan menerapkan algoritma divide and conquer)menjadi data diskrit yang lebih kecii berukuran N = N,.N2.
c. Objek data dimasukkan ke dalam table (sebagai elemen tabel).
d. Untuk setiap elemen data, dicocokkan dengan data pada template (pada datatemplate juga dilakukan pemrosesan digitaiisasi menjadi data diskrit, dengancara yang sama dengan proses digitaiisasi data masukan bam yang ingindicocokkan).
e. Setiap upa masalah disatukan kembali dan dianalisis secara keseluruhan,kecocokan dari segi tata bahasa dan apakah data yang diucapkan sesuai dengankata yang tersedia pada template data.
f. Verifikasi data. Jika sesuai, proses iebih lanjut, sesuai dengan aplikasi yangmengimplementasikan algoritma ini.
C. IMPLEMENTASI SPEECH RECOGNITION
1. Bidang komunikasi
a. Komando Suara
Komando Suara adalah suatu program pada komputer yang melakukan perintah berdasarkan komando suara dari pengguna. Contohnya pada aplikasi Microsoft Voice yang berbasis bahasa Inggris.
b. Pendiktean
Pendiktean adalah sebuah proses mendikte yang sekarang ini banyak dimanfaatkan dalam pembuatan laporan atau penelitian. Contohnya pada aplikasi Microsoft Dictation yang merupakan aplikasi yang dapat menuliskan apa yang diucapkan oleh pengguna secara otomatis.
c. Telepon
Pada telepon, teknologi pengenal ucapan digunakan pada proses penekanan tombol otomatis yang dapat menelpon nomor tujuan dengan komando suara.
2. Bidang kesehatan
Alat pengenal ucapan banyak digunakan dalam bidang kesehatan untuk membantu para penyandang cacat dalam beraktivitas. Contohnya pada aplikasi Antarmuka Suara Pengguna atauVoice User Interface (VUI) yang menggunakan teknologi pengenal ucapan.
3. Bidang militer
a. Pelatihan Penerbangan
Aplikasi alat pengenal ucapan dalam bidang militer adalah pada pengatur lalu-lintas udaraatau yang dikenal dengan Air Traffic Controllers (ATC) yang dipakai oleh para pilot untuk mendapatkan keterangan mengenai keadaan lalu-lintas udara seperti radar, cuaca, dan navigasi. Alat pengenal ucapan digunakan sebagai pengganti operator yang memberikan informasi kepada pilot.
b. Helikopter
Aplikasi alat pengenal ucapan pada helikopter digunakan untuk berkomunikasi lewat radio dan menyesuaikan sistem navigasi
.
D. KELEBIHAN DAN KEKURANGAN
Kelebihan:
1. Cepat: Teknologi ini mempercepat transmisi informasi dan umpan balik dari transmisi tersebut.
2. Mudah digunakan: Komando dapat dilakukan tanpa perangkat keras.
Kekurangan:
1. Rawan terhadap gangguan: Karena proses ini masih berbasis frekuensi, sulit untuk memisahkan gangguan/noise dari sinyal suara
2. Jumlah kata yang dapat dikenal terbatas: Hal ini disebabkan pengenal ucapan bekerja dengan cara mencari kemiripan dengan basis data yang dimiliki.
BAB III
KESIMPULAN
A. KESIMPULAN
Speech recognition merupakan salah satu jenis biometric recognition, yaitu proses komputer mengenali apa yang diucapkan seseorang berdasarkan intonasi suarayang dikonversikan ke dalam bentuk digital print. Pengenalan pola suara adalah salahsatu aplikasi yang berkembang saat ini. Sistem ini mengijinkan kita untuk berkomunikasi antara manusia dengan memasukkan data ke komputer. Salah satufungsinya ialah untuk meningkatkan efisiensi industri manufaktur, mengontrol mesindengan berbicara pada mesin itu.Algoritma yang diimplementasikan untuk masalh pengenalan suara ini adalahalgoritma divide and conquer. Proses awalnya ialah mengkonversi data spektrumsuara ke dalam bentuk digital dan mengubah dalam bentuk diskrit. Dari bentuk diskrititulah yang kemudian mengaplikasika algoritma divide and conquer untukmengoptimalkan waktu pencocokan (kompleksitas berkurang). Contoh aplikasi yangmenerapkan speech recognition antara lain Microsoft Voice dan Microsoft Dictation.
Daftar Pustaka:
Apolloni, Bruno, Harpri (2003). Neural Nets. Springer-Verlag. hlm. 3. ISBN 3540202277.
Baecker, Ronald M, Jonathan Grudin, William A. X. Buxton, Saul Greenberg (1995). Human-Computer Interaction : Toward the Year 2000 (Second Edition). Morgan Kauffman Publishers, Inc. hlm. 546. ISBN 1558602461.
Benesty, Jacob, M. Mohan Sondhi, dan Yiteng Huang (2008). Handbook of Speech Processing. Springer-Verlag. hlm. 6.ISBN 159904840X.
Jelinek, Frederick (1997). Statistical Methods For Speech Recognition. Massachusetts Institute of Technology. hlm. 17.ISBN 0262100665.
Waibel, Alex dan Kai-Fu Lee (1990). Readings in Speech Recognition. Morgan Kauffman Publishers, Inc. hlm. 1 & 267.ISBN 1558601244.





Comments
Post a Comment