Bahasa sebagai bagian yang penting dari kehidupan manusia,
dalam bentuk tulis dapat merupakan catatan dari pengetahuan yang didapat oleh
umat manusia dari satu generasi ke generasi berikutnya sedangkan dalam bentuk
lisan merupakan sarana komunikasi antar individu dalam suatu masyarakat.
Bahasa dapat dibedakan menjadi 2 yaitu bahasa alami dan
bahasa buatan. Bahasa alami adalah bahasa yang digunakan manusia untuk
berkomunikasi, misalnya bahasa daerah, bahasa inggris, jepang, dan sebagainya.
Sedangkan Bahasa buatan merupakan bahasa yang sengaja dibuat secara khusus
untuk kebutuhan tertentu, seperti bahasa-bahasa pemrograman komputer atau
bahasa pemodelan.
Pengolahan Bahasa Alami
Pengolahan Bahasa Alami (PBA) atau Natural Language
Processing (NLP) merupakan cabang dari ilmu komputer dan linguistik yang
membahas tentang interaksi antara bahasa manusia (bahasa alami) dan komputer.
NLP juga sering disebut sebagai cabang dari kecerdasan buatan (Artificial
Inteligence) dan memiliki kajian yang berhubungan dengan linguistik
komputasional.
Sedikit melihat sejarahnya, pengolahan
bahasa alami dimulai pada tahun 1950-an. Bapak ilmu komputer, Alan Turing, menerbitkan
sebuah artikel. Di dalam artikel terkenalnya ini Alan Turing mengusulkan sebuah
tes yang sekarang dikenal Turing Test. Sebuah tes yang akan mengukur kemampuan
mesin (program komputer) untuk menunjukan kecerdasannya. Ilustrasinya, seorang
juri (manusia) akan melakukan percakapan dengan manusia dan mesin yang
melakukan tes tersebut. Peserta akan dipisahkan satu sama lain. Mesin tersebut
akan dinyatakan lulus tes jika juri tidak bisa membedakan antara manusia dan
mesin.
Tujuan dari bidang bahasa alami ini adalah untuk melakukan
proses pembuatan model komputasi dari bahasa manusia, sehingga antara manusia
dan komputer dapat melakukan interaksi dengan perantaranya bahasa alami. Sebuah
sistem bahasa alami (Natural Language System) harus memperhatikan pengetahuan
dari bahasa itu sendiri baik dari segi kata yang digunakan, apa arti dari
sebuah kata, fungsi kata dari sebuah kalimat dan bagaimana dari kata-kata
tersebut dapat membentuk sebuah kalimat.
Tingkatan Pengolahan Bahasa Alami
Secara singkat pengolahan bahasa alami mengenal beberapa
tingkat pengolahan, yaitu :
1. Fonetik dan Fonologi
2. Morfologi
3. Sintaksis
4. Semantik
5. Pragmatik
6. Discourse Knowledge
7. World Knowledge
2. Morfologi
3. Sintaksis
4. Semantik
5. Pragmatik
6. Discourse Knowledge
7. World Knowledge
Komponen Utama Bahasa Alami
Pengolahan Bahasa Alami terdiri dari tiga bagian utama,
yaitu:
1. Parser
Suatu sistem yang mengambil kalimat input bahasa alami dan menguraikannya ke dalam beberapa bagian gramatikal (kata benda, kata kerja, kata sifat, dan lain-lain).
2. Sistem Representasi Pengetahuan
Suatu sistem yang menganalisis output parser untuk menentukan maknanya.
3. Output Translator
Suatu terjemahan yang merepresentasikan sistem pengetahuan dan melakukan langkah-langkah yang bisa berupa jawaban atas bahasa alami atau output khusus yang sesuai dengan program komputer lainnya.
Suatu sistem yang mengambil kalimat input bahasa alami dan menguraikannya ke dalam beberapa bagian gramatikal (kata benda, kata kerja, kata sifat, dan lain-lain).
2. Sistem Representasi Pengetahuan
Suatu sistem yang menganalisis output parser untuk menentukan maknanya.
3. Output Translator
Suatu terjemahan yang merepresentasikan sistem pengetahuan dan melakukan langkah-langkah yang bisa berupa jawaban atas bahasa alami atau output khusus yang sesuai dengan program komputer lainnya.
Aplikasi Pengolahan Bahasa Alami
Secara umum, Jenis aplikasi yang bisa dibuat dalam bidang
ilmu NLP terbagi dua, yaitu text-based application dan dialogue-based
application.
Text-based application adalah segala macam aplikasi
yang melakukan proses terhadap teks tertulis seperti misalnya dokumen, e-mail,
buku, dan sebagainya.
Beberapa jenis aplikasi NLP yang berbasis teks:
1. Programs for Classifying and
Retrieving Documents by Content
Program yang mampu mengklasifikasi dan mengambil isi dari suatu dokumen berdasarkan kontennya. Seperti spam filtering (pemfilteran pesan sampah), language identification (identifikasi bahasa), dan lain-lain.
Program yang mampu mengklasifikasi dan mengambil isi dari suatu dokumen berdasarkan kontennya. Seperti spam filtering (pemfilteran pesan sampah), language identification (identifikasi bahasa), dan lain-lain.
Spam Filtering
|
2. Machine Translation
Program yang mampu mentranslasi kalimat baik berupa teks maupun suara dari satu bahasa alami ke bahasa lainnya. Contoh: Google Translate.
Google Translate
|
Dialogue-based application idealnya melibatkan bahasa
lisan atau pengenalan suara, akan tetapi bisa juga memasukan interaksi dialog
dengan mengetikkan teks pertanyaan melalui keyboard.
Beberapa jenis aplikasi NLP yang berbasis dialog:
1. Intelligent Personal
Assistant
Perangkat lunak yang mampu melakukan tugas-tugas dan jasa berdasarkan inputan dari pengguna, lokasi, dan memiliki kemampuan untuk mengakses informasi dari berbagai sumber online (seperti cuaca, keadaan lalu lintas, berita, saham, dll). Contohnya adalah Siri pada produk-produk Apple dan S-Voice pada produk-produk seluler Samsung.
Perangkat lunak yang mampu melakukan tugas-tugas dan jasa berdasarkan inputan dari pengguna, lokasi, dan memiliki kemampuan untuk mengakses informasi dari berbagai sumber online (seperti cuaca, keadaan lalu lintas, berita, saham, dll). Contohnya adalah Siri pada produk-produk Apple dan S-Voice pada produk-produk seluler Samsung.
|
Siri Apple
|
2. Chatbot
Chatbot adalah program komputer yang didesain untuk mensimulasikan sebuah percakapan cerdas dengan satu atau lebih pengguna manusia melalui inputan suara atau teks, utamanya digunakan untuk percakapan kecil. Contoh: Cleverbot, SimSimi, dan Begobet.
SimSimi
|
Sumber :
http://windyandani.blogspot.com/2016/12/pengolahan-bahasa-alami-natural.html