Di era saat ini Natural Language Processing sangat dibutuhkan terutama di sektor bisnis, industri, kesehatan, pemerintahan dan pendidikan karena didalamnya akan ada informasi data. Biasanya data yang tersedia sebagian besar berbentuk teks, itulah mengapa Natural Language Processing (NLP) sangat penting dan berpeluang besar diberbagai sektor lainnya.
Komunikasi adalah hal yang paling penting dibutuhkan manusia sebagai makhluk sosial. Salah satu cabang Artificial Intelligence (Ai) ada yang berfokus pada pengolahan bahasa natural yaitu Natural Language Processing (NLP).
Ada banyak sekali terapan dari aplikasi dari NLP. Contohnya adalah Chatbot (aplikasi yang membuat user bisa seolah-olah melakukan komunikasi dengan computer). Lalu ada Stemming atau Lemmatization (pemotongan kata dalam bahasa tertentu menjadi bentuk dasar pengenalan fungsi setiap kata dalam kalimat).
Setelah itu ada Summarization (ringkasan dari bacaan), Translation Tools (menterjemahkan bahasa) dan aplikasi-aplikasi lain yang memungkinkan komputer mampu memahami instruksi bahasa yang di inputkan oleh user. Pemrosesan bahasa alami (NLP) adalah sub-bidang linguistik, ilmu komputer, teknik informasi, dan kecerdasan buatan yang berkaitan dengan interaksi antara komputer dan bahasa manusia (alami), khususnya cara memprogram komputer untuk memproses dan menganalisis sejumlah besar data bahasa alami
A. Sejarah NLP
Sejarah ini dimulai pada tahun 1950-an, meskipun telah ada penelitian NLP pada tahun-tahun sebelumnya. Pada tahun 1950, Alan Turing (bapak ilmu komputer) mempublikasikan artikel terkenalnya yang berjudul “Computing Machinery and Intelligence” yang di dalamnya Alan Turing mengusulkan tes yang sekarang disebut dengan Turing Test. Tes Turing adalah sebuah tes yang mengukur kemampuan mesin (dalam hal ini program komputer) untuk menunjukan perilaku cerdas.
Perbedaan (AI),(ML) DAN (NLP)?
Perbedaannya adalah AI ini bertujuan untuk menciptakan kecerdasan pada komputer atau mesin seperti manusia, sehingga mesin dapat melakukan tugas dan aktivitas seperti manusia.
Sedangkan mesin pembelajaran adalah bagian dari Kecerdasan Buatan. Pada dasarnya ada kumpulan algoritma untuk mengajar mesin untuk melakukan tugas-tugas seperti manusia dan itu juga tanpa atau dengan sedikit intervensi manusia.
Kemudian, NLP ini adalah subbidang Kecerdasan Buatan, yang menggunakan algoritma mesin pembelajaran. Untuk memecahkan masalah terkait Data Bahasa Alami seperti ekstraksi informasi, klasifikasi teks, dll
Pentingnya NLP
Adanya NLP membantu komputer untuk berkomunikasi dengan manusia dalam bahasanya sendiri dan membuat skala tugas-tugas yang terkait bahasa lainnya.
Misalnya, NLP memungkinkan komputer untuk membaca teks, mendengar ucapan, menafsirkannya, mengukur sentimen, dan menentukan bagian mana yang penting. Selanjutnya, saat ini mesin dapat menganalisis data berbasis bahasa lebih banyak dibandingkan manusia, tanpa rasa lelah dan dengan cara yang konsisten.
Cara Kerja NLP
Ada berbagai teknik dalam pemrosesan bahasa alamiah untuk ditafsirkan menjadi bahasa manusia. Dimulai dari metode statistik sampai pada pembelajaran mesin hingga pendekatan-pendekatan berbasis aturan dan algoritmik.Di sini juga memerlukan berbagai pendekatan yang luas karena data yang ada berbasis teks dan juga suara yang bervariasi, seperti halnya aplikasi praktis.
Tugas-tugas NLP
Tugas dasar meliputi tokenisasi dan parsing, lemmatization/stemming, part-of-speech tagging, deteksi bahasa, dan identifikasi hubungan semantik. Adapun tugas yang ada meliputi :
(1) Kategorisasi konten, dalam kategorisasi ini diharuskan meringkas dokumen berbasis linguistik, termasuk pencarian dan penyusunan indeks, pemberitahuan konten dan deteksi duplikasi.
(2) Penemuan dan pemodelan topik, makna dan tema yang akan ditangkap secara akurat dalam kumpulan teks, dan penerapan analitik tingkat lanjut ke teks, seperti pengoptimalan perkiraaan
(3) Ekstraksi kontekstual, akan secara otomatis menarik informasi terstruktur dari sumber berbasis teks.
(4) Analisis sentiment, mengidentifikasi suasana hati atau opini subjektif dalam jumlah yang besar teks, termasuk sentimen rata-rata dan penambangan opini.
(5) Konversi ujaran-ke-teks dan teks-ke-ujaran, Mentransformasi perintah suara ke dalam teks tertulis, dan sebaliknya.
(6) Perangkuman dokumen, secara otomatis menghasilkan sinopsis dalam kumpulan besar teks.
(7) Penerjemahan mesin, teks atau ujaran yang ada akan di terjemahkan secara otomatis
Contoh NLP Dalam Kehidupan Sehari-hari
Ada banyak sekali contoh NLP dalam kehidupan sehari-hari seperti, Melihat email di folder spam dan melihat kesamaan di baris subjek? Lalu melihat pemfilteran spam Bayesian, teknik NLP statistik yang membandingkan kata-kata dalam spam ke email yang valid untuk mengidentifikasi junk mail.
Selanjutnya NLP yang ada dalam kehidupan kita adalah menjelajahi situs web dengan menggunakan bilah pencarian internal, atau dengan memilih topik yang disarankan, entitas atau tag kategori? Tanpa sadar kita telah menggunakan metode NLP untuk penelusuran, pemodelan topik, ekstraksi entitas, dan kategorisasi konten.
Ilmu yang digunakan dalam NLP
Ada 7 disiplin ilmu yang ada pada NLP yaitu:
(1) Fonetik atau Fonologi, ilmu ini berhubungan dengan suara yang menghasilkan kata yang dapat dikenali. Ilmu ini dapat dipakai dalam aplikasiaplikasi speech-based system.
(2) Morfologi, ilmu ini berisi pengetahuan tentang kata dan bentuk, sehingga bisa dibedakan antara yang satu dengan yang lainnya. Contohnya seperti: membangunkan > Bangun (kata dasar) > mem (prefix) > kan (suffix).
(3) Sintaksis, ilmu ini berisi pengetahuan tentang urutan kata dalam pembentukan kalimat. Contohnya seperti, kalimat > (subyek, predikat) subyek > (determinan, katabenda) predikat > (katakerja, katabenda).
(4) Semantik, ilmu yang mempelajari arti suatu kata dan bagaimana arti tersebut membentuk suatu arti kata dari kalimat yang utuh. contohnya seperti, ayahku dating membawa buah tangan.
(5) Pragmatik, ilmu ini berisi pengetahuan tentang konteks kata/kalimat yang berhubungan erat keadaan atau situasi kata/kalimat tersebut dipakai. Contohnya seperti, ayah datang (diucapkan dengan nada datar), ayah datang! (diucapkan dengan nada tinggi), ayah datang? (diucapkan dengan tempo cepat).
(6) Discource Knowledge, ilmu yang berisi pengetahuan tentang hubungan antar kalimat, dengan cara melakukan pengenalan apakah suatu kalimat yang telah dikenali mempengaruhi kalimat selanjutnya. Contohnya seperti, ibu pergi ke pasar. Ia membeli makanan disana.
(7) World Knowledge, di dalamnya mencakup arti sebuah kata secara umum dan apakah arti khusus bagi suatu kata dalam suatu percakapan dengan konteks tertentu
Contoh Aplikasi NLP
(1) Text-based Application
Aplikasi yang melakukan pemrosesan terhadap teks tertulis. Contohnya seperti mencari topic tertentu dari buku yang ada di perpustakaan, mencari isi dari suatu berita atau artikel, mencari isi dari email
(2) Speech-based Application
Aplikasi yang melakukan prosesan dari bahasa lisan atau pengenalan suara
Contohnya seperti sistem otomatis pelayanan melalui telepon, kontrol suara pada peralatan elektronik dan aplikasi peningkatan kemampuan berbahasa
Contoh Aplikasi
(1) ELIZA – Aplikasi ini dibekali pengetahuan psikologi
(2) JUPITER – Aplikasi ini memberikan informasi cuaca
(3) ALVIN – Aplikasi yang mampu menjawab pertanyaan
(4) SEXPERT – Aplikasi yang dirancang untuk berbincang mengenai pendidikan seksual
Kenapa harus mendalami NLP
a. Tersedianya internet dengan jutaan dokumen
b. Teknologi yang dipakai human-friendly dan,
c. Pembangunan teknologi bahasa alami sangat terkait dengan bahasa yang digunakan di daerah/Negara tertentu.
Prospek NLP dalam dunia industri
Saat ini, perusahaan yang bergerak di setiap bidang harus dapat memanfaatkan apa yang berpotensi menjadi sumber aset penting. Namun menantang untuk diolah itulah mengapa natural language processing (NLP) prospek nya sangat tinggi namun tergantung juga pada kreatifitas.
Terlepas dari bidang yang ada , setiap bisnis saat ini bergantung pada jumlah besar informasi dalam teks. Sebagai contoh, sebuah firma hukum bekerja dengan sejumlah besar hasil penelitian, dokumen transaksi legal yang sudah lalu maupun yang masih berlangsung. Catatan-catatan, email korespondensi, serta informasi pemerintah dan referensi khusus dalam ukuran besar pula. Dikarenakan jenis-jenis informasi seperti tadi sebagian besar terdiri dari bahasa, NLP sangat dibutuhkan di dalamnya. Karena NLP dapat mengungkap pola, koneksi dan tren dari berbagai sumber data yang berbeda
Manfaat NLP
Pemrosesan Bahasa Alami atau Natural Language Processing NLP adalah komponen yang paling penting dalam text mining dan subbidang pada kecerdasan buatan (artificial intelligence/AI) dan komputasi linguistic. Ilmu ini mempelajari tentang bagaimana ‘memahami’ bahasa manusia alami. Dengan cara mengubah gambaran bahasa manusia (seperti dokumen teks) menjadi penyajian yang lebih formal (dalam bentuk data numerik dan sombolik).
Diharapkan nantinya lebih mudah untuk dimanupulasi oleh program komputer. Tujuan dari NLP sendiri adalah untuk melangkah melebihi manipulasi teks berbasis sintaks (yang sering kali disebut dengan ‘word counting’). Menjadi pemahaman yang benar dan memproses bahasa alami yang mempertimbangkan berbagai batasan semantik dan gramatikal dan juga konteks.
NLP juga telah sukses diterapkan pada berbagai pekerjaan melalui program-program komputer untuk memproses secara otomatis bahasa manusia yang sebelumnya hanya bisa dilakukan oleh manusia. Keberhasilan dan popularitas text mining sangat bergantung pada perkembangan NLP baik dalam prosses menghasilan maupun memahami bahasa manusia. NLP memungkinkan ekstraksi berbagai features dari teks tak-terstruktur .
Sumber : Buletin APTIKOM edisi Juli 2020
https://www.ictcs.info/view/31/Natural-Language-Processing
https://www.certybox.com/product/natural-language-processing/
https://centragama.com/nlp-super-sales/
https://www.blumeglobal.com/learning/machine-learning/
https://teknologi.id/tekno/5-manfaat-menakjubkan-dari-artificialintelligence-ai
https://pegus.digital/business-applications-of-nlp/
https://teknojurnal.com/beberapa-model-openai-lolos-beberapa-ujiuntuk-nlp/