Analisis Preprocessing untuk Text Mining pada konten e-mail Bahasa Indonesia

Kategori Penelitian	Penelitian Internal
Bidang	Rekayasa
Tgl Posting	2015-01-14 14:24:17.523
Judul	Analisis Preprocessing untuk Text Mining pada konten e-mail Bahasa Indonesia
Abstrak	Ekstraksi informasi pada email box perusahaan sangat berguna untuk pendukung keputusan perusahaan dalam mengetahui informasi dari client, parter dan steacholder. Tapi, proses ini membutuhkan proses pre-prosesing karena jenis data email berbentuk semi structured dengan konten berbentuk unstructured. Email termasuk semi structured karena data pengirim, subjek dan konten di pisahkan, layaknya tabel pada relasional. Umumnya Subjek pada email menjelaskan topik dari konten. Jadi, untuk melakukan ekstrasi informasi pada email dapat dilakukan hanya pada subjek, tapi, subjek tidak banyak mengandung informasi jika dibandingkan dengan konten email. Berdasarkan permasalahan tersebut Maka, dalam penelitian ini akan melakukan perbandingan akurasi dan performance dari proses preprocessing pada teks subjek email dengan teks konten email pada dokumen email Bahasa Indonesia. Proses stemming akan menggunakan stemmer untuk Bahasa Indonesia dengan algoritma Nazief & Andriani. Kamus kata dasar Bahasa Indonesia dan stopword list yang digunakan bersumber dari hasil penelitian oleh Nazief & Andriani. Hasil dari penelitian akan berguna untuk menentukan model yang dapat digunakan untuk proses preprocessing dokumen email box dalam Bahasa Indonesia.
Authors	GUSTI NGURAH MEGA NATA, S.Kom., M.T. (ketua)
Tgl Mulai	2015-03-04 20:52:00.000
Tgl Selesai	2015-05-21 23:59:00.000
Biaya	3300000
Sponsor	STMIK STIKOM Bali
Periode	1