Latar Belakang Implementasi Kombinasi Model Ruang Vektor Dan Model Probabilistik Pada Sistem Temu Balik Informasi
Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan
menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari
informasi. Salah satu cara untuk mendapatkan informasi yang akurat dan relevan adalah
dengan menggunakan sistem temu balik informasi. Sistem ini membuat perhitungan-
perhitungan untuk menentukan apakah sebuah informasi relevan dengan kebutuhan
penggunanya. Ada dua buah jenis perhitungan matematis/model yang sering digunakan, yaitu
model ruang vektor dan model probabilistik.
Walaupun kedua model tersebut umum digunakan, tapi performa yang ditunjukkan oleh
kedua model tersebut tidak terlalu memuaskan. Untuk itulah, model lain diperlukan untuk
mendapatkan performa lebih baik. Salah satu cara untuk mendapatkan model lain itu adalah
dengan melakukan kombinasi antara model-model yang sudah ada, dalam hal ini model ruang
vektor dan model probabilistik.
Metode ruang vektor mengibaratkan query dan dokumen sebagai sebuah vektor n-dimensi
yang tiap dimensinya diwakili oleh satu kata pada query. Relevansi tertinggi ditentukan
menurut vektor yang paling mendekati dengan vektor query. Gambaran umum sistem temu
balik informasi yang menggunakan model ruang vektor dapat dilihat pada Gambar I. 1.
Di sisi lain, model probabilistik adalah model yang menggunakan perhitungan matematis
berupa peluang terhadap relevansi query pada dokumen. Intinya adalah memperkirakan
peluang relevansi sebuah dokumen terhadap query yang diberikan. Ada beberapa model yang
dikembangkan berdasarkan perhitungan probabilistik, di antaranya model probabilistik dasar,
Okapi BM25 dan Binary Independence Retrieval (BIR).
Model ruang vektor dan model probabilistik sendiri memiliki kelebihan dan kekurangannya
masing-masing. Kelebihan dan kekurangan tersebut menjadi pertimbangan tersendiri dalam
melakukan kombinasi model yang akan dilakukan. Kombinasi terhadap kedua model tersebut
harus menghapus kekurangan yang dimiliki namun tidak menghilangkan kelebihan
sebelumnya.
Cara lain untuk meningkatkan performa sistem temu balik informasi adalah dengan
menggunakan relevance feedback. Ide dari relevance feedback ini adalah mengambil hasil
dari sebuah query dan menggunakan informasi dari hasil tersebut untuk membentuk query
baru yang bisa menghasilkan dokumen dengan tingkat relevansi yang lebih akurat[INS07].
Informasi tersebut bisa berupa kata yang mengarah kepada hasil yang relevan, atau kata yang
justru mengarah kepada hasil yang tidak relevan dengan query. Untuk mencapai tingkat
akurasi yang lebih baik, selain menggunakan relevance feedback kedua model tersebut juga
bisa digabungkan. Penggabungan ini bisa berupa penggabungan hasil perhitungan dari kedua
model tersebut atau penggabungan perhitungan dari kedua model tersebut.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah disampaikan, maka masalah yang ingin ditangani
dalam tugas akhir ini adalah bagaimana meningkatkan kemampuan sistem temu balik
informasi dengan melakukan penggabungan antara model ruang vektor dan model-model
probabilistik yang telah dijelaskan pada bagian sebelumnya. Masalah lain adalah model apa
yang memiliki performa lebih baik untuk digunakan pada sistem temu balik informasi.
Kata Kunci : sistem temu balik informasi, model ruang vektor, model probabilistik,
kombinasi, performa.
19.16
Unknown
Comment With Facebook!
4.5 | Reviewer: Unknown | ItemReviewed: Implementasi Kombinasi Model Ruang Vektor Dan Model Probabilistik Pada Sistem Temu Balik Informasi
Rating: