Sistem Manajemen Dokumen: Pengorganisasian dan Temu Kembali Dokumen Artikel Ilmiah Elektronik

  • Urip T Setijohatmo Jurusan Teknik Komputer dan Informatika, Politeknik Negeri Bandung
  • Setiadi Rachmat Jurusan Teknik Komputer dan Informatika, Politeknik Negeri Bandung
  • Irwan Setiawan Jurusan Teknik Komputer dan Informatika, Politeknik Negeri Bandung
Keywords: document retrieval, similarity document, relevant document.

Abstract

Perkembangan teknologi jaringan dan bermunculannya mesin pencari (search engine) dilingkungan web, memungkinkan setiap orang untuk memperoleh informasi sebanyak-banyaknya dan menyimpannya pada media penyimpanan (baik pada komputer standalone atau yang terhubung ke suatu jaringan).  Hal ini menimbulkan masalah baru pada saat pencarian kembali dokumen yang dibutuhkan karena pada umumnya dokumen elektronik yang telah didapat tidak disimpan dengan pengorganisasian file yang baik. Sehingga semakin banyak dokumen yang tersimpan akan menyebabkan semakin sulit pula mencari informasi yang spesifik pada suatu dokumen yang telah dimiliki. Hal ini disebabkan oleh masih minimnya search engine di lingkungan offline/standalone dan intranet, dimana arsitekturnya dan kebutuhannya berbeda dengan Web. Sehingga memanfaatkan search engine untuk Web tidak efektif bila diimplementasikan untuk lingkungan offline/standalone dan intranet. Atas dasar hal-hal tersebut, maka perlu dikembangkan suatu mekanisme pengorganisasian dan temu kembali dokumen dalam lingkungan intranet dalam hal ini di lingkungan Politeknik Negeri Bandung. Sistem yang akan dikembangkan untuk itu melingkupi pengorganisasian, mekanisme document aquisition dan memiliki fasilitas pencarian berdasarkan kriteria tertentu. Proses pencarian atau penelusuran informasi (information retrieval) akan menghasilkan dokumen-dokumen yang relevan dengan keywords yang diminta. Untuk membantu user mendapatkan suatu dokumen yang dicari diantara dokumen-dokumen yang relevan tersebut ditampilkan abstraksi dan similar documents dari suatu dokumen yang sedang dipilih. Karenanya mekanisme penyimpanan mempersiapkan relevansi dokumen dan similaritas dokumen. Mendahului mekanisme tersebut, dipersiapkan ekstraksi dokumen menjadi term-term melalui tokenizing, minimasi jumlah token yang dihasilkan dan stemming. Jika document relevance berkaitan dengan keseringan kemunculam term pada dokumen yang merepresentasikan kekentalannya pada dokumen, document similarity berkenaan dengan kemiripan topik sehingga kesamaan semantik dipertimbangkan. Sistem yang dikembangkan menggunakan tools Java Netbeans 6.5.1 dengan dukungan java database yang disediakan. Penggunaan tools ini cukup memadai dikarenakan dalam penanganan database tidak memerlukan fitur-fitur DBMS seperti concurrency control dan integrity constraint.

Downloads

Download data is not yet available.
Published
2010-10-27