Kamis, 18 Februari 2010

FUNGSI KATA/ISTILAH DI DALAM BAHASA ALAMIAH SEBAGAI ACCESS POINT DALAM KEBERHASILAN PROSES PENELUSURAN INFORMASI BERBASIS TEKS

Abstrak
Temu balik informasi atau dokumen adalah inti atau sari dari seluruh kegiatan yang ada di perpustakaan. Keberhasilan proses temu balik suatu informasi sangat tergantung pada proses penentuan subyek yang pilih oleh seorang pengolah informasi (pengindeks) untuk pemakai informasi. Ketepatan pemilihan subyek melalui kata atau istilah yang tepat yang disesuaikan dengan kemampuan menerjemahkan, menganalisa dan merangkum isi suatu dokumen dengan kemungkinan pemilihan kata atau istilah oleh pemakai informasi harus tepat.Seorang pengindeks harus mampu memilih kata atau istilah yang baku dan umum dipakai oleh pemakai informasi, hingga beberapa kata atau istilah yang digunakan oleh beberapa penelusur informasi akan tetap bisa menelusur ke dokumen atau informasi yang diinginkan.

Pendahuluan
Temu balik informasi atau dokumen adalah inti atau sari dari seluruh kegiatan yang ada di perpustakaan. Keberhasilan proses temu balik suatu informasi sangat tergantung pada proses penentuan subyek yang pilih oleh seorang pengolah informasi (pengindeks) untuk pemakai informasi. Ketepatan pemilihan subyek melalui kata atau istilah yang tepat yang disesuaikan dengan kemampuan menerjemahkan, menganalisa dan merangkum isi suatu dokumen dengan kemungkinan pemilihan kata atau istilah oleh pemakai informasi harus tepat. Atau paling tidak mendekati tepat, sehingga kecil kemungkinannya suatu informasi atau dokumen tidak ditemukan. Seorang pengolah informasi dalam hal ini adalah pengindeks harus mampu memilih kata atau istilah yang baku dan umum dipakai oleh pemakai informasi, hingga beberapa kata atau istilah yang digunakan oleh beberapa penelusur informasi akan tetap bisa menelusur ke dokumen atau informasi yang diinginkan.
Proses temu balik dikatakan berhasil jika informasi tersebut dapat ditemukan dalam waktu yang singkat dan cepat dengan melalui tahapan atau proses yang singkat dan cepat pula. Dalam menelusur suatu informasi atau dokumen, seseorang akan merasa senang dan puas jika dalam waktu 15 menit ia berhasil menemukannya. Dan akan bertambah senang dan puas lagi jika ia berhasil menemukan informasi atau dokumen tersebut dalam 10 menit, 5 menit atau bahkan 2 menit. Kecepatan dan ketepatan itu akan semakin nyata saat teknologi informasi turut aktif menyertainya. Kehadiran komputer dalam sistem temu balik informasi atau dokumen, semakin menambah keragaman dan kemudahan dalam proses penelusuran.

Pembahasan
Pendapat Muddamalle yang dikutip oleh Hasugian dalam artikel berjudul Penggunaan Bahasa Alamiah dan Kosa Kata Terkontrol Dalam Sistem Temu Kembali Informasi Berbasis Teks dinyatakan bahwa bahasa dan atau kosa kata (vocabulary) memegang peranan yang sangat penting dalam efektifitas dan efisiensi penelusuran pada suatu sistem temu kembali informasi. Kegiatan penelusuran hanya dapat berlangsung bila menggunakan kosa kata, sebab kosa kata inilah yang digunakan sebagai alat (tools) penelusuran untuk menemukan dokumen yang diinginkan. Dalam sistem temu kembali informasi, kosa kata itu disebut dengan indeks, yang dapat berupa indeks subjek, pengarang, judul, maupun thesaurus.
Dua pendekatan penelusuran yang biasa digunakan dalam sistem temu kembali informasi adalah bahasa alami (natural language), dan kosa kata terkontrol (controlled vocabulary). Studi tentang efektifitas dan efisiensi penelusuran menggunakan dua pendekatan ini telah lama dilakukan. Banyak database yang telah dibangun untuk digunakan sebagai sarana penelusuran eksperimen dalam rangka pembuktian efektifitas dan efisiensi dari kedua pendekatan tersebut.
Penggunaan bahasa alamiah (natural language) kontra kosa kata terkontrol (controlled vocabulary) dalam sistem temu kembali informasi, dimulai dengan penekanan kepada popularitas pengindeksan istilah berdasarkan judul (title term indexing). Kosa kata terkontrol atau controlled vocabulary lebih dominan digunakan dalam penelusuran, terutama digunakan untuk menemukan cantuman bibliografi dalam katalog berklasifikasi di perpustakaan. Sedangkan penelusuran berdasarkan bahasa alamiah yang biasa dikenal dengan penelusuran dengan teks bebas (free-text searching), digunakan ketika komputer sudah mulai digunakan dalam sistem temu kembali informasi.
Berbagai penelitian dan percobaan berkenaan dengan kedua pendekatan tersebut. Dan kesimpulan akhir dari beberapa penelitian tentang penelusuran dengan teks bebas adalah penelusuran dengan teks bebas bisa seefektif penelusuran menggunakan controlled vocabulary, asalkan dilakukan oleh seseorang yang memiliki pengalaman dalam penelusuran. Penelusuran dengan teks bebas bisa lebih efektif, sebab ada kalanya penelusuran menggunakan controlled vocabulary mengorbankan ketepatan dalamkemungkinan mencapai kemudahan. Secara keseluruhan, temu kembali teks bebas (free- text retrieval) dengan menggunakan pendekatan bahasa alamiah menghasilkan perolehan (recall) yang tinggi dengan ketepatan (precision) yang rendah, dari pada menggunakan pendekatan controlled vocabulary.

Sistem Temu Kembali Informasi Berbasis Teks
Sistem temu kembali informasi adalah suatu proses untuk mengidentifikasi, kemudian memanggil (retrieve) suatu dokumen dari suatu simpanan (file), sebagai jawaban atas pemintaan informasi. Pengertian lain menyatakan bahwa pada sistem temu kembali informasi terkandung sejumlah kegiatan yang meliputi proses penyimpanan, penyediaan representasi, identifikasi serta pencarian atau penelusuran dokumen yang relevan pada suatu database, dalam rangka memenuhi kebutuhan informasi dari pengguna. Dari sekian banyak sistem temu kembali yang ada,salah satu diantaranyya adalah sistem temu kembali informasi berbasis teks.
Dalam sistem temu kembali berbasis teks didesain untuk memberi suatu kawasan titik akses (access points) kepada suatu database dari informasi yang relatif tidak terstruktur, yang biasa dikenal dengan teks bebas. Oleh karena itu, kegiatan free-text search dapat dilakukan dengan menggunakan bahasa alamiah (natural language) dari dokumen yang berbentuk teks yang tersimpan dalam suatu database. Hal ini sangat menolong penelusur pemula yang tidak mampu menelusur dengan menggunakan bahasa indeks (controlled language) yang dibuat oleh pengindeks, seperti halnya thesaurus atau tajuk subyek tertentu.
Dalam sistem temu kembali berbasis teks, terdapat sejumlah fasilitas yang dapat digunakan untuk: pertanyaan atau bahasa perintah (query or command language); formulasi pertanyaan Boolean (Boolean query formulation); pemurnian penelusuran (search refinement); pemendekan/pemotongan dan penelusuran rentetan teks (truncation and text string searching); daftar kata tak terpakai dalam penelusuran (stop list or common word list); thesaurus/pendukung perbendaharaan kosa kata (thesaurus/vocabulary support); kedekatan penelusuran (proximity searching); pembatasan penelusuran dengan ruas (limiting searching by field); dan penelusuran kawasan numerik (numeric range searching). Sejumlah fasilitas yang disebutkan di atas sangat diperlukan untuk melakukan penelusuran pada suatu database. Kelengkapan fasilitas ini tentu sangat mempengaruhi keefektifan sistem temu kembali informasi, yang tentu akan berdampak kepada tingkat ketepatan (precision) dalam penelusuran.
Menurut Lee Pao yang dikutip oleh Hasugian, efektifitas dari suatu sistem temu kembali informasi adalah kemampuan dari sistem itu untuk memanggil berbagai dokumen dari suatu basis data sesuai dengan permintaan pemakai informasi. Efektifitas dari sistem temu kembali informasi tersebut dapat diukur. Ada dua hal penting yang biasanya digunakan dalam mengukur kemampuan suatu sistem temu kembali informasi yaitu rasio atau perbandingan dari perolehan (recall), dan ketepatan (precicion).

Pengindeksan dan Bahasa Indeks Dalam Sistem Temu Kembali Informasi
Salah satu faktor yang berpengaruh terhadap sistem temu kembali ialahpengindeksan dokumen. Pengindeksan (indexing) mencakup proses pencatatan ciri- ciri dokumen, analisis isi, klasifikasi maupun pembuatan entri ke dalam bahasa indeks. Tujuan pengindeksan ialah untuk memungkinkan ditemukannya dokumen yang relevan
dengan pertanyaan (query) dengan tepat. Informasi dalam indeks adalah cantuman dari berbagai atribut yang diharapkan dapat digunakan sebagai dasar pencarian dokumen. Jika
atribut tersebut berupa subjek, maka indeks yang mewakilinya disebut sebagai indeks
subjek. Sedangkan bila atribut tersebut berupa pengarang, maka indeks yang mewakilinya disebut sebagai indeks pengarang. Umumnya kegiatan pengindeksan adalah berupa pengindeksan subjek, namun dalam kenyataannya di perpustakaan indeks subjek dan pengarang digunakan secara bersamaan dalam sistem temu kembali.
Indeks di perpustakaan berfungsi sebagai sarana atau kunci yang menunjukkankepada penelusur dokumen- dokumen yang potensial relevan dengan permintaannya. Sarana itu sering disebut sebagai wakil dari dokumen yang dimiliki, yaitu berupa katalog perpustakaan. Dengan demikian fungsi indeks pada database maupun perpustakaan pada prinsipnya adalah sama yaitu sebagai sarana temu kembali. Tujuan utama dari pengindeksan ialah untuk membentuk representasi dari dokumen dalam bentuk yang sesuai untuk dicantuman dalam berbagai tipe database. Indeks sebagai representasi dari dokumen diharapkan dapat menggambarkan isi atau subjek yang terkandung di dalam dokumen tersebut, sehingga dapat ditemukan kembali melalui istilah (index term) yang digunakan.
Dua jenis bahasa indeks yaitu bahasa alamiah (natural language) dan kosa kata terkontrol (controlled vocabulary). Bahasa alamiah adalah bahasa dari dokumen yang diindeks. Biasanya bahasa tersebut merupakan bahasa yang tidak terkendali (uncontrolled vocabulary). Bahasa alamiah ini umum digunakan dalam komunikasi dan penulisan ilmiah, yang banyak dipakai oleh pengarang. Sedangkan kosa kata terkontrol dapat berupa indeks subjek, pengarang, judul maupun thesaurus.
Dalam bahasa pengindeksan kosa kata terkontrol seperti thesaurus, istilah yangdigunakan untuk menyatakan kandungan atau isi suatu dokumen telah dibakukan dalam suatu daftar indeks yang disusun secara alfabetis. Sedangkan pengindeksan bahasa alamiah adalah pengindeksan yang dilakukan pada semua istilah baik dari judul, abstrak, maupun dari teks lengkap (full text) dokumen, terkecuali stop word atau daftar kata umum yang tidak digunakan dalam penelusuran. Semua istilah indeks yang dihasilkan adalah bergantung kepada bahasa dokumen itu sendiri, dan semuanya itu dapat merupakan representasi dari dokumen itu. Mengingat volume pengindeksan dalam bahasa alamiah ini sangat besar, maka biasanya dilakukan oleh komputer. Bahasa alamiah dan kosa kata terkontrol adalah dua bahasa hasil daripengindeksan yang sama -sama dapat dipergunakan sebagai representasi dokumen. Kedua bahasa pengindeksan tersebut digunakan pada waktu pemasukan (input) data ke database, dan akan digunakan juga pada waktu pencarian/penelusuran (output) informasi dari database.

Kesimpulan
Ketepatan pemilihan subyek melalui kata atau istilah yang tepat yang disesuaikan dengan kemampuan menerjemahkan, menganalisa dan merangkum isi suatu dokumen dengan kemungkinan pemilihan kata atau istilah oleh pemakai informasi harus tepat. Atau paling tidak mendekati tepat, sehingga kecil kemungkinannya suatu informasi atau dokumen tidak ditemukan.
Dalam sistem temu kembali informasi, kosa kata itu disebut dengan indeks, yang dapat berupa indeks subjek, pengarang, judul, maupun thesaurus. Bahasa dan atau kosa kata (vocabulary) memegang peranan yang sangat penting dalam efektifitas dan efisiensi penelusuran pada suatu sistem temu kembali informasi. Salah satu faktor yang berpengaruh terhadap sistem temu kembali ialah pengindeksan dokumen. Kosa kata dalam indeks di perpustakaan berfungsi sebagai sarana atau kunci yang menunjukkankepada penelusur dokumen- dokumen yang potensial relevan dengan permintaannya. Sarana itu sering disebut sebagai wakil dari dokumen yang dimiliki, yaitu berupa katalog perpustakaan.
Dengan demikian fungsi indeks pada database maupun perpustakaan pada prinsipnya adalah sama yaitu sebagai sarana temu kembali. Tujuan utama dari pengindeksan ialah untuk membentuk representasi dari dokumen dalam bentuk yang sesuai untuk dicantuman dalam berbagai tipe database. Indeks sebagai representasi dari dokumen diharapkan dapat menggambarkan isi atau subjek yang terkandung di dalam dokumen tersebut, sehingga dapat ditemukan kembali melalui istilah (index term) yang digunakan.


DAFTAR PUSTAKA
1.Hasugian. Jonner. Penggunaann Bahasa Alamiah dan Kosa Kata Terkontrol Dalam Sistem Temu Kembali Informasi Berbasis Teks. http://library.usu.ac.id/download/lib/perpus-jonner7.pdf yang diakses pada Senin 1 Juni 2009 pukul 10.45 WIB
2.Somadikarta, Lily K. Dasar-dasar Analisis Subyek Untuk Pengindeksan Subyek Dokumen. Jakarta: FSUI, 1982
3.Leide, John E. Pedoman Penyusunan Tesaurus. Yogyakarta: Sunan Kalijaga Press, 2002. Yang diterjemahkan oleh Labibah.
4.Santoso, Budi. Evaluasi Bahasa Alami Vs Boolean Query: Sebuah Perbandingan dari pendayagunaan sistem temu kembali informasi. http://kangbudhi.wordpress.com/2007/10/18/evaluasi-bahasa-alami-vs-boolean-query-sebuah-perbandingan-dari-pendayagunaan-sistem-temu-kembali-informasi/ yang diakses pada Sabtu 6 Juni 2009 pukul 10.38 WIB.

Tidak ada komentar:

Posting Komentar