Mesin
pencari atau Search engine adalah program
komputer yang dirancang untuk melakukan pencarian atas berkas-berkas
yang tersimpan dalam layanan www, ftp,
publikasi
milis, ataupun news group dalam sebuah ataupun sejumlah
komputer peladen
dalam suatu jaringan. Search engine merupakan perangkat
pencari informasi dari dokumen-dokumen yang tersedia. Hasil pencarian umumnya
ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat
akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits.
Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam
jenis berkas seperti halaman situs web, gambar, ataupun jenis-jenis berkas
lainnya. Beberapa mesin pencari juga diketahui melakukan pengumpulan informasi
atas data yang tersimpan dalam suatu basisdata
ataupun direktori web.
Sebagian
besar mesin pencari dijalankan oleh perusahaan swasta yang menggunakan
algoritma kepemilikan dan basisdata tertutup, di antaranya yang paling populer adalah Google (MSN Search
dan Yahoo!).
Telah ada beberapa upaya menciptakan mesin pencari dengan sumber
terbuka (open source), contohnya adalah Htdig, Nutch, Egothor dan OpenFTS.[1]
Sejarah
Saat
awal perkembangan internet, Tim
Berners-Lee membuat sebuah situs web yang berisikan daftar situs web
yang ada di internet melalui peladen web CERN. Sejarah yang
mencatat sejak tahun 1992 masih ada hingga kini.[2]
Dengan semakin banyaknya situs web yang aktif membuat daftar ini tidak lagi
memungkinkan untuk dikelola oleh manusia. Utilitas pencari yang pertama kali
digunakan untuk melakukan pencarian di internet
adalah Archie yang berasal dari kata "archive" tanpa
menggunakan huruf "v".[3]
Archie dibuat tahun 1990 oleh Alan Emtage, Bill Heelan dan J. Peter Deutsch,
saat itu adalah mahasiswa ilmu komputer Universitas McGill, Amerika
Serikat. Cara kerja program tersebut adalah mengunduh daftar
direktori serta berkas yang terdapat pada layanan ftp publik (anonim)
kemudian memuatnya ke dalam basisdata yang memungkinkan pencarian.
Mesin
pencari lainnya seperti Aliweb, muncul di 1993 dan
masih berjalan hingga saat ini. Salah satu mesin pencari pertama yang sekarang
berkembang menjadi usaha komersial yang cukup besar adalah Lycos, yang dimulai di Carnegie Mellon University sebagai proyek
riset di tahun 1994.
Segera
setelah itu, banyak mesin pencari yang bermunculan dan bersaing memperebutkan
popularitas. Termasuk di antaranya adalah WebCrawler, Hotbot, Excite, Infoseek, Inktomi, dan AltaVista. Masing-masing
bersaing dengan menambahkan layakan-layanan tambahan seperti yang dilakukan
oleh Yahoo.
Tahun
2002 Yahoo! mengakuisisi Inktomi, setahun kemudian
mengakuisisi AlltheWeb dan Altavista kemudian
meluncurkan mesin pencari sendiri yang didasarkan pada teknologi gabungan dari
mesin-mesin pencari yang telah diakuisisinya serta memberikan layanan yang
mengutamakan pencarian Web daripada layanan-layanan lainnya.
Di
bulan desember 2003, Orase menerbitkan versi
pertama dari teknologi pencari waktu-riilnya. Mesin ini memiliki banyak fungsi
baru dan tingkat unjuk kerja yang jauh lebih baik.
Mesin
pencari juga dikenal sebagai target investasi internet
yang terjadi pada akhir tahun 1990-an. Beberapa perusahaan mesin pencari yang masuk ke dalam
pasar saham diketahui mencatat keuntungan besar. Sebagian lagi sama sekali
menonaktifkan layanan mesin pencari, dan hanya memasarkannya pada edisi-edisi enterprise
saja, contoh Northern Light sebelumnya
diketahui merupakan salah satu perintis layanan mesin pencari di internet.
Buku
Osmar R. Zaïane From Resource
Discovery to Knowledge Discovery on the Internet menjelaskan
secara rinci sejarah teknologi
mesin pencari sebelum munculnya Google. Mesin-mesin pencari lainnya
mencakup a9.com, AlltheWeb, Ask Jeeves, Clusty, Gigablast,
Teoma, Wisenut, GoHook, Kartoo, dan Vivisimo.
Google
Google
muncul pada akhir tahun 1997, dimana Google memasuki pasar yang telah diisi
oleh para pesaing lain dalam penyediaan layanan mesin pencari, seperti Yahoo,
Altavista, HotBot, Excite, InfoSeek dan Lycos, dimana perusahaan-perusahaan
tersebut mengklaim sebagian perusahaan yang bergerak dalam bidang layanan
pencarian di internet. Hingga akhirnya Google mampu menjadi sebagai penyedia
mesin pencari yang cukup diperhitungkan di dunia.
Saat
tingginya persaingan antar mesin pencari yang ada, namun mesin pencari lain
tidak mampu menghentikan kesuksesan Google. Setelah Yahoo mampu pada posisi
puncak di sekitar tahun 2000, Google mampu menerobos liga besar tersebut.
sehingga Google dipandang sebagai mesin pencari yang utama seperti yang kita
ketahui pada hari ini.
Yahoo
Yahoo
raja directori di internet, di samping para pengguna internet
melihat DMOZ serta LookSmart berusaha menurunkan nya dari posisi puncak
tersebut. Akhir-akhir ini, telah tumbuh secara cepat dalam ukurannya, mereka
pun sudah memiliki harga sehingga mudah untuk memasukinya, dengan demikian,
mendapatkan sebuah daftar pada direktori Yahoo memang memiliki nilai yang
tinggi.
pada
tahun 2001, mesin pencari Google berkembang besar. Keberhasilan ini didasarkan pada
bagian konsep dasar dari link popularity dan PageRank.
Setiap halaman diurutkan berdasarkan seberapa banyak situs yang terkait, dari
sebuah premis bahwa situs yang diinginkan pasti lebih banyak terhubung
daripada yang lain. Rangking situs (The PageRank)dari sebuah link halaman dan
jumlah link dari halaman-halaman tersebut merupakan masukan bagi Rangking situs
yang bersangkutan. Hal ini memungkinkan bagi Google untuk mengurutkan hasilnya
berdasarkan seberapa banyak halaman situs yang menuju ke halaman yang
ditemukannya. User interface Google sangat disukai oleh pengguna, dan
hal ini berkembang ke para pesaingnya.
Manfaat
· Mesin pencari merupakan tempat kebanyakan orang
mencari sesuatu via internet. Menurut survei hampir 90% pengguna internet
memakai mesin pencari untuk mencari lokasi tertentu di internet. dan di antara
mesin pencari yang ada, google merupakan mesin pencari yang paling banyak
digunakan.
· Sebagian besar pengguna mesin pencari tidak
pernah melewatkan dua halaman pertama dari mesin pencari.
· Sebagian besar (hampir 70%) pengguna mesin
pencari tidak pernah klik pada hasil pencarian sponsor. Dengan demikian, hasil
pencarian yang organik (secara alami) akan membuat suatu website
memperoleh posisi strategis dalam dunia internet.
· Di negara-negara maju, porsi penjualan yang
dilakukan melalui internet sudah hampir mencapai 20% dari keseluruhan transaksi
tahunan.
· Sebuah informasi yang mudah di akses oleh semua
orang baik dalam maupun luar negeri.
· Memudahkan Masyarakat dalam mencari informasi di
internet
Cara kerja mesin pencari
Mesin
pencari web bekerja dengan cara menyimpan informasi tentang banyak halaman web,
yang diambil langsung dari WWW. Halaman-halaman ini diambil dengan web crawler — browser
web otomatis yang mengikuti setiap pranala yang dilihatnya. Isi setiap halaman
lalu dianalisis untuk menentukan cara indeks-nya (misalnya, kata-kata diambil
dari judul, subjudul, atau field khusus yang disebut meta tag). Data tentang
halaman web disimpan dalam sebuah database indeks untuk digunakan dalam
pencarian selanjutnya. Sebagian mesin pencari, seperti Google,
menyimpan seluruh atau sebagian halaman sumber (yang
disebut cache)
maupun informasi tentang halaman web itu sendiri.
Selain
halaman web,
Mesin pencari juga menyimpan dan memberikan informasi hasil pencarian berupa
pranala yang merujuk pada file, seperti file audio, file video, gambar, foto dan sebagainya, serta
informasi
tentang seseorang, suatu produk, layanan, dan informasi beragam lainnya yang
semakin terus berkembang sesuai dengan perkembangan teknologi informasi.
Ketika
seseorang mengunjungi mesin pencari dan memasukkan query, biasanya dengan
memasukkan kata kunci,
mesin mencari indeks dan memberikan daftar halaman web yang paling sesuai
dengan kriterianya, biasanya disertai ringkasan singkat mengenai judul dokumen
dan kadang-kadang sebagian teksnya.
Ada
jenis mesin pencari lain: mesin pencari real-time, seperti Orase. Mesin seperti ini tidak menggunakan
indeks. Informasi yang diperlukan mesin tersebut hanya dikumpulkan jika ada
pencarian baru. Jika dibandingkan dengan sistem berbasis indeks yang digunakan
mesin-mesin seperti Google, sistem real-time ini unggul dalam beberapa
hal: informasi selalu mutakhir, (hampir) tak ada pranala mati, dan lebih
sedikit sumber daya sistem yang diperlukan. (Google menggunakan hampir 100.000
komputer, Orase hanya satu.) Tetapi, ada juga kelemahannya: pencarian lebih
lama rampungnya.
Manfaat mesin pencari
bergantung pada relevansi hasil-hasil yang
diberikannya. Meskipun mungkin ada jutaan halaman web yang mengandung suatu
kata atau frasa, sebagian halaman mungkin lebih relevan, populer, atau
autoritatif daripada yang lain. Kebanyakan mesin pencari menggunakan berbagai
metode untuk menentukan peringkat hasil pencarian
agar mampu memberikan hasil "terbaik" lebih dahulu. Cara mesin
menentukan halaman mana yang paling sesuai, dan urutan halaman-halaman itu
diperlihatkan, sangat bervariasi. Metode-metode nya juga berubah seiring waktu
dengan berubahnya penggunaan internet dan berevolusinya teknik-teknik baru.
Sebagian
besar mesin pencari web adalah usaha komersial yang didukung pemasukan iklan dan karenanya
sebagian menjalankan praktik kontroversial, yaitu membolehkan pengiklan
membayar agar halaman mereka diberi peringkat lebih tinggi dalam hasil
pencarian.
Pentingnya mesin pencari optimasi
Salah
satu alasan yang menyebabkan diperlukan mesin pencari optimasi adalah karena
ada banyak World Wide
Web Wanderer yang sudah ada, dan akan terus bertambah di setiap
bulannya.
Sebagai
Contoh, seseorang mempunyai World Wide
Web Wanderer untuk menjual produk pertanian maka di Indonesia akan
ada puluhan atau ratusan Website sejenis. Sementara itu, jika ingin melihat
segmen dunia maka akan lebih banyak lagi jumlahnya. Untuk itu, dengan
menempatkan posisi di tingkat ada dalam hasil pencarian maka akan membuat
website pengguna tersebut ibarat toko strategis yang terletak di tepi jalan
besar. Dengan SEO yang bagus maka kemungkinan website anda dikunjungi oleh
orang lain akan lebih besar.
Dengan
Kaidah SEO yang bagus, website menggunakan lebih jelas atau keluhan sehingga
akan lebih diperhatikan oleh mesin pencari. itulah inti dari SEO, yaitu untuk
membuat website anda diperhatikan oleh mesin pencari.
Pencarian
Proses Pencarian
Melakukan
pencarian dokumen yang dimuat pada suatu situs bisa begitu mudah dan
kelihatannya mungkin sulit juga. apalagi mengignat begitu menyebarnya informasi
dimana-mana, bahkan University of Calofornia menyebutkan saat ini telah
terdapat lebih dari 50 milyar halaman web di internet,
meskipun tidak ada ada satupun yang benar-benar tahu jumlah persisnya.
kesulitan
yang mungkin terjadi adalah karena WWW tersebut tidak terdata dalam bentuk yang
terstandardisasi isinya. tidak sama halnya dengan katalog yang ada di
perpustakaan, yang memiliki standardisasi secara mendunia berdasarkan subjek
dari judul buku, meskipun jumlahnya juga tidak sedikit.
Dalam
pencarian di web, pengguna selalu memperkirakan kata apa
yang di kira-kira terdapat pada halaman yang ingin anda temukan. atau kira-kira
apa subjek yang dipilih oleh seseorang untuk mengelolah halaman situs yang
mereka kelola, topik apa saja kira-kira yang di bahas.
Jika
pengguna melakukan apa yang dikenal dengan pencarian pada halaman web,
sebenarnya tidaklah melakukan pencarian. tidak mungkin melakukan pencarian di WWW secara langsung.
Pada
web
benar-benar terdiri dari banyak sekali halaman web yang ingin disimpan dari
berbagai server diseluruh dunia. Komputer pengguna tidak langsung melakukan pencarian kepada
seluruh komputer tersebut secara langsung.
Apa
yang mungkin pengguna lakukan hanyalah melalui komputer untuk mengakses satu
atau lebih perantara yang disebut dengan alat bantu pencarian yang ada saat
ini. Melakukan pencarian pada alat bantu itu tadi ke database yang dimiliki.
data base tersebut mengkoleksi situs-situs yang ditemukan dan simpan.
alat
bantu pencarian ini menyediakan hasil pencarian dalam bentuk hypertext link
dengan URL menuju halaman lainnya. ketika anda klik link ini, dan menuju ke
alamat tersebut maka dokumen, gambar, suara dan banyak lagi bentuk lainnya yang
ada pada server tersebut disediakan, sesuai dengan informasi yang
terdapat di dalamnya. layanan ini bisa menjangkau ke manapun di seluruh dunia.
Tidak
mungkin seseorang untuk melakukan pencarian ke seluruh komputer yang terhubung
internet ini, atau bahkan alat bantu pencarian yang mengklaim bahwa
melakukannya, tidak benar.
Kategori Alat Pencari
Saat
ini, tiga bentuk dari alat bantu pencarian ini. Menggunakan strategi yang
berbeda untuk memanfaatkan kemampuan potensial dari masing-masingnya, yaitu:
Mesin pencari dan mesin pencari-meta
Karakteristik:
· Menyimpan data dalam bentuk teks penuh pada
halaman yang terpilih,
· Pencarian berdasarkan kata kunci, mereka mencoba
mencocokkan dengan tepat kata kunci tersebutdengan teks yang ada dalam
dokumen,
· Tidak perlu dilakukan browsing, dan tidak ada
subjek dari kategori,
· Database dijaring dan dikumpulkan oleh spidr,
yaitu komputer yang memiliki program robot, dengan kemampuan seminimal mungkin
dari pandangan atau sentuhan manusia,
· Ukuran search engine:dari skala kecil hingga
mampu menyimpan sangat banyak (sekitar hingga 20 milyar halaman web).
· Meta-search engine dengan cepat melakukan
pencarian ke dalam beberapa data base dari berbagai search engine dalam satu
kali permintaan. hasilnya adalah daftar yang hasilnya dan penggabungan hasil
pencarian dari beberapa mesin pencari yang mereka libatkan. Contoh :
Search engine: Google,
Yahoo Search, Ask.com.
Meta-Search : Dogpile, Copernic, dan lainnya.
Subject Directories
Karakteristik :
· Seleksi dari situs yang ada merupakan seleksi
langsung yang dilakukan oleh manusia, kadang kala para ahli untuk subjek
tertentu,
· Sering dengan hati-hati dievaluasi dan menjaga
keterbaruan informasi yang mereka miliki, namun tidak selalu, kadang-kadang
tidak, terutama untuk mereka yang telah memiliki data yang banyak dan bersifat
general,
· Biasanya dikelola dalam bentuk subjek dan
direktori yang tersusun secara hirarki,
· Sering dilengkapi dengan catatan mengenai
deskripsinya ( tidak untuk Yahoo),
· Subjek dapat di-browse subjek dan
kategorinya atau melakukan pencarian berdasarkan kata-kata tertentu,
· Dokumen yang tidak penuh teks. pencarian diminta
lebih spesifik dibandingkan dengan pencarian melalui mesin pencari, karena kata
kunci tidak bisa dibandingkan dengan isi dari halaman suatu situs, melainkan
hanya pada subjek, kategori-kategori, dan deskripsi.
· Terdapat ribuan atau bahkan lebih subjek
direktori dalam praktek dan kenyataannya apa saja yang dipikirkan di sana.
Specialized Databade (Invisible Web)
Karakteristik :
· Merupakan web
yang menyediakan akses melalui suatu kotak pencarian ke dalam isi database pada
sebuah komputer di suatu tempat,
· Dapat saja berubah berbagai topik, dapat pula
juga hal yang komersial, pekerjaan yang spesifik, pemerintahan, dll
· Juga terdiri dari banyak halaman yang
menghasilkan hasil pencarian dari katalog direktori online.
Prinsip Umum Dari mesin pencari
Sistem
kinerja mesin ini ada beberapa hal yang perlu di perhatikan terutama
keterkaitannya dengan masalah arsitekrut dan mekanismenya.
Spider
Merupakan
program yang men-download halaman-halaman yang mereka temukan, mirip dengan
browser. Perbedannya adalah bahwa browser menapilkan secara langsung informasi
yang ada (baik tekas, gambar, dll). Untuk kepentingan manusia yang
menggunakannya pada saat itu, sedangkan spider tidak melakukan untuk
menampulkan dalam bentuk yang terlihat seperti itu, karena kepentingannya
adalah untuk mesin, bukan untuk manusia, spider pun dijalankan oleh mesin
secara otomatis. Kepentingannya adalah untuk mengambil halaman-halaman yang
dikunjunginya untuk disimpan kedalam database yang dimiliki oleh search engine.
Crawler
Merupakan
program yang dimiliki search engine untuk melacak dan menemukan link yang
terdapat dari setiap halaman yang ditemuinya. Tugasnya adalah untuk menentukan
spoder harus pergi kemana dan mengevaluasi link berdasarkan alamat yang
ditentukan dari awal. Crawler mengikuti link dan mencoba menemukan dokumen yang
belum dikenal oleh search engine.
Indexer
Komponen
ini melakukan aktifitas untuk menguraikan masing-masing halaman dan meneliti
berbagai unsur, seperti teks, headers, struktur atau fitur dari gaya penulisan,
tag HTML
khusus, dll.
Database
Merupakan
tempat standar untuk menyimpan data-data dari halaman yang telah dikunjungi,
di-download dan sudah dianalisis. kadang kala disebut juga dengan index dari
suatu search engine.
Result Engine
Mesin
yang melakukan penggolongan dan penentuan peringkat dari hasil pencarian pada
search engine. Mesin ini menentukan halaman mana yang menemui kriteria terbaik
dari hasil pencarian berdasarkan permintaan penggunanya, dan bagaimana bentuk
penampulan yang akan ditampilkan.
Proses
ini dilaksanakan berdasarkan algoritma perangkingan yang dimiliki oleh search engine
tersebut, mengikuti kaidah perangkingan hakaman yang dipergunakan oleh mereka
adalah hak mereka, para peneliti mempelajari sifat-sifat yang mereka gunakan,
terutama untuk meningkatkan pencarian yang dihasilkan oleh serach engine
tersebut.
Web Server
Merupakan komponen yang melayani permintaan dan
memberikan respon balik dari permintaan tersebut. Web Server ini biasanya
menghasilkan informasi
atau dokumen dalam format HTML. Pada halaman tersebut tersedia layanan untuk mengisikan
kata kunci pencarian yang diinginkan oleh usernya. Web Server ini juga
bertanggung jawab dalam menyampaikan hasil pencarian yang dikirimkan kepada
komputer yang meminta informasi.
Sumber: http://id.wikipedia.org/wiki/Mesin_pencari_web