Tergelitik dengan twit-nya ndorokakung, seorang blogger kawakan tanah air yang mengatakan “kenapa google menganggap nama joko itu berkaitan dengan penipuan? tak percaya? ketik “joko s” lihat apa yg disarankan Google”, saya browsing sedikit nyari tahu secanggih apa – atau sebodoh apa – kemampuan bahasa mesin pencari.

Teman-teman programmer tentu pernah belajar bagaimana kita meng-ekstrak kata tertentu pada teks, bisa berupa file, field database, atau apapun yang penting isinya berupa streaming teks.

Berbagai bahasa pemrograman memiliki instruksi keperluan tersebut. Sedikit lebih canggih, kita menambahkan counter untuk menghitung berapa kata tertentu muncul dalam satu streaming teks. Tapi jika anda sering menggunakan Google untuk mencari informasi – terutama dalam bahasa Inggris – dan memperhatikan hasil pencariannya, anda tentu menyadari kalau kemampuan search engine jauh lebih dari sekedar menemukan adanya keyword dalam konten sebuah halaman web.

Kemampuan Algoritma Google Dalam Memahami Bahasa

Komputer memang sangat canggih. Ada banyak hal yang sulit untuk kita lakukan, bisa dilakukan dengan sangat mudah oleh komputer. Ironisnya ada beberapa hal yang sangat mudah bagi manusia tapi sangat sulit dilakukan oleh komputer.

Atau tepatnya sangat sulit bagi para pakar untuk membuat komputer mampu melakukannya. Salah satunya adalah kemampuan bahasa. Para pakar kecerdasan buatan sanggup membuat komputer super canggih yang mampu menandingi kecerdasan grand master catur, tapi untuk memahami kalimat, sistem komputer paling canggih kalah jauh oleh anak kecil sekalipun.

Salah satu industri yang sangat berkepentingan dengan kemampuan bahasa ini adalah search engine. Google mengembangkan teknologi yang memungkinkan sistemnya memahami bagian yang paling sederhana dari bahasa, sinonim, dalam arti yang luas. Dalam blog resmi Google googleblog.blogspot.com, Steven Baker, seorang senior software engineer Google menjelaskan sedikit mengenai sistem ini, berikut terjemahannya secara bebas.

Salah satu contoh dari penggunaan sinonim dalam bahasa sehari-hari misalnya antara “pictures” dan “photos” yang dalam kebanyakan kasus merujuk pada hal yang sama. Jika kita mencari “pictures developed with coffee” untuk mencari informasi mengenai teknik cetak foto dengan menggunakan bubuk kopi, Google harus memahami bahwa meskipun satu halaman web menyebut “photos”, bukan “pictures”, halaman tersebut masih relevan.

Anak kecilpun bisa memahami penggunaan pictures/photos dalam kasus tadi, tapi membuat program komputer yang mampu memahaminya adalah tantangan yang luar biasa. Wajar jika Google bangga dengan sistem yang mereka bangun.

Sistem sinonim Google merupakan hasil dari penelitian lebih dari luma tahun oleh tim web search ranking mereka, termasuk dengan terus-menerus memonitor kualitas output dari sistem tersebut. Mungkin biasanya pemakai tidak terlalu memperhatikan apakah keyword yang mereka pakai melibatkan sinonim.

Dari sisi proses pemakai mungkin juga tidak menyadarinya karena semua terjadi di balik layar. Tetapi Steve mengklaim bahwa 70% pencarian yang dilakukan pemakai dalam 100 bahasa yang didukung Google melibatkan sinonim. Lebih jauh Steve menyatakan berdasarkan hasil analisanya, sistem sinonim Google hanya meleset 1 kali dari setiap 50 pencarian yang melibatkan sinonim.

Dia mencontohkan salah satu kesalahan hasil sistem sinonim Google. Dalam pencarian dengan keyword “dell system speaker driver precision 360″ sistem Google menganggap “pc” adalah sinonim “precision”. Yang menarik adalah Steve mengatakan bahwa kesalahan itu sampai sekarang masih ada jika anda melakukan pencarian yang sama.

Alasannya karena mereka tidak melakukan perbaikan secara manual kata-per-kata setiap kesalahan ditemukan, melainkan dengan pengembangan algoritma sehingga kesalahan seperti itu bisa hilang dengan sendirinya.
Google juga mengubah cara mereka menampilkan sinonim dalam hasil pencarian. Dulu Google hanya menampilkan dengan huruf tebal varian kata dari keyword yang dimasukkan, misalnya jika orang mencari “picture”, maka “pictures” juga akan di bold.

Sekarang Google melangkah lebih maju, kata-kata yang oleh sistem dianggap sinonim meskipun kata-kata tersebut sama-sekali berbeda, sebagai contoh pada kasus di bawah, untuk pencarian “pictures developed with coffee”, kata “photos” juga di-bold.

Perlu dicatat disini bahwa tidak dalam setiap kasus “photos” ikut di-bold setiap orang mencari “pictures”, tetapi hanya jika algoritma sistem menganggap perlu saja.

Sistem Google melakukan analisa petrabytes terhadap konten halaman web dan data pencarian untuk mengembangkan kemampuan memahami arti sebuah kata dalam konteks yang berbeda. Pada contoh di atas “photos” dapat dikatakan sinonim dengan “pictures”, tapi itu tidak selalu benar.

Dalam koteks lain, misalnya untuk pencarian “motion pictures”, situasinya menjadi sangat berbeda. “photos” tidak lagi relevan karena “motion pictures” artinya film, “movie”. Contoh lain “GM” biasanya dihubungkan orang dengan “General Motors”. Untuk pencarian “gm cars”, “General Motors” di-bold karena dianggap penting.

Tapi Google juga mencatat sekitar 20 kemungkina lain untuk “gm”. “genetically modified” di-bold untuk pencarian yang relevan dengan pertanian, hasil panen, dan makanan misalnya “gm wheat”. Untuk pencarian “gm university” George Mason di-bold, untuk “gm screen star wars”, “gamemaster” di bold. Untuk pencarian “gm college”, Gangadhar Meher di-bold. Untuk pencarian “nba gm”, “general manager” di-bold. Untuk pencarian “navy gm”, “gunners mate” di-bold.

Secara standar, varian seperti “pictures” dan “picture” dianggap berbeda oleh komputer, karena itu Google memasukkannya dalam sistem sinonim meskipun mungkin dari sisi ilmu bahasa berbeda. “picture/pictures” disebut stemming variant karena berasal dari kata dasar yang sama, di sisi lain sistem sinonim juga harus memahami bahwa “pictures” dan “photos” bisa sinonim dalam konteks tertentu.

Hal ini sangat jelas bagi manusia, tapi tidak bagi komputer. Mari kita tambah rumit persoalan. Mirip dengan “picture/pictures” ada “animal” dan “animation” yang secara etimologis berasal dari kata dasar yang sama, tapi artinya sangat berbeda. Contoh lain “arm” dan “arms” yang juga berasal dari kata yang sama. Secara umum “arms” adalah bentuk jamak dari “arm”. Tapi jika kita pakai dalam frasa, coba anda bandingkan pengertian “arm reduction” dan “arms reduction”.

Sistem sinonim Google cukup pandai untuk memahami bahwa “arm reduction” berhubungan dengan pengurangan lemak dari lengan seseorang sementara “arms reduction” berhubungan dengan perlucutan senjata. “Picture” dan “pictures” mungkin memang kasus sederhana, “arm” dan “arms” dalam kasus tertentu mungkin sama juga. Tapi “arm” dan “arms” memiliki pengertian lain dalam konteks yang berbeda. Ini yang membuat sistem sinonim sesuatu yang sangat rumit.

Berikut beberapa contoh sinonim lain yang menarik untuk disimak:

Untuk search “song words”, kata “lyrics” di-bold karena dianggap sinonim dengan “words”.
Untuk search “what state has the highest murder rate”, kata “homicide” di-bold karena dianggap sinonim dengan “murder”.

Untuk search “himalayan kitten breeder”, Google tahu bahwa “kitten breeder” sama dengan “cat breeder”.
Untuk search “dura ace track bb axle njs”, Google tahu bahwa “‘bb” disi maksudnya “bottom bracket”.
Untuk search “software update on bb color id”, kata “blackberry” di-bold karena dianggap sinonim dengan “bb”.
Untuk search “bb cream dark”, Google tahu bahwa “bb” disini maksudnya “blemish balm”.

Untuk search “southeastern usa bb fitness & figure”, kata “bodybuilding” di-bold karena dianggap sinonim dengan “bb”.

Penjabaran diatas merupakan salah satu pembahasan SEO yang ditulis pada tahun 2011 yang lalu, dan kini sudah 2020, tentu Google memiliki algoritma yang lebih canggih dibandingkan dengan mesin mereka 9 tahun yang lalu tersebut.

Seiring dengan perkembangan teknologi, Google selalu mengupgrade mesin pencari mereka, algoritma search engine yang mereka inginkan adalah mampu menemukan apa yang benar-benar dicari oleh pengguna mesin mereka.

Dapatkan Artikel mengenai SEO dan Mesin pencari lainnya di blog kami. Subscribe yaa… Klo butuh Jasa SEO, jangan lupa, langsung hubungi customer service kami… Jangan sungkan untuk banyak tanya…

0/5 (0 Reviews)
0/5 (0 Reviews)

Leave a Reply

Your email address will not be published. Required fields are marked *