Friday, January 19, 2007

Cara Mudah Mendapatkan Dokumen PDF di Google

Dokumen PDF biasanya berupa teks dan gambar, dan jamak digunakan untuk dokumen-dokumen yang panjang dan rumit, seperti berkas akademis, katalog produk, dan berkas-berkas berharga. Juru bicara Google, David Krane, memperkirakan Google telah berhasil mengindeks sekitar 70 persen dari seluruh dokumen PDF yang ada di umum.

Google sudah terkenal sebagai Search engine kelas wahid, kini mereka berusaha makin mengembangkan mesin pencari itu, dengan memperluas jangkauan pencariannya hingga ke dokumen dengan format PDF atau Portable Document Format. Hingga saat ini, Google sudah menambah sekitar 13 juta dokumen PDF ke dalam indeksnya.

Indeks search engine Google sendiri, belum termasuk dokumen PDF, terdiri dari lebih dari 1,3 miliar halaman situs. Mayoritas dokumen dalam bentuk Hypertext Markup Language (HTML).

Danny Sullivan, editor SearchEngineWatch.com yang memuat berita dan tips mengenai search engine, mengatakan bahwa Google merupakan search engine pertama yang menawarkan indeks dokumen PDF secara komprehensif.

Dikatakan oleh Sullivan, bahwa dia belum melihat tanda-tanda search engine lain akan mengikuti jejak Google. Hal ini mungkin disebabkan oleh pengurangan tenaga kerja dan kurangnya sumber daya yang dibutuhkan.

Google harus mengembangkan sendiri software untuk mencari teks dalam dokumen PDF, dan telah menyediakan beberapa komputer khusus untuk tugas ini.

Menurut Krane, para ahli di Google memperkirakan bahwa sebuah dokumen PDF berukuran 100 kali lebih besar daripada sebuah dokumen HTML biasa. Hal ini berarti, 13 juta dokumen PDF yang berhasil ditambahkan dalam indeks Google mengandung triliunan byte data mentah.

1 comment:

formilist said...

kalo diantara teman-teman memakai browser firefox, udah ada koq extension-nya untuk download file pdf. ( download disini)

nanti pada saat di klik link pdf nya, langsung muncul pesan, mau di buka secara online, mau di download atau view as HTML ..??