Ini adalah artikel lanjutan dari pembahasan sebelumnya yang berjudul Cara Cek Halaman Sudah Terindex Google Atau Belum. Jika ternyata halaman sudah terindex dengan baik, biasanya akan muncul pertanyaan baru yang membuat penasaran: sebenarnya berapa banyak sih halaman blog saya yang sudah diindex oleh Google?
Ada beberapa cara untuk memeriksa URL postingan yang sudah terindeks mesin pencari.Saya akan mencoba menjelaskan sesuai pengetahuan yang dimiliki. Baca sampai habis ya.
1. Menggunakan Google
Cara paling mudah dan cepat adalah menggunakan layanan Google itu sendiri. Untuk melakukannya, kamu cukup mengetikkan perintah pendek di kotak penelusuran dengan format site:alamatblog
. Contoh:
site:igniel.com
Perhatikan angka yang muncul di bawah kotak pencarian (yang ditandai merah pada gambar). Disana tertulis Sekitar 477
. Artinya jumlah halaman igniel.com yang terindex kurang lebih sekitar 477 buah.
Jika kamu memiliki beberapa subdomain dengan TLD yang sama, maka hasil yang muncul adalah keseluruhan subdomain tersebut. Ngerti kan? Gini lho maksudnya….misal saya punya 4 blog yaitu www.igniel.com
, blog.igniel.com
, berita.igniel.com
, dan test.igniel.com
. Maka jumlah index yang muncul adalah total dari keempat blog tersebut.
Jika ingin mengecek salah satunya saja maka subdomainnnya WAJIB ditulis seperti ini:
site:www.igniel.com
Jika tidak memiliki subdomain lain maka tidak masalah tidak menuliskan “www” atau sub lainnya.
2. Menggunakan Search Console
Untuk melakukannya kamu harus mendaftarkan blog ke Search Console terlebih dulu. Setelah itu buka dashboard dan akses menu Coverage
. Lihat pada bagian Valid
dan itulah jumlah halaman blog yang telah diindex Google.
3. Kenapa Jumlah Index Lebih Banyak dari Jumlah Artikel Sesungguhnya?
Pada saat artikel ini diterbitkan, jumlah artikel yang saya miliki di blog igniel.com berjumlah 210 buah yang terdiri dari halaman posting sebanyak 204 buah dan halaman statis (page) sebanyak 6 buah. Tapi kenapa jumlah indexnya bisa 400-an lebih?
Untuk mengecek, kita harus kembali menggunakan Search Console. Buka lagi menu Coverage
dan klik menu Valid
. Scroll ke bawah dan kamu akan menemukan menu yang bertuliskan Details
.
Jumlah index pada Search Console adalah penjumlahan dari semua yang berstatus Valid.
Tipe | Jumlah |
---|---|
Submitted and indexed | 210 |
Indexed, not submitted in sitemap | 196 |
TOTAL | 406 |
3.1. Submitted and indexed
Halaman ini disubmit oleh sitemap dan telah diindex. Jika telah disubmit oleh sitemap, artinya halaman ini benar-benar ada dan telah terbit di blog kita. Punya saya berjumlah 210, persis sama dengan jumlah artikel sesungguhnya yang ada di blog. Coba klik deh bagian itu untuk detailnya dan lihat halaman mana saja yang tersubmit dan terindex.
3.2. Indexed, not submitted in sitemap
Halaman ini telah terindex, tapi tidak disubmit oleh sitemap. Ingat ya, tidak disubmit sitemap artinya artikel tersebut tidak ada di dalam sitemap. Tidak ada di sitemap tapi terindex, maksudnya gimana?
URL blog di sitemap.xml, khususnya Blogger (Blogspot) memiliki format seperti ini:
https://alamatblog.com/[tahun]/[bulan]/teks.html
Blogger memiliki URL khusus untuk tampilan desktop dan mobile. Untuk desktop ditandai dengan akhiran ?m=0
dan mobile ?m=1
. Ketika kita menerbitkan artikel dengan permalink https://www.igniel.com/2019/06/cara-custom-domain-blogger.html
, secara otomatis akan muncul URL lain untuk versi desktop dan mobile yakni https://www.igniel.com/2019/06/cara-custom-domain-blogger.html?m=0
dan https://www.igniel.com/2019/06/cara-custom-domain-blogger.html?m=1
.
Namun URL dengan akhiran ?m=0
dan ?m=1
tersebut TIDAK tampil di sitemap.xml blog. Kenapa? Ya nggak tau, yang bikin halaman sitemap.xml itu pihak Blogger langsung. Kita tidak bisa mengedit layaknya blog self-hosted.
Sebenarnya hal ini SANGAT BAGUS karena URL artikel itu cukup satu saja dan tidak perlu memiliki banyak embel-embel di belakangnya. Maka dari itu URL artikel pada sitemap.xml tidak memiliki buntut ?m=0
dan ?m=1
. Paham kan maksudnya? URLnya aktif, tapi tidak ada dalam sitemap.
Ada beberapa halaman lain yang memiliki kemungkinan ikut terindex, diantaranya:
<-- Arsip Per Tahun -->
https://alamatblog.com/[tahun]/
<-- Arsip Per Bulan -->
https://alamatblog.com/[tahun]/[bulan]/
https://alamatblog.com/[tahun]_[bulan]_01_archive.html
Jadi ada kemungkinan URL tersebut ikut terindex. Contohnya seperti milik saya berikut ini.
Pokoknya patokannya adalah: URL yang ada di dalam sitemap.xml HANYA URL postingan. Jika jumlah index lebih banyak dari jumlah artikel dalam sitemap, maka ada URL lain yang ikut terindex.
3.3. Kesimpulan
Jadi sudah terjawab kenapa jumlah index halaman lebih banyak dari jumlah artikel yang sesungguhnya, yaitu karena ada URL lain yang TIDAK ada dalam sitemap.xml yang ikut terindex. Biasanya yang ikut terindex adalah URL lain yang memiliki buntut ?m=0
, ?m=1
, halaman arsip, bahkan halaman pencarian.
4. Kenapa Jumlah Index Google dan Search Console Berbeda?
Pada contoh di atas jumlah index Google adalah 477 sedangkan pada Search Console berjumlah 406. Kok bisa beda gitu ya? Search Console mengindex artikel berdasarkan submit sitemap yang dilakukan oleh pengguna. Maka jumlah index cenderung lebih sesuai dengan artikel sebenarnya. Sementara index pada halaman Google biasanya lebih lambat meng-update karena butuh waktu bagi robot untuk merayapi ulang blog kita. Bingung? Gini deh…
Saya punya satu halaman yang sudah dihapus dengan URL sebagai berikut:
https://www.igniel.com/p/egegffegd.html
Pada Search Console, halaman tersebut sudah tidak diindex dan muncul pesan kesalahan ketika dilakukan inspeksi URL.
Sementara ketika dicek oleh Google, halaman tersebut masih terpajang di hasil pencarian. Artinya URL tersebut belum di-update di hasil pencariannya.
Maka hasil di Search Console lebih sedikit karena dia telah mengeliminasi halaman yang tidak ada. Dia juga tidak memvalidasi halaman yang diblokir oleh robots.txt atau ditandai noindex oleh meta tag. Sementara pada hasil pencarian Google, halaman tersebut masih muncul sehingga jumlah indexnya lebih banyak. Dibutuhkan waktu agar halaman bisa hilang dari hasil pencarian agar jumlahnya bisa sama dengan Search Console.
Sekali lagi, ini hanya sepengetahuan saya. Harap koreksi melalui kolom komentar jika ada penjelasan yang lebih tepat.
Kalau bingung baca lagi pelan-pelan ya. Memang sedikit membingungkan pada pembahasan nomor 3 yaitu soal jumlah index yang lebih banyak dari artikel sesungguhnya. Saya pun agak kesulitan menjabarkannya dalam bentuk tulisan. Lebih enak pakai video sih. Mungkin harus mulai bikin video di Youtube. Subscribe ya channel saya, siapa tau suatu saat nanti beneran bikin video.