データサイエンティストハトリのブログ

PythonとインテリジェントクラウドとAIが好きな学生エンジニア。データ分析、スクレイピング、就職活動などについて書いていきます。

他人のサイトの全記事数が何記事あるのかを調べる方法

f:id:hatorihatorihatorik:20181002154850j:plain


 

こんにちは、どうもハトリです!!

TwitterでプログラミングやIT関連のことについてつぶやいているのでよかったら是非フォローしてください →→(@tori_engineer)

 

 

あと何記事書けば目標に近づけるのか

Webメディアを作る際にはいろいろ考えるべきことがあります。SEOやワード選定、その他いろいろな作戦を練って運営を行なっていくのが多くのケースなのではないでしょうか。

そのなかでも1つの指標として重要になってくるのがそのサイト自体の記事数だと思っています。

 

おそらくみなさんが目指している多くの強いサイトではたくさんの記事が書かれているのではないでしょうか。

もちろん記事を書けばいいメディアになるとは限りませんが、いい情報をたくさん提供している方がgoogleからもいい評価を受けるのではないかと思っています。

 

記事数を探るのは結構面倒

Webメディアが持っている全記事数をいちいち数えていくのはかなり大変です。トップページの記事一覧にページネーションが付いていて、後ろのほうのページまで遡れるならまだなんとかできそうですが、そのように親切に作られているとも限りません。

 

manablog.org

 

このブログのような感じで、カードタイプになっていないとかなり大変です。果てしなく時間がかかります。ページ数がサイト内に表示されていないので、クリックしている途中で今何ページ目か忘れてしまったりします。

 

そんな人のために、他の人のサイトがだいたい何記事あるのかを確認する方法を紹介したいと思います。

 

他人のサイトの全記事数を確認する方法

手順はかなり簡単です。

 

ブラウザで上の方に表示されているURLのまえに「site:」という文字を加えるだけです。

たとえば、

 

https://www.torikun.com

 

だったら

 

site:https://www.torikun.com

 

という感じになります。

 

そうするとgoogleの検索結果がでてきますよね。そしたら左上に表示されている「件数」を見てみましょう。

 

f:id:hatorihatorihatorik:20181018035955p:plain

これがindex数と呼ばれるものです。

 

インデックス数(index)とは、Google等の検索エンジンクローラーがサイトにアクセスし、検索結果に表示する為に検索データベースに登録されたURL数を意味します。 Googleの検索ロボットがウェブサイトをクロールしインデックス処理を行わない限り、検索結果に表示されることはありません。

参考インデックス数は順位に影響する? | アレグロのSEOブログ

 

index数とはgoogleのデータベースに登録されているサイトの数のこと。

 

Wordpressで作ったサイトには記事ページの他に、トップページやカテゴリページなど余計なページがたくさんあるため記事数よりは大きい値が入ってしまいますが、まあこれも誤差の範囲内。

 

だいたいこれくらい書けばこのサイトに追いつけるんだなーと思って1つの指標として参考にしてみてください。

 

自分のサイトがindexされているか確認しよう

余談です。

 

実は、自分のサイトの記事をいくらがんばって更新しても、google側がindexという作業をしてくれなければ他の人の検索結果に現れないという悲しい現実があります。indexは基本的にはgoogleが勝手にやってくれるのですが、indexを行なっているのもgoogleが開発した機械なので本当にしっかりやってくれるかは怪しいところです。

 

事実として、記事を書いてから数分後にindexされることもあれば、数日経ってもindexされないこともあります。

 

自分の書いた記事がすぐにindexされなかったら悲しいですよね。アクセスアップを狙うためにもすぐにindexしてもらう作業が必要です。

 

Fetch as Google

GoogleのSearch Consoleというものに登録すると、このFetch as Googleという機能を使うことができます。

 

これは自分でindexしてほしい記事をgoogle側に教えてあげることでgoogleがindexしてくれるようになるという役割があります。

www.granfairs.com

 

PuSHPress

Wordpressを使っている人はこのPuSHPressというプラグインがオススメです。先ほど紹介したFetch as Googleeでは、いちいち手動でindexのお願いをgoogleにしなければ行けなかったにも関わらず、このPuSHPressは一連の作業を全て自動でやってくれます。

 

使い方はプラグインをインストールして有効かするだけ。これをやっておくだけでかなり作業が効率化されるので是非やってみてください。

promonista.com