検索アルゴリズム

公開日:2013年9月4日
 最終更新日:2014年4月15日

検索アルゴリズムとは、複数の基準によりウェブページの評価を行い、入力検索されたキーワードに対して関連性の高い順にリストアップする技術のことです。

Googleの検索アルゴリズムの種類

検索アルゴリズムの評価項目は多岐にわたり、その数は数百にも及ぶと言われます。こちらの記事ではGoogleの200項目の検索アルゴリズムを紹介しています。

それぞれの検索アルゴリズムの影響力は異なります。特に影響力を持っているのはアウトバウンドリンクやバックリンクのプロファイルなど外部リンク関係です。

ドメインに関する13要因

  • ドメイン年齢
  • ドメイン取得からの長さ
  • ドメイン登録情報(Who is情報)の表示/非表示
  • ドメイン種類(サイトレベルドメイン(.com や co.uk)
  • トップレベルドメイン(.comや.info)
  • サブドメインまたはルートドメイン
  • ドメイン過去履歴 (IPアドレスの変更履歴や頻度)
  • ドメイン過去の所有者(過去所有者の履歴や変更頻度)
  • ドメインにキーワードが含まれているか
  • ドメイン(サーバー)のIPアドレス
  • 同一IPを使用する別ドメインとの関係
  • 外部リンクとの関連性
  • Googleウェブマスターツールの使用

サーバー:2つの要因

  • サーバーの場所
  • サーバーの信頼性/稼働時間

アーキテクチャ(構造や仕組み):8因子

  • URL構造
  • HTML構造
  • 論理的な構造
  • 外部CSS、JavaScriptファイル
  • ウェブサイト構造、アクセシビリティ
  • URLの正規使用
  • 正しいHTMLコード
  • クッキーの使用

 

コンテンツ:14要因

  • コンテンツの言語
  • コンテンツの一貫性
  • コンテンツ量(HTML形式とテキスト)
  • リンクの数とそれ以外のテキスト量との関係(比率)
  • 純粋なテキストコンテンツ(リンク、画像、コード、など以外)
  • コンテンツの時事的要素(新鮮さ)
  • Semantic information
  • カテゴリのコンテンツフラグ(トランザクション、情報、ナビゲーション)
  • コンテンツの質(情報の深さ)
  • フラグが設定されたキーワードの使用(ギャンブル、出会い系等)
  • ALT属性
  • 悪意のあるコンテンツ有無
  • 単語の入力ミス
  • 使用するフレーズの新鮮さ(他サイトで使い回されていない言い回し)

内部のクロスリンク :5要因

  • ページへの内部リンク
  • ターゲットページに対しての同一アンカーテキストの使用
  • 全ページ共通部分(グローバルナビゲーション等以外)の内部リンク
  • “nofollow”属性を使用したリンク
  • 内部リンクの密度

ウェブサイトの要因:7要因

  • robots.txtファイルの有無と内容
  • サイト全体の更新頻度
  • サイト全体のサイズ(ページ数)
  • Googleがサイトを最初にインデックスした時から経過時間
  • XMLサイトマップ有無
  • コンタクトフォーム、プライバシーポリシー、利用規約など、信頼性を向上させるページの有無
  • ホームページの種類(ブログ形式、ポータル形式、企業サイトなど)

ページ固有の要因:9要因

  • ページのメタタグ
  • ページ年齢
  • ページの鮮度(更新頻度や新鮮さ)
  • ページ更新の割合(更新時に何%が更新されたか)
  • サイト内の類似ページの有無
  • ページ内容(専門性)
  • ページの読み込み時間
  • ページタイプ(メインコンテンツからのアクセシビリティ)
  • サイト内でのページの話題性(多くの内部リンクが張られている)
  • 外部サイトからの人気(外部サイトから多くのリンクが張られている)

キーワードの使用頻度、キーワード使用方法 :13要因

  • ページタイトル内キーワードの有無
  • ページタイトルのキーワード位置
  • altタグ内でのキーワード使用
  • 内部リンクでのアンカーテキスト内にキーワード使用
  • 外部サイトへの発リンクにキーワード使用
  • 太字や斜体などの強調タグでのキーワード使用
  • コンテンツ上部でのキーワード使用
  • 上部でのキーワード使用
  • ページ/サイトのテーマと関連するキーワード同義語の使用
  • ファイル名のキーワード使用
  • URL内のキーワード使用
  • 「キーワード」を、ドメイン、ファイル名、説明とキーワードタグの最初のラインの最初の言葉を故意に使用したり乱用している

アウトバウンドリンク:8要因

  • 外部発リンクドメイン数
  • 外部発リンクページ数
  • リンク先ページの品質
  • 低品質なサイトへのリンク
  • 外部リンク先の関連性
  • 404ページとその他エラーページへのリンク
  • クライアントサイトからSEO業者サイトへのリンク
  • 関連画像へのリンク

バックリンクのプロファイル:21要因

  • リンクサイトとの関連性
  • リンクページとの関連性
  • リンクサイトの品質
  • リンクページの品質
  • リンクネットワークとのつながり
  • 同様のバックリンクソースを持つサイトの存在
  • リンクソースのパターン
    アンカーテキストのパターン
    リンクしているサイトIPアドレスパターン
    リンク元サイトのIPアドレスパターン
    トップレベルドメインパターン
    話題のパターン
    リンクサイトのパターン(過去ログ、ディレクトリ系など)
    リンク設置場所のパターン
  • オーソリティサイトとのリンク(CNNやBBC放送など)
  • 質が低いフラグを持ったサイトからのリンク
  • 全体の被リンクに対しての相互リンク比
  • 全体の被リンクに対するソーシャルメディアからのリンク比
  • 被リンクの急激な増加や自作的パターン
  • WikipediaやDMOZからの引用
  • これまでのリンク購入履歴(過去の傾向)
  • ソーシャルブックマークサイトからの被リンク

個別のバックリンク:6因子

  • トップレベルドメインの権限(.comに対する.govなど)
  • オーソリティドメインからのリンク
  • オーソリティページからのリンク
  • リンクの位置(フッター、グローバルメニュー及び本文)
  • アンカーテキスト中のリンク
  • リンクのタイトル属性

訪問者のプロフィールと行動:6因子

  • トラフィック
  • 訪問者の統計(パターン)
  • 直帰率(類似サイトとの比較)
  • 訪問者の閲覧パターン
  • 再訪問や新規セッションなどのパターン
  • SERPs内でのクリック数

ペナルティ、フィルタなどのフラグ:12要因

  • キーワードスタッフィング使用上のキーワード
  • リンクの購入フラグ
  • リンク販売フラグ
  • スパム歴(コメント、その他のリンクスパム)
  • クローキング
  • 隠しテキスト
  • 重複コンテンツ(外部複製)
  • ドメインの過去のペナルティ歴
  • ドメイン所有者の過去のペナルティ歴
  • ドメイン所有者のその他の特性の過去ペナルティ歴
  • 過去のハッキング歴
  • 301及び404を用いたリダイレクトスパム

その他の要因6個>

  • Googleウェブマスターツールの登録
  • Googleニュースのインデックス履歴
  • Googleブログ検索のインデックス履歴
  • Googleアドワーズ広告利用
  • Google Analyticsの登録
  • サイト名、企業名のブランド

検索アルゴリズムのアップデートの歴史

Googleの検索アルゴリズムの主要アップデートには次のようなものがあります。(アップデートの歴史

  1. フリッツアップデート(2003年)
    インデックス技術の改良によるインデックス完了までの時間短縮
  2. フロリダ / オースティン / ブランデー アップデート(2003年)
    リンクの関連性や権威性を検索アルゴリズムに取り入れる
  3. ビッグダディ(2005年)
    検索基盤のリニューアル
  4. カフェイン(2009年)
    検索基盤のリニューアル
  5. パンダアップデート(2011年)
    コンテンツの品質を再評価するアルゴリズム
  6. ペンギンアップデート(2012年)
    スパムを排除するためのアルゴリズム
  7. ハミングバード(2013年)
    口語調など複雑な検索クエリに対応するアルゴリズム

検索アルゴリズムの精度は、年々向上しています。以前は内容の薄いペラページが上位表示されているのをよく見ましたが、最近は見なくなりました。検索アルゴリズムは一体どこまで進化するのでしょうか。今後が楽しみですね。

コメントを残す

サブコンテンツ

このページの先頭へ