2022年11月21日、Googleが検索アルゴリズムに関する理解を深めてもらうために、新しいドキュメント「A guide to Google Search ranking systems」を公開しました。
主要な検索アルゴリズムのアップデートの一覧が紹介されているほか、現在すでに廃止された、あるいはコアアルゴリズムに組み込まれたものについても触れられています。
また、同時に公開されたブログ記事「Introducing our new guide to Google Search ranking systems」において、アップデートについての用語の整理のアナウンスがありました。
従来、ランキングシステムが新たに導入されたとき、そのシステムに対して「アップデート(update)」という言葉が使われてきたものの、今後は現在稼働しているものを「システム(System)」と呼び、アップデートについては「システムのアップデート(update to the system)」と呼ぶように軌道修正するとのことです。
例を挙げると、今まで「ヘルプフルコンテンツ・アップデート(Helpful Content Update)」と読んできたものは、「ヘルプフルコンテンツ・システムのアップデート(update to the helpful content system)」と表現されることになります。
これは、曖昧でわかりにくい点の多かったGoogleの公開情報が改善されることを意味するので、非常に良いことだと思います。
目次(Table of Contents)
Googleの主要な検索ランキングシステムの一覧
ここから本題に入ります。
公開されたドキュメントを参考にして、Googleの主要な検索ランキングシステムの一覧と、その補足説明をご紹介します。
BERT
BERT(Bidirectional Encoder Representations from Transformers)と呼ばれるAIシステムで、言葉の組み合わせによって生まれる複雑な意味や意図を理解するために使われています。
危機情報システム(Crisis information systems)
個人的な危機や災害などの際に、必要な情報をタイムリーに届けるためのシステムです。
個人の危機
自殺、性的暴行、毒物摂取、薬物依存などのクエリに反応して、信頼のできるコンテンツやホットラインを提供します。
SOSアラート
自然災害などの広範囲な危機状況の際、国や自治体が発する最新情報や緊急時の電話番号、有用なコンテンツを提供します。
重複排除システム(Deduplication systems)
類似したページを排除して検索結果を整理し、有用性を高めるためのシステムです。ウェブマスターによるURL正規化への対応も担っています。
完全一致ドメイン・システム(Exact match domain system)
Googleはドメイン名をランキングのシグナルとして用いますが、クエリとドメインが完全一致しても過度に評価を上げないように調整するためのシステムです。(ドメイン名によるスパムへの対策と言えます)
フレッシュネス・システム(Freshness systems)
最新の情報を期待するクエリに対して、最新のニュースや鮮度の高いコンテンツを優先的に提供するためのシステムです。
ヘルプフルコンテンツ・システム(Helpful content system)
検索エンジンに向けて作られた有用性の低いコンテンツよりも、本当に役立つコンテンツを評価するように設計されたシステムです。
リンク分析システムとページランク(Link analysis systems and PageRank)
ページ間のリンクを分析することによって、ページの内容や有用度を分析します。Googleの検索サービスが当初から持っている中核的なシステムです。
ローカルニュース・システム(Local news systems)
「トップニュース」や「ローカルニュース」などを通じて、ユーザーに役立つローカルなニュースを提供するためのシステムです。
MUM
Multitask Unified Modelの略で、BERTの次を担う高性能なAIシステムです。複雑なクエリから意図を理解し、適切な結果を返すことを目指しています。
まだ開発の初期段階であり、現在はCOVID-19ワクチンに関連する検索結果やスニペットの改善など、特定の用途のみに用いられているとのことです。
ニューラルマッチング(Neural matching)
クエリやページのコンテンツをAIによって解析し、マッチングさせるためのシステムです。
オリジナルコンテンツ・システム(Original content systems)
単に引用したコンテンツではなく、オリジナルコンテンツを高く評価し優先表示するためのシステムです。
削除に基づいた降格システム(Removal-based demotion systems)
Googleはユーザーよりコンテンツの削除の依頼を受け付ける仕組みを持っています。その仕組みを通じて特定のサイトで大量の削除が発生した場合、それをシグナルとして検索結果を改善するためのシステムです。
法的な削除
有効な著作権違反による削除要求を大量に受け取ったサイトの評価を降格させます。名誉毀損、模倣品、裁判所命令によるものも同様です。
個人情報の削除
個人情報の削除を大量に処理したサイトを降格させます。氏名のクエリに対して、同意のない露骨な画像が表示されるのを自動的に保護する機能もあります。
ページエクスペリエンス・システム(Page experience system)
公開されてからWeb業界で大きなテーマとなっている、ページエクスペリエンスに関するシステムです。表示速度が速く、スムーズに操作できるなど、ページ体験の優れたサイトを高く評価します。
SEO対策を行う上では特にCore Web Vitalsの指標が重要とされています。
パッセージランキング・システム(Passage ranking system)
ページ全体ではなく、ページ内の一部分のコンテンツを識別・分析して、関連性の高いクエリに表示するシステムです。
プロダクトレビュー・システム(Product reviews system)
製品レビューに関して、深い分析や洞察を備えた質の高いものや、専門性の高い人によって作られたものを高く評価するシステムです。
ランクブレイン(RankBrain)
単語と概念の関連性を理解して、マッチング度を高めるためのAIシステムです。あるコンテンツを指し示す言葉がクエリに含まれていなくても、適切なコンテンツを返すことができるとされています。
信頼性のある情報提供のシステム(Reliable information systems)
検索結果に信頼性できる情報が不足していたり、品質が十分でなかったりする可能性があるとき、満足度を高めるために自動的にユーザーにアドバイスを行うためのシステムです。
ファクトチェックラベル、ナレッジパネル、強調スニペット、オートコンプリートなどの機能はこのシステムに含まれるようです。
サイトの多様性システム(Site diversity system)
検索結果の上位に同じサイトのページが2つ以上表示されないようにするシステムです。
ただし、特に関連性が高いと判断した場合は、多数のページを表示する場合もあります。
スパム検出システム(Spam detection systems)
インターネット上には膨大で多種多様なスパムが存在します。さまざまなスパム検出システムによって、スパムポリシーに違反するコンテンツや行為に対処します。
退役した検索ランキングシステムの一覧
続いて、退役したシステムを紹介します。
現在すでに廃止されているか、コアランキングシステムに組み込まれたランキングシステムです。
ハミングバード(Hummingbird)
2013年に導入されたもので、単語ではなく長い文章や会話型の文章が入力されたときに、意図を理解して適切な結果を返すためのシステムでした。
モバイルフレンドリー・システム(Mobile-friendly ranking system)
モバイルデバイスで検索したユーザーに対して、モバイル向けのコンテンツを優先的に表示するシステムでした。
現在はページエクスペリエンス・システムに組み込まれました。
ページスピード・システム(Page speed system)
2018年に導入された「スピードアップデート」と呼ばれるもので、モバイル向けに表示速度が速いページを高く評価するシステムでした。
こちらも現在はページエクスペリエンス・システムに組み込まれました。
パンダ・システム(Panda system)
一言で言えば「コピペ禁止」のシステムで、他のWebサイトから文章をコピーしただけの、独自性の低いWebサイトの検索順位が下げられました。
2011年に導入された当時は「パンダアップデート」と呼ばれ、検索順位が大きく入れ替わったためWeb業界で大きな話題になりました。
2015年にコアランキングシステムに組み込まれました。
ペンギン・システム(Penguin system)
2012年に導入されたもので、「ペンギンアップデート」と呼ばれました。
当時横行していた、キーワードを詰め込んだページや、アクセスを伴わない被リンクなどのSEOスパム(ブラックハットSEO)に対処するためのシステムでした。
2016年にコアランキングシステムに組み込まれました。
セキュアサイト・システム(Secure sites system)
2014年に導入されたもので、暗号化されたサイト(https~のサイト)を高く評価しました。
現在はページエクスペリエンス・システムに組み込まれました。