新米ウェブマスターのためのウェブマスターブログ

URLに含めるキーワードの最適なSEOとは

2013年11月12日 00:09

url-include-keyword

URLにもキーワードを含めることが、微力ながらユーザビリティとSEOに効果があることは、「URLにも記事に関連するキーワードを含めるSEOは有効?」で述べた通りです。

さて、「キーワード」と一口にいってもその表現は様々です。英語、日本語、和製外来語、和製英語などの言語の選択。キーワードとキーワードの間は、ハイフン(-)とアンダースコア(_)、どちらで連結すべきか。.htmlなどの拡張子は必要なのか。今日はそんなお話です。

 

検索結果に表示されるURLに一致するのはどんな単語か

まずは、検索結果に表示されるURLに一致するのはどんな単語か調査してみました。

日本語で「伊藤博文」と検索してみると、

Wikipediaのページが上位に表示されます。
URLの「伊藤博文」が太字で強調されていることから、検索エンジンがURLも解析していることがわかります。
これが検索結果の順位に影響がないとしても、緑色の太字はなかなか目立つので、クリック率に効果があることは無視できません。

(URLに日本語を使うことのリスクについては後述するとして・・・)

日本語で検索して日本語に一致するのは頷けますが、気になるのは日本語の検索ワードがURL中の英単語に一致するのかどうかです。いくつか検証してみました。

検索ワード URLに含まれる単語
ヒットする ヒットしない
クリスマス クリスマス christmas / xmas
東京 東京 / tokyo
花火 花火 hanabi / fireworks
ホームページ ホームページ / hp homepage
結婚式 結婚式 wedding / marriage / bridal
ウェディング ウェディング / wedding

なんかまちまちといった感じですね。日本語での検索から英単語に結びつく例はほとんどないようです。

日本語を操るユーザをターゲットとしているウェブサイトである限り、URLに「christmas」というキーワードをいくらいれたとしても、ユーザが「クリスマス」で検索すれば意味はない。少なくとも、この記事を書いている現時点ではそういうことになります。
もちろん、ユーザビリティに効果的であることに変わりはないし、今後、認識されるようになる可能性もあります。

また、和製外来語・和製英語はそのままで良いです。
例えば、シュークリーム(chou cream)は英語圏ではクリーム・パフ(cream puff)と呼びます。
これもターゲットが日本語を操るユーザならば、「シュークリーム」と検索して「cream-puff」や「chou-cream」に結びつくかどうかに関わらず、どちらがユーザに伝わるかを優先して考えるべきです。
ユーザビリティを第一に考えている姿勢は検索エンジンに評価されるべきという理屈です。
ちなみに、うっかり英語圏のレストランで「シュークリーム」と注文すると、靴磨きのクリームが皿に盛られて出てくるとか・・・。

単語を区切るのはハイフン(-)?それともアンダースコア(_)?

Tokyo Disneyland

これをURLに挿入する場合、単語と単語をどのように連結すべきでしょうか?
半角スペースは使えませんから、およそ以下のような選択肢になるでしょう。

どれもURLとしては問題ありませんが、ユーザビリティとSEOにとってはどれが望ましいのでしょうか?

まず、12 についてですが、ほとんどの場合、大文字と小文字は区別されるので、両者は別のページとして扱われます。「ほとんどの場合」といったのは、これはウェブサーバの仕様によるものだからです。
みなさんの多くはWindowsを使っているものと思いますが、12 の名前をつけられたファイルを同じ階層に置くことはできないはずです。それが多くのウェブサーバではできるわけです。
また、当然ですが、ドメイン名は大文字と小文字を区別しません。
WordPressの場合、URLを自由に設定できるので、この2つのページを区別して存在させることが可能なわけですが、大文字と小文字の混在は、ユーザにとってもウェブマスターにとっても混乱のもとです。必ずどちらかに統一(小文字が一般的)しましょう。
というわけで、1 はここで消えます。

2 は単語と単語の境がわからないので、やはり読みづらさは否めません。
検索エンジンはちゃんと解析できるのでしょうか?
Googleで「Tokyo Disneyland」と検索すると、

tokyodisney」の部分が一致していると判断されています。
つまり検索エンジンは、検索ワードと完全一致した情報だけを抽出するのではなく、23 のような表現も予測して検索しているということです。とはいっても、ユーザビリティを考えると、やはり区切り文字があった方が良いのではないかと思います。
ということで 2 も消えます。

これでいよいよハイフンかアンダースコアかに絞られたわけですが、Googleにおいては、はっきりとハイフンが好ましいとされています。これはハイフンは文字を分割し、アンダースコアは文字を連結するという解釈に基づいています。
この解釈の裏付けは、以下の例で確認できます。

abcdefg_hijklmnop_qrstuv_wxyz_abcdefg_hijklmnop_qrstuv_wxyz

abcdefg-hijklmnop-qrstuv-wxyz-abcdefg-hijklmnop-qrstuv-wxyz

アンダースコアで連結した場合は、自動改行されずに枠からはみ出してしまうのに対し、ハイフンで連結した場合は、ハイフンの後で自動改行されています。

Googleが推奨するハイフンで連結することが、SEOにどれほどの効果があるかはさておき、決して無視できない問題があります。それは、URLをアンカーテキストにしてリンクを張ったときです。
アンダースコアで連結されたURLは自動改行がされないため、被リンク元のウェブサイトによっては、コンテンツ領域をはみ出してしまうことがあるのです。これではリンクする気も萎えてしまいます。
ドメイン名にアンダースコアを使用できないということからも、ハイフンが好ましいのは明らかなので、単語と単語の連結はハイフンを使うようにしましょう。

日本語のURLのSEO効果は期待できる?

一定の成果は望めるのではないかと思います。
先の「伊藤博文」の例のように、英語ばかりのURLが並んでいる中に、緑色の太字で強調された日本語は非常に目立ちます
用語をそのままURLに用いているWikipediaが多くの上位表示を達成しているので、同じように上位表示が期待できそうな気がしてしまいますが、それは違います。Wikipedia自体の評価が高いからです。日本語のURLだから有利ということは決してありません

また、URLはURLエンコードをしなければなりません。
http://ja.wikipedia.org/wiki/%E4%BC%8A%E8%97%A4%E5%8D%9A%E6%96%87
これはマルチバイトである日本語キーワードの部分をURLエンコードした、Wikipediaの「伊藤博文」のページのURLです。%と英数字で構成された文字列がURLエンコードされた箇所にあたります。
一見めちゃくちゃな暗号のようですが、検索エンジンにはちゃんと「伊藤博文」と見えているので大丈夫です。

アンカーテキストをURLにする場合、アンカーテキストは「http://ja.wikipedia.org/wiki/伊藤博文」で問題ありませんが、href属性はURLエンコードしなければなりません。

<a href="http://ja.wikipedia.org/wiki/%E4%BC%8A%E8%97%A4%E5%8D%9A%E6%96%87">http://ja.wikipedia.org/wiki/伊藤博文</a>

URLエンコードしないと、なぜいけないのか?どんな不都合があるのか?
これらを説明すると長くなりそうなので、この件はまた後日、別の記事でまとめます。
ということで、href属性に日本語キーワードが含まれる場合は、必ずURLエンコードをしましょう!

拡張子は必要なのか

ウェブページの代表といえば.html(.htm)ですよね。
ウェブページには静的ページ(スタティックページ)動的ページ(ダイナミックページ)という2つのタイプがありますが、この拡張子の存在が静的ページであることの証みたいに思っている方も多いのではないかと思います。

では、静的ページと動的ページの違いは何でしょうか?
ウェブページを見ただけで判定する方法の1つがURLの構造です。
静的ページは「www.dolphin-cms.net/tokyo/cafe/195.html」のようなURLです。
これを動的ページらしいURL構造で表現すると、
「www.dolphin-cms.net/index.php?area=tokyo&category=cafe&p=195」
のようになります。areaやcategoryのパラメータを変えることでコンテンツが変わるということから、検索エンジンからは信頼できないページだと判断されたり、パラメータが複雑すぎて解析不能になり、インデックスされない可能性がある。というのがよく目にする解釈なのですが、これを覆す記事がこちら。
http://japan.cnet.com/blog/takawata/2008/09/24/entry_27014847/
まぁ5年も前の記事なのですが、現在もなお、主流は静的URLなので、あまり浸透しなかったということでしょうか。ユーザにとって静的URLの安心感はあります。複雑なパラメータにはどこか怪しさを禁じ得ません。
ともあれ、動的URLだからといって信頼しないわけではないし、インデックスもちゃんとしますよ、ということであれば何も問題はないかと思います。

では、検索エンジンは何をもって、静的ページか動的ページか判断しているのでしょうか?
その答えはURLの構造です。
WordPressで構築されたページは、静的ページのようなURLに偽装が可能(擬似静的化)なだけで、本質的には動的ページです。つまり、検索エンジンはWordPressで構築されたページと、実体のあるhtmlファイルで構築された、本質的に静的であるページとを区別することはできないということです。
クローラが巡回してくれて、インデックスされれば、静的も動的も同じということです。

つまり、拡張子は付けても付けなくてもどちらでも構わない。.htmlを付ける意味は、もはや人間の目を欺くためだけのものだといえます。いくらでも偽装は可能なのですが、.htmlの安心感は、僕にもまだ少し残ってます。
もうひとつだけ利点を挙げるなら、すべてのページをHTMLファイルに起こしてウェブサイト全体を構築しなおすときに、拡張子がついていると楽ですね。

コメント / トラックバック

このエントリーに対するコメント / トラックバックはまだありません。

メールアドレスが公開されることはありません。
*が付いている欄は必須項目です

*
*

次のHTMLタグと属性が使えます : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

トラックバック :

ページの先頭へ