検索エンジンは、どれくらいValidHTMLを評価するのか
いつもは会社の方に書いてるけど、こちらでもテスト。
ArticleDashboardの記事より
Do Search Engines Care About Valid HTML?
直訳すれば「検索エンジンはValidなHTMLを気にするのか」ですが
イマイチ合わないので表題のように変えてみました。
以下がその訳。
ValidなHTMLであることの重要性はあちこちから聞く。その理由はアクセスしたユーザーのサイト内回遊性を高めるから、とかブラウザにとって安定しているから、とか検索エンジンにクロール、インデックスされやすくなるから、などの理由が挙げられる。
しかし、検索エンジンのクローラーにインデックスしてもらうために、サイト内のhtmlを直すことが、どれくらいランキングを向上させるのだろう。どれほどの数のサイトがValidなHTMLを保持しているだろうか?
検索エンジンがどれくらいValidであることに重要度を置いているのか、実験を行ってみることにした。
FireFoxのプラグインである<a href="http://users.skynet.be/mgueury/mozilla/" target="_blank">HTML Validator Extension</a>を用いて、問題のあるHTMLのエラー数も調べられるようにした。
Yahoo!Buzzindexを用い、現在最も検索されているキーワードの上位5つを選ぶことにした。実験の時は「World Cup 2006」「WWE」「FIFA」「Shakira」「Paris Hilton」であった。
これらのキーワードを3大主要検索エンジンで検索することにした。
各々のキーワードに対して、上位10件のサイトのHTML Validationを行い、合計で150の調査結果を作成した。
実験の結果、興味深いことが発見された。150のサイトのうち、わずか7サイトだけ(4.7%)がValidなHTMLであった。
97サイトがエラーとはいかないまでも警告が表示され、46サイトはエラーが見つかった。
また検索エンジンごとに数も違った。
Googleでは50の結果のうちValidだったのは4つ、MSNは50のうち3つ、Yahoo!に関しては0であった。
キーワード別に見ると「Paris Hilton」がもっともValidであった率が高く、7サイトのうちの3つを占めた。
他の評価要素もあることは知っているが、この結果から、トップの検索エンジンではかならずしもValidなHTMLが有効であるとはいえないのではないかと思う。
更に驚くべきことは、その3つの検索エンジン自体がどれもValidではなかったということだ。
ValidなHTMLであることの重要性を、これら3つの検索先陣は学んでいないということだろうか?
MSNの検索結果はValidであったが、Yahoo!のhomeは154の警告が出て、MSNのhomeは65、Googleは22個の警告が出る。
Googleの検索結果ページにいたっては警告だけでなく、6つのエラーが見つかった。
また、最近人気の出てきたESPN.comやIMDBやmySpaceも同様にValidではない。
このことから得られる結論はValidなHTMLの作成では検索順位を上げることは期待できない、ということだ。そのためには他の判定要素を改善するべきであり、影響は非常に低いといわざるを得ない。
Validであることは他の理由においても重要であるが、決して検索結果順位の改善を夢見て行ってはいけない。
Comments
アクセス数アップ、いわゆるSEO対策は、他の部分にあるということですね。参考になりました!
全く無駄ではないと思うんですね。W3CでもValidなマークアップは推奨されていますし、またそもそも論として、あいまいな書き方でもそれなりに見えてしまうHTMLという言語自体がおかしいので(その柔軟性のために爆発的に広まったという点は重要ですけど)、
だからSEOという期待ではなく、あくまでW3Cの定めた例に乗っ取って書いている、という認識でやるのがいいのだと思います。
検索エンジンのパーサーが頑張ってるってことですかね。
でも、ある程度HTMLの論理構造を解析しているわけだから、いつどこで解析エラーが出ていて、
SEOポイント(なんじゃそりゃ)が下がっているかは謎なわけです。
いずれにせよ「有用な外部リンク」の方が価値が高いハズなので、要は微妙な世界で。
でも、差別が難しいサイトで接戦になったときに生きてくるのかもしれません。
なのでValidではなくても、パーサーがエラーを起こさない程度にちゃんとしておくべし、と考えています。
SEOの点から考えれば有用な外部リンクの方が重要でしょうね。
恣意的な順位上げには興味がないし、また一昔前のように、上位表示される価値のない(増すから見た時の)ページを上位に持ってこられても困るので、今くらいの方が丁度良いのだと思います。