ウェイバックマシンの威力は?
先日紹介した『「ネットの未来」探検ガイド』の中にあった、インターネットアーカイブ・ウェイバックマシンを試してみた。
実は注目していた知財関連訴訟判決が今日出たので、その関連資料をインターネットで見ていたところ、古い新聞記事へのリンクがことごとく切れていたので、「よし、この機会にウェイバックマシンなるものの実力をテストしてみよう!」という気になったという訳。
調べたかったのは、パテントサロンというサイトの職務発明問題トピックスのページ内のリンク先。お目当ての【日立製作所】関連の過去記事を探すと、毎日新聞の記事以外はすべてリンク切れ。(毎日新聞が一番長くリンクを残してくれているってことになるみたいだ。)
そこで、ウェイバックマシン(Wayback Machine)というインターネットアーカイブの出番。これは、全世界のインターネット上の情報を、定期的に、可能な限り保存してしまうというプロジェクト。これにより、現在は消去されている情報であっても、過去のある時点にさかのぼってアクセスできる可能性があることになる。
何はともあれ、Wayback Machineの入力欄に、見たいページのURL(この場合は"www.patentsalon.com/topics/employee/index.html")を入れ、Take Me Back ボタンを押すと、2002/10/27と/12/8、それに2003/1/26のページが保存されているようだ。欲しい情報は2002/11/29以降なので2002/12/8のページを見てみることに。
さて、一見すると現時点とほとんど同じページが表示された(なんとなく日本語ページが出てきただけで感激するなあ)。現時点ではリンク切れになっているところをクリックしてみると、yahoo!は駄目、朝日新聞は違う記事にリンク、日経BiztechはOK、ZDNetもOK、infoseekは駄目、日経新聞は駄目、読売新聞も駄目という結果であった。
ウェイバックマシンで見ている2002/12/8のパテントサロンのページは、URLが"http://web.archive.org/web/20021208102314/http://patentsalon~"となっており、このページ内の各リンクのURLも先頭に"http://web.archive.org/web/20021208102314/"がついている。ところがリンク先のサイトのアーカイブが同じ日付で取られているとは限らないわけで、その辺がどうなっているのか?と思いきや、例えばリンクが繋がっていた日経Biztechのアーカイブ先URLは先頭に"http://web.archive.org/web/20021202132359/"がついているし、ZDNetは"http://web.archive.org/web/20030218081003/"がついている。ということは、結構賢くて、リンク先のページを同じドメイン内の別のアーカイブからも探し出してくるということのようだ。たまたま朝日新聞の場合には、違う年の同じ日付・記事番号の記事があったために、それが引っかかってきたらしい。
ということで、インターネット情報のタイムマシンとなるのか期待されるウェイバックマシンだが、さすがに毎日大量に更新されていくニュースの保存という意味では完全とは言えないようだ。でも普通のページ(って何だ?)については、結構感動ものだし、ともかくどうしても見たいと思ったら、まずはここで探してみるのはとっても有効だと思う。ともかく一度お試しあれ!
*結局ウェイバックマシンでは手に入らなかった場合には、有料コンテンツでDB検索するか、図書館にでも行って新聞縮刷版を見ることになりそうだ。とは言え、たとえインターネット上の情報がリンク切れになっていても、その出所と年月日がわかれば、その大元の情報に何とかたどり着けるから何も無いよりは良しとするか。
| 固定リンク
コメント
偶然、拝見しました。この記事と「『ネットの未来』探検ガイド」の記事にトラックバックさせていただきました。自分で書くよりも適切に書かれたメモを読むというもの、奇妙な気分になるものですねえ・・・よろしくお願いします。
投稿: Ryu-Ha | 2004/02/02 15:56
Ryu-Haさん、こんにちは。トラックバックもしていただいたようで。ちょっと持ち上げられすぎて、恥ずかしい限りですが、ありがとうございます。ココログの初心者なもので、いろいろと良くわからないままに勝手に書き散らしている次第ですが、こうやってネットワークが徐々にというか飛躍的に広がっていくんだな、と実感します。
Ryu-Haさんのブログもざっと目を通させていただきました。とても謙遜されてますが、テクニカルな面も、世の中への興味の持ち方も、私などより数段上です。これを機会に今後ともよろしくお願いします。
投稿: tf2 | 2004/02/02 16:51
先ほどウェイバック・マシンの投稿から上記リンクさせていただきました。TB失敗したのでコチラに…↓
http://longtailworld.blogspot.com/2006/04/webprevent-linkrot-with-wayback.html
確かにこれは実際の調べ物にも威力を発揮しますね。縮刷版やマイクロフィッシュで目をつぶしていた昔からは想像もつかない話です。あと、グーグルのベータ版で検索したら今の検索結果が出ます。まるで羊水と直結してるみたいだな、と妙な感慨を持ちました。
投稿: satomi | 2006/04/23 01:58
コメントありがとうございます。なるほど、アーカイブの中から現在につながるわけですか、面白いというべきか、つまらないというべきか。。 本当は昔の検索エンジンで、その時点での検索結果にたどり着けると、それはそれで面白そうですが。
あと、ウェイバックマシンのデータ保存周期がもっと短くなるとニュース関係などで使い勝手が格段に良くなるのでしょうけど、さすがに情報量が多すぎですかね。
投稿: tf2 | 2006/04/23 19:20