コンテンツにスキップ

ウェイバックマシン

出典: フリー百科事典『ウィキペディア(Wikipedia)』
Wayback Machineから転送)
ウェイバックマシン
Wayback Machine
スクリーンショット
URL web.archive.org ウィキデータを編集
言語 英語
タイプ アーカイブ
事業地域 世界中(中国とロシア、北朝鮮を除く)
運営者 Internet Archive
登録 任意
開始 2001年10月24日 (23年前) (2001-10-24)[1][2]
現在の状態 閲覧のみ(DDOS攻撃により10日に停止、閲覧のみ再開している。)
プログラミング言語 JavaPython

ウェイバックマシンWayback Machine)は、インターネット上のWorld Wide Webやその他情報を扱うデジタルアーカイブアメリカ合衆国カリフォルニア州サンフランシスコにある非営利団体インターネットアーカイブ2001年にサービスを開始した。

歴史

[編集]

2001年、インターネットアーカイブの創設者であるブリュースター・ケールブルース・ギリアット英語版がウェブサイトのコンテンツが閉鎖やサイトリニューアルなどで消失する問題に対処するために立ち上げた[3]。このサービスでユーザーは「three dimensional index」と呼ばれる時間別のウェブページアーカイブを閲覧することができる[4]。ケールとギリアットはインターネットの全てをアーカイブすることと「全ての知識へのユニバーサルアクセス」を提供することを目標にウェイバックマシンを開発した[5]

「Wayback Machine」の名はアニメーション作品「ロッキーとブルウィンクルの大冒険」に登場するキャラクターのミスター・ピーボディとシャーマンが使用する「WABACマシン」(WABACはウェイバックと発音)というタイムトラベルマシンが由来である[6][7]。シリーズ作品の1つである「Peabody's Improbable History」では日常的にWABACマシンを使って度々有名な歴史上の出来事を目の当たりにするだけでなく直接的に関与し改変したりしている。

ウェブページのキャッシュをアーカイブする作業は5年後に一般公開することを目標に1996年から始まっている。 1996年から2001年まで、集められた情報は不完全ながらデータベースとしてデジタルテープで保存されていて、ケールは研究者や科学者がアクセスできるようにしていた[8]。アーカイブが5周年を迎えた2001年に一般公開を迎え、カリフォルニア大学バークレー校にて記念式典が行われた[9]。サービス開始時点で既にアーカイブページが10億ページ以上に及んでいた[10]

データはインターネットアーカイブが所有するLinuxノードの大規模クラスタに保存されているが[5]、時折ウェブページに再アクセスし新しいバージョンをアーカイブしている(下部の技術的詳細参照)[11]。またウェイバックマシン側がウェブサイトを「クロール」して保存できる場合に手動で検索ボックスにウェブサイトのURLを入力してキャプチャーすることができる。

2024年10月9日、親パレスチナ派のハクティビスト集団「SN_BlackMeta」からのDDoS攻撃によって3100万人分の利用者情報(ユーザー名、メールアドレス、暗号化されたパスワードなど)が流出、Internet Archive運営は「Wayback Machine」などのサービスをオフラインにし利用停止状態となった[12][13][14]

2024年10月14日、「Wayback Machine」が暫定的に読み取り専用モードで復旧した[15]

技術的詳細

[編集]

ウェブをクロールし、一般にアクセスできるWorld Wide Webページの全て、Gopherヒエラルキー、ネットニュース(Usenet)掲示板システム、ダウンロード可能なソフトウェアを収集するために開発されたソフトウェアが「クローラー」である[16]。「クローラー」によって収集された情報はインターネット上にある情報が全て含まれているわけではなく公開者によって制限されているかアクセスできないデータベースに保存されているデータがある。部分的にキャッシュされたウェブサイトの矛盾を解決するために、2005年にインターネットアーカイブがArchive-It.orgという機関やコンテンツ制作者がデジタルコンテンツコレクションを収集して保存しデジタルアーカイブを作成するシステムを開発した[17]

クロールは様々なソースで構築されていて一部は第三者から移入されたものやアーカイブによって内部生成されたものもある[11]。たとえばアルフレッド・P・スローン財団アレクサ・インターネットが構築したクロールやアメリカ国立公文書記録管理局インターネット・メモリー財団英語版の代理としてインターネットアーカイブが運用しているクロールや、コモン・クロールのミラーがある[11]。2010年より「Worldwide Web Crawls」が作動していて世界中のウェブをキャプチャーしている[18][11]

スナップショットの取得頻度はウェブサイトによって異なっていて[11]、「Worldwide Web Crawls」内のウェブサイトはクロール毎に一回アーカイブされたサイトがある「クロールリスト」に含まれている[11]。たとえば「Wide Crawl Number 13」は2015年1月9日に始まり、2016年7月11日に完成した[19]。しかし、複数のクロールがある時点で同時進行していることがあり、また特定のサイトが複数のクロールリストに含まれるため、サイトのクロール頻度が大きく異なることが多い[11]

ストレージ容量と成長

[編集]

長年に渡る技術発展のように、ウェイバックマシンのストレージ容量は増大している。一般公開から2年後の2003年時点で、ウェイバックマシンの容量は月に12TB(テラ バイト)増加している。データはインターネットアーカイブ職員がカスタムデザインしたPetaBoxラックシステムに保存されている。最初の100TBのラックは2004年6月に本格稼働したが、間もなくさらなる容量のストレージが必要になることが判明した[20][21]

2009年にインターネットアーカイブは自身のカスタマイズしたストレージアーキテクチャをSun Open Storage英語版に移行し、サン・マイクロシステムズのカリフォルニアキャンパスにあるSun Modular Datacenterの新たなデータセンターで管理することになった[22]。2009年時点で、ウェイバックマシンは約3PB(約3000TB)のデータで構成されていて、毎月100TB(0.1PB)(ペタ バイト)の割合で増加していた[23]

2011年、インターフェイスやアーカイブされたコンテンツの索引が更新されたウェイバックマシンの新しいかつ改善されたバージョンの公開テストが行われた[24]。同年3月、ウェイバックマシンフォーラムにて「ウェイバックマシン新バージョンのベータ版は2010年に全てのクロールされたデータのインデックスが更新されより完全なものとなり、定期的に更新を続けている。古いウェイバックマシンには2008年になっても僅かなデータしかなく、これ以上インデックスを更新する予定もなく、今年運用終了する予定である。」と発表された[25]。また2011年、インターネットアーカイブは6組のPetaBoxラックを導入したことで、ウェイバックマシンのストレージ容量は700TB(0.7PB)増加した[26]

2013年1月、URLが2,400億に達したと発表した[27]。同年10月、ユーザーがURLを入力するだけでウェブサイトをアーカイブできる「Save a Page」機能を発表したが[28]、この機能は悪意あるバイナリをダウンロードさせる手口に悪用される脅威となった[29][30]

2014年12月時点で、ウェイバックマシンはウェブページが4,350億、データ容量が約9PBとなり、週で20TB(0.02PB)増える割合になった[10][31][32]

2016年7月、データ容量が約15PBに達したと発表した[33]

2018年9月、データ容量が25PB以上に達した[34][35]

2020年12月、データ容量が70PB以上に達した[36]

2023年3月、ウェイバックマシンにアーカイブされているサイトの数が8000億に達した[37]

成長

[編集]

2013年10月から2015年3月の間、アレクサの全世界ランクは163[38]から208[39]に推移している。

2022年8月にはページ数が7200億件を突破。

2023年中にはページ数が1兆に達すると言われている。

ウェイバックマシンの成長[40][41]
ウェイバックマシンの年別 アーカイブページ数
2005
40,000,000,000
2008
85,000,000,000
2012
150,000,000,000
2013
373,000,000,000
2014
400,000,000,000
2015
452,000,000,000
2016
459,000,000,000
2017
279,000,000,000
2018
310,000,000,000
2019
345,000,000,000
2020
405,000,000,000
2021
514,000,000,000
2022
640,000,000,000

ウェブサイト除外規定

[編集]

歴史的に、ウェイバックマシンはRobots Exclusion Standard(robots.txt)の設定でウェブサイトをクロールできるかできないか、既にクロールされているか、そのウェブサイトのアーカイブが一般向けに閲覧できるかを判断している。ウェブサイト管理者は任意でrobots.txtを使ってウェイバックマシンをオプトアウトするか設定できる。robots.txtの設定を遡及的に適用していて、もしインターネットアーカイブをブロックしている場合、そのドメインから過去にアーカイブされたページも直ちに利用できなくなる。加えて、インターネットアーカイブは「時々ウェブサイト管理者が、我々に直接連絡したり、サイトのクロールやアーカイブを止めるように求めることがあり、この要求に我々は従っている。」と声明している[42]。さらに、「インターネットアーカイブは自身の資料をコレクションに追加することを望まない人のウェブサイトやその他インターネットドキュメントを保存したり提供することは考えていない。」とも述べている[43][44]

Oakland Archiveの規定

[編集]

Waybackの遡及的除外規定は2002年にカリフォルニア大学バークレー校の情報管理学部が出した、ウェブサイト管理者がサイトのアーカイブへのアクセスを阻止する権利について書かれている「Recommendations for Managing Removal Requests and Preserving Archival Integrity」の一部に基づいている[45]。Waybackは高額訴訟を避けるためにこの規定を遵守している[46]

しかし、2017年にWaybackの遡及的除外規定が緩和され、アメリカ合衆国の政府や軍のウェブサイト両方のrobots.txtの設定に従わずクロールを行いウェブページを閲覧できるようにした。2017年4月時点で、robots.txtの無視は拡大し米国政府のウェブサイトに留まらなくなっている[47][48][49][50]

利用

[編集]

一般向けに利用開始された2001年以降、ウェイバックマシンによるデータの収集と保存方法やアーカイブにある現行のページに関して学者によって研究されている。2013年時点で、ウェイバックマシンに関する論文は約350件ありほとんどは情報技術、図書館科学、社会科学の分野で著されている。社会科学学者は1990年代から現在までの間のウェブサイト開発が企業の成長に与えた影響を分析するためにウェイバックマシンを活用している[10]

ウェイバックマシンがページをアーカイブした時、通常ほとんどのハイパーリンクが収集されておりネットの不安定性さが原因で壊れている可能性があってもそれらのリンクは保持される。インドの研究者はオンライン学術出版のハイパーリンクを保存するためのウェイバックマシンの能力の有効性を研究していて、実際保存されていたのはほぼ半分という結果を得た[51]

ジャーナリストも削除されたウェブサイトや日にちの経った報道記事を閲覧したりウェブサイトコンテンツに変えるためにウェイバックマシンを使用している。得られたコンテンツは政治家に説明責任を求め、論争の場での嘘を暴くことに活用されている[52]。2014年、ウクライナからの分離独立を目指す組織のトップであるイーゴリ・ストレルコフは自身のソーシャルメディアページでの投稿で、実際は民間のマレーシア航空機だったことが判明する前にウクライナ軍機と疑われる軍用機を自軍が撃墜したことを自慢していたものの、後にその投稿を削除しウクライナ軍が撃墜したと非難したがその削除した投稿がアーカイブに残っていた[52][53]。2017年、ホワイトハウスのウェブサイトから気候変動に関する全ての参照文献が削除されたことがArchive.orgの閲覧を通して発覚しこれがredditで議論になったことが科学のための行進英語版の原因となった。「科学者はワシントンでデモを起こす必要がある。」というユーザーのレスポンスがあった[54][55][56]

制限

[編集]

ウェイバックマシンは多機能であるがいくつかの制限も存在する。2014年、ウェブサイトがクロールされてウェイバックマシンで閲覧できるようになるまで6ヶ月ものタイムラグがあった[57]。2018年時点ではタイムラグは3時間から10時間である[58]。ウェイバックマシンではユーザーがウェブサイトを閲覧するためにはURLを把握する必要がある[59]

またウェイバックマシンはウェブクローラーの制限により常に作成されたウェブページが全て収録されるわけではない上、FlashプラットフォームやJavaScriptで書かれたフォームといったインタラクティブ機能はホストウェブサイトとの対話が必要なため完全にアーカイブできない。ウェブクローラーはHTML(またその派生の一種)でコードされていないものを取り出すのが困難なため結果的にハイパーリンクが壊れたり画像が失われることも多い。さらに、ウェブクローラーは他のどのサイトからもリンクされていない「孤立ページ」をアーカイブすることもできない[60][59]。ウェイバックマシンの運用を定めた特定の規則によって設定されているハイパーリンクの深さ制限により全てのページの全ハイパーリンクをアーカイブすることもできない[18]

一部の管理者は自身のウェブサイトにrobots.txtというファイルを置くことでウェイバックマシンが発見しアーカイブすることを防いでいる。さらに、ウェブサイト管理者はインターネットアーカイブに直接問い合わせたりアーカイブからのページの削除を求めることもできる[60]

法的根拠

[編集]

民事訴訟

[編集]
Netbula LLC v. Chordiant Software Inc.
[編集]

2009年の訴訟である「Netbula, LLC v. Chordiant Software Inc.」では被告のChordiantはNetbulaにウェイバックマシンが遡ってNetbulaのサイトのアーカイブページの過去版へのアクセスを不能にしているとしてウェブサイトに置かれたrobots.txtの強制的な撤去を求めた。そのページにはChordiantがこの訴訟で有利になる材料があると考えていた[61]

Netbulaは自社のウェブサイトを改ざんしようとしているとして申立に反対し、インターネットアーカイブを直接呼び出さなければならないと主張した[62]。インターネットアーカイブの職員はChordiantの申立を支持する意見書を提出したが、「著しい負担や費用、業務の中断無し」に他の手段でウェブページを作成することはできないとも述べている[61]

カリフォルニア州北地区サンノゼ管区のハワード・ロイド判事はNetbulaの申立は退けたものの、ChordiantにNetbulaが求めるアーカイブページにアクセスできるように一時的にrobots.txtの無効化を求めた[61]

ポーランド・テレビ
[編集]

2004年10月の訴訟である、「Telewizja Polska USA, Inc. v. Echostar Satellite」, No. 02 C 3293, 65 Fed. R. Evid. Serv. 673(N.D. Ill. October 15, 2004)は、訴訟の当事者がウェイバックマシンのアーカイブを有効な証拠の典拠とした初めての裁判とされている。Telewizja PolskaはTVPポロニア英語版のプロバイダでエコースター英語版ディッシュ・ネットワークを運営している。裁判の手続きの前に、エコースターはTelewizja Polskaウェブサイトの過去のコンテンツの証拠になるウェイバックマシンのスナップショットを提出しようとしたが、Telewizja Polskaは伝聞証拠禁止の原則や認証されていない典拠であることを理由にスナップショットを採用しないように予備的申し立て英語版を行ったが、アランダー・キーズ判事はTelewizja Polskaによる伝聞証拠禁止の原則の主張を退け、TVPの裁判での証拠としての除外を求める予備的申し立てを認めなかった[63][64]

特許法

[編集]

いくつかの追加要件(たとえば記録保管者の正式な声明の提供)が満たされていることを条件に、米国特許商標庁欧州特許庁は提供されたウェブページが公にアクセスできていたことを示す証拠となるインターネットアーカイブからのデータ印を承認している。これらの日付はたとえば特許出願審査で、ウェブページが先行技術英語版として利用可能かどうかを決定するのに活用される[65]

実用性の制限

[編集]

ウェブサイトのアーカイブには技術的制限があり、その結果として、訴訟相手がウェブサイトのアーカイブによってもたらされた結果を悪用することがある。この問題は基礎となるリンクが公開されていない故にエラーを含んでいる可能性がある場合において、ウェブページのスクリーンショットが問題、回答や専門家の証人の報告として提出してしまうことで悪化することもある。たとえばウェイバックマシンなどのアーカイブはフォームに書き込みしないゆえに、アーカイブにおいて非RESTful英語版電子商取引データベースは含まれない[66]

法的地位

[編集]

欧州では、ウェイバックマシンは著作権法に違反する可能性があると言われている。コンテンツの公開や複製を決めることができるのはそのコンテンツの作成者のみであり、インターネットアーカイブは作成者から削除要求が来たら削除しなければならないとされる[67]。ウェイバックマシンの除外規定は公式サイトのFAQページに書かれている[68]

アーカイブされたコンテンツの法的問題

[編集]

Wayback Machineのアーカイブ活動に関してインターネットアーカイブに対する訴訟が数多く起こされている。

サイエントロジー

[編集]

2002年後半、インターネットアーカイブはウェイバックマシンから新興宗教 サイエントロジーを批判する複数のサイトを削除した[69]。この時サイト所有者の要求により削除した旨のエラーメッセージが表示されたが[70]、その後実際に削除を要求したのはサイエントロジー教会 (enの弁護士でありサイト所有者は削除を望んでいなかったことが明らかになった[71]

Healthcare Advocates, Inc.

[編集]

2003年、Harding Earley Follmer & Fraileyはウェイバックマシンを活用して商標問題からクライアントを弁護した。弁護士は数年前のウェブサイトの内容によって原告の主張は無効であることを論証することに成功した。原告のHealthcare Advocatesはデジタルミレニアム著作権法コンピュータ犯罪取締法英語版違反を含む著作権侵害を糾弾するために申し立ての相手にインターネットアーカイブを含む修正を申告した。また、Healthcare Advocatesは自身のウェブサイトにrobots.txtを導入して以降、最初の訴訟が提起された後もインターネットアーカイブはウェイバックマシンから自身のウェブサイトの過去のコピーを全て削除するべきなのに一部は未だに閲覧可能であると主張した[72]。この訴訟は法廷外で解決していて、その後ウェイバックマシンで問題が修正された[73]

スザンヌ・シェル

[編集]

活動家のスザンヌ・シェル英語版は2005年12月、1999年から2004年まで自身のウェブサイトの profane-justice.org をアーカイブしていたとして10万ドルの賠償を求めインターネットアーカイブを提訴した[74][75]。インターネットアーカイブは2006年1月20日、カリフォルニア北部地区連邦地方裁判所英語版にシェルの著作権を侵害していないという判決を求める確認訴訟英語版を起こした。これに対してシェルは自身の利用規約英語版に違反していると主張する形でインターネットアーカイブを反訴した[76]。2007年2月13日、コロラド州連邦地方裁判所英語版裁判官は契約違反を除き全ての反訴を退けた[75]。インターネットアーカイブはコピー行為により著作権侵害が生じたというシェルの主張を退けることは望まなかった[77]

2007年4月25日、インターネットアーカイブとスザンヌ・シェルは共同で和解を発表した[74]。インターネットアーカイブは「…自身のウェブコンテンツをアーカイブされたくない人の資料をウェイバックマシンに入れようとは考えていない。我々はシェル氏が自身のウェブサイトに関する有効かつ法的効力のある著作権を有することを認識しており、ウェイバックマシンに彼女のウェブサイトのコンテンツを収集したことによって訴訟になってしまったことを遺憾に思う。」と、シェルは「私はインターネットアーカイブの目標の歴史的価値に敬意を表しており、その目標を阻害したり損害を与えるつもりはなかった。」と述べた[78]

検閲とその他の問題

[編集]

Archive.orgは現在中国でブロックされている[79][80]。暗号化されたHTTPSプロトコルに対応した後、2015年にインターネットアーカイブはロシア全域でブロックされた英語版[81][82][52]

Library Freedom Projectのアリソン・マクリーナ長官は「図書館員は個人のプライバシーは重視しているものの、検閲には強く反対している。」と述べている[52]

他の脅威には自然災害[83]、サイトのユーザーに対する監視がある[84]

ケヴィン・ヴォーンは「我々の技術的文明に継続性がある場合」に「何も手を加えられていないデータの多くが検索可能」なら「何もない」世代の長期利用において有効な方法で生き残れると考えるとしている[85]

インターネットアーカイブには、長期的なインフラストラクチャが無くてもデータが消失する前に熱心にキャプチャーするために[86]長期間構築し続けていると記述されているとされる[87]

類似サービス

[編集]

脚注

[編集]
  1. ^ WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools”. WHOIS. May 14, 2020時点のオリジナルよりアーカイブMarch 13, 2016閲覧。
  2. ^ InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools”. WHOIS. May 12, 2020時点のオリジナルよりアーカイブMarch 13, 2016閲覧。
  3. ^ Notess, Greg R. (March–April 2002). “The Wayback Machine: The Web's Archive”. Online 26: 59–61. 
  4. ^ “The Wayback Machine”, Frequently Asked Questions, オリジナルのSeptember 18, 2018時点におけるアーカイブ。, https://web.archive.org/web/20180918131957/https://archive.org/about/faqs.php#The_Wayback_Machine September 18, 2018閲覧。 
  5. ^ a b "20,000 Hard Drives on a Mission | Internet Archive Blogs". blog.archive.org (アメリカ英語). 2018年10月20日時点のオリジナルよりアーカイブ。2018年10月15日閲覧
  6. ^ Green, Heather (February 28, 2002). “A Library as Big as the World”. BusinessWeek. オリジナルの2011年12月20日時点におけるアーカイブ。. https://web.archive.org/web/20111220074306/http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm 
  7. ^ Tong, Judy (September 8, 2002). “Responsible Party – Brewster Kahle; A Library Of the Web, On the Web”. New York Times. オリジナルのFebruary 20, 2011時点におけるアーカイブ。. https://web.archive.org/web/20110220181725/http://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html August 15, 2011閲覧。 
  8. ^ Cook, John (November 1, 2001). “Web site takes you way back in Internet history”. Seattle Post-Intelligencer. オリジナルのAugust 12, 2014時点におけるアーカイブ。. https://web.archive.org/web/20140812205508/http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php August 15, 2011閲覧。 
  9. ^ “Wayback Goes Way Back on Web”. Wired. (October 28, 2001). オリジナルのOctober 16, 2017時点におけるアーカイブ。. https://web.archive.org/web/20171016225914/https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ October 16, 2017閲覧。. 
  10. ^ a b c Arora, Sanjay K.; Li, Yin; Youtie, Jan; Shapira, Philip (May 5, 2015). “Using the wayback machine to mine websites in the social sciences: A methodological resource” (英語). Journal of the Association for Information Science and Technology 67 (8): 1904–1915. doi:10.1002/asi.23503. ISSN 2330-1635. 
  11. ^ a b c d e f g Kalev Leetaru (28 January 2016). "The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web". Forbes. 2017年10月16日時点のオリジナルよりアーカイブ。2017年10月16日閲覧
  12. ^ 「Wayback Machine」のInternet Archiveから3100万人のユーザーデータ漏えい」『ITmedia』2024年10月10日。2024年10月11日閲覧。
  13. ^ Internet Archive、ダウンは続くも「データは破損していない」”. ITmedia NEWS. 2024年10月11日閲覧。
  14. ^ 「Internet Archive」がDDoS攻撃でダウン--3100万件のアカウント情報が漏えい”. ZDNET Japan (2024年10月11日). 2024年11月2日閲覧。
  15. ^ Internet Archiveの「Wayback Machine」が復旧--ただし制限あり”. ZDNET Japan (2024年10月15日). 2024年11月2日閲覧。
  16. ^ Kahle, Brewster. "Archiving the Internet". Scientific American – March 1997 Issue. 2012年4月3日時点のオリジナルよりアーカイブ。2011年8月19日閲覧
  17. ^ Jeff Kaplan (27 October 2014). "Archive-It: Crawling the Web Together". Internet Archive Blogs. 2017年10月12日時点のオリジナルよりアーカイブ。2017年10月16日閲覧
  18. ^ a b "Worldwide Web Crawls". Internet Archive. 2017年10月19日時点のオリジナルよりアーカイブ。2017年10月16日閲覧
  19. ^ "Wide Crawl Number 13". Internet Archive. 2017年10月19日時点のオリジナルよりアーカイブ。2017年10月16日閲覧
  20. ^ "Internet Archive: Petabox". archive.org (英語). 2018年10月25日閲覧
  21. ^ Kanellos, Michael (July 29, 2005). “Big storage on the cheap”. CNET News.com. オリジナルのApril 3, 2007時点におけるアーカイブ。. https://web.archive.org/web/20070403030705/http://news.zdnet.com/2100-9584_22-5808754.html July 29, 2007閲覧。 
  22. ^ "Internet Archive and Sun Microsystems Create Living History of the Internet". サン・マイクロシステムズ. 25 March 2009. 2009年3月26日時点のオリジナルよりアーカイブ。2009年3月27日閲覧
  23. ^ Mearian, Lucas (March 19, 2009). “Internet Archive to unveil massive Wayback Machine data center”. Computerworld.com. オリジナルの2009年3月23日時点におけるアーカイブ。. https://web.archive.org/web/20090323093002/http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top March 22, 2009閲覧。 
  24. ^ "Updated Wayback Machine in Beta Testing". Archive.org. 2011年8月23日時点のオリジナルよりアーカイブ。2011年8月19日閲覧
  25. ^ "Beta Wayback Machine, in forum". Archive.org. 2014年4月17日時点のオリジナルよりアーカイブ。2014年4月16日閲覧
  26. ^ "Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used". archive.org (英語). 2016年10月24日時点のオリジナルよりアーカイブ。2018年10月25日閲覧
  27. ^ "Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs". Blog.archive.org. 9 January 2013. 2014年4月14日時点のオリジナルよりアーカイブ。2014年4月16日閲覧
  28. ^ Rossi, Alexis (25 October 2013). "Fixing Broken Links on the Internet". archive.org. San Francisco, CA, US: Collections Team, the Internet Archive. 2014年11月7日時点のオリジナルよりアーカイブ。2015年3月25日閲覧We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.
  29. ^ The VirusTotal Team (25 March 2015). "207.241.226.190 IP address information". virustotal.com. Dublin 2, Ireland: VirusTotal. 2014年7月14日時点のオリジナルよりアーカイブ。2015年3月25日閲覧2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe
  30. ^ Advisory provided by Google (25 March 2015). "Safe Browsing Diagnostic page for archive.org". google.com/safebrowsing. Mountain View, CA, US: Google. 2015年4月6日時点のオリジナルよりアーカイブ。2015年3月25日閲覧2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).
  31. ^ "Internet Archive Frequently Asked Questions". 2009年10月21日時点のオリジナルよりアーカイブ。2015年1月17日閲覧
  32. ^ "Internet Archive Frequently Asked Questions". 18 December 2014. 2014年12月18日時点のオリジナルよりアーカイブ。2018年12月13日閲覧
  33. ^ "Can the manipulation of big data change the way the world thinks?". The National. 2017年1月12日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  34. ^ Crockett, Zachary (September 28, 2018). “Inside Wayback Machine, the internet’s time capsule” (英語). The Hustle. オリジナルのOctober 2, 2018時点におけるアーカイブ。. https://web.archive.org/web/20181002145800/https://thehustle.co/inside-wayback-machine-internet-archive October 26, 2018閲覧。 
  35. ^ Heffernan, Virginia (September 18, 2018). “Things Break and Decay on the Internet—That's a Good Thing” (英語). WIRED. オリジナルのSeptember 25, 2018時点におけるアーカイブ。. https://web.archive.org/web/20180925130510/https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/ October 26, 2018閲覧。 
  36. ^ Donate to the Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine” (英語). adafruit. December 2, 2020時点のオリジナルよりアーカイブ。December 2, 2020閲覧。
  37. ^ Wayback Machine”. web.archive.org. 2023年3月4日閲覧。
  38. ^ "Archive.org Site Info". Alexa Internet. 2013年10月28日時点のオリジナルよりアーカイブ。2013年10月29日閲覧
  39. ^ "Archive.org Site Overview". Alexa Internet. 2015年4月9日時点のオリジナルよりアーカイブ。2015年4月9日閲覧
  40. ^ michelle (9 May 2014). "Wayback Machine Hits 400,000,000,000!". Internet Archive. 2014年8月26日時点のオリジナルよりアーカイブ。2015年3月25日閲覧
  41. ^ "web.archive.org 2015年2月13日時点のアーカイブ". Internet Archive. 2015年2月13日時点のオリジナルよりアーカイブ。2015年3月25日閲覧
  42. ^ Some sites are not available because of Robots.txt or other exclusions Archived April 15, 2011, at the Wayback Machine.
  43. ^ How can I remove my site's pages from the Wayback Machine? Archived April 17, 2014, at the Wayback Machine.
  44. ^ Cox, Joseph (May 22, 2018). “The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers”. オリジナルのMay 23, 2018時点におけるアーカイブ。. https://archive.is/20180522192132/https://motherboard.vice.com/en_us/article/nekzzq/wayback-machine-deleting-evidence-flexispy May 23, 2018閲覧。 
  45. ^ "Recommendations for Managing Removal Requests And Preserving Archival Integrity". University of California. 14 December 2002. 2017年9月18日時点のオリジナルよりアーカイブ。2017年9月14日閲覧
  46. ^ "Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy". Internet Archive. 7 July 2014. 2017年10月10日時点のオリジナルよりアーカイブ。2017年9月14日閲覧
  47. ^ Mark Graham (17 April 2017). "Robots.txt meant for search engines don't work well for web archives". Internet Archive Blogs. 2017年4月17日時点のオリジナルよりアーカイブ。2017年4月16日閲覧
  48. ^ "Archivierung des Internets: Internet Archive ignoriert künftig robots.txt" (ドイツ語). heise online. 2017年4月27日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  49. ^ "Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de" (ドイツ語). 2017年6月19日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  50. ^ "Internet Archive will ignore robots.txt files to keep historical record accurate". Digital Trends. 24 April 2017. 2017年5月16日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  51. ^ Sampath Kumar, B.T.; Prithviraj, K.R. (October 21, 2014). “Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs” (英語). Journal of Information Science 41 (1): 71–81. doi:10.1177/0165551514552752. ISSN 0165-5515. 
  52. ^ a b c d "Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed". 2017年1月6日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  53. ^ "What the Web Said Yesterday". The New Yorker. 2015年1月25日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  54. ^ "The March for Science began with this person's 'throwaway line' on Reddit". Washington Post. 2017年4月23日時点のオリジナルよりアーカイブ。2017年4月23日閲覧
  55. ^ "Are scientists going to march on Washington?". The Washington Post. 2017年1月31日時点のオリジナルよりアーカイブ。2017年1月31日閲覧
  56. ^ Foley, Katherine Ellen. "The global March for Science started with a single Reddit thread". Quartz. 2017年4月24日時点のオリジナルよりアーカイブ。2017年4月23日閲覧
  57. ^ "Internet Archive Frequently Asked Questions". Internet Archive. 2 April 2014. 2014年4月2日時点のオリジナルよりアーカイブ。2018年11月23日閲覧
  58. ^ "Internet Archive Frequently Asked Questions". archive.org (英語). 2018年11月23日閲覧
  59. ^ a b Bates, Mary Ellen (2002). “The Wayback Machine”. Online 26: 80. 
  60. ^ a b "Internet Archive Frequently Asked Questions". archive.org (英語). 2013年4月20日時点のオリジナルよりアーカイブ。2018年10月18日閲覧
  61. ^ a b c Lloyd, Howard (October 2009). "Order to Disable Robots.txt" (PDF). 2011年5月13日時点のオリジナル (PDF)よりアーカイブ。2009年10月15日閲覧
  62. ^ Cortes, Antonio (October 2009). "Motion Opposing Removal of Robots.txt". 2010年10月27日時点のオリジナルよりアーカイブ。2009年10月15日閲覧
  63. ^ Gelman, Lauren (17 November 2004). "Internet Archive's Web Page Snapshots Held Admissible as Evidence". Packets. 2 (3). 2011年4月30日時点のオリジナルよりアーカイブ。2007年1月4日閲覧
  64. ^ Howell, Beryl A. (February 2006). "Proving Web History: How to use the Internet Archive" (PDF). Journal of Internet Law: 3–9. 2010年7月5日時点のオリジナル (PDF)よりアーカイブ。2008年8月6日閲覧
  65. ^ Wynn W. Coggins (Fall 2002). "Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?". USPTO. 2012年9月21日時点のオリジナルよりアーカイブ。2020年7月20日閲覧
  66. ^ "Debunking the Wayback Machine". 2010年6月29日時点のオリジナルよりアーカイブ。2020年7月20日閲覧
  67. ^ Bahr, Martin (2002). "The Wayback Machine und Google Cache - eine Verletzung deutschen Urheberrechts?". JurPC (ドイツ語). doi:10.7328/jurpcb/20021719. 2009年8月23日時点のオリジナルよりアーカイブ。2020年7月20日閲覧
  68. ^ "Internet Archive FAQ". Archive.org. 2014年4月17日時点のオリジナルよりアーカイブ。2014年4月16日閲覧
  69. ^ Bowman, Lisa M (September 24, 2002). “Net archive silences Scientology critic”. CNET News.com. オリジナルのMay 15, 2012時点におけるアーカイブ。. https://web.archive.org/web/20120515210932/http://news.cnet.com/2100-1023-959236.html January 4, 2007閲覧。 
  70. ^ Jeff (23 September 2002). "exclusions from the Wayback Machine" (Blog). Wayback Machine Forum. Internet Archive. 2007年2月11日時点のオリジナルよりアーカイブ。2007年1月4日閲覧 Author and Date indicate initiation of forum thread.
  71. ^ Miller, Ernest. "Sherman, Set the Wayback Machine for Scientology". LawMeme. Yale Law School. 2012年11月16日時点のオリジナル (Blog)よりアーカイブ。2007年1月4日閲覧
  72. ^ Dye, Jessica (2005). “Website Sued for Controversial Trip into Internet Past”. EContent. 28 (11): 8–9. 
  73. ^ Bangeman, Eric (August 31, 2006). “Internet Archive Settles Suit Over Wayback Machine”. Ars technica. オリジナルのNovember 5, 2007時点におけるアーカイブ。. https://web.archive.org/web/20071105205430/http://arstechnica.com/news.ars/post/20060831-7634.html November 29, 2007閲覧。. 
  74. ^ a b Internet Archive v. Shell, 505 F.Supp.2d 755 at justia.com, 1:2006cv01726 (Colorado District Court August 31, 2006) (“'April 25, 2007 Settlement agreement announced.' Filing 65, 2007-04-30: '...therefore ORDERED that this matter shall be DISMISSED WITH PREJUDICE...'”).
  75. ^ a b Babcock, Lewis T., Chief Judge (13 February 2007). "Internet Archive v. Shell Civil Action No. 06cv01726LTBCBS" (PDF). 2014年1月25日時点のオリジナルよりアーカイブ (PDF)。2015年3月25日閲覧1) Internet Archive's motion to dismiss Shell's counterclaim for conversion and civil theft (Second Cause of Action) is GRANTED, 2) Internet Archive's motion to dismiss Shell's counterclaim for breach of contract (Third Cause of Action) is DENIED; 3) Internet Archive's motion to dismiss Shell's counterclaim for Racketeering under RICO and COCCA (Fourth Cause of Action) is GRANTED.
  76. ^ Claburn, Thomas (March 16, 2007). “Colorado Woman Sues To Hold Web Crawlers To Contracts”. New York, NY, US: InformationWeek, UBM Tech, UBM LLC. オリジナルのSeptember 4, 2014時点におけるアーカイブ。. https://web.archive.org/web/20140904170742/http://www.informationweek.com/colorado-woman-sues-to-hold-web-crawlers-to-contracts/d/d-id/1053075 March 25, 2015閲覧. "Computers can enter into contracts on behalf of people. The Uniform Electronic Transactions Act (UETA) says that a 'contract may be formed by the interaction of electronic agents of the parties, even if no individual was aware of or reviewed the electronic agents' actions or the resulting terms and agreements.'" 
  77. ^ Samson, Martin H., Phillips Nizer LLP (2007). "Internet Archive v. Suzanne Shell". internetlibrary.com. Internet Library of Law and Court Decisions. 2014年8月3日時点のオリジナルよりアーカイブ。2015年3月25日閲覧More importantly, held the court, Internet Archive's mere copying of Shell's site, and display thereof in its database, did not constitute the requisite exercise of dominion and control over defendant's property. Importantly, noted the court, the defendant at all times owned and operated her own site. Said the Court: 'Shell has failed to allege facts showing that Internet Archive exercised dominion or control over her website, since Shell's complaint states explicitly that she continued to own and operate the website while it was archived on the Wayback machine. Shell identifies no authority supporting the notion that copying documents is by itself enough of a deprivation of use to support conversion. Conversely, numerous circuits have determined that it is not.'
  78. ^ brewster (25 April 2007). "Internet Archive and Suzanne Shell Settle Lawsuit". archive.org. Denver, CO, USA: Internet Archive. 2010年12月5日時点のオリジナルよりアーカイブ。2015年3月25日閲覧Both parties sincerely regret any turmoil that the lawsuit may have caused for the other. Neither Internet Archive nor Ms Shell condones any conduct which may have caused harm to either party arising out of the public attention to this lawsuit. The parties have not engaged in such conduct and request that the public response to the amicable resolution of this litigation be consistent with their wishes that no further harm or turmoil be caused to either party.
  79. ^ Conger, Kate. "Backing up the history of the internet in Canada to save it from Trump". TechCrunch. 2016年12月27日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  80. ^ "Where to find what's disappeared online, and a whole lot more: the Internet Archive". Public Radio International. 2017年3月28日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  81. ^ Chirgwin, Richard. "There's no Wayback in Russia: Putin blocks Archive.org". 2016年10月7日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  82. ^ "Russia won't go Wayback, blocks the Internet Archive". Digital Trends. 26 June 2015. 2016年4月17日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  83. ^ "Help Us Keep the Archive Free, Accessible, and Reader Private | Internet Archive Blogs". 2017年5月21日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  84. ^ Herb, Ulrich. "Die Trump-Angst grassiert" (ドイツ語). heise online. 2016年12月7日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  85. ^ LaFrance, Adrienne. "The Internet's Dark Ages". The Atlantic. 2017年5月7日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  86. ^ LaFrance, Adrienne. "The Human Fear of Total Knowledge". The Atlantic. 2016年12月2日時点のオリジナルよりアーカイブ。2017年5月14日閲覧
  87. ^ "The Entire Internet Will Be Archived In Canada to Protect It From Trump" (アメリカ英語). Motherboard. 2017年5月16日時点のオリジナルよりアーカイブ。2017年5月14日閲覧

関連項目

[編集]

外部リンク

[編集]