TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼
画ちゃん管理人を逮捕せよ!
★☆ラブサーチの危険人物を語るスレ part11★
【晒し】2ショットチャット♪ ラブルーム【OK】
AIM Mail
LaLa Call Part 07
★あひゃひゃひゃひゃ75147#kuso
chat roulette
Netscape Mail 250MBキタ-----!!
無線インターネットはどうですか
【コソアソ】コッソリアソケート【160モリタポ】

Internet Archive総合 (web.archive.org) #2


1 :2016/09/30 〜 最終レス :2020/03/21
 
 前スレッド

Internet Archive総合 (web.archive.org) #1
http://echo.2ch.sc/test/read.cgi/esite/1189771222/
 

2 :
 
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php

インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
  ------------------


Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう

A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック


Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される

A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。
 

3 :
3!

4 :
 
 関連スレッド

ウェブ魚拓 Part2
http://echo.2ch.sc/test/read.cgi/esite/1340450717/

「ウェブ魚拓」と類似サービス
http://echo.2ch.sc/test/read.cgi/esite/1440044212/
 

5 :
テンプレのQ&A二件、まだそんなやり方が通用すると思ってる奴いるの?

6 :


7 :
浮上

8 :
スレ保全

9 :
これでインフォシークの消えたページ見る方法ないの?

10 :
Internet archiveでYoutubeの動画をダウンロードするのに簡単な方法は何かありますか?

11 :
>>9
インフォシーク自身はロボット除けの robots.txt を置いたり
コンテンツを Internet Archive からごっそり削除させたりということは
やっていないので、アーカイブさえ残っていれば問題なく見られます。

12 :
>>11
>コンテンツを Internet Archive からごっそり削除させたり

これどういうこと? 削除なんてできるの?

13 :


14 :
Youtubeとかrobots.txtで保存できないサイトは、
Archive.is→ウェブ魚拓と経由させると保存できるよ
これ結構やってる豆知識

15 :
robots.txtで

Disallow: /
Allow: /nullpo/

とかアロウ指定されてても効いてなくて一括ではじかれるやつが痛い

16 :
>>15
一部のクローラが Allow 文の実装を始める前の、
初期の robots.txt の仕様で動作してるってことだね。

17 :
サービス終了したniftyの保存し忘れてたサイトをInternet archiveで
サルベージしようと思ったのに出来るサイトとできないサイトがあるんだな
homepage2.nifty.comはThis URL has been excluded from the Wayback Machine.が出て全くダメで
homepage3.nifty.comはいけた これ2の方はアーカイブされてないってことか
データベース系サイトの消失が勿体無い

18 :
あれどういうことなんだろうね

19 :
$50の募金?が必要?
1000円ぐらいなら払ってもいいんだけど。

20 :
てす

21 :
前は500billionページ超えてた気がするけど保存ページへってない?
自分が以前保存させたのも今見てみたら保存できてないし

22 :
保守

23 :
>>21
ttp://web.archive.org/web/20161015012725/archive.org/web/web.php
510 billion web pages saved over time.

これが最高値かな。10 日後には半減してる。

24 :
誰も寄付しないの?

25 :
>>24
Hrm.....

26 :
保守

27 :
paypalで寄付しようとしたらJPからじゃダメ言われた

28 :
>>23
だよねえ。運営苦しいのかな

29 :
今Chromeでアクセスして過去ページ見るとどこを見てもファビコンが「あたまにきた」になるんだけど俺だけ?

30 :
あたまに?

31 :
あけおめ

32 :
保守

33 :
―――――――――――――――――――――――

34 :
―――――――――――――――――――――――

35 :
単語で検索できたら最高なのにな
URLが分からなきゃせっかく保存されてる過去の遺産も永遠に見れないままとか糞

36 :
昔あったけどやっぱり重すぎたのかな

37 :
ここ数日めっちゃ不安定

38 :
>>23
まあ「more than」ってことで…

39 :
>>37
わかる

40 :
過去にあったURLをキッチリ入れてても観れないサイトってあるんだね。

41 :
あちらの時間で9日に取得してアーカイブ成功したときの表示になった62ページのうち
20ちょっとが失敗してることを今確認してて気付いた
使ってた端末とかの環境も取得対象にしたドメインも分散してるからあちらの問題ぽい
そのあたりに取った人は成功してるかチェックしたほうがいいかも

42 :
困ったことによくあるんだよなそういうの

43 :
http://page.freett.com/brave_heart/atm_inspire/
こっちのサイトのFlashを見ようと思って、最近の日時のやつだと表示されないから古い日時のやつ見ようと思ったら勝手にinfoseekのトップに飛ばされてしまう…
飛ばされないようにすることとか出来ぬのか
(ブラウザはedge、chrome、Firefox)

44 :
見てみたけどInfoseekトップじゃなくてhttp://binyudaisuki.hp.infoseek.co.jp/に飛ばそうとしてる(そしてinfoseek側がトップにリダイレクトしてる)。
Flashのことは知らないけど、他サイト(この場合web.archive.org)からの再生を検出してそこに飛ばす、みたいなのが組み込まれてるんじゃないの?

45 :
バイナリエディッタって復元したい画像があるんですが、やってくれる神様いますか?
潰れた撮影会系サイトのアーカイブデータなんですが、一連の画像のうち、ほぼ半分が割れて開けません
(わいせつ性もジポ性も皆無のピチピチという言葉にハマらないクソつまらない画像だというのは一連の画像なのでわかります。)

46 :
あるはずのページが無いって言われることあります?
さっき見てたページにアクセスしたらHrm.
何度やってもHrm.
で、知らない間にまた見れる
みたいなのがちょくちょく…

47 :


48 :
最近robot.txtで弾かれるの増えたな
ついったの動画とかみんなどうやって補完するんだろう

>>29
ここのファビコンはしょっちゅう化ける 原因は不明だが
最近自分が見たサイトのものと入れ替わることが多い
archive自体のファビコンはちゃんとあるのにな

49 :
改悪されてそうな悪寒

50 :
なんかうまく見れないな

51 :
なんかおかしくなってる?

52 :
昨日から調子悪くて遺跡発掘が捗らないな
メンテでもやってんのかね

53 :
自分だけじゃなくて良かった。
しばらく様子見てみるか。

54 :
横にツイッターボタンとかいらんのよ
ちゃんと見れるようにしてくれ

55 :
ブクマしてたIAの中の某サイトがきれいさっぱり消滅してた

56 :
エエー・・・

57 :
自分のサイトが中途半端にアーカイブされていて恥ずかしかったから
なんちゃらtxt入れたら過去の分もアクセスできなくなったがそれじゃないのか

58 :
niftyも恥ずかしかったのかな

59 :
なんか数日前から突然ツイッターとか他のサイトも色々robot.txtが云々で保存できなくなってて絶望してたんだけど、みんなもそうだったのか
色々なサイトが仕様変更したんじゃなくてInternetArchiveの方が何か改悪したのか?

60 :
>>55
自分のブクマしてた過去にアーカイブしといたはずのページも見れなくなってた…このままだったら最悪だ

61 :
何で余計な改悪するんだろうな

62 :
顔本ボット仕込んで取得NGにしやがった

63 :
フレームを使用してたページが全て見れないんだけど

64 :
確かに

65 :
firefox10で表示できなくなった。
それとは別に、robots.txtのせいで表示できないサイトがあるのって全体的にそうなの?

66 :
Firefox10って?

67 :
フレームの件はサイト名がタブに出るから直る可能性があるけど
biglobe系のサイトが全滅?してしまったのが痛すぎる

68 :
なんとかアーカイブできるサイトでも表示がすごく変になってる

69 :
co.jp/ の表示が co.jp:80/ になってない?
時系列を遡るとURLがおかしくなるな

70 :
それは大昔からの仕様
近頃の不具合と一切関係ない

71 :
やはり不具合があるんですね。
保存しようとしたブログが文字化けしてしまう。

72 :
いわゆる機種依存文字だけが化けるという問題なら
2014 年 7 月にすでに始まっているはず。

自称 Shift_JIS の Windows-31J な文書も、あくまで厳密に Shift_JIS として
UTF-8 への変換を掛けてしまってるんだよね。

73 :
そんな前から…

74 :
biglobe系が失われたのは地味にダメージでかいな

75 :
どうやって失われたの?

76 :
フレームのページは見れるようになったが、通常は上に表示される棒グラフが出ないな。
フレームじゃないページでも棒グラフのところが真っ白になるのもある。

77 :
棒グラフって一覧表?

78 :
>>74
ハーメルンも

79 :
>>75
推測だけど、レンタルサーバーに自分のページを作って削除報告→ドメインごと見れなくなるだと思われ

80 :
そんな原理が発生しうるのか…

81 :
古いサイトの魚拓をとる場合はGoogleキャッシュ→archive_isが文字化けしないから確実だと思う

82 :
IAと違って何年も先の存続にはちょっと不安はある

83 :
IAも誰かが削除依頼すればドメインごと見れなくなるという欠点あるからなぁ
ドメイン(サブ含む)保有者ならrobot.txtを設置するだけで見れなくすることができるし

84 :
使い道次第ってことか

85 :
IAなら半永久的に残ると思って今まで一生懸命魚拓してきたのがほぼ全滅して虚しい…

86 :
最近旧operaだとうまく機能しなくなったからおかしいと思ったら他のブラウザもそうなのか
アドレスが文字化けしたりカレンダー画面出せなくなったり
JS切ると1つだけ検索出てくる(たくさん登録されてても)
システム戻してほしい

87 :
(´・ω・`)

88 :
本当に前と比べてかなりのサイトが魚拓できなくなってるし表示もおかしいし今までの魚拓も大部分見れなくなってるしでイライラする

89 :
もうダメだこのサイト使い物にならん…

90 :
Bummer
Hrm
robot.txt
こればっかりで今ネットの9割以上のサイトがこれで全く保存も閲覧もできなくなってる感じなんだけど?
InternetArchiveはネットの保存収集あきらめたの?バカなの?

91 :
ブンメルンとハラマはリロードしたら治ることも多い気がする

92 :
あるサイト(ジオ)で10あるサイト内リンクのうち6つが「7d6 0」としか表示されないんだけど、
これって何でか分かりますか?
他4つは正常に表示されるんですが……

93 :
「HTML はアーカイブされているけど、そこで使われている画像はアーカイブ無し」
という状況のとき、その画像について以前は /save/ の URL にリダイレクトして
オリジナルサーバへ読みに行かせていたのが、ただ 404 を返すだけに変わった。

94 :
>>90
Sorry. This URL has been excluded from the Wayback Machine.
これが抜けてる

95 :
●の丸マークがぐるぐる回ったまま、ページが開かない

96 :
わかる

97 :
え?
もしかしてfirefox10が悪いの?
つい先日まで使えてたのに。

98 :
収得ページの上に表示されるグラフやら時間移動の左右矢印やら消えてるのはIA側の不具合ですか?
一番新しい登録から移動できないのは不便。ブラウザ変えてもダメ

99 :
Firefox10ってマジ?

100 :
古いブラウザでは動作しなくなっていますね。
Firefox 13.0.1 ttp://i.imgur.com/D8ugVF8.png
Firefox 14.0.1 ttp://i.imgur.com/3VhIJse.png
Firefox 21.0 ttp://i.imgur.com/OqutIJD.png
Firefox 22.0 ttp://i.imgur.com/GFL3Imq.png

14.0.1 〜 21.0 ではカレンダーは一応表示されるのですが、
日付が縦に並び、下の月の数字と重なってしまうので使い物になりません。


100〜のスレッドの続きを読む
【無制限】Amazon Drive(Amazon Cloud Drive) 7
【コソアン】コッソリアンケート【154-4モリタポ】
ライコス黒字化計画
E-MAIL NETのサービスってどう?
ヤフーチャット40-6 Part9
Yahoo!リサーチ ほんとに抽選してんのか?
バンダイチャンネル総合スレ7
「SHOWROOM」総合スレ
トラムオンラインを語るスレッド
【人が】総合掲示板・えむちゃんjp【いない】
--------------------
地方競馬実況6176
【悲報】住所を特定された高校生が受けた仕打ちが酷すぎる・・・ [875850925]
可哀想なおじさんを愛で包むスレ
アーチェリーのロッド
【関東】アラサー達の合コンオフ
【素意や!】一世風靡SEPIA【素意や!】
【速報】千曲川ガチでヤバイ!長野市長が避難呼びかけ「直ちに逃げて下さい」
【自称司法書士は】行政書士本職スレ 別記様式第105号【書込禁止】
【MHFZ】晒しスレ上がると悔しくてめらるー@★【本スレ・武器スレ・独り言スレ】をすぐ上げ直す模様w
田舎愚痴スレ6@同人板
好きな上乗せ特化ゾーンwww
MANKAI STAGE『A3!』エーステ4季節目
【コロナ】NYの動物園、トラとライオンの新型コロナ感染8頭に
【iOS】iPhone iPad ダウングレード総合 Part1
嫌いだった教師・最低だった教員 その2
【悲報】 ポプテピピック作者 Twitter凍結 ローソン関係者への殺害予告が通報されたか [541495517]
++++++2ch初心者++++++
新潟越後線小2女児死体遺棄・殺人事件 3
ゴジラ考察
氏んでほしい奴の名前を晒すスレ100
TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼