TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼
InoReader Part6
MEGA
【同人者が】 fc2ブックマーク 【大暴れ】
【〒】 オンラインCD+DVDレンタル pt.52 【猫】
exciteのIDが削除できないよぉ('・ω・`)ショボーン
ネットの世界でナンバー1になりたい
届いたチェーンメールを晒そう 
IPアドレス公開されるとどうなるの?
損害賠償請求を受けました
Yahoo!プレミアム 会員限定 Part.4

Internet Archive総合 (web.archive.org) #3


1 :2020/04/02 〜 最終レス :2020/06/14
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php

インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
  ------------------


Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう

A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック


Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される

A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。


前スレッド
Internet Archive総合 (web.archive.org) #2
http://mevius.2ch.sc/test/read.cgi/esite/1475246713/

2 :
関連スレッド

・ウェブ魚拓 Part3
http://mevius.2ch.sc/test/read.cgi/esite/1498902308/

・【保存・記録】ウェブアーカイブ総合 Page.01
https://mevius.2ch.sc/test/read.cgi/internet/1554553882/

3 :
保守しよう

4 :
追加した方がいいテンプレって何があるかな

5 :
保存したはずなのに消えてる!って質問よくされてるから
その辺の事とか?

6 :
ホシュ

7 :
保守

8 :
Hmmm

9 :
>>5
それいいね、こんなところだろうか
少し長すぎたかも

Q. 保存したはずなのに見れない!どういうこと?
A. Internet Archiveはアーカイブ量の増加ペースの速さにサーバが追いついておらず、不安定なことが多いです。安定するタイミングを待ちましょう。
またWayback Machineは、ページの保存作業を担当するクローラ部分(Heritrix)と、保存したページの保管・記録・表示を担当するビューワー部分(Wayback)の別々な2つのソフトウェアを組み合わせて動いています。
なので、保存したはずのアーカイブが表示されなくなっていても、クローラ部分がちゃんと動いていたのならアーカイブはちゃんと保存されています。サーバが安定するのを待ちましょう。

10 :
( ゚ー゚)Ъ イイネ

11 :
TMR出まくる

12 :
IAは滅亡する!

13 :
Archive.st - Save The Internet
いま試してみたらヤフーニュースの魚拓が取れるみたいだぞ。

14 :
本日1回目のSaveでいきなりToo Many Requests

15 :
やっぱりTMRの出方おかしいよな

16 :
400 Bad Request
Request Header Or Cookie Too Large

17 :
直ったっぽい >>16

18 :
閲覧のほうでToo Many出すのはやめて欲しい
使い勝手が悪い

19 :
英語版ウィキペディア
List of Web archiving initiatives
https://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives

20 :
Internet Archive にアーカイブされたページを、
全文検索する方法ってないですか?

21 :
homepage2.nifty.comがみれない

22 :
>>20
昔はあったらしいけど、今は無いね

23 :
https://it.srad.jp/story/18/12/04/0637201/
>少なくとも「インターネット上の情報を残しておく義務」も「過去にインターネット上にあった情報にアクセスできる権利」も法的にあるわけじゃないしね。

削除申請に応じる義務もないだろ

24 :
ブロックされて見れません
どうしたらいいですか

25 :
諦めましょう。

26 :
アーカイブされたサイトのホームページだけでなく
全文で全サイトを検索することってできますか?

27 :
>>26
>>20 と同じ質問の香りがする

28 :
>>26
おじいちゃんさっき質問したばかりでしょ

29 :
>>26だがあえて実現しないってことなのかな?

30 :
ほんもののおじいちゃんだ・・・・

31 :
繋がらない

32 :
昨日から調子悪いな

33 :
いつ調子がよかったですか

34 :
savingの読み込みから進まんね


と思ったら何分か経って完了したわ

35 :
なおDLは出来ない程度には重い模様

36 :
そう言えばレジューム出来ないの?

37 :
アサシャンレジューム

38 :
なんでか分からないけどFirefoxだと/web/2/とか/save/が使えないのに
Google Chromeだと使えるっぽいんだよな。昔はFirefoxでも使えた。
最新版に更新してアドオン切っても駄目とかどうなってんだ。
> Firefox 75.0 64bit Firefoxは最新バージョンです
> Google Chrome は最新版です バージョン: 81.0.4044.129(Official Build) (64 ビット)
Firefoxで使えてる人いる?

39 :
>>38の件の追記、何故か/web/2/の方だけ復活した。
/save/は使えないまま。開くと真っ白なページが出てそれ以上何も起きない。

40 :
This snapshot cannot be displayed due to an internal error.
って出るサイトは無理?

41 :
それはダメだな
諦めろ

42 :
homepage2.nifty.comは1と3はできるのにどうして2だけ見れないの

43 :
わたしにもわかりません

44 :
もうこっちは駄目だ
>>9のレスと現状は違う
保存したはずが後日何度見返しても保存されてない場合がある
10回につき2〜3回くらい
https://web.archive.org/save/
こっちは大丈夫
http://archive.vn/

45 :
>>44
どーせスポーツ新聞のサイトだろ、保存してるのって

46 :
保存したものの特に重要なものはリスト化してチェックしてるが取りこぼしはないな
しかし反映の遅いものは一週間以上かかる場合もあった

47 :
>>44
archive.today は他にもドメインがあるのに
わざわざ .vn なんか持ち出してくるとか笑える
ベトナム共産シンパかよ

48 :
そんなに悔しかったのかよ白湯でも飲んどけ

49 :
俺はこれ
http://archive.fo/

50 :
流れ的におすすめの白湯の紹介かと思った

51 :
>>49
こういうマイナーなドメインのレジストリは騙されやすいのかねぇ。
https://twitter.com/archiveis/status/1188222460598116353
(deleted an unsolicited ad)

52 :
ニッチなニーズかもしれませんがスクリプトを公開しました。
Wayback Machine でURL検索をした際、最古または最新のページに自動で飛びます。
https://greasyfork.org/ja/scripts/403724-wayback-machine-auto-hopper

53 :
ありがとこんばんは

54 :
ヤフーニュースのスクリーンショット取れなくなった?

55 :
Internet Archiveってサイト保存したらどのIPが保存したとかも記録されんの?

56 :
>>55
どの方法でアーカイブが行われたのかも記録されているから、
おそらく IP も残っているんじゃないかねぇ。
ただ、アーカイブを読み出したときのレスポンスヘッダを見る限りでは、
その IP がアーカイブ閲覧者に漏れているような感じはしない。
あともう一つ、Archive.is がやっているような
リクエスト元 IP のアーカイブ対象サーバへのお漏らしは
Internet Archive では起きていない。

57 :
>>55
この辺見る限り保存はされていないっぽい
https://help.archive.org/hc/en-us/articles/360001513491-Save-Pages-in-the-Wayback-Machine
https://help.archive.org/hc/en-us/articles/360018536672-What-is-a-view-
https://blog.archive.org/2013/10/25/reader-privacy-at-the-internet-archive/
・全てのユーザーの行動はIPアドレスを元にしたハッシュ値で記録される
・一日毎にハッシュ値は変更される
とか何とか、間違ってたらすまん

58 :
>>57
しっかり書いてありますね。勉強になります。

59 :
ページの全文検索って募金が終わらないとできないの?

60 :
>>54
回復した

61 :
Twitterでたまにjsonが取れる現象なんとかならないのかね

62 :
やったじゃん
むしろほしい

63 :
Vuepressのページを保存すると一瞬は表示されるけどすぐ404に画面が書き換わっちゃう
https://web.archive.org/web/20200528205956/https://hapicode.com/vuepress/config.html

64 :
見たが普通に表示されてる

65 :
俺は見てない

66 :
ふむふむ。
https://web.archive.org/web/20200528205956im_/hapicode.com/vuepress/config.html

67 :
平和(・∀・)イイ!!

68 :
>>63
別サイトのページだが俺もそれ多い
全部じゃないけど…

69 :
>>62
自分でパーサなり何なり通さないと読めないから言うほど便利じゃないぞ
それにWayback Machineを使う場合、jsonが欲しい時よりもhtmlとして描画された状態のアーカイブが欲しいことの方が多い

70 :
ttps://twitter.com/internetarchive/status/1268108466192703489
また落ちたか
(deleted an unsolicited ad)

71 :
Internet ArchiveってURLで保存する方法とは別に
htmlソースコピーで保存する方法も出来るようにすればいいのに
当然独自URL生成する必要性も出てくるけど

72 :
うpろだかよw

73 :
ツイッターがInternet Explorerからの閲覧をできないようにしたらしく、その影響でツイッターのアーカイブがとれなくなってしまったんだけどどうしたらいいだろう?
今までInternet Explorerからならツイッターのアーカイブがとれたんだけど…他のブラウザからじゃアーカイブできないのよ困った

74 :
試してないけどmobile.twitter.comもだめなん

75 :
>>73
もしかしてThis page is available on the web!から取ってない?
あれは保存する奴の環境に左右されるから使えんよ
https://web.archive.org/save
からなら問題なく取れる

76 :
>>74
今ためしてみたらmobileの方でならアーカイブできたわ
ありがとう
でもなんでまたツイッターは急にIEからの閲覧はじくようになったんだろう?

77 :
>>75
よく分からないけどアーカイブしようとすると「このブラウザは現在サポートされていません」て出てくる
調べたら最近ツイッターがIEから閲覧できないようにしたらしいって言われてたから

78 :
>>75
今そのURLから保存してみたらmobileじゃなくてもアーカイブできたわ
どうもありがとう

79 :
Internet Archive ってなんで全ページ検索できるようにしないの?

80 :
Internet Archive ってなんで全ページ検索できるようにしないの?

81 :
>>79
高負荷だからだとおもう

82 :
すみません
ツイッター保存してるとけっこう頻繁に.jsonてURLについて謎の文字化けみたいになってしまうんですが、これはいったい…?
どうしたらいいんだろう

83 :
>>82
ちょっと前からたまに起きる現象、原因は分からない・・・
面倒だけどちゃんと取れるまで取り直すしかない

84 :
>>75
に追加
This page is available on the web!からだけじゃなくて
https://archive.org/web/
のSave Page Nowもダメっぽい
基本的にhttps://web.archive.org/saveを使った方が良さげ

85 :
Save Page Nowにあるこのチェックは何の意味があるの

>Save error pages (HTTP Status=4xx, 5xx)

86 :
エラー画面を保存するかしないか

87 :
しらんけど
例えば「404 Not Found」だけのページだった場合に
「そこにはなにもなかった」ってことにするか、
それとも「404 Not Foundがあったのだ」ってことにするかだと思う

88 :
壁打ち

89 :
>>83
どうも
取り直せばいけるなら何度かトライしてみます

90 :
>>79
昔一度やったことあるけど情報量があまりにも多過ぎて重すぎてまともに検索できなかったとか見た
全文検索できたら本当にいいんだけど現時点では無理ぽい…

91 :
<title>だけでも検索できるとめちゃ便利なんだけどな

92 :
アーカイブってエロサイト保存した場合動画も保存されんの?

93 :
基本的にされないと思った方が良い

94 :
訴訟問題は大丈夫なのかな
大事にならないといいが

95 :
訴訟問題って何?

96 :
何か前にあったような気もするが
フェアユースだしな

97 :
Internet Archiveが公開してる電子書籍について出版社から訴えられたとかじゃなかったか
Gigazineだかどっかのネットニュースに出てたね

98 :
電子書籍って保存出来るんなら無料で見れるやつじゃないの?

99 :
これだな
詳しくは記事見てくれ

米国の複数の大手出版社がInternet Archive(IA)に対する著作権侵害訴訟を提訴
Posted 2020年6月3日
https://current.ndl.go.jp/node/41125

Internet Archive(IA)、“National Emergency Library”の終了を早めることを発表
Posted 2020年6月12日
https://current.ndl.go.jp/node/41213

100 :
もしかしてTwitter取れなくなった?
https://web.archive.org/saveでもダメだ


100〜のスレッドの続きを読む
★ピコ森チャットの痛いおっさん星野壊滅運動
オンラインストレージ情報交換スレ Part26
悲しいチャットサイトの管理者
忍者ツールズ総合 Part6
学研キッズネット
Yahoo!リサーチ ほんとに抽選してんのか?
(センタク)みんなの投票所(懲りない顔文字)
(センタク)みんなの投票所(懲りない変態顔文字)
ヲチスレ★12
ヲチスレ★13
--------------------
けものフレンズ【2】554人目
【ハード】「ニンテンドークラシックミニ スーパーファミコン」国内は10月5日発売、海外版とは少し違う収録タイトルも発表
田原総一朗氏「無知蒙昧な発言」 丸山議員に広がる怒り
ヨドバシ 秋葉原情報 No1
同人PCゲー版KOTYスレ
【妨害工作】 新田ヒカル126 【削除依頼で身バレ】
日本で一番うまいギョウザが食えるとこって餃子の王将でいい?
教育とは何かをまじめに議論するスレ
unDonut Part36
【多角】ダブルヒーローってどう?【関係】Part2
【小室圭の功績】 女系天皇が駄目だとよくわかった
男子校に通っていたらわかること
日本人女からしたら外人男、混血男は結婚対象外!!
【新型肺炎】中国の専門家「感染力比較的強い 警戒が必要」
不要になったCD-R、DVD±Rの処分方法
男向けや男オタが嫌い57
岡山&香川のアナウンサーを語らん会〔62〕
■■ノーマルな(普通の)しりとり その511■■
【中越震災】長岡まつり大花火大会29【15年】
【新型コロナ対応、最低の指導者は誰?】断トツのワースト1位は安倍首相
TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼