一部ページに、location ヘッダーを使って別ドメインに飛ばしている部分があります
このため、wget コマンドが、他サイトのデータを取りに行ってしまうのを抑制したいのですが、何か良い方法はないでしょうか?
wget 以外のツールでも良いのですが、とりあえず、ドメイン内のファイルをリンク切れなくすべてダウンロードできるかどうか確認できれば良いのですが
リファラーを操作できるのか、wget しか見つけられなかったのです
(例1)対処ドメインが1つだけならばホストをまたがないようにする。
-H を使わない。
(例2)複数のドメインが対象の場合は、ドメインを指定する。
wget -r -D対象とするドメイン1,対象とするドメイン2,・・・,対象とするドメインn ダウンロード開始URL
(例3)飛ばしたくないドメインを特定できる場合は、そのドメインを指定する。
--exclude-domains=飛ばないドメイン1,飛ばないドメイン2,・・・,飛ばないドメインn
※その他のオプションは適宜追加してください。
おお・・・とても詳しい!!
早速、試してみます
ありがとうございました
wget のオプションに --max-redirect=1 を追加すれば、ご希望の動作になると思います。
今回の要件だと、poyopoyo さんのオプションが簡単かもしれないです
こちらも、早速試してみたいと思います
ありがとうございました
今回の要件だと、poyopoyo さんのオプションが簡単かもしれないです
こちらも、早速試してみたいと思います
ありがとうございました