私は文献管理にMendeleyというフリーウェアを使っています。このソフトの素晴らしいところは、Windows、Mac、Linux、iPhoneと各種OSを横断して文献データを共有できる点。これがフリーでいいのかっていうぐらいハイクオリティだと思います。 しかしながら、ついさっき気づいた気になる機能が一点。 以下、iPhone版Mendeleyで文献の詳細データを表示した画面です。「View Paper on Mendeley Web」に何らかのURLが書かれています。 どうもMendeleyに登録したアイテムは全てURLが割り振られて、その文献のタイトル等メタデータを閲覧できるページに飛べるようになっているもよう。 このページは、非ログインユーザでもURLを知っていればアクセス可能であり、しかも一度登録されるとこのページは削除されない?! Mendeleyが多機能なだけあって、
Webページを簡単にダウンロードできて、クローラを作る際に便利なwgetコマンドですが、オプションの設定に気を付けないと、すごくクローリングに時間をかけることになります・・・。 -Tオプション Webページの取得に時間がかかる場合、処理をタイムアウトさせるまでの秒数を指定します。デフォルトでは900秒です。 -tオプション Webページが取得できずタイムアウトした場合に、再度Webページを取得し直す回数を指定します。デフォルトでは20回です。 上記のデフォルト設定では、幾ら何でも待っていられないので、以下のようにしてwgetを実行することにしました。 $ wget -T 60 -t 1 -O [出力先ファイル名] [取得したいWebページのURL] これだと60秒でタイムアウトし、タイムアウトしたらWebページの取得をやり直さず諦めることができます。Similar Posts:No
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く