タグ

dataに関するt_a_oのブックマーク (3)

  • Amazonの画像を拡大してリサイズし切り抜く

    Amazonの商品画像は色々なパラメーターで加工できるのはよく知られている。大抵の場合はウェブサイトに合うようにサイズを変更したりとかが主なのでAA320やSX480とかを使うだけ。ただ非矩形な商品の画像の場合、余白がないことがあり白背景のウェブサイト以外ではサイズの変更だけでは上手くなじまない。それを拡大(SS)とリサイズ(AA)・切り抜き(CR)を組み合わせることにより適切に余白を追加してやろうというテクニック。頭悪そうなタイトル。 以下のデフォルトの画像では余白がなくキツキツでちょっとアレな画像を例にして説明する。 元の画像のサイズは500x221 https://m.media-amazon.com/images/I/31Eybjr97iL.jpg SSとAAというパラメーターによる画像サイズの変更は、元になる画像のサイズ(長辺が500pxのことが多い)を超えると余白が追加される。

    Amazonの画像を拡大してリサイズし切り抜く
  • Wikipediaのダウンロードできるデータファイル一覧 | mwSoft

    概要 記事はWikipediaのダウンロード可能なデータについてまとめたものです。 Wikipediaではクロール行為は禁止されています(ここを見る限りでは)が、代わりに全記事の情報を圧縮したファイルが公開されています。 日Wikipedia情報ダウンロードページ http://download.wikimedia.org/jawiki/latest/ 記事は2009年の10月下旬に取得した情報を元に書いています。時間が経つと結果が変わる可能性があるのでご注意ください。 事前情報 2009/10/25に確認した時点では、日Wikipediaのダウンロードページには55個のファイルが置いてありました(うち半分は更新を通知する為のRSS)。 ファイルの形式は「XML」、「MySQLのダンプ」、「テキスト」などがあります。 詳しいデータのインポート方法は、こちらのリンク集が参考になる

  • Wikipedia の本文データをデータベースに投入する手順 - 地平線に行く

    Wikipedia文データは、XML形式で公開されています。 (詳しい内容は、Wikipediaのダウンロードできるデータファイル一覧 | mwSoft が参考になります) これをデータベースに投入する手順として、xml2sqlを使う方法がよく紹介されていますが、Wikimedia では「これを使ったやり方は推奨しない」と明記されています。 かといって、importDump.php を使うには PHP 環境を用意しなくていけません。 なので、Java で動く MWDumper を使って jawiki-latest-pages-articles.xml.bz2 (Wikipedia文データ)を投入してみました。 ダウンロード データベース定義 (tables.sql) Wikipedia文データ (jawiki-latest-pages-articles.xml.bz2)

    Wikipedia の本文データをデータベースに投入する手順 - 地平線に行く
    t_a_o
    t_a_o 2013/06/06
  • 1