ブックマーク / yag.xyz (19)

  • fr24feedを使ってflightrader24にADS-B情報をフィードする - Yuki Okuda

    2016-07-10 概要 週末の工作として,Raspberry Pi 3 Model BでADS-B受信機を作成しました.と言っても半田ごてを持って電子工作などをするわけではなく,SDR受信機を購入してセットアップするだけの簡単なものです.ハードウェアの選定からソフトウェアのインストール方法まで,基的に以下のブログを参考にさせていただきました. Raspberry Piで航空機からの位置情報信号ADS-Bを受信してみた - Okiraku Programming その中で,取得したADS-Bの情報をFlightradar24にフィードする部分で一部アップデートがあり,今ではWindowsを利用する必要がなくなりました.すべてRaspberry PiのCLI上で設定できるようになっていますので,その方法を以下にまとめておこうと思います. 環境 Raspberry Pi 3 Model B

    yag_ays
    yag_ays 2016/07/10
  • オレオレJupyter運用法 ~常にJupyter Notebookを開きつつ任意のディレクトリをターミナルから開く - Yuki Okuda

    2016-02-13 tl;dr Jupyter Notebookは裏で常に動かしておいて,ノートブックを作りたくなったら任意のディレクトリに移動してjdコマンドで開くようにしとくと便利. Jupyter/ipython notebookの運用について ぶっちゃけJupyterの使い方が良くわからない.とりあえず自分のやり方を書いてみるので,他に便利な使い方をしている人がいれば是非教えてほしい. といっても,別にノートブックの使い方がわからないんじゃなくて,日常的に使い倒すにあたってどういう運用をすればよいかがわ分からないのだ.一番分からないのは,Jupyter Notebookをいつ起動するか?という問題.よし解析するかとなった時に必要に応じて起動する人もいれば,裏で常に起動しておいていつでも作業できるようにしておくというのもある.サーバに立てといてリモートで使えるようにしておくとか,あ

    yag_ays
    yag_ays 2016/02/13
  • 今年行ってよかった飯屋5選(日本橋~新橋あたり) - Yuki Okuda

    2015-12-01 「今年買ってよかったもの」というのが思いつかなかったので,代わりに自分の生活圏内である秋葉原〜新橋付近で,今年行ってよかった飯屋を5つ選定した.何度も行ったことがある店もあれば,1回しかべたことのないものもあるが,とにかく今でも記憶に残っていてなおかつ人に自信を持って薦められる店を選んだつもり. 天ぷらめし 金子半之助 (日橋) とにかく味良し,値段良し,雰囲気良しと,非の打ち所のない天ぷら屋.店内は厨房を囲うようにカウンターが10席程度あり,揚げたての天ぷらをその都度持ってきてくれる.穴子や舞茸,イカのかき揚げといった定番の天ぷらはもちろん絶品なのに加え,その中でも半トロ卵の天ぷらをご飯に乗っけて醤油を掛けて卵かけごはんにするべ方は最高に贅沢だ.これでメインは1000円を切るというのだから,どんな人にも掛け値なしにオススメできる.時間帯によっては少し並ぶものの

    yag_ays
    yag_ays 2015/12/02
  • "Humor Recognition and Humor Anchor Extraction"読んだ - Yuki Okuda

    2015-10-30 http://aclweb.org/anthology/D/D15/D15-1284.pdf http://www.cs.cmu.edu/~hovy/papers/15EMNLP-humor.pdf 10/24にEMNLP2015読み会に参加して”Humor Recognition and Humor Anchor Extraction”というユーモアに関する論文を紹介しました. スライド 補足:負例を判定するタスクになっていないかどうか 質疑応答で指摘があったが,ドメインを揃える工夫をしているとはいえ,負例にニュース記事などを使っている以上はそちらの分類問題になっていないかは気になるところ.今回作った識別器を流用したAnchor Extractionでのある程度の抽出精度をもってして,ユーモアかどうかの二値分類はきちんとユーモアを識別しているとは言えるかもしれない.

    yag_ays
    yag_ays 2015/11/02
  • "Letting Users Choose Recommender Algorithms"読んだ - Yuki Okuda

    2015-11-02 RecSys2015勉強会で紹介した論文.勉強会での発表自体は著者のスライドを使用した. Letting Users Choose Recommender Algorithms 概要 MovieLensにおいて推薦アルゴリズムをユーザに自由に選択させたときにどういう挙動を示すのかを実験した論文.被験者のうち約25%のユーザが推薦アルゴリズムを変更し,推薦アルゴリズムの人気度合いやユーザの機能の使い方などから,ユーザの趣向を反映したと思われる実験結果が得られた. MovieLensにおける実験 現状のウェブサービスにおける推薦システムは,ユーザから見て仕組みがわからず推薦結果のみが示される状態にある.これまでに提案されてきた推薦アルゴリズムはそれぞれに出力の特徴が異なることから,推薦アルゴリズムの選択はユーザの趣向をある程度反映すると考えられる. 実験は映画レビューサイ

    yag_ays
    yag_ays 2015/11/02
  • 推薦システム用データセットMovieLensについて - Yuki Okuda

    2015-10-03 概要 推薦システムの開発やベンチマークのために作られた,映画のレビューためのウェブサイトおよびデータセット.ミネソタ大学のGroupLens Researchプロジェクトの一つで,研究目的・非商用でウェブサイトが運用されており,ユーザが好きに映画の情報を眺めたり評価することができる. MovieLens | GroupLens MovieLens - Wikipedia, the free encyclopedia MovieLensのウェブサイト MovieLensでユーザができるアクションは基的に以下の3つのみ. 映画に評価を付ける(0.5-5.0の0.5刻み) 映画をウィッシュリストに入れる 映画にタグをつける 映画サムネイルの下にある★☆の箇所からインタラクティブに評価を付けることができる. たまにログイン時などにアンケートやサーベイが提示されることもある.

    yag_ays
    yag_ays 2015/10/03
  • "Promoting Positive Post-Click Experience for In-Stream Yahoo Gemini Users"読んだ - Yuki Okuda

    "Promoting Positive Post-Click Experience for In-Stream Yahoo Gemini Users"読んだ 2015-08-28 http://www.dcs.gla.ac.uk/~mounia/Papers/kdd2015.pdf Promoting Positive Post-Click Experience for In-Stream Yahoo Gemini Users (スライド)Promoting Positive Post-click Experience for In-Stream Yahoo Gemini U… 概要 Yahoo!のニュース記事のネイティブアドにおいて,広告を踏んだ後の体験(post-click experience)というものを滞留時間と直帰率で表現し,それらを推定するモデルを作り広告を表示するランキング

    yag_ays
    yag_ays 2015/08/28
  • "Gender and Interest Targeting for Sponsored Post Advertising at Tumblr"読んだ - Yuki Okuda

    "Gender and Interest Targeting for Sponsored Post Advertising at Tumblr"読んだ 2015-08-22 Gender and Interest Targeting for Sponsored Post Advertising at Tumblr http://astro.temple.edu/~tuc17157/pdfs/grbovic2015kddA.pdf 概要 Tumblrのユーザの興味と性別を推定して広告のターゲティングに活かすという論文.興味の推定にはSkip-gramを拡張した半教師あり学習を,性別の推定にはロジスティック回帰を用いており,実運用としてデプロイするところまで行っている. 内容的にも著者的にも,実質WWW2015で発表されたqueryCategorizr: A Large-Scale Semi-

    yag_ays
    yag_ays 2015/08/22
  • "Rule-based Information Extraction is Dead! Long Live Rule-based Information Extraction Systems!"読んだ - Yuki Okuda

    "Rule-based Information Extraction is Dead! Long Live Rule-based Information Extraction Systems!"読んだ 2015-08-18 http://www.aclweb.org/anthology/D13-1079 概要 情報抽出(Information Extraction:IE)のサーベイ論文.情報抽出にはルールベースの手法と機械学習ベースの手法の2種類があるが,アカデミアとビジネスでそれらの使われ方であったり認識に大きな乖離がある.アカデミアではルールベースはもはや見込みの無い技術だと思われがちだけれども,むしろビジネスの実務ではルールベースの方が成果面・コスト面で重要であって,そこの活用が両者の溝を埋める可能性があるという話. 内容 (Figure 1: D13-1079.pdf) 情報抽出の

    yag_ays
    yag_ays 2015/08/18
  • "How to Memorize a Random 60-Bit String"読んだ - Yuki Okuda

    2015-08-14 http://www.isi.edu/natural-language/mt/memorize-random-60.pdf 概要 人間が覚えやすくかつ強固なパスワードを作成するために,ランダムに生成された60文字のビット列を英単語の列に変換するという論文. 発端 (From http://xkcd.com/936/) 翻訳記事:xkcd: Password Strength - パスワード生成に関する新たな提案 - 涙目で仕事しないSE xkcdという有名なウェブコミックで,パスワードに関する話が投稿された.機械により生成された文字列は人間にとって決して覚えやすいものではなく,また文字数からもブルートフォースアタックに弱い.そのため,11-bitのビット列を英単語に変換することによって,意味は無いが物語性のあり覚えやすそうな文章にしてしまおうというアイデアである. こ

    yag_ays
    yag_ays 2015/08/14
  • "Combining Visual and Textual Features for Information Extraction from Online Flyers"読んだ - Yuki Okuda

    "Combining Visual and Textual Features for Information Extraction from Online Flyers"読んだ 2015-08-08 emnlp2014.org/papers/pdf/EMNLP2014206.pdf EMNLP2014のshort paper. 概要 不動産の広告チラシからの固有表現認識において,文字のサイズや色などのテキスト以外の視覚的情報を使うことで認識精度を上げたという論文. 背景と問題設定 仲介業者が入るような産業は,往々にして情報が集約され整備されたデータベースを持たないことが多い.特に不動産は仲介業者が独自の情報網によって対応しているケースが多く,データベースがあっても内容が古かったりと,信頼できる最新情報は広告チラシのみということがある.そのため,広告チラシから不動産の情報を自動的に情報抽出し

    yag_ays
    yag_ays 2015/08/09
  • PythonでXgboost - Yuki Okuda

    2015-08-08 xgboost package のR とpython の違い - puyokwの日記 puyokwさんの記事に触発されて,私もPythonでXgboost使う人のための導入記事的なものを書きます.ちなみに,xgboost のパラメータ - puyokwの日記にはだいぶお世話になりました.ありがとうございました. Xgboostとは dmlc/xgboost Xgboostは言わずと知れた最近流行りのGradient Boosting系のライブラリで,独立したバイナリとしてコマンドラインから実行できるほか,RやPythonからもライブラリとして利用することができる.詳しくい情報は以下の記事を参照していただきたい. 勾配ブースティングについてざっくりと説明する - About connecting the dots. xgboostとgbmのパラメータ対応一覧をつくる -

    yag_ays
    yag_ays 2015/08/08
  • "A Computational Approach to Automatic Prediction of Drunk-Texting"読んだ - Yuki Okuda

    "A Computational Approach to Automatic Prediction of Drunk-Texting"読んだ 2015-08-06 www.cse.iitb.ac.in/~pb/papers/acl15-drunk-text.pdf ACL2015のshort paper.@mhagiwaraさんのtweetで紹介されていたので読んでみた. 概要 “Drunk Texting”という,いわゆる酔った状態で書かれた文章かどうかを自動分類しようという論文.Twitterのハッシュタグを元にデータセットを作成し,n-gramやその他の素性を元にSVMで分類器を作成.最終的に人間の正答率68.8%のところを自動分類で64%程度到達できた. 背景と問題設定 言うまでもなく,酒を飲んだ状態では理性が効かなくなってあとあと後悔することがある.例えばGmailでは算数の問題

    yag_ays
    yag_ays 2015/08/06
  • scikit-learnやpandasのドキュメントをDashから確認する - Yuki Okuda

    2015-06-27 最近家ではもっぱらscikit-learnやpandasを書いているのだけれども,コードを書いている時の大半はドキュメントを引いているかサンプルコードをネットで探していると言っても過言ではない.最初はわざわざGoogleで”scikit-learn randomforest”とか”pandas read_csv”などで検索して情報を探していたが,この方法だと明らかに面倒だし,ブラウザのタブは増えるわ何度も重複して検索してしまうわと何かと不便だった.また,ネットワーク速度の出ない外出先ではまともに表示すらできないということで,ローカルで検索できるドキュメント環境を整備する必要があった.当初はipythonで In [1]: import pandas as pd In [2]: pd.read_csv? などとしてドキュメントを眺めていたのだけれども,とにかく検索性が悪

    yag_ays
    yag_ays 2015/06/27
  • Ipython Notebookでグラフ描画時に出力を抑制する - Yuki Okuda

    2015-06-21 Ipython Notebookの上でmatplotlibを使ってグラフを描画していると,値の出力の下にグラフが描画されるときがある.plt.plotなどでは<matplotlib.lines.Line2D at 0x111762fd0>の1行で済むのだけれども,plt.histではn, bins, patchesといった値が出力されるので,グラフが画面下に追いやられることがある. そういうときは,以下のように行末にセミコロンを付けると出力を抑制することができる. plt.hist([sp.stats.uniform.rvs(0,1) for x in xrange(10000)], bins=100, normed=True); ほかには,_ = plt.histのようにアンダースコアに出力を吸収させる方法もあるようだ.あと自分は何故か2行目にprintを書くという

    yag_ays
    yag_ays 2015/06/21
  • イタリア映画祭2015「いつだってやめられる」を見てきた - Yuki Okuda

    朝日新聞社 - 「イタリア映画祭2015」- 作品情報 いつだってやめられる : 作品情報 - 映画.com ゴールデンウィークに行われているイタリア映画祭2015で上演された「いつだってやめられる」(原題:Smetto quando voglio)を見てきた. 職を失ったポスドクが合法麻薬作りに手を染めるというストーリーに強く惹かれて,すかさず知り合いの分を含めてチケットを購入したのだが,正直なところネタ半分といったところであまり期待はしていなかった.イタリア映画といえばニュー・シネマ・パラダイスくらいしか出てこないにわか映画ファンなので,あらすじからブレイキング・バッドとオーシャンズ・イレブンを足して2で割った映画かと思って観に行ったら,完全に度肝を抜かれてしまった.いや,イタリア映画舐めててすいませんでした. ここからは,あらすじをイタリア映画祭のページから引用して少し言葉を足しつつ

    yag_ays
    yag_ays 2015/05/05
  • "Latent Dirichlet Allocation based Diversified Retrieval for E-commerce Search"読んだ - Yuki Okuda

    "Latent Dirichlet Allocation based Diversified Retrieval for E-commerce Search"読んだ 2015-02-24 Latent dirichlet allocation based diversified retrieval for e-commerce search 概要 ECサイトの検索に,商品のタイトルの中の単語の出現分布を多変量ベルヌーイ分布でモデル化したLatent Dirichilet Allocation(LDA)を組み込んだ論文.第一著者のeBayでのインターンの成果. 例えばECサイトで”Fossil”というクエリをユーザが投げたときに,ユーザはブランドとしての”Fossil”の時計やバッグが欲しいかもしれないし,単に化石のアンティークが欲しいかもしれない.ユーザの興味に関する情報が無いときには,曖

    yag_ays
    yag_ays 2015/02/25
  • "Factoring Variations in Natural Images with Deep Gaussian Mixture Models"読んだ - Yuki Okuda

    "Factoring Variations in Natural Images with Deep Gaussian Mixture Models"読んだ 2015-02-23 NIPS : Conferences : 2014 : Program : Factoring Variations in Natural Images with Deep Gaussian Mixture Models 概要 混合正規分布モデル(Gaussian Mixture Model, GMM)を多層化したDeep GMMを提案する.任意の正規分布は,標準正規分布の線形変換によって生成することができる.GMMを一つの標準正規分布から複数の線形変換を通した正規分布の線形和と考えると,この線形変換を層と見なして複数積み上げることによって,いくつもの線形変換を経た正規分布の和としてDeep GMMを定義することが

    yag_ays
    yag_ays 2015/02/23
  • "Beyond Clicks: Dwell Time for Personalization"読んだ - Yuki Okuda

    2015-02-14 Beyond Clicks: Dwell Time for Personalization | Yahoo Labs Recsys2014のMetrics and Evaluationセッションで発表されてベストペーパーに選ばれた論文.新規手法や精度云々という話ではなく,新しい指標を作ってそれが実際に機能することを示したという内容. 概要 ウェブサイトのレコメンデーションは,だいたいCTRやクリックの有無をもとにしてユーザの趣向を推定するけれども,当にユーザが記事の中身を見て読んだり気に入ったりしているとは限らない.そこでウェブページの滞留時間(Dwell Time)を新たな指標として提案する.サーバサイドとクライアントサイドの両方で検証して比較したほか,実際の応用としてランク学習や協調フィルタリングに適用して,クリックの情報を用いた解析と比較して同等の結果が得られ

    yag_ays
    yag_ays 2015/02/14
  • 1