タグ

2013年5月19日のブックマーク (12件)

  • パーセプトロンを実装してみた - Topics Related to Computers and NLP

    実装力を磨くためと学習器への理解を深めるために、パーセプトロンを実装してみた。3時間ぐらいかかった。今のレベルはSVMの赤に行く前ぐらいのレベル。 コードは以下にある。以下で参考にしたチュートリアルの擬似コードをそのまま実装した。 https://github.com/akkikiki/nlp_tutorial/blob/master/train_perceptron.py 以下のチュートリアルを参考にした。詳しい事はこちらに書いてあるが、概要を述べてみる。 パーセプトロンアルゴリズムと文書分類 ちなみに、自分は昨年の春ぐらいにPRML4章(パーセプトロン含む)を輪読会で発表したのだが、完全に忘れていたうえ、読んだ時も機械学習の全体像(識別関数、生成モデル、識別モデルから成る)が掴めていなかったので、いきなりPRMLを読むのはオススメしない。 今PRML4.1.7節を見たら「すごい、わか

    パーセプトロンを実装してみた - Topics Related to Computers and NLP
  • Algorithm::LibLinear の紹介

    Notice: This article is outdated. Please refer an updated English tutorial. 要旨かなり前になりますが、Algorithm::LibLinear という Perl モジュールを書きました。 CPAN Github これを使うと線形分類器などが高速に学習できます。テキストや画像の分類が応用として期待されます。 LIBLINEAR についてLIBLINEAR は LIBSVM と同じ台湾国立大学の Chih-Jen Lin 教授のチームが公開しているオープンソースの機械学習パッケージです。 関数のロジスティック回帰、サポートベクター回帰及び線形 SVM による多クラス分類を行うことができます。LIBSVM と違ってカーネル関数を使うことはできませんが、はるかに高速に動作します。 Algorithm::LibLinear

    sassano
    sassano 2013/05/19
  • 論文紹介 “Representing Topics Using Images” (NAACL 2013) - 唯物是真 @Scaled_Wurm

    “Representing Topics Using Images", Nikolaos Aletras and Mark Stevenson 研究室で論文紹介したので適当に以下に資料を貼っておく。 論文を読んだ後で気づいたけど、NAACL 2013はまだやっていないので、preprintバージョン(?)っぽい。 何故か研究室での論文紹介は、資料が英語で口頭説明が日語なので、以下では日語の説明を加えておいた。 英語が間違っている部分があると思いますが、コメントで指摘なりスルーするなりしてください。 スライドはこうした方がいいとかもあったらぜひ。 後から読むと説明の流れが変かな?ってところもありますね。 論文中の図表ってどの程度載せていいんでしょうか……? やっぱりまったく載せないほうがいいんですかね。 論文紹介 概要 自然言語処理ではトピックモデルというものがよく用いられている。 トピ

    論文紹介 “Representing Topics Using Images” (NAACL 2013) - 唯物是真 @Scaled_Wurm
  • ワンタイムパスワード - Yahoo! JAPAN IDガイド

    ワンタイムパスワードを設定すると、万が一他人にパスワードを知られてしまっても、不正ログインの危険を回避できます。 ワンタイムパスワードとは? ログインのたび認証画面が表示され、ワンタイムパスワードが発行されます。人のみが受け取れ、1回限り有効な時間制限のあるパスワードのため盗まれるリスクが著しく低く安全です。

    ワンタイムパスワード - Yahoo! JAPAN IDガイド
  • Choosing a Machine Learning Classifier

    How do you know what machine learning algorithm to choose for your classification problem? Of course, if you really care about accuracy, your best bet is to test out a couple different ones (making sure to try different parameters within each algorithm as well), and select the best one by cross-validation. But if you’re simply looking for a “good enough” algorithm for your problem, or a place to s

    sassano
    sassano 2013/05/19
  • 実験で判明。頻繁すぎるメールチェックが仕事の生産性を下げている!?

    仕事にメールはつきもの。ひっきりなしにメールが来るので、頻繁にチェックしないと追いつかないという人は多いのではないでしょうか。最近はスマートフォンでもメールチェックできるので、チェック頻度はますます上がっていることと思います。ところが、兄弟サイト「ライフハッカー[日版]」によれば、米カリフォルニア大学の研究では意外な事実が判明したそう。「頻繁にメールをチェックする人は、その習慣をやめると仕事での生産性が上がる」というのです。「メールを他の人より2倍のペースでチェックしている人の心拍数は、『かなり興奮した』状態で一定していました。そのような人を5日間メールから離れさせたところ、より自然な心拍数への変化が見られました 」つまり、ということ。そのせいで集中力が下がり、生産性も落ちるのだそうです。そこでというわけですね。研究者は「メーラーにログインする時間を管理し、新着メッセージ数をバッジ表示

    実験で判明。頻繁すぎるメールチェックが仕事の生産性を下げている!?
    sassano
    sassano 2013/05/19
  • 朝活は不向き!? 記憶力についてわかった科学的な新事実 | ライフハッカー・ジャパン

    脳に関する研究は日々進んでいますが、ときに、これまで常識と思われていたことも覆されるもの。 「朝活」といえば、朝、出勤前の時間を使ってさまざまに取り組んでいる人も多いと思います。しかし、誰にも邪魔されずに集中できる朝の時間帯も「記憶作業」には向かないようです。 以下、カフェグローブの記事より転載して紹介します。「最近、物忘れがひどい気がする...歳のせい?」そんな風に思ったことはありませんか? 実は「物忘れは加齢のせいでひどくなるわけではない」ということが、最近の研究でわかっているんです。 実際、「ど忘れ」の回数は子供も大人もさほど変わらないのだとか。大人は子供に比べて圧倒的に経験値による「ひきだし」が多いため、特定の記憶を思い出すのに時間がかかることなどが、「最近、物忘れが多くなった」と大人に感じさせる要因なのだそうです。 このように脳の研究が進み、「記憶力」についても新たに多くの事実が

    朝活は不向き!? 記憶力についてわかった科学的な新事実 | ライフハッカー・ジャパン
    sassano
    sassano 2013/05/19
  • ChromiumのWindowsビルドがいつの間にか超絶簡単になっていた件 | Scene Research Station

    やり方は http://www.chromium.org/developers/how-tos/build-instructions-windows に書いてあるのだけど、その中のAutomatic simplified toolchain setupがそれ。 今まではWindowsの場合、Visual Studioでビルドをしていたと思うのだけど、これはSDKやらのインストールやらパッチ当てが面倒くさい上にビルド自体が激重い。けど最近は、Windows上でもセットアップの自動化を行う神スクリプトが出て来て、それとninjaビルドを組み合わせるとお手軽にビルドができるようになったらしい。試してみる。 まずは https://src.chromium.org/svn/trunk/tools/depot_tools.zip を落として、適当なところに展開してコマンドラインから叩けるようにPAT

    sassano
    sassano 2013/05/19
  • 一撃で説得されないために役立つ一冊 | シゴタノ!

    「攻撃は最大の防御なり」 という言葉があります。いろいろ解釈する余地がありますが、 「攻め方が分かっていれば、守りやすい」 と解釈することもできるでしょう。攻撃方法に精通していれば、防御方法も組み立てやすい。そんなに不自然な話ではありません。 つまり、相手が一撃でこちらを仕留めてくる(説得してくる)ための方法を知っておけば、それを回避するのも容易になるわけです。 一撃で仕留める説得 書によると、「超」説得法は「瞬間的に相手の心を掴む方法」とあります。その中身は 相手の関心を引き、信頼を獲得した上で 相手の判断を変更させ 最後にとどめの一撃を打つ の3つのプロセスです。 研ぎ澄まされた刀で、相手の首を、一瞬で斬り飛ばす。少々物騒な表現ですが、こんなイメージかもしれません。 書では、それぞれのプロセスにおけるノウハウが、いくつかの例と合わせて紹介されています。また、説得における強力な二つの

    sassano
    sassano 2013/05/19
  • Yahoo Japanで相次いで発生した不正アクセスについてまとめてみた - piyolog

    4月2日、そして5月16日にYahoo Japanのサーバーに対し不正なアクセスが行われたことをYahoo Japanがそれぞれ後日に発表しました。ここではメディア等の情報を元に不正アクセスインシデントについてまとめます。 相次ぎ発生したYahoo Japanへの不正アクセスインシデントの概要 3月から4月にかけ不正ログインを試みるアクセスが行われたことを多くの組織が発表しましたが、同時期にYahoo Japanでは同社が管理するサーバーへ不正アクセスが行われ、IDやパスワードなどの情報を抽出してファイルを作成する不審なプログラムが動いていたことを発表しました。そして、それから1ヶ月半近くが経過した5月半ばに顧客情報を抽出したファイルが作成されるといった似たような手口による不正アクセスインシデントが発生したことを報告しました。なお、この2件のインシデントの関連性については明らかになっていま

    Yahoo Japanで相次いで発生した不正アクセスについてまとめてみた - piyolog
  • IJCNLP-2013 - Open Notebook NLP

    IJCNLP-2013は、10/14-18に名古屋国際会議場で開催されます。今回ローカルオーガナイザの末席を仰せつかっておりますので、宣伝も兼ねてここで話題にしております。 ホームページはこちら。 地元開催ということで、日の締め切りに合わせて会議論文を投稿しました。時間的には厳しかったのですが、なんとか形にはなったと思います。採否は時の運ですので、どうなるかわかりませんが… 名古屋国際会議場は、IJCAI-1997が開催されたときに発表した場所で、思い出深い場所でもあります。名古屋はその時に初めて来た、縁もゆかりもない場所でしたが、そのとき何かの縁のようなものを感じました。今ここに定住しているのは熱田大神のお導きでしょうか。

    IJCNLP-2013 - Open Notebook NLP
  • Soft Confidence Weightedも書いてみた - EchizenBlog-Zwei

    CW(Confidence Weighted)を実装したので調子に乗ってSCW(Soft Confidence Weighted)も書いてみた。 SCWには1と2があって、それぞれL1,L2正則化っぽい感じのことをしている。今回はSCW1を実装した。 またCWは学習時に使う共分散行列が対角成分しかなかったのだが、SCWは対角成分以外にも値が入ってくるので取りうる特徴量が多い場合はなんらかの工夫が必要かも。 https://github.com/echizentm/ConfidenceWeighted test.plの最後でRGBそれぞれの重みをダンプした。scwのほうが重みが控えめになっているっぽい。 $$ perl test.pl 0.7 cw 1 3 < colors.csv update: 1,255 0 0 update: -1,0 255 0 update: -1,0 0 255

    Soft Confidence Weightedも書いてみた - EchizenBlog-Zwei
    sassano
    sassano 2013/05/19