タグ

2013年3月19日のブックマーク (22件)

  • テキストマイニングのための機械学習超入門 二夜目 パーセプトロン - あんちべ!

    一夜目はパターン認識と機械学習の概要を学びました。今夜は、識別部で用いられる機械学習の基的な線形識別器である「パーセプトロン」を具体的に学びたいと思います。「線形識別器?パーセプトロン?何それ?」字面は厳しいですが、手を動かしてみると意外と簡単に理解できます。今夜からは数式をバリバリ使っていきますし、手を動かしていただきます。「必ず」手元にペンと紙を用意してください。そうは言ってもパーセプトロンが一体何なのか、機械学習の中でどのような位置づけなのかがわからないと混乱するかもしれません。パーセプトロンの説明へ入る前に、機械学習の3つのアプローチをご紹介します。 ●機械学習の3つのアプローチ - 識別関数、識別モデル、生成モデル 機械学習は大きく分けて識別関数、識別モデル、生成モデルという3つのアプローチがあります。 識別関数 := 入力データを見て、特定のクラスに属するよう識別(代表的な手

    テキストマイニングのための機械学習超入門 二夜目 パーセプトロン - あんちべ!
  • Shinyで5分でできる株価チャートウェブアプリ - はやしのブログ Rev.3

    RにもWeb化の波が来てますね。 RStudio, IncがリリースしたShinyはRのみでサーバーも他言語も必要とせずウェブアプリを作成できる画期的なパッケージです。 Introducing Shiny: Easy web applications in R - rstudio.com/shiny/ #rstats #rstudio #shiny— RStudioさん (@rstudioapp) 11月 8, 2012 概要はバタデ先生にお任せするとして,簡単なアプリを作ってみました。 ウェブアプリのスクリプトは,2つのファイルに分けて作成します。 1つめは,ui.Rという名前で作成します。 2つめは,server.Rという名前で作成します。 これらを1つのフォルダに保存します。ここではstockというフォルダを作って,そこに保存することにします。保存したら,Rを立ち上げ,stockのあ

    Shinyで5分でできる株価チャートウェブアプリ - はやしのブログ Rev.3
  • Shiny アプリをワンクリックで起動するやつ作った - ほくそ笑む

    先日、RStudio から Shiny がリリースされ、早くも話題になっています。 Shinyを使って、RだけでWebアプリケーション - ixixixixixixi Shinyで5分でできる株価チャートウェブアプリ - はやしのブログ Rev.3 shinyでシャイニイイイイイイイイイイイイイイイイイイイイイイイイイ - 盆栽日記 Shiny は、R だけで手軽に Web アプリケーションが作れるということで、早速試してみましたが、これはすごいです。 解析結果を埋め込んだインタラクティブな Web アプリケーションを非常に簡単に作成することができます。 実際どういうのができるのか知りたい人は、デモページがあるので触ってみるといいでしょう。 Spark and Glimmer Users – RStudio Spark and Glimmer Users – RStudio Spark a

    Shiny アプリをワンクリックで起動するやつ作った - ほくそ笑む
  • 【GDC2010】家庭用からソーシャルゲームへ・・・1億ユーザー『FirmVille』開発者が語る「計測的開発手法」 / GameBusiness.jp

    「自分たちがソーシャルゲームを作れば、もっと良い物ができる」・・・。そう考えているコンソールゲームの開発者は少なくありません。これは日でも海外でも変わらないようです。 しかも日ではソーシャルゲームの開発者自らが「自分たちはゲーム作りのノウハウがないので・・・」とへりくだる姿がよく見られます。これにも「だから一緒に、もっとおもしろいソーシャルゲームを作りませんか?」という音が隠されていたりするのですが・・・。コンソールゲームとソーシャルゲームの開発文化には、広くて深い溝が横たわっています。 Zynga社のプロダクト開発副社長、マーク・スカッグス氏がGDCで11日に行った講演「Creating Successful Social Games:Understanding Player Behavior」は、こうした状況に活を入れるような内容でした。同氏はFacebookで大旋風を巻き起

  • マルコフ連鎖と日本語形態素解析によるワードサラダSEO

    マルコフ連鎖とは マルコフ連鎖は未来の挙動が現在の値だけで決定され、過去の挙動と無関係であることを利用した確率統計モデルです。定義としては次のような形を取ります。 マルコフ連鎖は、一連の確率変数 X1, X2, X3, … で、現在の状態が決まっていれば、過去および未来の状態は独立であるものである。形式的には、 であるような過程をいう。一般の、時間的に均一でないマルコフ連鎖は、この等式を満たさない。(Wikipedia:「マルコフ連鎖」より) はい、難しい数式が出てきましたね。私もこの中身は完全には理解していません。しかし、このマルコフ連鎖を使うと、現在のデータを一定の出現率で並び替えるアルゴリズムを作成することも可能という事を憶えておいてください。実はGoogleのページランクアルゴリズムなどにもマルコフモデルが応用されています。 日形態素解析とは 日語は単語と助詞を中心に、日

    マルコフ連鎖と日本語形態素解析によるワードサラダSEO
  • はてなブログ | 無料ブログを作成しよう

    盛岡旅行記 なぜ盛岡か。 白龍 店のじゃじゃ麺 岩手銀行赤レンガ館 白沢せんべい店の南部せんべい 盛岡天満宮と盛岡八幡宮 チーズケーキのチロル 大通店のクリームチーズケーキ フェザン/イオンタウン 盛岡駅前 盛楼閣の盛岡冷麺 福田パン 長田町店のパン マルイチ 材木町店 …

    はてなブログ | 無料ブログを作成しよう
  • Chromeで複数のGmailアカウントの新着メールをチェックできる「Google Mail Multi-Account Checker」 | ライフハッカー・ジャパン

    Chrome:「Gmail」の受信メールをチェックできる拡張機能で、マルチアカウントに対応しているものが「Simple Mail Checker」以外にもありました。今回ご紹介する「Google Multi-Account Mail checker」は、最大9個までアカウントを管理でき、未読件数を通知してくれます。 アドオンをインストールすると、冒頭画像のように受信状況がわかるアイコンとともに未読メッセージの総数がツールバーに追加されます。そのツールバーボタンをクリックすると、それぞれのアカウントごとに未読数や件名、送信者名、文の冒頭部分がポップアップ表示され、その場でそれらをチェック可能です。面倒なログインやログアウトの手間をかけずに、Gmailの内容を同時にチェックできます。 複数のアカウントを使いわけている人は、アカウントの個数やそれぞれのアカウントを登録するだけで設定可能です。し

    Chromeで複数のGmailアカウントの新着メールをチェックできる「Google Mail Multi-Account Checker」 | ライフハッカー・ジャパン
  • 論文『大規模 AV 画像データベースと類似顔画像検索を用いた AV 検索システム』を公開しました | ぱろすけのメモ帳

    By Robert McDon. 昨年に顔画像をもとに似た顔の人が出ている AVBy Robert McDon. 昨年に顔画像をもとに似た顔の人が出ている AV を検索するツールを公開しました。そのツールは大変好評を博し、いろんなところで話題になってなかなか嬉しかったのですが、今回はそれを論文にした件の報告です。 あの人の研究論文集というものがありまして、そこではネタ系の文章が学術論文の体裁をもって多数掲載されています。これは僕も投稿する他ないではないか、というわけで昨年の12月に投稿しました。すると査読を無事に通過し、昨年末発行の論文集に掲載されました。コミケで販売されたのですが、どうやら完売に近いらしく、確認を取ったところ Web で無料で公開しても良いとのことだったので、今回ここで論文を無料で公開します。 さてさて。 [ダウンロードはこちら。] タイトルは『大規模 AV 画像データ

  • 顔画像をもとに似た顔の人が出ている AV を検索するツールを公開しました | ぱろすけのメモ帳

    By RobertBy Robert McDon. 最近いろいろやってましたが、邪悪なツール、遂に完成しました!! 顔画像をもとに似た顔の人が出ている AV を検索します。検索対象の顔画像は35万枚です。使い方としては「この画像、AV 女優なんだけど誰だかよくわかんない」「このアイドルに似た人が出てる AV を探したい」など考えられます。「Facebook で流れてきた画像をとりあえず放り込む」「卒業アルバム」などはいろいろアレなのでやめましょうね!! というわけで今回はこのツールを配布します。 もともとは Python で Ubuntu 向けに書いたんですけど、ちゃんと Windows 版も作ったのでそれで。 まずは起動します。 ふつうに起動すれば良いですね。 とりあえず画像を選べと言われます。 画像を選びます。今回は紗倉まなの DMM のサンプル画像を選びました。(リンク先18禁サイト

  • 確率統計を学ぶにあたって 金谷健一 岡山大学工学部情報系学科

    確率統計を学ぶにあたって 金谷健一 岡山大学工学部情報系学科 1 確率統計は大学の一番難しい科目? 私の知っている人で(中には大学の理科系の先生もいる),確率統計は習ったがよく分からない という人が多い.私自身もそうであった.大学で確率統計を習ったが(私の場合は 3 年次であっ た),まったく分からなかった.期末試験のためにいろいろなを読んだが,どうしても理解でき ない.個々の例題の計算の仕方の説明を読めば,そのやり方は分かるし,導出も書いてあるので, そのようになるのだということに疑いは起きない.しかし,どうしても「分かった」という気に ならない.自分の頭で考えることができない.そのため覚えらないのである. 大学に入ると難しい科目をいろいろ学ぶ.特に 1 年次の解析学(微分積分学)と線形代数学(ベ クトルと行列)を学んだときは,あまりに抽象的な記述に愕然とした記憶がある.しかし,その

  • RSSリーダーに情報を集めたい一心で、はてブを使って自力キュレーションをやってみる。

    ブログ移転のお知らせ! ▼当ブログは移転しました!新しいサイトは以下となります!! http://bamka.info ▼お手数おかけしますが、RSSの再登録もお願いします!! http://feeds.feedburner.com/bamka Summifyなどのキュレーションサービスは便利なんですが、RSS登録できないのが難点でした。 話の発端は、情報収集のカタチをひとつにまとめたかったからなんです。 (もっと言えば、iPhoneRSSリーダー「Reeder」にまとめたかった!) 参考:RSSを最速で読みこなしてみせる。スター付けてを一気に処理するのが吉。 今まではキュレーションサービスの配信先をEvernoteにして、あとで読むようにしていました。ですがそうすると、EvernoteのInboxがたちまちいっぱいになってしまうんです。 そこで、なんとかSummifyの更新をRSS登録

    RSSリーダーに情報を集めたい一心で、はてブを使って自力キュレーションをやってみる。
  • 16万タイトルの AV の ID を dmm から集めた | ぱろすけのメモ帳

    By RobertBy Robert McDon. 皆様こんにちは! 今日は、「大規模AVサンプル画像認識」プロジェクトの第1回として、その下準備としての素材集めの話について書きます。これはもちろん何か悪事を働くためのプロジェクトではなく、コンピュータの活用によるユートピアの実現へ向けての第一歩と捉えていただければ幸いです。 さて僕は、画像処理や画像認識に関して、少しだけ知識があります。画像処理とは主に画像を処理して別の画像を吐き出すことで、たとえばフィルタをかけて色を変えたりぼやけさせたり、そういうようなことをしています。画像認識とは人工知能に比較的近い分野で、もう少し高度なことをします。たとえば、画像から顔を検出したり、写っているものが何であるか判定したりします。 画像認識では、近年、ネット上の大規模データを活用して何か賢いものを作ろうという話が多くあります。そのようなアプローチはアカ

  • Hashnote - Vimを最強のPython IDEにする

    pythonbrewによるフレキシブルなPython環境の構築 Vimの設定とかはあまり関係ないですが最強を詠うために最強のPython環境が必要なので構築します。最強の環境とは インストールされているPythonのバージョンが違うことによって不可解なバグが発生しない インストールされているライブラリのバージョンが違うことに不可(ry インストールされているライブラリ同士が干渉して不可解な(ry だと思っています。これらを解決するために pythonbrew という素晴らしいソフトを利用します。 ただこのソフトはシェルが前提となっているのでWindowsをお使いの方は代わりに virtualenv をインストールして先に進んでください。 Pythonには大きく分けて2.x系と3.x系の大きなバージョンがあり、この二つは相容れないものとなっています。 2.x系はずっと使われてきたもので外部ラ

  • 数学にはネイティブはいない:「語学としての数学」完全攻略=風景+写経アプローチ

    (関連記事) ・凡人が数学を語学として学ぶ具体的な手続きを説明する/図書館となら、できること番外編 読書猿Classic: between / beyond readers ・無料で自宅でやりなおす→小学校の算数から大学数学までweb上教材をリストにした 読書猿Classic: between / beyond readers 数学は、科学(自然科学はもとより、大半の社会科学と、かなりの人文科学で)の共通言語です。 一定程度マスターすれば、数カ国語を習得した以上の世界が眼の前に広がっていることを知って狂喜乱舞するはずです。いわば《語学としての数学》を習得する利益は非常に大きいと思われます。 ところが「英語の学び方」のコツ、体験談、支援サイトの紹介な、定期的にネット上でも話題になるのに、潜在的習得ニーズが大きな数学については、そうした形で取り上げられることがほとんどありません。 その一番大き

    数学にはネイティブはいない:「語学としての数学」完全攻略=風景+写経アプローチ
  • まとめ:夢を見て書け! ~文章力向上を目指す35選 | ライフハッカー・ジャパン

    欲の秋、スポーツの秋、芸術の秋、高田の奥さん向井亜紀...。秋は短い季節ですが、気候が穏やかで過ごしやすく、さまざまなことに打ち込みやすい時期です。 読者の皆様の中で、ブログを書いている人は多いのではないでしょうか。文章を書いて稼いでいるという方もいるかもしれません。ブログの普及のおかげで、今では多くの人々が、自分の書いた文章を世界中へ発信しています。その中で、オリジナリティのある文章を書くとなると、なかなか難しいものです。 ブログに限らず、文章力はさまざまな場面で役立ちます。この秋は、書くことに打ち込んで、文章力を向上させてみませんか? そこで今回は、文章力向上を目指す35選をお送りします。 ■テクニック ・効率的に校正するための10のコツ ・プロから教わる、良い文章を紡ぐ5つの珠玉のテクニック ・自分をガッツリ集中させるための8つのセルフマネジメント術 ・テープ起こしは、インタビュー

    まとめ:夢を見て書け! ~文章力向上を目指す35選 | ライフハッカー・ジャパン
  • 基本心得からオススメツールまで、よりよいライティングのための10のコツ | ライフハッカー・ジャパン

    「ライティング」は、自分自身を表現したり、頭の中を整理するのに適した、身近で基的な手段。しかし、そんな身近な手段だからこそ「言いたいことが、なかなかうまくまとまらない」、「じっくり書くことに専念できない」といった悩みも尽きません。そこで米Lifehackerでは、よりよいライティングのためのコツを10点にまとめました。「英語で書く」ことを前提としたものですが、言語を問わず活用できる方法が紹介されているので、ぜひ参考にしてみてください。 1: 書く前に、考えを整理しよう 書き始める前に、落ち着いて考えを整理しよう。ラフなアウトラインがあれば、全体をまとめやすくなる。「Scrivener」や「yWriter」は、ライター向けの便利なツール。このほか、「Evernote」や「OneNote」といった、一般的なオーガナイザーを活用してもよい。 2: 書くためのスケジュールを設定しよう ものを書く

    基本心得からオススメツールまで、よりよいライティングのための10のコツ | ライフハッカー・ジャパン
  • 有名小説家が伝授する、ショートストーリーを書くための8つの法則 | ライフハッカー・ジャパン

    秋の読書シーズン真っ盛り。もはや読んでいるだけでは物足りず、「今度は自分で何か書いてみようかな?」という方はいらっしゃいませんか? 11月には「NaNoWriMo」月間として、プロ・アマ問わず、多くの「小説家」たちが、創作活動を行っています。 では、読者に伝わりやすい小説を書くには、どんなことを心がけるべきなのでしょうか? 米小説家カート・ヴォネガット(Kurt Vonnegut Jr.)氏は、著書『バゴンボの嗅ぎタバコ入れ』において、以下の8つのポイントを指摘しています。 時間の無駄を感じさせないように、時間を使う。 登場人物のうち一人は、読者が応援したくなるような人物を入れておく。 登場人物には、たとえ水一杯でも、何かを求めさせる。 各センテンスは、登場人物を明かす、もしくは、アクションを前進させるの、いずれかにする。 可能な限り、最初と最後を近づける。 サディストになる。どんなにかわ

    有名小説家が伝授する、ショートストーリーを書くための8つの法則 | ライフハッカー・ジャパン
  • 解明! 運がない人は、なぜ運がないのか

    仕事もプライベートもトントン拍子に進む幸せな人と、何をしてもトラブルに見舞われる不運続きの人がいるのはなぜだろうか。気鋭の研究者が心理学的に解説する。 他人に配慮できる人ほど運がいい あなたの周囲を見回してみると、仕事でもプライベートでもなぜかいつもツイていて物事がトントン拍子に進む人はいないでしょうか。逆に、運に見放されたか のように何事もうまくいかず、沈み込んでいる人はいないでしょうか。このような幸運、福運、強運の人と、不運、悲運、悪運の人はなぜ生まれるのでしょう か。そして、両者はどこが違うのでしょうか。 私たちは「認知的焦点化理論」というものを唱えています。人が心の奥底で何に焦点を当てているか。そこに着目した心理学上の研究です。 ひとことで言えば、ある人が物事に向き合うときに、どのぐらい他人のことを配慮できるかという観点から、人を分類しようとする試みです。 図1をごらんください。横

    解明! 運がない人は、なぜ運がないのか
  • Googleリーダー難民で賑わう8つのRSSリーダー

    Googleリーダー終了でユーザーは阿鼻叫喚だけど、Feedlyは2日で難民受け入れ50万人! 一部RSS関係者からは「やっとまともな競争の土壌がきたね」という声も聞かれる今日この頃。 ギズでも早速ライターの三浦さんがLivedoor Readerへの移行手順をご紹介しましたが、網を広げてみると他にもこんなにあるんですね! DiggとかYahooジャパンさんも移行先を爆速で作ってる宣言してます。 とりあえずここでは今移行が楽なRSSリーダーを8つ選んでみました。Googleリーダーが閉鎖になる7月1日までにいろいろ試して決めたいですね。 Feedly リーダーこれひとつで全端末いける、その手のRSSリーダーではベストに入るのがこのフィードリー(Feedly)。デスクトップだとChromeとFirefoxの拡張機能で使えて、AndroidとiOSのアプリもあるし、Kindleで探しても見つか

  • 匿名掲示板への気軽な書き込みが名誉毀損に!その時、投稿者はどうやって身元を割り出されるのか

    昨年末時点での個人普及率が79.1%と、身近な存在となったインターネット。中でも「2ちゃんねる」に代表される匿名掲示板は、名を知られることなく気軽に自分の意見を表明できる場として、根強い人気がある。しかし一方でその「気軽さ」故に、容易に名誉毀損を生みやすいという面もある。もし被害者が名誉回復を求める行動に出たら、投稿者はどのようにして割り出されていくのか。その経緯を解説する。(弁護士:最所義一 協力:弁護士ドットコム) 決して完全に「匿名」ではない匿名掲示板 ある日舞い込んだ一通の書面には…… 「ある日突然、『発信者情報開示に係る意見照会書』と書かれた書面が、私が契約しているインターネットプロバイダから届きました。書面には『貴方が発信されました、次葉記載の情報…』と記載され、請求者に弁護士の名前が書かれています。 確かに、私はある掲示板に投稿しました。ですが、書き込んだのは匿名掲示板のは

  • 安倍首相のFacebookに韓国人・中国人が反日コメント するも、 何故かフランス人が論破した件|ガジェット通信 GetNews

    (Photo by 足成) 戦場は安倍首相のフェイスブック 先日、安倍晋三首相がFacebookで中国を批判しました。 3月11日の東日大震災慰霊式典に「台湾の代表の取り扱い」を理由に中国が欠席いしました。 昨年行われた慰霊式典では、台湾の代表は招待され出席していたにも関わらず名前すら読み上げられませんでした。 震災発生時、台湾は世界のどの国よりも多額の200億円を超える義援金を贈ってくれた大切な日友人です。台湾の人々の気持ちを傷つける非礼な対応でした。 今年はこの対応を改め、台湾に対し感謝の意を込めて「指名献花」をしていただくことにいたしました。 このことに対して中国が代表を送らなかったことは大変残念なことであります。 しかし私達はこれからも礼儀正しくありたいと思います。 そして多くの支援をいただいた台湾をはじめ全ての国に対して、感謝の思いでいっぱいであります。 (原文そのまま、引

    安倍首相のFacebookに韓国人・中国人が反日コメント するも、 何故かフランス人が論破した件|ガジェット通信 GetNews
  • Rデータフレーム自由自在

    This document summarizes information about a person named Takeshi Arabiki. It includes: 1. Their Twitter handle is @a_bicky and ID is id:a_bicky. 2. A link to their blog on Hatena is provided. 3. They have written books and slides about using R and SciPy. 4. Links are provided to their slideshare presentations about using Twitter and R.Read less

    Rデータフレーム自由自在