「遊び」をクリエイトするAI デスピサロを相手に、効くはずのないザラキを唱えまくるクリフトを見ながら、AIというのはなんてアホなのだろうと思った。多分、それが、僕が初めてAIに出会った瞬間だったと思うのだけど、時は過ぎ、現代では生成AIを中心とした「かしこいAI」たちが世に溢れていて、…
突然ですが,mecabの辞書 (mecab-ipadic) をデフォルトのまま使って,mecab意外と使えねぇとか文句言ってる悪い子はおらんかね? mecab-ipadic は比較的お行儀のよい日本語をベースに作られているので,そのままでは web上の口語文体のテキストはうまく扱えないことがあります。本来は教師データを用意し,学習させるといった手法を使うのが正攻法だと思いますが,とりあえず名詞を充実させるだけでも実用度はだいぶ上がるでしょう。 人間の話す言語には,動詞の語幹や名詞には日々新しく語彙が増えるけど,助詞や活用のルールは簡単には変化しない,という特性があります。特に「いま最もつぶやかれている単語ランキング」といった集計をするような場合は,名詞の範囲の切り出しさえ間違えなければそれなりの結果を出せることも多いのです。 ただ,辞書への単語追加はここにある通り簡単にできるのですが,単語
codewallに登録してみたら、ちょっと面白い仕掛けがあった。プロフィールを何も入力していない状態だと、「スキル」の欄がこんな悲惨な内容になっている。 これは悲惨すぎる! ちゃんと編集しないといけない! もしもここに「まだ入力されていません」としか表示されていなかったら、あまり真面目にプロフィールを編集しようとは思わない人も多いだろう。後で気が向いたら書けばいいや、と。 しかし「ちゃんと記入しないと『IE6大好き☆ 特技はVBで〜す☆』ってことになるぞ」ってのは多くの人にとってはかなり嫌な脅迫となる。これはもう速攻で記入するしかないよ! 実際に何もしないと本当にIE大好きで特技はVBですと表示されるのかどうかは謎。おそらくはただの気の利いたジョーク……だと思う。 わかったのは、デフォルトが酷いものになっていると、「未入力です」と表示するよりもずっと強力に記入したい気分になるってこと。
情報と技術は未来をどう変えるのか──IT、スマートデバイス、ロボット、電子工作、メディアのアーキテクチャ Google勤務のKazunori SatoさんがGoogle+に簡潔な解説をポストしてくれています。 ポスト1 BigQueryが一般公開されました!数100億件の全検索が数十秒で完了する超並列クエリサービスで、MapReduceと並びGoogleの根幹を支える虎の子技術です。 Google BigQuery brings Big Data analytics to all businesses - Google Developers Blog ポスト2 BigQueryプチ解説:BigQueryはGoogle社内では「Dremel」と呼ばれる超並列クエリインフラを利用した一般向けサービスです。DremelはSybase IQやOracle Exadataと同様のColumar DB
風邪がはやっているので、田中社長におかれましては暖かくして寝ていただきたいのですが、消費者庁から第一弾の見解として、コンプガチャについては違法性を確認し(絵合わせ)、景品表示法の名目で中止を要請するということで落ち着きました。 違法性が確認しうる他のソーシャルゲームサービスについても順次中止を要請する予定だそうですが、一応の猶予期間といいますか、目安としては5月一杯は様子を見るという形だそうであります。 で、一番問題となるネクソンジャパンが6社協議会の中に入っていません。呼びかけに応じなかったのか、お誘いがなかったのか分かりませんが、やっぱりちょっと気になります。基本的には、いかな抗弁があろうとも聴く耳を持たない方向で推移するので結果は変わらないとは思いますけれども…。 当初想定していたシナリオの中では、比較的穏便な方向で着地したように思うんですよね。もっとも、先般書きました内容は近い将来
風邪がはやっているので、田中社長におかれましては暖かくして寝ていただきたいのですが、消費者庁から第一弾の見解として、コンプガチャについては違法性を確認し(絵合わせ)、景品表示法の名目で中止を要請するということで落ち着きました。 違法性が確認しうる他のソーシャルゲームサービスについても順次中止を要請する予定だそうですが、一応の猶予期間といいますか、目安としては5月一杯は様子を見るという形だそうであります。 で、一番問題となるネクソンジャパンが6社協議会の中に入っていません。呼びかけに応じなかったのか、お誘いがなかったのか分かりませんが、やっぱりちょっと気になります。基本的には、いかな抗弁があろうとも聴く耳を持たない方向で推移するので結果は変わらないとは思いますけれども…。 当初想定していたシナリオの中では、比較的穏便な方向で着地したように思うんですよね。もっとも、先般書きました内容は近い将来
GW中にやることリストのひとつである確率的情報検索ノートができたので公開. Notes on Probabilistic Information Retrieval ―Probability Ranking PrincipleからBM25まで― 確率的情報検索とは,Prbability Ranking Principle (説明はノート参照) をスタート地点にして適合確率をモデル化した情報検索のいち分野.Binary independence modelやBM25などが含まれる (BM25はいろんなヒューリスティクスが入っているのだけれど). BM25とは, [tex:\sum_{t \in q} q_t \cdot \frac{f_{t,d} (k_1 + 1)}{k_1*1 + f_{t,d}} \cdot w_t] という (説明はノート参照),ぱっと見ワケワカラン計算式だけれど当た
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く