オーバーチュアとヤフーは3月25日、興味関心連動型広告「インタレストマッチ」のPC向けサービスについて、4月以降に提携パートナーへも配信していくと発表した。これまではYahoo! JAPANのみに配信していた。 広告の掲載が開始されるのは、mixi、All Aboutなど現在コンテンツ連動型広告「コンテンツマッチ」を採用しているパートナーサイト。5月までに、コンテンツマッチ採用パートナーにはすべてインタレストマッチを配信するという。
![興味関心連動型広告「インタレストマッチ」、mixi、All Aboutなどにも配信へ](https://cdn-ak-scissors.b.st-hatena.com/image/square/b2e7e8148382fd7b3dec79b2c199e08ace74193a/height=288;version=1;width=512/https%3A%2F%2Fjapan.cnet.com%2Fmedia%2Fc%2F2012%2Fimages%2Flogo%2Flogo_ogp_1200.png)
最近出た Twitterville というアプリを教えてもらったのですが、唖然としました。どうやら github に上っている NatsuLion for iPhone のソースコードをそのままコンパイルして、名前とアートワークとクレジットだけを変えて、ほか機能いじらずに販売されてしまっているようです。ライセンス的には New BSD License ですので、もちろん第三者がコンパイルして(改変してもソース公開なしに)売ることも可能ですが、アプリのクレジットが明確に消されてしまっています。(購入して確認しました。ついでに返金請求してみた。) あと個人的には、起動画面のやっつけ具合もちょっと無いんじゃないかなあ、と。。 クレジットのところは明確に New BSD License 違反なので、この Twitterville の作者に入れるようにとのメールを出しました。残念なことになってしまい
昨日のNL190で以前より日記を拝見させていただいていた持橋さんの発表「ベイズ階層言語モデルによる教師なし形態素解析」がありました。辞書なしで文字単位のテキスト(コーパス)処理をして、情報理論的な基準で形態素解析(というか単語分割)を行うというもので、理論的にもよく考えられているようです。言語の文字列を階層Pitman-Yor過程による文字-単語階層nグラムモデルの出力とみなし, ベイズ学習を行うことで, 教師データや辞書を一切用いない形態素解析を可能にする。これにより, 教師データの存在しない古文や話し言葉,口語体などの形態素解析と言語モデルの作成が可能になる。発表は分かりやすく、結果はかな漢字変換にも応用が効きそうなもので、大変刺激を受けました。理論的な面については付け焼刃でなんとかなるようなものではなさそうなので、持橋さんのサイトで公開されている論文を読みながら勉強してみようと思いま
unigramとディリクレ分布について復習しました。ディリクレ分布については自然言語処理関係ではなく、PRML本の2章を読んで初めて理解したのを覚えています。Polya分布については数式は分かっても、意味はよくわかっていません。unigramとは 自然言語処理では様々な応用に言語モデルが使われる最も単純な言語モデルはunigram(1-gram)unigramの確率分布は多項分布ベイズなので多項分布の事前分布を導入したい事前分布を導入すれば、ゼロ頻度問題を緩和できるディリクレ分布とは 多項分布の事前分布として、よく使われる確率分布ベータ分布を多次元に拡張したものにあたる多項分布の事前分布として使ったときの事後分布はディリクレ分布予測分布の式は、Polya分布と呼ばれる事後分布の期待値は、頻度確率に仮想的な観測データを加えた形をしているディリクレ分布を事前分布とする理由 全ての確率変数の定義
2009 03 29 [Sun] WEB企業の未来を担う若手エンジニアが大集合!! 日本野望の会 presents Web2.0 中の人ナイト Open 17:00 Start 18:00 End 20:30 (予定) 前売り券1500円 当日券2000円(ともに飲食代別途必要400円〜) 「WEBの未来を担うのは俺たちだ! 誰もが知っているあのWEBサービス、 生活を変えてしまった便利なWEBサービスを 裏側から支えるWEBエンジニア・開発者・管理者…… 通称“中の人”が語る現場の裏側マル秘エピソード、 WEBビジネス、ネットワーク社会の今と、そしてこれからと。 時代は、彼らの両の手によって、切り開かれる!!」 ウェブサイトの制作・運営を行う業界で働く若手社員を対象に お互いの仕事を紹介し、一緒にものづくりを目指す仲間と出会う 交流イベントを開催します。 当日はmix
twitter検索はpublic_timelineをスクレイピングする方法でポストを収集していました。 これはうまくいっていたのですが3月のはじめにAPIによるアクセスに続いて通常ページもキャッシュされるようになり、ポストの取得がとびとびになってしまいました。影響はかなり出てしまい、回収率は1/10程度に落ち込んでしまいました。 代替策 TwitterはData mining feedという600ほどのポストを一度でもらえるAPIを提供していてポストを多く集めたい人はそれを使うようにというアナウンスをしています。しかしこれもキャッシュが効いているようですからそれほど改善しないのではないかと思い試していません。 また、既に事実上日本語のみを検索対象にするサービスになっているので日本語ユーザーのポストだけもらえればいいかと思い、日本語ユーザー(7万人前後)をRSSで取得する方法を考えましたが、
現在大学1年生の人で3年後には NAIST に (というか松本研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は Perl → Python がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。 そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出
「Lucene.Net」は.NET Framework上で利用できる「全文検索エンジン」です。例えば、ASP.NETを使ってWebサイトを作成する際に、サイト内のコンテンツを検索する検索ページを作成したいという場合や、Windowsアプリケーションで全文検索機能を利用したい場合にLucene.Netが利用できます。 Lucene.NetはApache Software Foundationが開発しているプロジェクトの1つで、オープンソースで開発されています。Java言語で記述された「Lucene」がそのオリジナルであり、これは、Wikipediaをはじめ多くのWebサイトで現在利用されています(Lucene-java WikiのPowerdBy) Luceneの.NET版であるLucene.NETは、Java版と同様Apache Software Foundationの「Lucene.Ne
もうあと1週間しか東京にいられない関係でちょっと立て込んでいて(あまり考えていなかったが早めにやっておかないといけないという意味でプライオリティ高い仕事があったりして)、今日の研究会には参加できなかったのだが(昨日の日記にも追記したがもう一度書いておくとdaiti-m さんのページに行くと教師なし単語分割のスライドが見られる。ちぃ、ベイズ階層言語モデルおぼえた!)、松本先生が会う度(3月頭の言語処理学会の年次大会と、中旬の日本語書き言葉コーパスのワークショップに加え、昨日の NL 研でまで……)に「最近 ai-a くんの研究おもしろくなってきたよ。聞きに来ないの?」と言うので興味があって「系列ラベリングのための Forward-Backward アルゴリズムの一般化」を読んでみた。 数式追い切れていないのでよく分からない(違ったらツッコミください>>ai-a さん)が、つまり既存の自然言語
1.目標 JavaScriptで日本語IMEを作ろう( ゚∀゚) - Webと文字で作ったJavaScriptIMEをWindowsに移植する。 2.必要な実装 文字列の挿入と一時的な入力エリアの挿入 一時的な入力エリアにおけるテキストの変更とキャレット位置の取得とキャレット位置の設定と書式変更 一時的な入力エリアの下に出すWindowとその書式設定 キーイベントの取得 WwbAPIより変換候補を取得する 3.準備 今までに以下に示す関連するエントリを書きました。 C++について1:C++をかじる - Webと文字 C++とCOMについて:C++とCOM - Webと文字 COMとTSFの概略、環境の構築:COMとTSF - Webと文字 DLLとレジストリ、TSFの登録:TSFのサンプル? - Webと文字 TSFの説明が日本語資料としてMSDNにあります。 Text Services
マイクロソフトは、主力ソフトウェア「Office」の対象ユーザーを見直し、家庭での利用者増を図る。マーケティング活動でも、タレントを使い、Office製品の家庭における楽しみ方を動画で紹介する特設サイトをつくるなど、企業向けというOfficeの硬いイメージを壊す考えだ。 同社が2008年10月31日に開始したのが「オフィス 2007 でヒーローになろう!」というキャンペーン。家庭のPCでOffice 2007の利用を促す。特に企業向けのイメージが強いプレゼンテーションソフトのPowerPointで、年賀状やサークル活動の案内状、デジタルカメラを使った写真アルバムを作成しようと呼びかけているのが特徴的だ。特設サイトでは、パワーポイント版昔話「かぐや姫」編などの動画コンテンツを用意し、Officeの家庭における新たな使い方を提案している。 インフォメーションワーカービジネス本部の飯島圭一氏は「
美しく幻想的なグラフィックと、3D視点が生み出す圧倒的なスピード感で、今もなおファンから高い評価を受けている、大ヒット・シューティングゲームです。ドラゴンランドの危機を救うため、超能力戦士「ハリアー」は大空を飛び大地を駆け、邪悪なドラゴンや異生物、巨大ロボットや戦闘機と戦いを繰り広げます。 アーケードの花形「セガ体感ゲーム」シリーズの第2弾タイトルである本作は、コックピット型の大型マシンと操縦桿による操作システムが特徴でした。この「バーチャルコンソールアーケード」版では、「ヌンチャク・スタイル」による操作に対応することで、オリジナルさながらの直感的なプレイ感覚を実現しています。もちろんWiiリモコンやクラシックコントローラによる、従来の家庭用移植バージョンと同様の操作も可能です。
Twitterで最近以下の発言をしました。 http://twitter.com/gamella/status/1376736918 今日、花見の席でちょうどこの話題が出て、簡単に説明したところ結構好評だったのでこっちでも書いてみます。 僕は勝間和代氏の本を結構読んでいる方だと思うのですが、勝間和代氏の政治的なスタンスは以下の3点に集約されると思います。 女性の社会進出、積極活用 子育て支援 若者への投資強化と教育支援 僕は上記3つに対してはどれも賛成なのですが、NHKの「真剣中年しゃべり場」や「激論2009 世界はどこへ そして日本は」を見ているとかなり実現可能性を意識しているように見受けられました。もちろんコンサルタント出身ということなので、データを基に、持論を展開するのは当然だとおもうのですが、なんとなく直感的に感じたのはこれは結構本気で日本を変えようと思っているな、という点でした。
米Microsoftのクラウドサービス担当者が3月26日(米国時間)、“Cloud Manifesto”として非公式に進んでいるクラウドコンピューティング標準化の動きをブログで批判。相互運用性や標準は「一般がコラボレーションできるオープン性のあるプロセスで定義されるべき」と提案した。 開発者ネットワークMSDNのブログで、同社プラットフォーム製品管理部門上級ディレクターのSteven Martin氏が記したもの。Martin氏は、クラウドサービスプラットフォーム「Azure Services Platform」などを担当している。 それによると、Martin氏は先日、Cloud Manifestoとよばれる最新のクラウド標準化の取り組みを関係者から紹介され、非公式にドキュメントの草案を見たという。クラウドの相互運用性を目的としたガイドラインや原則を記したものだが、「われわれの観点からすると
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く