1. Succinct Vector, Wavelet Matrix implementation 2013/2/20 社内勉強会 3/21 update version of marisa 光成滋生 2. 今回の実装(中のもの) Succinct vector https://github.com/herumi/cybozulib/blob/m aster/include/cybozu/sucvector.hpp Wavelet matrix https://github.com/herumi/cybozulib/blob/m aster/include/cybozu/wavelet_matrix.hpp Benchmark code https://github.com/herumi/opti/ rank_test.cpp, wm_test.cpp 2 / 16
2013年3月21日木曜日 バイドゥを退職しますぅ〜 12:19 | 投稿者 Hiro Imamura | | 投稿を編集 みなさん、こんにちは村長こと暇村ですw! この度、バイドゥ株式会社を3月末日をもって退社することになりました。 バイドゥでは約1年2ヶ月在籍させて頂き、Androidの日本語入力アプリの「Simeji」の商品企画っぽいことを行なっていました。 Simeji(日本語入力キーボード) - Google Play http://goo.gl/uR3Ev Android向け日本語入力アプリ Simeji http://simeji.me/ 既に、先日行われたABC2013SのワンチップAndroidソリューションの紹介と言うセッションをご覧になったり、その後公開された動画(http://goo.gl/cQAGx) をご覧になった方はご存知だったかもしれません。 A
昨日、韓国の放送局や金融機関がサイバー攻撃されたとの報道があった。1日経って、少しずつ情報が出てきたのでメモしておく。 新情報が入り次第、追記します。 注:「非正規のクライアントOSを使っていたために、WindowsUpdateで起動不能にされた」という誤情報を流している人がいるようです。毎度の事ながら困ったものだ。 例によって2ちゃんねる発→パクリサイト経由で広がっているようです。 追記:サーバー側が非正規だったのでは?という説が出ています。「セキュリティ・ホットトピックス – 韓国の大規模サイバー攻撃は非正規Windowsサーバーのパッチ配布が原因:ITpro」。記事本文は推測ばかりで妙な記事です(この記事の下で詳しく書きます)。 資産管理サーバー経由の攻撃韓国ハウリ社(ウイルス対策ソフト開発会社)から下記のリリースが出ている。 [참고사항] 일부 언론을 통해 와전된 것처럼 업데이
In computer science and data mining, MinHash (or the min-wise independent permutations locality sensitive hashing scheme) is a technique for quickly estimating how similar two sets are. The scheme was invented by Andrei Broder (1997),[1] and initially used in the AltaVista search engine to detect duplicate web pages and eliminate them from search results.[2] It has also been applied in large-scale
HDP-LDA の更新式を実装できたら、それが正しく動いているのか、そして収束したかどうかを確認するために perplexity を求めたいところだが、こちらも例によって論文には詳細な数式は書き下されていないので、最後にこれをやっつけよう。 論文ではパープレキシティはこのような式で定義されている。 LDA の眷属は bag-of-words モデルなので、単語はすべて i.i.d. であることを使って展開していくと、 ここで事後分布 p(z|X) と p(x|z,X) はそれぞれ次のようになる。 ディリクレ分布の事後分布は PRML 等でもおなじみのものだが、ディリクレ過程の事後分布はなかなか見たこと無い人も多いかと。かの Ferguson の原典にはもちろんちゃんと書かれているんだけど、普通それ読まないし読めない。 で、なんかいいのないのかなあと探してたら、まさに Teh さんのサイトで
3月20日に韓国で発生した大規模サイバー攻撃(関連記事1、関連記事2)。同時多発的に発生していることから、ウィルスを用いたサイバーテロ(サイバー戦争)という話が最も有力になっている。 筆者は、今回の事件は、韓国における非正規Windowsの存在が引き金になったと推測している。なぜ、そのように判断したか、順を追って解説してきたい。 まず、2003年に大流行したSQL Server 2000に感染するSQL Slammerというウィルスの存在を思い出してほしい。あのときは、米国と並んで韓国でも大きな騒動となり、一時インターネットが使えないなどの大混乱となった(関連記事3、関連記事4)。その大きな要因は韓国内で大量の海賊版Windowsを利用されていたことで、複数のサーバーで適切な運用及びセキュリティパッチが適用されておらず、そのため韓国内でウィルス感染が一気に広がり、韓国内のインターネットがダ
7/28 に行われた nokuno さん主催の ICML 2012 の論文読み会にのこのこ参加。お疲れ様でした&ありがとうございました>各位 「えーまたトピックモデルなの?(ぶーぶー)」とブーイングを浴びつつ、[Kim+ ICML12] Dirichlet Process with Mixed Random Measures を紹介してみた。発表資料はこちら。 [Kim+ ICML2012] Dirichlet Process with Mixed Random Measures : A Nonparametric Topic Model for Labeled Data from Shuyo Nakatani www.slideshare.net 論文では Stick Breaking Process と Polya Urn の2つでモデルを表現していたが、そのあとどうせ Gibbs s
■中国オタク「ウチの国の感覚でも違和感の少ない学園モノの作品って何があるかな?」■ ■中国オタクが納得できる日本の学園モノ このブログでは「日本の学園モノの作品に対する中国オタクの反応」「学校生活、特に中学や高校の生活に関する日中のイメージの違い」といった話を紹介させていただいておりますが、ありがたいことに「中国オタクから見て、納得できる、ありそうだと感じられる日本の学園モノの作品ってありますか?」という質問をいただきました。 そんな訳で、今回は中国のソッチ系のサイトなどをまわって見かけた「中国オタク的に見て違和感の少ない日本の学園モノ」についてのやり取りを、例によって私のイイカゲンな訳で紹介させていただきます。 ■中国人オタクの議論 日本のアニメや漫画で描写される「学園」に関して、ウチの国ではツッコミが絶えないし、ある程度現実的な作品においても、学校の描写に関して違和感を覚えてしまうこと
※この原稿は「情報の科学と技術」Vol. 63 (2013) より許諾を得て転載させていただいております。執筆者はガジェット通信の関連企業「未来検索ブラジル」社で検索エンジン開発を行なっている森大二郎です。 「情報の科学と技術」(情報科学技術協会) http://www.infosta.or.jp/journal/journal.html 検索エンジンの未来 -検索エンジンは妖怪“覚(さとり)”の夢を見るか-【前編】(森大二郎) 1.はじめに 検索エンジンサービスと、それを支える情報ネットワークはこの先どのように変化していくのだろうか。あるいは変化しないのであろうか。WWW検索エンジンの歴史がまだ20年にも満たないことを考えると、未来を予想するなど無謀な試みに過ぎないのはもちろんであるが、本稿ではあえて想像を逞しくして将来を展望してみよう。 今からちょうど20年前の1993年にNCSA M
概要† 『表記統合辞書』は,言語研究・自然言語処理用に開発された,同語判別のための基礎データです。 奈良先端科学技術大学院大学 情報科学研究科 自然言語処理学講座(松本研究室)で開発された形態素解析システム『茶筌』付属の電子化辞書『IPADIC 』ver.2.4.4 に対応しています。 『表記統合辞書』は無償でご利用いただけます。 著作権及び使用条件をあらかじめご確認の上,ご利用ください。 「ver.1.0 のダウンロード」のページからダウンロードしてください。 『表記統合辞書』の利用例としては,『茶筌』で形態素解析した結果に対して,同語判別を行う,ということが挙げられます。例えば,『茶筌』の解析結果(『IPADIC』 ver.2.4.4 を利用した場合)では,「組み立てる」と「組立てる」は表記上の違いにより,別語となりますが,『表記統合辞書』を使うことにより,同じ語であると判断することが
このページでは,国立国語研究所で開発されたコーパス,辞書,ソフトウェアなどの言語資源を公開しています。 新着情報 ... 履歴† 2024-04-01:全文検索システム『ひまわり』用の『青空文庫』パッケージを更新しました。 2024-03-15: FishWatchr (ver.1.0 rev02,履歴)を公開しました。 2023-10-25: 『ひまわり』ver.1.7.4を公開しました。 2023-01-31:全文検索システム『ひまわり』を用いた『日本語学習者作文コーパス』の利用を公開しました。 2023-01-07: FishWatchr Mini (ver.2.1,履歴)を更新しました。 2022-12-19:全文検索システム『ひまわり』を用いた『小中高大生による日本語絵描写ストーリーライティングコーパス』の利用を公開しました。 2022-12-15:全文検索システム『ひまわり』の
初めに 「たんし」とは 「たんし」とは、日本語の表記ゆれ判別用の辞書です。フォーマットは国立国語研究所の表記統合辞書に基づいています。 単語、その読み、その品詞、活用形ならびに表記ゆれと見なされる単語群で構成されています。 辞書フォーマットはTSV(タブ区切りのテキストファイル)で保存してあります。以下にその一部を引用します。 かざれる カザレル カザレル 動詞-自立 一段一段-基本形 かざれる/飾れる 飾れる カザレル カザレル 動詞-自立 一段一段-基本形 飾れる/かざれる 滑込める スベリコメル スベリコメル 動詞-自立 一段一段-基本形 滑込める/滑り込る/すべりこめる/滑込る/滑り込める ダウンロード 最新版 Ver. 1.1.0 過去のバージョン Ver. 1.0.0 これから… ATOKダイレクトAPIとの連携を実装しました。 © 2009 Koumei_S This Web
国内唯一のTwitter公式パートナーシップにより Twitter全量データをご提供 株式会社NTTデータは、2012年9月27日に米Twitter社とTweetデータ提供に関するFirehose契約を締結致しました。これにより、米Twitter社から全量・全言語のTweetデータをリアルタイムに受領し、Twitter社の公開APIよりも大量・高度・高付加価値なTweetデータをご提供可能なサービスプラットフォームを構築しております。 最上位のTwitter Official Data Partnerとして、このプラットフォームを基軸に、ユーザー企業様のソーシャルメディア情報活用を支援していきます。
Cooooooooooooooollllllllllllll!!!!!!!!!!!!!! Using Word Lengthening to Detect Sentiment in Microblogs *** Preprint Version *** Samuel Brody School of Communication and Information Rutgers University sdbrody@gmail.com Nicholas Diakopoulos School of Communication and Information Rutgers University diakop@rutgers.edu Abstract We present an automatic method which lever- ages word lengthening to adapt
『逆境ナイン』(ぎゃっきょうナイン)は島本和彦による漫画、およびそれを原作とした映画。「GK9」とも略される。 『月刊少年キャプテン』(徳間書店)において、1989年から1991年まで連載された。全28話。 スポ根とギャグの要素を含む野球漫画。主人公「不屈闘志」と全力学園野球部が次々と襲いかかる逆境に立ち向かい、甲子園優勝をめざす姿を描く。男の生きかた・男らしさを追求した内容と、徹底して常識外れな展開が特徴。 続編に『ゲキトウ』がある。また、作者自身が同人誌でパロディ版や番外編を数作発表している。 2005年に実写映画化。またノベライズ小説『平成の偉人伝シリーズ 試験に出る不屈闘志物語 112対0からの大逆境克服』が発行された。 概要[編集] 主人公不屈闘志ら全力学園野球部に次々と襲い掛かる、あまりにも非現実的な「逆境」に対し、不屈らがその名通りの不屈の闘志で乗り越えていくという、「熱血」
ここ半年以上、社内の自分が関連しているチームでHipChatを使っているのですが、先ほどTwitterで@yaotti/id:yaottiに「使ってみた感じどうですかー?」と聞かれたので感想を書いてみます。 結論から言うと「チャットツールは一長一短で、使う場面やチームによってマッチするツールは変わるなぁ」というのが正直な感想なのですが、今のところHipChatを便利に使っていて、直近で別のツールに乗り換える予定はありません。 今回使用したシーン メールでの情報共有が多すぎたので、グループチャットに切替え 非開発者メイン 拠点が2つ 人数は10人弱 API連携は使用しない ユーザーのITリテラシーは様々 HipChatのよいところ 固定チャットルーム機能 ログインしたら全員が友達リストにいて、業務用のチャットルームが見えるのもGood 検索が簡単(Webから検索できる) ブラウザ内チャットで
ガイアックスは3月21日、ソーシャルメディア上のトラブル防止を目的としたサービス「ソーシャルリスクモニタリング」を企業向けに提供開始した。 ソーシャルリスクモニタリングは、ソーシャルメディアリテラシー向上のためのeラーニングと、従業員の投稿モニタリングからなるサービス。初期費用は15万円。月額費用はモニタリング対象となるソーシャルメディアのアカウント数や投稿数によって異なる。 eラーニングでは、ソーシャルメディアの性質、炎上をはじめとするトラブルの要因と予防策、トラブル時の望ましい対応について、わかりやすく解説したコンテンツを提供するとともに、企業に合わせたコンテンツ作成も支援する。 投稿モニタリングでは、FacebookやTwitterを24時間365日、事前に設定した判断基準に基づき、有人で目視モニタリングし、リスクのある投稿を報告する。軽微な事故やニアミスの事例を集めることで、重大な
1:名も無き被検体774号+:2013/03/19(火) 21:37:13.06 ID:cDYzMzRN0 さて、語ろうか。 4:名も無き被検体774号+:2013/03/19(火) 21:38:12.49 ID:tV7mqQbs0 はよ 5:名も無き被検体774号+:2013/03/19(火) 21:38:20.75 ID:cDYzMzRN0 マジてキモいんだけど貼っていいか? 6:名も無き被検体774号+:2013/03/19(火) 21:39:08.48 ID:emsv8Ugb0 はよ! 12:名も無き被検体774号+:2013/03/19(火) 21:59:28.89 ID:cDYzMzRN0 13:名も無き被検体774号+:2013/03/19(火) 22:01:09.25 ID:cDYzMzRN0 15:名も無き被検体774号+:2013/03/19(火) 22:01:42.0
2013年3月19日公開 独立行政法人情報処理推進機構 技術本部 ソフトウェア・エンジニアリング・センター 概要 インターネット販売サイトやSNS(ソーシャルネットワークサービス)等のシステムでは、その構築において要件のすべてが明確にならなくても開発に着手し、要件の明確化や変更には開発と並行して対応します。それは、いかに早くサービスを提供するかに、ビジネスの命運がかかっているからです。 こうした要件の変化に柔軟に対応できる開発手法として、「アジャイル型開発」があります。これは、ビジネス上の優先度が高い順に、短いサイクルで機能単位の開発を繰り返す手法です。 このアジャイル型開発手法は自社開発(内製)が中心の米国で発展したものであり、要件を決めて外部に開発を委託することが多い等、受発注環境が異なる日本でアジャイル型開発を適用するのは難しいと考えられています(*1)。 「アジャイル型開発」には、
» 【所要時間5分】Twitterで話題の「卵とパンを使ったお手軽朝食」を作ってみた! 簡単なのにめちゃウマすぎて笑った! 朝は忙しくて時間がない! でも、おいしい朝食は食べたいのよぉーーーっ!! うんうん、わかりますその気持ち!! そんな皆さんにオススメしたいのが、最近Twitterで話題となったお手軽朝食レシピ。今回、記者も実際に作ってみたので、画像とともにご紹介します! 用意する材料・道具は次のとおり。 ・食パン ・卵 ・ベーコン ・マーガリン(バターでも) ・チーズ ・塩 ・フライパン ・包丁(ナイフ) どれも今すぐにでも揃いそうなところがイイですね! では作り方です。 1、食パンの中をくり抜きます 2、あたためたフライパンに食パンの耳を乗せて、中にマーガリンを落とします 3、卵→ベーコン→チーズの順に耳の中に入れていく 4、繰り抜いたパンでフタをする 5、焦げないタイミングでひっ
長友佑都のお辞儀浸透しすぎ!? ついにCMでもお辞儀パフォが採用される カテゴリ動画ネタセリエA Tweet 843: 名無しに人種はない@実況はサッカーch 2013/03/20(水) 09:06:06.85 ID:ey1FMHiI0 https://www.youtube.com/watch?v=CdPdb9Z0zsM おじぎCM スポンサードリンク 845: 名無しに人種はない@実況はサッカーch 2013/03/20(水) 09:14:07.07 ID:cb+yZOBK0 >>843 まじでお辞儀が浸透してるのか。 848: 名無しに人種はない@実況はサッカーch 2013/03/20(水) 09:55:43.93 ID:0n3IcfTb0 >>843 お辞儀するサッカー少年いいな! インテルのゴールパフォ… パラシオとグアリンが尻ぶつけるやつとか? 851: 名無しに人
args4j is a small Java class library that makes it easy to parse command line options/arguments in your CUI application. Why should I use it? See my quick intro. It makes command line parsing very easy by using annotations Generate usage text very easily Generate HTML/XML documentation listing all options Full localization support Designed to parse javac like options, as opposed to GNU-style (wher
Parent Directory docword.enron.txt.gz docword.kos.txt.gz docword.nips.txt.gz docword.nytimes.txt.gz docword.pubmed.txt.gz readme.txt vocab.enron.txt vocab.kos.txt vocab.nips.txt vocab.nytimes.txt vocab.pubmed.txt Apache/2.4.6 (CentOS) OpenSSL/1.0.2k-fips SVN/1.7.14 Phusion_Passenger/4.0.53 mod_perl/2.0.11 Perl/v5.16.3 Server at archive.ics.uci.edu Port 80
本日、キーワード名とふりがなが対になっている、はてなダイアリーキーワードふりがなリストを公開しました。ユーザー様が独自に作成されている辞書などで、名詞の読み仮名などでご活用いただくと便利かと思います。 以下のURLを右クリックでファイルに保存してご覧ください。 http://d.hatena.ne.jp/images/keyword/keywordlist_furigana.csv http://d.hatena.ne.jp/images/keyword/keywordlist_furigana_with_kid.csv (キーワードID つき) ※タブ区切りの csv 形式、文字エンコードは EUC で改行コードは LF となっております。 ※ファイルサイズが本日現在 4M 強ほどあります。ブラウザで開く際はご注意下さい。 このリストをは定期的に最新情報に更新しています。どうぞご利用下さ
3月15日、サイバーエージェント・ベンチャーズにて「エンタテインメントの未来を考える会 黒川塾(七)」と題したトークセッションが行われた。コラムニストの黒川文雄氏が主宰、エンタテインメントの原点を見つめなおし、ポジティブに未来を考える会となっている。 今回は「僕らのゲーム業界ってなんだ……!?」と題し、ゲストそれぞれの立場から変化の激しいゲーム業界について語られた。登壇したのは、2012年12月に日本ゲームユーザー協会(JGUA)を設立した漫才コンビ「アメリカザリガニ」の平井善之氏、コーエーテクモホールンディングスの代表取締役社長やジンガジャパンの代表取締役CEOを務めた松原健二氏、日本eスポーツエージェンシーの代表取締役である筧誠一郎氏、ゲームのチューニングを行う猿楽庁の長官である橋本徹氏の4人。 パッケージゲームの行く末はいかに 最初の話題は平井氏が立ち上げたJGUAと、パッケージソフ
浦和レッズサポのフランス人マルワンさんがサポーターの鑑すぎると話題に カテゴリサポーターJリーグ Tweet 106: 名無しが急に来たので 2013/03/21(木) 00:44:04.88 ID:xcKmFppe0 フランス人サポ号泣w スポンサードリンク 430: 名無しが急に来たので 2013/03/21(木) 07:14:22.29 ID:vfp4IWWA0 YOUは何しに日本へ? 2013年3月20日放送分 http://video.fc2.com/content/20130321n7hL3dnA/ [高画質で再生] YOUは何しに日本へ? 2013年3月20日放送分 [ブログ] 27:10から外国人レッズサポ 107: 名無しが急に来たので 2013/03/21(木) 00:44:05.45 ID:NW/+V2/4O 達也のコメント+泣き顔とかwww テレ東センスいいな
パリ(Paris)西郊ムードン(Meudon)で開催されたハッカーのコンテストに参加する学生(資料写真、2013年3月16日撮影)。(c)AFP/THOMAS SAMSON 【3月21日 AFP】米情報セキュリティー企業マンディアント(Mandiant)の幹部は20日、米上院軍事委員会の公聴会で証言し、中国は企業機密の入手を狙ったサイバー攻撃に、膨大な資金や人的資源などを投入していると述べた。 中国が発信源とみられるサイバー攻撃については、バラク・オバマ(Barack Obama)米大統領や米政府高官らも問題視してきた。マンディアントのケビン・マンディア(Kevin Mandia)最高経営責任者(CEO)は公聴会で、これらサイバー攻撃は「知的財産を盗み出すための大規模な試み」の一環であり、「資金面で支援を受けている」と指摘した。同社は今年、中国の人民解放軍が長期にわたるサイバースパイ行為に
セクハラ(性的嫌がらせ)は日本だけでなく、世界中に存在する。ヨーロッパの中で先進国、文化大国として栄えるドイツでも近年セクハラは深刻なようだ。 ドイツ女性というとおっぱいが大きいイメージがあるが、やはり「おっぱい」にまつわるセクハラが多いのだろうか。 数カ月前にドイツ自民党のある偉い政治家と女性ジャーナリストとの間でのセクハラ疑惑事件が大ニュースになった。その内容は、 「南ドイツの衣装“ディルンドル”のネックラインを自分の胸でいっぱいに埋めることができるかい?」というもの。 日本でもオクトーバーフェストが各地でしばしば開催されるようになったが、その会場でウェイトレスがよく着ている衣装が“ディルンドル”。胸部が大きく開いているのが特徴のひとつで、問題の政治家は要はそれを「おっぱいでいっぱいにできるか」というわけだ。女性ジャーナリストのおっぱいサイズがどのくらいか聞きたかったのか、それとも小さ
開催の目的とゴール 本研究会は、マーケティングから技術的観点も含めてTwitterを見つめなおすことを 目的とします。そのため、講演テーマについては敢えて制約をしません。 また、参加者についても多様なバックグラウンドを持った方を想定しています。ゆえに 参加者の想定としてTwitterに関わるあらゆるステークホルダーを指します。例えば 「ユーザ」「APIを使った開発者」「研究者」「ブロガー」「Twitterと競合するサイト事業者」 などです。 本研究会のゴールは多様なバックグラウンドの参加者がTwitter研究会というイベント を通してリアルまたはバーチャルに接する(Trigger)ことで、Twitterに関わる議論を 発散しつつ深化させ(Action)、その結果をblogやTwitter,SBM、他のイベント、会合等に フィードバックする(Output)ことです。 ■第4回Twitter研
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く