さて言語処理学会の年次大会で気になった発表などについて書いてみます。 といっても、個別の発表にというよりは全体感です。 今年気になったのは、最適化について少し考えなおしたほうがいいのかなということでした。 言語を扱う上で、一般的に解釈の曖昧性が残ることがふつうですから、いかにハードな制約を設けても何かしらのスコア関数を最大化する形に落ち着くのが普通です。 一方で自然言語処理の出力は、複数の変数の組合せ(例えば品詞列)を求めることが多いため、候補集合が入力データ長の指数サイズになります。 したがって全部チェックすることはできません。 古くからこの問題は、動的計画法で解くことが多かったわけですよね。 Viterbi法やCKY法などがこれにあたります。 動的計画法で解くということは、スコア関数が部分問題に分解できるという極めて強い制約がかかるわけですが、自然言語には極めて強いローカルな制約があり
Remove multi language page from official site. #160 というパッチを今日マージしました. 背景 fluentd-docsはdocs.fluentd.orgのリポジトリです.前は英語しかなく,各言語の翻訳バージョンが欲しいという要望があったので(特に日本語),複数言語を表示出来るように少し前にしました. ただ,Fluentdの開発者達は基本英語でドキュメントを書くのと,逐一日本語へ翻訳するのはかなりのコストなので,日本語への翻訳はコントリビューションベースという感じになりました. サポートした最初の頃は良かったんですが,Fluentd本体の進化にともない英語のドキュメントが更新される一方,日本語への翻訳ペースは全然追いつかないようになっていました(ほぼmazgiさん一人に頼り切りになってました). 問題点 分かるとは思いますが,日本の方は日本
従来のリツイート(RT)では、コメントは付けられなかった。また、「引用」すればコメント付きでツイートを紹介できたが、その場合は元ツイートとコメントを1ツイート140字の制限内に収めなければならなかった。 Twitterは昨年6月からこの機能をテストしていたが、ようやく一般に公開した。 関連記事 Twitter、不快なツイートを通知タイムラインから排除する「Quality filter」の提供開始 Twitterが、脅しや暴言を通知タイムラインに表示しないようにする「Quality filter」を、認証済みアカウントユーザーに提供しはじめた。 Twitter、リベンジポルノなど嫌がらせ対策でポリシーを改定 Twitterが、利用ポリシーに「撮影されている人物の同意なく撮影または配布された、私的な画像や動画を投稿することを禁じます」という文言を追加し、リベンジポルノなどの嫌がらせを禁じた。
はじめに データ解析本部のn_maoです。 前回は高速集計ツールmコマンドのご紹介をしました。 前回のmコマンドの紹介の投稿 今回は趣向を変えて、社内に分析部隊をゼロから作り、データドリブンなサービス改善を実現するためにまず行うべきこと、意識することをまとめてみました。 これは実際にゼロから初めた私の経験に基づくものです。 1つのケーススタディとして読んでいただければと思います。 主張を大まかな流れに分類すると、 1. 分析環境を整える 2. 社員のデータに対する意識を高める 3. データ分析とサービス開発を結ぶ仕組みを作る 4. 小さな効果を体感してもらう 5. 現状を把握し、指標を作る という感じです。 以下で各トピックの詳細について触れていきます。 1. 分析環境を整える 分析のためのサーバーを用意する 当然のことですが、念のため。 データ分析や集計を行っていると、どうしてもメモリや
日本最強の看板を下ろしたミラーサーバftp.jaist.ac.jpの管理者の一人が、 このサーバにまつわるよしなしごとを語ります。 English versions of some posts on another blog. 先月上旬からGoogle Chromeでftp.jaist.ac.jp/pub/以下にアクセスすると、「この先のサイトには有害なプログラムがあります」と警告される状態が続いています。前回の記事を書いた時点では、Googleセーフブラウジングによる判定は「疑わしくない」だったので、待っていれば警告が解除されるだろうと思っていました。 ところが判定がいつの間にか「疑わしい」に変わり、待っても解除される見込みがないので、3月22日に解除のための手続きをしました。具体的には、Googleからマルウェアだとして示されたSourceForge.net配下の二つのファイルを確認の
「なぜ、単なる十数ケタの数字の羅列が、個人情報として保護の対象になるのか、そこがさっぱり分からないんですよ。企業ごとの自主的な規制ではダメなんでしょうか…」 2015年3月10日に閣議決定した個人情報保護法の改正案(ITpro関連記事:個人情報保護法改正案を閣議決定、個人情報の定義は骨子案を踏襲)を巡り、企業や経済団体の担当者から、取材の場でこうした疑問をぶつけられた。 担当者を困惑させているのが、個人情報の定義を明確化するという名目で新たに導入される「個人識別符号」という概念だ。個人の氏名だけでなく、政府や民間企業が個人に割り当てた符号(数字や文字)を含む情報も、個人情報として保護の対象になる。 企業や経済団体は、個人情報保護法改正案のどこに、違和感を覚えているのか。経済団体への取材を基に、改めて「符号を法的保護の対象にする」ことの意味について考えてみたい。 国会審議で明らかになった個人
野生のシカとイノシシが、人にも感染する寄生虫に高い割合で感染しているとの調査結果を岐阜大学などのグループがまとめた。 ジビエ(野生鳥獣肉)料理として全国的に利用が広がる中、加熱の徹底など取り扱いに注意を呼びかけている。 調査は、2013年から今年にかけ岐阜県の長良川と揖斐川水系で捕獲されたシカとイノシシを調べた。 人が体内に取り込むと食中毒症状を起こす恐れがある住肉胞子虫は、シカで食用部位の背ロースとモモからそれぞれ90%(60頭中54頭)と88%(59頭中52頭)の高い割合で検出された。イノシシではそれぞれ46%(26頭中12頭)と43%(21頭中9頭)だった。住肉胞子虫が原因とみられる健康被害は、11年に滋賀県でシカ肉のステーキを食べたグループが下痢や嘔吐(おうと)を訴えた事例がある。 また、シカの肝臓の65%で、人に感染すると肝炎や胆管炎を引き起こす槍(やり)形吸虫が検出され
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く