「筆舌尽くし難い」という表現があるけど、筆を尽くし弁舌を尽くしても通じないってのもあるなあ、と140字の壁を感じる昨今。 このところ連日、様々な「話が通じないケース」に見舞われているのだが、よくよくメンションのくるオーディエンスやまとめのコメント欄を見ると、伝わる人にはちゃんと伝わっており、ただただ目前の論難者にだけ話が伝わらないケースが多い様子。 Twitterでの議論、対話は一度に140字に制限された文字だけで行われる。それでも英単語しかない英語圏に比べれば、表意文字(漢字熟語)を使える分だけ日本語Twitter圏のほうが議論が活発に行えるものであるらしいと聞いた。 日本は幸い、ほぼ単一の言語を共有している。地域により若干の方言があるにせよ、標準語教育により意志疎通に不便はほとんどない恩恵を受けている。 続きを読む
こんにちは、買物情報事業部の荒引 (@a_bicky) です。 前回、「検索結果の疑問を解消するための検索の基礎」で単語単位でインデキシングする前提で説明しましたが、今回は文などを単語単位で分割するために使う技術である形態素解析について触れます。 形態素解析器には色々ありますが、中でもメジャーと思われる MeCab の仕組みについて説明します。 MeCab の解析精度を上げるために辞書に単語を追加したことのある方もいると思いますが、動作原理を理解することで単語を追加する際に適切な生起コストを設定できるようになったり、学習の際に適切なパラメータを設定できるようになったりするはずです。 なお、MeCab は汎用テキスト変換ツールとしても使用できます が、簡単のため MeCab + IPA 辞書のデフォルト設定前提で説明します。 アジェンダ 形態素解析とは MeCab における最適な解析結果の推
circa 1955: A woman gestures with her index finger as she scolds her husband, who stands with his arms folded in front of a window with drapes. She holds one hand on her hip. (Photo by Harold M. Lambert/Lambert/Getty Images) ニュースレター「レニー・レター」で女優のジェニファー・ローレンスは、男性俳優に自分の意見を率直に伝えたときのエピソードを紹介している。その俳優はローレンスに「僕ら全員、ここでは同じチームのメンバーじゃないか」という返事をしたという。そこにはローレンスが感情的で攻撃的だという意味が込められていて、彼女を落ち着かない気持ちにさせたそうだ。「男性たちは、
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く