You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
「gooラボ」、日本語解析技術APIを公開 〜検索技術の裏側を公開し、オープンイノベーションを加速〜 URL:https://labs.goo.ne.jp/ NTTレゾナント株式会社(本社:東京都港区、代表取締役社長:若井 昌宏、以下、NTTレゾナント)は、日本語解析技術に関するAPIを本日より、「gooラボ」にて公開します。本技術は、NTT研究所が開発し、長年「goo」にて利用してきたものです。 1.背景 「goo」は、1997年の提供開始より長年をかけてWeb検索に関わる技術やノウハウを蓄積し、またNTT研究所との連携により、世界有数の技術力も有します。一方で、近年、我々の持つWeb検索技術が、他の自社コンテンツを提供する企業やビッグデータ解析技術を求める企業においても活用が見込まれることから、この度、gooの持つ技術やノウハウを「gooラボ」にて順次公開することとなりました。
文脈IDは-1を指定すれば自動採番してくれるという噂だったのですが、実行したら「自動で探したけど、対応するのが見つからなかったよ」と言われた為(文字コードの問題かな)、自前でシステム辞書ディレクトリ内の「left-id.def」と「right-id.def」を探して、それっぽいIDを拾ってきました(本当にこの方法で良いのか未確認)。 辞書によってIDは変わってきて、IPA辞書の「名詞,一般」は、我が家の環境では1285になっていました。バージョンによっても違う可能性もあるので注意が必要です。 読み・発音については、はてなのファイルの読みは全て平仮名で記述されているので、NAISTの辞書に合わせる為に片仮名に変換して登録します。発音は本来「アマクサシロー」になるべきですが、その辺は変換してると面倒なのでこのままで。 参考URLでは、CSVの末尾に「はてなキーワード」と入れて、はてなの辞書が使
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く