タグ

2017年3月21日のブックマーク (4件)

  • RNNで「てにをは」を校正する - にほんごのれんしゅう

    RNNで「てにをは」を校正する 余談 2017/3/19に、どの深層学習フレームワークがこれから深層学習を始める人におすすめなのかというアンケートをtwitterで取らせていただきました。 五位 Theano(個別カウント) はじめに RNNによる文章校正がリクルートによって提案されて以来、調査タスクとして私のものとに来たりして、「できるんでしょう?」とか軽く言われるけど、実際には簡単にはできません。 RNNによる文章生成ができるから、校正もできるというのが人間の自然な発想なのかもしれませんが、英語と日語の違いに着目した場合、英語がアルファベットのみで構築されるのに比べて日語は、漢字・ひらがな・カタカナと非常に多く、同じように問題を適応すると、すごい高次元の問題を解くこととなり、理想的なパフォーマンスになかなかなりません。 まぁ、あんまり完成してるわけでない技術を完成したようにプレスリ

    RNNで「てにをは」を校正する - にほんごのれんしゅう
  • ANTLR のターゲットに Go が追加されたので Gogland とあわせて遊んでみる - 押してダメならふて寝しろ

    概要 ANTLR ってのは,いわゆるパーサジェネレーターです. 去年の年末に出たバージョン 4.6 からターゲットに Go が追加されました 🙌 . かなり昔に使ったことあったんですが,v4 になってだいぶ整理されて洗練された感じになってました. この記事は結構適当にやってしまっていると思うので,ちゃんとやりたいならリファレンスを読んだ方がよさそうです(ぉ. The Definitive ANTLR 4 Reference 作者: Terence Parr出版社/メーカー: Pragmatic Bookshelf発売日: 2013/01/22メディア: ペーパーバックこの商品を含むブログを見る ANTLR の簡単な紹介 入力のあるプログラム書いていると,入力が well-formed であるかどうかをチェックする必要があることがあります. 正規表現とか使って自分で入力が正しいかどうかチェ

    ANTLR のターゲットに Go が追加されたので Gogland とあわせて遊んでみる - 押してダメならふて寝しろ
  • Lodashのファイルサイズを削減する方法 | 綺麗に死ぬITエンジニア

    JavaScriptにおける便利な関数の詰め合わせであるライブラリ「Lodash」。JavaScript(Node.js)での開発をしている人の多くは利用したことがあるでしょう。 今回はそのLodashを使う上で、ライブラリを導入後のファイルサイズを削減する方法を紹介します。 なお、今回当記事で紹介するにあたり、検証にモジュールバンドラーツール「webpack」を利用します。ですが、webpackを利用しない場合においても同様の方法でファイルサイズは削減できます。 ユースケースLodashに限らず、比較的高機能なJavaScriptライブラリは、場合によっては性能面や容量(ファイルサイズ)の面で、1機能特化のミニマルなものに比べ劣ることがあります。 例えば、そのライブラリの全ての機能のうち1つの機能しか使わなかったとしても、全ての機能分のファイルサイズを消費し、全ての機能を読み込んでしまい

  • キーワード自動抽出サービス 「言選Web」が面白い!|webproduct-lab

    「言選Web」というキーワード自動抽出サービスをご存知ですか? これは、助詞などを省いて単語のみを抽出するだけでなく、文章中での重要度を調査してくれるWeb上で公開されているサービスです。これが意外と面白い! 専門用語(キーワード)自動抽出サービス 「言選Web」 目的はSEOに限ったものではありませんが、自分のコンテンツがどのような傾向にあるのか?参考になると思います。 サイトの方でも以下のように記載されています。 自作の文章からキーワードを抽出したい! メタデータ作成のためにウェッブサイトからキーワードを抽出したい! 言語学的な研究に利用したい! 引用元:専門用語(キーワード)自動抽出システム”のページ 最近、SEOで特に重要なのはキーワード出現率ではなく、文字数でもなく単語です。 そして、それは単に数ではなく関連語のバランスや文脈など…もっと複雑なものと思われます。 そして、こういっ

    キーワード自動抽出サービス 「言選Web」が面白い!|webproduct-lab
    nantan
    nantan 2017/03/21