タグ

ブックマーク / qiita.com/mur (3)

  • Rust製の形態素解析器Linderaを使って日本語の語数を数える - Qiita

    概要 Rust製の形態素解析器Linderaを使用して、テキストファイルに含まれる日語の語数を数えるプログラムを作成しました。Linderaの使用方法と、並列処理ライブラリrayonによる処理の高速化について解説します。 Rustについて Rustは、CやC++と同等の高速・低レイヤーのプログラミングが可能でありながら、メモリ安全性に重点をおいたプログラミング言語です。2015年にバージョン1.0がリリースされた比較的新しい言語であり、近年人気を集めています。 自然言語処理にRustを使う動機 Rustを勉強中である著者が「使ってみたかった」というのが一番の動機です。 それ以外には、 Rustによる日語の自然言語処理の例は、ネット上でそれほどたくさんは見かけないので、やってみた。 それなりの大きさのテキストファイル(数百メガバイト)を分かち書きするのに、例えばPythonで処理するのと

    Rust製の形態素解析器Linderaを使って日本語の語数を数える - Qiita
  • Vimで日本語を編集するいくつかの方法 - Qiita

    そこそこ知見がたまってきた気がするので、ここらでいったんまとめさせていただきます……! なお、このエントリでは以下については原則触れません。 文字コードまわりのオプション fileencodingやfileencodingsはじつはわりとややこしいので…… Migemo /や?での検索だったり後述のf系マッピングだったりのためのプラグインがあるのですが、誤爆率が高めなので積極的には使っていません…… スペルチェック vim-watchdogsとtextlintを組み合わせてみるのがまだ実験中のためです…… LaTeXMarkdown、Re:VIEWそのほかファイルタイプに特化した設定 そもそもVimは日語の編集に向いていない 題に入る前にはっきりさせておきたいのは、以下のような理由があり「そもそもVimは(英語の場合ほど)日語の編集に向いていない」ということです。 Vimのモードと

    Vimで日本語を編集するいくつかの方法 - Qiita
    kyo_ago
    kyo_ago 2016/04/22
  • Gitでやらかさないための事前予防策 - Qiita

    Gitでやらかした時に使える19個の奥義を書いてやらかしたときになんとかリカバリできるようにした。 今回は、そもそもやらかさないようにしたいよねっていうお話。 コミット編 .gitignoreを細かく指定しておく .gitignoreを指定しておけば余計なファイルをコミットしちゃうことを予防できます 過去に似たようなプロジェクトがあるのならそれを流用しましょう。 ないのであれば.gitignore.ioで生成してそれをカスタムしましょう。 ワイルドカード指定やディレクトリまるごとの指定は副作用ある可能性があるので慎重に。 コミットメッセージのフォーマットを決めておく コミットメッセージのフォーマットを決めておけば書き直したいということも減ります コミットメッセージをやらかして直したいと思うことはよくあります。 そういうのって案外コミットメッセージが自由すぎることが問題だったりします。 ある

    Gitでやらかさないための事前予防策 - Qiita
  • 1