タグ

タグに関するyujiodのブックマーク (2)

  • Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記

    こんにちは! 日語のウェブサイトを作っていると、日語特有の問題にぶちあたることがありますよね。 その中でも今回着目したいのは、日語改行問題。最近、この問題を解決するためのライブラリを公開したので、紹介します。 github.com そもそも日語改行問題とは何か ウェブブラウザで日語で書かれたウェブサイトを見ていると、ときどき文章が変なところで改行されているのを目にすることがありますよね。 たとえば、こんなかんじ。 「ソリューション」が「ソリューショ」と「ン」に分かれてしまっています。読みにくいですね。 英語では単語がスペースによって区切られますが、日語や中国語などのアジア圏の言語では単語がスペースで区切られないことが多いです。 そのため、英語では単語の途中で改行されることは通常ありませんが、日語では単語の途中で改行されることがよくあります。 文ならともかく、見出しやキャッチ

    Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記
  • Make: Japan | すごーく便利なノートハック

    このノートハックを見たときは興奮した。日からのInstagramらしい。私もたくさんノートに書き込むし、仕事のアイデアやプロジェクトや地元の情報(旅行べ物、ショッピングなど)を日記に書いているけど、複数のノートやMaker’s Notebooksからひとつの項目を探し出すのは大変な手間。この問題を解決してくれる唯一の方法は、時間をかけてすべての索引を作ることだ。 だが、この方法を使えば、とっても簡単に巻末に(巻頭でもかまわない)に索引が作れる。そのやり方をお見せしよう。 まずは普通にノートをつける。この例では、High Fiveというブログを書いているAdamがレシピブックを作っているところだ。これはその最初のレシピレシピノートの最後のページにレシピのタイプを書き込む。 そのタイプに従って、チャイニーズのレシピのページの外側に印を付ける。 こうすると、巻末の索引を見て印のところを

    Make: Japan | すごーく便利なノートハック
  • 1