タグ

改行に関するshuuuuunyのブックマーク (2)

  • YAMLで改行する方法 - このブログは証明できない。

    Railsのtest/fixturesにテストデータを用意するときなど、改行が入った文字列を使いたい場合がありますね。\nを入れてもダメです。代わりに特別な書式をつかいます。 memo: | 1行目です。 2行目です。 3行目かな? 4行目いっちゃう? 上の書き方だと、最後の行の末尾にも改行が入ります。入れたくない場合は、こう書きます。 memo: |- 1行目です。 2行目です。 3行目かな? 4行目いっちゃう? ちなみに、明示的に最後に改行を入れることを示したい場合は、こうです。 memo: |+ 1行目です。 2行目です。 3行目かな? 4行目いっちゃう? 文字列を加工して\nを入れたりしなくていいので、YAMLってステキだったんですね。

  • Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記

    こんにちは! 日語のウェブサイトを作っていると、日語特有の問題にぶちあたることがありますよね。 その中でも今回着目したいのは、日語改行問題。最近、この問題を解決するためのライブラリを公開したので、紹介します。 github.com そもそも日語改行問題とは何か ウェブブラウザで日語で書かれたウェブサイトを見ていると、ときどき文章が変なところで改行されているのを目にすることがありますよね。 たとえば、こんなかんじ。 「ソリューション」が「ソリューショ」と「ン」に分かれてしまっています。読みにくいですね。 英語では単語がスペースによって区切られますが、日語や中国語などのアジア圏の言語では単語がスペースで区切られないことが多いです。 そのため、英語では単語の途中で改行されることは通常ありませんが、日語では単語の途中で改行されることがよくあります。 文ならともかく、見出しやキャッチ

    Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記
  • 1