2016年9月12日のブックマーク (2件)

  • Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記

    こんにちは! 日語のウェブサイトを作っていると、日語特有の問題にぶちあたることがありますよね。 その中でも今回着目したいのは、日語改行問題。最近、この問題を解決するためのライブラリを公開したので、紹介します。 github.com そもそも日語改行問題とは何か ウェブブラウザで日語で書かれたウェブサイトを見ていると、ときどき文章が変なところで改行されているのを目にすることがありますよね。 たとえば、こんなかんじ。 「ソリューション」が「ソリューショ」と「ン」に分かれてしまっています。読みにくいですね。 英語では単語がスペースによって区切られますが、日語や中国語などのアジア圏の言語では単語がスペースで区切られないことが多いです。 そのため、英語では単語の途中で改行されることは通常ありませんが、日語では単語の途中で改行されることがよくあります。 文ならともかく、見出しやキャッチ

    Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記
  • テキストエディタと高齢社会(文章を書く心がけ)|結城浩 / Hiroshi Yuki

    「文章を書く心がけ」のコーナーです。 * * * 結城はふだんVimというテキストエディタを使っています。 Vimには、ノーマルモードとインサートモードという二つのモードがあり、ノーマルモードでは、入力したキー(文字)はコマンドとして扱われます。 たとえば、カーソルの移動(上下左右)は k j h l というキーを打って行います。文字を入力するためには、コマンドモードからインサートモードに移る必要があります。 ……と説明すると、めんどうそうに感じるかもしれませんが、Vimのユーザ(Vimmerという)にはめんどうな話ではありません。現在どのモードにいるかは身体が覚えているので、特に意識しなくてもさっとモードを移ることができるからです。 しかしながら、Vimというエディタは、基的にインサートモードの継続時間が短いことを想定してデザインされていると思います。つまり、文字を連続的に入力し続ける

    テキストエディタと高齢社会(文章を書く心がけ)|結城浩 / Hiroshi Yuki
    cardboarder
    cardboarder 2016/09/12
    “「自分の仕事をする」ことそのものも楽しいが、仕事を変革するために「自分の仕事の設計(デザイン)をする」ことも楽しい。”