タグ

ブックマーク / scrapbox.io/masui (11)

  • 接続辞書と日本語入力 - 増井俊之

    増井俊之.icon はMacでもAndroidでもChromeOSでも自前の日本語入力システム(IME)を使ってるのだが、「接続辞書」を使う単純なアルゴリズムを利用している。 世の中で広く使われているモダンな日本語入力システムは高度な自然言語処理によってかな漢字変換を行なっているが、実は高度な自然言語処理を利用しなくても効率的に日本語入力することは可能である。たとえばSKKという日本語入力システムは単純な辞書とアルゴリズムしか使っていないにもかかわらず高速な日本語入力が可能だったりする。(SKKはもともとEmacs上での日本語入力用に開発されたもので、増井俊之.icon も結構使っていたのだが、キーボードの利用が前提でありモバイル機器では使いにくいとか日語でしか使えないという制約がある) 接続辞書というのは「単語の次にどのような単語が続くか」を記述した辞書である。単語ごとに、読み/カテゴ

    接続辞書と日本語入力 - 増井俊之
  • 曖昧検索asearch

    曖昧検索は便利なものである。「ピテカントロプス」の綴りは難しいが、最近のGoogle検索は曖昧検索対応しているようで、「pitekantoropusu」で検索してもちゃんと直立猿人(Pithecanthropus)がみつかる。しかし「musogurusuki-」でムソルグスキーを検索できないようなので、改良の余地はあるのかもしれない。 Unix系の計算機システムやプログラミング言語では曖昧な検索を行なうために正規表現を使えるものが多い。正規表現とは検索パタンとして文字列の繰り返しや文字列の選択を指定できるもので、a*という表現で「0回以上のaの繰り返し」というパタンを指定したり、(abc|def)という表現で「abcまたはdef」を指定したり、a.cという表現で「aac, abc, acc, ...」を指定したりできる。たとえばpi.*ca.*puのような曖昧なパタンを指定すれば辞書からP

    曖昧検索asearch
    yuiseki
    yuiseki 2019/11/05
  • 箱整理法 - 増井俊之

    A4より小さい書類や薄いモノはクリアファイル整理法でうまく整理できているのだが、クリアファイルに入らない雑多な小物は白い段ボール箱に入れて番号を貼って積み上げている。どの箱に何が入っているかはScrapboxに書いているので探すのは簡単である。 https://gyazo.com/bc1fd31b1cf353cd110e58f3a080ea98 https://gyazo.com/9b128cd2ed20e73be40e47a8a6062b81

    箱整理法 - 増井俊之
    yuiseki
    yuiseki 2019/10/30
  • なぜScrapboxはMarkdownを採用していないのか - 増井俊之

    Markdownというマークアップ言語がエンジニア界隈で広く使われている。もともとはHTMLをもっと簡単に記述したいという意図で開発されたものだそうで、<h1>タイトル</h1>と書くかわりに# タイトルと書けたりするので、記述が少し簡単になるというメリットがある。太字(<b>)やリスト(<ul><li>)なども簡単に書ける。 Markdownに慣れたエンジニアがよく「何故ScrapboxMarkdownを採用しないんだ」と言ってくる。「Markdownを採用しないとか馬鹿じゃないの?」とまで言う人もいる。こういう人々は完全にMarkdown脳というか、自分がタマタマ慣れているものがサイコーだと考えているだけに思える。 ScrapboxのようなWikiで一番大事なのはページ間リンクの記述であり、ここに[...]という単純な記法を使っているためMarkdownとは異なる記法になっているのだ

    なぜScrapboxはMarkdownを採用していないのか - 増井俊之
  • なぜScrapboxはMarkdownを採用していないのか - 増井俊之

    字下げ.iconMarkdownというマークアップ言語がエンジニア界隈で広く使われている。もともとはHTMLをもっと簡単に記述したいという意図で開発されたものだそうで、<h1>タイトル</h1>と書くかわりに# タイトルと書けたりするので、記述が少し簡単になるというメリットがある。太字(<b>)やリスト(<ul><li>)なども簡単に書ける。 字下げ.iconMarkdownに慣れたエンジニアがよく「何故ScrapboxMarkdownを採用しないんだ」と言ってくる。「Markdownを採用しないとか馬鹿じゃないの?」とまで言う人もいる。こういう人々は完全にMarkdown脳というか、自分がタマタマ慣れているものがサイコーだと考えているだけに思える。 字下げ.iconScrapboxのようなWikiで一番大事なのはページ間リンクの記述であり、ここに[...]という単純な記法を使っているた

    なぜScrapboxはMarkdownを採用していないのか - 増井俊之
  • A4サイズの起源 - 増井俊之

    世の中で広く使われているA4サイズの紙は210mm×297mmで、A0サイズはその16倍になるが、A0サイズというのは面積がちょうど1平方メートルになるように決められたものらしい。地球の外周を4万で割ったものが1Kmなのだから、A4サイズは地球のサイズをもとに決まっているというのは面白い。

    A4サイズの起源 - 増井俊之
  • リンク情報の活用 - 増井俊之

    写真を検索したいときはどうしてるだろうか? 富士山に行ったときの写真を検索できるようにするためには、すべての写真に「富士山」というタグをつけておく必要があると思っている人が多いのではなかろうか? 実はそういう必要は全く無い。富士山の写真がひとつみつかれば、同じ時に撮った富士山の写真をみつけられるはずなので、すべての写真に「富士山」というタグがついている必要はない。タグが沢山あるとかえって邪魔である。 位置情報も同様である。写真に位置情報がついていると便利だが、あらゆる写真に位置情報がついている必要はない。ある場所でのあるイベントの写真がひとつみつかれば、関連する写真はすぐにみつかるからである。

    リンク情報の活用 - 増井俊之
    yuiseki
    yuiseki 2018/05/19
  • 三角関数はなぜ重要か - 増井俊之

    三角関数なんか勉強してもしょうがないみたいな発言が問題になったことがあったが、では何故学ぶ必要があるのか人に聞いてみても明確に答えてもらえることが少ない。三角関数をよく使う人は「なんとなくいろいろ便利じゃない?」ぐらいに思ってるようだし、ふだん使わない人は高校で「加法定理」みたいなものを覚えさせられたために面倒な割に不要なものだと印象づけられている気がする。

    三角関数はなぜ重要か - 増井俊之
    yuiseki
    yuiseki 2018/05/17
    ちなみにこれは増井先生による三角関数の重要性の説明です
  • Chromebook利用開始 - 増井俊之

    開発者モードではchronosというユーザ名でシェルで作業ができるのだが、/etcが書き込み禁止になってるためにuseraddコマンドが使えない。ところが驚いたことに裏蓋をはずしてネジを外せば書き込み可能になるらしいのでやってみたら確かに書き込みが可能になった。useradd masuiとしてmasuiというユーザ名が使えるようになった。 Chromebrew(crewコマンド)というのを入れると様々なシステムを簡単にインストールできる。EmacsもNodeも簡単にインストールできた。Sinatraも使えたのでWebアプリ開発もできてしまう。頑張ればRailsも動きそうである。(crewだとコケたが個別インストールすれば大丈夫そう)

    Chromebook利用開始 - 増井俊之
    yuiseki
    yuiseki 2018/05/17
    増井先生のScrapbox、いつの間にかふつうのブログっぽいシンプルな見た目になってていいな
  • 階層脳 - 増井俊之

    世の中の大きなデータは階層的に綺麗に管理されているから、整理とはそういうものだ/そうでなければいけない/と思ってしまう

    階層脳 - 増井俊之
    yuiseki
    yuiseki 2018/02/03
  • Twitterクラッキング経緯 - masui - Scrapbox

    110.147.140.37 - - [08/Apr/2017:00:00:14 +0900] "GET /masui@pitecan.com/Amazon123456 HTTP/1.1" 200 121669 "http://episopass.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36"

    Twitterクラッキング経緯 - masui - Scrapbox
    yuiseki
    yuiseki 2017/04/08
  • 1