タグ

形態素解析に関するkirakkingのブックマーク (2)

  • 任意の長文を勝手にHello Worldのソースにする

    「○○○は、Hello Worldを表示するプログラムだったんだよ!!」 「Ω ΩΩ<な、なんだってー!?」 来プログラム言語といえばはじめに文法が決まっていて、そこに文法に従った文字列を入れると実行可能な何かができあがるというのが普通の流れです。 これを逆にしたらどうなるかと思ったのが今回の話題です。つまり、欲しい出力結果があって、適当な文字列があったとき、それをプログラム言語にするようなインタプリタを出力するプログラムを作ろう、というものです。メタプログラミングという用語をはじめて聞いたときに浮かんだ個人的イメージだったり。 もう少し動機を素直に言うと、Brainfu*kの仲間を見てふと思ったのです。Brainfu*k風のプログラム言語ってたくさんあるのですが、どれも来の雰囲気を損なわないような入力文字列の例(だいたいHello World)を頑張って作っているじゃないですか。 名

    任意の長文を勝手にHello Worldのソースにする
    kirakking
    kirakking 2015/06/14
    ハフマン符号使ったらできるかなーと思ったけど、文章構造が崩れるからダメだった。出現位置で重みつけたらいけそうかね。
  • 形態素解析エンジンMeCabにて文章中から短歌を抽出 - inaniwa3's blog

    概要 偶然57577になっている文章を短歌としてつぶやく Twitter の bot を作りました。 フクロウが鳴くと明日は晴れるので洗濯物を干せという意味 #tanka ウィキペディア日語版「フクロウ」より http://t.co/Dm1uHcQdzR— 偶然短歌bot (@g57577) 2014, 12月 31 再帰的アルゴリズムが有効な問題として有名であり #tanka ウィキペディア日語版「ハノイの塔」より http://t.co/vm2ZqwImKi— 偶然短歌bot (@g57577) 2014, 12月 31 文章はウィキペディア日語版を対象としました。 作り方 jawiki-latest-pages-articles.xml.bz2 をダウンロード。 WP2TXT で上記を扱いやすい形式に変換。 このスクリプト で57577になっている文を抽出。数時間かけて(遅い)

    形態素解析エンジンMeCabにて文章中から短歌を抽出 - inaniwa3's blog
    kirakking
    kirakking 2015/01/18
    日本人の潜在的短歌脳がこんなところにも。すごい。
  • 1