タグ

2015年1月18日のブックマーク (4件)

  • 形態素解析エンジンMeCabにて文章中から短歌を抽出 - inaniwa3's blog

    概要 偶然57577になっている文章を短歌としてつぶやく Twitter の bot を作りました。 フクロウが鳴くと明日は晴れるので洗濯物を干せという意味 #tanka ウィキペディア日語版「フクロウ」より http://t.co/Dm1uHcQdzR— 偶然短歌bot (@g57577) 2014, 12月 31 再帰的アルゴリズムが有効な問題として有名であり #tanka ウィキペディア日語版「ハノイの塔」より http://t.co/vm2ZqwImKi— 偶然短歌bot (@g57577) 2014, 12月 31 文章はウィキペディア日語版を対象としました。 作り方 jawiki-latest-pages-articles.xml.bz2 をダウンロード。 WP2TXT で上記を扱いやすい形式に変換。 このスクリプト で57577になっている文を抽出。数時間かけて(遅い)

    形態素解析エンジンMeCabにて文章中から短歌を抽出 - inaniwa3's blog
    Jxck
    Jxck 2015/01/18
    おお、 MeCab でやってるのか。本物の短歌は手動ではじいてるという苦労が味わい深い。
  • Wikipediaの中から偶然57577になっている文章をつぶやく「偶然短歌bot」が話題に

    Twitter上で、Wikipedia語版の文字列の中から、偶然57577の韻を踏んでいる文章を見つけ、ツイートしていく「偶然短歌bot」(@g57577)が話題になっています。 短歌を作っているわけではありません。Wikipediaで偶然57577になっているものです どのように作っているかは、作者が詳しく解説しています。解析ツールを使って音数を抽出、さらに短歌になっていないものを弾くように調整。最終的に残ったものの中から、物の短歌を手動で弾く、という非常に手の込んだbotになっています。 この発想と面白さに多くの反響を呼んでいます。 もう一つのこだわりポイントは5・7・5・7・7時間おきにツイートしている、ということ。凝ってるなー。 (たまごまご) advertisement 関連記事 村上春樹やモーツァルトの創作時間は? 有名な文化人の1日の過ごし方をグラフ化したサイト「The

    Wikipediaの中から偶然57577になっている文章をつぶやく「偶然短歌bot」が話題に
    Jxck
    Jxck 2015/01/18
    良くできてるなぁ、何で形態素解析してるんだろう。
  • http://www.youtube.com/watch?v=18LcYhsGq6Q

    Jxck
    Jxck 2015/01/18
    すげぇ、、
  • ep14 WHATWG | mozaic.fm

    Theme 第 14 回のテーマは WHATWG です。 今回は @myakura さんと @nunnun (hiro) さんをお迎えして、 WHATWG 、 W3C 、 TAG などの成り立ちや、それらがやっていること。先日の HTML5 勧告の意味。 LivingStandard とはどう考えればいいのか?といった話から、標準化において「今何が起こっているのか」、「これからどうなっていくのか」そして、「自分たちはそれにどう参加できるのか?」を議論しました。 後半は Extensible Web の話になったので、 次のエピソード に分けています。 Show Note 0:00 ~ : intro 3:00 ~ : W3C とは? W3C - World Wide Web Consortium W3C とは 5:30 ~ : 他の標準化団体との棲み分け WebRTC は IETF では

    ep14 WHATWG | mozaic.fm
    Jxck
    Jxck 2015/01/18
    @myakura さん @nunnun さんをお迎えして WHATWG とは何か、昨今の標準化で今なにがおこっていて、これからどうなって行くのかを議論させていただきました!濃いです! #mozaicfm