タグ

ブックマーク / inaniwa3.hatenablog.com (2)

  • 吉幾三の村に無いものにマッチする正規表現 - inaniwa3's blog

    はじめに 正規表現をうまく書けないので練習していたのですが、郵便番号にマッチさせたり、HTMLタグにマッチさせたりするのにも飽きてきたので、なにか飽きない練習法はないものかと考えました。 その結果、好きな曲の歌詞を使えばいいんじゃないかと思いつきました。歌詞は繰り返しもあるし、なんなら韻を踏んだりするので都合がよさそうな気がします。 今回はその一例、吉幾三の村に無いものにマッチする正規表現です。 SAMPLE INPUT テレビも無エ ラジオも無エ 自動車もそれほど走って無エ ピアノも無エ バーも無エ 巡査毎日ぐーるぐる 朝起きて牛連れで 二時間ちょっとの散歩道 電話も無エ 瓦斯も無エ バスは一日一度来る 俺らこんな村いやだ 俺らこんな村いやだ 東京へ出るだ 東京へ出だなら 銭コア貯めで 東京で牛飼うだ ギターも無エ ステレオ無エ 生まれてこのかた見だごとア無エ 喫茶も無エ 集いも無エ ま

    吉幾三の村に無いものにマッチする正規表現 - inaniwa3's blog
    ebo-c
    ebo-c 2015/01/19
    秀逸なスレタイならぬblogタイトルとして紹介されるべきインパクト
  • 形態素解析エンジンMeCabにて文章中から短歌を抽出 - inaniwa3's blog

    概要 偶然57577になっている文章を短歌としてつぶやく Twitter の bot を作りました。 フクロウが鳴くと明日は晴れるので洗濯物を干せという意味 #tanka ウィキペディア日語版「フクロウ」より http://t.co/Dm1uHcQdzR— 偶然短歌bot (@g57577) 2014, 12月 31 再帰的アルゴリズムが有効な問題として有名であり #tanka ウィキペディア日語版「ハノイの塔」より http://t.co/vm2ZqwImKi— 偶然短歌bot (@g57577) 2014, 12月 31 文章はウィキペディア日語版を対象としました。 作り方 jawiki-latest-pages-articles.xml.bz2 をダウンロード。 WP2TXT で上記を扱いやすい形式に変換。 このスクリプト で57577になっている文を抽出。数時間かけて(遅い)

    形態素解析エンジンMeCabにて文章中から短歌を抽出 - inaniwa3's blog
    ebo-c
    ebo-c 2015/01/19
  • 1