エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
転置インデックスによる検索システムを作ってみた - pythonco(ぱいそんこ)の日記
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
転置インデックスによる検索システムを作ってみた - pythonco(ぱいそんこ)の日記
転置インデックスによる検索システムを作ってみよう! にインスパイアされて作ってみました。 検索記事... 転置インデックスによる検索システムを作ってみよう! にインスパイアされて作ってみました。 検索記事は [記事ID][SPC][記事内容]\n以上のフォーマットで、文字コードはUTF-8とします。 検索対象ファイルとして 1 これはペンです 2 最近はどうですか? 3 ペンギン大好き 4 こんにちは。いかがおすごしですか? 5 ここ最近疲れ気味 6 ペンキ塗りたてで気味が悪いです 7 ペンペンペンペンという内容のtest.txt用意しました。 インデックス n-gramをkeyとして、各記事のtf(記事中のn-gram出現頻度)と記事IDのタプルをtf降順にsortしたリストを登録した辞書 index[n-gram] => [(tf, 記事ID), ...] #タプルはtf降順にsortしておくをcPickleでシリアライズしたものをインデックスファイルとして使うことにします。 cPickl