文字列の ID 化と相互変換を SUFARY を使って行う方法

テクノロジーカテゴリーの変更を依頼記事元:

chalow.net

11 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

文字列の ID 化と相互変換を SUFARY を使って行う方法

文字列の ID 化と相互変換を SUFARY を使って行う方法 2008-04-10-2 [Programming] 例えば、巨大なコー... 文字列の ID 化と相互変換を SUFARY を使って行う方法 2008-04-10-2 [Programming] 例えば、巨大なコーパスに対して出現する単語の共起情報を計算するときなどに、 (1) 各単語をあらかじめ ID (例えば整数) に変換して、 (2) その ID で内部処理を行い、結果をその ID で出力し、 (3) 出力結果の ID を元の単語に戻す、というロジックをよく使う。機械学習の学習データの feature や、ログデータ分析なんかもこのロジックでやったりする。 SUFARY を用いてこの作業を効率的に行う方法をメモ。速度よりも省ディスクスペースを優先する人向け。巨大な単語集合（例えば100万とか1000万とか1億とか）に有効。小規模なら、ありもののDBやハッシュで良いかと。まず準備。各行はキー文字列と付加情報をスペースでつないだもの。 mkary

ブックマークしたユーザー

mzta2009/10/21
pcod2008/06/23
y883p22008/05/23
makoto152008/04/15
Cuckoo2008/04/14
yokochie2008/04/13
sassano2008/04/11

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx