サンフランシスコの帰りに、成田から福岡の飛行機からずっと夜景が見えてて写真を撮っていたので、どこだったか場所を特定してみました。 思いのほか時間がかかってしまった。 名古屋を超えたあたり。四日市周辺 これが名古屋だと思っていたのだけど、名古屋は超えてた。鈴鹿あたりまではひとつながりの都市圏なんですね。 地図は、対応させやすいように反転しています。 ちなみに、名古屋あたりは雲がかかってたので、場所の特定が困難。。。 雲がきれいに光っていて怪しい雰囲気でした。 草津 琵琶湖の南の端です。 京都 そして京都。これは空から見ても一発でわかりました。 下部の逆ハの字になってるところが西大路と千本通ですね。その右の暗い中に点があるのは大文字山ですかね。 左の黒い四角が御所で、右上のちょっと暗い区画が二条城、上にいったところのひときわ明るいのが四条烏丸あたりではないかと。 大阪 都会だ。向こうの右端、関
やったこと 文書の特徴語の抽出方法として「TF-IDF」という比較的簡単なものがあることを知ったので、身近なデータを使って試してみた。 弊社スローガン株式会社が運営している新卒学生向けの求人メディア「Goodfind」では、ベンチャー企業・スタートアップ企業約100社を掲載しているので、この企業紹介ページのテキストを元に、各社の特徴語を抽出した。しれっと自社の求人もここに掲載しているので、自社の特徴語を見て結果の妥当性を考えた。 使ったツール・技術 MeCab 非常に有名なオープンソース形態素解析エンジン。形態素解析とは、文書を単語ごとに分割し、その単語に対して品詞をタグ付けする作業を指す。形態素解析は日本語のような単語が区切られていない言語では必須の前処理である。 http://taku910.github.io/mecab/ 文書中の単語の重みを表す値。詳しい定義は下記を参照。 htt
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く