タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

pythonとqiitaとfilteringに関するishideoのブックマーク (3)

  • 読書メーターをスクレイピングして協調フィルタリングっぽいのを実装した - Qiita

    この記事は、OIT Advent Calendar 2018の17日目の記事です. こんにちは こっそり歩くです.まいかた出て奈良なんとかで院生してます. twitter やったこと 読書メーターをスクレイピングして協調フィルタリングを使った推薦モデルを作った. モチベーション 恒川光太郎の作品が好きだけど,そろそろ全作読み終わるのでいい感じのが探したい →Amazonの推薦が微妙だったので,とりあえず自分で作ってみようと思った スクレイピング 協調フィルタリングをするのにデータが欲しい →読書メーターからユーザごとの読んだを持ってくれば協調フィルタリングいけるか? →スクレイピングしよう (→なんかスクレイピングってハッカーぽくてカッコイイ🤓(やったことないが)) 使ったもの beatifulsoup4 有名どころらしい. HTMLをパースしてくれたり,欲しいタグのみ取り出したりし

    読書メーターをスクレイピングして協調フィルタリングっぽいのを実装した - Qiita
  • PySparkで協調フィルタリング - Qiita

    ratingの名前の通り、「ユーザーがその商品にどれだけ評価値を付けたかどうか」が来の使い方になりますが、上記の通り「商品を購入したかどうか」、または「ページにアクセスしたかどうか」といったデータでも実装は可能です。前者の場合は「ユーザーがその商品を購入するスコアはどのくらいか」、後者は「ユーザーがそのページにアクセスするどのくらいか」を予測するモデルになります。 学習データを加工する ユーザーIDや商品IDがint32の最大値(2,147,483,647)までしか扱えないため、それを超えるIDがある場合にIDを改めてナンバリングし直します。また整数値しか扱えないので、文字列含まれる場合も同様にナンバリングし直します。 IDが整数値かつint32の最大値を超えない場合は、この工程は飛ばしてください。 # !/usr/bin/env python # -*- coding: UTF-8 -

    PySparkで協調フィルタリング - Qiita
  • はてなブックマークのRSS feedをフィルタリングする - Qiita

    結論 inoreaderにフィードのフィルタ機能があったので、移行しました 以下は、そこにいたるまでの紆余曲折になります。 動機 ホッテントリって便利だけどフィルタリングとかしたいよね、ということでやり始めました。 PC/スマホから見るので、サーバ側でフィルタリングをかけたいという個人的な需要がありました。 feedlyから移行するのが面倒だったので、移行せずに何とかする方向で考えていました。 当初やろうとしていたこと feedにアクセスが来るたびにホッテントリのRSS feedを取得し、タイトルとドメインでフィルタリングして表示する仕組みをflaskで書いていました。 が、諸々問題がありお蔵入りになりました。 https://github.com/tetosuna/hatebu_with_ng 問題点 自前で公開したfeedがfeedlyに登録できない。 DNS名がついてないとfeed登

    はてなブックマークのRSS feedをフィルタリングする - Qiita
  • 1