2024年6月12日のブックマーク (2件)

  • レコメンドアルゴリズム入門:基礎から応用まで実装に必要な知識を解説 - Qiita

    1: 購入 0: 閲覧(したが購入してない) -: 未観測 ユーザーベース型 ユーザー同士の類似度を計算 「あなたと購入履歴の似たユーザーはこんな商品を買っています」 行を各ユーザーのベクトルとみなして、似たユーザーを見つける(上位N人) 似たユーザーが購入しているアイテムを推薦する(N人の平均値などで購入しそうな順に提示) アイテムベース型 アイテム同士の類似度を計算 「この商品を買ったユーザーはこんな商品も買ってます」 列を各アイテムのベクトルとみなして、類似度の高いアイテムを推薦する(上位M件) 類似度計算には、コサイン類似度やJaccard類似度が使われる。 類似度を計算する際に、未観測「-」は適当な値(0, 0.5など)で埋めるか、無視をする。 ログデータを使うため、情報の少ない新規アイテム/新規ユーザーに弱いコールドスタート問題がある。 コンテンツベースフィルタリング アイテム

    レコメンドアルゴリズム入門:基礎から応用まで実装に必要な知識を解説 - Qiita
  • 日本で一番読み間違いが浸透している漢字

    「他」だと思う 「他」と書いて「ほか」って読むことね 「他」にそんな読み方ないのに、社会に出たらみんな普通に使っている (ちなみに役所やちゃんと日語知っている人は「ほか」と読ませたい場合は「外」と書く) 読み間違いの多い漢字の話題になったときも、「他」が出てきたの見たことがない 日人の9割以上、間違っていることに気づいていないんじゃないかと思う 「凡例」とか「重複」とかでキャッキャキャッキャ騒いでいる場合じゃないだろ 「ほか」ってタイピングして変換すると「他」が変換候補に出てくるのもどうかと思う よく使われているからって間違った文字を変換できるようにしていいものなのか IMEとかgoogle日本語入力とか、なんかそういうの作ってる会社には、正しい日語を守っていく義務もあるんじゃないのか? いや、正しい日語を守るとか大層なこと考えなくてもいいが、間違いを広めないというポリシーみたいな

    日本で一番読み間違いが浸透している漢字
    enjoymoon2
    enjoymoon2 2024/06/12
    言葉なんていくらでも移ろい変わっていくもの。余程コミュニケーションに支障がない限り、マイナーチェンジする道具でしかない。