タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

*algorithmと*dataと*bookに関するsh19910711のブックマーク (9)

  • Official髭男dismの『Cry Baby』と『ミックスナッツ』で計量国語学を自由研究する夏🌻 - 5日と20日は歌詞と遊ぼう。

    Official髭男dismの『Cry Baby』を久しぶりに聴いてました。 いい曲〜〜! で気づいたことがあるんですけど、この歌詞、動詞多くないですか? 目視で動詞を見つけて色をつけてみました。こういう感じになるはずです。 胸ぐらを掴まれて 強烈なパンチをらってよろけて 肩を並べうずくまった 予報通りの雨にお前はにやけて 「傷口が綺麗になる」なんて嘘をつく いつも口喧嘩さえうまく出来ないくせして 冴えない冗談言うなよ あまりのつまらなさに目が潤んだ 何度も青アザだらけで涙を 流して 流して 不安定な心を肩に預け合いながら 腐り切ったバッドエンドに抗う なぜだろう 喜びよりも心地よい痛み ずっしりと響いて 濡れた服に舌打ちしながら 腫れ上がった顔を見合って笑う 土砂降りの夜に 誓ったリベンジ Official髭男dism『Cry Baby』歌詞 めちゃくちゃ多い…… 動詞が多いと、ああな

    Official髭男dismの『Cry Baby』と『ミックスナッツ』で計量国語学を自由研究する夏🌻 - 5日と20日は歌詞と遊ぼう。
    sh19910711
    sh19910711 2022/11/26
    "動詞が多いと、ああなって、こうなって、そうなって…みたいに、シーンがどんどん変わる感じ。マンガみたい / 文章を要約しようとすると名詞が残る感じある / 計量国語学会『データで学ぶ日本語学入門』"
  • 「確率論」(伊藤清, 岩波講座基礎数学)を古本屋にて200円で買った。 - 閃き- blog

    先日、神保町の古屋で「確率論」(岩波書店)を買いました。 お値段はなんと税込200円です。 確率論は統計学はもちろん、確率微分方程式などの解析分野の基礎でもあるので、辞書的に使うのはアリだと思います。 ↓表紙はこんな感じ ところで、数学というのはシビアな世界で、とりわけ定義(公理)と証明(演繹)を重視します。 最近のAIブームの中で、偉い人が「機械学習や数値解析、計算統計学などの分野を学ぶ際には、当然その下位分野も学んでしかるべきである。」という主張をよくしていますが、これは数学の作法として自然なものでしょう。 で、実際、統計・機械学習まわりでは以下のようなお叱りを受けることがしばしばあります。 「機械学習を学ぶ前に、統計学を学びなさい!」 「統計学を学ぶ前に、確率論を学びなさい!」 「確率論を学ぶ前に、測度論を学びなさい!」 「測度論を学ぶ前に、解析論を学びなさい!」 ... (以下略

    「確率論」(伊藤清, 岩波講座基礎数学)を古本屋にて200円で買った。 - 閃き- blog
    sh19910711
    sh19910711 2022/11/25
    2018 / "お叱り: 「機械学習を学ぶ前に、統計学を学びなさい!」「統計学を学ぶ前に、確率論を学びなさい!」「確率論を学ぶ前に、測度論を学びなさい!」「測度論を学ぶ前に、解析論を学びなさい!」 ... (以下略"
  • 数学に強いエンジニアむけの機械学習勉強法

    今年の3月から機械学習の勉強を始めて9ヶ月たったのでその振り返りと今後機械学習に入門する人の参考になればという記事です。 巷の記事だと「数学何もわからない人向けの機械学習~」みたいなものが多いので「数学チョットワカル人向け」に勉強方法をまとめてみようと思いました。 前提として筆者は大学で数学を専攻しており、社会人になってからはプログラミングを生業としております。 # 前提知識のおさらいいきなり機械学習入門~のような書籍に入る前に、基礎知識としてこの辺を抑えておくと良いと思います。 ## 線形代数:大学1年レベル機械学習の説明はほとんど行列の計算として表現されますので大前提として。手を動かして計算問題を解くのもおすすめです。 プログラミングのための線形代数 https://www.amazon.co.jp/dp/4274065782 ## 基礎統計(頻度主義):大学1年レベル正規分布や指数分

    sh19910711
    sh19910711 2022/11/24
    "ある程度写経をして「どう書くのか」がわかってきたら次は「モデルがどう動くのか」を学習します。(この”学習”の主語は機械ではなく人間です) / 『完全独習 ベイズ統計学入門』『ベイズ統計の理論と方法』"
  • 書評 「統計学を哲学する」 - shorebird 進化心理学中心の書評など

    統計学を哲学する 作者:大塚 淳発売日: 2020/10/26メディア: 単行(ソフトカバー) 書は応用統計学にも造詣の深い科学哲学者大塚淳による統計学の哲学の入門書になる.序章では書について「データサイエンティストのための哲学入門,かつ哲学者のためのデータサイエンス入門」だとある. これまで読んだ統計学の哲学についてはソーバーの「科学と哲学」がなかなか面白かった.書ではソーバーでは扱っていなかった因果推論や深層学習についても論じられていて,そのあたりも勉強したいと思って手に取った一冊になる. 序章 統計学を哲学する? 序章では書のねらいと構成が書かれている.ねらいとしては,上記の入門書というだけでなく,「統計は確固とした数理理論であり,そこに哲学的思弁が入り込む余地はない」とか「統計は単なるツールであり,深遠な哲学とは無縁だ」とかいう誤解を解きたいということが挙げられている.

    書評 「統計学を哲学する」 - shorebird 進化心理学中心の書評など
    sh19910711
    sh19910711 2022/11/04
    2021 / "確率: 母集団に占める部分集合の大きさを測る / 確率モデル: データの源としての「母集団(標本空間)」を想定し,その部分集合として「事象」を / 帰納推論: データの背後にある「自然の斉一性」の仮定が必要"
  • 分散密ベクトル探索エンジンValdとSentence-BERTを使った類似文書検索を試す - エムスリーテックブログ

    エムスリーエンジニアリンググループ AI機械学習チームでソフトウェアエンジニアをしている中村(@po3rin) です。 好きな言語はGo仕事では主に検索周りを担当しています。 Overview 最近、社内で情報検索論文輪読会を立ち上げました。 情報検索論文読み会のスケジュール そこでNGT-ONNGについての論文*1を紹介したところ1時間の予定のところを盛り上がりすぎて2時間超えてしまいました。 大盛り上がりのついでに、今回は情報検索論文輪読会で紹介した近似最近傍探索ライブラリNGTを内部で利用するValdを使って、類似文書検索がどのように出来るのか、現状の問題を解決できるのかを試したのでその結果を報告します。 Overview 弊社が抱える類似文書検索の課題 Sentence-BERT Valdを使った近似最近傍探索 NGT Vald Vald×Sententce-BERTで類似文書

    分散密ベクトル探索エンジンValdとSentence-BERTを使った類似文書検索を試す - エムスリーテックブログ
    sh19910711
    sh19910711 2021/06/08
    "医療言語は表現揺れが大きく単語頻度ベースだと類似文書を出せない可能性 > 医療言語処理という本が面白い / Vald: NGTを内部で利用するスケーラブルな分散型ベクトル検索エンジン > Helmが公式から提供"
  • データ指向アプリケーションデザインを読んでLSM-treeインデックスに基づくKVSを作る - 油そば

    この記事はMicroAd Advent Calendar 2019の4日目の記事です。 qiita.com はじめに どういうKVSを作るか 手始めにログベースのKVS 書き込み, 読み取り, 削除 ログフォーマットの決定 実装 LSM-treeインデックスを持つKVSを実装する 書き込み MemTableからSSTableの生成 SSTableの反映 SSTableのマージとコンパクション バッファを使ったマージ&コンパクション ステップ1. SSTable毎にキーを読み出す ステップ2. バッファ内の最小のキーの最新の値を読み出す 再起動時の復元 アクターで組み立てる 書き込みのケース 読み取りのケース コード はじめに データ指向アプリケーションデザインは今年買って読んだ技術書の中で最も読み応えがあったでした。 www.oreilly.co.jp 単に周回で読むだけでも学びが多い

    データ指向アプリケーションデザインを読んでLSM-treeインデックスに基づくKVSを作る - 油そば
    sh19910711
    sh19910711 2021/05/16
    "学びが多い本ですが、特定のツールや技術に依存しない話や抽象的な話が多く、分かったつもりになってしまいやすい本だと感じました / たった一節読むだけで単一マシンで動作する簡単なKVSは作れるのでかなりお得"
  • クエリ修正を考慮した検索評価指標sDCGを使ってユーザーの検索体験を監視をしたい - エムスリーテックブログ

    エムスリーエンジニアリンググループ AI機械学習チームの中村(@po3rin) です。 好きな言語はGo仕事では主に検索周りを担当しています。最近、ユーザーの検索体験の向上のために、以下の検索評価に関するを読んでいました。 情報アクセス評価方法論 作者:酒井 哲也発売日: 2015/05/19メディア: 単行 そこで今回は検索評価指標の1つであるsDCG (session-based Discounted Cumulative Gain)を使ってエムスリーの検索ログから体験の悪かった検索を抽出してみたのでその方法を紹介します。 現状の検索監視 現状の検索監視の問題 nDCG sDCG 線形横断 最下位クリックにおける検索結果の破棄 クリック=適合文書 nsDCGを実際の検索ログに使ってみる sDCGを使って感じたこと まとめ We're hiring !!! Reference 現

    クエリ修正を考慮した検索評価指標sDCGを使ってユーザーの検索体験を監視をしたい - エムスリーテックブログ
    sh19910711
    sh19910711 2021/03/10
    "「情報アクセス評価方法論」"
  • 新著が出ます:『プログラマのためのSQLグラフ原論』 - ミックのブログ

    今月下旬に、J.セルコの『Trees and Hierarchies 2nd Edition』の邦訳が刊行されます。同著者の代表作『プログラマのためのSQL 第4版』のスピンオフの一つで、RDB/SQLで木と階層構造を扱うための方法論にフォーカスしたなかなかマニア度の高い一冊です。主眼となる「入れ子集合モデル」については、私もあちこちの記事や書籍で紹介したことがあるので、ご存じの方もいるかもしれませんが、より包括的かつ理論面までカバーした格派の内容になっています。 表紙の女性はマリア様でしょうか。家の方が刊行されたときも「このおっさん誰?」という質問が相次ぎましたが、ガリレオという説が有力なようです。そう言われてみると家は『星界の報告』のような格調を感じます。書の方は、長らく定説とされてきたモデルをひっくり返そうという意味では『天体の回転について』みたいな性格もあるのですが、大型

    新著が出ます:『プログラマのためのSQLグラフ原論』 - ミックのブログ
    sh19910711
    sh19910711 2020/08/16
    "『プログラマのためのSQL 第4版』のスピンオフの一つで、RDB/SQLで木と階層構造を扱うための方法論にフォーカスしたなかなかマニア度の高い一冊"
  • 仕事ではじめる機械学習

    TOPICS Database 発行年月日 2017年10月 PRINT LENGTH 212 ISBN 978-4-87311-821-5 FORMAT ソフトウェアエンジニアの間でも一般的な言葉になった「機械学習」。書では、その機械学習データ分析の道具をどのようにビジネスに生かしていけば良いのか、また不確実性の高い機械学習プロジェクトの進め方などを「仕事で使う」という観点から整理します。 プロジェクトのはじめ方や、システム構成、学習のためのリソースの収集方法など、読者が「実際どうするの?」と気になるであろう点を中心にまとめています。上司に「人工知能でいい感じの成果を出してくれ」とあいまいな指示をされたとき、書で学んだことが活きてくるに違いありません。 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作

    仕事ではじめる機械学習
  • 1