タグ

データに関するknekokzのブックマーク (7)

  • 英語論文執筆のために arXiv からの例文検索サービスを作った話

    arXiv の論文から例文を検索する Hyper Collocation というサービスを公開しました. 以下はあまり整理されていない製作の記録です. 英語論文執筆用の例文検索サービス 英語での論文執筆の際に,専門用語を含む例文や言い回しのパターンを知りたいことが多々あります.有用なサービスとしては ライフサイエンス辞書のコーパス検索 Springer Exemplar (2018/2/1頃に終了) がありますが, データがライフサイエンス系の論文に限られている(ライフサイエンス辞書) ソートの基準が頻度順ではないため典型的な例文が上位にこない ストップワードに近い頻出語を検索した際の 検索が重い(Springer Exemplar) 表示可能な検索結果が偏る(ライフサイエンス辞書) という不満点があったので,並行して個人的な資料から検索を行うプログラムを作って使っていました. しかし,個

    英語論文執筆のために arXiv からの例文検索サービスを作った話
  • 異空間への埋め込み!Poincare Embeddingsが拓く表現学習の新展開 - ABEJA Tech Blog

    ABEJAでResearcherしている白川です。 今回ご紹介するのは、Poincaré Embeddings [1]という手法です。その内容に驚愕し、個人的に調べたり実装したり勉強会でお話したりしていたところ、最近運良く自分の実装をredditで取り上げてもらえたので、これを機にその驚愕の内容を共有できればと思います。 正直、自分の中ではまだ煮詰まりきっていない技術なので、現況の共有はしますが、ところどころ私の憶測や展望、期待が入り混じっていることをご容赦ください。 www.reddit.com Poincaré Embeddingsは大雑把に言えばword2vecを異空間で実現する技術で、双曲空間(Hyperbolic Space)という、おなじみのEuclide空間(2点$x,y$の間の距離を$\sqrt{(x_1 - y_1)^2 + (x_2 - y_2)^2 + ... + (

    異空間への埋め込み!Poincare Embeddingsが拓く表現学習の新展開 - ABEJA Tech Blog
  • 機械学習のデータセットを可視化する「Facets」で遊んでみた - paiza times

    秋山です。 先日、Google Open Sourceで「Facets」という機械学習向けデータセットの可視化ツールが公開されました。 サイトはこちら opensource.googleblog.com (※Chromeであれば、ブラウザ上でどういったことができるかのデモを触れます。Safariだとうまく動かない?ようなのでご注意ください) GitHubはこちら github.com デモのようにブラウザ上でデータを可視化したり、Pythonライブラリのjupyter内で使ったりすることができます(ブラウザで表示させるかjupyter内で表示させるかだけの違いですが…) 例えば巨大なデータを扱っていて、うまく分離できていないデータ群はどの辺りになるのか…といったことを可視化して眺めたいときなどによさそうなので、実際にちょっと使ってみたいと思います。 ■Facets使ってみた Facetsに

    機械学習のデータセットを可視化する「Facets」で遊んでみた - paiza times
  • 生態学データ解析 - FAQ モデル選択

    統計学的なモデル選択 (とくに AIC を使ったモデル選択) についてよくある質問と 久保 によるてきとーなる回答を並べてみました 参照: FAQ 系ペイジ一覧, FAQ stepAIC() モデル選択 [項目] モデル選択とは何ですか モデル選択したあとに検定すればいいのですか? モデル選択規準 AIC が一番小さいモデルは一番あてはまりの良いモデルですか? AIC によって選択された統計モデルってどういう意味で「良い」のですか? AIC で選ばれる統計モデルは標数に影響されますか? AIC が少しでも小さい統計モデルが「良い」モデルなのですか? 統計ソフトウェアが出力する AIC の値だけ確認すればいいのですか? 比較すべき統計モデルの個数が 100 個ぐらいあるんですけど,このときも AIC 最小のモデルを選べばよいのですか? 「パラメーターの重要性」をみるために ``Akaike

  • 税金はどこへ行った? - WHERE DOES MY MONEY GO? -

    あなたが払った税金が1日あたりどう使われているかを知ることで、 公共サービスの受益と負担の関係を読み解く市民主導のプロジェクトです 私たちは来であれば支払った税金で 望む公共サービスを受ける権利があります。 そのためには税金の使われ方を知る事が必要ですが、 簡単に知る術がありません。 「税金はどこへ行った?」は、 税金が支える公共サービスの受益と負担の関係をわかりやすく理解する為にデータを表現するプロジェクトで、 税金への理解と問題意識が 日の財政を健全化させ新たな成長へと導く近道に違いないと信じ、活動しています。 2012年頃には多くの有志の人の手により様々な自治体のサイトが立ち上がりました。 しかしながら、その後活動は衰退し、サーバが停止したことにより多くのサイトが見れなくなっています。 2021年8月、再度有志がプロジェクトを復活させるために立ち上がり、活動を再開しています。

    税金はどこへ行った? - WHERE DOES MY MONEY GO? -
    knekokz
    knekokz 2013/12/05
    チーズはどこへ消えた?的な語感がいい
  • Think with Google - Discover Marketing Research & Digital Trends

    Marketing is at an inflection point. Here’s why that’s an opportunity

    Think with Google - Discover Marketing Research & Digital Trends
  • 生活者データベース | HAKUHODO Inc.,

    東京都港区。大手広告会社。博報堂の卓越したソリューションとそれを支える「知」と「技」、会社概要、各種調査資料、CSR活動などについてご覧いただけます。博報堂の発想の原点は、「生活者発想」です。 誰よりも生活者をよく知る企業として、さまざまな側面から生活者を研究し、生活者と企業の橋渡しとして活動しています。 このコーナーでは、これまで博報堂が発表した「生活者関連」のデータなどについてまとめてご紹介致しております。

  • 1