タグ

2023年9月5日のブックマーク (13件)

  • コンペで使える!?LightGBMで実装する3つの弱教師あり学習 - ABEJA Tech Blog

    ABEJAでデータサイエンティストをしている小林です。 今回は、もしかしたらいつか業務や機械学習コンペに役立つかもしれない情報、LightGBMで弱教師あり学習を行う方法についてお話します。 コードはこちらで公開しております。 目次 はじめに 弱教師あり学習の例(マルチインスタンス学習) LightGBMで弱教師あり学習がしたい! PU分類 問題設定 解き方 LightGBMの実装 実験 Partial Label Learning 問題設定 解き方 LightGBMの実装 実験 マルチインスタンス学習 問題設定 解き方 LightGBMの実装 実験 おわりに はじめに 機械学習を行うためには、一般的に、大量の入力データと、それら一つ一つに対応した正確なラベルが必要です。 例えば、犬との画像分類を行う場合には、それぞれの画像一つ一つに犬かのラベルがついていてほしいですね。 一方で場合に

    コンペで使える!?LightGBMで実装する3つの弱教師あり学習 - ABEJA Tech Blog
    misshiki
    misshiki 2023/09/05
    “3つの弱教師あり学習の設定・解き方と、そのLightGBMでの実装法を紹介”
  • Pythonの「仮想環境」を完全に理解しよう

    Pythonで必ずお世話になる「仮想環境(venv)」のしくみを「完全に理解」しましょう! イベントページ:https://studyco.connpass.com/event/292513/ 関連記事:Pythonの開発環境の3つの観点をおさえよう (https://zenn.dev/o…

    Pythonの「仮想環境」を完全に理解しよう
    misshiki
    misshiki 2023/09/05
    全19ページのスライド資料。
  • 「Python」にセキュリティ更新 ~v3.11.5、v3.10.13、v3.9.18、v3.8.18が公開/次期バージョン「Python 3.12」の開発は順調

    「Python」にセキュリティ更新 ~v3.11.5、v3.10.13、v3.9.18、v3.8.18が公開/次期バージョン「Python 3.12」の開発は順調
  • データサイエンティスト募集のお知らせ | 埼玉西武ライオンズ

    埼玉西武ライオンズは、来季のデータサイエンティストを募集します。 野球界では人的に入力するデータだけではなく、トラッキングシステム、映像解析ソフトなどからさまざまなデータが取得できる時代になりました。これらのデータを駆使して選手やチームの潜在的な能力を評価・予測し、さまざまなスタッフと連携してチーム強化につなげていただきます。チーム全体の力でチャンピオンフラッグをつかんだ時の喜びは人生の宝物になること間違いないでしょう。 応募希望の方は、下記応募条件をご確認のうえ、応募フォームよりお申込みください。 ご応募はこちらから 募集職種 データサイエンティスト 業務内容 ・データを活用して深層的且つ潜在的な能力を見極める選手評価 ・選手やチームのパフォーマンスを確度高く予測する戦力予測モデルの構築と運用 ・選手育成計画を基に成長進捗管理モデルの構築と運用 ・スカウティングに関する管理指標の構築と運

    misshiki
    misshiki 2023/09/05
    “報酬は経験能力に応じて相談”こういう仕事してみたい。
  • 【西武】データサイエンティストを募集 9月末まで - スポーツ報知

    西武はデータを駆使して選手の潜在的な能力を評価、予測するデータサイエンティストを9月末まで募集している。 近年、野球界では人的に入力するデータだけではなく、トラッキングシステム、映像解析ソフトなどから様々なデータを取得できるようになっている。そのような環境下で多様なデータを駆使、分析しながらチームスタッフとコミュニケーションを図ることができる人材を発掘し、さらなる戦力アップを目指していく。要項は以下の通り 【募集職種】 データサイエンティスト 【業務内容】 データを活用して深層的且つ潜在的な能力を見極める選手評価。 選手やチームのパフォーマンスを確度高く予測する戦力予測モデルの構築と運用。 選手育成計画を基に成長進捗管理モデルの構築と運用。 スカウティングに関する管理指標の構築と運用。 チームスタッフとのコミュニケーションを通して課題発掘、データ分析による課題解決の企画立案と提言。 各種デ

    【西武】データサイエンティストを募集 9月末まで - スポーツ報知
    misshiki
    misshiki 2023/09/05
    “西武はデータを駆使して選手の潜在的な能力を評価、予測するデータサイエンティストを9月末まで募集している。” 面白そうな仕事ですね~。
  • 【異常検知】最近の研究動向・2023年夏 - Qiita

    最近、画像の異常検知研究が活発になってきました。 そこで、稿では、画像の異常検知研究に関する最新情報をお伝えします。 画像はpaper with codeより転載 先に結論 最近の研究は精度を維持しつつ、メモリの圧迫を抑える。さらに、推論時間も短縮させている。 最近のデータセットは多様性が増し、より難易度が上がっている 予備知識 題に入る前に、従来の手法・データセットが抱える問題点をおさらいしておきます。2021年くらいまでの情報ですので、ご存知の方は読み飛ばしてください。 従来の手法 PaDimとマハラノビスAD 今でも根強い人気があるのがPaDim[1]です。中身が簡単なことに加え、異常検知性能も高いことが理由だと思います。また、PaDimの基となったのがマハラノビスAD(gaussian AD)[2]です。 上記のスライドは二つの手法を説明したものです。両手法とも、ImageNe

    【異常検知】最近の研究動向・2023年夏 - Qiita
    misshiki
    misshiki 2023/09/05
    “最近、画像の異常検知研究が活発になってきました。 そこで、本稿では、画像の異常検知研究に関する最新情報をお伝えします。”
  • グラフ構造学習を評価するためフレームワーク、米Googleが開発 4000以上のアーキテクチャを統一

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Google Researchに所属する研究者らが発表した論文「UGSL: A Unified Framework for Benchmarking Graph Structure Learning」は、グラフ構造学習のベンチマーク戦略を提案するもので、既存のいくつかの方法を単一のモデルにまとめたフレームワークに関する研究報告である。 ここでいうグラフとは、棒グラフや円グラフのようなデータを視覚化したものではなく、対象物をノード(頂点)とエッジ(辺)を用いて表現したデータ構造を指す。例えば、SNSのソーシャルグラフに用いられている。各ユー

    グラフ構造学習を評価するためフレームワーク、米Googleが開発 4000以上のアーキテクチャを統一
    misshiki
    misshiki 2023/09/05
    “グラフ構造学習のベンチマーク戦略を提案するもので、既存のいくつかの方法を単一のモデルにまとめたフレームワークに関する研究報告”
  • AWSのLLM開発支援、採択企業が明らかに サイバーエージェント、マネフォ、PFN、rinna、リコーなど

    AWSジャパンは9月4日、7月に発表した大規模言語モデル(LLM)開発支援プログラムについて、参加企業を一部発表した。応募があった約60社のうち、サイバーエージェント、rinna、Preferred Networks、リコー、マネーフォワード、松尾研究所など17社を採択。今後、総額600万ドル規模の利用料補助や、技術支援などを提供する。 対象企業の一覧は以下の通り。ただし発表したのは社名の公開に同意した企業のみ。実際にはもう1社、対象企業がいるという。 カラクリ マネーフォワード サイバーエージェント ユビタス ストックマーク Lightblue Sparticle リクルート Turing リコー Preferred Networks rinna Poetics ロゼッタ 松尾研究所 わたしは LLM開発支援プログラムは、AWSを使ってLLM開発に取り組む日の企業・団体をサポートする取

    AWSのLLM開発支援、採択企業が明らかに サイバーエージェント、マネフォ、PFN、rinna、リコーなど
    misshiki
    misshiki 2023/09/05
    “応募があった約60社のうち、サイバーエージェント、rinna、Preferred Networks、リコー、マネーフォワード、松尾研究所など17社を採択。今後、総額600万ドル規模の利用料補助や、技術支援などを提供する。”
  • ChatGPTに渡す文章の適切な区切り線について検証した記事|Clirea

    はじめに大規模言語モデルであるChatGPTに文章を渡す際、適切な区切り線の使用は、情報の正確な伝達や解釈に大いに役立ちます。 この記事では、区切り線に適切なものを検証します。 区切り線とは?使い方区切り線は文章を区切る時に使用する文字列のことです。 例えば下記のようなものです。 また、使い方をまとめた記事もあるので参考にしてください。 def test() a = "a" b = "b" c = a + b print(c) ================================ ←これが区切り線 上記のコードについて教えてください 結論先に結論を言うと、4個~16個連続した「-」か「=」 もしくは8の倍数の「-」か「=」が区切り線としてはベストでした。 ---- ---------------- -------------------------------- ==== ==

    ChatGPTに渡す文章の適切な区切り線について検証した記事|Clirea
    misshiki
    misshiki 2023/09/05
    “ChatGPTに文章を渡す際に区切り線として適しているのは4個~16個連続した「-」「=」か、もしくは8の倍数の「-」か「=」らしいです。”
  • OpenAIが推奨!ChatGPTを最大限活用するためのプロンプトの7つのコツ|Ainova

    こちらのページでは、ChatGPTの開発元であるOpenAIの公式サイトに掲載されている「GPT best practices」を基に、ChatGPTを活用するためのプロンプトのコツを7つご紹介します。 これからの時代、ChatGPTを効果的に使いこなすスキルは、仕事の生産性を大きく左右する要素となります。 特に、プロンプトエンジニアリングの技術は、そのキーとなる要素であるため、これからChatGPTをしっかりと活用していきたいという人はぜひ参考にしてみてください。 こちらのページで紹介している内容はスライドにもまとめているので、ぜひご自身の勉強はもちろんのこと、社内や学校での講義資料としてもお使いいただければと思います。 資料のダウンロードは、以下のリンクからも可能です。(個人情報の登録などは不要) プロンプトのコツ①:詳細な説明をする ChatGPTには高度なAIが使われていますが、さ

  • これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales) | テクノエッジ TechnoEdge

    IT海外速報を書いたり、翻訳を請け負ったりしています。初めてのスマートフォンはHTC Desire。その後はNexus 5からずっとGoogleさんオリジナルモデルを使っています。 AI一色だった5月のGoogle I/Oで発表された新サービスの中でも、一般ユーザーが手軽に使えそうだと期待したのが「Search Generative Experience」(以下「SGE」)でした。まずは米国でのみの提供でしたが、これが8月30日に日とインドでも使えるようになりました。米国以外で使えるようになったのは、今のところこの2カ国のみだそうです。 SGEは、Microsoftの「新しいBing」のような、Web検索を生成AIチャットボットとのやりとりで行うというサービスです。全収入に占める広告収入の割合がごくわずかなMicrosoftと違い、GoogleにとってのGoogle検索(の広告)は重要

    これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales) | テクノエッジ TechnoEdge
    misshiki
    misshiki 2023/09/05
    “私の周辺でSGEを使えるようになった人のだいたいの感想は「いまいち」というものですが、これはまだ実験なので、フィードバックしつつ、進化を見守りたいと思います。”
  • [解決!Python]type関数やisinstance関数でオブジェクトの型を確認するには

    # type関数 a = 1 t = type(a) print(t)  # <class 'int'> tt = type(t)  # type関数の戻り値の型 print(tt)  # <class 'type'> tt = type(int)  # int型(intクラス)の型 print(tt)  # <class 'type'> # オブジェクトの型で振る舞いを変えるには if type(a) == int: print(f'{a}の型はintです') elif type(a) == float: print(f'{a}の型はfloatです') n = 1.2 t = type(n) if t == int or t == float or t == complex: print(f'{n} is number: {t}')  # 1.2 is number: <class 'f

    [解決!Python]type関数やisinstance関数でオブジェクトの型を確認するには
  • Stack Overflow Developer Survey 2023

    In May 2023 over 90,000 developers responded to our annual survey about how they learn and level up, which tools they're using, and which ones they want. Read the overview → Methodology → Welcome to the 2023 Developer Survey! For 13 years, we've delivered industry-leading insights regarding the developer community. This is the voice of the developer. Analysts, IT leaders, reporters, and other deve

    misshiki
    misshiki 2023/09/05
     ChatGPTとCopilotは非常に使われている。