タグ

2023年8月16日のブックマーク (19件)

  • 機械学習の評価指標覚え書き

    評価指標の重要性 データ分析失敗事例集という書籍を読んで「評価指標って大事だな(小学生並みの感想)」と思ったので、個人的な覚え書きとしてメモ。 データ分析失敗事例集に加えて、ほぼ積読状態だった評価指標入門から、ポイントをまとめます。 評価指標とは何か?どうやって決めるか? 一番大事な話として、そもそも(この記事では特に機械学習分野での)「評価指標とは何か?」「どうやって決めるか?」という大問題がありますが、私が語るのは恐れ多いので、記事では省略します。 一番難しくて、重要だからこそ、簡単に説明できないのでこの記事を読んであらためて気になったら、最初に紹介したようなを読んでみると良いかもしれません。 評価指標の分類 機械学習は「教師あり学習」「教師なし学習」「強化学習」と大きく3つに分けられるという話を聞いたことがある人は多いかもしれません。そのうち代表的な「教師あり学習」をさらに大きく

    機械学習の評価指標覚え書き
    misshiki
    misshiki 2023/08/16
    混合行列に評価指標を入れてまとめた表。こんな書き方もできるのかと参考になった。
  • PoCの概要や進め方、「PoC疲れ」に陥らないためのポイントをサクサク学ぼう

    1 PoCとは PoCはProof of Concept(概念実証)の略称で、新しいアイデアやコンセプトの実現可能性を確認するための検証を表す用語です。PoCでは、ビジネスにおける課題解決のアイデアや、市場のニーズを検証するため、対象となるアイデアを具体化し、プロトタイプの開発やテストによって、アイデアやコンセプトの実現可能性を確認します。昨今の日では、DX(デジタルトランスフォーメーション)の推進に積極的な企業がさまざまなアイデアや手法に対してPoCを実施しています。 2 PoCの進め方 PoCは以下の流れで進めていきます。 2.1 ゴールの設定 PoCの目的と検証する範囲を明確化し、ゴールを設定します。PoCによって得たい結果など目標を明確化することで、検証を進める中での方針のぶれや、コンセプトを検証するはずがただの技術や製品の検証になってしまう、といった事態を防ぎます。 2.2 環

    PoCの概要や進め方、「PoC疲れ」に陥らないためのポイントをサクサク学ぼう
  • カーネル法(Kernel method)とは? 次元を変えて分かりやすくするテクニック!!

    カーネル法(Kernel method)とは?カーネル法とは、データを変換して(データの次元を上げて)分析しやすくする手法です。 例えば、下の図のような直線的な赤と青のデータが有り、これを直線で分離させようとしてもできません。 ここで、1次元のデータから2次元のデータに次元を上げてみます。 図では各値にの2乗をとったイメージをしています。 すると、線形分離(直線で分離)が可能になりました。

    misshiki
    misshiki 2023/08/16
    “カーネル法とは、データを変換して(データの次元を上げて)分析しやすくする手法。...分析したいデータの次元数を上げて単純な形に変えることでデータ分析しやすくなることをカーネルトリックと言います。”
  • Pythonの罠10選 - Qiita

    皆さんはプログラムを組んでいて、あれ?思った通りの出力結果にならないという経験はありますでしょうか。単純なエラーであればいいですが、文法の理解がい違っている場合、中々ミスに気づかない場合もあります。 今回はそんな知らないと沼にハマるかもしれないPythonの文法を10個ご紹介します。 1つでも新しい知見があると幸いです。 それではいってみましょう! YouTube Pythonチュートリアル(公式ドキュメント)を使って基礎文法を解説しています。 チャンネル登録いただけると励みになります。 罠1:アイテム1のタプルもカンマが必要 タプルはカンマで区切られた値からなるので、アイテムが1つでもカンマが必要です。 忘れるとstr型だったり、int型になり、意外と気づかないです。。。

    Pythonの罠10選 - Qiita
  • Google Cloud で生成 AI アプリケーションを作ろう!パート 0:Google Cloud の生成 AI ソリューション

    シリーズの執筆者 Google Cloud で生成 AI アプリケーションを作ろう! シリーズの記事は、Google Cloud Japan の下記の有志メンバーが共同で執筆しています。 執筆者 下田倫大(Norihiro Shimoda, Google Cloud AI/ML Practice Lead) 中井悦司(Etsuji Nakai, Google Cloud Solutions Architect) 木村拓仁(Takuto Kimura, Google Cloud Customer Engineer) RyuSA レビュアー 牧 允皓(Yoshihiro Maki, Google Cloud AI/ML Specialist) 鈴木かの子(Kanoko Suzuki, Google Cloud Associate Customer Engineer) 吉田望(Nozomu Y

    Google Cloud で生成 AI アプリケーションを作ろう!パート 0:Google Cloud の生成 AI ソリューション
    misshiki
    misshiki 2023/08/16
    “Google Cloud の生成 AI サービスの全体像と本シリーズの流れを説明”
  • グローバルのクラウドインフラ市場シェア、AWSがトップ維持、Google Cloudの成長率が高い。2023年第2四半期、Synergy ResearchとCanalysの調査結果

    グローバルのクラウドインフラ市場シェア、AWSがトップ維持、Google Cloudの成長率が高い。2023年第2四半期、Synergy ResearchとCanalysの調査結果 調査会社のSynergy Research GroupとCanalysは、2023年第2四半期のグローバルにおけるクラウドインフラのシェアをそれぞれ発表しました(Synergy Research Group、Canalys)。 クラウドインフラとは、IaaS、PaaS、ホステッドプライベートクラウドを合わせたもの。 Synergy Research Groupはクラウドインフラにおける過去1年の市場成長率を18%としており、これは第1四半期の19%よりも下がったとして成長の鈍化を指摘しています。成長の鈍化はCanalysも同様に指摘しており、ここ半年以上、成長率が少しずつ低下傾向にあることは明らかです。 そうし

    グローバルのクラウドインフラ市場シェア、AWSがトップ維持、Google Cloudの成長率が高い。2023年第2四半期、Synergy ResearchとCanalysの調査結果
    misshiki
    misshiki 2023/08/16
    “CanalysによるとMicrosoft AzureではAzure OpenAI Serviceが勢いを見せており、高い成長率が期待されると分析されています。”
  • LINEの3.6B言語モデルで遊んだら爆笑した|shi3z

    LINEから36億(3.6B)パラメータの大規模言語モデル(LLM)が公開されたので早速遊んでみた。正確には遊んだのは昨日のデイリーAIニュースなのだが、面白かったのでこちらにも転載する。 細かいやり方は大先生のページを参照のこと。 例によってこんな関数を書いた def line(prompt): # 推論の実行 input_ids = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt") tokens = model.generate( input_ids.to(device=model.device), min_length=50, max_length=300, temperature=1.0, do_sample=True, pad_token_id=tokenizer.pad_token_i

    LINEの3.6B言語モデルで遊んだら爆笑した|shi3z
    misshiki
    misshiki 2023/08/16
    “やはり読ませてるデータが面白いんだろうな”
  • 生成AIに“性格診断テスト”実施 GPTやLlamaに個性はある? 中国ByteDanceの研究者らが検証

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 中国のByteDanceに所属する研究者らが発表した論文「Do LLMs Possess a Personality? Making the MBTI Test an Amazing Evaluation for Large Language Models」は、大規模言語モデル(LLM)に個性があるかを検証した研究報告である。 LLMの倫理的な懸念や幻覚の問題を解決するために、強化学習などの高度な技術が採用され、人間の価値観へ近づきつつある。このような状況において、人間に近い能力を持つLLMは、人間のような人格を持っているのか。 この疑問を

    生成AIに“性格診断テスト”実施 GPTやLlamaに個性はある? 中国ByteDanceの研究者らが検証
    misshiki
    misshiki 2023/08/16
    “大規模言語モデル(LLM)に個性があるかを検証した研究報告”
  • Using GPT-4 for content moderation

    Content moderation demands meticulous effort, sensitivity, a profound understanding of context, as well as quick adaptation to new use cases, making it both time consuming and challenging. Traditionally, the burden of this task has fallen on human moderators sifting through large amounts of content to filter out toxic and harmful material, supported by smaller vertical-specific machine learning mo

    Using GPT-4 for content moderation
    misshiki
    misshiki 2023/08/16
    “コンテンツモデレーションに GPT-4 を使用する”
  • OpenAI、GPT-4の活用で人間のコンテンツモデレータの負担軽減が可能と主張

    OpenAIは8月15日(現地時間)、「Using GPT-4 for content moderation」(コンテンツモデレーションにGPT-4を活用する)と題するブログを公開した。コンテンツポリシーの開発とモデレーションにGPT-4などのLLM(大規模言語モデル)を使えば、ラベル付けの一貫性が高まり、迅速なポリシー改善が可能になり、人間のモデレータの関与を軽減できると主張している。 問題のあるコンテンツを判定し、ラベル付けするために、多数の人間が低賃金で長時間、暴力的など問題のあるコンテンツを視聴させられることが問題になっている。 OpenAIは、こうした問題に対処するためにLLMの使用を検討しているという。GPT-4は自然言語を理解して生成するので、モデレーションに適用できるとしている。GPT-4のシステムを使えば、コンテンツポリシーの開発とカスタマイズにかかる時間が、従来の数カ

    OpenAI、GPT-4の活用で人間のコンテンツモデレータの負担軽減が可能と主張
    misshiki
    misshiki 2023/08/16
    “「他のAIアプリと同様に、結果と出力は、人間を常に関与させて注意深く監視、検証、改良する必要がある」としている。”
  • ニュース記事・写真のAI学習利用、NYタイムズが禁止…違反なら「民事罰や刑事罰の対象」

    【読売新聞】 【ニューヨーク=小林泰裕】生成AI(人工知能)の開発企業によるニュース記事の利用を巡り、米紙ニューヨーク・タイムズが、AIによる記事や写真の学習利用を制限する措置を導入したことが明らかになった。米メディアではAP通信が

    ニュース記事・写真のAI学習利用、NYタイムズが禁止…違反なら「民事罰や刑事罰の対象」
    misshiki
    misshiki 2023/08/16
    “「これまでもAIによる学習は禁止してきた。今回の変更は、これを明確化するものだ」”
  • ニューヨーク・タイムズ AIによる記事などの学習を原則禁止に | NHK

    アメリカの新聞大手、ニューヨーク・タイムズはサービスの利用規約を変更し、AI人工知能に記事や写真などを学習させることを原則禁止しました。AIによる学習は、記事などの著作権侵害にあたる可能性があると指摘されていて、メディア各社の対応が注目されます。 アメリカの新聞大手、ニューヨーク・タイムズは8月3日、サービスの利用規約を変更しました。 この中では、許可を得ずに無断で機械学習AIシステムに記事や写真などを学習させることを原則禁止し、違反した場合には民事や刑事などで責任が問われる可能性があるとしています。 AIの開発企業は、メディア各社の記事などを学習させて情報の精度を高める必要がありますが、AI学習は記事などの著作権侵害にあたる可能性があると指摘されています。 ニューヨーク・タイムズはNHKの取材に対し「これまでもAI学習に記事を利用することを禁じていたが、このことをより明確に示すため規

    ニューヨーク・タイムズ AIによる記事などの学習を原則禁止に | NHK
    misshiki
    misshiki 2023/08/16
    “アメリカの新聞大手、ニューヨーク・タイムズはサービスの利用規約を変更し、AI=人工知能に記事や写真などを学習させることを原則禁止しました。”
  • ChatGPTを征服する: 七里式プロンプト「8+1の公式」を解説|ChatGPT研究所

    はじめにプロンプトは、ChatGPTのような高度なAIを使いこなすためには欠かせない技術となっています。今回は、いま日で一番 ChatGPT を使い倒している経営者兼プロンプトエンジニアの七里さんが考案した七里式プロンプト「8+1の公式」をご紹介させていただきます(※七里さんの許可を得て紹介しています)。これは、最大限の成果を生み出すためのプロンプト制作に役立つ独自の公式で、ビジネスや個人利用において、効果的な応答を生成するための鍵となります。 記事では、その概要から具体的な例と一緒に解説していきます。読者の皆様がより効果的にChatGPTを使いこなすためのガイドとなることを願っております。最後に非常に重要なお知らせもあるのでお見逃しなく。 それでは早速、「8+1の公式」を一つずつ見ていきましょう! 「8+1の公式」ソース:https://twitter.com/shichiri_11

    ChatGPTを征服する: 七里式プロンプト「8+1の公式」を解説|ChatGPT研究所
    misshiki
    misshiki 2023/08/16
    “いま日本で一番 ChatGPT を使い倒している経営者兼プロンプトエンジニアの七里さんが考案した七里式プロンプト「8+1の公式」をご紹介”
  • 【西川和久の不定期コラム】 次世代Stable Diffusion(SDXL)をWindows上で一発で使用可能にする「Fooocus」

    【西川和久の不定期コラム】 次世代Stable Diffusion(SDXL)をWindows上で一発で使用可能にする「Fooocus」
    misshiki
    misshiki 2023/08/16
    “Fooocusは、SDXLをrun.bat一発で使えるようになるWeb UI”
  • 生成AIは今後7年間で4500億ドルの利益を生む可能性、そのための条件は? ABI Researchが予測

    ABI Researchは2023年7月27日(米国時間)、生成AIが今後7年間で、12の異なる業種で4500億ドル以上の利益をもたらすとの予測を発表した。 コンテンツに重きを置く業種では混乱が発生 生成AIはすでに多業種の市場全体で数百の使用事例がある。しかし、ABI Researchによると精度や性能、企業への対応は、使用事例が異なる3つの波がやってくることを意味するという。ABI Researchのシニアアナリストであるリース・ヘイデン氏は「マーケティングや教育のようなコンテンツに重きを置く分野では、導入の第1波で、すでにさまざまな職務で混乱が起きている」と語る。 関連記事 企業に価値をもたらすジェネレーティブAIの4つのユースケース AIのイノベーションは加速しており、さまざまな業界でジェネレーティブAI(生成AI)のユースケースを数多く生み出している。ジェネレーティブAIは、特定

    生成AIは今後7年間で4500億ドルの利益を生む可能性、そのための条件は? ABI Researchが予測
    misshiki
    misshiki 2023/08/16
    “ABI Researchは、生成AIが今後7年間で、12の異なる業種で4500億ドル以上の利益をもたらすとの予測を発表した。”
  • AIカメラではんだ不良を検出、エッジ処理でレイテンシーも低減

    ソニーセミコンダクタソリューションズは「ハノーバーメッセ(Hannover Messe)2023」において、AIカメラを活用したはんだ付け不良の検出デモンストレーションを披露した。 高シェアのスマートフォン向けをはじめイメージセンサー事業を展開するソニーセミコンダクタソリューションズが、事業拡大に向けて注力しているのが産業機器向け分野だ。工場などモノづくりの現場では、イメージセンサーを搭載するカメラを用いた外観検査が広く利用されているが、近年はAI人工知能技術の進化によりAIカメラを用いたより高度な外観検査への取り組みが進んでいる。 そこで同社が、「ハノーバーメッセ(Hannover Messe)2023」(2023年4月17~21日:現地時間、ハノーバー国際見市場)のマイクロソフトのブース内で披露したのが、AIカメラを活用したはんだ付け不良の検出デモンストレーションである。 同社で

    AIカメラではんだ不良を検出、エッジ処理でレイテンシーも低減
    misshiki
    misshiki 2023/08/16
    “AIカメラを活用したはんだ付け不良の検出”
  • リコー、自然言語処理AIでAIモデルをノーコード作成できるツール開発

    リコーは、自然言語処理AI技術によるデータ分析によって、ノーコードで企業独自のAIモデルを作成できるツールを開発し、無償トライアルの提供を開始した。 リコーは2023年7月10日、自然言語処理AI人工知能技術によるデータ分析によって、ノーコードで企業独自のAIモデルを作成できるツールを開発し、無償トライアルの提供を開始した。業務の効率化や新たな価値創造を支援する。 大規模言語モデル(LLM)を業務で活用するには、固有の用語などを学習させて企業独自のAIモデルを作成する必要がある。しかし、AIモデル作成には専門的な知識が必要となり、同時に手間と時間もかかる。 同ツールは、企業特有の用語など分類情報のサンプルを表計算ソフトで作成。それをアップロードするだけで独自のAIを利用できるようにするものだ。 無償トライアルでは、顧客自身で使い勝手やAIモデルの効果などを検証できる。無償トライアルは3

    リコー、自然言語処理AIでAIモデルをノーコード作成できるツール開発
    misshiki
    misshiki 2023/08/16
    “企業特有の用語など分類情報のサンプルを表計算ソフトで作成。それをアップロードするだけで独自のAIを利用できるようにするものだ。”
  • AIの住民が勝手に会話して交流する2D RPGっぽい箱庭シミュレーター「AI Town」

    生成AIの進歩によって、人間が一から文章を書いたり絵を描いたりしなくても、文章や画像を簡単に自動生成することができるようになりました。「AI Town」はAIによってさまざまな性格を持った住民が勝手に動いて自動で会話したりコミュニケーションを取ったりする2D RPGっぽい見た目の箱庭シミュレーターで、オープンソースで開発されています。 AI Town https://www.convex.dev/ai-town GitHub - a16z-infra/ai-town: A deployable starter kit for building and customizing your own version of AI town - a virtual town where AI characters live, chat and socialize. https://github.com

    AIの住民が勝手に会話して交流する2D RPGっぽい箱庭シミュレーター「AI Town」
  • Amazonが「大量のカスタマーレビューをAIが要約してまとめる機能」を導入することを発表

    大手通販サイトのAmazon2023年6月頃からテストを行っていることが報じられていた「ユーザーが書いたレビューの文章をAIが要約してまとめる機能」が、2023年8月14日、アメリカの一部のユーザーを対象に正式サービスを開始しました。 Amazon improves the customer reviews experience with AI https://www.aboutamazon.com/news/amazon-ai/amazon-improves-customer-reviews-with-generative-ai Amazon adds AI-generated review summaries so you don’t have to read the comments - The Verge https://www.theverge.com/2023/8/14/23

    Amazonが「大量のカスタマーレビューをAIが要約してまとめる機能」を導入することを発表
    misshiki
    misshiki 2023/08/16
    “「ユーザーが書いたレビューの文章をAIが要約してまとめる機能」が、2023年8月14日、アメリカの一部のユーザーを対象に正式サービスを開始”