misshikiのブックマーク / 2023年4月7日

MLOps is Mostly Data Engineering.

MLOps is Mostly Data Engineering Introduction MLOps is a relatively recent term. A quick search on Google Trends reveals that the term started being searched for, around the end of 2019. Upon examining the trend line above, we can observe a significant spike that occurred at the end of 2021. Since then, the interest has rem ained high. ML is not something new though, if we check Google Trends for t

misshiki 2023/04/07

“数年後、誇大広告が消えた後、MLOps はほとんどの人が信じていたよりもデータエンジニアリングと重複していることが明らかになりました。その理由と MLOps エコシステムにとっての意味を見てみましょう。”

MLOps

リンク

クラスメソッドデータアナリティクス通信(AWSデータ分析編) – 2023年4月号 | DevelopersIO

データアナリティクス事業本部のコンサルティングチームの石川です。コンサルティングチームメンバーを中心に、日々AWSのアナリティクス関連サービスのアップデートを追っています。今回は、re:Invent2022 で発表された、Amazon DataZoneのパブリックプレビューの開始、Amazon Clean RoomsのGA（Generally Available）、その他にも多くのアップデートが発表されました！ Amazon DataZone (Preview) パプリックプレビュー開始 2023/03/29 AWSがAmazon DataZone (プレビュー) を発表 Amazon Data Zoneとは、お客様が AWS、オンプレミス、およびサードパーティのソースに保存されているデータのカタログ化、発見、共有、および管理をより迅速かつ簡単にする新しいデータ管理サービスです。Amaz

misshiki 2023/04/07

AWS

リンク

Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する！ - Qiita

こんにちは！逆瀬川 ( @gyakuse ) です！今日は最近作った議事録文字起こしアプリに話者分離機能をくっつけたものを作っていきたいと思います。 ChatGPT APIの使い方、Whisper APIの使い方、Hugging Face Spacesへのデプロイ方法等を知りたい場合は以下の記事をぜひ！できたもの openai_keyにOpenAIのAPIキーを入れるメイン音声ファイルに会話音声 (wav, 25MB以内) を入れる話者 (1) 参考音声ファイルに話者 (1) の参考音声 (wav) を入れる話者 (1) の名前を入れる話者 (2) 参考音声ファイルに話者 (1) の参考音声 (wav) を入れる話者 (2) の名前を入れる上記を行って送信ボタンを押すと処理が開始されます。なお、参考音声は10秒程度で大丈夫です。実装全体は以下で確認できます。話者分離 (S

misshiki 2023/04/07

“議事録文字起こしに話者を自動アサインする方法をまとめ”

リンク

NVIDIAが目指す「AIの工場」、スパコン誰でも利用可能に

米NVIDIA（エヌビディア）が新しいAI（人工知能）を次々と生み出す「AIの工場」になろうとしている。強力なハードウエアやソフトウエアを基軸に据えつつクラウドサービスを強化することで、生成AIや巨大言語モデル（LLM）といった最先端AIの構築環境をユーザーに提供する。「WebブラウザーからAIスーパーコンピューター（スパコン）に誰でもアクセスできる」。そんなうたい文句でエヌビディアが開始したのは、クラウドサービスの「DGX Cloud」だ。2023年3月に開催した自社イベント「GTC 2023」で大々的に発表した。その名の通り、エヌビディアのAIスパコン「DGX」を利用できるサービスである。 AIの構築や学習などに向けたソフトウエア群もクラウド経由で用意した。これにより、ユーザーは自前でスパコンやソフトウエアなどを用意せずとも、AIの構築や学習に取り組める。

misshiki 2023/04/07

“ 「WebブラウザーからAIスーパーコンピューター（スパコン）に誰でもアクセスできる」。そんなうたい文句でエヌビディアが開始したのは、クラウドサービスの「DGX Cloud」”

NVIDIA

リンク

ChatGPTなどのチャットAIがどんな風に文章をトークンとして認識しているのかが一目で分かる「Tokenizer」

OpenAIが開発したChatGPTをはじめ、さまざまなAIが人間レベルの会話を行ってくれるようになりました。AIは文章を読み書きするとき「トークン」という単位で認識を行うのですが、普通の文章がトークン的にはどのように分解されるのかを一目で教えてくれるツール「Tokenizer」がOpenAIのページ上で公開されています。 OpenAI API https://platform.openai.com/tokenizer Tokenizerの画面はこんな感じ。テキストを入力する必要がありますが、いったん「Show example」をクリックして例を見てみます。英語の場合、252文字の文章で64トークンとなる模様。下部にて文字がトークンのまとまりごとに色分けして表示されています。「TOKEN IDS」をクリックするとそれぞれの数値も確認できます。人間が見てもなにがなんだか分かりませんが、G

misshiki 2023/04/07

“普通の文章がトークン的にはどのように分解されるのかを一目で教えてくれるツール「Tokenizer」がOpenAIのページ上で公開されています。”

リンク

「AI多すぎ、何使えばいいか分からない……」を解決するAI「HuggingGPT」　文章入力だけで、適切な機械学習モデルを自動選択

Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: ＠shiropen2 中国の浙江大学とMicrosoft Research Asiaに所属する研究者らが発表した論文「HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in HuggingFace」は、大規模言語モデル（LLM）と多数の機械学習モデルを連携し、ユーザーがテキストを入力するだけで、その内容を解決するための適切な機械学習を選んでくれるシステムを提案した研究報告である。今回はChatGPTと、LLMの機械学習モデルやデータセットなどが共有されているプラットフォーム「Hugging Face」（詳細

misshiki 2023/04/07

“「ChatGPT」を活用し、機械学習コミュニティー（Hugging Face）内のさまざまな機械学習モデルを連携させてAIタスクを解決するシステム「HuggingGPT」”

人工知能

リンク

AI生成アートとオンライン画像市場：「AIトレーニングに使わせない権利」がクリエイターの仕事を奪うワケ | p2ptk[.]org

AI生成アートとオンライン画像市場：「AIトレーニングに使わせない権利」がクリエイターの仕事を奪うワケ投稿者: heatwave_p2p 投稿日: 2023/4/72023/4/7 Electronic Frontier Foundation コンピュータで生成された画像が、奇妙なアイデアとインターネット接続があれば誰にでもアクセスできるようになった今、「AIアート」による創造は疑問――と訴訟――を提起している。ここでのポイントは、1）AIは実際にどのように機能するのか、2）どのような仕事を代替するのか、3）この変化を通じてアーティストの労働はどのように尊重されるのか、だ。 AIをめぐる訴訟は、その大部分が著作権に関係している。この著作権の問題は非常に複雑であるため、著作権に関連する考察は別稿に譲り（邦訳）、ここでは法律以外の、より深刻な問題に焦点を当てたい。 AIアートジェネレータの仕組

misshiki 2023/04/07

“自動翻訳技術がもたらした最大のインパクトは、翻訳者の仕事を奪ったことではなく、多言語のツイートやウェブページを気軽に閲覧する自由で簡単な方法を生み出したこと”書籍の翻訳がAI翻訳ではやっぱり嫌だもの

人工知能

リンク

医師免許試験に合格できるAI「ChatGPT」は緊急救命室に運び込まれた患者を的確に診察できるのか？

OpenAIが開発した対話型AI「ChatGPT」はさまざまな質問に対して非常に高い精度で回答することができ、アメリカの医師免許試験であるUnited States Medical Licensing Exam(USMLE)で合格圏内に収まる成績をたたき出したことも知られています。そんなChatGPTが本当に臨床現場において利用可能かどうかを調べるため、救急科に勤務する医師のJosh Tamayo-Sarver氏が、「実際に緊急救命室に運び込まれた患者についてのデータをChatGPTに入力し、的確な診察を下せるかどうか」を調べる実験を行いました。 ChatGPT in the emergency room? The AI software doesn't stack up https://www.fastcompany.com/90863983/chatgpt-medical-diagno

misshiki 2023/04/07

“「...少なくとも私が正しいと思える診断が含まれていたのは、患者の約半数...、緊急外来での成功率が50％というのはあまり良いとは言えません」と述べ、臨床現場で使用するには精度が十分ではないと指摘”

人工知能

リンク

Generative AI(ChatGPT)と対話する、社内用生産性向上ツールを開発し、業務利用リスクを解決した話｜sys1yagi

こんにちは、Ubie(ユビー)株式会社のUbie Discoveryという組織で、ソフトウェアエンジニアとして働いている八木(@sys1yagi)です。 ChatGPTが賑わっていますね。正確にはGPT-3.5やGPT-4といった大規模言語モデルのブレークスルーが賑わっているわけですが、一般的にはChatGPTを通して大規模言語モデルに触れるというケースがほとんどだと思います。 ChatGPTの業務利用のリスクChatGPTを使った業務効率化のアイデアなどが散見されますが、ChatGPTの場合、Open AI社によって入力内容を学習等に利用される場合があります。基本的に会社で契約を結んでいないWebサービス等に対して、業務に関連するデータを入力するべきではないわけですが、便利さのあまりについつい入力してしまうケースもあるかもしれません。各社においては法務等と連携して利用に関する注意喚起等

misshiki 2023/04/07

“ChatGPTの業務利用のリスクへの対策から始まったツール開発でしたが、意外と色んなことに使えそうだなということで、様々な機能拡張を行い、社内で広く使うことになりました。”

リンク

ChatGPTに「贈収賄で服役した」と嘘プロフ流された市長、OpenAIに訴訟準備 | テクノエッジ TechnoEdge

ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他オーストラリア南部、メルボルンの北東に位置するヘップバーンシャーの市長、ブライアン・フッド氏が、OpenAIを名誉毀損で訴えるための準備をしています。もし訴訟になれば、ジェネレーティブAIが出力するコンテンツの不正確性をめぐる世界初の事例になるかもしれません。フッド氏の弁護人によると、ChatGPT 3.5にフッド氏に関する情報を問い合わせると「1999～2005年にマレーシア、インドネシア、ベトナムの政府関係者に賄賂を送ったことで告発された」、「2012年には会社法上の虚偽会計で2件の罪を認めて懲役30ヶ月を言い渡された」、「マレーシア政府との契約を取り付けるために仲介役としてマレーシアの武器商人に金銭の

misshiki 2023/04/07

“フッド氏は3月下旬に、自身が収賄その他で有罪になり、服役歴もあるとの虚偽情報を広めたのはChatGPTだとしてOpenAIを提訴する方針を明らかに”

リンク

「ChatGPT」など学校現場での取り扱い示す資料作成へ文科省 | NHK

AI＝人工知能との対話ソフト「ChatGPT」などについて、学習にもさまざまな影響が及ぶとみられることから、文部科学省が学校現場での取り扱いを示す資料を作成する方針であることが分かりました。アメリカのベンチャー企業「オープンAI」が開発したChatGPTは、去年11月に無料公開が始まって以降、急速に活用が広がっています。 AIに質問するだけで自然で説得力のある回答が返ってくるため、読書感想文やリポートなども簡単に作成できてしまい、学習への影響を懸念する声もあります。一方、学習にうまく生かすべきだという意見もあるため、文部科学省がChatGPTをはじめとするAIを使った同種のソフトについて、学校現場での取り扱いを示す資料を作成する方針であることが分かりました。文部科学省では今後、国内外の事例を集め、専門家の意見も聞いたうえで、なるべく早く示したいとしています。松野官房長官「AIに関す

misshiki 2023/04/07

“文部科学省がChatGPTをはじめとするAIを使った同種のソフトについて、学校現場での取り扱いを示す資料を作成する方針”

リンク

「チャットＧＰＴ」運営元、年齢確認の導入検討…回答のＡＩ精度も向上

【読売新聞】　【ニューヨーク＝小林泰裕】人工知能（ＡＩ）による対話型サービス「チャットＧＰＴ」を巡り、運営元の米新興企業「オープンＡＩ」は５日、個人情報の流出防止や未成年者の保護などに関する安全対策を公表した。ただ、チャットＧＰＴに

misshiki 2023/04/07

“未成年者が有害な情報に触れることのないよう、利用の際に年齢を確認する仕組みの導入に向けて検討することも明らかに”

リンク

OpenAI、AIを安全に使用するための取り組みを発表

OpenAIは4月5日（現地時間）、「Our approach to AI safety（わたしたちのAI安全対策）」と題したドキュメントを発表した。AI開発が急速に進むことに懸念を示す世論に対する返答と考えられる。 OpenAIの「安全なAI」開発に向けた取り組み 3月29日、非営利組織Future of Life Institute（FLI）が「GPT-4」より強力なAIシステムのトレーニングを6ヵ月間停止するよう提案する公開書簡を発表、31日にはイタリアのデータ保護当局が、OpenAIによる同国ユーザーのデータ処理に一時的な制限を課す命令を出すなどここ数日、急速なAI開発に対し見直しを求める事案が続いている。今回のドキュメントには「OpenAIは、強力なAIを安全に、そして広く有益に保つことを約束します」と改めて宣言したうえで、OpenAIが「安全なAI」に向けこれまで取り組んでき

misshiki 2023/04/07

“GPT-4はGPT-3.5と比較して事実に基づいたコンテンツを生成する可能性が40％高くなった。ハルシネーションの可能性はまだ残っており、「AIツールの現在の限界について一般の人々を教育する」必要があることを認識”

リンク

GPT-4やChatGPTを開発するOpenAIが「AIの安全性に対するアプローチ」を発表

絵や文章などのコンテンツを自動生成するジェネレーティブAIは日進月歩で進化を続けていますが、AIに対して法的な規制を設けるべきという声も挙がっています。そんな中で、大規模言語モデルのGPT-4や対話型AIのChatGPTを開発するAI開発団体・OpenAIが「AIの安全性に対するアプローチ」を公開しました。 Our approach to AI safety https://openai.com/blog/our-approach-to-ai-safety ◆より安全なAIシステムの構築 OpenAIは「新しいシステムをリリースする前に厳密なテストを実施し、外部の専門家にフィードバックを求め、人間のフィードバックによる強化学習などの手法を使用してモデルの動作を改善し、広範な安全および監視システムを構築します」と述べています。たとえば、GPT-4のトレーニングが終了して一般公開する前に、Op

misshiki 2023/04/07

“新システムをリリースする前に厳密なテストを実施し、外部専門家にフィードバックを求め、人間のフィードバックによる強化学習などの手法を使用してモデルの動作を改善し、広範な安全および監視システムを構築”

リンク

OpenAI、対話AI「ChatGPT」の安全策公表　欧米の批判受け - 日本経済新聞

【シリコンバレー=渡辺直樹】人工知能（AI）開発の米オープンAIは5日、高度な言語能力を持つAIの安全面での施策を公表した。外部の専門家や利用者の声を交え、動作監視して改善するほか、AIの訓練に使うデータから個人情報をできる限り削除することなどを掲げた。プライバシー侵害をめぐり欧米で批判や懸念の声が強まっていることに対応した。人と自然な会話ができるサービス「ChatGPT（チャットGPT）」と

misshiki 2023/04/07

“オープンAIは可能な場合は、AIを訓練するデータから個人情報を削除する。外部から個人情報の削除の要請があった場合にも応じることでプライバシー侵害を最小限にするとしている。”

リンク

AIの“新しい波”は興奮と不安を生み出している　MozillaがAIの透明性を確保するためのスタートアップを設立

AIの“新しい波”は興奮と不安を生み出している　MozillaがAIの透明性を確保するためのスタートアップを設立：「信頼できるAI」への投資 Mozillaは2023年3月22日（米国時間）、AI（人工知能）に特化したスタートアップ「Mozilla.ai」の設立を発表した。直近では「安全性と透明性の高いジェネレーティブAI」と「誤った情報を与えないレコメンドシステム」の開発を進めるという。

misshiki 2023/04/07

“Mozilla.aiを「志を同じくする創業者、開発者、科学者、プロダクトマネジャー、ビルダーが集うスペースにしたい」としている。”

人工知能

リンク

noteに投稿された「AI」記事が6.7倍に　「機械学習」は22.4倍　ChatGPTブームで

noteは4月7日に公開した「クリエイターエコノミー動向2023」で、ChatGPTの流行により、コンテンツ投稿サイト「note」におけるAI関連ハッシュタグのついた投稿が急増したと明らかにした。この1年間で、ハッシュタグ「AI」が付けられた投稿は10万5717件（前年比6.7倍）、「人工知能」が付けられた投稿は8万9596件（同16.0倍）、「機械学習」が付けられた投稿は7万4151件（同22.4倍）だった。関連記事 note、待望のエクスポート機能をリリース　インポートも可能に noteが、待望のエクスポート・インポート機能の提供を開始した。3月6日より順次提供としており、14日までに全てのユーザーで利用できるようになるという。 noteの執筆サポートAIを使ってみた……日本語が怪しいかも？　“上手な質問”がクオリティーアップのカギ noteが一部ユーザー向けに公開した執筆支援AI

misshiki 2023/04/07

「えっ」と思って「機械学習」タグを調べたら https://note.com/hashtag/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92?f=hot ChatGPTとStable Diffusionの記事ばかりだった。純粋な「機械学習」の記事は増えている感じはない。

人工知能

リンク

はてなブックマーク

タグ

2023年4月7日のブックマーク (17件)

MLOps is Mostly Data Engineering.

クラスメソッドデータアナリティクス通信(AWSデータ分析編) – 2023年4月号 | DevelopersIO

Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する！ - Qiita

NVIDIAが目指す「AIの工場」、スパコン誰でも利用可能に

ChatGPTなどのチャットAIがどんな風に文章をトークンとして認識しているのかが一目で分かる「Tokenizer」

「AI多すぎ、何使えばいいか分からない……」を解決するAI「HuggingGPT」　文章入力だけで、適切な機械学習モデルを自動選択

AI生成アートとオンライン画像市場：「AIトレーニングに使わせない権利」がクリエイターの仕事を奪うワケ | p2ptk[.]org

医師免許試験に合格できるAI「ChatGPT」は緊急救命室に運び込まれた患者を的確に診察できるのか？

Generative AI(ChatGPT)と対話する、社内用生産性向上ツールを開発し、業務利用リスクを解決した話｜sys1yagi

ChatGPTに「贈収賄で服役した」と嘘プロフ流された市長、OpenAIに訴訟準備 | テクノエッジ TechnoEdge

「ChatGPT」など学校現場での取り扱い示す資料作成へ文科省 | NHK

「チャットＧＰＴ」運営元、年齢確認の導入検討…回答のＡＩ精度も向上

OpenAI、AIを安全に使用するための取り組みを発表

GPT-4やChatGPTを開発するOpenAIが「AIの安全性に対するアプローチ」を発表

OpenAI、対話AI「ChatGPT」の安全策公表　欧米の批判受け - 日本経済新聞

AIの“新しい波”は興奮と不安を生み出している　MozillaがAIの透明性を確保するためのスタートアップを設立

noteに投稿された「AI」記事が6.7倍に　「機械学習」は22.4倍　ChatGPTブームで

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス