[B! study] ko-ya-maのブックマーク

本当にわかりやすいAI入門

2023年12月7日に開催されたStudyCoの勉強会で、AIについてお話した際の資料です。スライドではお伝えしきれない部分もあるので、同じ内容を記事にしてます。こちらもぜひ！ https://qiita.com/segavvy/it ems/9e7e4ab4b253599ac58a 動画（ス…

ko-ya-ma 2023/12/08

リンク

[翻訳]AI生成コンテンツの総合調査：GANからChatGPTまでのGenerative AIの歴史｜株式会社ガラパゴス

原文の総文字数15万字超え！生成AI研究の歴史をまとめた論文をChatGPTを使って翻訳しました。ところどころ日本語がおかしいところもありますが、15万もの文字翻訳するのめんどくさい！という方、参考程度にご覧ください。ポイントだけ読み進めるとサクッと把握できます。こちらの翻訳です本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。脚注、参考文献、Appendixなどは本文をご覧ください。概要【POINT1】ChatGPTはAIGCのカテゴリに属し、効率的で高品質なコンテンツ作成をします。【POINT2】大規模モデルの利用で、意図抽出や生成結果が向上し、現実に近いコンテンツが生まれます。【POINT3】この調査では、生成モデルの進歩や未解決の問題・将来の課題について解説しています。最近、ChatGPT は、DALL-E-2 [1]や

ko-ya-ma 2023/04/08

リンク

AI（LLM）についてまだみんなが知らない8つの事実（論文：Eight Things to Know about Large Language Modelsについて）

いかにも海外の煽り記事みたいなタイトルを付けてしまったが、おおむねそういう感じの内容の論文が発表されて、興味深かったので今回はそれについて書いてみたい。最近、「AGIが人類を滅亡させる！」みたいなAI人類滅亡説がにわかに広がっているらしい。これの言い出しっぺみたいな人は、ユドコウスキー氏という方らしいが、彼は何十年も前からAI脅威論を言っていたらしい。そういう人もいるとは思うが、最近はそれを真に受けちゃう人が増えてるらしい。ChatGPTの実力に驚いた人が増えたからだろうか。ホワイトハウスでFox Newsの記者が「AIが人類を滅亡させるってホントですか？」と質問しちゃうというような、パニック映画さながらの出来事まで起きている。これはエイプリルフールではない。ホワイトハウスでFox Newsの記者が「機械知能研究所の専門家がAI開発を無期限に停止しないと文字通り地球上のすべての人間

ko-ya-ma 2023/04/07

リンク

GPTの仕組みと限界についての考察（2.1） - conceptualization

全３回のシリーズパート２の本記事では、GPTの能力と可能性をAttention/Transf ormerの仕組みをふまえて考察します。というつもりでしたが、凄く長くなってしまったのでパート2は以下の3回に分けようと思います。（2.1）各技術の定性的な説明（本記事）（2.2）Transf ormerのアルゴリズム詳細（2.3）GPTの能力と可能性について 2.1 各技術の定性的な説明自然言語の構造を考えてみるまず我々が使う言語についてちょっと振り返るところから話を始めましょう。文や文章は、おおもとのデータである文字から始まって、単語、文節、句、節、文、文章、さらにその上の意味、という風に階層的な構造を持っていると我々は概念的に認識してますよね。構文の階層そして、各階層や階層間には、文法や語法といった言葉のルールがあります。深層学習はその名の通り、層を深くしたニューラルネットワ

ko-ya-ma 2023/03/28

リンク

認知心理学の観点からみたGPT3の振る舞いとロボット技術・Labratory Automation - 電通総研テックブログ

XI本部　オープンイノベーションラボの飯田です。最近、ChatGPTをはじめとした生成AIが注目されています。その中で、Gigazineのニュースで以下の話を目にしました。 gigazine.net 上記の記事に感化され、心理学でChatGPTのようなものが、どのように扱われているのかを調べています（私は大学で心理学専攻だったこともあり）。その中で、心理学系論文のプレプリントが掲載されている PsyArXivで、GPT-3の振る舞いを認知心理学の観点で分析した論文を見つけました。生成系の振る舞いを理解する上でも参考になりそうだし、ISIDでも取り組んでいるロボット技術やLabratory Automationとの接合点を見つけた気がしましたので、ISIDでの取り組みを紹介しつつ、妄想したいと思います。 Binz, M., & Schulz, E. (2022, June 21). U

ko-ya-ma 2023/03/12

リンク

GPTが出した回答の確からしさを見えるようにしてみる - Taste of Tech Topics

皆さんこんにちは。データサイエンティストチームYAMALEXのSsk1029Takashiです。 YAMALEXは Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。この記事はGPTでチャットボットを作ってみるシリーズ第3弾です。第1弾と第2弾もぜひご覧ください。 acro-engineer.hatena blog.com acro-engineer.hatena blog.com 第1弾では、GPTになるべく正確な回答をさせるために、回答の情報を持つ文書を検索し、それをもとに回答を生成するという内容を試しました。文書をもとに回答を生成することで比較的正確な回答を取得することができました。ただし、この回答も必ずしも正確な回答とは限らないので、どれくらい信頼していいのかを自動で判定する仕組みが欲しくなります。今回は第1弾のシ

ko-ya-ma 2023/03/10

リンク

テスラに迫る!? 中国の自動運転をリードするBaidu/ApolloのAI戦略

こんにちは。Turingの機械学習チームでエンジニアをしている塩塚です。 Turingは「We Overtake Tesla」を合言葉に、完全自動運転EVの開発・販売を目指しているスタートアップです。TuringではAIの強力さとそのさらなる成長を信じ、AIベースの自動運転システムを開発しています。 AIベースで自動運転を開発している会社はいくつかありますが、例えば米国の電気自動車メーカーTeslaはその代表的な会社の一つです。Teslaはカメラを主たるセンサーとして採用し、AIによって走行経路などを決定しています。詳しい内容は、Tesla AI Day 2021というイベントの内容を弊社のエンジニアがまとめているのでぜひ見てみてください。一方、私たちはTeslaだけでなく、Apolloという中国企業にも大きく注目しています。 Apolloは、中国の巨大IT企業Baidu傘下の会社で、自

ko-ya-ma 2023/02/22

リンク

画像生成AIの著作権問題について海外や日本ではどのように解釈されているのか？

Stable DiffusionやMidjourney、DALL・Eなどの画像生成AIは膨大な写真やイラストで構成されたデータセットで学習することで、画像を自動生成することが可能になっています。しかし、このデータセットに含まれる画像の著作権についての議論が、AI 技術の進歩に追い付いていないのが現状です。そんな画像生成AIの著作権問題について、IT系ニュースサイトのThe Vergeがまとめています。 The scary truth about AI copyright is nobody knows what will happen next - The Verge https://www.theverge.com/23444685/generative-ai-copyright-infringement-legal-fair-use-training-data Q：AIモデルが作成したも

ko-ya-ma 2022/12/04

リンク

数学カフェ確率・統計・機械学習回「速習確率・統計」

The document describes various probability distributions that can arise from combining Bernoulli random variables. It shows how a binomial distribution emerges from summing Bernoulli random variables, and how Poisson, normal, chi-squared, exponential, gamma, and inverse gamma distributions can approximate the binomial as the number of Bernoulli trials increases. Code examples in R are provided to

ko-ya-ma 2022/03/12

リンク

はじめに — マンガと学ぶデータビジュアライゼーション

はじめに# データビジュアライゼーションとは，数値や文章などのデータに基づいた情報を，人間が理解しやすい形に視覚化する技術を指します．このサイトは，文化庁のメディア芸術データベース・ラボ（MADB Lab）で公開されている四大少年誌（週刊少年サンデー，週刊少年ジャンプ，週刊少年チャンピオン，週刊少年マガジン）のデータを用いて，データビジュアライゼーションの学習を手助けすることを目指しています．データビジュアライゼーション（に限らずデータ分析全般）の学習において重要なのは，分析対象のデータに興味を持てるかどうかです．本書では約47年の四大少年誌のマンガ作品データを採用しているため，モチベーションを保ちつつ学習を進めることが可能です．

ko-ya-ma 2022/02/14

リンク

GitHub - roottusk/vapi: vAPI is Vulnerable Adversely Programmed Interface which is Self-Hostable API that mimics OWASP API Top 10 scenarios through Exercises.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

ko-ya-ma 2022/01/26

“Vulnerable Adversely Programmed Interface which is Self-Hostable API that mimics OWASP API Top 10 scenarios”

リンク

統計・機械学習の理論を学ぶ手順 - Qiita

社内向けに公開している記事「統計・機械学習の理論を学ぶ手順」の一部を公開します。中学数学がわからない状態からスタートして理論に触れるにはどう進めばいいのかを簡潔に書きました。僕が一緒に仕事をしやすい人を作るためのものなので、異論は多くあると思いますがあくまでも一例ですし、社員に強制するものではありません。あと項目の順番は説明のため便宜上こうなっているだけで、必ずしも上から下へ進めというわけでもありません。（追記）これもあるといいのではないかというお声のあった書籍をいくつか追加しました。数学残念ながら、統計モデルを正しく用いようと思うと数学を避けることはできません。ニューラルネットワークのような表現力が高くて色々と勝手にやってくれるような統計モデルでも、何も知らずに使うのは危険です。必ず数学は学んでおきましょう。理想を言えば微分トポロジーや関数解析のような高度な理論を知っておくのがベス

ko-ya-ma 2022/01/26

リンク

Kubernetesをゲーム感覚で腕試しできるサイト「Game of PODs」で遊ばないと年を越せない・2021冬

この記事はFixer Advent Calendar 9日目の記事です。はじめに最近CKADの受験して一旗上げようと画策しているなむゆです。 Kubernetesについて学ぶ中で、腕試しに使えそうな面白そうなサイトを見つけたので紹介してみようという回です。 Game of PODsとは Game of PODsとは、無料で遊べるKubernetesの問題集です。 Kubernetesクラスターにアプリケーションを展開したり、クラスターで起きている問題を解決することを通してそれらの方法を学ぶことができます。この問題集はKodeKloudというサービスに提供されている教材のひとつで、KataKodaという教材用環境サービス内でホストされている仮想環境にアクセスしてハンズオン形式で課題を解くことができることが特徴です。問題の内容としては、あるアーキテクチャが与えられて、「このアプリケーシ

ko-ya-ma 2021/12/24

リンク

Goを学ぶときに参照した学習リソースまとめ

皆さん、新しいプログラミング言語を学ぶ時、どのように学習しているでしょうか？私は4月に新卒でエンジニアになり、業務でGoを使うことになりました。その際、とりあえず公式チュートリアルであるTour of Goをやりましたが、その後にどうやって学習を進めれば良いか迷ってしまいました。考えてみると、新しい言語を学ぶ際、毎回学習方法に困っている気がします。ネットでサンプルを探す、動画を見る、書籍を読む、などさまざまな学習方法があると思いますが、私は手を動かしながらいろいろなパターンを学んでいくのが好きです。そこで今回Goを学ぶ際も、手を動かしてさまざまなコーディングのパターンを学習するために、ネットや書籍でサンプルを探して実践しました。この学習方法は私にとっては楽しみながら続けることができて、他の言語を学ぶ際も今回実装したサンプルを使って学習しようと考えています！そこで自分と同じ様な悩み

ko-ya-ma 2021/12/21

リンク

非エンジニアのSQL学習ことはじめ〜1日1時間・3か月でSQLがそこそこできるようになる勉強方法とおすすめ書籍〜

これは何「来年こそはSQL書けるようになるぞ」と思ってる方に向けた、1日1時間・3か月でSQLそこそこできるようになる学習方法について書いた記事です長文がつらつら書いてある本稿ですが、要するに言いたいことは

ko-ya-ma 2021/11/12

リンク

書籍を使った勉強のしかた - 覚書

わたしがこれまでに書籍でなにか新しいことを学ぼうと思ったときにどういう手段で目的を達成してきたかについて書きます。生業にしているIT系のこともそうですが、それ以外も同じ方法を使っています。はじめに書いておくと、これまでの自分自身の体験や優秀な人の観察などから、学習の原則コツコツと反復練習を続けることであり、近道は無いと思っています。原則を守るための典型的な方法の一つが「網羅的に書かれた決定版と呼ばれる本を何度も精読する」です。これができる人はこうしたほうがいいと思いますし、ここから先を読む必要はないです。しかしながら、わたしはこの方法がうまくいったためしがないので、自分なりに工夫して、金銭的コストがやや高いながらそこそこうまくいく方法にたどり着きました。本記事ではこの方法を紹介します。わたしは何かを理解しようとするときには、まずは初心者向きのページ数が少なくて読みやすそうな本をたくさん

ko-ya-ma 2021/11/04

リンク

企画書の書き方 | アクティブ１０　プロのプロセス | NHK for School

ここは、とある学校。やたらとカタカナ言葉を使いたがるオサダと、アナログ人間のマツオが、情報社会を生き抜く技をプロから教えてもらうお話です。「おはよーう！」。マツオが教室にやってきました。「わっ、どうしたマツオ？」とオサダはびっくり。髪はボサボサ、顔はきずだらけ、肩には鳥のふんが…。「カラスに襲われたんだよ」とマツオ。「最近、町じゅうのゴミが増えたのが原因で、カラスが集まってきてるらしいからな」とオサダ。すると、「オサダくん、僕ね、この町をきれいにするために、“おそうじフェス”っていうのを考えたんだ」とマツオが言います。「町の人にも協力してもらって、チームでゴミ拾い競争するんだ。で、いちばん多くゴミを拾えたチームが、商店街の割引券がもらえるっていう企画も考えたんだよ」。「素晴らしいじゃないか、マツオ。こういうときはちゃんと企画書を書いて町の人に読んでもらうのが効果的だ」。そう、今日のテー

ko-ya-ma 2021/11/02

リンク

SQL Training 2021

Transcript SQL 株式会社 AI Shift 三宅悠太 1. データベース 2. SQL I 3.トランザクション 4. データベース設計 5. インデックス 6. 実行計画 7. SQL II データベースデータベースとは “A database is an organized collection of inter-related data that models some aspect of the real-world “ (CMU) データベースとは、実世界のある側面をモデル化した、秩序だった、相互に関連したデータの集まり DBMS • データベース管理システム（DBMS）は、データベースを管理するソフトウェア ◦ 例：MySQL, Oracle Database, SQLite, Mongo DB • DBMSの目的は、アプリケーションが簡単にデータベースにデー

ko-ya-ma 2021/06/22

リンク

Interpretable Machine Learning

Interpretable Machine Learning A Guide for Making Black Box Models Explainable. Christoph Molnar 2021-05-31 要約機械学習は、製品や処理、研究を改善するための大きな可能性を秘めています。しかし、コンピュータは通常、予測の説明をしません。これが機械学習を採用する障壁となっています。本書は、機械学習モデルや、その判断を解釈可能なものにすることについて書かれています。解釈可能性とは何かを説明した後、決定木、決定規則、線形回帰などの単純で解釈可能なモデルについて学びます。その後の章では、特徴量の重要度 (feature importance)やALE(accumulated local effects)や、個々の予測を説明するLIMEやシャープレイ値のようなモデルに非依存な手法(mo