最近作った Slack Bot が好評だったのでまとめてみました! どこの Slack ワークスペースでも導入できるように詳細に設定方法も記載しています。 🛠 作ったもの tell-me-bot(社内では tell-me-paccho)という、社内用語辞典をいい感じに管理してくれる Slack Bot を作りました。 社内ではもともと Spreadsheet で社内用語を管理していたのですが、メンテナンスする人が限られ、あまり積極的には利用されていない状況でした。 そんな時に@しかじろうさんのこちらの記事を発見して、これはおもしろいアイデアだと思い、Firebase + Bolt(TypeScript)にて作ってみました(アイデアをくれた@しかじろうさんに感謝🙏)。元記事の機能を参考に+αの機能も色々実装しています。 構成 Cloud Functions for Firebase で
尾崎さんは、開発の経緯をこう語ってくれました。「元々は、Gateboxさんの『AIバイト』のタブレット版を開発する予定だったんです。でも、これなんか面白くないねえと話しているときに、武地さんの『商品紹介ではなく、AIと一緒にお酒を飲むようなものにしたい』という一言で、プロジェクトの方向性が大きく変わりました」。 AI幹事が可能になった背景には、技術的なことを含め、いくつかの要因がありました。整理すると、以下のようなことです。 画像認識:GPT-4oの登場でマルチモーダル技術が使えるようになり、リアルタイムでテーブルの状況を把握することが可能になっていた 会話の生成:AIが認識したものをベースとして、自然な対話が可能になった コロナ禍の影響:パンデミックを経て、飲食店のDXが急速に進み、テーブルの上にタブレットがあることへの抵抗感が減った 尾崎さんは「AIがあたかも自発的にアドバイスをすると
高精度な言語翻訳サービス「DeepL」。 これまではWebサイトや、デスクトップ用のネイティブアプリ経由で使用する方法が主流でしたが、今後はChrome用の公式拡張機能「DeepL翻訳」にも注目した方が良いかもしれません。 現在ベータ版ですが昨年末から便利すぎると話題になっています。 DeepL翻訳拡張機能の使用方法 ChromeでChromeウェブストアの「DeepL翻訳」ページにアクセスし、拡張機能をインストールします。 ▲Webサイトの情報を日本語に翻訳したい場合、Chromeでそのサイトを表示し、翻訳したい部分のテキストを選択します。表示されたDeepLのアイコンをクリックすると、その近くに翻訳結果がポップアップ表示されます(トップ画像)。 また、自分の入力した情報を他の言語に翻訳することもできます。 ▲拡張機能が有効な場合、TwitterやGmailの入力欄にDeepLのアイコン
はじめに Python だけでクロスプラットフォームなアプリを作ることが出来る、Flet というフレームワークについての記事です。 Pythonだけで次のようなWeb・デスクトップに両対応したアプリを作ることが出来ます。 Flet の概要 Flet は Flutter をベースにしています。主に以下のような特徴があります。 From idea to app in minutes 「素早くGUIアプリを作成出来る」ことが、Fletの主なセールスポイントのようです。 Simple Architecture JSフロントエンドやRestAPIを書くこと無く、PythonだけでSPAを作る事が出来ます。 Batteries included Batteries Included は、Pythonの設計思想のようです。電池が付属している、つまりそのままでもすぐに動かせることを指します。 Powere
米Metaは7月18日(現地時間)、大規模言語モデル「Llama 2」を発表した。利用は無料で商用利用も可能としている。最大サイズの700億パラメーターモデルは「ChatGPT(の3月1日版)と互角」(同社)という。 ダウンロードには、Metaが用意するフォームから名前とメールアドレス、国、組織名を入れ、利用規約に同意した旨を送信する。Metaが受理すると専用URLが送られてくるため、同社がGitHubで公開しているダウンロード用のスクリプトと合わせるとLlama 2の各モデルをダウンロードできるようになる。 モデルサイズは70億、130億、700億パラメーターの3種類があり、それぞれベースモデルとチャット向けに追加学習(ファインチューニング)したモデルを用意する。いずれも4096トークン(おおよそ単語数の意)まで文脈を読める。 性能は、Llama-2-70b-chat(700億のチャット
Notionはナレッジやタスク管理、メモ、そして目標到達のためのツールとして、何千万ものユーザーに使っていただいています。私たちは、ダグラス・エンゲルバートのような初期のコンピューティング・パイオニアからインスピレーションを受けてきました。彼はコンピューターが私たちの問題解決をより良く、より速くするのに役立つと信じており、これを "Augmenting Human Intellect "と呼びました。後にスティーブ・ジョブズは、"Bicycle for the Mind "というフレーズを使っています。 “We refer to a way of life in an integrated domain where hunches, cut-and-try, intangibles, and the human ‘feel for a situation’ usefully co-exis
集英社は6月7日、AI生成画像を使ったグラビア写真集「生まれたて。」の販売を終了すると発表した。発売後にさまざまな意見を受け、編集部内で検証したところ、AI生成物の販売は慎重に考えるべきと判断。販売終了を決めたという。 生成AIを使った作品の販売について、週刊プレイボーイ編集部はITmedia NEWSの取材に「法務部に確認しながら適法の範囲内でやっている」と回答していた。 販売終了を決めた経緯について「制作過程で、編集部で生成AIをとりまくさまざまな論点・問題点についての検討が十分ではなく、AI生成物の商品化については、世の中の議論の深まりを見据えつつ、より慎重に考えるべきであったと判断するに至った」と説明している。写真集の販売は各電子書店で7日以降、順次停止していく。
近年、OpenAIのGPT-4やGoogleのGemini、MetaのLLaMAをはじめとする大規模言語モデル(Large Language Model:LLM)の能力が大幅に向上し、自然言語処理において優れた結果を収めています[1][2][3]。これらのLLMは、膨大な量のテキストデータで学習されており、さまざまな自然言語処理タスクにおいて、タスクに固有なデータを用いてモデルをファインチューニングすることなく、より正確で自然なテキスト生成や、複雑な質問への回答が可能となっています。 LLM-jp-eval[4]およびMT-bench-jp[5]を用いた日本語LLMの評価結果。Nejumi LLMリーダーボード Neoより取得。 大規模言語モデルは近年急速な進歩を遂げていますが、これらの進歩にもかかわらず、裏付けのない情報や矛盾した内容を生成する点においては依然として課題があります。たとえ
「ユニクロ」の店舗にある無人のセルフレジに使われている商品のタグの情報を読み取る技術の特許をめぐって、大阪市のIT企業とユニクロを展開するファーストリテイリングが争った裁判で、知的財産高等裁判所は、IT企業側の特許は有効だとする判決を言い渡しました。 裁判で争われたのは、ユニクロの店舗にある無人で会計ができるセルフレジで、商品をまとめてくぼみの中に置くとタグの情報を読み取ることができる技術の特許です。 大阪市のIT企業「アスタリスク」がこの技術を発明したとして特許を取得したのに対し、ファーストリテイリングは「これまでの技術と同じで発明は簡単だ」と主張して特許庁に訴え、特許庁では、IT企業の一部の特許が無効だと判断されていました。 これについて、知的財産高等裁判所の森義之裁判長は判決で「上向きに開いた状態でタグのデータを読み取る技術の発明は簡単にはできない」と指摘し、特許庁の審決とは逆に、I
また、ZOZO自身でもZOZOSUIT 2の技術を活用したボディマネジメントサービス「ZOZOFIT」を2022年夏に米国で展開予定。ZOZOFITを着た状態でスマホを使って体型を計測し、身体の3Dモデルを作成。体型管理が簡単にできるという。ただし、ZOZOFITの日本展開については今のところ検討中としている。 関連記事 全身を瞬時に採寸、ボディスーツ「ZOZOSUIT」無料配布 「ぴったりの服」注文可能に 「人が服に合わせる時代から、服が人に合わせる時代へ」――身体を瞬時に採寸できるというボディスーツ「ZOZOSUIT」の無料配布がスタート。「ぴったりの服」をネット注文可能に。 ZOZOSUIT 2登場 マーカー数50倍、計測アルゴリズム改善で精度向上 ZOZOが「ZOZOSUIT 2」を発表した。採寸用マーカーの数やデザイン、計測アルゴリズムなどを改善し、より精密な3Dモデルが作れるよ
ChatGPTの新機能「Advanced Data Analysis(旧Code Interpreter)」にアパレル店舗の売上分析をお願いしたらデータサイエンティストが不要になった 2023年7月7日頃に日本でも利用できるようになったChatGPTの新機能「Advanced Data Analysis(旧Code Interpreter)」が凄いと話題なので、架空のアパレル店舗の売上データを元に売上を上げるための分析を依頼してみました。 どうせデータ分析の専門家でないと使いこなせないんだろうなと全然期待していなかったのですが、予想を超えるクオリティでしたので、一部始終を皆様にもご紹介します。 「Advanced Data Analysis」の基本的な機能やどんなことができるかは以下のページでまとめているので、「Advanced Data Analysis」について知りたい人はこちらをご覧
最近ソーダストリームを買い、炭酸水を飲むのにはまってます。機械学習エンジニアの@yktm31です。 以前に「AWS Lake Formationでデータレイク体験!」という記事を書いてみて、データ基盤アーキテクチャに興味が湧いてきました。 データレイクハウスは、「データウェアハウス」と「データレイク」を統合したようなアーキテクチャで、 2020年にDatabricks社により提唱され、新しいデータ基盤アーキテクチャとして注目されているようです。 www.databricks.com そこで今回、「データレイクハウス」について調べてみたことをまとめてみたいと思います。 なぜデータレイクハウスが注目されているのか? データウェアハウスの特徴・課題 データレイクの特徴・課題 データレイクハウスの特徴 データレイクハウスのアーキテクチャ Azure Azure Synapse Analyticsを
悪用されても気付けない 「駅名は明かせませんが、約110の駅のコンコースなどに設置したおよそ5800台の監視カメラの一部に、顔認証機能を搭載しました。マスクをつけていても、不審者の顔を判別できる能力があります」(JR東日本広報) JR東日本が、ひっそりと「顔認証監視カメラ」を導入したことをご存じだろうか。駅利用者の顔と、登録されている犯罪容疑者や不審者の顔をリアルタイムで照合し、検知しているというのだ。 五輪開幕に合わせて、7月から導入していた。顔データの出元や最終的な情報提供先は「答えられない」と言うものの、警察とみて間違いない。 先月24日夜、東京・港区で男性に硫酸をかけた男は、JR品川駅から新幹線に乗って逃走した。男は28日にスピード逮捕されたが、この捜査にも顔認証監視カメラが活用されたとみられる。 捜査に役立つなら、問題ないと思うかもしれない。しかし、顔の画像を無差別に収集されるの
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 お茶の水女子大学、東京大学、ヤフー株式会社、東京工科大学に所属する研究者らが発表した論文「FoodSkin:金箔(きんぱく)回路を用いて電気味覚を実現する食品拡張手法の提案」は、食品表面に金箔を貼ることで回路の一部とし、食べた際に電気刺激により味が変わる技術を提案した研究報告だ。チョコレートやクッキーに金箔を貼って実験した結果、電気味覚が生起され塩味などが増強したという感想が得られた。 電気味覚とは、味覚の神経系への電気刺激によって味を生起、抑制、増強する技術を指す。これまでの電気味覚の研究では、フォークや箸、コップ、おわんなどの食器型装置や手袋型装置など、装置を介して食べた食品に電気味覚
「Data Cross Conference」の登壇資料です。 https://dcc2022.datafluct.com/ データ活用によって億単位の利益を創出してきた登壇者が、データ基盤をこれから構築する方に向けて、費用対効果を最大化するための初期構築プロセスを紹介します。 ----------------------------------------------------------- 【PR】一緒に働きましょう! https://kazaneya.com/kdec -----------------------------------------------------------
アニメーションと音響技術と機械学習を組み合わせ、歌ったり配信で交流したりもできる「デジタルヒューマン」が中国で急速に普及しており、スキャンダルのない仮想インフルエンサーとしての活躍が期待されています。すでに中国のテクノロジー企業が積極的に開発を進めているだけでなく、政府もバーチャルコンテンツの普及に多額の予算を計上しています。 Companies can ‘hire’ a virtual person for about $14k a year in China https://www.cnbc.com/2023/01/02/companies-can-hire-a-virtual-person-for-about-14k-a-year-in-china.html 中国で最も有名なデジタルヒューマンが、バーチャルシンガーの洛天依(ルォ・テンイ)です。洛天依は日本の初音ミクと同じようにボーカ
前書き この記事を読んでいるエンジニアの皆さんは、それぞれ異なるエディタを使用しているかと思います。読者自身が使用しているエディタの良し悪しについては詳しいと考えているため、私がVS Codeと他のエディタを比較をすることは、限界があります。また、VS Code と他のエディタの機能や快適さを比較できません。 そこで、私が毎日使用している VS Code の良さをアピールすることで、VS Code を使ってもらう機会を作りたいと思っています。 ここで説明しないこと カスタマイズしたキーコンフィグの紹介 ただし、これから紹介する VS Code の機能に好みのキーコンフィグを割り当てることは可能です。 他のエディタとの比較(Vim系 JetBrain系 Helix等の新興エディタ系) 目次 VS Codeとは 毎月のアップデート VS Codeのデフォルト機能 拡張機能(エクステンション)が
こんにちは。ISID 金融ソリューション事業部の若本です。 先日、GPT-4から発展し、画像も扱うことができるGPT-4 with vision(GPT-4V)が発表されました。GPT-4Vは大規模マルチモーダルモデル(LMMs: Large multimodal models)と呼ばれるAIモデルの一種であり、GPT-4の入力として「画像」を拡張したものになります。 今日は Microsoft Researchの論文[1]を中心に、Open AIの発表したSystem Card[2]も踏まえ、GPT-4Vでできることや苦手とすること、そして実用上の制限について解説します。 GPT-4Vの特徴 ① 画像とテキストを入力にできる GPT-4Vでは、GPT-4のテキスト入力に加えて画像も入力することが可能になりました。 画像は複数枚入力することが可能であり、かつ、画像とテキストを任意に交互に組
米Microsoftは2月20日(現地時間)、大規模言語モデル「GPT-4」などのAPIを同社のクラウド上で使える「Azure OpenAI Service」の外部データ連携機能「On Your Data」を正式リリースした。これまではパブリックプレビュー版として提供していた。 On Your Dataはいわゆる「RAG」(大規模言語モデルに外部データベースの情報を参照させ、機密情報を基にした回答などを可能にする仕組み)の構築に向けた機能。ローカルやAzure上のストレージに保管するテキストファイルやPDF、PowerPointファイルを、GUIの操作でGPT-4などに参照させられる。 参照できるのはクラウド型検索サービス「Azure Cognitive Search」のインデックス(検索対象)にインポートしたデータや、Azureのストレージ「Blob Storage」に格納したデータなど
今やさまざまな企業・自治体で活用されるクラウド技術。もちろん、学校が使う事例もある。奈良県北葛城郡にある西大和学園も、クラウドを活用する学校の一つだ。同学は2022年5月、学園祭の開催に当たり、AWSを活用した映像配信システムや、チケット管理システムを開発・活用した。 ただ、このシステムはいわゆる「システム開発事業者」や、学内のIT部門が作ったのではない。なんと生徒自らがクラウドで開発・提供した。手掛けたのは同学の「西大和学園技術統括局」(旧・生徒会電算部)という、生徒たちの集まりだ。 生徒自作のシステムが誕生し、実運用に至った背景を、同学の光永文彦教諭(情報科)、そして西大和学園技術統括局の栗栖(くりす)幸久さん、吉田伊織さん、渡部総一郎さん(いずれも高校2年生)に聞いた。
米AI研究企業OpenAIは1月16日(現地時間)、AIチャットサービス「ChatGPT」のAPIを間もなく公開すると発表した。利用希望者の申し込み用ページも公開している。申し込みには名前、メールアドレス、会社名(任意)、利用目的などの入力が必要。 ChatGPTは22年12月に登場したAI言語モデル。現在はプレビュー版として、テキストで質問を投げかけるとAIがその回答を表示するサービスを提供しており、その精度からSNSなどで話題を集めている。日本語にも対応しており、例えば「ChatGPTとはなんですか?」と聞くと以下のような答えが返ってくる。 「ChatGPTは、OpenAIが開発した対話型自然言語生成モデルです。このモデルは、対話文や会話文を入力として受け取り、それに対して自然な形で返答することができます。ChatGPTは、大規模なトレーニングデータセットを用いて訓練されており、人間に
アジャイルを展開していくうえで、現場の開発チームがどう振る舞えばいいかは具体的なテクニックがあるのですが、「偉い人」がどう振る舞うべきかについての情報が少ない気がしたので整理します。なお、僕の元ツイートはこちらからの一連です。 アジャイルを推進している偉い人の中にはスプリントレビューに出るなど、マイクロマネジメントになりがちな人がいる。理由を聞いたら「成果物が、普通に考えたらそうならないでしょ、みたいなものを作るから目を離せない」という。進言したのは「それはチームに考えさせてないからですよ」(続— 鈴木雄介/Yusuke SUZUKI (@yusuke_arclamp) 2023年2月4日 前提 偉い人、とは 偉い人は関わりすぎてはいけない なぜ、チームは普通に考えないのか 偉い人が関わらないのもダメ 偉い人は適切に関わる 追記 前提 この議論において「そもそも、偉い人やPOやエンジニアに
こんにちは!逆瀬川( https://twitter.com/gyakuse ) です! 今日は公開されたばかりのChatGPT APIを使ってAIキャラクターを作ってみます。 概要 ChatGPT APIを使ってAIキャラクターを作る 嬉しいところ 以前のOpenAIのGPT-3.5系のAPIは $0.0200 / 1K tokens で、だいたい1000文字で3〜5円くらいでした。 今回のChatGPT APIは $0.002 / 1K tokens であるため、1/10のやすさになっています。 また、規約が更新され、APIを使ったinput/outputは学習対象外(オプトアウトがデフォルト)となりました。 DPAの締結(OpenAIの書式に従う必要があります)も可能になっているためより以前よりは守秘性の高いコミュニケーションに使用できる可能性があります。 Colab 実装 会話を行
サイバーエージェントのGitHub CopilotのAnalyticsデータを公開!利用開始から約3ヶ月でエンジニアの生産性は向上したのか? CTO統括室の黒崎(@kuro_m88)です。サイバーエージェントでは2023年4月下旬より、GitHub Copilotの導入を開始しました。 「実際のところどうなの?」という情報がまだまだ少ないと思われるので、本記事では導入から約3ヶ月が経過した現在の利用状況を公開します。 GitHub Copilotの利用状況 2023年7月現在、サイバーエージェントでは500名以上のエンジニアがGitHub Copilotを利用しています。 追記 7/20: そしてこの数字はGitHubによると現時点で日本で一番多いそうです🎉 サイバーエージェントではGitHub Enterpriseが導入されており、事業部や事業単位でOrganizationを保持してお
前書き 注意:ここに書いていることは2020年代としては、古すぎる見解になっている。 近年の自己教師あり学習の大幅な進展で、ここで述べているようなアプローチは大幅に古めかしいものになっている。 ・自己教師あり学習の進展は、画像認識タスクに対する共通のbackbone を作り出しており、後段で個々の画像認識タスクに対するfine-tuningをするアプローチに変わってきている。 ・そのため、ラベル付きの限られたデータで特徴量の抽出をしていたのが、自己教師あり学習に基づく特徴量の抽出になっている。 ・各人、自己教師あり学習について調べることをお勧めする。 主旨 単純に学習データを追加するだけでは学習が改善しないことがある。そのような場合へのヒントを著者の限られた経験の中から記述する。 はじめに 画像認識の機械学習を改善するためにはデータを追加すればよい。 そう思っている人が大半だろう。 ただ、
1 画像生成AIを含む生成系AIとビジネス ビジネス領域において、画像生成AIを含む生成系AI技術が利用される場面は大きく分けると2つあるように思います。 1つはユーザー側で利用する場面、つまり「生成系AIを利用して生成したコンテンツを自社プロダクトで用いる場合」、もう1つはベンダ側で提供する場面、つまり「生成系AIのモデルそのものや当該モデルをベースとするアプリケーションを開発・提供する場合」の2つです。 もちろん、企業によっては「自社で生成系AIツールを開発し、当該ツールを用いて生成したコンテンツを自社プロダクトで用いる」ということもあるでしょう。その場合は2つの領域双方にまたがった検討が必要です。 (1) 生成系AIのモデルそのものや当該モデルをベースとするアプリケーションを開発・提供する場合 生成系AIのモデルそのものや、当該モデルをベースとするアプリケーションをベンダ・サービサー
囲碁世界チャンピオンを打ち負かしたDeepMind製のAI「AlphaGo」は度重なる機能強化によってチェスや将棋などあらゆるボードゲームへの対応を果たしました。新たに、AlphaGoの系譜を受け継ぐAI「AlphaTensor」が「行列の積を計算する最適な方法を求めるゲーム」に挑み、行列の積を計算する未発見のアルゴリズムを導き出すことに成功しました。 Discovering faster matrix multiplication algorithms with reinforcement learning | Nature https://doi.org/10.1038/s41586-022-05172-4 Discovering novel algorithms with AlphaTensor https://www.deepmind.com/blog/discovering-no
テレワーク環境を変革した“夢のシステム”は、なぜ2週間で完成したのか 天才プログラマーが語る理由:CEATEC2020 自宅のパソコンからオフィスのパソコンを簡単・安全に使える、無償のシステム――テレワークの導入を検討している経営者やIT部門にとって夢のようなシステムが、緊急事態宣言下の4月21日に登場した。NTT東日本が開発したシンクライアント型VPN「シン・テレワークシステム」だ。 開発に携わった登大遊さん(NTT東日本 特殊局 特殊局員)は4月1日、同社に非常勤社員として入社。シン・テレワークシステムは、4月6日から社内調整を始め、わずか2週間後の21日にはリリース。10月22日時点で8万5000人以上が利用するほど好評だ。 なぜ、このようなシステムを短期間で開発できたのか。家電・ITの見本市「CEATEC 2020」の講演で、登さんが秘密を語った。 シン・テレワークシステムができる
最近流行りのChatGPT。 「色々な作業を自動化した」 「国家試験に合格した」 ニュースで目にする機会も最近は多いと思います。 では、ChatGPTは現段階でどのくらい賢いのでしょうか? 「海外の司法試験で人間を超えた」などの情報をよく耳にしますが、実感が湧きませんよね。 今回は日本人に馴染みの深い大学入学共通テスト(旧センター試験)を題材に、その実力を検証してみました。 実験方法今回は、令和4年度の国語・英語(リーディング)・公民(倫理 / 政治・経済)の3科目について実験を行いました。 ※ 数学・理科等の科目については図表を読み取る問題が多く、正確に試験できないため今回は除外しました。 ポイント①: テキストになおす大学入試センターで公表されている試験問題がPDFのため、ChatGPTに読めるテキスト形式にする必要があります。 今回はGoogle Docsの機能を活用して文字起こしし
デジタル庁は9月17日、新型コロナワクチンの接種証明書を、スマートフォンで電子交付する際の仕様案を公開し、意見の募集を始めた。マイナンバーカードを使って専用アプリから申請すれば、スマホ画面に証明書を表示できるようにする案だ。ワクチン接種情報を取得するAPIも提供し、事業者が予約サイトなどで使えるようにする計画だ。年内にサービスを開始する予定。 ワクチン接種証明書の電子交付は、既に交付が始まっている紙の証明書と同じ内容を、スマートフォンに表示させる仕組み。 仕様案では、専用の「接種証明書アプリ」をダウンロードし、マイナンバーカードと4ケタの暗証番号を入力して申請すると、2次元コード付きの接種証明書が交付される。2次元コードからは、氏名や生年月日、接種日、ワクチンのメーカーやロット番号といった情報が読み取れる。 海外渡航予定がある人は、専用アプリでパスポートの指定エリアを読み込めば、パスポート
デジタルトランスフォーメーション(DX)が加速する中、あらゆる企業においてデジタル化の推進は喫緊の課題。デジタルに関するスキルは、すべての社会人にとって必須スキルとなりつつあります。 自宅に居ながら新しい知識やスキルを習得したいが、何をどのように学んだらよいか分からない。 本サイトでは、そうしたこれまでデジタルスキルを学ぶ機会が無かった人にも、新たな学習を始めるきっかけを得ていただけるよう、誰でも、無料で、デジタルスキルを学ぶことのできるオンライン講座を紹介します。 本サイトは、令和4年中に、令和4年3月29日に開設したポータルサイト「マナビDX(デラックス)」へ移行いたします。
オセロAIを作り始めた日のこと あれは2021年4月のこと、今思い返せば偶然が重なって起きた出来事でした。 第一の偶然は、ゲームAI(ゲームを自動プレイするAI)世界4連覇の方になぜかゲームAIの初歩的な話を30分程度教わっていたことです。 第二の偶然は、Twitterの知り合いが「オセロソフトRTA」なる競技をやっているのを目にしたことです。なんじゃそりゃ、と思った私はすぐに、その競技が 「オセロで遊ぶプラットフォームをどれだけ早く作るか」を競うものだとわかりました。 面白い、やってみよう。 YouTubeでライブ配信しながら、私はオセロソフトRTAをやってみました。その時のライブはこちら。3時間で完成できれば良いと思っていたのですが、思ったよりも早く終わってしまいました。 オセロAIでも作るか。 こうして私のオセロAI制作が開始しました。 何をしたら良いかわからなかった オセロAIを作
ソフトバンクは5月10日の決算会見で、LINEと共同で和製GPTの立ち上げを進めていることを明らかにした。グループのLINEが開発を進めてきたLINE AiCallなどのHyperCLOVA技術をベースに、OpenAIに追いつくことを狙う。 「GPTの基礎ベースを持っている会社は日本ではわが社しかない。これはもうやらざるを得ない。米国勢や中国勢に勝てるかどうかではなく、やらなければ今後の参加権がなくなる」(宮川潤一社長) 3月に組織を立ち上げ、合弁会社も用意した。グループ内からAI開発人材として1000人を選抜し、異動または兼務を検討している。「1000人から5000人規模の“GPT祭り”をやらなければ、日本の中でのGPTの立ち上がりはない」(宮川氏) LINEが開発してきた独自の大規模言語モデルHyperCLOVAは、LINE子会社のワークスモバイルジャパンに移管されている。Zホールディ
大規模言語モデル(LLM)を、実際にプロダクトや実務に役立つかたちで利用している各社が見た使いどころや、実践の上での工夫について学び合うためのイベント「ChatGPT IN ACTION 実践で使う大規模言語モデル」。株式会社ROXXからは、CTOの松本宏太氏が登壇。「ChatGPT×Whisper」で作ったプロトタイプを紹介しました。 ROXX社・CTO松本宏太氏 松本宏太氏:弊社は「ChatGPT×Whisper」でいろいろプロトタイプを作っているので、その中の事例を1つ紹介して、そこで学んだ内容をもとに、今後の展望をお話できればなと思っています。 (スライドを示して)今日は、こういう感じで話していこうかなと思っています。まず、自己紹介をさせていただきます。 あらためて、株式会社ROXXでCTOをやっている松本と申します。「kotamat」という名前でいろいろやっているのですが、もとも
文章(プロンプト)を入力するだけで画像を生成してくれるAI「Stable Diffusion」は、2022年8月に一般公開されて以降、有志によって簡単に動かせるUIや各種拡張機能が続々と生み出されています。そんなStable Diffusionについて、Appleが機械学習フレームワーク「Core ML」への最適化を発表しました。同時にMacBookやiPhoneなどのAppleシリコン搭載デバイス向けのコードもオープンソースで公開されています。 Stable Diffusion with Core ML on Apple Silicon - Apple Machine Learning Research https://machinelearning.apple.com/research/stable-diffusion-coreml-apple-silicon GitHub - app
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く