2023年12月7日に開催されたStudyCoの勉強会で、AIについてお話した際の資料です。 スライドではお伝えしきれない部分もあるので、同じ内容を記事にしてます。こちらもぜひ! https://qiita.com/segavvy/items/9e7e4ab4b253599ac58a 動画(ス…
Adobe Illustraor 28.0に搭載された生成AI(ベクターグラフィックの生成)が衝撃的だったので、このページにまとめていきます。 イラレの生成AIの探求は以下の新しいページに掲載しています 新しいイラレ生成AI関連ページイラレの生成AIでハロウィンのイラストを描こう! イラレの生成AIでイラストを描くLive - 2023/10/14-15 Adobe Illustrator「イラレの生成AIを探求する」ライブ配信 イラレで生成したベクターグラフィック本日からロスアンゼルスでAdobe MAX 2023がスタートしましたが、遂にAdobe Illustrator(バージョン28.0)に「テキストからベクター生成 (Beta)」が実装されました。Adobe Fireflyのベータ版が登場した時から待機リストに掲載されていたので、いつ搭載されるのか注目していました。 参考:Ill
米Googleの著名な2人の元研究者、リオン・ジョーンズ氏とデビッド・ハー氏が8月17日、東京に拠点を置く新AI企業を設立したとX(旧Twitter)で発表した。 ジョーンズ氏は、Googleが2017年に発表した生成AI革命のきっかけとなったと評価されている論文「Attention Is All You Need」(PDF)の8人の著者の1人。この論文では、後にChatGPTなどの製品開発の基礎となった深層学習アーキテクチャー、Transformerを紹介している。ジョーンズ氏は8月に10年以上勤めたGoogleを退社した。これで論文を書いた著者全員がGoogleからいなくなった。 ハー氏は2016年にGoogle Brain入りし、機械学習などの研究に取り組んだ後、2017年にGoogle Brainが東京チームを設立した際、そのトップとして来日した。2022年にGoogleを辞め、S
その日、私はなんとなく思い付きでそのキーワードを入れた指示文をMidjourneyに与えました。 Three Kingdoms, Warlords, 3D, 12K, octane render, cinematic lighting, Photorealism --testp Discordで見かけるMidjourneyの絵柄はヨーロッパの神話のキャラクターやアニメやゲームのキャラクターが多く、自分で書いた小説の挿絵にしたがる人が多かったりするのでファンタジー的な要素の多い絵をたくさん見かけます。その分アジア的な絵柄はあるようでない。 日本的な絵柄は「anime」や「kawaii」という要素ならば有効ですが伝統的な日本の絵柄はなかなか難しい。「北斎」と入れても出てくるのは波ばかりでそれ以外の絵柄を描かせることは不可能に近い。黒人の絵もうまく描けているのに。アジアは難しいのだろうか。ならば
高杉 光一🦋 @14:59 @kuronagirai Cry… 基本箱推し 画像生成AIで作った画像の供養先@AI_Rushia 生成した画像は商用利用と人が嫌がるようなこと以外の用途であれば好きに使って構いません syosetu.org/?mode=user&uid… 高杉 光一🦋 @kuronagirai 私が把握してる今のところの各画像生成AIの相関図 Stable Diffusionのオープンソース化は間違いなくターニングポイントの一つだけどWaifu Diffusionがどこまで影響を与えるかはこれ次第 Midjourneyも十分影響あったんだけど芸術や背景特化感否めない ERNIE-ViLGはどうなるんだろう…? mimicはうん… pic.twitter.com/ykyDSkltPE 2022-09-09 04:17:01 高杉 光一🦋 @kuronagirai 素人目
GitHubがCopilotの将来像「Copilot Workspace」を発表した。人間が書いたIssueを起点にCopilotが仕様作成からコーディング、ビルドなど、ほとんど全ての開発工程を自動的に実行してくれるものだ。 GitHubの年次イベント「GitHub Universe 2023」が米サンフランシスコで開幕。同社CEOのThomas Dohmke(トーマス・ドムケ)氏は1日目の基調講演の最後に、GitHub Copilotの将来像となる「Copilot Workspace」を発表しました。 Copilot Workspaceは、人間が書いたIssueを起点にCopilotがIssueに対応した仕様を書き、実装計画を示し、それに沿ってコーディングや既存のコードの修正を行い、ビルドをしてエラーがあれば修正まで行うという、コーディングのほとんど全ての工程をCopilotが自動的に実
プロローグ ストーリー編 第1章 感銘 step1. KPIの設定 step2. データの観測構造をモデル化する step3. 解くべき問題を特定する step4. 観測データのみを用いて問題を解く方法を考える step5. 機械学習モデルを学習する step6. 施策を導入する 第2章 絶望 第3章 反省 第4章 再起 step1(再) KPIの設定 step2(再) データの観測構造をモデル化する step3(再) 解くべき問題を特定する step4(再) 観測データのみを用いて問題を解く方法を考える step5(再) 機械学習モデルを学習する step6(再) 施策を導入する 第5章 俺たちの戦いはこれからだ! 実装編 準備 擬似データの生成 意思決定モデルの学習 モデルのオフ方策評価 モデルの真の性能の評価 まとめ この記事を読んだ方はこんな記事も読んでいます(多分) @tkana
絵文字構文 基礎構文 Ctrl+Cでコピーできます。 プロンプト ((ultra-detailed)),masterpiece,best quality,(1 girl),(illustration),((((full-length figure)))), paint right up to the tip of the head,((transparent background)),(solo),standing,(wearing shoes on feet), ((is wearing ●●●)),good girl, beautiful detailed eyes,good looking,((an extremely delicate and beautiful)),make the eyes the same shape and color on both sides, ネガティ
Translate while you read and write with DeepL Translate, the world’s most accurate translator. Stay informed, work smarter, and communicate globally without leaving your browser. Trusted by millions across the globe, DeepL’s Language AI delivers unmatched accuracy and fluency to help you scale faster and bring clarity and efficiency into your daily work. All of that, with the highest levels of dat
他にも「LatentMajestyDiffusion」「centipidediffusion」「latenddiffusion」「discodiffusion」「dalle2」など存在します。アルゴリズムが違うと同じ呪文でも質の違う画像が生成されるので、気が向いた人は色々と試してみることをお勧めします。 画像生成に関する基本知識画像生成に関するベーススキルは、どんなものを生成する場合でも一緒なので、上級錬金術師に学ぶのが一番早い。参考をいくつか紹介します。 大原則となる考え方を深津さんのnoteから抜粋します。 対話型のAIにとって、呪文プロンプトとは画像錬成の方向性ベクトルを定めるものにすぎない。 だからAIをよく使役するには、2つの理解「ベクトルの方向を強く適宜する力ある言葉ルーンの語彙力」と「再現性をもった呪文の組み立て」が必要になる。 深津さんのnote「魔術として理解するお絵描き
はじめに Pythonのデータ解析エコシステムは日々進化を続けています。2024年現在、効率的なデータ処理、直感的な可視化、高度な機械学習の自動化など、様々な新しいツールが登場しています。本記事では、最新のPythonデータ解析ライブラリを紹介し、それぞれの特徴や使用例、実際のユースケース、そして導入方法まで詳しく解説します。 1. データ操作ライブラリ 1.1 Polars: 高速データ処理の新標準 Polarsは、Rustで実装された高速なデータ操作ライブラリです。pandasに似たAPIを持ちながら、大規模データセットでより高速に動作します。 特徴: 高速な処理速度 メモリ効率が良い pandasに似たAPI 使用例: import pandas as pd # サンプルデータを作成 data = { "age": [25, 32, 28, 35, 40, 50], "categor
関連記事 AIで、3歳児のラクガキが“超美麗”に!? 「Meitu」で実験してみた 最近、Twitterを騒がせているのは、スマートフォンアプリ「Meitu」の「AIイラストメーカー」だ。「AIのやつ」などと呼ばれることもある。 お絵かきAI、育児で活躍 “無限塗り絵”に4歳も夢中 塗り絵好きな子どもがいる家庭では、「子どもが好きな塗り絵をどう用意するか」がしばしば課題になる。そこで活躍するのが、お絵かきAIだ。 「10秒でイメージ通りに」 お絵かきAIが変える“デザイン” あるネットショップでの使い方 「AIお絵描きツールのmidjourneyで、アクセサリーごとにオリジナルのラッピングをしています」。輸入雑貨などのネットショップで。 まさに「世界変革」──この2カ月で画像生成AIに何が起きたのか? 2022年8月22日。日本時間にして午前4時ごろ、「世界変革」はついに実行された。「どん
リチウムイオン電池は、現代社会でスマートフォンや電気自動車などに広く使用される一方で、破裂や火災につながる危険性が指摘されています。2024年1月9日にMicrosoftとパシフィック・ノースウエスト国立研究所(PNNL)は共同で、既存のリチウムイオン電池よりも破裂しにくい可能性のある新たな固体電解質を用いたバッテリー材料を発見したことを発表しました。今回の発見には、Microsoftの量子コンピューティングサービス「Azure Quantum Elements」が用いられました。 Discoveries in weeks, not years: How AI and high-performance computing are speeding up scientific discovery - Source https://news.microsoft.com/source/featu
Just another blog about manga, anime, video games, models, and the life of Dan Kanemitsu. NovelAI Stable Diffusion Midjourney 画像:2022年10月の段階で三つの作画AIに「女の子、キツネ耳、白耳、白尻尾、ぴっちりボディスーツ、だぼだぼジャケット、秋葉原、夜の街、雨、路面に反射」などと入力した出力した結果。絵柄は指定しておらずそれぞれの作画AIのデフォルトスタイルである。 ■今回の騒動の背景を少々…… 作画AIが及ぼす影響について日本のクリエーターや受け手側の間でかなり憂慮する声が広がっています。この10年、機械学習の躍進とそれが社会に及ぼした影響はすさまじいの一言としか言いようがないと思います。機械翻訳の質が飛躍的に向上したことによって一般的な会話であれば機械によ
GitHub.comの利用をやめようと言われても、多くのソフトウェア開発者やGitHub.comのユーザーにとって、それはかなり困難で突拍子もない提案のように聞こえる。この便利なサービスなしには日々の生活が成り立たなくなっているユーザーは世界中にたくさんいる。 Software Freedom Conservancyは6月30日(米国時間)、「Give Up GitHub: The Time Has Come! - Conservancy Blog - Software Freedom Conservancy」において、同組織におけるGitHubの使用を中止するとともに、他のFOSSプロジェクトがGitHubからほかのサービスに移行するのを支援する長期計画を実施すると伝えた。 Software Freedom Conservancyは現在のGitHubの取り組みに疑問を呈しており、AI支援
こんにちは。一般イラストレーターです。今回は新しい情報ではないのですが、前々からやってみたかった「AIイラストを真面目に加筆修正する。」をやってみたのでそのまとめとなります。現在のAIイラストは細部描写の甘い部分が多く、真面目に作品に使っていこうとすると手作業での修正が不可欠となります。AI絵師を名乗る人々の中にはそういった加筆を行ってイラストをアップしている人も居るので、今後はそういうスタイルも定着するんじゃないかなと思っています。イラスト依頼系でも「このAI絵を加筆修正してくれ!」みたいなリクエストは普通にありそうですからね。まぁ、私は今回は単にやってみたかっただけなのでアレですが。 取りあえず今回のベースとなるAI生成物を見て下さい。使用AIは話題のniji journeyです。 insanely high quality masterpiece pixiv color illust
最適輸送問題(Wasserstein 距離)を解く方法についてのさまざまなアプローチ・アルゴリズムを紹介します。 線形計画を使った定式化の基礎からはじめて、以下の五つのアルゴリズムを紹介します。 1. ネットワークシンプレックス法 2. ハンガリアン法 3. Sinkhorn アルゴリズム 4. ニューラルネットワークによる推定 5. スライス法 このスライドは第三回 0x-seminar https://sites.google.com/view/uda-0x-seminar/home/0x03 で使用したものです。自己完結するよう心がけたのでセミナーに参加していない人にも役立つスライドになっています。 『最適輸送の理論とアルゴリズム』好評発売中! https://www.amazon.co.jp/dp/4065305144 Speakerdeck にもアップロードしました: https
AIはてなブックマーカーの一番星はてのにスター付与機能を実装しました。 b.hatena.ne.jp 記事タイトルとランダムに最大50件に絞ったブックマーク一覧をはてのちゃんに渡して、ステキだったりお星様のパワーをあげたいコメントをユーザーを選んでと伝えてスターをつけてます(スターをつけるブコメの数など予告なく変えることがあります)。 特にブコメのスター数などはプロンプトに入れておらず、シンプルにコメントで選んでもらっています。セッション切れの問題はありますが、コメントを選んでからスターをつけるところまでは自動化されています。 現段階ではどの記事のブコメに対してスターをつけるかは自分が選んでますがそのうちここも自動化します。 はてのがつけたスター一覧 https://s.hatena.ne.jp/firststar_hateno/starss.hatena.ne.jp 自分がしたコメントに
2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR処理プログラムです。 このプログラムは、国立国会図書館がCC BY 4.0ライセンスで公開するものです。なお、既存のライブラリ等を利用している部分については寛容型オープンライセンスのものを採用しているため、商用非商用を問わず自由な改変、利用が可能です。 機能ごとに7つのリポジトリに分かれていますが、下記リポジトリの手順に従うことで、Dockerコンテナとして構築・利用することができます。 リポジトリ : https://github.com/ndl-lab/
この記事は株式会社Nuco Advent Calendar 2022の9日目の記事です。 はじめに いきなりお馴染みの「キャッチーでウィットでセンセーショナルな」タイトルで失礼します。 私自身、業務の中でpandasに大変お世話になっており、自戒も込めてpandasの「アンチパターン」をまとめてみました。 この記事を読んで、より快適なpandasライフを送っていただけると嬉しいです。 対象読者 Pythonを使ったデータ分析や機械学習に携わる方 この記事はpandasの基本的な使い方を解説するものではないので注意してください。 表形式ファイルを加工する必要がある方 pandasの強みはリレーショナルなデータ全般です。必ずしもデータ分析や機械学習だけが守備範囲ではありません。 pandasとは pandasの公式ドキュメントの概要には、以下のように記載してあります。 pandas is a
そろそろAI拓也について誰かが語らなければなりません。この貧乏くじは僕が引きます。 AI創作の最前線にして最底辺 AI拓也と淫夢の相違点 AI拓也の歴史 怪文書について 同人拓也について AI拓也について AI拓也傑作選 2021年11月『AI自動生成タクヤの評判』★★★ 2021年12月『タクヤ依存症対策条例』★★★ 2022年1月『AIを使って拓也さんを「ジョジョの奇妙な冒険」に登場させる』★☆☆ 2022年2月『AIで拓也をHUNTER×HUNTERの世界で活躍させる【ハンター試験編】』★★★ 2022年2月『AIの力を使って拓也を核融合炉に飛び込ませてみた』★★☆ 2022年2月『AI拓也にYahoo!知恵袋の回答をやらせる』★☆☆ 2022年2月『普樋の高■生・藍沢柚葉の曰屺 出力日:2022年1月9315日(拓)99:99:99』★★★ 2022年4月『AI2人に拓也さんについ
LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog こんにちは。 LINEのNLP Foundation Devチームの清野舜と高瀬翔とoverlastです。 LINEでは2020年11月から日本語に特化した大規模言語モデル「HyperCLOVA」の構築と応用に関わる研究開発に取り組んできましたが、この「HyperCLOVA」と並行するかたちで複数の大規模言語モデルの研究開発プロジェクトが進行しています。 今回はそれらの研究開発プロジェクトのうち、我々を含むMassive LM開発ユニットから、日本語言語モデル「japanese-large-lm(ジャパニーズ ラージ エルエム)」をOSSとして公開できる状況になりましたので、本ブログを通じてお伝えすることにしました。 この記事
We’ll help you make it like nobody’s business.No creative challenge too big, no timeline too tight. Get to production with Stability AI, your enterprise-ready creative partner. Work with us. Marketing Create high-quality on-brand assets for every campaign using our image generation and editing tools. Gaming Build immersive worlds with our 3D and 4D video models that take volumetric generative medi
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、わずか2700万パラメータという小規模なモデルでありながら、複雑な推論タスクにおいて最先端の大規模言語モデル(LLM)を凌駕するモデルを開発した論文「Hierarchical Reasoning Model」を取り上げます。 この論文はシンガポールのSapient Intelligenceと清華大学による研究発表です。Sapient Intelligenceはシンガポールに本社を置き、サンフランシスコと北京に研究センターを構えるグローバルなAGI研究企業です。精華大
出典:Flickr / Tatsuo Yamashita (CC BY 2.0 DEED)ホンダのADAS「Honda SENSING(ホンダセンシング)」による「天一騒動」が再燃しているようだ。ホンダセンシングが、ラーメンチェーン「天下一品」の企業ロゴを「車両進入禁止」の道路標識に誤認識してしまう案件だが、ローソンが「天下一品こってりフェア」を開催したことで「遭遇率」が高まり、再び話題となっているようだ。 この誤認識による本質的なトラブル事例は出ておらず、あくまで「ネタ」としてトピック化されているわけだが、こうした事案が自動運転レベル3以降で発生すると厄介だ。 ■天下一品のロゴが車両進入禁止標識に酷似している件標識認識機能が「ネタ」に……天下一品の企業ロゴは、赤い丸枠に筆で描いたような「一」の字が白抜きで刻まれたものだ。このロゴが、赤い丸枠に白抜きで横線を入れた「車両進入禁止」の標識と酷
1: 購入 0: 閲覧(したが購入してない) -: 未観測 ユーザーベース型 ユーザー同士の類似度を計算 「あなたと購入履歴の似たユーザーはこんな商品を買っています」 行を各ユーザーのベクトルとみなして、似たユーザーを見つける(上位N人) 似たユーザーが購入しているアイテムを推薦する(N人の平均値などで購入しそうな順に提示) アイテムベース型 アイテム同士の類似度を計算 「この商品を買ったユーザーはこんな商品も買ってます」 列を各アイテムのベクトルとみなして、類似度の高いアイテムを推薦する(上位M件) 類似度計算には、コサイン類似度やJaccard類似度が使われる。 類似度を計算する際に、未観測「-」は適当な値(0, 0.5など)で埋めるか、無視をする。 ログデータを使うため、情報の少ない新規アイテム/新規ユーザーに弱いコールドスタート問題がある。 コンテンツベースフィルタリング アイテム
さまざまな数学的トピックをムービー形式で解説するサイト「3Blue1Brown」において、ChatGPTに代表されるAIを形作っている「Transformer」構造の心臓部「Attention(アテンション)」についての解説が行われています。 3Blue1Brown - Visualizing Attention, a Transformer's Heart | Chapter 6, Deep Learning https://www.3blue1brown.com/lessons/attention AIの中身と言える大規模言語モデルのベースとなる仕事は「文章を読んで次に続く単語を予測する」というものです。 文章は「トークン」という単位に分解され、大規模言語モデルではこのトークン単位で処理を行います。実際には単語ごとに1トークンという訳ではありませんが、3Blue1Brownは単純化して
近年、OpenAIのGPT-4やGoogleのGemini、MetaのLLaMAをはじめとする大規模言語モデル(Large Language Model:LLM)の能力が大幅に向上し、自然言語処理において優れた結果を収めています[1][2][3]。これらのLLMは、膨大な量のテキストデータで学習されており、さまざまな自然言語処理タスクにおいて、タスクに固有なデータを用いてモデルをファインチューニングすることなく、より正確で自然なテキスト生成や、複雑な質問への回答が可能となっています。 LLM-jp-eval[4]およびMT-bench-jp[5]を用いた日本語LLMの評価結果。Nejumi LLMリーダーボード Neoより取得。 大規模言語モデルは近年急速な進歩を遂げていますが、これらの進歩にもかかわらず、裏付けのない情報や矛盾した内容を生成する点においては依然として課題があります。たとえ
建物や植生、建築物同士の距離などをもとに、写真に写っている場所がどこなのかを秒単位で高精度で予測する「GeoSpy」というAIツールが、法執行機関を対象として販売されていることをニュースサイト・404 Mediaが報じています。 The Powerful AI Tool That Cops (or Stalkers) Can Use to Geolocate Photos in Seconds https://www.404media.co/the-powerful-ai-tool-that-cops-or-stalkers-can-use-to-geolocate-photos-in-seconds/ 404 Mediaによると、GeoSpyを開発しているのはボストンに拠点を置くGraylark Technologiesという企業です。 マーケティング資料によると、GeoSpyは世界中の
連載目次 本連載(基礎編)の目的 スクラッチ(=他者が書いたソースコードを見たりライブラリーを使ったりせずに、何もないゼロの状態からコードを記述すること)でディープラーニングやニューラルネットワーク(DNN:Deep Neural Network、以下では「ニューラルネット」と表記)を実装して学ぶ系の書籍や動画講座、記事はたくさんあると思います。それらで学んだ際に、「誤差逆伝播」(バックプロパゲーション)のところで挫折して、そこはスルーしている人は少なくないのではないでしょうか。個々の数式や計算自体を理解していても、何となく全体像がつかめずに、 と自信を持って言えない人も多いのではないかと思います。 本連載(基礎編)はそういった人に向けた記事になります。この記事はニューラルネットの仕組みを、数学理論からではなくPythonコードから学ぶことを狙っています。「難しい高校以降の数学は苦手だけど
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く