fpf1のブックマーク - はてなブックマーク

無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない

Invoke、Comfy Org、Civit ai、LAIONは6月25日、米コミュニティーサイト「Reddit」の「r/StableDiffusion」スレッドで、画像・動画・音声生成のためのオープンライセンスAIモデルの開発を推進することを目的にしたプロジェクト「Open Model Initiative」の立ち上げを宣言した。企業による技術の独占を防ぎ、アクセシビリティを確保「Open Model Initiative」の初期メンバーは、企業向け生成AIプラットフォームを提供するInvoke、直感的に操作できるオープンソースの画像生成AIツール「ComfyUI」を開発するComfy Org、クリエイター向け生成AIモデル共有サイトを運営するCivit ai、大規模な学習データセットを構築するLAIONだ。彼らは、最近の制限的ライセンス下でのAIモデルのリリースに懸念を示し、オープン

fpf1 2024/06/28

リンク

キーボードとマウスをつなぐDINおよびPS/2コネクター　消え去ったI/F史 (1/3)

初期のPCでは必須だったのに、今では存在しないコネクターとI/Fの代表例がキーボードで、これにマウスが続く格好だろうか。もっともこれアーキテクチャーによっていろいろ違うのだが、今回はIBM-PC系列の話である(Macintoshはまた異なるし、日本のPC-98シリーズもいろいろ異なる)。 DINコネクターを採用した IBM-PC標準装備のキーボード初代のIBM-PC(IBM Model 5150)の場合、ユーザー入力デバイスはキーボードのみだった。まだマウスはこの時点で世間的には普及していない("Mouse"と名付けられたデバイスそのものは1965年に、Douglas Engelbart博士によって発明されている)が、これがPCの世界に入ってきたのは1985年にMicrosoftが初代のMicrosoft Mouseを発売してからだったと記憶している。というわけで最初のIBM-PCには

fpf1 2024/05/07

リンク

ChatGPTで画像生成するならコレ!　おすすめGPTs紹介 (1/6)

OpenAIは1月10日、カスタムバージョンのGPTを作成できる「GPTs」機能で作成した多様なGPTを探索できる「GPT Store」の公開を予告通り開始した。今回はストアーのラインアップから画像生成系の「DALL·E」カテゴリーを取り上げてみよう。「DALL·E」カテゴリー「DALL·E」カテゴリーには言うまでもなくOpenAIの画像生成AI「DALL·E 3」を便利に使うために作られたカスタムGPTが掲載されている。今回は上位6個のGPTを使ってみることにする。まずは「DALL·E」カテゴリーのトップ「image generator」というGPTを試してみよう。説明欄には「プロフェッショナルかつフレンドリーなトーンで画像を生成し、洗練させることに特化したGPT（A GPT specialized in generating and refining images with a

fpf1 2024/03/02

リンク

これは嬉しい　ChatGPTプロンプト書き方のコツ、OpenAIが公開

OpenAIは、大規模言語モデル（GPT-4）でよりよい結果を出すためのプロンプトエンジニアリング（プロンプトのノウハウ）入門テキストを同社のウェブサイトで公開している。同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術（コツ）が掲載されている。また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。では紹介された6つの戦略を見ていこう。明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。具体的な戦術としては下記が提案されている。・より関連性の高い回答を得られるよう、質問は詳細に・モ

fpf1 2023/12/19

リンク

月2178円で30GB＋通話定額付き！日本通信SIM「合理的30GBプラン」に実際に加入、ホントに高コスパ？ (2/2)

MVNOとしては快適度が高く、昼の速度低下も少なめ最後にデータ通信回線としての快適さを示す目安となる、速度測定の結果を見ておきたい。すべて郊外の住宅地で測定しているため、無線区間の差よりも、利用ネットワークであるドコモとMVNO間やその先のインターネットへのデータ伝送の能力の比較と思ってほしい。環境は揃えたわけではないが、結果的にすべて4Gでの接続だった。参考として、MVNOの格安SIMの代表と言えるドコモネットワークのIIJmio、サブブランドのY!mobile／UQ mobile、そして楽天モバイルと比較している。昼に近い午前中といった混雑の少ない時間帯では、各社フルスピードの速度を記録している。Y!mobileと楽天モバイルが少し低い程度。電波環境の違いもあるため、このくらいの速度が出れば最高速が出ていると言っていいだろう。 11時30分頃(Mbps) 下り上り日本通信SI

fpf1 2023/12/12

リンク

画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり（左）として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる（筆者作成） Stable Diffusi

fpf1 2023/12/11

リンク

画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3（ダリ３）」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日本語で「猫の画像を作ってください」などと入れるだけでかわいい猫の画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資本で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。「ラーメンを食べる女の子」が描ける！なにより衝撃的だったのは、「アニメ風の少女と猫が遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

fpf1 2023/10/17

リンク

アニメ業界で“生成AI”に挑んだ実験の裏側 (1/4)

9月5日、キャラクターと会話するタイプのAIチャットサービス「AI lain」が登場しました。ユーザーはアニメ「serial experiments lain」主人公、岩倉玲音（いわくられいん）との会話を楽しめます。利用料金は月額20ドルから。無料で10回まで試用可能です。 serial experiments lainは1998年に登場した、アニメとゲームが同時進行するメディアミックス作品。インターネット時代に揺らぐ個人のアイデンティティーのあり方をテーマにした作品はカルト的な人気を得て、現在でもネットミームとして世界中に知られています。 AI lainは、物語に登場するコンピュータネットワーク端末「NAVI」（ナビ）をイメージした画面上で玲音とチャットができるという、原作に忠実な世界観を再現。音声にも声優の清水香里さんの当時の音声を学習させたものを使用しています。玲音と会話を進めるに

fpf1 2023/10/02

リンク

ChatGPTをめちゃくちゃ便利にする“プラグイン”の使い方「これを作って！」編 (1/4)

プラグインの基本を知ろう ChatGPTの有料プラン「ChatGPT Plus」には、「プラグイン（Plugin）」という、ChatGPTの機能を拡張するためのツールが多数用意されている。プラグインを導入することで無料版ではできなかった最新の情報へのアクセスや、サードパーティーのサービスを利用することができるようになるというのが売りだ。プラグインの導入方法については第10回の記事を参照してほしい。注：本記事はすべて筆者がChatGPT Plusでプロンプトを実行・検証している。「結果はこちら（クリックで拡大表示）」のリンクをクリックすることで、すべてのプロンプトと生成されたChatGPTの回答を見ることができる。なお、記事内で触れられていない質問や頓珍漢な回答も含まれているが、これはChatGPTとのリアルな対話記録であるため、そのあたりをお楽しみいただければと思う。 ChatGP

fpf1 2023/09/25

リンク

ChatGPTがさらに楽に！会話設定を記憶「カスタム指示」無料化

OpenAIは8月9日（現地時間）、同社のAIチャットボット「ChatGPT」の有料プラン「ChatGPT Plus」ユーザー向けに提供されていた「カスタム指示（Custom instructions）」機能を無料版ユーザーにも公開したと発表した。 ChatGPTに知っておいてほしいことを入力 ChatGPTが応答する際に考慮してほしいことをあらかじめ入力しておける同機能は、7月20日に有料プランユーザーに向けて提供開始されていた。今回すべて（英国およびEUはのぞく）のユーザーが利用できるようになる。カスタム指示の設定画面が開くので、「What would you like ChatGPT to know about you to provide better responses?（ChatGPTに知っておいてほしいこと）」と、「How would you like ChatGPT to

fpf1 2023/08/18

リンク

ChatGPT向けライブラリ、LangChainを格段に使いやすくするtips

LangChainの用意しているプロンプトやラッパーは英語以外を意識していないことが多く、特に検索系のtoolがUSのサイトを引っ張ってくるということが多々ある。こういったケースはtoken数に制限のあるChatGPT APIにとっては大きな問題になってくる。USのサイトが検索上位にかかってくることで得られる情報が減る上に、これを解消するために検索数を増やせばそれだけtoken数を消費するためである。当然だがtoken数の上限を超えればエラーを吐いて異常終了する。こういった問題の多くは、LangChainのライブラリが用意しているクラスをそのまま使うことによって発生している。またLangChainはagentの定義を行うだけで簡単に基本的な機能が使えてしまうため、agentがどのようなロジックで動いているのか理解しにくい。本記事はLangChainを少しだけ掘り下げて、これらの問題

fpf1 2023/08/17

リンク

6万円台は破格！HDMI 2.1対応4K・144Hz最安ゲーミングディスプレー、PS5＆PCでいかが (1/4)

FPSやTPSといった一瞬の動作が勝敗を分けるゲームでは、高リフレッシュレートに対応したディスプレーがトレンドになっている。高性能ビデオカードで1フレームでも多く描画し、そのフレームを1枚でも多く表示したほうが有利になるからだ。その一方で、RPGやRTSなどではなるべく広い画面でプレイしたいという需要が高い。その両方を満たすディスプレーというと、高解像度かつ高リフレッシュレートに対応した製品ということになる。今回紹介するJAPANNENXTの「JN-IPS28G144UHDR」は、そういったニーズにぴったり寄り添うモデルだ。しかも、4K・144Hz、HDMI 2.1というゲーミングにおけるトレンド仕様をしっかり押さえて、なんと価格は6万円台。若干不安になる安さだが、しっかりレビューしていきたいと思う。 4K・144Hzの28型ゲーミングディスプレーが6万円台 JAPANNEXTの4Kゲ

fpf1 2023/07/24

リンク

「マジでやばい」ChatGPTでプログラムが実行できる“コードインタープリター“

OpenAIは2023年7月7日（現地時間）、ChatGPTの追加機能「Code Interpreter（コードインタープリター）」機能を、有償サブスクリプションプラン「ChatGPT Plus」ユーザーに向けベータ版として公開した。同機能は、3月23日のプラグイン機能公開のタイミングで、一部ユーザーのみに向けてアルファ版として公開していたが、今回すべてのサブスクリプション登録ユーザーが利用可能になった。ファイルのアップロードも可能 Code Interpreterを有効にすると、ChatGPT内にサンドボックス化された実行環境で動作するPythonインタープリターおよび一時的なディスク領域を利用できるようになる。例えば、ユーザーが自然言語で問題を入力すると、Code Interpreterはそれを理解し適切なコードをインタープリターを使って生成する。また、既存のデータを読み込ませ視

fpf1 2023/07/11

リンク

ChatGPTの新機能コードインタープリターに《未来の仕事の全自動化》が見える

国勢調査（csv）と国土地理院（xls）とドン・キホーテ店舗数（html）を自動マージしてパワポにする OpenAIが、ChatGPTに革命的ともいえる新機能「Code Interpreter」を追加して、試した人たちの間で大騒ぎになっている。さまざまな機能が可能になっているが、その本質は名前のとおりChatGPTの中でプログラムを実行可能になったことだ。 ChatGPT plus（20ドル／月の有料ユーザー）は、随時このCode Interpreter というプラグインが使えるようになるそうなのだが。画面左下から「Settings」を選び、「Code Interpreter」のスライドスイッチをONできれば利用可能。「New Chat」をスタートしたときに「GPT-4」を選び、「Code Interpreter」にチェックする。とくに、データサイエンティスト的な数値の分析の世界にインパ

fpf1 2023/07/11

リンク

Photoshopの画像生成AIがすごい　ついに商用利用もスタートへ (1/3)

Adobeが5月23日、生成AIモデル「Adobe Firefly」に、テキストを使って画像を追加・拡張・削除できる「ジェネレーティブ塗りつぶし」機能を追加。Photoshop（Beta）にベータ版の機能として搭載しました。実際に使ってみると、「以前から研究していたとはいえ、やっぱりAdobeが本気を出してくるとすごいな」という感想でした。「消したり、足したり」30秒程度でまず試してみたのは、画像生成AI「Nijijjourney」で作ったいかにも生成が面倒くさそうなサイバーパンクの都市を題材にしたAI画像。画像サイズを横幅を1500ドットくらい広げた後に、生まれた空白を範囲選択して「ジェネレーティブ塗りつぶし」。すると適当に周囲の情報を読み、それっぽい形にイラストを広げてくれます。何もないものからよく作れるものです。左がオリジナル画像のサイバーパンクの都市。右が左右のサイズを広げて

fpf1 2023/06/12

リンク

99年間使える！　買い切り型クラウドストレージ「pCloud」の多機能超コスパぶりを伝えたい (1/4)

クラウドストレージは便利だけど何十年もお金を払い続けられるか心配…… あらゆるファイルのサイズが拡大傾向にある昨今。スマホで撮影した写真は1枚あたり数MB、画面キャプチャなら10MBを超えることも。子どもの成長記録を動画で保存しようものならGB単位でデータが増えていく。そうしたファイルの保存先として選択されるHDDは、大容量化・低価格化が進んでいる。大量のデータを低コストで保存できるのはうれしい限りだが、使い続けるほどに故障のリスクも増える、つまり大切なデータを失ってしまう可能性が高まる。ならばNASという選択肢はどうだろう。しかしNAS環境を自分で構築できるほどITリテラシーが豊富な人ばかりとも限らない。いくら大容量HDDが手に入れやすくなったとは言え、多くのファイルを長期間、的確に管理するのはハードルが高い。というわけで、このところHDDよりも頼りにされているのが「クラウドスト

fpf1 2023/03/26

リンク

グーグル、歌声から伴奏を生成するAI「SingSong」を公開

グーグルの研究部門Google Researchは1月30日、フランスの研究機関IRCAM（Institut de Recherche et Coordination Acoustique/Musique）と共同で、入力された歌声にあわせた伴奏を生成するAIモデル「SingSong」を発表した。 Excited to share SingSong, a system which can generate instrumental accompaniments to pair with input vocals! 📄https://t.co/1mRUaXvqVy 🔊https://t.co/8RGezPu5YQ Work co-led by myself, @antoine_caillon, and @ada_rob as part of @GoogleMagenta and the b

fpf1 2023/02/04

リンク

「AIトレパク」が問題に (1/3)

3DアバターのVRMのスクショアプリ「VRM Posing Desktop」を使いVRMで画像（左）を作成後、Stable DiffusionのWebUIでimg2imgを行ってイラスト風の画像（右）を生成したもの。（画像：筆者作成）画像生成AIの「img2img」が議論を起こしています。 img2imgとは、画像生成AIの機能の1つ「Image-to-Image」の略称。画像を読み込ませて、テキストで指定するプロンプトと合わせて画像生成すると、元となる画像のイメージを踏襲した画像を作ってくれるという機能です。たとえば3DアバターのVRMデータを読み込ませるだけでアニメ風の絵が生成されます。パラメーターの設定次第ですが、元のキャラクターの特徴もそのまま踏襲させることが可能です。元となる画像を用意することで、同じ顔つきのやポーズの画像が生成を容易にすることができるわけですね。この原理を

fpf1 2023/01/26

リンク

これで6990円は買い「Xiaomi Smart Band 7」 (1/5)

シャオミが7月15日に発売した常時表示対応のスマートバンド「Xiaomi Smart Band 7」を試用した。本稿では、同機の使い心地について紹介する。表示領域が25%広がりディスプレイが進化した Xiaomi Smart Band 7は、1.62インチの有機ELディスプレイを備える。同社のプレスリリースなどで「スマートウォッチ」と称されてはいるものの、製品名のとおり、縦長のディスプレイを備えたスマートバンド型の製品だ。

fpf1 2022/08/14

リンク

天才プログラマー・オードリーさんがたった200行で効果的なアプリを作れる秘訣

天才プログラマー・オードリーさんがたった200行で効果的なアプリを作れる秘訣オードリー・タン台湾デジタル大臣との対話 - 未曾有の危機に幅広く使える未来思考（後編） 2021年1月19日、『コロナ vs. AI 最新テクノロジーで感染症に挑む』（翔泳社刊）が発売されました。医師の起業家からAIの研究者・ITの先端技術コンサルタントによって執筆されており、コロナ対抗策としてのAIの社会実装事例・AI研究事例・医療研究事例をわかりやすくまとめられています。今回本書の発売を記念して、収録されている台湾のデジタル大臣、オードリー・タンさんへの特別インタビューから、一部内容をご紹介します。株式会社キアラ代表取締役の石井大輔氏による寄稿です。（前編はこちら）。石井：今回の私の質問は少し技術的なことです。オードリーさんは天才プログラマーとして有名です。GitLab Taiwanのエンジニア友人か

fpf1 2021/02/02

リンク

はてなブックマーク

タグ

ブックマーク / ascii.jp (20)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス