yasuhiro1212のブックマーク - はてなブックマーク

画像生成AIに照明革命　日本と世界で同時に“神ツール”登場 (1/3)

この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール（lllyasviel）さんが発表した「ICライト（Imposing Consistent Light、印象的な一貫的なライト）」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。画像生成AIで照明効果がつけられる「ICライト（IC-Light）」発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

yasuhiro1212 2024/05/27

あとで読む

リンク

いまどきのゲーミングPCでマザー側の映像出力に繋ぐのはあり/なし？古の禁忌に踏み込む (1/6)

「ビデオカードがある時にマザーボード側の映像出力に繋ぐ」のは今でもNGなのか？ PC初心者がデスクトップPCを設置する時にやりがちなミスの1つとして、「ビデオカードがあるのにマザーボード側（オンボード側）にディスプレーを接続する」というものがある。これをやってしまうとディスプレーに映像が出ない、あるいは映像が出たとしてもゲームのレンダリングがCPU内蔵GPUで行われてしまい、ビデオカードは休んだままになってしまう、というものだ。こういったトラブルを防ぐため、ビデオカードを装着したBTOメーカー製PCではオンボード側の映像出力がシールで封印されていることもある。ビデオカードを搭載したBTOメーカー製PCでは、マザーボード側のHDMIやDisplayPort出力に使用不可であることを知らせるシールが貼られていることも多いしかし、このような古の教えはハードやソフトの発展で乗り越えられるよ

yasuhiro1212 2024/05/27

あとで読む

リンク

しまむら、AIモデル「るな」起用　20歳の服飾専門学生（という設定）

sponsored 軽量薄型で、かつ安価！ 15.6型実用ノートがセールでさらに安い！ sponsored 夏ボーナスと夏休みを先取り！ Ryzen 7＋4060 Tiでちょうどいい性能のゲーミングPCをセールで手に入れよう！ sponsored X-360Q（JN-27IPS360WQHDR-HSP）をレビュー 360Hz・WQHDの27型ゲーミングディスプレーが9万円台！ KVMも90W給電も使えてお得感大 sponsored 「JAPANNEXT 上総中川駅」誕生の経緯をいすみ鉄道の社長にインタビューディスプレー会社が駅名に!? JAPANNEXT×いすみ鉄道の異色コラボはなぜ実現したのか sponsored Radiant GZ3500Z790/D5をカスタム BTOってマジ大事。16万円台のふつ～なPCが20万円のi5＆RTX 4060のゲーミングPCに sponsored 音

yasuhiro1212 2024/05/21

あとで読む

リンク

ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法（ちょっとわかりづらいので解説）

5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが……」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。とはいえ、ちょっとばかり確認の仕方が分かりづらいので、簡単に解説しようと思います。実はこんなとこにある無課金ユーザー向けのモデル選択まず、いつものようにChatGPTのサイトにアクセスします。まだアカウントも持っていないよって方は、ここでは詳細は省きますので、どこかの情報を参考にしてちゃちゃっと作ってください。 ChatGPTのサイトにアクセスすると、下のような画面になるかと思います。

yasuhiro1212 2024/05/17

あとで読む

リンク

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性 (1/5)

筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子（あすきこ）さん」 PCローカル環境で動作する大規模言語モデル（LLM）「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT（GPT-4）と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

yasuhiro1212 2024/05/13

あとで読む

リンク

Windows上でユニコードを「見る」方法

Windowsでは、文字コードに「ユニコード」を使う。Windowsに搭載されているフォントはさまざまあるが、ユニコード文字を表示できるように、多数の文字の形が組み込まれている。今回は、Windowsでユニコードを“見る”方法について解説する。なお、WindowsではUTF-16LEエンコードをUnicodeと表記する。ここでは、エンコードと混同されないために、文字仕様のUnicodeは「ユニコード」とカナ書きすることにする。 GUIアプリでユニコードを使うユニコード文字は多数ある。それぞれの文字に割り当てられた文字コードをユニコードでは「コードポイント」と呼ぶ。コードポイントは、「U+」の後ろに16進数4桁または6桁で指定するのが正式な表記方法だ。たとえば、「漢」は「U+6F22」となる。ユニコード関連の文書やもちろん、インターネット内のウェブページでも同様の表記をすることが多い。

yasuhiro1212 2024/05/13

あとで読む

リンク

画像生成AIに“照明”革命　ControlNet開発者が作った「IC-Light」

画像生成AI関連の著名な開発者、lllyasviel（イリヤスフィール）氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light（Imposing Consistent Light）」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像（人物やオブジェクトなど）を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。現在、「テキスト条件付きリライティングモデル（text-conditioned relighting model）」と「背景条件付きモデル（background-conditioned model）」の2種類がGitHubで公開されており自由に試すことができる。なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

yasuhiro1212 2024/05/10

あとで読む

リンク

アップル、AI特化のM4チップで全Mac刷新か

アップルはMacシリーズを2024年後半からM4チップにアップデートしていく予定だという。米メディアBloombergのMark Gurman記者が4月11日に報じた。 M4チップは生成AIなどの人工知能機能のパフォーマンス向上に重点を置いて開発が進められているという。同氏によると、Macシリーズ全体が2024年後半から2025年前半にかけてM4チップに移行していく予定だという。まずはiMac、14インチMacBook Proのローエンドモデルとハイエンドモデル、16インチMacBook Pro、Mac miniがM4チップにアップデートされ、2025年春に13インチと15インチのMacBook Airが、2025年半ばにMac Studioが、2025年後半にMac Proがアップデートされると予想されている。なお、M4バージョンのMacのデスクトップ機種に搭載されるユニファイドメ

yasuhiro1212 2024/05/07

あとで読む

リンク

漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ (1/3)

発表当初は、画像生成AIに詳しいXユーザーのあいだで「画像生成AI『Stable Diffusion』で、追加学習モデル『LoRA』を使っているだけでは」という疑問の声も出ていたが、エンドルフィンは4月5日にプレスリリースを出し、「私たちが提供しているサービスは、公開されている汎用モデルを活用した生成AIとは一線を画しています」として、画像の生成までに独自のプロセスを踏んでいる旨を説明している。話題の「ピュアモデルAI」ができた経緯や、その技術的背景について、連載「メタバース・プレゼンス」を執筆している新清士氏とアスキー編集部で、エンドルフィンの代表と、サービス開発元のスーパーエンジンのCEOに話を聞いた。生成AIは「アナログからデジタル」の変化と同じ ──　最初にそれぞれの会社について教えてください。ジェームズ　キム・ドンジュン　2022年下半期ごろから、生成AIに関心をもって、

yasuhiro1212 2024/04/29

あとで読む

リンク

GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」

カナダのAIスタートアップCohereは4月4日（現地時間）、ビジネス向けに最適化された最新の大規模言語モデル（LLM）「Command R+」を発表した。高度なRAG技術を採用 Cohereは、AI業界に変革をもたらしたTransf ormerモデルを提唱した論文「Attention is All You Need」の共同執筆者として知られるトロント大学の研究者Aidan Gomez氏らによって2019年に設立されたカナダのAIスタートアップ。 OpenAIと同様、LLMの開発に特化しており、企業向けにチャットボット、検索エンジンの最適化、要約サービス、自社AIモデルのAPIなどを提供している。 Command R+は、同社が3月に発表した「Command R」の後継となるモデルであり、Cohereが得意とする高い効率性と精度のバランスを重視したRシリーズの一部となる。 128K（12万

yasuhiro1212 2024/04/09

あとで読む

リンク

WindowsでAndroidスマホをWebカメラにする機能を試した (1/2)

Microsoftが提供するWindowsとスマートフォンの連携機能「Windowsにリンク」に、AndroidスマートフォンをWindowsの「Webカメラ」にする機能がリリースされた。 AndroidスマートフォンをWindowsのWebカメラにする機能が搭載された。設定すると、スマートフォンをWindows仮想カメラとして利用できるスマートフォンとは無線LANでの接続で、Windows側では仮想カメラとして認識され、Windows標準のカメラアプリや各種ネットワーク会議アプリなどから利用できる。この機能は、プレビュー版だけでなく、現在の通常版Windows 11でも利用することができる。スマートフォンをWebカメラにする設定を整理する Microsoftのドキュメント（英語）（https://blogs.windows.com/windows-insider/2024/02/29

yasuhiro1212 2024/04/08

あとで読む

リンク

AI検索「Perplexity」がかなり便利だったので紹介します (1/5)

「ChatGPTはすぐに嘘をつくから調べものには使えない」という意見をよく聞くが、これには大きな誤解がある。そもそもChatGPTの心臓部である大規模言語モデル（LLM）は、膨大な知識を元にテキストを「生成」する仕組みだ。逆に言うと、知識として持っていないことは一切わからないので、知らないことについて説明を求められても能力的に不可能なのだ。だから、知識にない質問をされると答えられないだけでなく、苦し紛れに幻覚（ハルシネーション）を起こしてしまう。これが「すぐに嘘をつく」と言われる理由だ。結論を書いてしまうと「ChatGPTは検索ツールではない」のだ。むしろ「ChatGPTがいちばん苦手とすることが検索」なのだ。今回はこの欠点を補い、AIを活用した新しい検索の形を実現するという触れ込みのサービス「Perplexity.ai」を紹介していく。 Perplexity.aiとは Perp

yasuhiro1212 2024/04/06

あとで読む

リンク

すき家「うな丼」発売へ価格やや高く

牛丼チェーンすき家が11日、うなぎを使った新メニューを発表。18日から販売する。メニューは「うな丼」、牛丼とうな丼を合体させた「うな牛」、うな丼にとろろをのせた「うなとろ丼」、うな丼に温泉玉子をのせた「うなたま丼」の4種類。価格はうな丼（並盛）が790円。昨年4月発売のうな丼（並盛り）は780円だったため、10円の値上げになった。うなぎは焼いてから蒸し、タレで3度つけ焼きをくりかえしてかば焼きにする。同社サイトによれば、うなぎは中国の福建省や広東省で養殖されたもの。流通過程で同社が計11回の検査をしているという。検査基準としては流通している一般的な養殖うなぎよりも厳しいそうだ。 ●メニュー（並盛り価格）うな丼 790円うな牛 890円うなとろ丼 890円うなたま丼 860円

yasuhiro1212 2024/04/06

あとで読む

リンク

画像生成AIで同じキャラクターが簡単に作れるようになってきた (1/3)

画像生成AIサービスの「Midjourney」に3月12日、新機能「Creative Reference」が追加。1枚の画像から特徴を引き継いだ画像を生成できるようになり、同じキャラクターに別のポーズをとらせるなど様々な画像を作れるようになりました。これまで画像生成AI「Stable Diffusion」などで同じキャラクターの画像を作るには「LoRA」という追加学習をするのが一般的でしたが、それが必要ないため、キャラクターの再現が劇的に簡単になってきました。画像1枚で“似た顔”　Midjourneyの新機能「Creative Reference」使い方は、MidjourneyのDiscordに画像をアップロードして、「Creative reference」のタグ（cref）をつけてプロンプトを入力するだけ。CW 0〜100までのパラメーターがあり、0だと顔だけが共通になり、あとは数字

yasuhiro1212 2024/03/25

あとで読む

リンク

ChatGPTのライバル「Claude 3」の使い方　良い点、悪い点まとめ (1/5)

3月4日の公開以来、「Claudeやばくない？」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル（LLM）だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも書いていきたいと思う。 Claude 3とは？既報の通り、Claude 3はAnthropicが開発する大規模言語モデルの名称だ。パラメーターのサイズなどが異なる3つのモデルがラインアップされている。「Claude 3 Opus」は最も知能が高く、複雑なタスクでも最高のパフォーマンスを発揮する強力なモデル。APIやデータベースを介した複雑なアクションの計画や実行、インタラクティブコーディングなどの高度な活用が想定されている。「Clau

yasuhiro1212 2024/03/23

あとで読む

リンク

アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表

アップルの研究チームは3月14日、画像とテキストを理解し処理する能力を持つマルチモーダル大規模言語モデル「MM1」を発表した。今のところ論文のみの公開で、一般公開の時期は明かされていない。一部ベンチマークではGPT-4Vをも凌ぐ性能を発揮複数（30億、70億、300億）のパラメータサイズを備えるMM1は、10億以上の画像および30兆語以上のテキスト、GitHubのコード例などの多様なデータセットを用い、教師なし学習と教師あり学習を組み合わせる独自の方法で学習され、多様なタスクに対して高い精度を示すという。各種ベンチマークの結果によると、30億および70億パラメーターのモデルはそれぞれのモデルサイズにおいて過去最高を記録。特にVQAv2（画像理解）、TextVQA（画像内のテキスト情報）、ScienceQA（科学知識）、MMBench（マルチモーダル）、MathVista（数学）などの

yasuhiro1212 2024/03/19

あとで読む

リンク

日本発のリアルタイム画像生成AIサービスが熱い　大手にとっては“イノベーションのジレンマ”に (1/3)

Akuma.ai http://akuma.ai 2024年2月、日本発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました！たくさんご利用いただきありがとうございます。今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら：https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日本発の画像生成AIサ

yasuhiro1212 2024/03/18

あとで読む

リンク

PowerShellの今を見る　2つあるPowerShellはどっち使えばいい？ (1/2)

PowerShellに関しては、2021年に1回まとめたのだが、あれから3年も経過したので最新情報も含めて、簡単に解説したい。なお、それぞれのこれまでの経緯などは、過去記事に記載しているので参考にしてほしい。 ●あらためて「PowerShell」の現状と登場後の経緯を整理する https://ascii.jp/elem/000/004/052/4052789/ 結論から言えば、PowerShellには、Windowsに同梱されている「Windows PowerShell」と、ユーザーがインストールする必要がある「PowerShell」がある。コマンドラインを使う頻度が高いようならば、最新のPowerShellをインストール、そうでなければWindows PowerShellで十分である。 PowerShellのインストーラーなどに表示される奇妙な人物イラストを見たことがある人もいるだろう。

yasuhiro1212 2024/03/17

あとで読む

リンク

暴れ馬すぎる「Core i9-14900KS」、今すぐ使いたい人向けの設定を検証！ (1/4)

Core i9-14900KSのパッケージ（レンダリング画像）。Core i9-14900Kとほぼ同じデザインだが、「Special Edition」の表記がある事だけが異なる。Core i9-14900Kと同様にCPUクーラーは別売となる 2024年3月15日0時、インテルはデスクトップ向けインテルCoreプロセッサー（第14世代）のフラッグシップモデル「Core i9-14900KS」の販売をグローバルで解禁する。国内予想価格は税込12万4980円となっており、1年前に登場したCore i9-13900KS（初値12万3800円）とほぼ同価格からのスタートとなった。 Coreプロセッサー（第14世代）は、第13世代（Raptor Lake）の設計をそのまま継承しクロックを微増（Core i7のみEコア増）としたシリーズだ。特にこれまでの最上位モデルであるCore i9-14900Kは、

yasuhiro1212 2024/03/15

あとで読む

リンク

画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)

2月29日に、文化庁で「文化審議会著作権分科会」の第7回が開催されました。著作権の専門家によってその制度について議論をする場ですが、今年度は2023年7月より「AIと著作権」について議論されてきました。3月に文化庁から政府に報告する「AIと著作権に関する考え方について（素案）」の最終案に近いものが発表され、1月下旬から2月上旬にかけて募った「パブリックコメント（パブコメ）」の結果報告もされるということもあり、注目されました。登場したのは「AIと著作権に関する考え方について（素案）令和6年2月29日時点版」、パブコメの結果を受けて、これまでの内容に微修正が施されていました。しかし、そこからわかったのは、文化庁の一貫したスタンスでした。文化庁文化審議会著作権分科会法制度小委員会（第7回）パブコメへの反応は「素案の内容周知」発表物から議論を集めたのが発表資料に「パブコメの結果」が追加

yasuhiro1212 2024/03/11

あとで読む

リンク

はてなブックマーク

タグ

ブックマーク / ascii.jp (657)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス