fashiのブックマーク - はてなブックマーク

動画生成AIの進化が止まらない　今度は「Runway」の動画が超高品質に

動画生成サービスを展開するRunwayは6月17日、高品質で詳細な制御が可能な次世代の動画生成モデル「Gen-3 Alpha」を発表した。「汎用世界モデル」構築のための第一歩 Introducing Gen-3 Alpha: Runway’s new base model for video generation. Gen-3 Alpha can create highly detailed videos with complex scene changes, a wide range of cinematic choices, and detailed art directions.https://t.co/YQNE3eqoWf (1/10) pic.twitter.com/VjEG2ocLZ8 — Runway (@runwayml) June 17, 2024 Gen-3 Alph

fashi 2024/06/19

画像生成

リンク

革命レベルの動画生成AI「Kling」　ついに「Sora」対抗が出てきた

中国のSNS「快手（Kuaishou）」は、テキストから最大2分間の動画を生成できる動画生成モデル「可灵（Kling）」を開発。多数のサンプル動画を掲載するデモサイトを公開した。テキストから最大2分間のフルHD動画を生成 A Chinese AI video generator just dropped before we got access to Sora Can generate 2-minute videos at 30fps, 1080p quality, available on the KWAI iOS app with a Chinese phone number A few generations from their site: 1. pic.twitter.com/NEmWiqKHiO — Rowan Cheung (@rowancheung) June 6, 20

fashi 2024/06/08

リンク

実録：AIで描く漫画の実際～AIで今風の手描きっぽい漫画を作ってみる (1/6)

こんにちは、漫画界の生き恥こと野火城と申します。「画像AI使ってみた／AI 漫画実験企画」第2回です！ ■第1回はこちら　実録：AIで描く漫画の実際～体験して見えた、その実力と課題!! その成り立ちから様々な議論を呼んでいる画像生成AIですが、少なくとも2024年3月現在日本の法律では使用が許可されており、存在を完全に無視する事はできません。かといって全てを肯定して受け入れるのも難しい。だからこそ、必要以上に恐れず、実際にどのような事が出来るのか、具体的に検証する――それが画像AIとの誠実な向き合い方なのではないでしょうか。「画像AIの技術がすごいという賞賛記事はよく見るが、それは本当に創作活動で実戦的に使えるものなのか？　『AIに仕事を奪われる』と『今のAIは実戦では使い物にならない』という真逆の意見を多数見るが、この二つは両立しないのでは？　実際はどっちなんだ？」「画像AIを試し

fashi 2024/05/30

「気になる部分だけバケツツールやペンツールなどで手動で直しました」普通に描くのと変わらないくらい直してそう

画像生成

リンク

画像生成AIに照明革命　日本と世界で同時に“神ツール”登場 (1/3)

この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール（lllyasviel）さんが発表した「ICライト（Imposing Consistent Light、印象的な一貫的なライト）」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。画像生成AIで照明効果がつけられる「ICライト（IC-Light）」発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

fashi 2024/05/28

リンク

電源端子が丸形／角型のノートPCでもコンパクトACアダプターが使えるケーブル

エレコムは5月21日、USB Type-Cポート搭載のAC充電器をノートパソコンの丸形／角型の電源ポートに接続するケーブル2商品を発売した。 AC充電器（別途必要）から、ノートパソコンの丸型／角型の電源ポートへの充電を可能変換ケーブル。重くてかさばるノートパソコン付属のACアダプターに比べ、軽量かつコンパクトに持ち運ぶことができる。最大出力100WのUSB Power Deliveryに対応しており、一部のハイスペックノートパソコンでも使用可能。床などの離れた差込口からも取り回しやすいおよそ2mのロングケーブルとなっている。

fashi 2024/05/22

エレコムからも出るPDトリガー

ガジェット

リンク

画像生成AIとしても超進化したChatGPT「GPT-4o」

OpenAIは5月13日（現地時間）、「Spring Update」と題したオンラインプレゼンテーションを配信。新しい大規模言語モデル（LLM）「GPT-4o（オー）」がお披露目された。プレゼンテーションではまるで人間と話しているような音声会話機能が話題になっているが、実はウェブサイトに掲載された記事を見ると画像生成機能も大幅に性能アップしていたことがわかった。一貫性の保持。AIコミックが描けるぞ！今回のプレゼンテーションではなぜかまったくと言っていいほど触れられていなかったが、画像生成AI「DALL-E 3」（おそらく）を使用した画像生成能力も大幅に進化しているようだ。まず、いちばん驚いたのは画像の一貫性の保持だ。なぜなら、DALL-E 3やStable Diffusionなどの画像生成AIにとって「同じキャラクター」を生成するのは最も苦手な仕事だからだ。

fashi 2024/05/18

やはりデモのようにはいかない

リンク

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性 (1/5)

筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子（あすきこ）さん」 PCローカル環境で動作する大規模言語モデル（LLM）「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT（GPT-4）と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

fashi 2024/05/13

「RTX A6000（GDDR6 48GB）搭載PCでやっと動作しました」何はなくともVRAM

ai

リンク

Windows上でユニコードを「見る」方法

Windowsでは、文字コードに「ユニコード」を使う。Windowsに搭載されているフォントはさまざまあるが、ユニコード文字を表示できるように、多数の文字の形が組み込まれている。今回は、Windowsでユニコードを“見る”方法について解説する。なお、WindowsではUTF-16LEエンコードをUnicodeと表記する。ここでは、エンコードと混同されないために、文字仕様のUnicodeは「ユニコード」とカナ書きすることにする。 GUIアプリでユニコードを使うユニコード文字は多数ある。それぞれの文字に割り当てられた文字コードをユニコードでは「コードポイント」と呼ぶ。コードポイントは、「U+」の後ろに16進数4桁または6桁で指定するのが正式な表記方法だ。たとえば、「漢」は「U+6F22」となる。ユニコード関連の文書やもちろん、インターネット内のウェブページでも同様の表記をすることが多い。

fashi 2024/05/13

プログラミング

リンク

キーボードとマウスをつなぐDINおよびPS/2コネクター　消え去ったI/F史 (1/3)

初期のPCでは必須だったのに、今では存在しないコネクターとI/Fの代表例がキーボードで、これにマウスが続く格好だろうか。もっともこれアーキテクチャーによっていろいろ違うのだが、今回はIBM-PC系列の話である(Macintoshはまた異なるし、日本のPC-98シリーズもいろいろ異なる)。 DINコネクターを採用した IBM-PC標準装備のキーボード初代のIBM-PC(IBM Model 5150)の場合、ユーザー入力デバイスはキーボードのみだった。まだマウスはこの時点で世間的には普及していない("Mouse"と名付けられたデバイスそのものは1965年に、Douglas Engelbart博士によって発明されている)が、これがPCの世界に入ってきたのは1985年にMicrosoftが初代のMicrosoft Mouseを発売してからだったと記憶している。というわけで最初のIBM-PCには

fashi 2024/05/07

え、まだデカイデスクトップPCなんかには付いてるっしょ？って思って調べたらEPSONとMSIのデスクトップにしか付いてなかった

キーボード

リンク

話題のAI「Command R+」無料iPhoneアプリで試せるように

AI関連企業Hugging FaceのJulien Chaumond CTOは4月18日、自身のXアカウントで、AIチャットサービス「HuggingChat」のiOS版アプリを発表した。 we just shipped HuggingChat on iOS 💬 The app is super polished and gives you access to the community's best open AI models, on the go. Give it a try! link to Appstore below ⤵️ pic.twitter.com/ZItn9NLpay — Julien Chaumond (@julien_c) April 18, 2024 HuggingChatは2023年4月、ブラウザー版の提供が始まったオープンソースのチャットAIサービス。メタのL

fashi 2024/04/19

HuggingChat

ai

リンク

AI検索「Perplexity」がかなり便利だったので紹介します (1/5)

「ChatGPTはすぐに嘘をつくから調べものには使えない」という意見をよく聞くが、これには大きな誤解がある。そもそもChatGPTの心臓部である大規模言語モデル（LLM）は、膨大な知識を元にテキストを「生成」する仕組みだ。逆に言うと、知識として持っていないことは一切わからないので、知らないことについて説明を求められても能力的に不可能なのだ。だから、知識にない質問をされると答えられないだけでなく、苦し紛れに幻覚（ハルシネーション）を起こしてしまう。これが「すぐに嘘をつく」と言われる理由だ。結論を書いてしまうと「ChatGPTは検索ツールではない」のだ。むしろ「ChatGPTがいちばん苦手とすることが検索」なのだ。今回はこの欠点を補い、AIを活用した新しい検索の形を実現するという触れ込みのサービス「Perplexity.ai」を紹介していく。 Perplexity.aiとは Perp

fashi 2024/04/07

ai

リンク

ChatGPTのライバル「Claude 3」の使い方　良い点、悪い点まとめ (1/5)

3月4日の公開以来、「Claudeやばくない？」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル（LLM）だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも書いていきたいと思う。 Claude 3とは？既報の通り、Claude 3はAnthropicが開発する大規模言語モデルの名称だ。パラメーターのサイズなどが異なる3つのモデルがラインアップされている。「Claude 3 Opus」は最も知能が高く、複雑なタスクでも最高のパフォーマンスを発揮する強力なモデル。APIやデータベースを介した複雑なアクションの計画や実行、インタラクティブコーディングなどの高度な活用が想定されている。「Clau

fashi 2024/03/23

ai
chatgpt

リンク

日本発のリアルタイム画像生成AIサービスが熱い　大手にとっては“イノベーションのジレンマ”に (1/3)

Akuma.ai http://akuma.ai 2024年2月、日本発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました！たくさんご利用いただきありがとうございます。今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら：https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日本発の画像生成AIサ

fashi 2024/03/18

画像生成

リンク

PowerShellの今を見る　2つあるPowerShellはどっち使えばいい？ (1/2)

PowerShellに関しては、2021年に1回まとめたのだが、あれから3年も経過したので最新情報も含めて、簡単に解説したい。なお、それぞれのこれまでの経緯などは、過去記事に記載しているので参考にしてほしい。 ●あらためて「PowerShell」の現状と登場後の経緯を整理する https://ascii.jp/elem/000/004/052/4052789/ 結論から言えば、PowerShellには、Windowsに同梱されている「Windows PowerShell」と、ユーザーがインストールする必要がある「PowerShell」がある。コマンドラインを使う頻度が高いようならば、最新のPowerShellをインストール、そうでなければWindows PowerShellで十分である。 PowerShellのインストーラーなどに表示される奇妙な人物イラストを見たことがある人もいるだろう。

fashi 2024/03/18

リンク

画像生成AIの著作権問題、文化庁議論で争点はっきり (1/4)

2月29日に、文化庁で「文化審議会著作権分科会」の第7回が開催されました。著作権の専門家によってその制度について議論をする場ですが、今年度は2023年7月より「AIと著作権」について議論されてきました。3月に文化庁から政府に報告する「AIと著作権に関する考え方について（素案）」の最終案に近いものが発表され、1月下旬から2月上旬にかけて募った「パブリックコメント（パブコメ）」の結果報告もされるということもあり、注目されました。登場したのは「AIと著作権に関する考え方について（素案）令和6年2月29日時点版」、パブコメの結果を受けて、これまでの内容に微修正が施されていました。しかし、そこからわかったのは、文化庁の一貫したスタンスでした。文化庁文化審議会著作権分科会法制度小委員会（第7回）パブコメへの反応は「素案の内容周知」発表物から議論を集めたのが発表資料に「パブコメの結果」が追加

fashi 2024/03/11

「著作権法の範囲にとどまるものではない」「具体的な判断は個別の事案に応じた司法判断による必要がある」嫌いな人は今後は著作権とは違う手斧で攻めてほしいってことかな。営業妨害とか？

著作権

リンク

「ExcelでChatGPTを再現するシート」が想像以上に素晴らしかった (1/4)

先日本サイトで「めちゃくちゃ重いけど動くぞ！Excelで『GPT-2』を再現したスプレッドシート」というニュースを執筆したのだが、実際に触ってみたところ想像以上に素晴らしかったのでレポートする。「Spreadsheets-are-all-you-need」とは記事で紹介した「Spreadsheets are all you need」とは、Excelの標準的なスプレッドシート機能を使ってGPT2（ChatGPTの先祖）のフォワードパス（入力から出力までのプロセス）をExcelの中で完全に実装したものだ。と言ってももちろんExcel内で「ChatGPT」的な会話ができるわけではない。ChatGPTの心臓である大規模言語モデル（LLM）のごくごく基本的な機能をシミュレートできるだけだ。本シートの説明文には「開発者でない人でも本物のLLMが内部でどのように機能しているのかを、最小限の抽象

fashi 2024/03/09

リンク

昔はまったく売れなかった「電気の要らない自動ドア」が人気を集めているらしい

Newtonプラスが、3月2日、日本トーターグリーンドーム前橋で開催中の「UPDATE EARTH 2024 ミライMATSURI@前橋」で「電気を使わない自動ドア」を展示した。電気で開閉するから自動ドアなのに、電気を使わないとはどういうことか？　聞けば、床板に荷重がかかるとドアが開く構造を持った、機械式の自動ドアだという。電気によるランニングコストが発生しないことに加え、災害時や停電時でも開かなくなることがない安全性、人が乗っている限りは閉まることがないので、挟まれる心配もないなど、メリットは複数ある。建物の構造的に建築基準法をクリアできない場合を除き、既存の自動ドアを置き換える形で設置することも可能。主に自治体や、ビル内の授乳室、災害時の避難所の役割を果たしている地域の店舗やビルといった、公共性の高い場所への導入が進んでいるという。この製品、実は14年前に発売されているが、ほと

fashi 2024/03/04

技術

リンク

日本発の画像生成AIサービスがすごい　無料アップスケーラー「カクダイV1」 (1/4)

「カクダイV1」でアップスケールした画像（左）、「Midjouney v6」で作成したオリジナル画像（右）画像の描き込みを増やして高画質にする、日本発の生成アップスケーラー「カクダイV1」が2月7日に発表されて話題になりました。東大出身ベンチャーのMavericksが開発したもので、画像生成AI「Stable Diffusion」生成環境「ComfyUI」向けの技術として無料公開されています。人気アップスケーラー「Maginific AI」を超える製品にまでに成長していくのか注目です。 Stable Diffusionのアップスケールは難しかったカクダイを紹介する前に、まずは画像生成AIとアップスケーラーとの関係についてお話します。 Stable Diffusion登場後の画像生成AI 技術を使ったアップスケーラーは、単に画像を拡大させるだけの用途ではなくなりました。画像を拡大するとき、

fashi 2024/02/19

画像生成

リンク

昨年末に無料プランを大幅制限したEvernote、一部機能を無料化

オンラインノートサービス「Evernote」は2月14日（現地時間）、無料プランの機能制限を緩和。これまで有料プラン向けに提供していた14の機能を無料プランのユーザーにも開放した。新たに無料化された機能は以下の通り。・履歴のメモと復元・オフラインノートとノートブック・PDF 注釈・PDFエクスポート・名刺スキャン・スプレッドシートのプレビュー機能・Evernote にメモをメールで送信・メールによるノートの共有・カスタムグローバルキーボードショートカット・モバイルの「作成」ボタンをカスタマイズ・カスタムテンプレート・ブール検索（AND、OR、NOTなどの演算子を使った高度な検索機能）・位置情報の検索・ドキュメントと画像の検索（無料プランでは2月14日以降に追加したコンテンツのみ対応）

fashi 2024/02/15

Webサービス

リンク

“世界生成AI”到来か　画像生成AIのゲームエンジン化が進む (1/5)

Midjourneyの生成画像。12月のアップデートのv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか（筆者作成）画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

fashi 2024/01/22

VR・AR

リンク

はてなブックマーク

タグ

ブックマーク / ascii.jp (245)

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第2週）

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス