kinushuのブックマーク - はてなブックマーク

Windowsが今更（？）開発者に優しくなろうとしている!? 「Dev Home」は開発者にとって使い物になる？ (1/2)

Dev Homeの起動画面。最初に「ダッシュボード」が表示される。ここには、登録したウィジェットが並び、ツールのアップデート状態やGitHubの通知などが表示できる。左側にあるのがページ切替のナビゲーション領域だ Build 2023で発表された開発者向けアプリ「Dev Home」開発が進められているようだ昨年5月に開催されたMicrosoftのイベント「Build 2023」で、「Dev Home」なるアプリケーションが発表された。しかし、Copilotと同じタイミングだったので、ほとんど話題になることはなかった。このとき、筆者もインストールして試してみたが、特筆するようなことは何もなく、ソフトウェアの開発には特に不要なものと判断していた。それから1年、プレビュー版はバージョンアップしていた。まだまだ完成ではないが、将来を考えるとWindowsを開発マシンとして使うときの「入口」ぐ

kinushu 2024/06/24

あとで読む

リンク

情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ！！ (1/7)

最新のアプリやサービスのニュースを書くのが仕事の筆者にとって情報の整理は永遠の課題だ。もちろん書くことを仕事にしている人に限らず、氾濫する大量の情報を必要な時に取り出して利用したいという欲求は多くの人が持っているはずだ。以前は手書きノートやファイルのような紙媒体に保存していた情報も、時代とともに完全にデジタルに移行し、Evernote、Microsoft OneNote、Notionといったメモを作成することに特化したクラウドアプリを利用している人も多いだろう。筆者はおそらく普通の人よりは多くのサービスに触れているはずだが、どれも帯に短したすきに長しに感じてしまい、複数のメモアプリに情報が散乱してしまっているのが実情だ。そこで6月6日に日本でも提供が開始されたグーグルの「NotebookLM」だ。「AI駆動型のリサーチ、執筆アシスタント」と説明されているように、参照文献（ソース）

kinushu 2024/06/15

あとで読む

リンク

アップルWWDCで明かされたのは「パーソナルインテリジェンス」への挑戦だった（西田宗千佳） (1/4)

今年のWWDCは「アップルAI祭り」になるのが必然だった。というか、そうでなかったら、アップルは「AIに関する取り組み」戦略で大変なダメージを負っていただろう。しかし、今回は予告通り、AIが主軸の発表になった。技術的に見れば、去年のVision Pro発表以上におもしろい内容だったと感じている。一方、アップルの生成AI 技術である「Apple Intelligence」は、まだ正しく理解されていないのではないかとも感じる。その証拠に、基調講演後には株価がグッと下がったものの、この記事を書いている6月11日（アメリカ時間）現在は大幅に上がっている。どういうものなのかが見えてきたから持ち直したのではないか……と考えている。

kinushu 2024/06/13

リンク

音楽生成AIの進化速度に舌をまく、無料でも試せるStable Audio 2.0を使う (1/2)

著作権侵害を未然に防ぐ機能も持つ昨年紹介した音楽生成AI「Stable Audio」が「Stable Audio 2.0」となり大きく進化した。生成AIがブレイクするきっかけを作った画像生成AI「Stable Diffusion」を開発したStability AIによる音楽生成AIだ。2023年8月にバージョン 1.0をリリースした際にはこの連載でも紹介した。グーグルの「MusicLM」のようにプロンプトを与えることで、音楽を作り出す音楽生成AIで、Stable Diffusionのようにステップを経て徐々に生成が完了する“拡散モデル”を使用しているのが特徴だ。Stable Audio 2.0では、モデルが新しくなったのが最大の改良点だ。ある入力に対応して生成される出力に関して、生成のルールやパターンを決めるのがモデルである。つまり、知識やアルゴリズムを持つ中核部分が改良されたことにな

kinushu 2024/04/08

あとで読む

リンク

アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表

アップルの研究チームは3月14日、画像とテキストを理解し処理する能力を持つマルチモーダル大規模言語モデル「MM1」を発表した。今のところ論文のみの公開で、一般公開の時期は明かされていない。一部ベンチマークではGPT-4Vをも凌ぐ性能を発揮複数（30億、70億、300億）のパラメータサイズを備えるMM1は、10億以上の画像および30兆語以上のテキスト、GitHubのコード例などの多様なデータセットを用い、教師なし学習と教師あり学習を組み合わせる独自の方法で学習され、多様なタスクに対して高い精度を示すという。各種ベンチマークの結果によると、30億および70億パラメーターのモデルはそれぞれのモデルサイズにおいて過去最高を記録。特にVQAv2（画像理解）、TextVQA（画像内のテキスト情報）、ScienceQA（科学知識）、MMBench（マルチモーダル）、MathVista（数学）などの

kinushu 2024/03/18

あとで読む

リンク

日本発のリアルタイム画像生成AIサービスが熱い　大手にとっては“イノベーションのジレンマ”に (1/3)

Akuma.ai http://akuma.ai 2024年2月、日本発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました！たくさんご利用いただきありがとうございます。今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら：https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日本発の画像生成AIサ

kinushu 2024/03/18

リンク

ChatGPTで画像生成するならコレ!　おすすめGPTs紹介 (1/6)

OpenAIは1月10日、カスタムバージョンのGPTを作成できる「GPTs」機能で作成した多様なGPTを探索できる「GPT Store」の公開を予告通り開始した。今回はストアーのラインアップから画像生成系の「DALL·E」カテゴリーを取り上げてみよう。「DALL·E」カテゴリー「DALL·E」カテゴリーには言うまでもなくOpenAIの画像生成AI「DALL·E 3」を便利に使うために作られたカスタムGPTが掲載されている。今回は上位6個のGPTを使ってみることにする。まずは「DALL·E」カテゴリーのトップ「image generator」というGPTを試してみよう。説明欄には「プロフェッショナルかつフレンドリーなトーンで画像を生成し、洗練させることに特化したGPT（A GPT specialized in generating and refining images with a

kinushu 2024/03/02

あとで読む

リンク

画像生成AI、安いPCでも高速に　衝撃の「Stable Diffusion WebUI Forge」 (1/4)

Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel（イリヤスベル）さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL（SDXL）が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStabl ity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

kinushu 2024/02/26

あとで読む

リンク

昨年末に無料プランを大幅制限したEvernote、一部機能を無料化

オンラインノートサービス「Evernote」は2月14日（現地時間）、無料プランの機能制限を緩和。これまで有料プラン向けに提供していた14の機能を無料プランのユーザーにも開放した。新たに無料化された機能は以下の通り。・履歴のメモと復元・オフラインノートとノートブック・PDF 注釈・PDFエクスポート・名刺スキャン・スプレッドシートのプレビュー機能・Evernote にメモをメールで送信・メールによるノートの共有・カスタムグローバルキーボードショートカット・モバイルの「作成」ボタンをカスタマイズ・カスタムテンプレート・ブール検索（AND、OR、NOTなどの演算子を使った高度な検索機能）・位置情報の検索・ドキュメントと画像の検索（無料プランでは2月14日以降に追加したコンテンツのみ対応）

kinushu 2024/02/15

あとで読む

リンク

【自腹レポ】アップルVision Proの「歴史的価値」はなにかを考える（西田宗千佳） (1/3)

Vision Proを購入して一週間ほどが経過した。その間筆者は毎日使っている。 SNS上ではVision Proを使った動画がバズる一方で、「結局できることはほかと同じではないか」「過去にも似たようなものはあった」という話が出てくる。では、Vision Proは、コンピュータの歴史上どう位置付けられるべきなのか？マイクロソフトの「HoloLens」やMeta Quest、果ては初代MacintoshやWindowsのことまで考え、まとめてみよう。 Vision Proがしていることは「空間にオブジェクトを並べることだけ」だが…… 空間にアプリケーションのウィンドーを浮かべ、それらを並べて空間を活用して作業をする。極論すれば、Vision Proがやっているのはこれだけだ。映画は「巨大なウィンドーを空中に配置して楽しむ」ことだし、複数の作業をするのも同様。巨大な恐竜を空中に表示す

kinushu 2024/02/13

あとで読む

リンク

“世界生成AI”到来か　画像生成AIのゲームエンジン化が進む (1/5)

Midjourneyの生成画像。12月のアップデートのv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか（筆者作成）画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

kinushu 2024/01/22

リンク

約50万円のアップル「Vision Pro」予約にいたった経緯を解説する（西田宗千佳） (1/3)

1月19日22時（日本時間）といえば？そう、もちろん「Apple Vison Pro」の予約開始時間だ。まあ普通に考えればハードルは高い。高いだけでなく、「アメリカ市場向けのみ」というのがいろいろ大変だ。普通なら「数ヵ月から1年以内に日本で出るから、それまで待とう」という判断になるだろう。だが、筆者の友人・知人やSNSで絡む人々はテックガジェットガチ勢ばかりなので、「3500ドル（およそ51万8500円）の高額商品をアメリカから（もしくはアメリカに行って買う）」覚悟が完了した、面構えの違う人々なのでだいぶ麻痺している。というわけで、その麻痺した頭で購入にいたった経緯をちょっと解説してみよう。まずは「アカウントの準備」からアメリカからは事前に「Tips」メールもすでに述べたように、Vision Proはまずアメリカ市場でだけ売られる。根本的な理由はアップルのみぞ知る、というと

kinushu 2024/01/20

リンク

円形のオーディオスペクトラム作ったんですが、Adobe AEの使い方を学ぶよりChatGPTに聞きながらPythonで実装する方がラクでした（個人的に）

メンヘラテクノロジーの高桑蘭佳です。最近イケボからイケメンを生成する方法を考えてみたり（前編 / 後編）、音関連のものに興味・関心が強くなっています。この記事を書いている時点では、Xを中心に音楽生成AI「Suno AI」が話題になっており、私も曲を生成してみました。プロダクトのイメージソング的なものへの憧れもあったので、自社アプリ「DIALS2」のコンセプトテキストをもとにChatGPTに歌詞へ書き換えてもらい、Suno AIに曲をつくってもらいました。2000年代のネオヴィジュアル系の要素を取り入れたメンズ地下アイドルグループが歌ってそうな曲がほしいという思いをChatGPTとSuno AIには伝えました。 https://app.suno.ai/song/d3890905-d799-4bfa-812e-72c74f400445/ 前置きが長くなってしまいましたが、音楽を生成してもら

kinushu 2024/01/13

あとで読む

リンク

秒100枚の画像生成ができるという「Stream Diffusion」を動かそうとしたらたいへんだったお話 (1/3)

美少女画像を生成しようと思い立ち7月にゲーミングPCを購入してからはや半年、当初の目標であった画像生成にはなんとか成功したものの、とにかくこのジャンルは進化が早い。苦労して新しい技術を使えるようになったと思ったらすぐに次のとんでもない技術が登場し、以前のものは古くなっていく。なんとか振り落とされないようについていくのがやっとだが、それでも猛烈におもしろく刺激的な半年間だった。「Stream Diffusion」爆誕 StreamDiffusion、ほぼ100fpsで画像生成出来るようになりました！！ sd-turbo, 512x512, batch size 1, txt2imgだと10msで1枚画像が生成出来ます！多分これが一番速いと思います pic.twitter.com/4qleR2isW1 — あき先生 / Aki (@cumulo_autumn) December 6, 20

kinushu 2024/01/07

リンク

「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。ノイズ除去をバッチ処理で高速化「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス（CFG）に代わり、残差分類器フリーガイダンス（RCFG

kinushu 2023/12/22

あとで読む

リンク

これは嬉しい　ChatGPTプロンプト書き方のコツ、OpenAIが公開

OpenAIは、大規模言語モデル（GPT-4）でよりよい結果を出すためのプロンプトエンジニアリング（プロンプトのノウハウ）入門テキストを同社のウェブサイトで公開している。同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術（コツ）が掲載されている。また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。では紹介された6つの戦略を見ていこう。明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。具体的な戦術としては下記が提案されている。・より関連性の高い回答を得られるよう、質問は詳細に・モ

kinushu 2023/12/19

リンク

さくらインターネットがガバクラ事業者に選ばれた理由を深掘りする

長らく外資系のみだった政府のガバメントクラウドの選定事業者に、さくらインターネットが選定された。大手通信事業者ではなく、なぜさくらインターネットが選ばれたのか？　外資系クラウドとの競合というテーマがナンセンスである理由とは？　さくらインターネットを集中的に取材していた立場から深掘りしてみた。条件付きながら、ガバメントクラウドとして初の国産事業者へ私がラスベガスで開催されていたAWS re:inventでグローバルクラウドのスケールに圧倒されていた11月末、日本のガバメントクラウドの事業者としてさくらインターネットが認定されたというニュースが流れた。「2025年度末までに技術要件を満たす」という条件付きながら、ガバメントクラウドの提供基盤として「さくらのクラウド」が利用できるようになるのだ。従来はAWS、Microsoft Azure、Google Cloud、Oracle Cloud

kinushu 2023/12/16

あとで読む

リンク

偽名で運用 !? Azureデータセンターの「トリビア」を集めてみた

世界140カ国以上の地域に100以上配置されているマイクロソフトのデータセンター（DC）。ここで、Microsoft Azureのほか、Office 365、OneDrive、Bingなど同社のクラウドサービスが運用されている。今回は、思わず誰かに話したくなる「Azureデータセンターのトリビア」を集めてみた。教えてくれるのは、マイクロソフトテクノロジーセンターセンター長の澤円さんだ（聞き手、アスキー羽野三千世）。 AzureのDCは・・・「知られざる謎の組織」が運用している澤さん：AzureのDCは“知られざる謎の組織”によって構築、運用されています。この組織は「MCIO（Microsoft Cloud Infrastructure and Operations）」という名称で確かにマイクロソフト社内に存在しているのですが、MCIOに誰が所属しているのかは、社員にも知らされていません

kinushu 2023/12/13

リンク

これ、かなり革命的。自分のChatGPTが作れる「GPTs」 (1/4)

OpenAIは11月6日、開発者向けイベント「OpenAI DevDay 2023」を開催した。開発者向けというだけあり、発表内容は「GPT-4 Turbo」をはじめとする新モデルやAPIについてが多かったが、ChatGPTに関するものもいくつか発表された。中でも注目はオリジナルのチャットボットを作れる「GPTs」および、作ったものを販売できる「GPT Store」ではないだろうか。「GPT-4 All Tools」とは？まずは「GPT-4 All Tools」について説明しておこう。「DevDay」が終了した翌日、いつものように「ChatGPT Plus」にアクセスするとこのようなウィンドウが表示された。「ChatGPTはウェブブラウズ、データ分析、画像生成ができるようになりました。これらの機能はGPT-4に組み込まれており選択する必要はありません。Plusユーザーはご利用い

kinushu 2023/11/18

あとで読む

リンク

画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている (1/3)

10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3（ダリ３）」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日本語で「猫の画像を作ってください」などと入れるだけでかわいい猫の画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資本で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。「ラーメンを食べる女の子」が描ける！なにより衝撃的だったのは、「アニメ風の少女と猫が遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です

kinushu 2023/10/16

あとで読む

リンク

はてなブックマーク

タグ

ブックマーク / ascii.jp (212)

お知らせ

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス