タグ

ブックマーク / ascii.jp (58)

  • 情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)

    最新のアプリやサービスのニュースを書くのが仕事の筆者にとって情報の整理は永遠の課題だ。 もちろん書くことを仕事にしている人に限らず、氾濫する大量の情報を必要な時に取り出して利用したいという欲求は多くの人が持っているはずだ。 以前は手書きノートやファイルのような紙媒体に保存していた情報も、時代とともに完全にデジタルに移行し、EvernoteMicrosoft OneNoteNotionといったメモを作成することに特化したクラウドアプリを利用している人も多いだろう。 筆者はおそらく普通の人よりは多くのサービスに触れているはずだが、どれも帯に短したすきに長しに感じてしまい、複数のメモアプリに情報が散乱してしまっているのが実情だ。 そこで6月6日に日でも提供が開始されたグーグルの「NotebookLM」だ。 「AI駆動型のリサーチ、執筆アシスタント」と説明されているように、参照文献(ソース)

    情報整理の決定版「NotebookLM」が最高すぎる。こういうのがほしかったのよ!! (1/7)
    ahat1984
    ahat1984 2024/06/15
  • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

    Stability AI画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

    画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
    ahat1984
    ahat1984 2024/06/09
  • アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表

    アップルの研究チームは3月14日、画像とテキストを理解し処理する能力を持つマルチモーダル大規模言語モデル「MM1」を発表した。今のところ論文のみの公開で、一般公開の時期は明かされていない。 一部ベンチマークではGPT-4Vをも凌ぐ性能を発揮 複数(30億、70億、300億)のパラメータサイズを備えるMM1は、10億以上の画像および30兆語以上のテキスト、GitHubのコード例などの多様なデータセットを用い、教師なし学習と教師あり学習を組み合わせる独自の方法で学習され、多様なタスクに対して高い精度を示すという。 各種ベンチマークの結果によると、30億および70億パラメーターのモデルはそれぞれのモデルサイズにおいて過去最高を記録。特にVQAv2(画像理解)、TextVQA(画像内のテキスト情報)、ScienceQA(科学知識)、MMBench(マルチモーダル)、MathVista(数学)などの

    アップル、高度な言語理解を持つ新型AIモデル「MM1」を発表
    ahat1984
    ahat1984 2024/03/19
  • PowerShellの今を見る 2つあるPowerShellはどっち使えばいい? (1/2)

    PowerShellに関しては、2021年に1回まとめたのだが、あれから3年も経過したので最新情報も含めて、簡単に解説したい。なお、それぞれのこれまでの経緯などは、過去記事に記載しているので参考にしてほしい。 ●あらためて「PowerShell」の現状と登場後の経緯を整理する https://ascii.jp/elem/000/004/052/4052789/ 結論から言えば、PowerShellには、Windowsに同梱されている「Windows PowerShell」と、ユーザーがインストールする必要がある「PowerShell」がある。コマンドラインを使う頻度が高いようならば、最新のPowerShellをインストール、そうでなければWindows PowerShellで十分である。 PowerShellのインストーラーなどに表示される奇妙な人物イラストを見たことがある人もいるだろう。

    PowerShellの今を見る 2つあるPowerShellはどっち使えばいい? (1/2)
  • 「ExcelでChatGPTを再現するシート」が想像以上に素晴らしかった (1/4)

    先日サイトで「めちゃくちゃ重いけど動くぞ!Excelで『GPT-2』を再現したスプレッドシート」というニュースを執筆したのだが、実際に触ってみたところ想像以上に素晴らしかったのでレポートする。 「Spreadsheets-are-all-you-need」とは 記事で紹介した「Spreadsheets are all you need」とは、Excelの標準的なスプレッドシート機能を使ってGPT2(ChatGPTの先祖)のフォワードパス(入力から出力までのプロセス)をExcelの中で完全に実装したものだ。 と言ってももちろんExcel内で「ChatGPT」的な会話ができるわけではない。ChatGPTの心臓である大規模言語モデル(LLM)のごくごく基的な機能をシミュレートできるだけだ。 シートの説明文には「開発者でない人でも物のLLMが内部でどのように機能しているのかを、最小限の抽象

    「ExcelでChatGPTを再現するシート」が想像以上に素晴らしかった (1/4)
    ahat1984
    ahat1984 2024/03/09
  • 「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発

    AITuber「しずく」開発者としても知られる、あき先生ことakio kodaira氏を筆頭にした研究グループは12月21日、リアルタイム画像生成を実現するために最適化されたパイプライン「StreamDiffusion」を発表。従来の画像生成パイプラインと比べて飛躍的な速度向上を実現している。 ノイズ除去をバッチ処理で高速化 「Stable Diffusion」をはじめとする画像生成AIモデルの高性能化は著しいが、メタバース、オンラインストリーミングなど高スループットと低レイテンシーが必要な環境ではまだ力不足だ。 StreamDiffusionは新しいアプローチを採用し、従来の連続的なノイズ除去をバッチ処理のプロセスに変換することで、高スループットストリームを実現。さらに、GPUの利用効率を向上させるため、従来の分類器フリーガイダンス(CFG)に代わり、残差分類器フリーガイダンス(RCFG

    「100fps以上も可能」爆速すぎる画像生成AI技術、日本人研究者ら開発
  • 伊藤園「おーいお茶」CMに生成したAIタレントを起用

    伊藤園が「お~いお茶 カテキン緑茶」のテレビCMにAIタレントを起用した。AIタレント事業を手がける企業AI modelが、自社のAIタレントが採用されたことを10月3日に公表した。 CMに登場するAIタレントの名称は明らかにされていない。CMはテレビのほか、伊藤園の公式YouTubeチャンネルでも公開されており、物の人間と見分けがつかないレベルの仕上がりだ。 AI modelによると、AIタレントが登場するテレビCMは日初になるという。 同社は発表に際して「AI技術で生成したAI model(AIモデル)を活用して、モデル撮影の創造性や表現の豊かさを広げて、そこから得られる新しい価値などを提供していくことで、広告やファッションなど様々な業界の発展に貢献していきます」と述べている。 「お~いお茶 カテキン緑茶」シリーズは伊藤園が9月4日より販売を開始した製品。同シリーズはテレビCM以外

    伊藤園「おーいお茶」CMに生成したAIタレントを起用
    ahat1984
    ahat1984 2023/10/14
  • Windowsではプロセスからプログラムに関するさまざまな情報が得られる (1/2)

    Microsoftが提供するSysinternalsの「Process Explorer」を使うと、ジョブオブジェクトを調べることができる。Optionメニューの「Configure Color」でJobsのチェックボックスをオンにする。ジョブでグループ化されているプロセスに指定した色がつく コンピューターでは、プログラムを実行するとメモリに読み込まれて「プロセス」になる。プロセスからはさまざまな情報が得られる。今回は、プロセスから情報を取得する方法について解説する。その前に、プロセスや関連の用語が混乱しているので、1回整理しておこう。 そもそもWindowsにおける「プロセス」とは 「プログラム」とは命令の連なりであり、これを記録したものが実行ファイルだ。ほとんどのプログラムは、実行ファイルという形を持つが、プログラムがプログラムを作って、実行ファイルという形を経ずに実行させることもでき

    Windowsではプロセスからプログラムに関するさまざまな情報が得られる (1/2)
  • マイクロソフト、軽量かつ高性能な大規模言語モデル「phi-1」を発表

    Microsoft ResearchのAI研究チームは6月20日(現地時間)、わずか13億パラメーターと従来のものよりもサイズが小さいにも関わらず「GPT-3.5(1750億パラメーター)」を上回る成績を収めたTransformerベースの大規模言語モデル「phi-1」を発表した。このモデルは間もなく「Hugging Face」で公開される予定だといいう。 ベンチマークでGPT-3.5を凌駕 「Textbooks Are All You Need」と題された研究論文によると、このモデルは8台のA100(NVIDIAの高性能GPU)でわずか4日間かけて訓練され、インターネット上から取得した60億トークンの「教科書品質」データセットと、GPT-3.5で生成した10億トークンの微調整用「練習問題」データセットが使用された。 サイズが小さいにもかかわらず、phi-1はLLMの性能を測定するためのベ

    マイクロソフト、軽量かつ高性能な大規模言語モデル「phi-1」を発表
    ahat1984
    ahat1984 2023/06/24
  • 画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

    画像生成AIStableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i(image2image)」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。 その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

    画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)
    ahat1984
    ahat1984 2023/05/22
  • Windows Updateの状態をコマンドラインから調べる方法を考える (1/2)

  • netshコマンドでWin8のモバイルブロードバンドの情報を得る (1/2)

    コマンドラインからモバイルブロードバンドの デバイスや接続先の情報にアクセスする ここまで2回に渡って紹介してきた(関連記事、関連記事)、Windows 8で3GやLTEを扱うためのモバイルブロードバンドネットワーク(MBN)は、netshコマンドからも制御ができる。netshでは、デバイスの情報や接続先の情報などをアクセス可能だ。 netshは、ネットワーク関連の設定をコマンドライン(コマンドプロンプトウィンドウ)から行なうものだ。netshコマンドには、「コンテキスト」と呼ばれるネットワーク機能に対応するキーワードがあり、これで設定対象を切り替える。 たとえば、無線LAN関係の設定は「wlan」、モバイルブロードバンドならば「mbn」を使う。各コンテキストでは、netshの標準コマンドとコンテキスト独自のコマンドが利用できる。主にコンテキスト独自のコマンドで各種の設定を行なう。 コンテ

    netshコマンドでWin8のモバイルブロードバンドの情報を得る (1/2)
  • Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)

    こんな簡単なコマンドで、Windowsは「しゃべって」くれる。画面キャプチャーでは声をお聞かせすることはできないが、お手元のWindows PowerShellで試してほしい スクリプトを作るとき、ちょっとユーザーの気を引きたくなることがある。たとえば、少し時間のかかる処理をするときに、終わったことを通知したい場合などだ。あるいは、実行後にすこし時間が経過してからエラーを通知するような場合にも、気を引きたくなることがある。 こんなとき昔のコンピューターならベル音やビープ音を鳴らすのが一般的だった。端末装置からコンピューターを使っていた頃、Ctrl+Gを出力するとベル音が鳴った。マイクロプロセッサが使われ始め、パソコンの原型ができあがった頃、BEEPと呼ばれる機能ができた。プログラムでビットをオンオフし、これをスピーカーに接続することで音を出していた。今もマザーボード上には、そのための小さな

    Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)
  • リスニング能力をひたすら鍛え上げられるサイト「ELLLO 」

    PCやスマホを使って、英語学習を時短にする便利なサービスやツールなどを紹介する連載。今回は、初心者から上級者まで、幅広くリスニング能力を向上できる「ELLLO」をご紹介します。 ELLLOは、「English Listening Lesson Library Online」の略で、読んで字のごとく、英語のリスニング学習に特化したオンライン学習サイト。3000以上という多くの無料のレッスンが用意されており、幅広いレベルの学習者が利用できる。もともと、日英語教師だったTodd Beuckens氏が創設したサイトで、2004年にスタートしたサイトだ。 メインの学習コンテンツは、ひたすら英語の音声を聞くというもの。スクリプトも用意されているため、聞き取れなかった場合も内容は把握できる。理想的なのは、スクリプトを見なくても聞き取れるようになることだ。 メインコンテンツとなるリスニングレッスンは、

    リスニング能力をひたすら鍛え上げられるサイト「ELLLO 」
  • Windows 10で秋の大型アップデートが始まったのに、春のアップデートも落ちてこないマシンがあるのはなぜ? (1/2)

    Windows 10 Ver.20H2の一般向け配信が開始されたのに いまだにVer.2004が落ちてこないマシンがある 仕事柄、筆者宅には、Windows 10が動作しているPCが複数ある。Windows Insider Previewをインストールしているマシンもあるが、何台かは最新のWindows 10を入れている。その中には、Windows 10 Ver.2004がいまだに“落ちてこない”機種がある。すでに「October 2020 Update」ことWindows 10 Ver.20H2の一般向け配布が開始されているのに、Windows 10 Ver.1909のままなのだ。 機種によって配布が遅れている原因は「Safeguard Holds」と呼ばれる措置が原因だ。これは機能アップデートを実行した結果、障害が発生することをMicrosoft側で検出した場合に、同じ条件を持つマシン

    Windows 10で秋の大型アップデートが始まったのに、春のアップデートも落ちてこないマシンがあるのはなぜ? (1/2)
  • 2019年IT業界重要イベントカレンダー

    テクノロジー、ムーブメントの最前線。大企業もベンチャー企業も注目の2019年IT業界重要イベントの大規模展示会、カンファレンス、技術勉強会などをまとめて紹介。 2019年1月 8日~11日 CES 2019(アメリカ・ラスベガス) 「世界最大の家電見市」 16日~18日 第5回 ウェアラブル EXPO(東京ビッグサイト) 「ウェアラブルガジェットの技術展示会」 26日、27日 闘会議2019(幕張メッセ) 「ニコニコがおくるゲーム大会、実況に特化したイベント」 2019年2月 6日~8日 第27回 3D&バーチャル リアリティ展(東京ビッグサイト) 「最先端の3D技術や超高精細の映像技術が一堂に出展し、その場で体験ができる専門技術展」 7日 MOBILITY PIONEERS(ミュンヘン、ドイツ) 7日~8日 イーコマースフェア 2019 東京(東京ビッグサイト) 「イーコマース・通販業

    2019年IT業界重要イベントカレンダー
  • Nintendo Switchのプッシュ通知を支えるテクノロジー

    テクノロジーに興味がある人なら、身近な製品の裏側って気になるもの。そんな知的欲求を満たしてくれるセッションが、昨年の夏に行なわれたre:Union 2018 Osakaには用意されていた。Nintendo Switchの裏側にあるシステムを紹介する「Nintendo Switch向けプッシュ通知システム『NPNS』」と題して、任天堂 ネットワークシステム部の渡邉 大洋さんが語ったセッションだ。フレンド登録したユーザーのゲームプレイ通知など、見慣れたあのメッセージは、こうやって送られていたのだ。 想定同時接続数1億台のリアルタイム通信インフラをAWSに構築 「実はこのセッション、AWS Summit Tokyoでもやったので聴いたことがある人がいるかもしれません。が、そこは今日初めて聴いたようなテンションで聴いてください」(渡邉さん) という出足で会場の笑いをさらった渡邉さんにならって私も書

    Nintendo Switchのプッシュ通知を支えるテクノロジー
  • Windows 10までほとんど手が入れられてこなかったWindowsのコンソール機能

    64bitWindowsでは16bitのDOSアプリは動かなくなったが 32bitのコンソールアプリは動作可能 「コマンドプロンプト」や「WSL」(Windows Susbsytem for Linux)を使う場合に利用するのが「コンソール」ウィンドウだ。このコンソールウィンドウは、テキスト主体のアプリケーションを実行する環境である。 Windowsでは、その祖先にあたるMS-DOSのアプリケーションをサポートするためにコンソールウィンドウが作られ、Windows XPまでは、16bitアプリケーションとしてMS-DOSアプリを動作できた。64bit版のVistaからは16bitアプリケーションのサポートはなくなったが、32bitのコンソールアプリケーションは実行できる。 もともとコンソールとは、ハードウェアとして、テキストの表示とキーボードからの入力をサポートしたもので、OSの支援など

    Windows 10までほとんど手が入れられてこなかったWindowsのコンソール機能
  • インストール不要で複数OSが高速起動する東大の変態Mac (1/5)

    東京大学では、学生や教職員が利用するPCや各種サービス一式を教育用計算機システム(ECCS)と呼んでおり、これを4年一度リプレースしています。2016年度はその更新時期にあたり、今回も入札の結果、クライアントマシンにはMacが選ばれました。東大では、2004年以来3期12年に渡ってMacが導入されてきましたが、、今回(ECCS2016)もこれが継承されたことで4年後の2020年3月(2019年度)までは引き続きMacが使われることになります。このあたりは、前回の取材記事で詳しく紹介しているので、文末に張ったリンクから関連記事をチェックしてください。 東大での取材で個人的にかなり気になったのが、もう変態といっていいほど特殊なMac。電源ボタンを押してもすんなりとOS Xが起動するわけではありません。Macハードウェア上で、UEFI(Unified Extensible Firmware In

    インストール不要で複数OSが高速起動する東大の変態Mac (1/5)
    ahat1984
    ahat1984 2016/12/22
  • なにこれヤバイ! 「パラッパ」「Rez」並の衝撃「PlayGround」

    もうヤバイ! びゅーんって音が出る! ヤバイ! 誰でも感動する! ヤバイ! とだけ書いていたら、上司が悲しそうな顔で「この仕事を辞めたいのか?」と聞いてきたので、ヤバイ理由をマジメに書くことにする。自分のクビがヤバくなってしまった。 百聞は一見にしかず。操作している画面を見るとそのかっこよさがわかる。 動画を見ればわかるが、操作方法は実際カンタン。楽曲パターンを選ぶと、画面上にパッドが現れて、それをなぞれば音が出る。これだけ。感覚としてはKORGの「iKaossilator」(関連記事)に似ているだろうか。 でも、そういうアプリは当に山ほどあるのだ。PlayGroundならではの、誰でもかっこよく演奏できるヤバイ秘密はどこにあるのか。 触ってみればわかる……というのはズルいので筆者なりの考えを言えば、パッドの配置が絶妙なのである。これに尽きる。 まず、リズムがカンタンに叩けるのが大きい。

    なにこれヤバイ! 「パラッパ」「Rez」並の衝撃「PlayGround」