
マイクロソフト、OSを介さず仮想化ハイパーバイザ上でWasmを高速起動し実行できる「Hyperlight Wasm」、オープンソースで公開 Hyperlightはマイクロゲストを実現するライブラリ Hyperlight Wasmの基盤となるHyperlightは、仮想化ハイパーバイザ上にマイクロゲストを作成するライブラリソフトウェアです。 そもそも仮想化ハイパーバイザでは一般に、ホストとなる仮想化ハイパーバイザ上にゲストとなる仮想マシンが作成され、その仮想マシン内でOSが実行され、OS上でアプリケーションが実行される、という階層構造になっています。 仮想マシンやOSなどから構成されるこうした階層構造のおかげで、アプリケーションの実行環境の互換性が保たれるわけですが、一方でこれはコンピューティングリソースの面ではオーバーヘッドであり、アプリケーションが起動するまでの時間もかかります。 Hyp
楽天証券は3月21日夜、ユーザー向けに緊急の注意喚起を実施した。ただちにログイン追加認証サービス(二要素認証)を設定し、自身の資産保全を図るよう呼びかけている。 ログイン追加認証サービスは、楽天証券の「マイメニュー>セキュリティ設定>ログイン追加認証」から設定できる。 楽天証券によると、楽天証券を装ったフィッシング詐欺により、ログインIDとパスワード、および取引暗証番号が盗用される事態が多発しているという。 ログイン追加認証サービスを設定することで、仮にフィッシングサイトが存在しても、ID・パスワード等の認証情報を盗まれるリスクが軽減されるという。また、取引暗証番号は株式の注文や各種変更の際に必要となる事はあるが、ログインIDとパスワードの入力直後に求められることはないとしている。 さらに、「楽天証券を装う電子メールを経由した不正取引被害が急増している」として、あわせて注意喚起している。
はじめに 開発業務で「情報収集」や「タスク自動化」をするときにスクレイピングやクローリングを用いる場合があると思います。一時期私もスクレイピング関連の本を読んでBeautifulSoup, Seleniumなどを使って自動化をしましたが、CSSセレクタを指定していくのが大変だったり、DOM構造が変わると動かなくなったりと、色々苦労した覚えがあります。 そんな時、browser-useという面白そうなライブラリを見つけたので、この記事では、browser-useを使ってみた内容を自分用のメモとして残そうと思います。 browser-useとは? browser-useはAIを使ってブラウザ操作を自動化してくれるツールです。 このツールは、Pythonを使ってブラウザで実行する操作をテキストで渡してあげると、AIがそのテキストに基づき操作を行ってくれます。そのためスクレイピング/提携業務の自動
2025年1月24日、OpenAIはウェブ上のタスクを自動実行するAIエージェント「Operator」を公開しました。 ユーザー専用のリモートブラウザを使ってサイトを閲覧・操作し、さまざまなタスクを自動化できます。 現在はアメリカのProユーザー向けの研究プレビュー版として提供されており、OpenAIはユーザーからのフィードバックをもとに機能を改善しながら、将来的にはPlusやTeam、Enterpriseへの展開も検討されています。 「Computer-Using Agent(CUA)」とは?Operatorの中核にあるのが、新しいモデルである Computer-Using Agent(通称:CUA) です。 GPT-4oの視覚的能力と強化学習による推論力を組み合わせることで、 画面上のボタンやフォームといったグラフィカルユーザーインターフェイス(GUI)を解析し、マウスやキーボードとい
はじめに 2025年はAIエージェントの年です。注目されているAIエージェントの一つが『AIが自動で自分のPC画面を操作』するBrowser Useというツールです。 Browser Useの面白さ Browser Useを使うと、AIが自動で自身のPC画面を操作することであらかじめ決めた目的を達成をしてくれます。 簡単な指示を出すだけで、自動でAIが色々操作してくれるのはキャッチーで衝撃的ですよね。 例えば下記のように完全自動でAIが記事を検索して記事の情報を取得してくれます。 簡単な指示でAIが自分で考えて画面操作をしてくれるのは近未来感ありますよね。 しかし、現場でAIを使いこなすには「AIがすごい」のレベルではまだ足りません。 実際に触ってみて何ができるのか?逆に何が苦手なのか?という肌感覚を持つことが非常に重要です。 そこで本記事は、その肌感覚を養うために実際にBrowser U
今日もいつものようにシラスでデイリーAIニュースを配信していると、とんでもないものにでくわした。 もうタイトルに書いてあるけど、AIが勝手にブラウザを操作して色々やってくれてしまう、その名もBrowserUseだ。 インストールは超簡単。 macなら以下の二行だけだ。 $ pip install browser-use $ playwright install使うのも超簡単だが、コマンドラインに落ちるのが怖い人々には簡単に見えないかもしれない。環境変数のOPENAI_API_KEYとかにAPIキーを入れておくこと。 $ python >>> from langchain_openai import ChatOpenAI >>> from browser_use import Agent INFO [browser_use] BrowserUse logging setup complete
概要 文章をコピペしてエクセルに張り付けたときに、画面のスタイルもコピーされてしまって困ったことはありますか?ありますよね! (↓こんな感じ) 私もよくやってしまうのですが、実際にどのような処理が行われているのかよく分かっていませんでした。理解を深めるためにも、自分で実装して謎を解いていきたいと思います。 3つパターンの処理を実装 比較のため、プレーンテキスト・HTMLテキスト・リッチテキストのコピー機能をサンプルプログラムを実装してみました。 (リッチテキストのコピーが、範囲選択してコピペしたときと同じ機能を想定しています。) HTMLファイル 画面表示されるHTMLは下記のような感じです。各コピー処理でid="message"の部分を固定でコピーするようにします。 <!DOCTYPE html> <html lang="ja"> <head> <meta charset="UTF-8"
米アルファベット傘下グーグルにインターネット閲覧ソフト「クローム」の売却を命じるよう求める米司法省の提案を裁判所が受け入れた場合、同事業の価値は最大200億ドル(約3兆1000億円)に上る可能性がある。実現すれば、世界有数のテック企業に反トラスト法に基づく事業売却を求める歴史的ケースとなる。 関係者によれば、司法省の反トラスト法執行担当者は、コロンビア特別区(首都ワシントン)連邦地裁のアミト・メータ判事に対し、人工知能(AI)とスマートフォンの基本ソフト(OS)「アンドロイド」に関する措置をグーグルに求めるよう要請する方針だ。 ブルームバーグ・インテリジェンス(BI)のアナリスト、マンディープ・シン氏は、30億人以上の月間アクティブユーザーがいることを考えると、売却が実現した場合、クロームの価値は「少なくとも150億-200億ドル」相当に上ると試算した。 メータ判事は今年8月にグーグルがオ
スタンドアロンなWebAssemblyランタイム「Wasmer」の開発元であるWasmer社は最新のWasmer 4.4の新機能として、C言語をWebAssemblyにコンパイルし、WebAssembly環境でそのまま実行可能する機能を発表しました。 下記はWasmer社が用意した、Webブラウザ上にWebAssemblyでBash環境を構築する「wasmer.sh」のコマンドラインから、wasmerによりC言語をコンパイルしてWebAssemblyモジュールを生成し、実行する操作を筆者のWindowsマシンで実際に試したところです(赤線は筆者による)。 Webブラウザ上でC言語をWebAssemblyにコンパイルし、そのままWebAssembly環境上で実行できています。 合わせて登場したJavaScript SDKによってNode.jsやBunなどのサーバサイドのWebAssembly
記事作成時点で広く使われているHTMLレンダリングエンジンは、ChromeやEdgeの「Blink」、Safariの「WebKit」、Firefoxの「Gecko」の3種に絞られています。ごく少数の大企業や団体がウェブの将来の決定権を握る状況を打破するべく、「ゼロから書かれた新しいウェブエンジン」として「Gosub」の開発が進められています。 Gosub Web Browser Engine https://gosub.io/ Gosubは開発の初期段階で、現時点ではHTMLパーサーが「HTML5を正しく解析できる段階」まで開発が進んでおり、CSSパーサーは概念実証の段階です。また、JavaScriptのエンジンとして、記事作成時点ではGoogleが開発するV8が使用されていますが、Gosubはモジュール性を重視しており、将来的には開発者が好みのJavaScriptエンジンを選択できるよう
まあ、魔法つっても普通に新機能なんですけどね。 iOS 18の新しい「Safari」では、「ちょっとこの広告、記事読むのにおジャマね」と思ったら、その広告を非表示にできる機能が標準搭載されるんです。しかも、ただ非表示にするだけじゃないんです。なんと、消える瞬間、魔法にかかったように霧散するというエフェクトが付いていて、本当に魔法みたいな機能なんですよ。 実は消せるのは広告だけじゃなくて、しつこく表示されるクッキーのポップアップだったり、なんなら記事中の図版や文字ブロックもきれいさっぱり消し去ることができるので、別に広告が気になるわけでもないのに色々消しているのがただ気持ちいい!みたいな機能でもあります。実装されたら、ぜひ遊んでみてください。 ※アップルの最新OSのパブリックベータ版の画面は一般に公開することが禁じられていますが、本稿では特別に取材許可を得たうえで掲載しています。 新しい「S
すまほん!! » テック » AI・人工知能 » 【悲報】WindowsのAIアシスタント「Copilot」、機能が大幅劣化。ただのチャットボットに 「お前を消す方法」のカイル君、そしてCortanaさん、後輩がそっちに行くかも。 Microsoftは、昨年11月にリリースした「Copilot in Windows」を発表。その後Windows向けのキーボードとしては30年ぶりに、キー配列に「Copilotキー」を追加するなどAIに対する本気度を見せていましたが、突然Copilot in Windowsの機能を大きく縮小させてしまったようです。 Copilot in Windows(以降Copilot)は、Copilotキーを備えるPCはそのキーを、そうでないPCからはWindows + Cのショートカットで起動するAIアシスタント。処理をクラウドに頼っているためレスポンスは早くありません
当サイトは Google Adsense、Amazon アソシエイト等 アフィリエイト広告を利用して収益を得ています. Microsoft は Windows ノートパソコンに新しい Copilot キーを搭載する Copilot+ PC シリーズを発表しましたが、現在このキーは Copilot のプログレッシブウェブアプリ(PWA)を起動させるためのキーに変更されています。 これまで Windows に組み込みの機能として備わっていた Copilot は、現在では Microsoft Edge ブラウザを経由した PWA として処理されるため、ただ単に新しいウィンドウでウェブアプリが起動するだけになります。 この変更により、以前までのように Windows に統合されているわけではなく単に PWA を呼び出すようになっているため、Copilot を使用して Windows の設定を変更し
Web アプリなどの UI でよくあるのですが、フォームの外側に送信ボタンがあるようなデザインのときに HTML だけで解決する方法があるので紹介します。 form 属性で紐付け <input> 要素の form 属性に <form> 要素の id 属性値を指定することで、フォームと送信ボタンを関連づけられます。 <form id="signin"> <label> メールアドレス <input type="email"> </label> <label> パスワード <input type="password"> </label> </form> <input type="submit" form="signin" value="サインイン">
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く