サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
GPT-4o
ascii.jp
Google I/Oでひっそりと語られたKDDI「Googleメッセージ」採用 グーグルは5月14日(現地時間)、本社近くの屋外シアターにおいて、開発者向けイベント「Google I/O 2024」を開催した。 初日の基調講演は「AI一色」。昨年はOpenAIによるChatGPTショックにより、グーグルのとしてかなりまとまりのないAI戦略を語っていたが、今年は「Gemini」を中心にしたAIにおける戦略を2時間弱、語り続けるという内容だった。 本来のGoogle I/O基調講演であれば、Androidの新バージョンを披露するといった内容が盛りだくさんのはずであったが、今年はあえてAndroidのアップデートの話は2日目に先送りして、徹底的に「Gemini」にフォーカスしていたのが印象的であった。 そんななか、Androidにおけるメッセージサービスについて、ひっそりと語られたニュースがある
5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが……」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。 とはいえ、ちょっとばかり確認の仕方が分かりづらいので、簡単に解説しようと思います。 実はこんなとこにある無課金ユーザー向けのモデル選択 まず、いつものようにChatGPTのサイトにアクセスします。まだアカウントも持っていないよって方は、ここでは詳細は省きますので、どこかの情報を参考にしてちゃちゃっと作ってください。 ChatGPTのサイトにアクセスすると、下のような画面になるかと思います。
「Intel Baseline Profile」によるパフォーマンスの違いを検証する インテル製CPUは複数のブースト機能(Turbo Boost/TBM 3.0/TVB)を利用してクロックを引き上げることでパフォーマンスを出すよう設計されているが、そのブーストをどの程度維持できるかというパラメーターがある。第12世代のインテル Coreプロセッサー以降はPBP(Processor Base Power)やMTP(Maximum Turbo Power)と呼ばれるものであるが、マザーボードのBIOS設定内ではそれぞれPL1、PL2とも呼ばれている。 インテルの公式スペックではPBP (PL1)<MTP (PL2)となっているが、現実のマザーボード、特にパフォーマンス志向の強いZ系チップセット(Z690/Z790)を搭載したモデルではPBP=MTPが推奨値となった。 しかしこれまでの慣例から
青森県三沢市で米の卸売りを手がけるKAWACHO RICE(カワチョウライス)と地元のクラウドインテグレーターのヘプタゴンは、AIで米の銘柄を判定する「RiceTag」で特許を取得した。RiceTag実現までの流れと検査員の精度を実現するための試行錯誤について、KAWACHO RICEの川村航人氏と共同開発したヘプタゴンの立花拓也氏、外舘大輔氏に話を聞いた。 実際に米の銘柄判定をやってみた KAWACHO RICEは、青森、秋田、岩手などの米の卸売りを手がける。別会社でペットボトルライス「PeboRa」や直営店なども手がけているが、事業の基本は小売店やメーカー、商店、飲食店などへの米の卸売りだ。まずは今回KAWACHO RICEとヘプタゴンがチャレンジした米の銘柄判定について見ていこう。 米の銘柄判定は納品された米をランダムに抜き出し、専門の農業検査員が品質と銘柄をチェックしていく検査工程
グーグルは5月14日(現地時間)、有料プラン「Google One AIプレミアム」(月額2900円)のユーザー向けに、最新の大規模言語モデル(LLM)「Gemini 1.5 Pro」を導入すると発表した。 Google One AIプレミアムはGoogleフォト、Googleドライブ、Gmail共通で使える2TBのクラウドストレージに、同社の有料版LLMを追加したプラン。同プランではこれまで「Gemini 1.0 Ultra」を利用できたが、今回新たにGemini 1.5 Proを選択できるようになった。 Gemini 1.5 Proは英語や日本語など複数の言語に対応。ブラウザーもしくはiOS版「Google」アプリ、Android版「Gemini」アプリからアクセスし、文書やメール文案の作成、コーディングからアップロードした文書の分析まで、さまざまな作業をAIに依頼することが可能だ。
OpenAIは5月13日(現地時間)、「Spring Update」と題したをオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」お披露目のほか、mac OS用デスクトップアプリや各種無料化施策なども発表した。 テキスト理解力は過去最高 GPT-4oは、これまでのフラッグシップモデル「GPT-4 Turbo」と同等の性能を持ちながら、より高速化され、テキスト、音声、画像の理解力も大幅に向上したという触れ込みの最新LLMだ。 ちなみにGPT-4oの「o」は、「すべての」「全てを含む」という意味を持つラテン語の接頭辞「omni(オムニ)」から来ている。 以前から得意な英語とプログラムコードに関してはGPT-4 Turboと同等の性能を発揮し、英語以外の言語のテキストでは大幅な改善がみられるという。 ベンチマーク(OpenAIが提供するsimple-eva
Parakeet(パラキート)は5月1日より、次世代リアルタイムAIボイスチェンジャー「Paravo(パラボ)」(旧:ParakeetVC)のβ版を提供開始した。 Paravoは昨年12月に完全無料のα版としてリリースされ、現在では累計3万ユーザーを突破する利用者がある「高品質」「低遅延」「低容量」を同時に実現する国産の次世代リアルタイムAIボイスチェンジャー。 個人利用の場合は、オンラインゲーム中にキャラクターボイスでボイスチャットしたり、オリジナルキャラクターに声を当てて動画配信サイトでライブ配信・動画投稿などが利用できる。法人であれば、オリジナルキャラクターに声を当てたライブ配信や、コールセンターやインターホンにおいて話し手の性別を変えることで、特定の性別に係る迷惑行為やハラスメント行為を対策、テーマパークやイベントでの「話せる着ぐるみ」などに活用できるとしている。 同社が独自開発し
OpenAIは5月13日(現地時間)、「Spring Update」と題したオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」がお披露目された。 プレゼンテーションではまるで人間と話しているような音声会話機能が話題になっているが、実はウェブサイトに掲載された記事を見ると画像生成機能も大幅に性能アップしていたことがわかった。 一貫性の保持。AIコミックが描けるぞ! 今回のプレゼンテーションではなぜかまったくと言っていいほど触れられていなかったが、画像生成AI「DALL-E 3」(おそらく)を使用した画像生成能力も大幅に進化しているようだ。 まず、いちばん驚いたのは画像の一貫性の保持だ。なぜなら、DALL-E 3やStable Diffusionなどの画像生成AIにとって「同じキャラクター」を生成するのは最も苦手な仕事だからだ。
生成AI大手OpenAIは5月13日(現地時間)、文字、音声、映像の入力からリアルタイムに推論ができて、まるで人間相手のように自然に会話できる最上位のLLM「GPT-4o(オー)」を発表した。今後数週間以内にChatGPTで使えるようになる。無料ユーザーも回数制限つきで利用できる。有料ユーザーは無料ユーザーの最大5倍利用可能。oは“オムニ”の略。 推論性能は他社モデルと比べてもトップクラス。音声入力の応答時間は最速232ミリ秒で、会話中の人間の応答時間と似ているという。APIとしては、旧来のモデルである「GPT-4 Turbo」に比べても処理が2倍早く、さらに料金が50%安く、レート制限は5倍になる。 文字、映像、音声を含むすべての入力と出力を、同じニューラルネットワークが処理する仕組みになっているのが特徴。旧来モデルのGPT-4より情報の損失が少なく、声のトーン、複数の話者、背景音なども
グーグルは5月9日(現地時間)、デスクトップ版「Google Chrome」をアップデートした。重大なゼロデイ脆弱性の発見に伴う対処で、Windows、macOS、Linux版が対象となる。 Visualsコンポーネントに起因する脆弱性で、攻撃者は相手のPCからデータを盗んだり、深刻なダメージを与えることができるという。重大度(危険性)のランクは上から2番目の「高」。グーグルでは、すでに本脆弱性の悪用を確認している。 対策済みのバージョンはWindowsおよびmacOS版が「124.0.6367.201/.202」、Linux版が「124.0.6367.201」以降となる。Chromeを起動していれば今後数日から数週間以内にアップデートが自動適用されるが、ブラウザーの設定から「このChromeについて」を選択することで、手動で最新版に更新することも可能だ。
FireWire、i.Link、DV、Lynxといろいろな呼び名があるのがIEEE 1394。IEEEで標準化がなされているので本稿ではIEEE 1394で通すが、AppleはFireWire、ソニーはi.Link、TIはLynxという名称を使っており、また一般にはDV端子と呼ばれることも多かったが、中身は「原則として」一緒である(多少例外はあり:後述)。 SCSIよりも美しいI/Fを求め Appleが立ち上げたIEEE 1394 IEEE 1394の規格をそもそも立ち上げようとしたのはApple Computerで、1986年のことである。1986年といえばMacintosh Plusが出たばかりの頃で、外部ストレージはSCSIを利用していたが、Apple的にはSCSIが美しくなかったのだろう。具体的には太いケーブル(なにしろ8bitのパラレルバスである)やPlug&Playの欠如、5M
NTTは、2024年5月13日、ハイブリッドワークおける「社会規範」とウェルビーイングの関係性に関する日米比較の調査分析を発表した。 社会規範とは「こうあるべきだ」という“暗黙の了解”のこと。例えば、「コロナ禍では外出時にマスクをつけなければいけない」「働く中では有給休暇取得に上司に説明しなければならない」といった、集団において期待される振る舞いのことを指す。ハイブリッドワークにおいては、いつ、どこで働くべきかという行動基準となる。 同調査では、通説的には「従わなければならない社会規範が多い」とされる日本人が、明確に働き方を指示されることをネガティブに捉える傾向があるといった結果が得られている。 ハイブリッドワークの新しい常識を探るための調査に着手 今回の研究の背景について、NTTの社会情報研究所 研究員である赤堀渉氏は、「コロナ禍が収束するにつれ、オフィスワークとリモートワークを組み合わ
東京工業大学、東北大学、名古屋大学、理化学研究所、富士通、サイバーエージェントおよびKotoba Technologiesからなる共同研究チームは、2024年5月10日、スーパーコンピューター「富岳」を用いて学習した、日本語能力に優れた大規模言語モデル(LLM)「Fugaku-LLM」を公開した。 Fugaku-LLMは、富岳で効率的にLLM学習するための研究成果として開発され、日本語を中心とした独自データで学習させた、130億パラメーターのLLM。開発者・研究者向けにGitHubでソースコードが、Hugging Faceでモデルが公開され、ライセンス内においては、商業および研究目的でも利用できる。 共同研究の全体統括を担った東京工業大学の学術国際情報センター 教授である横田理央氏は「海外製のGPUに頼らずに、国産のハードウェアで、さらに国産のモデルを一から開発した、純粋な国産LLMはFu
2024年は高性能化と軽量化が進むローカルLLMに注目 また、今はローカルで高性能なLLMを動かすためにはVRAM容量の多い、高価なビデオカードを搭載するPCマシンが必要ですが、モデルの量子化アプローチも様々な圧縮する方法が試されており、大きなモデルをさらに小さなデータ量にする手法が発見されつつあります。最近、RAMとVRAMのどちらの役割も与えられるユニファイドメモリを搭載していることから、ローカルLLMを動かす環境として「Mac Studio」が注目されはじめています。数年という時間はかかるでしょうが、いずれ一般的なスペックのパソコンや、あるいはスマートフォンやタブレットでも、高性能なローカルLLMが動作する環境が整ってくるのではないでしょうか。 2023年までは、ごく一部の人々しか触れられていなかったローカルLLMの世界ですが、2024年に入り、LM Studioのような扱いやすい環
筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統
Google I/Oに先がける形で、Pixelシリーズの廉価モデル「Google Pixel 8a」が発表。5月14日に発売される。本記事では上位モデルの「Pixel 8」や、Pixel Aシリーズの過去モデル「Pixel 7a」「Pixel 6a」とスペック面での比較を中心に見ていこう。 SoC以外のハードウェアでのPixel7aからの進化点は少なめ ただし、上位機譲りの強力AI周りが非常に魅力的 というわけでPixel 8aだが、7aと比較した場合、SoCが最新のTensor G3になった以外、ハードウェア的な進化点は実は少なめだ。ディスプレー(6.1型有機EL、1080×2400)のリフレッシュレートが最大120Hzになったほか(Pixel 7aは最大90Hz)、カラバリ以外で大きな違いはない。カメラについても、メインは1/1.73型の6400万画素とセンサーサイズと画素数に変化無し
Windowsでは、文字コードに「ユニコード」を使う。Windowsに搭載されているフォントはさまざまあるが、ユニコード文字を表示できるように、多数の文字の形が組み込まれている。 今回は、Windowsでユニコードを“見る”方法について解説する。なお、WindowsではUTF-16LEエンコードをUnicodeと表記する。ここでは、エンコードと混同されないために、文字仕様のUnicodeは「ユニコード」とカナ書きすることにする。 GUIアプリでユニコードを使う ユニコード文字は多数ある。それぞれの文字に割り当てられた文字コードをユニコードでは「コードポイント」と呼ぶ。コードポイントは、「U+」の後ろに16進数4桁または6桁で指定するのが正式な表記方法だ。たとえば、「漢」は「U+6F22」となる。ユニコード関連の文書やもちろん、インターネット内のウェブページでも同様の表記をすることが多い。
携帯電話のSMSを使った認証を、なりすましで不正に突破される例が問題視されている。手口としてはスマートフォンやケータイを物理的に盗んだり、他人がなりすまして不正にMNPする例が従来は見られたが、最近ではeSIMの再発行という手法も出てきた。そこで主要4キャリアについてeSIMの再発行が簡単かどうか、あらためてeSIMは不安視すべきものかどうか調べた。 そもそも不正なeSIM再発行をされると何が起こるのか? eSIM再発行とは、端末間で物理的なSIMカードを差し替えることに相当する行為だ。特にeSIMでは、物理SIMでは必要だった発送や受け取りが不要。たとえばネットで新規加入の手続きをすれば、SIMの到着を待つことなく、すぐに使うことができる。 手軽でスピーディーな反面、誰かが不正にeSIM再発行の手続きをして、別の端末でeSIMを受信してアクティベーションしてしまえば、どこかの誰かのスマー
今回は中国のFIIO Electronics(フィーオ)が発売した、レトロでスタイリッシュなデザインのポータブルカセットプレーヤー「CP13」の実機レポートをお届けします。 カセットテープをいい音で聴きたいファンのためのプレーヤー 筆者は小学生だった1980年代後半ごろに、邦楽歌謡曲の魅力に取りつかれました。当時は自分用のCDプレーヤーを持っていなかったので、おこづかいを貯めて買う音楽作品はもっぱらカセットテープでした。 現在も数は多くないものの、カセットテープで新しくリリースされている作品があるようです。レコードショップの棚を意識してみるとK-POPのアーティストが新作の限定版をカセットテープでも販売していたり、邦楽の復刻版にもカセットテープのタイトルが見つかります。筆者は去年アニメのサントラを買ったら、アルバムの中から1曲をピックアップして収録したカセットテープが特典として付いてきまし
ビューカードは5月9日より順次、JRE BANKサービス開始に合わせて、駅のATM「VIEW ALTTE(ビューアルッテ)」のサインパネルを新デザインに変更している。 ビューアルッテは、山手線をはじめとする、JR東日本の駅を中心に設置されているATM。ゆうちょ・銀行・信金・信組・ろうきんの預貯金が引き出しや、ビューカードやJRE POINTによるSuicaへのチャージ、ビューカードの各種設定変更などのサービスを利用できる。初電から終電まで年中無休で利用可能。 新デザインは、ビューアルッテの機能をシンプルに表現し、利用者が一目で分かりやすい。 ビューアルッテの主なサービス ■預貯金引出(ATM) ビューアルッテは、ほぼ全ての金融機関のキャッシュカードが利用できる。手数料が優遇される金融機関は以下のとおり。 JRE BANK ※楽天銀行 JRE はやぶさ/とき/こまち支店 上限回数なく無制限で
スマホを勝手に機種変更される、225万円するロレックスを勝手に購入されるなど、偽造マイナンバーカードを使った被害が後をたたない。 東京都の風間ゆたか都議は、4月17日に偽造マイナンバーカードを悪用されて携帯電話を乗っ取られたとXで明かした。その後もPayPayで勝手にチャージや決済の操作をされた上、クレジットカードで10万円を超える被害にあったという。 大阪府八尾市の松田憲幸市議は5月2日、偽造マイナンバーカードを使った犯罪に巻き込まれたことをやはりXで明かした。4月30日に偽造カードを使ってスマホを機種変更されていたことがわかり、5月1日にはオンラインショップで225万円もするロレックスの腕時計「デイトナ」を購入される被害にあったという。 なぜこんなことが起きるのか。テクノロジーを悪用した犯罪に詳しいITジャーナリストの三上洋氏は、携帯電話会社やショッピングサイトの本人確認が簡素になって
Stability.AIは5月10日、同社の画像生成AI製品「Stable Diffusion 3」や「Stable Video Diffusion」などを、競合サービス「Midjourney」のように「Discord」上で利用することができるサブスクリプションサービス「Stable Artisan」の運用を開始した。 豊富な編集ツールも用意 これまで同社の画像生成AI「Stable Diffusion」シリーズは、ローカル環境にダウンロードして利用するのが主流(APIもあり)だったため、高性能のグラフィックボードが必要になるなど利用のハードルが他社サービスと比べて少し高かった。 今回発表されたStable Artisanに加入すれば、コミュニケーションプラットフォームDiscordを利用して、誰でもすぐに画像生成を楽しむことができるようになる。特に、これまでAPI経由でしか利用できなかっ
家庭のルーターはサイバー犯罪者の標的になる スマートフォンやPCを使うとき、オンラインで利用しないというケースはめずらしいだろう。インターネットにつなぐのは当たり前の時代、ルーターを保有している家庭も多いはずだ。 しかし、セキュリティ意識が必ずしも高くない環境で利用されている家庭用ルーターは、悪意のある人間にとっては標的にしやすいもの。第三者にルーターを不正利用され、踏み台にされてしまうサイバー犯罪もあることに注意が必要だ。 総務省、国立研究開発法人情報通信研究機構(NICT)、一般社団法人ICT-ISACが運営する、IoT機器のセキュリティ対策向上プロジェクト「NOTICE」(National Operation Towards IoT Clean Environment)をご存知だろうか。 NOTICEでは、家庭のルーターやネットワークカメラなどIoT機器の安全啓発のための動画を、Yo
15歳で現役高校生の開発者「Holy-fox/子狐」氏は5月9日、パラメーター数7Bクラスとしては日本語能力が最強となる大規模言語モデル(LLM)「ArrowPro-7B-KUJIRA」を公開した。 「AITuberの魂」になることを想定 7Bにおいて日本語能力最強のモデル、ArrowPro-7B-KUJIRAができました。Elyza-task100においては約3.8をマークしています!AItuber用途を主眼において設計されています(それ以外もできるよ!) https://t.co/kiywdI5YCs — Holy-fox/子狐 (@Holy_fox_LLM) May 9, 2024 同モデルはMistral系のオープンソースLLM「NTQAI/chatntq-ja-7b-v1.0」をベースに、AITuber(生成AIを使ったバーチャルYouTuber)やAIアシスタントでの利用を想定
神戸市は、2024年4月30日、全国の人口分布や移動、就業状況などのオープンデータを公開するダッシュボード「神戸データラボ」にて、新たに国立社会保障・人口問題研究所(社人研)の「日本の地域別将来推計人口(2023年推計)」と、総務省の「住民基本台帳人口移動報告」に基づくデータを追加した。これにより、計8種類のオープンデータが利用可能になった。 神戸市のデジタル監(最高デジタル責任者)である正木祐輔氏は、「神戸データラボには、1日平均500件のアクセスがあり、政令指定都市をはじめとした全国の自治体が政策議論に活用しているケースや、民間企業、個人での利用も増えている」と述べる。 Tableauで直観的に分析可能な「神戸データラボ」に2種のオープンデータが追加 神戸市では、市職員が利用できる「神戸データラウンジ」を庁内で公開しており、約90種類のオープンデータを用意している。神戸データラボは、神
Stability AIは5月9日、日本語大規模言語モデル「Japanese Stable LM 2 1.6B(JSLM2 1.6B)」をリリースした。モデルサイズを16億パラメータと軽量化することで必要なハードウェアを小規模に抑えることが可能だという。 スピードと性能を両立した軽量モデル 🎉日本語特化の言語モデル「Japanese Stable LM 2 1.6B」をリリースしました🎉 Japanese Stable LM 2 1.6B(JSLM2 1.6B)は16億パラメータで学習した日本語の小型言語モデルです。 こちらのモデルはStability AI メンバーシップにご加入いただくことで商用利用が可能です。 詳細はこちら💁♀️… pic.twitter.com/b35t2Il4lm — Stability AI Japan (@StabilityAI_JP) May 9,
iPhoneで横向きの写真を撮ると、撮影後に向きが縦に変わっていることがある。写真アプリの編集機能で1枚ずつ向きを変えることもできるが、枚数が多くなるとさすがに面倒。そんな悩みを解決してくれるアプリが「くるりAI」だ。 AIで写真の向きを自動修正 くるりAIは新野ユキ(@yuki_arano)氏が開発したiOS/iPadOSアプリ。AIで写真の正しい向きを判定し、修正する点が特徴だ。 AIが写真の向きを自動で直すアプリ「くるりAI」ようやくリリースできました!!! カメラロールにある写真の向きを一括で直してくれるので、写真整理が捗ります!!! https://t.co/MWWmgU9fIOpic.twitter.com/EFJ3pvzsvC — 新野ユキ (@yuki_arano) May 8, 2024 使い方は至ってシンプル。起動すると端末内の写真が読み込まれるので、向きを変えたい写真
画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。 現在、「テキスト条件付きリライティングモデル(text-conditioned relighting model)」と「背景条件付きモデル(background-conditioned model)」の2種類がGitHubで公開されており自由に試すことができる。 なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ
東武鉄道は4月30日、「東武グループ中期経営計画 2024~2027」を公表。現行の磁気乗車券を全廃し、QRコードを使った乗車券に切り替える方針を明らかにした。 紙にQRコードを印字した乗車券へ移行か? 磁気乗車券の廃止は、デジタル技術を活用した持続的な運行体制の確立を目的としたもの。QR乗車券の具体的な仕様は不明だが、スマホアプリなどへの完全移行は難しいことから、紙の切符にQRコードを印字し、改札機で読み取るタイプを採用するとみられる。 大手私鉄で磁気乗車券の全廃とQR乗車券への置き換えを表明するのは、東武鉄道が初めて。大手以外では沖縄都市モノレール(ゆいレール)のように、磁気乗車券からQR乗車券へ切り替え済みの事業者も存在する。 コストダウンがQR乗車券最大のメリット 2024年現在、多くの鉄道事業者で使われている紙の切符は、裏面(黒や茶色の部分)に有効区間などの情報を磁気で記録してい
次のページ
このページを最初にブックマークしてみませんか?
『ASCII.jp - トップ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く