タグ

ブックマーク / www.itmedia.co.jp (348)

  • 「ChatGPT」の次に来るサービスは何か? 注目を集める「AIエージェント」 従来の生成AIとの違いとは

    ChatGPT」の次に来るサービスは何か? 注目を集める「AIエージェント」 従来の生成AIとの違いとは:小林啓倫のエマージング・テクノロジー論考(1/4 ページ) 2022年11月に登場した米OpenAIのチャットAIChatGPT」は、約2カ月で1億人のユーザーを獲得し、生成AIの実力をまざまざと見せつけた。あっという間に人々の話題を独占し、いまやChatGPTや生成AIという単語をニュースで見かけない日はない、と言っても過言ではない。そうなると気になるのが、「ChatGPTの次にくるのは何か」という点だ。 気が早いといわれるかもしれないが、ChatGPTが一夜にして人々の未来予想図を書き換えてしまったのを見ると、できる限り早く次のトレンドを把握したいのが人情というものだろう。そうした「次」の候補として有力視されているものの一つが「AIエージェント」(AI Agent)である。 「

    「ChatGPT」の次に来るサービスは何か? 注目を集める「AIエージェント」 従来の生成AIとの違いとは
  • OpenAIが次世代の「GPT-4 Turbo」やカスタムできる「GPTs」を発表/イーロン・マスクが対話型AI「Grok」

    OpenAIが次世代の「GPT-4 Turbo」やカスタムできる「GPTs」を発表/イーロン・マスクが対話型AI「Grok」:週末の「気になるニュース」一気読み!(1/3 ページ) うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、11月5日週を中心に公開された主なニュースを一気にチェックしましょう!

    OpenAIが次世代の「GPT-4 Turbo」やカスタムできる「GPTs」を発表/イーロン・マスクが対話型AI「Grok」
  • Google、「モラベックのパラドックス」打破目指すロボットプロジェクト

    Alphabet傘下のGoogleの研究部門Google ResearchとEveryday Robotsは8月16日(現地時間)、高度な言語モデルとロボット学習によって「モラベックのパラドックス」を解決するための共同研究「PaLM-SayCan」を発表した。 Everyday RobotsがGoogleのキャンパスで稼働させているヘルパーロボットで実行する学習モデルにPaLM(Pathways Language Model)を採用することで、ロボットの性能を強化し、より複雑で抽象的なタスクを実行させるための研究だ。 モラベックのパラドックスとは、AIやロボット工学では、高度な知性に基づく推論よりも人間の能に基づく運動スキルや知覚を覚えさせることの方が困難だという説だ。 Everyday Robotsのロボットたちは、「ペットボトルの水を持ってきて」というような単純な命令は理解し、実行

    Google、「モラベックのパラドックス」打破目指すロボットプロジェクト
  • 百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】

    昨年末から急激に話題を呼んだChatGPT、その内部的なバージョンアップであるGPT-3.5とGPT-4はいずれもMicrosoftから強力な支援を受けた米OpenAIという企業が独占的に提供する大規模言語モデル(LLM)だ。 それに呼応するかのように、Meta社からはLLaMA(ラマ)がリリースされ、LLaMAをChatGPTとの1万3千回の会話データで微調整したAlpaca(アルパカ)、AlpacaをShareGPT(GPTとの会話を有志がオープンにしたもの)のデータで微調整したVicuna(ビクーニャ)といった派生モデルが次々と登場した。 しかし、LLaMAはMeta社の意向により「アカデミック用途限定」という縛りがある。またGPTの出力にはOpenAIの利用規定で「GPTの出力結果を元にGPTに対抗できる強力なAIを作ってはいけない」という制約があるため、AlpacaもVicuna

    百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】
  • 論文PDFを数式込みで全文読み取るモデル 米Metaが「Nougat」開発 スキャンした古書の画像もOK

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Meta AIに所属する研究者らが発表した論文「Nougat: Neural Optical Understanding for Academic Documents」は、論文を記録したPDF内のテキストや数式を正確に読み取るモデルを提案した研究報告である。研究論文を機械が読めるテキストに変換することで、知識全体がより探しやすく、多くの人々がアクセスできるようになる。モデルのコードなどは全て公開されている。

    論文PDFを数式込みで全文読み取るモデル 米Metaが「Nougat」開発 スキャンした古書の画像もOK
  • パナの若者向け「食洗機」出足好調 6割が「必要ない」という世代にどう挑んだか

    パナの若者向け「食洗機」出足好調 6割が「必要ない」という世代にどう挑んだか:知らないと損!?業界最前線(1/7 ページ) パナソニックから新しい器洗い乾燥機が登場した。一人暮らしを想定した「パーソナル食洗機SOLOTA(NP-TML1)」(以下SOLOTA、実勢価格3万7620円)だ。 大きいサイズの器洗い乾燥機とは異なり、水栓の工事が不要なタンク式となっており、設置スペース(底面サイズ)は幅299×奥行き219mmと、ほぼA4サイズ。これなら、一人暮らしの小さなキッチンにも置けそうだ。 そこにちょうど1人分、6点の器を収納して、洗える仕組みとなっている。 関連記事 ホットクックの牙城を崩せるか? パナ気の「オートクッカー」の完成度は この10年間で、調理家電のうち最も躍進した製品の1つが自動調理鍋だが、中でも最も成功したのがシャープ「ヘルシオ ホットクック」だ。そこへパナソニッ

    パナの若者向け「食洗機」出足好調 6割が「必要ない」という世代にどう挑んだか
  • OpenAI、テキストから3Dモデルを高速生成するAI「Point-E」をリリース

    AI研究企業OpenAIの研究者らは12月19日(現地時間)、テキストプロンプトから3Dオブジェクトを生成するAIシステム「Point-E」をオープンソース化したと発表した。 同様のシステムとしては米Googleの「DreamFusion」などがあるが、発表論文によると、Point-Eは例えば単体のGPU(米NVIDIAの「V100」)でも3Dモデルを1~2分で生成できるという。 Point-Eは、点群(point cloud)で3Dオブジェクトを生成する。名称の「E」は点群を効率的(Efficiently)に生成することに由来するという。 3D生成は2段階で行われる。まずプロンプトを入力すると、レンダリングされた合成ビューが生成され、次に点群拡散スタックがこの画像を条件付けして3DのRGB点群を生成する。 「この方法は、最先端の他の類似技術よりも性能は劣る」が、DreamFusionの

    OpenAI、テキストから3Dモデルを高速生成するAI「Point-E」をリリース
  • Twitter、Mastodon他のSNSへのリンクツイートをポリシー変更で禁止(SNSの有料広告ならOK)

    Twitterは12月18日(現地時間)、ユーザーがTwitter以外のSNS上の自分のアカウントや投稿をツイートすることを正式に禁じるとツイートで発表した。特に、Facebook、Instagram、Mastodon、Truth Social、Tribel、Nostr、Post.を対象としている。 違反するツイートは削除され、アカウントは一時的に凍結される。繰り返せば完全に凍結される可能性がある。 同社は15日、複数の著名ジャーナリストのアカウントと凍結し、他のユーザーがそれらのジャーナリストの他のSNSアカウントをツイートすると、それらのツイートを削除した。ジャーナリストの凍結はその後解除された。 Twitterのヘルプセンターに新たに追加された関連ポリシーのページ(日語版はまだない)によると、他のSNSに関するツイートは「無料のプロモーション」とみなし、「今後、Twitterでの

    Twitter、Mastodon他のSNSへのリンクツイートをポリシー変更で禁止(SNSの有料広告ならOK)
  • 「Teams」操る穴あきイヤフォン、ソニーが発売 MS公認、リモートワークに

    ソニーは10月26日、耳をふさがない構造の完全ワイヤレスイヤフォン「LinkBuds」(リンクバッズ)にMicrosoft Teamsの操作に対応した「LinkBuds UC for Microsoft Teams」を追加すると発表した。11月25日に発売する。直販価格は2万9700円。 右側のイヤフォンを3回タップしてマイクをオン/オフ。一時的にPCから離れていて急な発言が必要になった場合でもあわててPCに駆け寄る必要がないという。他にもMicrosoft Teams会議の参加、受話、最前面表示、Web会議中の挙手といった操作が耳元で行える。 ただしTeamsの操作はPCに特定のアプリを導入した場合のみ。対応アプリは「Microsoft Teams Essentials」(Microsoft 認定パートナーを通じて購入した場合のみ)や「Microsoft 365 Business/Ent

    「Teams」操る穴あきイヤフォン、ソニーが発売 MS公認、リモートワークに
  • 壊れたスマホは「交換」よりも「修理」 iCrackedがPixelの正規修理を開始した理由

    壊れたスマホは「交換」よりも「修理」 iCrackedがPixelの正規修理を開始した理由:石野純也のMobile Eye(1/3 ページ) iCrackedというスマートフォンの修理業者をご存じだろうか。実は連載でも、同社が日に上陸する際に取り上げたことがある。約7年前、2015年のことだ。一方、上陸直後は電波法など法制度への理解が十分ではなく、当時から制度化されていた「登録修理業者」としての登録も特に検討していなかった。記事では、その姿勢を疑問視するのと同時に、登録修理業者になるためのコスト面、技術面でのハードルが高すぎることを指摘していた。 →電波法違反になる恐れも――日に上陸したスマホ修理業者「iCracked」の問題点 そんな経緯もあり、iCrackedは方針を転換。2016年には晴れて1機種分の登録を終え、徐々に対象端末や店舗数を拡大していく。今では、店舗数も74まで増え

    壊れたスマホは「交換」よりも「修理」 iCrackedがPixelの正規修理を開始した理由
  • スパッと買う決心がつかない貴方に――「アーロンチェア」を好きなだけ試せるサブスクはいかが?

    「高価でもよいものを買え」と言われるツールの代表格といえばキーボード、そしてチェアだろう。中でもチェアは、高級な製品は10万円超えが当たり前ながら試せる場が少なく、たとえあったとしても実際と異なる作業での試用ではピンと来ないこともしばしば。いざ購入して使い始めると「あれ、おかしい」ということになりがちだ。 こうした時のひとつの方法として、家具のサブスクリプションサービスを利用する手がある。家具のサブスクでは、取扱品目の中にオフィスチェアやビジネスチェアが含まれていることが多くあるので、その中に目的のチェアがあれば、1カ月や2カ月といった中長期にわたって実際の環境で使い勝手をチェックできる。 今回、そうしたサブスクサービスのひとつ「CLAS」を利用して、オフィスチェアの最高級品として知られるハーマンミラーの「アーロンチェア」、そして同じくビジネスチェアでは名高い「エルゴヒューマン」を試用して

    スパッと買う決心がつかない貴方に――「アーロンチェア」を好きなだけ試せるサブスクはいかが?
  • Googleさん 長生きしてね

    なんで始めたのかも忘れてしまったこの不定期連載「Googleさん」、今回でおしまいです。今見たら、開始は2017年5月で、5年以上もやっていたんですね。我ながら呆れます。これで155目くらいだと思います。 確か編集部の松尾さんに「なんかコラム書きましょう」とお誘いいただき、これといった得意分野があるわけでもない一介の海外速報担当者なので、一番仕事で使ったり記事で取り上げたりしているGoogleをテーマにしようということになったんだったかなと。 Googleについて最初に書いた速報記事がどれかはもう覚えていませんが、検索したところ2004年11月のBloggerの記事がそうかもしれません。アイティメディアには2004年10月から2011年3月まで在籍していた(現在はフリーランス)ので、入社してすぐだったのか。ちなみにGoogleの立ち上げは1998年です。 それからはいい話も悪い話もいろい

    Googleさん 長生きしてね
  • 「1Byteが8bitに決まったワケ」についての長い話 まずは「バベッジの階差機関」から

    いつものようにヘロヘロと仕事をしていると、突如担当編集の松尾氏からMessengerで「これに対するちゃんとした回答を書けるのは大原さんだなということで、また歴史物をお願いしたく」という依頼が飛び込んできた。 いやちゃんとした回答も何も、上のTreeで出題されたSEライダー氏が正解を出されているわけですが、歴史的経緯というか、ここに至るまでの話というのが長い訳で、その辺りを少し説明してみたいと思う。 ちなみに出題に少しだけ違和感がある(なぜ10bitがキリがいいと思うのか?)のは、筆者もこっち側の人間だからかもしれない。 回答の前に、その根底にある2進数採用の経緯 そもそも非コンピュータ業界の方からすれば、2進数がベースという辺りから違和感を覚えるのではないかと思う。実際、世界最初の計算機(≠電子計算機)とされる「バベッジの階差機関」(写真1)にしても、世界最初の電子計算機(※1)であるE

    「1Byteが8bitに決まったワケ」についての長い話 まずは「バベッジの階差機関」から
  • New York Times、人気ゲーム「Wordle」を買収 数億円規模か

    米The New York Timesは1月31日(現地時間)、ネット上で人気の英単語推測ゲーム「Wordle」を、このゲームを開発したジョシュ・ウォードル(Wardle)氏から買収したと発表した。買収総額は“7桁台前半”としているので、数百万ドル(日円換算で数億円)だ。買収後もこれまで通り無料でプレイできる。 Wordleは、ウォードル氏が昨年10月に自身のWebサイトで公開したゲーム。The New York Timesの1月3日の記事(要購読)によると、ウォードル氏はこのゲームを最初、The New York Times(以下NYT)のクロスワードパズルの大ファンである恋人、パラク・シャー氏のためだけに開発したという。このゲームを知った親戚が夢中になる反応を見てネットで公開したところ、公開後2カ月で30万人以上がプレイするようになった。 ゲームは、5文字の単語を6つの単語を並べるこ

    New York Times、人気ゲーム「Wordle」を買収 数億円規模か
  • 「同席しているみたい」──ビデオ会議の相手を3Dモデル化 Googleの「Project starline」 その仕組みは?

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Google Researchの研究チームが発表した論文「Project starline: a high-fidelity telepresence system」は、2021年5月の「Google I/O 2021」で発表した対面式テレプレゼンス・システム「Project starline」の技術的仕組みを詳細に書き記したものだ。Project starlineとは、互いの上半身を取得し、3Dモデルとして離れた相手側のディスプレイにリアルタイムに表示し続けるシステムのこと。 発表当初、遠方にいる相手が目の前に実在するかのような高い臨場感でコミュニケーションが取れるのではと、一部で話題

    「同席しているみたい」──ビデオ会議の相手を3Dモデル化 Googleの「Project starline」 その仕組みは?
  • 日本の製粉大手に「前例ない」大規模攻撃 大量データ暗号化 起動不能、バックアップもダメで「復旧困難」

    「システムの起動そのものが不可能で、データ復旧の手段はない」――製粉大手のニップン(東証一部上場)は8月16日、7月7日に受けたサイバー攻撃の詳細と影響を明らかにした。 グループ会社を含むサーバの大半が同時攻撃を受け、バックアップを含む大量のデータが暗号化されて復旧不能に。外部専門家に「前例のない規模」と報告を受けたという。 財務システムも被害を受け、早期の復旧が困難なため、8月5日に発表予定だった2021年4~6月期の決算は、約3カ月延期。8月16日が提出期限だった四半期報告書の提出も、11月15日に延期する。 サイバー攻撃を受けたのは7月7日未明。グループの情報ネットワークのサーバや端末が同時多発的な攻撃を受け、大量のファイルが暗号化された。 ニップン単体の財務・販売管理データを保管しているファイルサーバに加え、グループ企業で同じ販売管理システムを使っていた11社と、同じ財務会計システ

    日本の製粉大手に「前例ない」大規模攻撃 大量データ暗号化 起動不能、バックアップもダメで「復旧困難」
  • フェンシング剣の軌跡、AIと4Kカメラで捕まえた “ライトセーバー”みたいな可視化技術、約5年間の開発秘話

    フェンシング剣の軌跡、AIと4Kカメラで捕まえた “ライトセーバー”みたいな可視化技術、約5年間の開発秘話(1/3 ページ) 8月8日に閉幕した東京五輪で、日本代表が「エペ」の団体で史上初の金メダルを獲得するなど、盛り上がりを見せたフェンシング。選手の活躍に注目が集まる一方で、ロンドン五輪の銀メダリストでもある、日フェンシング協会の太田雄貴前会長がTwitterに投稿した動画も注目された。試合会場のバックスクリーンに映る試合映像を見ると、剣先が映画「スター・ウォーズ」に登場する武器「ライトセーバー」のように光り輝き、軌跡が可視化されているのだ。 無観客とならなければ、試合直後にスター・ウォーズのようなリプレイ映像を多くの人が目にしたはずだ。この演出はどのように実現したのか。Perfume のライブ演出やリオ五輪の閉会式の映像ディレクターを手掛けた、メディアアーティストの真鍋大度さんらFe

    フェンシング剣の軌跡、AIと4Kカメラで捕まえた “ライトセーバー”みたいな可視化技術、約5年間の開発秘話
  • コクヨの“折りたたみワークデスク”販売再開 「デスク置き場ない」悩み解決

    コクヨグループでオフィス通販を手掛けるカウネットは4月23日、折りたたんでコンパクトに収納できるワークデスク「リビングワークデスク」(税込8778円)の販売を再開した。 2月15日に発売したが、Twitterなどでの反響が大きく予想以上の問い合わせがあったため、発売から1週間で受注停止していたという。 奥行き45センチ、幅80センチのスリムなワークデスク。使わない時はコンパクトに折りたたんで家具のすき間などに収納できる。事務用品を収納できる布製ポケットも付属する(取り外し可能)。 天板の素材はMDF、脚はスチール製。天板の耐荷重は20キロ、体の重さは9.54キロ。 「自宅にデスクを置くスペースを確保できない在宅ワーカーの困りごとを解決する」商品として開発した。 関連記事 約1分で寝床ができる「ポンプ一体エアーマット」、キングジムが発売 オフィスの防災備蓄品に 内蔵のポンプを足で約1分間踏

    コクヨの“折りたたみワークデスク”販売再開 「デスク置き場ない」悩み解決
  • “ショーケースの向こう側”を操作できる技術 MIT「inDepth」開発

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米MIT Media Labの研究チームが開発した「inDepth」は、透明なパネルやガラスを外側から指で押さえることで、向こう側にある物体とやり取りできるシステムだ。例えば、ショーケース内の品や、3Dディスプレイ内のオブジェクトとインタラクションができる。 inDepthは、手前にある物理障壁の表面を指で押さえ付けることによって3次元空間内のポイントを指定し、向こう側にある物体とのインタラクションを可能にする。ユーザーは、障壁表面に加える力の強さや方向を変えることで、指定する点の深さや向きを制御できる。 ハードウェアは、バリア下に設置された3自由度の力覚センサー(90 x 90 x 3

    “ショーケースの向こう側”を操作できる技術 MIT「inDepth」開発
    satojkovic
    satojkovic 2021/03/12
    すごいな
  • AIを使って早く帰ろう――竹中工務店が建設現場へのディープラーニング導入で目指すもの

    2020年に向け、建設業界ではいくつもの大規模プロジェクトが大詰めを迎えようとしている。そうした建設現場の指揮命令を担うのが現場監督(施工管理者)だ。現場監督の仕事は工程管理から品質管理、現場の安全管理、作業者のスケジュール管理まで多岐にわたり、激務というイメージを持つ人も少なくないだろう。 そんな現場監督の業務負荷を減らそうと、新たなアプローチを始めた企業がある。日を代表する大手ゼネコンの1社として、高層ビルディングからスタジアム、商業施設、神社・仏閣などの伝統建築物に至るまで、さまざまなジャンルの大型建築プロジェクトを手掛ける竹中工務店だ。 同社はこれまでも業務効率化にいち早く取り組み、一定の成果を上げてきた。ただ、人手による作業が中心の建設現場だからこそ、効率化できない仕事も残っていたという。そこで同社が注目したのが、ディープラーニングの活用である。 夕方から始まる「現場写真整理」

    AIを使って早く帰ろう――竹中工務店が建設現場へのディープラーニング導入で目指すもの