タグ

ブックマーク / xtech.nikkei.com (36)

  • iPadの便利な手書き機能、Apple Pencilを「離さず少し待つ」と図形がきれいに

    iPadをデジタルノートとして使う際に覚えておきたい標準アプリ「メモ」、および「iPadOS」に備わっている便利機能を確認しておこう。 Apple Pencilを「少し止める」と図形が補正される ここからはメモアプリの手書き機能の中心となるペンツールの使い方を紹介しよう。メモアプリのペンや消しゴムなどのツールは、「PencilKit」と呼ばれるアップル標準のAPIを用いて実装されている。「Pages」「Numbers」「Keynote」といったほかのアップル製アプリの手書き機能でも採用されている。 PencilKitはサードパーティにも公開されており、既存のコードに数行追加するだけで手書き機能を実装できる。新しく登場するサードパーティ製ノートアプリでは、手書き機能はPencilKitに任せて、ほかの部分で個性を発揮する傾向が見られる。 PencilKitを採用したアプリでは、手書き機能を呼

    iPadの便利な手書き機能、Apple Pencilを「離さず少し待つ」と図形がきれいに
  • カラー化やノイズ除去をおまかせ、古い写真をAIでよみがえらせよう

    AI人工知能)は画像や写真の加工も得意だ。AIを使い古い写真をよみがえらせるWebサービスや画像編集アプリも多数ある。その中には無料で使える物もあるので、一度試してみるのはいかがだろうか。 AIで白黒写真をカラー写真に 今でこそ写真はカラーが当たり前。紙ではなくデジタルが主流になったが、そもそもカラー写真が一般的になったのは、写真がまだ「紙焼き」の時代、カラーフィルムが低価格になった1970年代以降と言われている。それ以前だと白黒写真が多い。50~60代の読者であれば自分が生まれた頃の写真は白黒の方が多いかもしれない。 白黒写真に色を付加することで、カラーに編集はできる。だが、手動で着色するのはかなり手間がかかる。そこでこの作業をAIにまかせてしまおう。AIは白黒写真に写っていた人や衣服、物や建物といった被写体を判別し、それに合った色を自動的に付加する。 AIによる白黒写真のカラー化は複

    カラー化やノイズ除去をおまかせ、古い写真をAIでよみがえらせよう
  • 好きなジャンルの曲をボーカル入りで作成、話題の作曲生成AI「Suno」がすごかった

    OpenAI(オープンAI)の「ChatGPT」をはじめとした生成AI人工知能)の進化は目を見張るものがあります。登場当初はユーザーの質問に答えるチャットボットのような用途が主でしたが、現在は画像や音楽までを生成できるようになりました。 音楽制作をなりわいとする筆者は「AIによる作曲」にとても関心があり、作曲AIをうたう様々なサービスやソフトウエアを試してきました。ですが、筆者を満足させるようなサービスやソフトウエアに出合えませんでした。「AIが進化してもクリエーティブな領域はまだまだ人間にかなわない」――。多くの識者が言及するように、筆者も満足できる作曲AIが登場するのは先の話と思っていたのです。 Sunoの出来栄えに脱帽 ところが米Suno(スーノ)が提供する作曲サービス「Suno」の登場で筆者の認識は根底からくつがえりました。Sunoは生成AIを用いて作曲できるサービスです。ユー

    好きなジャンルの曲をボーカル入りで作成、話題の作曲生成AI「Suno」がすごかった
  • デジタルノートに使うApple Pencilの選び方とチューニング方法

    日経クロステック登録会員になると… ・新着が分かるメールマガジンが届く ・キーワード登録、連載フォローが便利 さらに、有料会員に申し込むとすべての記事が読み放題に! 春割キャンペーン実施中! >>詳しくは

    デジタルノートに使うApple Pencilの選び方とチューニング方法
  • 生成AI活用の切り札「RAG」、社内情報に基づき回答できるがコストに要注意

    生成AI人工知能)を業務活用する際に、ユーザー企業がつまずきがちなポイントを指摘する特集。第3回は「RAGを使いこなすのは難しい」「大規模言語モデル(LLM)を選ぶのは難しい」「生成AIを使って最新システムを開発するのは難しい」の3つを取り上げる。 その7: RAGを使いこなすのは難しい LLMを業務で活用する際の「切り札」として期待されている技術がRAG(Retrieval Augmented Generation、検索拡張生成)だ。RAGはLLMが回答を生成する際に、ユーザーのプロンプト(指示文)に応じた外部の知識情報を参照する。ただし「RAGを使いこなすのは難しい」。それが第7のポイントだ。 LLMは事前学習した知識に基づいてテキストを出力するという性質上、事前学習した知識にはない内容を質問されると、回答できなかったり、デタラメな回答を出力したりする。いわゆるハルシネーション(幻

    生成AI活用の切り札「RAG」、社内情報に基づき回答できるがコストに要注意
  • ハルシネーションの根絶は無理筋、ファインチューニングへの過度な期待も禁物

    生成AI人工知能)を業務活用する際に、ユーザー企業がつまずきがちなポイントを指摘する特集。第2回は「ハルシネーションをなくすのは難しい」「生成AIを業務自動化に活用するのは難しい」「ファインチューニングは難しすぎる」の3つを取り上げよう。 その4: ハルシネーションをなくすのは難しい 生成AIが抱える課題として最も広く認識されているのはハルシネーション(幻覚)だろう。生成AIがもっともらしい嘘を回答する問題だ。しかし「ハルシネーションをなくすのは難しい」。それが第4のポイントだ。 まず「ハルシネーションを根絶しない限り、生成AIは業務で活用できない」と考えること自体が、生成AIの業務活用を難しくするということを明言しておこう。「ハルシネーションは完全な悪ではない。今の生成AIは前提としてハルシネーションが発生してしまう。しかしユーザーが生成AIの出力を咀嚼(そしゃく)して利用するなら、

    ハルシネーションの根絶は無理筋、ファインチューニングへの過度な期待も禁物
  • PDFに使える厳選ツール、PDF-XChangeなら無料版でもテキスト編集が可能

    日経クロステック登録会員になると… ・新着が分かるメールマガジンが届く ・キーワード登録、連載フォローが便利 さらに、有料会員に申し込むとすべての記事が読み放題に! 春割キャンペーン実施中! >>詳しくは

    PDFに使える厳選ツール、PDF-XChangeなら無料版でもテキスト編集が可能
  • 高音質なソニーのワイヤレスイヤホン「WF-1000XM5」、小型・軽量化で装着感アップ

    スマートフォンからヘッドホン端子が消え始めて早8年以上。聴きたい楽曲がすぐ手に入るストリーミングサービスが全盛期を迎え、音楽を手軽に楽しめるワイヤレスイヤホンは今や生活必需品となった。 ソニーの「WF-1000XM5」は、そんな中にあって独自の輝きを見せる製品だ。オーディオ製品として音質に優れるだけでなく、機能や使いやすさ、装着感といったあらゆる評価視点でトップ評価を与えられる。同社が近年発売したオーディオ製品の中でも、トップクラスの出来栄えだ。

    高音質なソニーのワイヤレスイヤホン「WF-1000XM5」、小型・軽量化で装着感アップ
  • NTTがLLMと音声合成で「デジタル分身」開発、少量データで個人を再現

    NTTは2024年1月17日、大規模言語モデル(LLM)と音声合成技術を使って個人の話す内容や声色を再現する「デジタル分身」の技術を開発したと発表した。個人的な対話データは数百から1000件程度、音声データは数秒または数分程度あれば、個人の特徴を再現できるという。 今回発表したのは、NTTのLLMである「tsuzumi」を使って個人の会話を効率よく再現する「個人性再現対話技術」と、少量の音声データから個人の声色を反映した音声を合成する「Zero/Few-shot音声合成技術」の2つ。NTT人のデジタル分身となるAI人工知能)エージェント技術「Another Me」の研究開発を進めており、2つの技術はその構成要素となる。

    NTTがLLMと音声合成で「デジタル分身」開発、少量データで個人を再現
  • 生成AIの誤回答を防ぐ「RAG」技術、要約業務で実装したデロイトトーマツの成果

    生成AI人工知能)を活用する際、企業にとって大きな課題となるのがAIがでたらめな回答をするハルシネーション(幻覚)だ。先行企業の多くは、ハルシネーションを軽減する取り組みを開始している。中でも注目される技術が検索拡張生成(RAG、Retrieval Augmented Generation)である。 ハルシネーション軽減にRAGを導入 「我々自身が生成AIを使った変革をしなければ、顧客の期待に応えられない」――。このように危機感をあらわにするのは、デロイトトーマツコンサルティングの藤岡稔大執行役員/パートナーだ。デロイトトーマツコンサルティングは2023年7月に、全社員5000人が生成AIを活用できる環境を構築。同年9月にはGPT-3.5だけでなくGPT-4も使えるようにするなど、生成AIを活用できる環境を積極的に整えている。 顧客企業が生成AIを活用するようになれば、生成AIで入手でき

    生成AIの誤回答を防ぐ「RAG」技術、要約業務で実装したデロイトトーマツの成果
  • 生成AIの「幻覚」防ぐグラウンディング、ハルシネーションの解決策をひもとく

    大規模言語モデル(LLM)ベースの生成AI人工知能)を企業が活用する際の大きな課題は、AIがでたらめを述べる「ハルシネーション(幻覚)」だ。自社の商品サービスを顧客に説明するAIがハルシネーションを起こしたら、企業の評価を毀損する恐れすらある。 「ハルシネーションの解決策としてグラウンディング(Grounding)がある」。グーグル・クラウド・ジャパンが2023年8月22日に開催した生成AIに関するイベント「Generative AI Summit」で、同社の牧允皓氏はこう語った。 ここで言うグラウンディングとは、AIを活用する側が指定した情報源だけに基づいて、LLMに回答を生成させることを指す。LLMは事前に学習した大量の訓練データから得た情報に基づいて文章を生成するが、ここでは事前学習した情報は使わせない。生成した文章の情報がどのデータに基づくのか追跡できるようにもする。 Googl

    生成AIの「幻覚」防ぐグラウンディング、ハルシネーションの解決策をひもとく
  • 高度な検出不能マルウエアを数時間で生成、研究者はChatGPTをどうだましたのか

    話題の生成AI人工知能)チャットボット「ChatGPT」。質問に答えるだけでなく、プログラムコードなども生成してくれる。このため登場以来、「マルウエアの生成」といったサイバー攻撃への悪用が懸念されている。 対策として、ChatGPTにはコンテンツフィルター機能が実装されている。悪用目的と思われるプロンプト(質問や要求)は拒否する。 例えば「ウイルス対策ソフトに検出されないマルウエアを生成して」などと要求すると、「私たちは、倫理的・法的に正しい行動を促進することを目的としています。そのため、ウイルス対策ソフトに検出されないマルウエアを生成する方法を提供することはできません」などと説教されてしまう。 だが実際には、ChatGPTを使ったマルウエアの生成例が相次いで報告されている。ChatGPTをだまして、まっとうなプログラムだと思わせるのがポイントのようだ。 2023年4月上旬には、米国のセ

    高度な検出不能マルウエアを数時間で生成、研究者はChatGPTをどうだましたのか
  • 第3の核融合発電、2024年にも発電開始へ

    FRC( Field-Reversed Configuration )型プラズマを利用する核融合発電の概要とメリットを示した。FRC型プラズマ(またはプラズモイド)はドーナツ状の自律した磁場中にプラズマを閉じ込めたもの(a)。磁場のうち、ドーナツの大きな輪に沿った成分Btは2つのプラズマで反対方向を向いている。これら2つを衝突させると、Bt成分が打ち消し合って加熱が進む。この方式の長所は大きく3つある(b)。1つは、原理上、トカマク式などより弱い磁場でプラズマの強い閉じ込めができること。これにより、装置をよりコンパクトに、あるいは高温の実現が可能になる。より高温を実現できることで2つめのメリット、つまりD-3He反応やp-11B反応といった中性子が出ない核融合反応も実現可能になると考えられている。これは、安全性が高いだけでなく、炉の素材や構造を大幅に簡素にできる。コストをかけられない実験装

    第3の核融合発電、2024年にも発電開始へ
  • 話題の文字起こしAI「Whisper」、ニュース記事を読み上げて試したら驚きの精度だった

    インタビューや会議の際に発言内容をメモしながら、後で間違えないよう録音もする人は少なくないだろう。だが、録音した音声を聞いてテキストに起こす作業はかなりの手間がかかる。筆者の場合は聞き取りづらい箇所を繰り返し再生したり、パソコンに文字を打ち込む操作が遅れて音声の再生を一時停止したりしているうちに、実際の録音時間の何倍もかかってしまう。作業が終わるころには疲れてうんざりしていることもある。 筆者と同じように「骨の折れる文字起こし作業を何とか楽にこなしたい」と考える人は、洋の東西を問わず多いのかもしれない。最近はAI人工知能)によって音声を解析して自動的に文字起こしするツールが国内外で増えてきた。中でも大きな注目を集めているのは、米OpenAI(オープンAI)の音声認識AIWhisper」だ。 同社は米テスラ創業者のイーロン・マスク氏らが設立したAIの研究開発企業で、2020年に発表した言

    話題の文字起こしAI「Whisper」、ニュース記事を読み上げて試したら驚きの精度だった
  • グローバルインターネットは終わり、「ブロック」化が進むのか

    米外交問題評議会(CFR)のタスクフォースが2022年7月に公表した報告書「Confronting Reality in Cyberspace Foreign Policy for a Fragmented Internet」 CFRは1921年に設立された超党派の会員制組織だ。CFRのタスクフォースはこの報告書で、「グローバルインターネットの時代は終わった。米国はさらなるインターネットの断片化を止めることはできない」と断言。「自由で開かれた」という米国の価値観を強く反映してきた現在のインターネットが、「単なるビジョンにすぎず、現実のものではなくなった。オープンで信頼性が高く、安全なグローバルネットワークというユートピア的なビジョンは、今後も実現する見込みはない」という厳しい認識を示したのだ。 以前に紹介したように、中国ロシアなどの権威主義的な国家は、国内インターネットの統制を強めている

    グローバルインターネットは終わり、「ブロック」化が進むのか
  • 免許返納したシニアの新たな移動手段に、WHILLが歩道走れる電動スクーター

    電動車椅子を開発するスタートアップのWHILLは2022年9月13日、自動車免許を返納したシニア世代の新たな「足」となることを目指す、歩道を走れるスクーター「WHILL Model S」の先行受注を開始したと発表した。販売価格は21万8000円(非課税)である。

    免許返納したシニアの新たな移動手段に、WHILLが歩道走れる電動スクーター
  • 分散システムはなぜ非中心の夢を見るか、Web 3.0ブームをまじめに考察する

    今から10年ほど前の2013年、筆者は六木のダイニングバー「The Pink Cow」に入り浸っていた。多国籍の料理や酒を楽しむため……ではなく、そこに集う暗号資産(仮想通貨)Bitcoin(ビットコイン)ファンに話を聞くためだ。 銀行を介さず自らデジタル通貨を管理し、店で決済できるBitcoinの可能性に、誰もが興奮していた。ブロックチェーンを使えば、銀行や国家から独立したDecentralized(非中心、非中央集権)なマネーを運営できる。そんな魅力に引かれていた。 そして2022年。DeFi(分散型金融)やNFT(非代替性トークン)、DAO(分散型自律組織)などに代表される「Web 3.0(Web3)」のブームにおいても、やはり人々を引き付けたのは非中心という考え方だった。「Web 1.0やWeb 2.0は中央集権的だが、Web 3.0は非中心になる」といわれるようになった。 とは

    分散システムはなぜ非中心の夢を見るか、Web 3.0ブームをまじめに考察する
  • Web3は本当に日本に必要な技術なのか、あるネット騒動が広げた波紋

    最近、Web3について解説したある入門書が「間違いだらけ」とネットで話題になっていた。他社の出版物なので書名を挙げるのは控えるが、検索すればすぐに見つかるはずだ。怪しい出版社の書籍ではなく、インターネット関連の書籍には定評のある技術系出版社が出版したものだ。 ネットでは、この書籍内でイーサリアムをOSと呼んでいたり、TCP/IPやHTTPといったプロトコルを米Googleや米Amazon.comが独占していると書いたりしている点が問題視されていた。これを見て私は当初、「よくある自転車置き場の議論ではないか」と思った。 自転車置き場の議論とは、知識が足りない人は質的な議論ができず、自分が理解できる範囲のどうでもいい議論しかできないことを指す。この書籍に関していうと「Web3の仕組みを理解できないから、自分に理解できる範囲で揚げ足取りをしているだけではないか」と思ったのだ。 確かにイーサリア

    Web3は本当に日本に必要な技術なのか、あるネット騒動が広げた波紋
  • Pathwaysの恐るべき威力、ベールを脱いだグーグルの万能AIが目指す究極形とは

    Googleグーグル)が数年にわたって開発を進めてきた万能AI人工知能)、「Pathways」の実力が明らかになった。Pathwaysは1つの機械学習モデルが最大数百万種類のタスクに対応できるという「万能」もしくは「汎用」のAIだ。従来のAIが1モデル1タスクの専用品であるにもかかわらず、タスクを処理する性能は汎用であるPathwaysが上回った。驚くべき威力だ。 グーグル2022年4月4日(米国時間)、自然言語処理に関する複数種類のタスクを処理できる「Pathways Language Model(PaLM)」を発表した。自然言語による質問応答や文章生成などができる言語モデルと呼ばれるAIをPathwaysによって実装した。言語モデルは近年、BERTやGPT-3などがめざましい成果をあげたことで注目されている。 1モデル1タスクの専用品である従来の言語モデルで別のタスクを処理させ

    Pathwaysの恐るべき威力、ベールを脱いだグーグルの万能AIが目指す究極形とは
  • ノートPCのType-Cをディスプレイ出力に使用中、充電はどこからできる?

    【Q】Type-Cなら2台目ディスプレイがつながる? パソコンからディスプレイに映像(および音声)を出力するときは通常、HDMI端子やDisplayPort(ディスプレイポート)端子を使う。だが、タイプCの登場でその常識が崩れつつある。最近はタイプC端子を搭載し、タイプCケーブルで映像を出力できるディスプレイが増えつつある(図1)。それらの多くはノートパソコンへの給電も可能。つまり、ケーブル1でディスプレイに映像と音声を出力しつつ、ディスプレイからの電力でノートパソコンを充電できるわけだ。 図1 オルタネートモード(オルトモード)に対応したType-C端子は、USBケーブルでディスプレイに映像(および音声)を出力できる。オルタネートモードはDisplayPortやHDMIの信号を送受信するType-C端子の機能で、パソコンとディスプレイの両方が対応していれば利用できる。なお、上の例では同

    ノートPCのType-Cをディスプレイ出力に使用中、充電はどこからできる?