タグ

ブックマーク / www.itmedia.co.jp (388)

  • PKSHA製基盤モデルの特徴とは? 「Transformer」ではなく「RetNet」だから実現できた“3つの強み”

    PKSHA製基盤モデルの特徴とは? 「Transformer」ではなく「RetNet」だから実現できた“3つの強み” 生成AIブームの今、注目のキーワードが「基盤モデル」だ。大量のデータを事前学習したAIモデルのことで、少しのチューニングを施せば、さまざまなタスクに対応できる。米OpenAIの「GPT-4」といった生成AIも包含する概念だ。 さまざまな企業が生成AIを使った業務効率化を試行錯誤する中、各AIベンダーたちの間では基盤モデルの開発競争が激化している。そこでこの特集では、基盤モデルを開発するAIベンダーに一問一答メールインタビューを実施。開発状況や独自の強みなどを探っていく。 今回は、日マイクロソフトの技術支援の元で、独自の基盤モデルを開発する、AIベンチャー・PKSHA Technology(東京都文京区)に話を聞いた。 PKSHA Technologyの基盤モデルの特徴や強

    PKSHA製基盤モデルの特徴とは? 「Transformer」ではなく「RetNet」だから実現できた“3つの強み”
    none53
    none53 2024/06/12
  • ブーム来る? 「和文バリアブルフォント」の世界

    そんな事もあり、4月10日は新しいフォントがいくつか発表された。今年の目玉はなんといっても「和文バリアブルフォント」であろう。 われわれが普段使用するフォントは、同じデザインでも細いもの、太いもの、横が詰まったものなどがそれぞれ個別のフォントとして提供され、1つのファミリーを形成している。 一方バリアブルフォントは、そうした文字の変形を1つのフォントで提供していこうという比較的最近のフォントフォーマットで、米Adobe/米Apple/米Google/米Microsoftが共同開発した。フォントパラメータとして、太さや字幅がバリアブルで変更できるため、従来はファミリーで提供しなければならなかったフォントデータが、1つのフォントで小さく提供できるというメリットがある。 もちろんデザインする側も、細いか太いかの2択ではなく「中間」も選べるし、縦長、横長も選べるので、表現の幅が広がるわけである。た

    ブーム来る? 「和文バリアブルフォント」の世界
    none53
    none53 2024/04/24
  • 5つの文字から1万4000文字を自動生成 筑波大発AIベンチャーがフォント生成システム 特許出願

    筑波大学発AIスタートアップのAIdeaLab(東京都千代田区)は8月17日、5つの文字から1万4000以上の文字をAIで自動生成するフォント生成システムの特許を出願したと発表した。 システムは、敵対生成ネットワーク(GAN)をベースに、大量のフォントを学習させた上で、手作業でデザインした数個の文字から、太さやセリフ(装飾)の形状を抽出し、生成する。パラメーターの値を調整することで、新しいフォントとして出力することも可能。ピクセル画像ではなく、ベクター画像として生成する独自技術により、フォントファイルとしての出力を可能にしたという。 特許は、フォント生成モデルだけでなく、アプリケーションUIも含む。パラメーター調整でフォントを生成するUI、少ない文字数でのアップロードでフォントを生成するUIなど、さまざまなパターンのサービス展開を織り込んでおり、特許出願技術をベースに、フォント制作会社向け

    5つの文字から1万4000文字を自動生成 筑波大発AIベンチャーがフォント生成システム 特許出願
    none53
    none53 2022/08/18
  • 文章から高解像度な画像を生成するAI、Microsoftなどが開発 「DALL・E2」や「Imagen」よりも横長で出力

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Microsoft Research Asia、北京大学、Microsoft Azure AIによる研究チームが開発した「NUWA-Infinity: Autoregressive over Autoregressive Generation for Infinite Visual Synthesis」は、 テキストから画像や動画、画像から動画、画像から拡張画像(コンテンツの関係を失うことなく画像を拡大すること)などを生成する学習モデルだ。 OpenAIのDALL・E2、GoogleのImagenやPartiなど、テキストから高品質の画像を生成できるモデルが注目されている。これらが解像度1

    文章から高解像度な画像を生成するAI、Microsoftなどが開発 「DALL・E2」や「Imagen」よりも横長で出力
    none53
    none53 2022/08/01
  • 光ファイバーでできたUSBケーブル登場 転送速度10Gbps、最長15m

    業務用映像機器メーカーのエーディテクノ(東京都新宿区)は4月28日、光ファイバーを使ったUSBケーブル6種類を6月15日に発売すると発表した。USB 3.2 Gen2に対応し、データ転送速度は規格最大値の10Gbps。ケーブルの長さは最長15m。想定価格は3万円台。 データロスが少なく長距離伝送に向いたOM3規格光ファイバーと、銅線を混ぜ合わせたハイブリッドケーブル。ケーブル部分の外径は4.5mm。コネクター部分は外来ノイズの影響を抑えるため金属製の筐体を採用。コネクターはUSB Type-A、USB Type-B、USB Type-Cから選べる。 関連記事 ローカル5Gで固定回線「NURO Wireless 5G」、大手キャリアの5Gホームルーターとの違いは? ソニーワイヤレスコミュニケーションズが4月1日から提供している、ローカル5Gを利用したインターネット接続サービス「NURO Wi

    光ファイバーでできたUSBケーブル登場 転送速度10Gbps、最長15m
    none53
    none53 2022/04/29
  • Googleが学生の手で学校用Chromebookを修理するプログラムを開始

    Googleは2月3日(現地時間)、教育機関で使用されているChromebookを学生自身の手で修理できるように支援する「Chromebook repair program」を米国で開始し、その一歩として、Chromebookを製造販売している台湾Acerと中国Lenovoの協力を得て、機種ごとの分解/修理マニュアルを公開した。 Googleによると、Acerなどのメーカーは既に学校でChromebookを修理する方法を教える教室を開講しているという。その結果、学生が修理センターを運営している学校も存在する。Googleはその学校の事例をまとめた文書と、どうすれば学生による修理センターを立ち上げることができるのかを説明する文書も公開した。

    Googleが学生の手で学校用Chromebookを修理するプログラムを開始
    none53
    none53 2022/02/08
  • 「誰がモデルか、なんとなく分かる」アニメ風の顔画像に変換するAI、台湾の研究チームが開発

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 国立台湾科技大学の研究チームが開発した「Cartoon Style Transfer in Faces using GANs」は、現実の顔のアイデンティティーを維持したままアニメ風の顔画像に変換するGAN(Generative Adversarial Network)を使った手法だ。実写感を排除しているのに、元の顔の原型をできるだけ残した点が特徴だ。 先行研究でも実写の顔画像からアニメ風の顔画像にスタイル変換するGANを使ったモデルが多数報告されている。TikTokやSnapchatなどの多くのモバイルアプリでも顔をアニメ化できるカートゥーン・フィルター機能を提供している。 これらの問題点

    「誰がモデルか、なんとなく分かる」アニメ風の顔画像に変換するAI、台湾の研究チームが開発
    none53
    none53 2022/02/03
  • テキストから御朱印を自動生成するシステム、筑波大が開発 寺社1000カ所以上から御朱印収集、データ化

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 筑波大学落合研究室の研究チームが開発した「Goshuin 2.0: Construction of the World’s Largest Goshuin Dataset and Automatic Generation System of Goshuin with Neural Style Transfer」(御朱印2.0)は、テキストから御朱印を自動生成する学習ベースのシステムだ。訓練用のデータセットは、寺社1000カ所以上を訪問し取得した御朱印を基に大規模にデータ化した。 御朱印とは、日の神社やお寺に参拝した証として集められるものだ。御朱印はおおむね、印章と寺社の名称や尊/祭神の

    テキストから御朱印を自動生成するシステム、筑波大が開発 寺社1000カ所以上から御朱印収集、データ化
    none53
    none53 2022/01/07
  • 京大スパコンのデータ77TBが消失 バックアップ処理中に不具合 日本ヒューレット・パッカード「100%弊社の責任」

    京都大学は12月28日、同学のスーパーコンピュータに保存していたデータ約77TBが消失したと発表した。うち約28TBはバックアップがなく復元不能という。原因は日ヒューレット・パッカード(HPE)製バックアッププログラムの不具合で、同社は「100%弊社の責」と謝罪している。 消失したのは、12月3日以降に更新がなかった3401万1293個のファイル。HPEによると、ストレージのバックアップ処理実行中にバックアッププログラムの更新作業をしたことで、ストレージ内のファイルを削除する想定外の処理が発生したのが原因という。 京都大学とHPEはバップアップ作業を停止。プログラムの改善と再発防止策を施した上で1月末までに再始動する予定。HPEは苦情や善後策の相談などを受け付けるメール窓口を設置した。 京都大学は今後、バックアップ機能の強化と運用管理の改善に取り組む。HPEは「担当技術者へのヒューマンエ

    京大スパコンのデータ77TBが消失 バックアップ処理中に不具合 日本ヒューレット・パッカード「100%弊社の責任」
    none53
    none53 2021/12/29
  • テキストだけで、AIが3Dモデルを自動生成 米Googleなどの研究チームが開発

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Google Researchと米カリフォルニア大学バークレー校の研究チームが開発した「Zero-Shot Text-Guided Object Generation with Dream Fields」は、自然言語の記述のみからデジタル3Dオブジェクトを生成するZero-shot learningを使ったアプローチだ。従来の手法とは異なり、3Dの学習データを必要とせず、自然言語によるプロンプトのみを使用し、形状や色、スタイルを柔軟に制御する。 以下の画像では、いくつかの出力結果の例を示している。例えば、画像上段は「bouquet of flowers sitting in a clea

    テキストだけで、AIが3Dモデルを自動生成 米Googleなどの研究チームが開発
    none53
    none53 2021/12/17
  • 合成背景に人が溶け込むよう照明を調節する技術 Googleが開発

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Google Researchが開発した「Total Relighting」は、人物画像を切り抜いて別の背景に置き換えた際、被写体の照明変更を行う深層学習を用いた技術だ。静止画像だけでなく、映像内で動く人物も新しい背景に応じた照明で合成し、違和感のない動画コンテンツに仕上げる。

    合成背景に人が溶け込むよう照明を調節する技術 Googleが開発
    none53
    none53 2021/10/18
  • 血流の動きをアバターの顔に反映したら、より人間的になった Microsoftなどが技術開発

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 3DCGの進化により、写実的なアバターを作成できるようになってきた。髪の毛や皮膚の繊細な再現、シワや呼吸の動きなど人間を模倣した追求が日進月歩で進んでいる。今回は、血流の変化によって生じる顔面のシグナルを再現するアプローチを取る。これまでの細部にこだわる表現よりも変化する見た目は派手ではなく知覚するのも困難だが、リアリティーの高い効果が得られると研究チームは述べている。 今回のアプローチは、生理学的な血流モデルに基づいてアバター上のピクセルを操作する方法で血流をシミュレートする。(1)画像やビデオフレームから得られる人の顔の血流の強度に基づく空間的マッピング、(2)ヘモグロビンの量に基づく

    血流の動きをアバターの顔に反映したら、より人間的になった Microsoftなどが技術開発
    none53
    none53 2021/10/15
  • 漫画のカラー化、AIが肩代わり 精度100%ではなくても有用なワケ

    ワンピース」や「鬼滅の刃」など、世界中でブームを起こしている日漫画。しかし、翻訳されたからといって必ずしも全ての漫画海外でヒットするわけではない。当然コンテンツ自体の面白さもあるが、もう一つ、海外展開には課題があるという。ピクシブの古賀和樹さん(新規事業部マネージャー)は「海外ではカラー漫画が主流になりつつある。中国では漫画がカラーでないと未完成のように感じられて読まれないこともある」と指摘する。 だが、白黒漫画のカラー化は漫画家にとって必ずしも「やりたい作業」とは言い難い。白黒漫画をデジタルで着色するには、色やパーツごとに範囲選択をした後、レイヤー分け、下塗り、仕上げ塗りといった作業工程が必要になり、時間や手間がかかるからだ。 この「やりたくない着色作業」を肩代わりするのが、ピクシブとAIベンチャーのPreferred Networksが作った自動着色AI「Petalica Pa

    漫画のカラー化、AIが肩代わり 精度100%ではなくても有用なワケ
    none53
    none53 2021/09/22
  • 経産省、GitHubで民間から意見募集 AI巡る契約書などの見本作りで 「フィードバックを広く受ける」

    経産省、GitHubで民間から意見募集 AI巡る契約書などの見作りで 「フィードバックを広く受ける」 経済産業省と特許庁は9月8日、AI技術や新素材に関連する契約書の見「モデル契約書」の改訂版を作成するに当たり、ソースコード共有サイト「GitHub」で民間からの意見募集を始めた。「モデル契約書のユーザーであるかを問わず、改善に向けたフィードバックを広く受けるため、不特定多数が編集に携わることができるGitHubを選んだ」(経産省)という。 スタートアップ企業と大企業が結ぶ秘密保持契約や技術検証契約などを想定したモデル契約書に書く条文の改善案や、修正が必要な理由を、GitHub上の課題や議論の管理機能「Issue」で募集。これらの意見を取りまとめ、改訂版に反映する。匿名の意見も受け付ける。 モデル契約書について意見募集をGitHubで行うのは2回目。初回はトライアルとして、マークアップ言

    経産省、GitHubで民間から意見募集 AI巡る契約書などの見本作りで 「フィードバックを広く受ける」
    none53
    none53 2021/09/10
  • Googleの“第三のOS”「Fuchsia」、初代「Nest Hub」にいつの間にか降臨

    Googleは、“第三のOS”「Fuchsia」を第1世代のNest Hub(旧「Google Home Hub」)にOTAによるサイレントアップデートでインストールしている。米9TO5Googleが8月17日(現地時間)、Googleに確認したとしてそう報じた。 Fuchsiaのリリースは5月にGoogleが認めていたが、その段階では「プレビュープログラム」を有効にした一部の端末のみが対象だった。9TO5Googleは、Googleが先週末にサポートページを更新し、ファームウェアアップデートのバージョンを更新したことに気づき、Googleに確認したところFuchsiaへの移行を認めたという。 稿筆者の第1世代Nest Hubのファームウェアバージョンも「1.52.260996」になっており、これはFuchsiaであることを意味する。なお、第2世代Nest Hubは対象ではなく、まだ「

    Googleの“第三のOS”「Fuchsia」、初代「Nest Hub」にいつの間にか降臨
    none53
    none53 2021/08/23
  • 小動物の脳活動をワイヤレス計測 1台約8000円の価格破壊 豊技大が開発

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 豊橋技術科学大学の研究チームが開発した「A lightweight, wireless Bluetooth-low-energy neuronal recording system for mice」は、小動物に取り付け可能な脳活動計測ワイヤレスシステムだ。小さく軽量なためマウスなどの小型の動物に適応できる。安価に製作でき、性能も高いという。 脳の情報処理の仕組みを理解するためには、脳組織内の多数のニューロンの発火活動を同時に測定し、個別に解析することが有効とされる。ニューロンの発火活動を直接捉えるには、微小電極で組織内のニューロン近傍の信号を測定する電気生理学的手法が効果的とされている。

    小動物の脳活動をワイヤレス計測 1台約8000円の価格破壊 豊技大が開発
    none53
    none53 2021/08/03
  • 「6年解けなかった構造があっさり」──タンパク質の“形”を予測する「AlphaFold2」の衝撃 GitHubで公開、誰でも利用可能に

    Alphabet傘下の英DeepMindが、遺伝子配列情報からタンパク質の立体構造を解析するAIAlphaFold v2.0」(以下、AlphaFold2)をGitHub上で無償公開し、ネット上で注目を集めている。Twitterを利用する生物系の研究者からは「革命的な成果だ」「これからの研究の前提が変わっていく」など、AlphaFold2の予測精度に対して驚きの声が相次いだ。 なぜAlphaFold2はこれほどの驚きや賞賛をもって迎えられているのか。タンパク質構造解析の難しさをひも解く。 未知の部分が多いタンパク質の構造 タンパク質は数十種類のアミノ酸からできており、配列によってさまざまな性質に変化する。例えば筋肉、消化酵素、髪の毛はそれぞれ役割が異なるが、いずれもタンパク質で作られている。タンパク質の構造が分かれば、生体内の化学反応の理解が進む。アルツハイマー型認知症やパーキンソン病

    「6年解けなかった構造があっさり」──タンパク質の“形”を予測する「AlphaFold2」の衝撃 GitHubで公開、誰でも利用可能に
    none53
    none53 2021/07/20
  • 書き込み可能な42インチの電子ペーパー PC、スマホと連携可 リコーが企業向けに提供

    リコーは7月16日、専用のペンで書き込み可能な42インチの電子ペーパー端末「RICOH eWhiteboard 4200」を発表した。画面上の手書き文字を認識し、自動でデジタルな文字に変換する機能も搭載。ホワイトボードや製図用紙の代わりとして、医療現場や屋外で図面を確認する建設現場などでの利用を見込む。価格は1台43万4000円(税別)から。

    書き込み可能な42インチの電子ペーパー PC、スマホと連携可 リコーが企業向けに提供
    none53
    none53 2021/07/17
  • 今度はCore i5枯渇で閉口するショップ

    グラフィックスカードや大容量HDD/SSDの在庫が回復傾向にある中で、ここ最近「売り切れ」の札が目立っているのがCPUの第11世代Core i5だ。 「もう次の世代に意識がいっちゃっているの? と思ってしまいます」 パソコン工房 秋葉原BUYMORE点は「ここ2週間くらいモノがなくなっていますね。マザーボードベンダー各社が夏の自作キャンペーンを打つタイミングで、ボリュームゾーンのCore i5が選べない。なかなか痛いですよ」とこぼす。 他店でも同様の傾向が見られ、Core i9とCore i5の多くのラインアップを切らしている風景をよく見かけた。ドスパラ秋葉原店も「i7はあるんですが、第11世代のi5は全部“在庫確認商品”になっていますね」という。

    今度はCore i5枯渇で閉口するショップ
    none53
    none53 2021/07/15
  • ドコモが2022年春から「IPv6シングルスタック」を導入へ 7月1日から開発者向けに試験環境を提供

    NTTドコモは2022年春から、モバイルデータ通信においてIPv6アドレスのみを割り当てる「IPv6シングルスタック方式」を導入する。ユーザー側で申し込みや設定変更は必要ない。それに先だって、同社は7月1日から12月3日まで、開発者に接続試験環境を提供する予定だ。 【追記:17時20分】ahamoでも利用できる旨を追記しました。合わせて、一部の表記を見直しました そもそも「IPv6シングルスタック方式」とは? インターネット上のサーバのアドレスは、大きく分けて「IPv4アドレス」と「IPv6アドレス」の2種類がある。普段はWebサイトにアクセスする際に「http://www.itmedia.co.jp/」といった「ドメイン名」を含むアドレスを利用するが、インターネット上のどこかにある「DNS(Dynamic Name System)サーバ」が、IPv4アドレスまたはIPv6アドレスに“変換

    ドコモが2022年春から「IPv6シングルスタック」を導入へ 7月1日から開発者向けに試験環境を提供
    none53
    none53 2021/07/06