ブックマーク / www.itmedia.co.jp (51)

  • 「RAGはそんなに簡単じゃない」──AIエンジニア主導でLLMを導入すると失敗に? 日本語特化のELYZA・曽根岡CEOに聞く、LLM開発&活用のいま

    「RAGはそんなに簡単じゃない」──AIエンジニア主導でLLMを導入すると失敗に? 日語特化のELYZA・曽根岡CEOに聞く、LLM開発&活用のいま(1/2 ページ) GPT-3.5 Turboと同水準の日語特化型LLMを開発したELYZA。4月にはKDDIグループの傘下となり、注目を集めている。日語性能トップクラスのLLMをどう作っているのか。KDDI傘下になったのはどんな狙いが? LLM活用でいま注目のポイントは? 気になることを、曽根岡侑也CEOにインタビューした。 「ChatGPTがやってることを全部やりきった」 3月に発表した700億パラメータモデル「ELYZA-japanese-Llama-2-70b」は、OpenAIの「GPT-3.5 Turbo」やGoogleの「Gemini 1.0 Pro」に匹敵する日語タスク処理性能を備える。性能向上をどのように実現したのか。

    「RAGはそんなに簡単じゃない」──AIエンジニア主導でLLMを導入すると失敗に? 日本語特化のELYZA・曽根岡CEOに聞く、LLM開発&活用のいま
  • なぜ人は“録音”よりも“ライブ演奏”で感動するのか スイスの研究者が解明 MRI内で音楽鑑賞して実験

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2

    なぜ人は“録音”よりも“ライブ演奏”で感動するのか スイスの研究者が解明 MRI内で音楽鑑賞して実験
  • Google、オープンな生成AIモデル「Gemma」公開 商用利用OK、Geminiと同じ技術の軽量LLM

    また、Gemmaの事前トレーニング済みモデルでは、学習データから特定の個人情報やその他の機密データを除外していると安全性もアピール。開発者や研究者向けに、安全で責任あるAIアプリケーションを構築できるというツールキット「Responsible Generative AI Toolkit」も併せて公開している。 関連記事 Google、“現行最強”の生成AI発表 月2900円で利用可 チャットAIサービスはBard→Geminiに刷新 米Googleは2月8日(現地時間)、「現行最強」をうたう生成AI「Gemini Advanced」を発表した。すでにサービスを提供開始しており、月額2900円で利用可能。2カ月間の無料試用期間も用意する。 Google、「Gemini 1.5 Pro」限定リリース コンテキストウィンドウは100万トークン Googleは、生成AIの次世代モデル「Gemini

    Google、オープンな生成AIモデル「Gemma」公開 商用利用OK、Geminiと同じ技術の軽量LLM
  • 集中力を高めないと抜けない"聖剣” 東大が開発 脳波と視線で集中力を推定

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 東京大学に所属する研究者らが発表した論文「聖剣を継ぐ者 - 集中の証明 -」は、フィードバックされた集中力を用いて祭壇に埋まった聖剣を抜くというVR体験を提案した研究報告である。体験者にはVR HMD(ヘッドマウントディスプレイ)や脳波計測デバイスなどを装着させ、マルチモーダルに集中力をフィードバックすることで、腕力ではなく集中力を高めて聖剣を抜く体験を提供する。

    集中力を高めないと抜けない"聖剣” 東大が開発 脳波と視線で集中力を推定
    yk_uminami
    yk_uminami 2023/11/16
    久しぶりにニヤニヤするニュースだ
  • なぜ日本はGPUのない「富岳」でLLMを研究するのか 外国に後れを取らないための“現実的な理由”

    OpenAIの大規模言語モデル(LLM)・GPT-4は今、世界を大きく塗り替え続けている技術の一つだ。世界各国の企業がこぞってLLMの開発を進めている。特にGAFAなどの巨大企業は、その膨大な資源を使ってすでにいくつものLLMを世に放っている。 そんな中、日では理化学研究所と富士通、東京工業大学、東北大学が、スーパーコンピュータ「富岳」を使ったLLMの研究を今まさに進めている。学習手法の研究からデータの法的な扱いまで幅広く検討し、日のLLM開発の基盤を作るのが目的だ。 深層学習といえば、今ではGPUを使うのが一般的になっている。しかし富岳はそのGPUを搭載していない。日にはGPU搭載スパコンも存在するのに、なぜ富岳を使ってLLMを研究するのか。 今回は富士通研究所・コンピューティング研究所の中島耕太所長と白幡晃一さんに、富岳を使ったLLM研究について、その意義を聞いた。富岳は確かに

    なぜ日本はGPUのない「富岳」でLLMを研究するのか 外国に後れを取らないための“現実的な理由”
  • 百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】

    昨年末から急激に話題を呼んだChatGPT、その内部的なバージョンアップであるGPT-3.5とGPT-4はいずれもMicrosoftから強力な支援を受けた米OpenAIという企業が独占的に提供する大規模言語モデル(LLM)だ。 それに呼応するかのように、Meta社からはLLaMA(ラマ)がリリースされ、LLaMAをChatGPTとの1万3千回の会話データで微調整したAlpaca(アルパカ)、AlpacaをShareGPT(GPTとの会話を有志がオープンにしたもの)のデータで微調整したVicuna(ビクーニャ)といった派生モデルが次々と登場した。 しかし、LLaMAはMeta社の意向により「アカデミック用途限定」という縛りがある。またGPTの出力にはOpenAIの利用規定で「GPTの出力結果を元にGPTに対抗できる強力なAIを作ってはいけない」という制約があるため、AlpacaもVicuna

    百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】
  • GPT-4が労働市場に与える影響と各職種のリスク評価──OpenAIの研究者が論文発表

    大規模言語モデル(LLM)の「GPT-4」を手掛けた米OpenAIとペンシルベニア大学の研究者らは3月17日、「GPTはGPT:LLMの労働市場への影響の可能性に関する初期の考察」と題した論文を公開した。「GPT(Generative Pre-trained Transformer)モデルと関連技術が米国の労働市場に与える潜在的な影響を調査」したとしている。 調査の結果、米国の労働力の約80%が、GPTの導入によって少なくとも仕事の10%に影響を受ける可能性があり、約19%の労働者は仕事の50%に影響を受ける可能性があることが示されたという。 ほぼすべての職種に影響するが、特に現在高収入な職種のリスクが高いとしている。 調査は、学習達成度を表を用いて測定するルーブリック評価によって、職業別の人間の専門知識とGPT-4を使った場合を比較した。 方法は、1016の職業について、職業ごとに測定す

    GPT-4が労働市場に与える影響と各職種のリスク評価──OpenAIの研究者が論文発表
  • ラズパイで動く大規模言語モデルがGitHubで公開 性能は“GPT-3相当”、Metaの「LLaMA」派生

    LLaMAは米Metaが独自開発した大規模言語モデル。LLM分野の研究推進を支援するため、研究者向けに2月にリリースした。大規模インフラを利用できない研究者のために小規模ながら性能の高いことが特徴で、7B(=70億)、13B、33B、65Bの4種類のパラメーターを用意している。13Bモデルはベンチマークで米OpenAIのLLM「GPT-3」を上回るという。 米スタンフォード大学は、LLaMAの7Bモデルを派生させ独自のLLM「Stanford Alpaca」を開発。このモデルは研究や学術目的でのみ利用でき、娯楽や商用での利用は禁止している。Alpaca LoRAでは、Stanford Alpacaが生成するトークン(単語列)を再現できるという。 関連記事 Meta、独自大規模言語モデル(LLM)の「LLaMA」を限定リリース Metaは独自の大規模言語モデル「LLaMA」(Large La

    ラズパイで動く大規模言語モデルがGitHubで公開 性能は“GPT-3相当”、Metaの「LLaMA」派生
  • サイボウズの“駆け出しエンジニア”向け研修資料が話題 Webアプリ開発やIT文化の基礎を無償公開

    サイボウズが公式ブログで無償公開している、新人ITエンジニア向けの研修資料Twitterで話題だ。Webアプリ開発の基礎知識やIT業界文化などが学べるといい、7月26日夜ごろから「初心者(エンジニア)の指針になる」「一通りできれば相当なレベルになれそう」などの声が出ている。 サイボウズが2021年4月から6月にかけて行った研修で使った資料や講義動画の一部を公開。Webアプリ開発やIT業界文化に加え、HTTPやDNSの仕組み、コンテナやその管理ソフトウェア「Docker」「Kubernetes」の基礎知識、「CI/CD」(継続的インテグレーション/継続的デリバリー)の考え方などが学べるという。UIUXの重要性の他、同社の支社がベトナムにあることからベトナム語の基をまとめた教材も公開している。

    サイボウズの“駆け出しエンジニア”向け研修資料が話題 Webアプリ開発やIT文化の基礎を無償公開
  • ハーバード大のプログラミング講座を日本語化 無料で学べる「CS50.jp」公開

    米ハーバード大が無償公開しているプログラミング入門講座を日語に訳したWebサイト「CS50.jp」が公開された。プログラミング教育ベンチャーのLABOTが、「コロナ禍などで大学のキャンパスの環境が不安定になる中、多くの学ぶ意欲がある学生に、良質な教材に母語でアクセスしてほしい」と翻訳作業を進めてきたという。 公開したのは、ハーバード大コンピューターサイエンス学部のデビッド・J・マラン教授が、無料オンライン教育サービス「edX」で公開している人気講座「CS50」のうち、コンピュータサイエンス入門と、PythonJavaScriptを使ったプログラミング講座を日語訳したもの。YouTubeの英語教材とあわせ、日語のテキストで学べる。 CS50は、非営利で再配布・改変可能なクリエイティブ・コモンズライセンス(CC BY-NC-SA 4.0)で公開されており、非営利なら改編や再配布が可能だ

    ハーバード大のプログラミング講座を日本語化 無料で学べる「CS50.jp」公開
  • 混ざった楽器の音を演奏者の動きで分離 米MITなど研究

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米マサチューセッツ工科大学(MIT)とMIT-IBM Watson AI Labの研究チームが開発した「Music Gesture for Visual Sound Separation」は、楽器を演奏する複数人の動きを深層学習で分析し、個々の楽器の音を分離する手法だ。ピアノ、フルート、トランペットなどの楽器を複数人で同時演奏した場合に、その映像から演奏者それぞれのメロディーを抜き出す。 映像解析ネットワークと視覚音声分離ネットワークの2つからなる「自己教師あり学習」を採用。映像解析ネットワークでは、人体のキーポイント18点、手のキーポイント21点を抽出。次に身体の動きと前後関係を統合し、

    混ざった楽器の音を演奏者の動きで分離 米MITなど研究
  • 50年前から分かっていた少子高齢化問題、なぜ回避できなかったのか

    50年前から分かっていた少子高齢化問題、なぜ回避できなかったのか:スピン経済の歩き方(1/5 ページ) 「敬老の日」の昨日、この国の「敬老」の意味をあらためて考えさせられるニュースがあった。65歳以上の高齢者は約3588万人で、全人口に占める割合は28.4%と過去最高となり、これは同じく高齢化が進むイタリアの23%を大きく引き離し、世界一となっているというのだ。 「敬老の日」の昨日、この国の「敬老」の意味をあらためて考えさせられるニュースがあった。 9月15日現在、65歳以上の高齢者は約3588万人で、全人口に占める割合(高齢化率)は28.4%と過去最高となり、これは同じく高齢化が進むイタリアの23%を大きく引き離し、世界一となっているというのだ。 ご存じのように、このポジションは当分続く。「平成30年版高齢化白書」によれば、日の人口がじわじわと減っていく中でも、高齢者は「団塊の世代」が

    50年前から分かっていた少子高齢化問題、なぜ回避できなかったのか
  • 短歌の5文字を入力→残りの「7・5・7・7」自動生成 5000首学んだ「恋するAI歌人」現る

    NTTレゾナントは8月8日、短歌の最初の5文字を入力すると、残りの26文字をAIが自動生成するサービス「恋するAI歌人」を公開した。短歌の専門誌「短歌研究」を発行する短歌研究社のWebサイト上で、同日から9月9日まで利用できる。 NTTレゾナントが開発したAI対話エンジン「gooのAI」を活用し、歌人の与謝野晶子や岡かの子などの恋愛に関する歌集から約5000首を学習させた。 その際、単語を赤や青などの色にひも付けてAIに学習させ、色のイメージを効果的に使った短歌を作れるように工夫。例えば、緑のグループに「苔」や「草」など色調の似た単語を分類し、文脈によってAIが同じ色のグループの単語を使い分けるという。 記者が試しに「夏休み」と入力したところ、20秒ほど考えた末、「夏休み 庭に椿は ただひとつ ひとの海ぞと あはれなりけれ」という句を詠んでくれた。 これまでもNTTレゾナントは、Q&Aサ

    短歌の5文字を入力→残りの「7・5・7・7」自動生成 5000首学んだ「恋するAI歌人」現る
  • LINEに画像を送ると、AIが3秒で文字起こし 「企業や役所の働き方変える」 長崎のベンチャーが開発

    紙の書類をスマートフォンのカメラで撮影し、「LINE」で画像を送ると、約3秒でテキスト化して返信する――。こんなAIアプリを、長崎県西海市のベンチャー企業「西海クリエイティブカンパニー」が7月3日からLINE上で公開している。ユーザーがOCR(光学文字認識)ソフトなどを用意しなくても、書類や帳票を簡単にデータ化できる点が特徴だ。 記者が試しに名刺を撮影して公式アカウントに送ったところ、すぐに氏名や企業名、所属部署、オフィスの住所、電話番号、メールアドレスなどを正確にテキスト化して返信してくれた。 このアプリの名前は「文字起こし ばりぐっどくん」。LINE上で友だち申請すると、誰でも利用できる。同社の業はデザインやWebメディアの運営だが、西海市内の企業・役所から紙文書のスキャンやデータ入力作業を減らし、地域全体の業務効率を高める狙いで開発したという。 だが、リリースすると他の地域からも利

    LINEに画像を送ると、AIが3秒で文字起こし 「企業や役所の働き方変える」 長崎のベンチャーが開発
  • 「セキュリティの基礎は無料で学べる」 ワンクリックで”リテラシー”高める無料教本

    セキュリティの基礎は無料で学べる」 ワンクリックで”リテラシー”高める無料教ITりてらしぃのすゝめ(1/3 ページ) ほとんどの人にとっては、ITセキュリティは難しいもので、勉強するのは面倒に感じるかもしれません。将来的に素晴らしい技術が登場して、私たちが何も気にしなくてもAIや機械がサイバー空間を守ってくれるようになる未来は必ずやってくると信じているものの、現状は私たち自身がサイバーセキュリティについて学んでいく必要があります。 いきなりセキュリティの達人になることはできなくても、「あ、これ聞いたことがあるな」と気付けるだけで、多くの脅威から身を守ることができます。 ならば、その「聞いたことがある」という状況にまでステップアップしてしまいましょう。これまでなら屋に行って何か教を買ってくるか、ネット上で調べるのが定番でした。いまやその第一歩が、無料の電子書籍で済んでしまうのですか

    「セキュリティの基礎は無料で学べる」 ワンクリックで”リテラシー”高める無料教本
  • 過酷なアニメ制作の現場、AIで救えるか 「動画マン」の作業を自動化、DeNAの挑戦

    過酷なアニメ制作の現場、AIで救えるか 「動画マン」の作業を自動化、DeNAの挑戦(1/2 ページ) 「労働環境が過酷すぎる」「時間も人もお金も足りない」――日のアニメ制作現場では、アニメーターの低賃金労働や法定労働時間の超過といった問題が指摘されている。こうした状況を、近年進化が著しいAI人工知能技術で改善できないか。ディー・エヌ・エー(DeNA)AIシステム部の李天キ(王に奇)さんと濱田晃一さんが、2月6日に開催された技術者向けイベント「DeNA TechCon 2019」で、最新技術を用いた事例を紹介した。 アニメの制作現場でも特に過酷とされるのが「動画マン」と呼ばれる仕事だ。動画マンは、滑らかなアニメーションになるように、原画と原画の間を埋める絵(中割り)を描く人のこと。 私たちが良く目にする「30分間のテレビアニメ」の場合、1話当たり3500~4000枚の中割りを描く必要が

    過酷なアニメ制作の現場、AIで救えるか 「動画マン」の作業を自動化、DeNAの挑戦
  • 原作レイプとは言わせない──日本IBMの“オタクマーケター”が倍率500倍のSAOコラボを実施できた理由

    仕掛け人は“オタクマーケター” 日IBMは、昨年3月に「ソードアート・オンライン ザ・ビギニング Sponsored by IBM」と題した約200人限定の体験イベントを実施。同社が「コグニティブ・コンピューティング」と呼ぶAI技術や、クラウドサービス「IBM Bluemix Infrastructure」(旧SoftLayer)の要素を取り入れたVRコンテンツを来場者たちが体験した。 イベント開催から約1年、「テクノロジーはワクワクする世界。ワクワクする感じで伝えていきたい」──そう語るのは、同社の山口有希子部長(マーケティング&コミュニケーション デジタル コンテンツ マーケティング&サービス)だ。社内で“オタクマーケター”との異名を持つ彼女は、このイベントを仕掛けた張人でもある。

    原作レイプとは言わせない──日本IBMの“オタクマーケター”が倍率500倍のSAOコラボを実施できた理由
  • なぜ電子出版は軽視されるのか

    出版業界の苦境が続いている。出版科学研究所によると、2015年の紙の出版物販売額は前年比5.3%減の1兆5220億円。書籍は健闘しているが、下げ止まらないのが雑誌だ。16年はさらにコミックも不調で、15年の数字を下回ると見られている。 長引く出版不況により業界は揺れている。3月にはコミックに強いことで知られた出版取次中堅の太洋社が自己破産。専門誌で知られてきた中小出版社の倒産も続いた。講談社による一迅社子会社化も大きなニュースとなった。ピーク時には25万部を超えていた人気雑誌「AneCan」(小学館)も、部数減により休刊を決めた。 書店もあおりを受けている。太洋社倒産の影響で芳林堂書店が自己破産。11月には岩波ブックセンターを経営する信山社が破産手続きを決定した。 帝国データバンクによると、出版関連業者の損益動向はほぼ半々だが、売上高規模が大きい企業は増益の占める割合が大きくなり、小さい企

    なぜ電子出版は軽視されるのか
    yk_uminami
    yk_uminami 2017/01/19
    書店の注文数にあわせて刷って売りきる出版社がでてくれば、印刷物のメリットは少なくなり電書のほうが価値が上がる? でもそうなると消費者は確実に本を手にするには予約する必要がでてくる。
  • Expired

    Expired:掲載期限切れです この記事は,産経デジタル との契約の掲載期限(6ヶ月間)を過ぎましたのでサーバから削除しました。 このページは20秒後にITmedia NEWS トップページに自動的に切り替わります。

  • 「ボカロFukaseに歌ってもらった」が“本人認定”で著作権侵害扱いに――“名誉の誤認”の行方は

    セカオワ「Fukase」のボーカロイドで制作した楽曲がYouTubeで“人認定”され著作権侵害扱いに――“名誉の誤認”による悲劇は、権利者側の申し立て撤回により無事に解決したようです。 問題になったのは、「SEKAI NO OWARI」のボーカリスト「Fukase」の声を基に開発した「VOCALOID4」用歌声ライブラリ「VOCALOID4 Library Fukase」を使用した同バンドの楽曲「スターライトパレード」。ソフトの付属小冊子で「人っぽく」歌わせる調声の題材となっている作例です。 制作者のタカオカミズキさんによると、2月3日にYouTubeにアップロード後、17日に「著作権で保護された曲が含まれる可能性がある」として、音声トラックをミュートする処置を受けていました。この“「原曲まんまじゃねーか」という名誉の誤認”に対し、異議申し立てを行っていましたが、一度はその申し立て自体

    「ボカロFukaseに歌ってもらった」が“本人認定”で著作権侵害扱いに――“名誉の誤認”の行方は