タグ

ブックマーク / www.itmedia.co.jp (135)

  • 音声合成はAIの力で“棒読み”を脱した 飛躍の年、2019年を振り返る

    2019年は音声合成の分野にとって、間違いなく飛躍の1年だったといえる。AIが自然な発話や豊かな表情を手に入れ、活躍の場を大きく広げたのが2019年の注目すべき変化ではないだろうか。気付かぬ間にAIの話し声を聞いていることもあるかもしれない。 これまでは一部の人しか耳にすることがなかった歌声の合成についても、ヤマハとNHKが共同開発した「AI美空ひばり」の登場で、多くの人に衝撃とともに伝わったのではないだろうか。AIが芸術的な表現を身に付け、多くの人が好感を持てる音声になってきたのだ。 そのために、今までは研究者や技術者しか知ることのなかった音声合成技術が一般の人々も耳にするまでに広がり、さまざまな議論を巻き起こしたといえる。 そんな19年の注目すべき音声合成ニュースについて振り返りながら、20年の動向を予想してみよう。 AIがプロの歌手になる時代の幕開け 歌声合成といえば、まず思い浮かべ

    音声合成はAIの力で“棒読み”を脱した 飛躍の年、2019年を振り返る
  • 海外旅行のついでに“おつかい”で稼ごう 「HAKOBIYA」が日本での展開に本腰

    海外旅行のついでに“おつかい”で稼ごう 「HAKOBIYA」が日での展開に腰:荷主と旅行者を仲介(1/3 ページ) 編集部からのお知らせ: 記事で紹介した「HAKOBIYA」のサービスについて、「利用者が犯罪に巻き込まれるリスクがあるのではないか」「国によって持ち込みが禁止・規制されている商品の扱いはどうなっているのか」といったご指摘が読者からございました。編集部としてはこれらの疑問に対する、運営会社や関係省庁の見解をまとめ、追記してまいります。 【2019年12月25日追記】 記事の続報となる「HAKOBIYA」のサービスに関わる法的問題やリスクをどう考えればいいのかを公開しました。今後は、こちらの記事に情報を追加いたします。 「海外で流行している商品を買いたいけど、実際に現地に行くのは大変」「海外から商品を送ってもらいたいけど、送料が高すぎるし、確実に届くかどうか不安」――こん

    海外旅行のついでに“おつかい”で稼ごう 「HAKOBIYA」が日本での展開に本腰
  • 短歌の5文字を入力→残りの「7・5・7・7」自動生成 5000首学んだ「恋するAI歌人」現る

    NTTレゾナントは8月8日、短歌の最初の5文字を入力すると、残りの26文字をAIが自動生成するサービス「恋するAI歌人」を公開した。短歌の専門誌「短歌研究」を発行する短歌研究社のWebサイト上で、同日から9月9日まで利用できる。 NTTレゾナントが開発したAI対話エンジン「gooのAI」を活用し、歌人の与謝野晶子や岡かの子などの恋愛に関する歌集から約5000首を学習させた。 その際、単語を赤や青などの色にひも付けてAIに学習させ、色のイメージを効果的に使った短歌を作れるように工夫。例えば、緑のグループに「苔」や「草」など色調の似た単語を分類し、文脈によってAIが同じ色のグループの単語を使い分けるという。 記者が試しに「夏休み」と入力したところ、20秒ほど考えた末、「夏休み 庭に椿は ただひとつ ひとの海ぞと あはれなりけれ」という句を詠んでくれた。 これまでもNTTレゾナントは、Q&Aサ

    短歌の5文字を入力→残りの「7・5・7・7」自動生成 5000首学んだ「恋するAI歌人」現る
  • Alexa、「嬉しそうな声」や「がっかりした声」で返答できるように(まずは英語で)

    Amazon.comは11月26日(現地時間)、音声アシスタントAlexaでの応答の声の調子を、「非常に嬉しそう」から「非常にがっかりしている」まで、6段階で設定できるようにする「Alexa Emotions」を発表した。まずは英語のみ。 例えばクイズスキルで、ユーザーが正解を言ったら「Excited(High Intensity)」設定で嬉しそうに「正解です!」と答えたり、ユーザーがお気に入りに設定している野球チームのスコアがぱっとしない場合は「Disappointed(Medium Intensity)」設定の声で負けたことを報告する、というような使い方を想定している。 この機能は、Amazon.com独自開発のニューラルネットワーク採用音声合成技術NTTS(Neural Text-To-Speech)」で実現した。 以下に、Amazonが公開した6段階の感情の音声を転載しておく。

    Alexa、「嬉しそうな声」や「がっかりした声」で返答できるように(まずは英語で)
  • Spotify、Podcastのパーソナライズプレイリスト機能を追加(日本はまだ)

    スウェーデンの音楽PodcastストリーミングサービスSpotifyは11月19日(現地時間)、Podcastに特化したパーソナライズプレイリスト「Your Daily Podcast」を発表した。 まずは米、英、独、スウェーデン、メキシコ、ブラジル、カナダ、オーストラリア、ニュージーランドで提供を開始した。 パーソナライズしたプレイリストは、音楽では既に提供している。音楽のプレイリストと同様に、ユーザーの再生履歴に基づいて、お勧めのPodcastを日替わりで提示する。 過去90日間に少なくとも4つのPodcastを聴いていれば、Your Daily Podcastが「Your Top Podcasts」に表示されるようになる。 聴いたことのあるPodcastの新着エピソードだけでなく、Spotifyのアルゴリズムが履歴から解析したお勧めのPodcastも紹介する。続き物の場合は、初回を

    Spotify、Podcastのパーソナライズプレイリスト機能を追加(日本はまだ)
  • Google、Chromeブラウザで低速サイトに不名誉なバッジ表示を検討中

    Googleは同日からChromeブラウザの開発者カンファレンス「Chrome Dev Summit 2019」を開催している。バッジ表示の実施のタイミングはまだ不明だが、Googleは開発者に対し、バッジが表示されるのを待たずにWebサイトを最適化するよう勧めている。 関連記事 CloudflareGoogleChrome(Canary)がHTTP/3のサポート開始 Firefox(Nightly)も間もなく CloudflareがエッジネットワークでのHTTP/3サポートを利用可能にしたと発表した。GoogleChromeもCanaryバージョンで利用できる。MozillaのFirefoxも次のNigtlyバージョンでサポートする見込み。 Google、画像をドラッグ&ドロップで圧縮するWebツール(PWA)「Squoosh」公開 Googleが、ドラッグ&ドロップで画像を圧縮す

    Google、Chromeブラウザで低速サイトに不名誉なバッジ表示を検討中
  • スマートスピーカーが家の“番犬”に? 米国で劇的進化するAmazonとGoogleの音声アシスタント

    スマートスピーカーが家の“番犬”に? 米国で劇的進化するAmazonGoogleの音声アシスタント(1/3 ページ) プライバシーを守るオンデバイスAI、ガス漏れ警報を「認識」するスマートスピーカー。AmazonGoogleが開発している新機能はいずれ日にもやってくるだろう。 10月16日(現地時間)、米Googleが「Pixel 4」を中心とした新ハードウェアを発表した。派手さはないものの、実は主軸は「音声アシスタント」であるGoogleアシスタント。家庭内や移動先でいかにGoogleアシスタントを活用するか、という観点で作られていた。 9月末に訪れたシアトルでは、Amazonが新ハードを発表した。そこでの主軸は、やはり同社の音声アシスタント「Alexa」である。 「音声アシスタントというとアレでしょ、命令すると動いてくれる奴」 「声で話すよりボタンを押す方が早い」 そんな認識はな

    スマートスピーカーが家の“番犬”に? 米国で劇的進化するAmazonとGoogleの音声アシスタント
  • AI記者、AI小説家、そしてAI作曲家も――創作する人工知能を支える技術

    画像認識や自然言語処理といった技術の進化で、機械は人間と同じように周囲の環境および言葉を認識できるようになってきている。最近では機械が文章を書いたり、絵を描いたりする例も出てきた。今回は、こうしたコンテンツ生成の事例や技術についてまとめた。 AIがスポーツ記事を作成 米国のローカルメディアRichland Sourceが開発した「LedeAI」は、スポーツ記事を作成するAIだ。さまざまなスポーツの試合結果を共有するサイトScoreStreamから高校スポーツに関するデータを取得し、あらかじめ学習させたスポーツニュースの記事構成パターンに当てはめて記事を作る。 2018年に行われた実証実験では、6カ月間で1万8000以上の記事を書き上げた。作成された記事を人間がチェックしたところ、その内容に誤りはなかったという。ScoreStreamを見ても必要な情報は手に入るが、記事としてまとめたほうが

    AI記者、AI小説家、そしてAI作曲家も――創作する人工知能を支える技術
  • 「外国人が働きたい国」で日本が33カ国中32位――この国の“真に深刻な問題”とは

    英金融大手HSBCホールディングスは7月、「各国の駐在員が働きたい国ランキング」の最新版を発表した。日は調査対象33カ国(地域含む)中32位という少しばかりショッキングな結果となった。このランキングについては、一方的な評価だと批判する声も聞かれるが、「やっぱりな」「それはそうだろう」と肯定的に捉える人が多かったようである。 ちなみにこのランキングの1位はスイス、2位はシンガポール、3位はカナダ、4位はスペイン、5位はニュージーランド、6位はオーストラリアで、逆に日より評価が低かった最下位の国はブラジルだった。 こうしたランキングが報じられるたびに、異なる文化の国を一律に比較しても意味がないといった「国際比較無意味論」が出てくるのだが、こうした意見を条件反射的に口走ってしまう人は、残念ながら物事の表面しか見ていない。ランキングを行うのは、単なる順位付けだけではなく、評価基準をあえて統一す

    「外国人が働きたい国」で日本が33カ国中32位――この国の“真に深刻な問題”とは
  • 20代ビジネスパーソン、恋人がいない人が半数以上

    不動産情報ポータルサイト「HOME'S」は、毎日コミュニケーションズと共同で、全国の20代社会人を対象に、恋愛観に関する調査を実施した。調査期間は2007年3月8日から3月16日まで、有効回答数は1164人。 男性の方が恋人との“近さ”を重視する? 同調査によれば、恋人の家と自分の住まいとの「理想の距離」については、男女ともに「30分未満」という回答が最多だった。男女別で見ると、恋人の住まいとの近さを求める傾向は男性の方が強く、同棲を含む「0分」という最も近い距離を希望する割合は、女性の8パーセントに対して男性は16パーセントとなった。また現在異性とつき合っている人に、相手の家への「お泊まり」経験を聞いたところ、「男性が彼女に自分の家に来てもらう」方が多いとした回答者は、48パーセントと全体の約半数を占めた。 また、結婚相手に求める「妥協しない」条件については、「性格」「一緒にいてくつろげ

    20代ビジネスパーソン、恋人がいない人が半数以上
  • Amazon、録音自動削除などのプライバシー関連を含む「Alexa」の新機能を多数発表

    Amazon.comは9月25日(現地時間)、シアトルの社キャンパスで開催した「Amazon Devices Event」で、多数のハードウェアと共に、音声アシスタント「Alexa」の新機能も発表した。幾つかを紹介する。 録音の自動削除など、プライバシー関連機能 過去3カ月あるいは18カ月分の音声データを自動的に削除する設定が使えるようになる(稿執筆現在、筆者の環境ではまだ使えない)。 Amazonは、Alexaとの会話の一部を人間の担当者が聞いていたことが発覚して以来、音声データの保存関連について改善してきている。5月には期間を指定して過去の録音をまとめて削除する機能を追加し、8月には「Alexaプライバシー」のページに人間の担当者が聞く可能性のあることを明示した。 また、ウェイクワードを言ったつもりがないのにEcho端末が突然動作した場合などに、「Alexa、何を聞いたのか言って

    Amazon、録音自動削除などのプライバシー関連を含む「Alexa」の新機能を多数発表
  • 50年前から分かっていた少子高齢化問題、なぜ回避できなかったのか

    50年前から分かっていた少子高齢化問題、なぜ回避できなかったのか:スピン経済の歩き方(1/5 ページ) 「敬老の日」の昨日、この国の「敬老」の意味をあらためて考えさせられるニュースがあった。65歳以上の高齢者は約3588万人で、全人口に占める割合は28.4%と過去最高となり、これは同じく高齢化が進むイタリアの23%を大きく引き離し、世界一となっているというのだ。 「敬老の日」の昨日、この国の「敬老」の意味をあらためて考えさせられるニュースがあった。 9月15日現在、65歳以上の高齢者は約3588万人で、全人口に占める割合(高齢化率)は28.4%と過去最高となり、これは同じく高齢化が進むイタリアの23%を大きく引き離し、世界一となっているというのだ。 ご存じのように、このポジションは当分続く。「平成30年版高齢化白書」によれば、日の人口がじわじわと減っていく中でも、高齢者は「団塊の世代」が

    50年前から分かっていた少子高齢化問題、なぜ回避できなかったのか
  • AIが声からウソを見抜く 劇的に進化する音声認識が変える世界

    ビジネスに役立つAIの基礎知識について分かりやすく解説する連載。前回の記事から、いまAIが具体的にどのようなアプリケーションに使われているかを紹介している。今回は音声認識の分野について考えてみよう。 連載:よくわかる人工知能の基礎知識 いまや毎日のようにAI人工知能)の話題が飛び交っている。しかし、どれほどの人がAIについて正しく理解し、他人に説明できるほどの知識を持っているだろうか。連載では「AIとは何か」といった根的な問いから最新のAI活用事例まで、主にビジネスパーソン向けに“いまさら聞けないAIに関する話”を解説していく。 (編集:ITmedia村上) 音声認識とは何か 音声認識とは文字通り、人の声(を記録したデータ)を分析する技術だ。音声を文字に置き換える、コマンドとして認識して命じられたアクションを実行する、音声に込められた感情を把握するなど、既に幅広く活用されている。

    AIが声からウソを見抜く 劇的に進化する音声認識が変える世界
  • “痴漢対策スタンプ”、シヤチハタが商品化 Twitterユーザーの提案受け開発

    シヤチハタは8月26日、痴漢などの証拠を残せる「迷惑行為防止スタンプ」の試作モデルを27日に発売すると発表した。被害者が容疑者の手にハンコを押しておくと、ブラックライトで印影が浮き出る仕組み。Twitter上での意見を踏まえて開発したもので、まず500個をテスト販売する。2500円(税別)。 5月上旬、Twitterユーザーが「痴漢されたら、安全ピンで刺すことを勧められた」というツイートを投稿し、「抑止につながる」「かえって傷害罪になるのではないか」などと物議を醸した。その際、同社がTwitter上で「安全ピンの代わりに、痴漢に目印を付けられるハンコを開発できないか」と提案を受け、開発を進めていた。 開発したスタンプは、ブラックライトを照射すると光る特殊なインキを採用。太陽光や照明の下では無色透明だが、ブラックライトを当てると手のマークが浮かび上がる。かばんやポケットなどに取り付けられるリ

    “痴漢対策スタンプ”、シヤチハタが商品化 Twitterユーザーの提案受け開発
  • Google検索でポッドキャストの検索→再生が可能に

    Googleは8月8日(現地時間)、Google検索でポッドキャストを検索できるようにしたと発表した。公式ブログでは、まずは米国の英語版でスタートするとあるが、筆者の環境ではAndroid版のGoogleアプリで「Appleのポッドキャスト」などで検索すると、日でもポッドキャストが検索結果に表示されるようになっている。 検索結果をタップすると、Googleのポッドキャストサービスで再生もできる(Androidの専用アプリをインストールしている場合は、アプリでの再生が始まる)。 現在は検索語に「ポッドキャスト」を含めないと検索結果にポッドキャストが表示されないが、将来的にはこのキーワードを入れなくても検索結果にカード状にポッドキャストが表示されるようになる見込み。また、年内にGoogleアシスタントでも検索できるようになる(「ヘイGoogle、マリー・キュリーについてのポッドキャストを再

    Google検索でポッドキャストの検索→再生が可能に
  • Apple、YouTubeにASMRビデオを投入 心地よい環境動画4本

    Appleは8月7日、YouTubeで「Apple ASMR」と題した4の動画を公開した。ASMRはAutonomous Sensory Meridian Responseの略語。いずれもiPhoneで撮影、録音した作品でiPhoneのカメラ性能を訴求する「Shot on iPhone」キャンペーンの一環。 「ささやく」「けずる」「ふみしめる」「たたく」の4つのテーマで作られており、いずれも「ヘッドフォン推奨」だ。 「Apple ASMRWhispers from Ghost Forest ― Shot on iPhone」は映画監督のアンソン・フォーゲルさんによる作品。米オレゴンのゴーストフォレストをiPhone XSとiPhone XS Maxで撮影、録音している。女性のささやきによる解説付き。

    Apple、YouTubeにASMRビデオを投入 心地よい環境動画4本
  • PDFから構造化テキスト抽出に成功 岩波新書をEPUB化 イースト

    テキストPDFから、構造化されたマークダウン(簡易HTML)テキストを取り出すことにイーストが成功。PDFから簡単にEPUBを生成できるクラウドサービスとして、「EPUBpack」という名称で出版社向けに販売する。第一弾として岩波書店が、岩波新書のEPUB化を始めた。 イーストはこのほど、テキストPDFから、構造化されたマークダウン(簡易HTML)テキストを取り出すことに成功したと発表した。同社は、「日語で複雑に組版されたPDFからの正確な構造化テキスト抽出は世界初と思われる」としている。PDFから簡単にEPUBを生成できるクラウドサービスとして、「EPUBpack」という名称で出版社向けに販売する。第一弾として岩波書店が、このサービスを使って岩波新書のEPUB化を始めた。 日語や欧文、中国語などで利用でき、縦組みや縦中横など、複雑な日語組版にも対応したツール。 PDFファイルを読み

    PDFから構造化テキスト抽出に成功 岩波新書をEPUB化 イースト
  • LINEに画像を送ると、AIが3秒で文字起こし 「企業や役所の働き方変える」 長崎のベンチャーが開発

    紙の書類をスマートフォンのカメラで撮影し、「LINE」で画像を送ると、約3秒でテキスト化して返信する――。こんなAIアプリを、長崎県西海市のベンチャー企業「西海クリエイティブカンパニー」が7月3日からLINE上で公開している。ユーザーがOCR(光学文字認識)ソフトなどを用意しなくても、書類や帳票を簡単にデータ化できる点が特徴だ。 記者が試しに名刺を撮影して公式アカウントに送ったところ、すぐに氏名や企業名、所属部署、オフィスの住所、電話番号、メールアドレスなどを正確にテキスト化して返信してくれた。 このアプリの名前は「文字起こし ばりぐっどくん」。LINE上で友だち申請すると、誰でも利用できる。同社の業はデザインやWebメディアの運営だが、西海市内の企業・役所から紙文書のスキャンやデータ入力作業を減らし、地域全体の業務効率を高める狙いで開発したという。 だが、リリースすると他の地域からも利

    LINEに画像を送ると、AIが3秒で文字起こし 「企業や役所の働き方変える」 長崎のベンチャーが開発
  • 記事を要約するAI、富士通が試験公開 言葉の表現を変えて54文字以内に

    富士通は7月8日、AI人工知能)を使って新聞などの記事文を要約するシステムを開発し、企業向けにWebサイト上で試験公開したと発表した。要約したい文章を入力すると、180文字以内と54文字以内の2通りで要約文を作れる。 AIを使った自動記事要約システム。開発したのは、入力した記事全文から重要度の高い文章を抽出して文体を変えずに180字以内の要約を作る「重要文抽出システム」と、重要な文章を抽出した上で、言葉の表現を変えて54文字以内の要約を作る「生成型要約機能」の2つ。 重要文抽出システムは、従来のシステムに比べて人手と同等の精度で要約文章を作れるようになったという。生成型要約機能は、約8万件の記事と要約のデータから単語の削除、語順の変更、言い換えを学習したAIが、文中の単語や接続詞などをつなぎ合わせて要約文を作る。 同社は、新聞記事を人力で要約して他のメディアに配信する新聞社やオウンドメ

    記事を要約するAI、富士通が試験公開 言葉の表現を変えて54文字以内に
  • “ハリポタGO”とポケモンGOは何が違う? 「ハリー・ポッター:魔法同盟」公開直前レビュー

    “ハリポタGO”とポケモンGOは何が違う? 「ハリー・ポッター:魔法同盟」公開直前レビュー(1/5 ページ) 「ハリー・ポッター」シリーズの世界観を楽しみながら、AR(拡張現実)を活用して現実世界で遊べる位置情報ゲーム「ハリー・ポッター:魔法同盟」(iOS/Android)が、米国などで6月21日(米国時間)に公開される。日でも近々公開される予定だ。 位置情報ゲーム「Pokemon GO」を開発した米Nianticが、米WB Gamesなどと共同開発した“ハリポタGO”ともいえる作。公開直前のデモバージョンを試す機会を得たので、プレイしてみて分かったゲームのコンセプトやPokemon GOとの共通点・違いなどをレポートする。 先に一言で感想を述べると、「ハリー・ポッターシリーズが好きな人なら楽しめる、一部改良版ポケモンGO」だ。 何をするゲームか ハリー・ポッター:魔法同盟(以下、魔法

    “ハリポタGO”とポケモンGOは何が違う? 「ハリー・ポッター:魔法同盟」公開直前レビュー