韓国語で話したら英語に通訳…サムスンGalaxy S24に「ライブ通訳」機能搭載 ▲GalaxyのAIリアルタイム通訳通話機能のイメージ。グラフィックス=サムスン電子 「予約できますか?」「Can you make a reservation for me?」 「Yeah, definitely.」「はい、もちろんです」 これからは電話をする時、外国人と韓国語で話すと、このように逐次、相手の言語に通訳されるサービスが始まる見通しだ。つまり、通訳なしでそれぞれが母語で外国人と会話できるようになるのだ。 【写真】ウクライナ兵「サムスン製スマホのおかげで仲間の命が助かった」…銃弾貫通防ぐ サムスン電子は9日、サムスン・ニュース・ルームを通じ、「オンデバイスAI(人工知能)」を搭載するGalaxy(ギャラクシー)シリーズのスマートフォンに、リアルタイム通訳通話「AIライブ通訳コール」機能を搭載する
株式会社PKSHA Communicationが提供する「PKSHA Speech Insight」は、システム開発不要、PCにアプリをインストールするだけで簡単に導入が出来ます。 また、ACW効率化だけでなく、オペレーターのモニタリングサポート・応答品質向上にも活用出来ます。
株式会社レアゾン・ホールディングス(本社:東京都新宿区、代表取締役:渡邉 真)は世界最高レベルの高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス※「ReazonSpeech」を公開いたしました。 2023年1月18日 株式会社レアゾン・ホールディングス(本社:東京都新宿区、代表取締役:渡邉 真)は世界最高レベルの高精度日本語音声認識モデルおよび世界最大19,000時間の日本語音声コーパス※「ReazonSpeech」を公開いたしました。 ※音声コーパス: 音声データとテキストデータを発話単位で対応付けて集めたもの。音声認識モデルを作成する材料として使用され、その規模と品質が音声認識の精度を大きく左右する。 ※2「ReazonSpeech」を用いた文字起こしサービスをプロジェクトwebサイトにて実際に試すことができます。 プロジェクトwebサイト:https://
福岡発スタートアップのアーニーMLG株式会社は、ワンクリックで全参加者分の発言の議事録を作成する自動議事録AI「YOMEL」を開発し、1月5日(木)より正式にサービス提供を開始しました。 議事録作成の手間を省くYOMELは、会議や商談などの場面における議事録作成の工数・負担を軽減するサービスです。 発話者ごとにAIが書き起こしをするため会話記録を残しておくことができるほか、会議中の重要な発言をワンクリックでメモに転記するだけで、発言内容を端的に要約する機能も搭載しており、議事録作成や要約作成の手間を省くことができます。 同サービスは、ユーザーが専用アプリをインストールし、会議開始時と終了時にデスクトップ上のボタンをクリックするだけで、全参加者の発言が書き起こされた会議記録のURLと、話中に転記したメモをもとに作成された議事録テキストを発行します。 オンライン会議ツールと連携して使用するサー
インタビューや会議の際に発言内容をメモしながら、後で間違えないよう録音もする人は少なくないだろう。だが、録音した音声を聞いてテキストに起こす作業はかなりの手間がかかる。筆者の場合は聞き取りづらい箇所を繰り返し再生したり、パソコンに文字を打ち込む操作が遅れて音声の再生を一時停止したりしているうちに、実際の録音時間の何倍もかかってしまう。作業が終わるころには疲れてうんざりしていることもある。 筆者と同じように「骨の折れる文字起こし作業を何とか楽にこなしたい」と考える人は、洋の東西を問わず多いのかもしれない。最近はAI(人工知能)によって音声を解析して自動的に文字起こしするツールが国内外で増えてきた。中でも大きな注目を集めているのは、米OpenAI(オープンAI)の音声認識AI「Whisper」だ。 同社は米テスラ創業者のイーロン・マスク氏らが設立したAIの研究開発企業で、2020年に発表した言
Watch Now This tutorial has a related video course created by the Real Python team. Watch it together with the written tutorial to deepen your understanding: Speech Recognition With Python Have you ever wondered how to add speech recognition to your Python project? If so, then keep reading! It’s easier than you might think. Far from a being a fad, the overwhelming success of speech-enabled product
パソコンのマイクに向かって話した内容を文字にするアプリを公開します。 連続して話しても文字にします。 文字はテキストファイルに保存します。 ブログの下書き作成などに使えますよ。 ▽アプリの画面 思いついた文章を書き留めるのに音声入力という方法があります。 思いつく場所がどこかわからないので、スマホアプリ 1 の方が使いやすいのかもしれません。 紹介するアプリは Windows 環境で動作するアプリです。 私自身は、長年、頭で考えて指で打つのが習慣になっているので、作ってはみたもののあまり活躍していません。 長い文章をすらすらと声にできる方はきっと重宝すると思います。 そうでなくてもキー入力が苦手な方は使ってみる価値があると思います。 世間には既にいろいろなツールが提供されているので、この記事を機会に、そちらを使っていただくのも良いと思います。 でも、このアプリもお手軽に使えて良いですよ。
こんちには。 データアナリティクス事業本部 機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。 個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…?と思っていたのですが… ですが… … … … おお!?(上記はGitHubにあるWER: Word Error Rateのグラフです) これは!? これは結構良さげな数値を出している!?(たぶん) ってことで元音声屋さんとしては、これは試すしかない!ということで動かしてみました!(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け 今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試
やなぎや・とものり/1972年12月生まれ。1998年からITライターとして活動しており、ガジェットからエンタープライズ向けのプロダクトまで幅広い領域で執筆する。2018年から、NPO法人デジタルリテラシー向上機構(DLIS)を設立し、ネット詐欺の被害をなくすために活動している。 https://prof.yanagiya.biz/ https://peraichi.com/landing_pages/view/dlis/ 仕事を256倍速くするツールを探せ! ITの世界は日進月歩。一昔前ならとても無理だったことや、人間がやらなくてはならなかったことをどんどんコンピュータに任せられるようになっています。連載「仕事を256倍速くするツールを探せ!」では、最近出てきたサービスの中から、特にビジネスや勉強に役立つサービスやソフトウエア、ハードウエアをピックアップ。ライターが実際に使用し、使い方や
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く