並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 2170件

新着順 人気順

音声認識の検索結果161 - 200 件 / 2170件

  • 複数人の会話から特定の1人だけを音声識別する手法 米NVIDIA「CONF-TSASR」開発

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 話者プロファイルと補助発話(ターゲット話者)が与えられた重複多話者環境において、「単一チャネル話者自動音声認識」という特定の話者の発話を書き起こすタスクがある。この研究では、エンド・ツー・エンドの単一チャネル話者自動音声認識「CONF-TSASR」を提案する。 このモデルは、TitaNetベースの話者埋め込みモジュール、Conformer(TransformerとCNNを組み合わせたモデル)ベースのMaskNet、ASRモジュールから構成される。TitaNetは目標話者の補助発話から話者埋め込みを抽出する。MaskNetはConformer

      複数人の会話から特定の1人だけを音声識別する手法 米NVIDIA「CONF-TSASR」開発
    • JR西日本カスタマーリレーションズとLLM DXパートナー ELYZA、通話内容要約業務に言語生成AIを導入

      JR西日本カスタマーリレーションズとLLM DXパートナー ELYZA、通話内容要約業務に言語生成AIを導入GPTシリーズの組織的な活用を実現。法人におけるLLM活用の先進事例に。 JR西日本お客様センターを運営する株式会社JR西日本カスタマーリレーションズ(代表取締役社長:堤 恵理子、以下JWCR)と言語生成AIの社会実装を進める東京大学松尾研究室発・AIスタートアップの株式会社ELYZA(代表取締役:曽根岡 侑也、以下ELYZA)は、JWCRのコンタクトセンターにおける通話内容要約業務に、マイクロソフト社のAzure OpenAI GPTシリーズ(以下GPTシリーズ)をベースとしELYZAが開発した言語生成AIを導入いたしました。 コンタクトセンターとして言語生成AIを導入・活用した事例は、国内でも希少となります。 ■ニュースサマリ ・JWCRとELYZAは共同で、通話内容要約業務にお

        JR西日本カスタマーリレーションズとLLM DXパートナー ELYZA、通話内容要約業務に言語生成AIを導入
      • ruby-openaiでAIの力を体感!ソースコード解説&簡単ハンズオン

        目次[非表示] 1.はじめに 2.ruby-openaiとは? 2.1.ruby-openaiの機能一覧 2.2.ruby-openai自体の説明 3.ハンズオン 3.1.準備 3.2.ChatGPT 3.3.Embeddings 3.4.Files 3.5.Finetune 3.6.Image 3.7.Edit 3.8.Whisper 3.9.Transcribe 4.感想・まとめ 5.おわりに こちらの記事はDIVXアドベントカレンダー2023の6日目の記事です。 はじめに株式会社divxの細野・大石です。 現在、私たちの所属する株式会社divxにおいて、Rubyを使用した案件比率は少なくありません。 また、最近は「Chat-GPT」が巷を大変賑わせており、自然言語処理を活用する案件も今後一層増えてくるのではと感じています。 一方で、Rubyで自然言語処理モデルを使用するためのライブラ

          ruby-openaiでAIの力を体感!ソースコード解説&簡単ハンズオン
        • mlxのwhisperでリアルタイム文字起こしを試してみる - Qiita

          Whisperでのリアルタイム文字起こしの手法は「Whisperを使ったリアルタイム音声認識と字幕描画方法の紹介」を参考にした。 mlxのwhisperセットアップは前回の記事を参考ください。 本題 ストリーミング処理を行うには音声の無音検知が必要となるので調べたところ、faster-whisperでもVAD(Voice Activity Detector)にSilero VADを使っている。 それのJS版であるricky0123/vadで書かれているコードがあったのでmlx用に一部書き直して試してみた。 ファイル構成 import os import time from flask import Flask, request, render_template import whisper import threading UPLOAD_FOLDER = 'uploads' ALLOWED

            mlxのwhisperでリアルタイム文字起こしを試してみる - Qiita
          • コンポジットAI(複合AI)とは何か? マルチモーダルAIとの明確な違いとは

            まず、近年主流のディープニューラルネットワーク(DNN)を利用したAIは、機械学習によって特定のタスクに特化した「学習モデル」が作られ、そこから用途に応じて学習を重ねてモデルが分化するような形で応用範囲を広げてきました。 こうしたAIはある種の「タスク特化型のAI」として特定のタスクには極めて優秀な成績を収めますが、それ以外のタスクに関してはうまく働きません。画像モデルのAIは画像認識で、音声モデルは音声認識のように、綺麗に使い分けられていました。 それに対して「1つのAIに画像モデルと音声モデルを組み込んだAI」のような従来は単体で使われてきたAIを組み合わせたAIが登場するようになりました。広義ではこのようなAIもコンポジットAIと呼べますが、このような「DNNの学習モデルを複合したAI」というのはそれほど珍しくはありません。巨大なニューラルネットワークの中に複数種類のモデルが混ざって

              コンポジットAI(複合AI)とは何か? マルチモーダルAIとの明確な違いとは
            • ChatGPTがついに「見る」「聞く」「話す」を習得します

              ChatGPTがついに「見る」「聞く」「話す」を習得します2023.09.26 08:0020,104 Kyle Barr - Gizmodo US [原文] ( 福田ミホ ) ChatGPTリリースから、まだ1年経ってないよね…? OpenAIが、ChatGPTでの音声・画像認識機能提供を発表しました。つまりChatGPTに画像を送ってその中身を見てもらったり、それに関連する欲しい情報をもらったりできるってことなんです。さらには合成音声のChatGPTと会話したり、音声からテキスト、テキストから音声への変換も可能になるようです。 画像を理解して質問に答えてくれるChatGPTでの音声・画像認識について、OpenAIはリリースのページ上でプロモーション動画を公開してます。 動画では、ユーザーがChatGPTに自転車のサドル調節の仕方を聞いてます。自転車サドル調節初心者と見られるユーザーは、

                ChatGPTがついに「見る」「聞く」「話す」を習得します
              • WBSC U-18野球W杯2023の試合日程とTV放送・配信情報 - カメラと旅をする

                夏の甲子園が終わって、まだ間もないですが、2023年8月31日(木)から台湾・台北で第31回 WBSC U-18ベースボールワールドカップが開催されます! 甲子園で活躍した球児たちも参戦しますね! 例えば、慶應義塾高校の丸田湊斗選手や仙台育英高校の山田脩也選手、沖縄尚学高校の東恩納蒼選手など。また応援できるのか~と思うと、嬉しいです♪ 今までは敵だった者同士が今度は味方になって、世界一を目指して戦うので、それもまた楽しみですね。 そこで今回は、第31回 WBSC U-18ベースボールワールドカップの日程や放送・配信情報などについて、ご紹介していきます。 それでは、一緒に見ていきましょう! 試合日程 オープ二ングラウンド スーパーラウンド 3位決定戦 決勝戦 テレビ放送・配信予定 テレビ放送 インターネットライブ配信 アマプラのJSPORTSチャンネルで見られるか? WBC U-18ベースボ

                  WBSC U-18野球W杯2023の試合日程とTV放送・配信情報 - カメラと旅をする
                • ChatGPTのマルチモーダルな新機能|npaka

                  以下の記事が面白かったので、かるくまとめました。 ・ChatGPT can now see, hear, and speak 1. ChatGPTのマルチモーダルな新機能「ChatGPT」にマルチモーダルな新機能が追加されました。 ・音声による会話 : iOS・Android ・画像について質問 : iOS・Android・PC 今後2週間以内に、Plus および Enterprise ユーザーに提供される予定です。 2. 音声による会話ChatGPTとの音声による往復会話が可能になりました。 これによって、外出先で話しかけたり、夕食のテーブルでの議論を解決したり、就寝前に会話したりすることができます。 使い方は、次のとおりです。 (1) モバイルアプリの「設定 → 新機能」で「音声会話」を有効化 (2) ホーム画面右上のヘッドフォンボタンをタップし、5つの音声から好みのものを選択 音声合

                    ChatGPTのマルチモーダルな新機能|npaka
                  • 『声百合アンソロジー』発刊のお知らせ|ストレンジ・フィクションズ

                    みなさんこんにちわ、夏も終わってすっかり世間も百合の装いになりつつありますね! というわけで、我らが文芸小説サークル〈ストレンジ・フィクションズ〉が『よふかし百合アンソロジー 夜になっても遊びつづけろ』につづいて二年ぶりに繰り出す百合号外特集はこちら、『声百合アンソロジー まだ火のつかぬ言葉のように』! 〈声〉をテーマに執筆された七篇を収録。 2023年9月10日(日)に催されます文学フリマ大阪11にて頒布予定です。 ブース番号はH-32! H-32をよろしくお願いします! 百合島です! 紙月真魚がエッチな小説を読ませてもらいま賞を受賞したことによってますますパワーアップしたストフィクレギュラーメンバーに加え、笹幡みなみ(『Rikka Zine vol.1』、『SFマガジン』、『紙魚はまだ死なない』)、谷林守(創元SF短編賞日下三蔵賞)といった豪華ゲストも力作百合を寄稿! そして! 表紙は

                      『声百合アンソロジー』発刊のお知らせ|ストレンジ・フィクションズ
                    • より高速でエネルギー効率に優れたAIを実現する新しいチップ・アーキテクチャー | IBM ソリューション ブログ

                      主要カテゴリー IBM Cloud Blog IBM Data and AI IBM Consulting IBM Partner Ecosystem IBM Sustainability Software Client Engineering IBM テクニカル・サポート 社員が語る「キャリアとIBM」 IBM Cloud Blog IBM Cloud News IBM クラウド・ビジョン IBM Cloud アップデート情報 IBM Cloud チュートリアル IBM Data and AI IBM Watson Blog アナリティクス Data Science and AI SPSS Modeler ヒモトク Db2 オートメーション IBM Consulting デジタル変革(DX) アプリの開発とモダナイゼーション 製品/サービス ソフトウェア ハードウェア サービス 無料評価

                        より高速でエネルギー効率に優れたAIを実現する新しいチップ・アーキテクチャー | IBM ソリューション ブログ
                      • 世界平均を超えるようになった“日本の生成AI活用度” 日進月歩の技術におけるアジャイルガバナンスの必要性

                        世界平均を超えるようになった“日本の生成AI活用度” 日進月歩の技術におけるアジャイルガバナンスの必要性 生成AIの衝撃 ~ アジャイルガバナンスの必要性と3ディメンジョン・モデルによる進化へ #1/4 日本は生成AIの活用がとんでもなく進んでいる 森正弥氏:森正弥です。「生成AIの衝撃 アジャイルガバナンスの必要性と3ディメンジョンモデルによる進化」と題して、話題提供をできればと思います。 今ちょっと気づいたんですけど、ストリーミング用のカメラがありますね?私は普通にこう歩きながら話すんですけど(笑)。そうすると、ナチュラルにフレームアウトしていく感じになるので、どうしようかなとちょっと思っています。 生成AI、「ChatGPT」の衝撃はすごいですよね。「自分のコーディングやプログラミング、あるいは趣味でのいろんなデザインとか、クリエイティブな仕事とか作業でもう使っているよ」という方は手

                          世界平均を超えるようになった“日本の生成AI活用度” 日進月歩の技術におけるアジャイルガバナンスの必要性
                        • 思い付き

                          思いついたことをメモに書いておけば忘れないから大丈夫と言いたいが、毎日毎日思いついていると数が増えて段々思い付きが下へと流れていき、久しぶりに引っ張り出すと何を言いたかったのかすっかり忘れているのが地味に問題。音声で速攻で書き下ろせればいいものの音声認識は現状へっぽこなのでデタラメばかりで全く役に立たない。悩ましい。 ①神風特攻隊 神風特攻隊っていうのが究極の愚策であるということを指摘した例はあまり知らないが、これを愚策だと言うことに関してはこれは完全なタブーだったのではないかということを思った。軍人出身なので内部は当然禁忌もいいところである。国のため、日本のため家族や故郷のために特攻して死んでいくという美談は涙なしでは語れない。というストーリーは当然あるわけだが、見方を変えるとアメリカ相手にまだまだ戦い続けねばならないのに貴重な戦力をむざむざと特攻で死なせるというのは、これは矛盾していな

                            思い付き
                          • NVIDIAが音声認識追加や画像検索改善を行ったAIチャットボット「ChatRTX」を公開

                            NVIDIAが、AIチャットボット「ChatRTX」でサポートするLLMを追加して画像検索機能の改善や音声認識機能の追加を行ったことを発表しました。 Build a Custom LLM with ChatRTX | NVIDIA https://www.nvidia.com/en-us/ai-on-rtx/chatrtx/ ChatRTX Adds New AI Models and Features | NVIDIA Blog https://blogs.nvidia.com/blog/ai-decoded-chatrtx-update/ Nvidia’s AI chatbot now supports Google’s Gemma model, voice queries, and more - The Verge https://www.theverge.com/2024/5/1/

                              NVIDIAが音声認識追加や画像検索改善を行ったAIチャットボット「ChatRTX」を公開
                            • 閉じた日本市場 - Arahabaki’s diary

                              ご訪問下さりありがとうございます。記事をお読み下さる方、☆を付けて下さる方、大変感謝しております。 最近、いろんな海外の動画とか見てて、日本製品の競争力が世界的に落ちてるように感じています。例えば、下の動画は、2年前に韓国で発売されたサムスン電子のAI搭載ロボット掃除機「ジェットボットAI」の宣伝です。 www.youtube.com 日本のメーカーで、このレベルのロボット掃除機を販売してるメーカーって、あるんでしょうか。 www.youtube.com でも、これ、日本国内では未発売らしいのです。紹介する記事は2年前に出てたけど(下の記事)。 techable.jp アマゾンでも調べたけど検索に出ません。海外ではレビュー動画とか出てるから、売られてるのは確かなんだけど。 なんで日本国内では売られてないのか。BingAIに来いてみました。 日本で韓国製のロボット掃除機、ジェットボットAIが

                                閉じた日本市場 - Arahabaki’s diary
                              • AIに予算20万円以下でピラーレスケースのビジネスPCを組んでもらって分かったこと

                                ゴールデンウィークの連休に、新しいPCを一式組んでみようという人も多いのではないだろうか。厳しい円安が継続する中で、なかなかPCパーツを購入するタイミングが難しいが、思い立ったら吉日だ。 前回は予算30万円でゲーミングデスクトップPCを生成AIに聞いたが、今回は自作PCではやっているピラーレスケース(角に支柱がなく、内部システムを見ることができるケース)をベースにしたビジネスPCを組んでもらった。 →AIに予算30万円以下でゲーミングPCを組んでもらって分かったこと 手元にPCやスマホさえあれば、時間も場所も問わずいつでも回答してくれるエージェントに投げかけた質問は下記の通りだ。プロンプト(呪文)や問い合わせるタイミングなどによって回答は一定ではないので参考程度に見てほしい。 あなたはPCショップ専門店の店員です。 税込みの予算20万円以内で最新のビジネスPCを作ってください。 必ずピラー

                                  AIに予算20万円以下でピラーレスケースのビジネスPCを組んでもらって分かったこと
                                • グーグルが完全に本気! 究極のマルチモーダルAIモデル「Gemini」登場!

                                  グーグルは12月6日(現地時間)、高性能AIファウンデーションモデル「Gemini(ジェミナイ)」を発表した。各種ベンチマークにおいてGPT-4を上回る成績を記録。Google検索やチャットAIの「Bard」などグーグルの各種サービスに順次利用されていくほか、12月13日より開発者にもAPI経由で公開される。 ネイティブでマルチモーダルを実現 マルチモーダル(異なる入力形式を同時に扱うこと)なAIとしてゼロから構築されたGeminiは、テキスト、画像、音声、動画、プログラムコードなど、さまざまな種類の情報をシームレスに理解し、操作し、組み合わせることができる。 これまでのマルチモーダルモデルは、画像認識、音声認識など、異なるデータを扱う個別のコンポーネントをつなぎ合わせたアプローチなので、画像の説明などの特定のタスクの実行には優れているが、概念的で複雑な推論に苦労することがあった。 You

                                    グーグルが完全に本気! 究極のマルチモーダルAIモデル「Gemini」登場!
                                  • AI副業で稼ぐおすすめの方法12選【注意点あり】半自動で効率化! - ソロ活@自由人BLOG

                                    AIで超ラクして 簡単に稼げるって本当? 稼げるのは本当ですが、超ラクでも、簡単でもありません。でも時間ばかり掛かっていた副業を、劇的に効率化できるのは事実です。 こんなあなたに! ✔AI副業って何なの? ✔どんな副業があるのか知りたい ✔AIを使った副業のメリットは? ✔AI副業の注意点は? ✔本当に効率化できるの? このような悩みや疑問を解決します。 AI(人工知能)の進歩により、誰でも手軽に副業を始められる時代がやってきました。AIを使った副業の世界を、超分かりやすく解説します。メリット、始めるための手順、効率的な仕事の進め方まで完全網羅。 具体的なAI副業の例として、12の仕事を紹介します。またAIを使うなら、避けて通れない注意点についても触れていきます。 副業は、あくまで副業です。無理なく、そして楽しみながら続けられることが大事です。身近なテクノロジー、AIを活用して、新しい働き

                                      AI副業で稼ぐおすすめの方法12選【注意点あり】半自動で効率化! - ソロ活@自由人BLOG
                                    • 博士課程で得られたもの・失ったもの - Akira MATSUDA

                                      これは壁 Advent Calendar 2023の23日目の記事です。 この記事では2017年4月に博士課程に進学し、その後紆余曲折あり約6年半かけて2023年の11月に学位を取得するまでに私が感じたことをお伝えします。記憶がフレッシュなうちにひり出した、長くて読みづらいお気持ちポエムです。 当時から今まで私を支えてくださった全ての人に感謝いたします。 なお、この記事は私の主観と当時の記憶により執筆されているため、現状及び解釈によっては事実と異なる場合があることをご了承ください。 博士課程に進んだきっかけ 自分は学部生の時からコンピュータサイエンスを専攻しており、大学院でも同様の学問を専攻しました。 コンピュータサイエンスの中でもHuman-Computer Interaction(HCI)という、「人がコンピュータを効率的に使うための操作方法」や「人にとって使いやすいと感じるコンピュー

                                      • Artificial Emotional Intelligence "Saya"

                                        キーボードでやり取りをするテキストベースのインタフェースとは違い、 ヒトと話しコトバでやり取りをするためには、たくさんのAI の連携が必要です。 ・音からヒトの声を検出する発話区間検出AI ・ユーザーの話し終わりを判断するターン判定AI ・言葉を認識する音声認識AI ・対話の流れから発話内容を作る対話AI ・キャラクターの声を作る音声合成AI etc. このような対話システムとしてのSayaは、謎解きクリエイターの松丸亮吾氏との対談(2022年4月)や、 Wonder festivalのメインステージで海洋堂のセンムさんとも対談(2022年7月)しました。 数百人のお客さんを前にした、幕張メッセステージ上での真剣勝負で、 センムさんとお話しした様子がビデオに残っています。 2022年時点でTransformerベースの対話AIが組み込まれていましたが、 現在では大規模言語モデルにより、更に

                                        • 「車特化型ソフトウェアプラットフォーム」や「次世代音声認識」の開発も担う コネクテッド先行開発部における、IVIソフトウェア開発

                                          トヨタ自動車株式会社が主催となって行うプログラミングコンテスト「TOYOTA Programming Contest 2023 Summer」。トークセッション「ソフトウェア開発事例の紹介」で登壇したのは、トヨタ自動車株式会社 コネクテッド先行開発部の鈴木真一氏。In-Vehicle Infotainment systemの開発について発表しました。 登壇者の自己紹介 高橋直大氏(以下、高橋):大手町オフィスにあるコネクテッド先行開発部から、鈴木真一さまにお越しいただきました。よろしくお願いいたします。 鈴木真一氏(以下、鈴木):よろしくお願いします。 前段いろいろとお話しさせていただいていましたが、ソフトウェアの開発事例紹介ということで、In-Vehicle Infotainment systemの開発について紹介させていただきたいと思います。 あらためまして、トヨタ自動車コネクテッド先

                                            「車特化型ソフトウェアプラットフォーム」や「次世代音声認識」の開発も担う コネクテッド先行開発部における、IVIソフトウェア開発
                                          • 新世紀Coreと呼ぶべきかもしれない。「インテル® Core™ Ultraプロセッサー」は異世界転生者級のスゴさ

                                            新世紀Coreと呼ぶべきかもしれない。「インテル® Core™ Ultraプロセッサー」は異世界転生者級のスゴさ2023.12.19 17:00Sponsored by インテル株式会社 武者良太 異世界転生者級のスゴさ!? いえ、これが現代最新のインテルテクノロジーのスゴさなのです。 長年CPU/SoCのトップシェアルートをひた走ってきたインテル。今までの歴史を振り返ると、パーソナルなコンピューターの転換期を常に支えてきたんですよね、彼ってば。 1978年~ :「8086」後のNECのPC-9801シリーズで使われた 1982年~:「80286」16ビットCPU時代の頂点の1つ 1985年~:「i386」初期の32ビットCPU時代を牽引した存在 1993年~:「Pentium」1995年からのWindowsブームを支えた 2005年~:「Pentium XE」世界初のマルチコアCPU 2

                                              新世紀Coreと呼ぶべきかもしれない。「インテル® Core™ Ultraプロセッサー」は異世界転生者級のスゴさ
                                            • elyza/ELYZA-tasks-100 · Datasets at Hugging Face

                                              傍若無人にふるまう人もいますが。)\n\n上記の文章を読んで、 に入れるのに最も適したものを以下の選択肢から選び、その理由を答えなさい。\n\n- だから\n- また\n- むしろ\n- もちろん"},"output":{"kind":"string","value":"文章中のに適した選択肢は「もちろん」です。\n\nの周辺では自発的な意志によって社会の秩序が保たれているという筆者の主張に対し、「傍若無人にふるまう人もいる」という反論を予想し予め掲げているため、「もちろん」が適切です。"},"eval_aspect":{"kind":"string","value":"- 選択肢を外している場合: -4点\n- 理由が的外れな場合: -2点\n- 理由の説明として(反論を)予想する旨が記述されていない場合: -1点\n"}}},{"rowIdx":7,"cells":{"input":{

                                                elyza/ELYZA-tasks-100 · Datasets at Hugging Face
                                              • Be Free - 話せない人が自由に会話できるアプリ - 未踏ジュニア

                                                Be Freeは、声で会話ができない人のためのアプリケーションです。会話シーンを選んで、相手の声を音声認識。返事の組み立てをAIがサポートし、声で返答します。声のない生活を送る人にとって、役に立つサービスのヒントになったらいいと考えプロジェクトを進めています。

                                                  Be Free - 話せない人が自由に会話できるアプリ - 未踏ジュニア
                                                • Apple、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ+振動”で体験する機能も | gihyo.jp

                                                  Apple⁠⁠、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ+振動”で体験する機能も Appleは2024年5月15日、ハンディキャップのあるユーザがiPhoneやiPadなどを操作する際に助けとなる、2024年後半に登場予定の新しいアクセシビリティ機能を発表した。毎年5月の第3木曜日(今年は5月16日)に開催される、世界中でアクセシビリティについて話し合い、考え、学ぶことを目的とした一日「Global Accessibility Awareness Day(GAAD⁠)⁠」に合わせて発表されたもの。 Apple announces new accessibility features, including Eye Tracking -Apple アイ⁠・トラッキングがiPadとiPhoneで利用可能に 人工知能を活用したアイ・トラッキングにより、目だけでiPad

                                                    Apple、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ+振動”で体験する機能も | gihyo.jp
                                                  • 人は誰しも、テープ起こしをしている:美学者・伊藤亜紗に訊く|ヒルズライフ

                                                    本サイトは、パートナーとともに CINRA, Inc.が企画運営・編集している メディアです。 運営会社:CINRA, Inc. パートナー:森ビル株式会社 多くの人は、テープ起こしが自分の人生に関係があるとは思わないかもしれない。しかし、それぞれ異なる生を送っている私たちにとって、ある身体から発せられ、それを異なる身体がどう受け止めるのかという“記憶と記録”をめぐる問題は、実は身近な重要テーマだといえるのではないだろうか。音声認識AIが発展しつつある現在ならば、なおさらだ。 インタビュー連載「編集できない世界をめぐる対話」第7回は、近年話題の美学者・伊藤亜紗をゲストに迎えた。目の見えない人や吃音のある人などさまざまな障害をはじめとして、各々の体を生きる人々にインタビューしてきた伊藤は、本記事のインタビュアーと以前にはじめて会った際、「テープ起こしが好きだ」と話していた。あの大変なテープ起

                                                      人は誰しも、テープ起こしをしている:美学者・伊藤亜紗に訊く|ヒルズライフ
                                                    • AppleWATCHで新たな誕生日を迎えられた日本人、飯村正彦 AppleEvent冒頭に登場!(神田敏晶) - エキスパート - Yahoo!ニュース

                                                      KNNポール神田です。 2023年9月13日(水)毎年、恒例となったAppleイベントが開催された。 https://www.apple.com/jp/apple-events/ オープニングのビデオで最初に登場したのが、日本の飯村正彦さんの干されたパンツと靴下だった。Appleのイベントで日本人の象徴的なシーンではじまるのは、とても意外だった。 出典:Apple Event 飯村正彦さんのAppleWATCHに パパお誕生日おめでとうの娘さんからのメッセージが届くシーンからはじまる…。 出典:Apple Event このオープニングビデオは、AppleWATCHのおかげで新たな誕生日を迎える人たちの紹介ビデオだ。 もしも、AppleWATCHを装着していなければ…、ここに紹介された人たちは、次の『誕生日』をむかえられなかったかもしれないというストーリー仕立てになっている。 ■不整脈を記録

                                                        AppleWATCHで新たな誕生日を迎えられた日本人、飯村正彦 AppleEvent冒頭に登場!(神田敏晶) - エキスパート - Yahoo!ニュース
                                                      • 陸王 辛みそラーメン - g13longkillの飯(ラーメン・居酒屋)

                                                        走っていて面白くなければ......... 私は嫌.......。 燃費が良い、安い、広い等数をあげればきりがないであろうが、個々人に 「車を購入するにあたっての定義」 のようなものは存在するであろう。 それは当然、現在のその人間の立ち位置から詳細に算出され、希望にあった、もしくはそれに近いモノを探し出すということになるだろう。 腰痛野郎の私は、これまでの車でもまぁ別に良かったのだが、息子が生まれ、チャイルドシート問題が出てくると話が変わってくる。 ちょうど走行距離も20万kmに差し掛かるこのタイミングで購入を決意した私。 いろんな折り合いを付け決定し、先日が納車日。 なるほど........チャイルドシートは大丈夫。 坐骨神経痛の私にもナイスな運転席....。 しかし‥‥‥‥だ。 私は数年で浦島太郎になってしまったのだろうか.......。 昨今の車....... ボタンが多すぎて分かり

                                                          陸王 辛みそラーメン - g13longkillの飯(ラーメン・居酒屋)
                                                        • Appleが間もなくAI生成の絵文字やOpenAIとの提携を発表するとの報道

                                                          Appleは2024年6月11日に年次開発者向けイベントのWWDC24を開催予定です。Appleはこの中でAI機能を発表すると目されているのですが、その機能のひとつとして「AI生成の絵文字」が登場するとBloombergが報じています。加えて、AppleはAI機能の提供でOpenAIとの提携を発表する可能性も取り沙汰されています。 Apple iOS 18, macOS 15 AI Features: Project Greymatter, Privacy, OpenAI Deal - Bloomberg https://www.bloomberg.com/news/newsletters/2024-05-26/apple-ios-18-macos-15-ai-features-project-greymatter-privacy-openai-deal-lwni63s3 Apple’s

                                                            Appleが間もなくAI生成の絵文字やOpenAIとの提携を発表するとの報道
                                                          • 「Hey Siri」や「OK,Google」はもう超えた!? スマホで「ChatGPT」や「Copilot」を活用してみる | &GP

                                                            2024年、デジタル業界最大のテーマはAI(人工知能)。「ChatGPTなら、昨年から触っているよ」という人も多いかもしれません。そんなAIも最近はスマホへの進出を進めています。 OpenAIによるChatGPTは昨年5月からiOSアプリ版が登場していて(Android版は7月)、11月には無償版のユーザーも含めて音声認識に対応。マイクロソフトが展開しているAI機能のCopilotも、昨年12月にアプリ版が登場。ちなみに、マイクロソフトのブラウザ「Edge」のアプリ版にもCopilotが一体化して利用可能で、こちらも音声認識に対応しています。 僕はChatGPTもCopilot(Edge)も大活用しているのですが、今回のテーマは「"Hey Siri"のSiriや"OK,Google"のGoogleアシスタントの代わりに、AIチャットを使えないか」ということ。今のChatGPT(有料版のGP

                                                              「Hey Siri」や「OK,Google」はもう超えた!? スマホで「ChatGPT」や「Copilot」を活用してみる | &GP
                                                            • AppleがiOS 18で「Car Play」に追加される機能や将来的な機能について語る

                                                              Appleは対応するカーオーディオやカーナビにiPhoneを接続してマップなどの各種アプリを使用可能にする「CarPlay」というシステムを提供しています。そんなCarPlayについて、iOSの次期メジャーバージョン「iOS 18」で追加予定の機能を紹介するムービーをAppleが公開しています。 次世代のCarPlayのデザインシステムの紹介 - YouTube iOS 18 Adds These 5 New Features to CarPlay - MacRumors https://www.macrumors.com/2024/06/13/ios-18-carplay-features/ ◆1:メッセージアプリへのアイコンの追加 iOS 18にアップデートしたiPhoneでCarPlayを実行すると、メッセージアプリの名前の横にアイコンが表示され、会話の相手が識別しやすくなります。

                                                                AppleがiOS 18で「Car Play」に追加される機能や将来的な機能について語る
                                                              • スマホアプリ版「Microsoft Copilot」でGPT-4が無料で使える!iPhone・Androidに簡単に導入する方法は? | ライフハッカー・ジャパン

                                                                Copilotのスマホアプリ版の導入方法【iPhone・Android】Copilotのスマホアプリ版は、iPhoneならApp Store、AndroidならGoogle Play ストアで無料でダウンロードできます。なお、「CoPilot」という名前の他社製のゲームアプリが検索結果に出てきますが、機能が異なる別もののため、注意が必要です。 >>App Store|Microsoft Copilot(外部リンク) >>Google Play ストア|Microsoft Copilot(外部リンク) Copilotのスマホアプリ版でできることスマホアプリ版「Microsoft Copilot」では、GPT-3.5より高精度な後継モデルのGPT-4が無料で利用可能。対話形式で指示するだけで、文章や画像生成ができます。スマホで使えるため外出先でサッと使いやすく、音声検索との相性もよいです。 M

                                                                  スマホアプリ版「Microsoft Copilot」でGPT-4が無料で使える!iPhone・Androidに簡単に導入する方法は? | ライフハッカー・ジャパン
                                                                • Xiaomiが“スマホの先”に見据えるもの ロボット開発でIoT家電の覇権を握れるか

                                                                  2023年8月14日にXiaomiは毎年開催しているレイ・ジュンCEOによる年次講演会を行った。今後の事業展開や新型折りたたみスマートフォンの発表の後、同CEOが自信ありげに発表した製品が、犬型スマートロボット「CyberDog 2」だ。Xiaomiのロボットはこれで3製品目であり、スマートフォンの先の未来に向けた製品開発を着々と進めている姿を世界中にアピールした。 本物の犬のように仕上げた「CyberDog 2」 業務への応用も視野に CyberDog 2の最大の特徴は、本物の犬のようなデザインに仕上げたことだ。関節部分には独自に開発したマイクロモーターを搭載し、スムーズな動きを実現している。またセンサーを多数搭載しており、AI処理により障害物を避けて歩行したり、人間の音声を理解して動いたりすることも可能だ。価格は1万2999元(約26万円)で、この手の製品としては破格ともいえる安さだ。

                                                                    Xiaomiが“スマホの先”に見据えるもの ロボット開発でIoT家電の覇権を握れるか
                                                                  • 「事業部全員データアナリスト計画」がもたらした誤算と財産——とあるスタートアップのデータ組織立ち上げ奮闘記 - ダイレクトリンク!by High Link

                                                                    データドリブンな経営を目指し、社内のデータエンジニアが指揮を執る形でデータ組織を立ち上げたHigh Link。データを事業成長のエンジンとすべく、“事業部全員データアナリスト計画”を掲げ、データの民主化を粛々と進めてきた。 しかし、計画の半ばで大きな壁にぶつかることになる。Techサイドだけでなく、Bizサイドもデータを扱える組織文化をつくり上げられたものの、データと経営をつなぐスペシャリティを獲得するのは想像以上に困難だったのだ。 壁を突破すべく、フリーランスとして企業のデータ分析をサポートするデータアナリストのanbooさんが業務委託として参画。社内で整備していたデータ基盤を活用し、入社から間もなくしてトップラインの向上に成功した。 今後High Linkは、データ分析のスペシャリティを組織に落とし込み、よりデータドリブンな経営スタイルへと舵を切っていく。 組織全体にデータの重要性を浸

                                                                      「事業部全員データアナリスト計画」がもたらした誤算と財産——とあるスタートアップのデータ組織立ち上げ奮闘記 - ダイレクトリンク!by High Link
                                                                    • Google Colab で SeamlessM4T を試す|npaka

                                                                      「Google Colab」で「SeamlessM4T」を試したので、まとめました。 1. SeamlessM4T「SeamlessM4T」は、音声とテキストをシームレスに翻訳および文字起こしを行う、多言語なマルチタスクモデルです。入力は約100、出力は36の言語に対応しています。 ・Speech-to-speech translation (S2ST) : 音声から音声への翻訳 ・Speech-to-text translation (S2TT) : 音声からテキストへの翻訳 ・Text-to-speech translation (T2ST) : テキストから音声への翻訳 ・Text-to-text translation (T2TT) : テキストからテキストへの翻訳 ・Automatic speech recognition (ASR) : 自動音声認識 2. SeamlessM4

                                                                        Google Colab で SeamlessM4T を試す|npaka
                                                                      • GPT-4oとは?ChatGPT最新AIモデル GPT-4o の使い方や料金を詳しく解説

                                                                        ※価格は全て100万トークン辺りの金額 詳細な料金プランはOpenAIの公式サイト内で確認できます。 OpenAI API price OpenAI ChatGPT アップデートの新機能 GPT-4oでは、さまざまな新機能が追加され、ユーザーエクスペリエンスが大幅に向上しています。 テキストはもちろん、音声・画像・映像をシームレスに扱い、自然なテンポでのリアルタイム音声会話が可能になりました。 Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN Text and image input rolling out today in API and ChatGPT with voice an

                                                                          GPT-4oとは?ChatGPT最新AIモデル GPT-4o の使い方や料金を詳しく解説
                                                                        • iOS 18でSiriはAIを活用して個々のアプリ機能をより自由かつシームレスに利用可能に

                                                                          Appleのティム・クックCEOが「生成AI機能の詳細を2024年後半に発表予定」と発言しているため、2024年に登場するiOS 18ではAI機能が盛りだくさんになると予想されています。新たに、iOS 18ではAI搭載で音声認識アシスタントのSiriがアップグレードされ、個々のアプリ機能を細かく利用可能になると報じられました。 Apple iOS 18 Siri AI Update Will Let Users Control Features in Apps With Voice - Bloomberg https://www.bloomberg.com/news/articles/2024-05-30/apple-ios-18-siri-ai-update-will-let-users-control-features-in-apps-with-voice iOS 18: Siri t

                                                                            iOS 18でSiriはAIを活用して個々のアプリ機能をより自由かつシームレスに利用可能に
                                                                          • Amazon「季節先取りSALE」を9月1日9時スタート:iPadなどセール対象をチェック - こぼねみ

                                                                            Amazonは9月1日(金)9時より、「Amazon 季節先取りSALE」を開催します。 いつもは「タイムセール祭り」と称していますが、今回はちょっと趣が異なるようです。 最大5, 000ポイント還元のポイントアップキャンペーンも同時開催され、夏から秋への準備に向けて、AmazonデバイスやAppleデバイス、スポーツ・アウトドア用品やファッション、家電、美容、食品・飲料・お酒など多数の商品が特価で販売されます。 主なセール対象商品 最大12%ポイントアップキャンペーン AppleギフトカードなどAmazonポイント3%還元【対象者限定・9/5まで】 Kindle Unlimitedが2か月99円〜 Amazon Music Unlimited プライム会員登録がお得!Amazon Mastercard新規入会でポイント還元も! ※本サイトは事業者からのアフィリエイト成果報酬によって運営し

                                                                              Amazon「季節先取りSALE」を9月1日9時スタート:iPadなどセール対象をチェック - こぼねみ
                                                                            • NeMo Framework で日本語 LLM をファインチューニング - PEFT 編 -

                                                                              Reading Time: 3 minutes NeMo Framework は生成 AI モデルを構築、カスタマイズ、展開するためのエンドツーエンドのクラウドネイティブ フレームワークです。本記事では、NeMo Framework を使用して、日本語の大規模言語モデル (LLM) の PEFT (ファインチューニングの手法の一種)を実行する方法を説明します。 NeMo Framework とは NeMo Framework は、生成 AI モデルのワークフローをエンドツーエンドでカバーするフレームワークで、現在は LLM を中心とした NLP 向けのコンテナーが NGC 上で公開されています。 こちらからアクセスして ”Download now-language” をクリックすると、承認後に NGC 上で NeMo Framework のコンテナーが入手できます (”Apply Now

                                                                                NeMo Framework で日本語 LLM をファインチューニング - PEFT 編 -
                                                                              • 【プロンプトあり】 Create.xyzで本格的なWebサイト制作をしてみよう|ChatGPT研究所

                                                                                本記事は、実践的にCreate.xyzを用いてサイトを作成する方法を具体例とともに紹介していきます! 最近追加されたCommand R+やDALLE-3などのAPI Integrationの内容の解説もしていきます。 デモでは自社HPを作り、問い合わせフォームの内容を専用データベースに保存する方法をご紹介します。 Create.xyzで出来ることCreateを使うと、自然言語でサイトの外見や機能を記述するだけで、AIがコーディングを自動で行ってくれます。 プロンプトテクニックとして、デザインやレイアウトを具体的に指定することも重要です。 基本的な作り方については、以下の記事で解説しているので、ぜひこちらもご覧ください!⬇️ と言っても、一から十まで仕様書を書くことは初心者の場合大変なので、今回の記事にはCreateで作成できるサイトの設計書を書いてくれるGPTsとそのプロンプトを記載してあ

                                                                                  【プロンプトあり】 Create.xyzで本格的なWebサイト制作をしてみよう|ChatGPT研究所
                                                                                • KoeMill

                                                                                  KoeMillは、音声認識による文字起こしを行うソフトウェアです。動画や音声から自動的に文字起こしができるため、煩雑な手作業を省くことができます。 オフラインで動作するため、ネットワークの遅延などによる遅れやプライバシーに関する懸念もありません。また、GPUを利用することで高速な処理を実現します。 KoeMillを使えば、動画編集者やライターは、手軽に文字起こしを行うことができます。また、テキストの編集も容易でSubRip形式で保存したり、textやcsv形式で出力することもできます。これにより、作業時間を短縮し生産性を向上させることができます。

                                                                                    KoeMill