本文「音声認識」を検索 - はてなブックマーク

161 - 200 件 / 2170件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

音声認識の検索結果161 - 200 件 / 2170件

複数人の会話から特定の1人だけを音声識別する手法　米NVIDIA「CONF-TSASR」開発
- 8 users
- www.itmedia.co.jp
- テクノロジー
- 2023/08/25
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: ＠shiropen2 話者プロファイルと補助発話（ターゲット話者）が与えられた重複多話者環境において、「単一チャネル話者自動音声認識」という特定の話者の発話を書き起こすタスクがある。この研究では、エンド・ツー・エンドの単一チャネル話者自動音声認識「CONF-TSASR」を提案する。このモデルは、TitaNetベースの話者埋め込みモジュール、Conformer（TransformerとCNNを組み合わせたモデル）ベースのMaskNet、ASRモジュールから構成される。TitaNetは目標話者の補助発話から話者埋め込みを抽出する。MaskNetはConformer
JR西日本カスタマーリレーションズとLLM DXパートナー ELYZA、通話内容要約業務に言語生成AIを導入
- 8 users
- prtimes.jp
- テクノロジー
- 2023/09/21
JR西日本カスタマーリレーションズとLLM DXパートナー ELYZA、通話内容要約業務に言語生成AIを導入GPTシリーズの組織的な活用を実現。法人におけるLLM活用の先進事例に。 JR西日本お客様センターを運営する株式会社JR西日本カスタマーリレーションズ（代表取締役社長：堤恵理子、以下JWCR）と言語生成AIの社会実装を進める東京大学松尾研究室発・AIスタートアップの株式会社ELYZA（代表取締役：曽根岡侑也、以下ELYZA）は、JWCRのコンタクトセンターにおける通話内容要約業務に、マイクロソフト社のAzure OpenAI GPTシリーズ(以下GPTシリーズ)をベースとしELYZAが開発した言語生成AIを導入いたしました。コンタクトセンターとして言語生成AIを導入・活用した事例は、国内でも希少となります。 ■ニュースサマリ・JWCRとELYZAは共同で、通話内容要約業務にお
- 機械学習
- ビジネス
ruby-openaiでAIの力を体感！ソースコード解説＆簡単ハンズオン
- 8 users
- www.divx.co.jp
- テクノロジー
- 2023/12/06
目次[非表示] 1.はじめに 2.ruby-openaiとは？ 2.1.ruby-openaiの機能一覧 2.2.ruby-openai自体の説明 3.ハンズオン 3.1.準備 3.2.ChatGPT 3.3.Embeddings 3.4.Files 3.5.Finetune 3.6.Image 3.7.Edit 3.8.Whisper 3.9.Transcribe 4.感想・まとめ 5.おわりにこちらの記事はDIVXアドベントカレンダー2023の6日目の記事です。はじめに株式会社divxの細野・大石です。現在、私たちの所属する株式会社divxにおいて、Rubyを使用した案件比率は少なくありません。また、最近は「Chat-GPT」が巷を大変賑わせており、自然言語処理を活用する案件も今後一層増えてくるのではと感じています。一方で、Rubyで自然言語処理モデルを使用するためのライブラ
- あとで読む
mlxのwhisperでリアルタイム文字起こしを試してみる - Qiita
- 8 users
- qiita.com/mbotsu
- テクノロジー
- 2024/05/26
Whisperでのリアルタイム文字起こしの手法は「Whisperを使ったリアルタイム音声認識と字幕描画方法の紹介」を参考にした。 mlxのwhisperセットアップは前回の記事を参考ください。本題ストリーミング処理を行うには音声の無音検知が必要となるので調べたところ、faster-whisperでもVAD(Voice Activity Detector)にSilero VADを使っている。それのJS版であるricky0123/vadで書かれているコードがあったのでmlx用に一部書き直して試してみた。ファイル構成 import os import time from flask import Flask, request, render_template import whisper import threading UPLOAD_FOLDER = 'uploads' ALLOWED
- ai
- ios
- mac
コンポジットAI（複合AI）とは何か？マルチモーダルAIとの明確な違いとは
- 8 users
- www.sbbit.jp
- テクノロジー
- 2023/11/06
まず、近年主流のディープニューラルネットワーク（DNN）を利用したAIは、機械学習によって特定のタスクに特化した「学習モデル」が作られ、そこから用途に応じて学習を重ねてモデルが分化するような形で応用範囲を広げてきました。こうしたAIはある種の「タスク特化型のAI」として特定のタスクには極めて優秀な成績を収めますが、それ以外のタスクに関してはうまく働きません。画像モデルのAIは画像認識で、音声モデルは音声認識のように、綺麗に使い分けられていました。それに対して「1つのAIに画像モデルと音声モデルを組み込んだAI」のような従来は単体で使われてきたAIを組み合わせたAIが登場するようになりました。広義ではこのようなAIもコンポジットAIと呼べますが、このような「DNNの学習モデルを複合したAI」というのはそれほど珍しくはありません。巨大なニューラルネットワークの中に複数種類のモデルが混ざって
- 人工知能
ChatGPTがついに｢見る｣｢聞く｣｢話す｣を習得します
- 8 users
- www.gizmodo.jp
- テクノロジー
- 2023/09/26
ChatGPTがついに｢見る｣｢聞く｣｢話す｣を習得します2023.09.26 08:0020,104 Kyle Barr - Gizmodo US ［原文］（福田ミホ） ChatGPTリリースから、まだ1年経ってないよね…？ OpenAIが、ChatGPTでの音声・画像認識機能提供を発表しました。つまりChatGPTに画像を送ってその中身を見てもらったり、それに関連する欲しい情報をもらったりできるってことなんです。さらには合成音声のChatGPTと会話したり、音声からテキスト、テキストから音声への変換も可能になるようです。画像を理解して質問に答えてくれるChatGPTでの音声・画像認識について、OpenAIはリリースのページ上でプロモーション動画を公開してます。動画では、ユーザーがChatGPTに自転車のサドル調節の仕方を聞いてます。自転車サドル調節初心者と見られるユーザーは、
- 人工知能
- techfeed
- AI
WBSC U-18野球W杯2023の試合日程とTV放送・配信情報 - カメラと旅をする
- 8 users
- www.hanacame.com
- エンタメ
- 2023/08/31
夏の甲子園が終わって、まだ間もないですが、2023年8月31日(木)から台湾・台北で第31回 WBSC U-18ベースボールワールドカップが開催されます！甲子園で活躍した球児たちも参戦しますね！例えば、慶應義塾高校の丸田湊斗選手や仙台育英高校の山田脩也選手、沖縄尚学高校の東恩納蒼選手など。また応援できるのか~と思うと、嬉しいです♪ 今までは敵だった者同士が今度は味方になって、世界一を目指して戦うので、それもまた楽しみですね。そこで今回は、第31回 WBSC U-18ベースボールワールドカップの日程や放送・配信情報などについて、ご紹介していきます。それでは、一緒に見ていきましょう！試合日程オープ二ングラウンドスーパーラウンド 3位決定戦決勝戦テレビ放送・配信予定テレビ放送インターネットライブ配信アマプラのJSPORTSチャンネルで見られるか？ WBC　U-18ベースボ
ChatGPTのマルチモーダルな新機能｜npaka
- 7 users
- note.com/npaka
- テクノロジー
- 2023/09/26
以下の記事が面白かったので、かるくまとめました。・ChatGPT can now see, hear, and speak 1. ChatGPTのマルチモーダルな新機能「ChatGPT」にマルチモーダルな新機能が追加されました。・音声による会話 : iOS・Android ・画像について質問 : iOS・Android・PC 今後2週間以内に、Plus および Enterprise ユーザーに提供される予定です。 2. 音声による会話ChatGPTとの音声による往復会話が可能になりました。これによって、外出先で話しかけたり、夕食のテーブルでの議論を解決したり、就寝前に会話したりすることができます。使い方は、次のとおりです。 (1) モバイルアプリの「設定 → 新機能」で「音声会話」を有効化 (2) ホーム画面右上のヘッドフォンボタンをタップし、5つの音声から好みのものを選択音声合
- あとで読む
『声百合アンソロジー』発刊のお知らせ｜ストレンジ・フィクションズ
- 7 users
- note.com/strange_fics
- 学び
- 2023/09/01
みなさんこんにちわ、夏も終わってすっかり世間も百合の装いになりつつありますね！というわけで、我らが文芸小説サークル〈ストレンジ・フィクションズ〉が『よふかし百合アンソロジー　夜になっても遊びつづけろ』につづいて二年ぶりに繰り出す百合号外特集はこちら、『声百合アンソロジー　まだ火のつかぬ言葉のように』！　〈声〉をテーマに執筆された七篇を収録。 2023年9月10日（日）に催されます文学フリマ大阪11にて頒布予定です。ブース番号はH-32！　H-32をよろしくお願いします！　百合島です！紙月真魚がエッチな小説を読ませてもらいま賞を受賞したことによってますますパワーアップしたストフィクレギュラーメンバーに加え、笹幡みなみ（『Rikka Zine vol.1』、『SFマガジン』、『紙魚はまだ死なない』）、谷林守（創元SF短編賞日下三蔵賞）といった豪華ゲストも力作百合を寄稿！そして！　表紙は
- 創作
- 本
より高速でエネルギー効率に優れたAIを実現する新しいチップ・アーキテクチャー | IBM ソリューションブログ
- 7 users
- www.ibm.com
- テクノロジー
- 2023/10/26
主要カテゴリー IBM Cloud Blog IBM Data and AI IBM Consulting IBM Partner Ecosystem IBM Sustainability Software Client Engineering IBM テクニカル・サポート社員が語る「キャリアとIBM」 IBM Cloud Blog IBM Cloud News IBM クラウド・ビジョン IBM Cloud アップデート情報 IBM Cloud チュートリアル IBM Data and AI IBM Watson Blog アナリティクス Data Science and AI SPSS Modeler ヒモトク Db2 オートメーション IBM Consulting デジタル変革（DX）アプリの開発とモダナイゼーション製品／サービスソフトウェアハードウェアサービス無料評価
世界平均を超えるようになった“日本の生成AI活用度”　日進月歩の技術におけるアジャイルガバナンスの必要性
- 7 users
- logmi.jp
- テクノロジー
- 2024/04/25
世界平均を超えるようになった“日本の生成AI活用度” 日進月歩の技術におけるアジャイルガバナンスの必要性生成AIの衝撃～アジャイルガバナンスの必要性と3ディメンジョン・モデルによる進化へ #1/4 日本は生成AIの活用がとんでもなく進んでいる森正弥氏：森正弥です。「生成AIの衝撃アジャイルガバナンスの必要性と3ディメンジョンモデルによる進化」と題して、話題提供をできればと思います。今ちょっと気づいたんですけど、ストリーミング用のカメラがありますね？私は普通にこう歩きながら話すんですけど（笑）。そうすると、ナチュラルにフレームアウトしていく感じになるので、どうしようかなとちょっと思っています。生成AI、「ChatGPT」の衝撃はすごいですよね。「自分のコーディングやプログラミング、あるいは趣味でのいろんなデザインとか、クリエイティブな仕事とか作業でもう使っているよ」という方は手
思い付き
- 7 users
- www.kikikikikinta3.com
- 学び
- 2024/04/12
思いついたことをメモに書いておけば忘れないから大丈夫と言いたいが、毎日毎日思いついていると数が増えて段々思い付きが下へと流れていき、久しぶりに引っ張り出すと何を言いたかったのかすっかり忘れているのが地味に問題。音声で速攻で書き下ろせればいいものの音声認識は現状へっぽこなのでデタラメばかりで全く役に立たない。悩ましい。 ①神風特攻隊神風特攻隊っていうのが究極の愚策であるということを指摘した例はあまり知らないが、これを愚策だと言うことに関してはこれは完全なタブーだったのではないかということを思った。軍人出身なので内部は当然禁忌もいいところである。国のため、日本のため家族や故郷のために特攻して死んでいくという美談は涙なしでは語れない。というストーリーは当然あるわけだが、見方を変えるとアメリカ相手にまだまだ戦い続けねばならないのに貴重な戦力をむざむざと特攻で死なせるというのは、これは矛盾していな
NVIDIAが音声認識追加や画像検索改善を行ったAIチャットボット「ChatRTX」を公開
- 7 users
- gigazine.net
- テクノロジー
- 2024/05/02
NVIDIAが、AIチャットボット「ChatRTX」でサポートするLLMを追加して画像検索機能の改善や音声認識機能の追加を行ったことを発表しました。 Build a Custom LLM with ChatRTX | NVIDIA https://www.nvidia.com/en-us/ai-on-rtx/chatrtx/ ChatRTX Adds New AI Models and Features | NVIDIA Blog https://blogs.nvidia.com/blog/ai-decoded-chatrtx-update/ Nvidia’s AI chatbot now supports Google’s Gemma model, voice queries, and more - The Verge https://www.theverge.com/2024/5/1/
- 人工知能
閉じた日本市場 - Arahabaki’s diary
- 7 users
- arahabaki.hatenablog.jp
- テクノロジー
- 2023/08/12
ご訪問下さりありがとうございます。記事をお読み下さる方、☆を付けて下さる方、大変感謝しております。最近、いろんな海外の動画とか見てて、日本製品の競争力が世界的に落ちてるように感じています。例えば、下の動画は、2年前に韓国で発売されたサムスン電子のAI搭載ロボット掃除機「ジェットボットAI」の宣伝です。 www.youtube.com 日本のメーカーで、このレベルのロボット掃除機を販売してるメーカーって、あるんでしょうか。 www.youtube.com でも、これ、日本国内では未発売らしいのです。紹介する記事は2年前に出てたけど（下の記事）。 techable.jp アマゾンでも調べたけど検索に出ません。海外ではレビュー動画とか出てるから、売られてるのは確かなんだけど。なんで日本国内では売られてないのか。BingAIに来いてみました。日本で韓国製のロボット掃除機、ジェットボットAIが
AIに予算20万円以下でピラーレスケースのビジネスPCを組んでもらって分かったこと
- 7 users
- www.itmedia.co.jp
- テクノロジー
- 2024/05/04
ゴールデンウィークの連休に、新しいPCを一式組んでみようという人も多いのではないだろうか。厳しい円安が継続する中で、なかなかPCパーツを購入するタイミングが難しいが、思い立ったら吉日だ。前回は予算30万円でゲーミングデスクトップPCを生成AIに聞いたが、今回は自作PCではやっているピラーレスケース（角に支柱がなく、内部システムを見ることができるケース）をベースにしたビジネスPCを組んでもらった。 →AIに予算30万円以下でゲーミングPCを組んでもらって分かったこと手元にPCやスマホさえあれば、時間も場所も問わずいつでも回答してくれるエージェントに投げかけた質問は下記の通りだ。プロンプト（呪文）や問い合わせるタイミングなどによって回答は一定ではないので参考程度に見てほしい。あなたはPCショップ専門店の店員です。税込みの予算20万円以内で最新のビジネスPCを作ってください。必ずピラー
- ai
- PC
- あとで読む
グーグルが完全に本気！究極のマルチモーダルAIモデル「Gemini」登場！
- 7 users
- ascii.jp
- テクノロジー
- 2023/12/07
グーグルは12月6日（現地時間）、高性能AIファウンデーションモデル「Gemini（ジェミナイ）」を発表した。各種ベンチマークにおいてGPT-4を上回る成績を記録。Google検索やチャットAIの「Bard」などグーグルの各種サービスに順次利用されていくほか、12月13日より開発者にもAPI経由で公開される。ネイティブでマルチモーダルを実現マルチモーダル（異なる入力形式を同時に扱うこと）なAIとしてゼロから構築されたGeminiは、テキスト、画像、音声、動画、プログラムコードなど、さまざまな種類の情報をシームレスに理解し、操作し、組み合わせることができる。これまでのマルチモーダルモデルは、画像認識、音声認識など、異なるデータを扱う個別のコンポーネントをつなぎ合わせたアプローチなので、画像の説明などの特定のタスクの実行には優れているが、概念的で複雑な推論に苦労することがあった。 You
- Google
- AI
AI副業で稼ぐおすすめの方法12選【注意点あり】半自動で効率化！ - ソロ活@自由人BLOG
- 7 users
- sorokatu.com
- テクノロジー
- 2023/11/05
AIで超ラクして簡単に稼げるって本当？稼げるのは本当ですが、超ラクでも、簡単でもありません。でも時間ばかり掛かっていた副業を、劇的に効率化できるのは事実です。こんなあなたに！ ✔AI副業って何なの？ ✔どんな副業があるのか知りたい ✔AIを使った副業のメリットは？ ✔AI副業の注意点は？ ✔本当に効率化できるの？このような悩みや疑問を解決します。 AI（人工知能）の進歩により、誰でも手軽に副業を始められる時代がやってきました。AIを使った副業の世界を、超分かりやすく解説します。メリット、始めるための手順、効率的な仕事の進め方まで完全網羅。具体的なAI副業の例として、12の仕事を紹介します。またAIを使うなら、避けて通れない注意点についても触れていきます。副業は、あくまで副業です。無理なく、そして楽しみながら続けられることが大事です。身近なテクノロジー、AIを活用して、新しい働き
博士課程で得られたもの・失ったもの - Akira MATSUDA
- 7 users
- www.0x0c.me
- テクノロジー
- 2023/12/24
これは壁 Advent Calendar 2023の23日目の記事です。この記事では2017年4月に博士課程に進学し、その後紆余曲折あり約6年半かけて2023年の11月に学位を取得するまでに私が感じたことをお伝えします。記憶がフレッシュなうちにひり出した、長くて読みづらいお気持ちポエムです。当時から今まで私を支えてくださった全ての人に感謝いたします。なお、この記事は私の主観と当時の記憶により執筆されているため、現状及び解釈によっては事実と異なる場合があることをご了承ください。博士課程に進んだきっかけ自分は学部生の時からコンピュータサイエンスを専攻しており、大学院でも同様の学問を専攻しました。コンピュータサイエンスの中でもHuman-Computer Interaction（HCI）という、「人がコンピュータを効率的に使うための操作方法」や「人にとって使いやすいと感じるコンピュー
Artificial Emotional Intelligence "Saya"
- 7 users
- aei-saya.jp
- 暮らし
- 2023/10/02
キーボードでやり取りをするテキストベースのインタフェースとは違い、ヒトと話しコトバでやり取りをするためには、たくさんのAI の連携が必要です。・音からヒトの声を検出する発話区間検出AI ・ユーザーの話し終わりを判断するターン判定AI ・言葉を認識する音声認識AI ・対話の流れから発話内容を作る対話AI ・キャラクターの声を作る音声合成AI etc. このような対話システムとしてのSayaは、謎解きクリエイターの松丸亮吾氏との対談（2022年4月）や、 Wonder festivalのメインステージで海洋堂のセンムさんとも対談（2022年7月）しました。数百人のお客さんを前にした、幕張メッセステージ上での真剣勝負で、センムさんとお話しした様子がビデオに残っています。 2022年時点でTransformerベースの対話AIが組み込まれていましたが、現在では大規模言語モデルにより、更に
「車特化型ソフトウェアプラットフォーム」や「次世代音声認識」の開発も担う　コネクテッド先行開発部における、IVIソフトウェア開発
- 7 users
- logmi.jp
- テクノロジー
- 2023/10/10
トヨタ自動車株式会社が主催となって行うプログラミングコンテスト「TOYOTA Programming Contest 2023 Summer」。トークセッション「ソフトウェア開発事例の紹介」で登壇したのは、トヨタ自動車株式会社コネクテッド先行開発部の鈴木真一氏。In-Vehicle Infotainment systemの開発について発表しました。登壇者の自己紹介高橋直大氏（以下、高橋）：大手町オフィスにあるコネクテッド先行開発部から、鈴木真一さまにお越しいただきました。よろしくお願いいたします。鈴木真一氏（以下、鈴木）：よろしくお願いします。前段いろいろとお話しさせていただいていましたが、ソフトウェアの開発事例紹介ということで、In-Vehicle Infotainment systemの開発について紹介させていただきたいと思います。あらためまして、トヨタ自動車コネクテッド先
- あとで読む
新世紀Coreと呼ぶべきかもしれない。｢インテル® Core™ Ultraプロセッサー｣は異世界転生者級のスゴさ
- 7 users
- www.gizmodo.jp
- テクノロジー
- 2023/12/20
新世紀Coreと呼ぶべきかもしれない。｢インテル® Core™ Ultraプロセッサー｣は異世界転生者級のスゴさ2023.12.19 17:00Sponsored by インテル株式会社武者良太異世界転生者級のスゴさ!? いえ、これが現代最新のインテルテクノロジーのスゴさなのです。長年CPU/SoCのトップシェアルートをひた走ってきたインテル。今までの歴史を振り返ると、パーソナルなコンピューターの転換期を常に支えてきたんですよね、彼ってば。 1978年～：｢8086｣後のNECのPC-9801シリーズで使われた 1982年～：｢80286｣16ビットCPU時代の頂点の1つ 1985年～：｢i386｣初期の32ビットCPU時代を牽引した存在 1993年～：｢Pentium｣1995年からのWindowsブームを支えた 2005年～：｢Pentium XE｣世界初のマルチコアCPU 2
- CPU
- 人工知能
- ai
elyza/ELYZA-tasks-100 · Datasets at Hugging Face
- 6 users
- huggingface.co
- テクノロジー
- 2023/08/29
傍若無人にふるまう人もいますが。）\n\n上記の文章を読んで、に入れるのに最も適したものを以下の選択肢から選び、その理由を答えなさい。\n\n- だから\n- また\n- むしろ\n- もちろん"},"output":{"kind":"string","value":"文章中のに適した選択肢は「もちろん」です。\n\nの周辺では自発的な意志によって社会の秩序が保たれているという筆者の主張に対し、「傍若無人にふるまう人もいる」という反論を予想し予め掲げているため、「もちろん」が適切です。"},"eval_aspect":{"kind":"string","value":"- 選択肢を外している場合: -4点\n- 理由が的外れな場合: -2点\n- 理由の説明として（反論を）予想する旨が記述されていない場合: -1点\n"}}},{"rowIdx":7,"cells":{"input":{
Be Free - 話せない人が自由に会話できるアプリ - 未踏ジュニア
- 6 users
- jr.mitou.org
- テクノロジー
- 2023/11/05
Be Freeは、声で会話ができない人のためのアプリケーションです。会話シーンを選んで、相手の声を音声認識。返事の組み立てをAIがサポートし、声で返答します。声のない生活を送る人にとって、役に立つサービスのヒントになったらいいと考えプロジェクトを進めています。
- 気になる
- あとで読む
Apple、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ＋振動”で体験する機能も | gihyo.jp
- 6 users
- gihyo.jp
- テクノロジー
- 2024/05/16
Apple⁠⁠、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ＋振動”で体験する機能も Appleは2024年5月15日、ハンディキャップのあるユーザがiPhoneやiPadなどを操作する際に助けとなる、2024年後半に登場予定の新しいアクセシビリティ機能を発表した。毎年5月の第3木曜日（今年は5月16日）に開催される、世界中でアクセシビリティについて話し合い、考え、学ぶことを目的とした一日「Global Accessibility Awareness Day（GAAD⁠）⁠」に合わせて発表されたもの。 Apple announces new accessibility features, including Eye Tracking -Apple アイ⁠・トラッキングがiPadとiPhoneで利用可能に人工知能を活用したアイ・トラッキングにより、目だけでiPad
- ipad
- iOS
- software
- apple
- iphone
人は誰しも、テープ起こしをしている：美学者・伊藤亜紗に訊く｜ヒルズライフ
- 6 users
- hillslife.jp
- エンタメ
- 2023/10/06
本サイトは、パートナーとともに CINRA, Inc.が企画運営・編集しているメディアです。運営会社：CINRA, Inc. パートナー：森ビル株式会社多くの人は、テープ起こしが自分の人生に関係があるとは思わないかもしれない。しかし、それぞれ異なる生を送っている私たちにとって、ある身体から発せられ、それを異なる身体がどう受け止めるのかという“記憶と記録”をめぐる問題は、実は身近な重要テーマだといえるのではないだろうか。音声認識AIが発展しつつある現在ならば、なおさらだ。インタビュー連載「編集できない世界をめぐる対話」第７回は、近年話題の美学者・伊藤亜紗をゲストに迎えた。目の見えない人や吃音のある人などさまざまな障害をはじめとして、各々の体を生きる人々にインタビューしてきた伊藤は、本記事のインタビュアーと以前にはじめて会った際、「テープ起こしが好きだ」と話していた。あの大変なテープ起
- 思想
- AI
- 人
- work
- life
- あとで読む
AppleWATCHで新たな誕生日を迎えられた日本人、飯村正彦　AppleEvent冒頭に登場！（神田敏晶） - エキスパート - Yahoo!ニュース
- 6 users
- news.yahoo.co.jp
- テクノロジー
- 2023/09/13
KNNポール神田です。 2023年9月13日（水）毎年、恒例となったAppleイベントが開催された。 https://www.apple.com/jp/apple-events/ オープニングのビデオで最初に登場したのが、日本の飯村正彦さんの干されたパンツと靴下だった。Appleのイベントで日本人の象徴的なシーンではじまるのは、とても意外だった。出典：Apple Event 飯村正彦さんのAppleWATCHに　パパお誕生日おめでとうの娘さんからのメッセージが届くシーンからはじまる…。出典：Apple Event このオープニングビデオは、AppleWATCHのおかげで新たな誕生日を迎える人たちの紹介ビデオだ。もしも、AppleWATCHを装着していなければ…、ここに紹介された人たちは、次の『誕生日』をむかえられなかったかもしれないというストーリー仕立てになっている。 ■不整脈を記録
- medical
- health
- event
- apple
陸王　辛みそラーメン - g13longkillの飯（ラーメン･居酒屋）
- 6 users
- g13longkill.hatenablog.com
- 暮らし
- 2024/05/10
走っていて面白くなければ......... 私は嫌.......。燃費が良い、安い、広い等数をあげればきりがないであろうが、個々人に「車を購入するにあたっての定義」のようなものは存在するであろう。それは当然、現在のその人間の立ち位置から詳細に算出され、希望にあった、もしくはそれに近いモノを探し出すということになるだろう。腰痛野郎の私は、これまでの車でもまぁ別に良かったのだが、息子が生まれ、チャイルドシート問題が出てくると話が変わってくる。ちょうど走行距離も20万kmに差し掛かるこのタイミングで購入を決意した私。いろんな折り合いを付け決定し、先日が納車日。なるほど．．．．．．．．チャイルドシートは大丈夫。坐骨神経痛の私にもナイスな運転席....。しかし‥‥‥‥だ。私は数年で浦島太郎になってしまったのだろうか.......。昨今の車....... ボタンが多すぎて分かり
Appleが間もなくAI生成の絵文字やOpenAIとの提携を発表するとの報道
- 6 users
- gigazine.net
- テクノロジー
- 2024/05/27
Appleは2024年6月11日に年次開発者向けイベントのWWDC24を開催予定です。Appleはこの中でAI機能を発表すると目されているのですが、その機能のひとつとして「AI生成の絵文字」が登場するとBloombergが報じています。加えて、AppleはAI機能の提供でOpenAIとの提携を発表する可能性も取り沙汰されています。 Apple iOS 18, macOS 15 AI Features: Project Greymatter, Privacy, OpenAI Deal - Bloomberg https://www.bloomberg.com/news/newsletters/2024-05-26/apple-ios-18-macos-15-ai-features-project-greymatter-privacy-openai-deal-lwni63s3 Apple’s
- 人工知能
- Apple
「Hey Siri」や「OK,Google」はもう超えた!? スマホで「ChatGPT」や「Copilot」を活用してみる | ＆GP
- 6 users
- www.goodspress.jp
- テクノロジー
- 2024/01/21
2024年、デジタル業界最大のテーマはAI（人工知能）。「ChatGPTなら、昨年から触っているよ」という人も多いかもしれません。そんなAIも最近はスマホへの進出を進めています。 OpenAIによるChatGPTは昨年5月からiOSアプリ版が登場していて（Android版は7月）、11月には無償版のユーザーも含めて音声認識に対応。マイクロソフトが展開しているAI機能のCopilotも、昨年12月にアプリ版が登場。ちなみに、マイクロソフトのブラウザ「Edge」のアプリ版にもCopilotが一体化して利用可能で、こちらも音声認識に対応しています。僕はChatGPTもCopilot（Edge）も大活用しているのですが、今回のテーマは「"Hey Siri"のSiriや"OK,Google"のGoogleアシスタントの代わりに、AIチャットを使えないか」ということ。今のChatGPT（有料版のGP
AppleがiOS 18で「Car Play」に追加される機能や将来的な機能について語る
- 6 users
- gigazine.net
- テクノロジー
- 2024/06/19
Appleは対応するカーオーディオやカーナビにiPhoneを接続してマップなどの各種アプリを使用可能にする「CarPlay」というシステムを提供しています。そんなCarPlayについて、iOSの次期メジャーバージョン「iOS 18」で追加予定の機能を紹介するムービーをAppleが公開しています。次世代のCarPlayのデザインシステムの紹介 - YouTube iOS 18 Adds These 5 New Features to CarPlay - MacRumors https://www.macrumors.com/2024/06/13/ios-18-carplay-features/ ◆1：メッセージアプリへのアイコンの追加 iOS 18にアップデートしたiPhoneでCarPlayを実行すると、メッセージアプリの名前の横にアイコンが表示され、会話の相手が識別しやすくなります。
スマホアプリ版「Microsoft Copilot」でGPT-4が無料で使える！iPhone・Androidに簡単に導入する方法は？ | ライフハッカー・ジャパン
- 6 users
- www.lifehacker.jp
- テクノロジー
- 2024/07/31
Copilotのスマホアプリ版の導入方法【iPhone・Android】Copilotのスマホアプリ版は、iPhoneならApp Store、AndroidならGoogle Play ストアで無料でダウンロードできます。なお、「CoPilot」という名前の他社製のゲームアプリが検索結果に出てきますが、機能が異なる別もののため、注意が必要です。＞＞App Store｜Microsoft Copilot（外部リンク）＞＞Google Play ストア｜Microsoft Copilot（外部リンク） Copilotのスマホアプリ版でできることスマホアプリ版「Microsoft Copilot」では、GPT-3.5より高精度な後継モデルのGPT-4が無料で利用可能。対話形式で指示するだけで、文章や画像生成ができます。スマホで使えるため外出先でサッと使いやすく、音声検索との相性もよいです。 M
Xiaomiが“スマホの先”に見据えるもの　ロボット開発でIoT家電の覇権を握れるか
- 6 users
- www.itmedia.co.jp
- テクノロジー
- 2023/10/03
2023年8月14日にXiaomiは毎年開催しているレイ・ジュンCEOによる年次講演会を行った。今後の事業展開や新型折りたたみスマートフォンの発表の後、同CEOが自信ありげに発表した製品が、犬型スマートロボット「CyberDog 2」だ。Xiaomiのロボットはこれで3製品目であり、スマートフォンの先の未来に向けた製品開発を着々と進めている姿を世界中にアピールした。本物の犬のように仕上げた「CyberDog 2」　業務への応用も視野に CyberDog 2の最大の特徴は、本物の犬のようなデザインに仕上げたことだ。関節部分には独自に開発したマイクロモーターを搭載し、スムーズな動きを実現している。またセンサーを多数搭載しており、AI処理により障害物を避けて歩行したり、人間の音声を理解して動いたりすることも可能だ。価格は1万2999元（約26万円）で、この手の製品としては破格ともいえる安さだ。
「事業部全員データアナリスト計画」がもたらした誤算と財産——とあるスタートアップのデータ組織立ち上げ奮闘記 - ダイレクトリンク！by High Link
- 6 users
- blog.high-link.co.jp
- テクノロジー
- 2023/10/31
データドリブンな経営を目指し、社内のデータエンジニアが指揮を執る形でデータ組織を立ち上げたHigh Link。データを事業成長のエンジンとすべく、“事業部全員データアナリスト計画”を掲げ、データの民主化を粛々と進めてきた。しかし、計画の半ばで大きな壁にぶつかることになる。Techサイドだけでなく、Bizサイドもデータを扱える組織文化をつくり上げられたものの、データと経営をつなぐスペシャリティを獲得するのは想像以上に困難だったのだ。壁を突破すべく、フリーランスとして企業のデータ分析をサポートするデータアナリストのanbooさんが業務委託として参画。社内で整備していたデータ基盤を活用し、入社から間もなくしてトップラインの向上に成功した。今後High Linkは、データ分析のスペシャリティを組織に落とし込み、よりデータドリブンな経営スタイルへと舵を切っていく。組織全体にデータの重要性を浸
Google Colab で SeamlessM4T を試す｜npaka
- 6 users
- note.com/npaka
- テクノロジー
- 2023/08/29
「Google Colab」で「SeamlessM4T」を試したので、まとめました。 1. SeamlessM4T「SeamlessM4T」は、音声とテキストをシームレスに翻訳および文字起こしを行う、多言語なマルチタスクモデルです。入力は約100、出力は36の言語に対応しています。・Speech-to-speech translation (S2ST) : 音声から音声への翻訳・Speech-to-text translation (S2TT) : 音声からテキストへの翻訳・Text-to-speech translation (T2ST) : テキストから音声への翻訳・Text-to-text translation (T2TT) : テキストからテキストへの翻訳・Automatic speech recognition (ASR) : 自動音声認識 2. SeamlessM4
GPT-4oとは？ChatGPT最新AIモデル GPT-4o の使い方や料金を詳しく解説
- 6 users
- aismiley.co.jp
- テクノロジー
- 2024/05/20
※価格は全て100万トークン辺りの金額詳細な料金プランはOpenAIの公式サイト内で確認できます。 OpenAI API price OpenAI ChatGPT アップデートの新機能 GPT-4oでは、さまざまな新機能が追加され、ユーザーエクスペリエンスが大幅に向上しています。テキストはもちろん、音声・画像・映像をシームレスに扱い、自然なテンポでのリアルタイム音声会話が可能になりました。 Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN Text and image input rolling out today in API and ChatGPT with voice an
iOS 18でSiriはAIを活用して個々のアプリ機能をより自由かつシームレスに利用可能に
- 5 users
- gigazine.net
- テクノロジー
- 2024/05/31
Appleのティム・クックCEOが「生成AI機能の詳細を2024年後半に発表予定」と発言しているため、2024年に登場するiOS 18ではAI機能が盛りだくさんになると予想されています。新たに、iOS 18ではAI搭載で音声認識アシスタントのSiriがアップグレードされ、個々のアプリ機能を細かく利用可能になると報じられました。 Apple iOS 18 Siri AI Update Will Let Users Control Features in Apps With Voice - Bloomberg https://www.bloomberg.com/news/articles/2024-05-30/apple-ios-18-siri-ai-update-will-let-users-control-features-in-apps-with-voice iOS 18: Siri t
- 人工知能
- あとで読む
Amazon「季節先取りSALE」を9月1日9時スタート：iPadなどセール対象をチェック - こぼねみ
- 5 users
- www.kobonemi.com
- テクノロジー
- 2023/08/25
Amazonは9月1日（金）9時より、「Amazon 季節先取りSALE」を開催します。いつもは「タイムセール祭り」と称していますが、今回はちょっと趣が異なるようです。最大5, 000ポイント還元のポイントアップキャンペーンも同時開催され、夏から秋への準備に向けて、AmazonデバイスやAppleデバイス、スポーツ・アウトドア用品やファッション、家電、美容、食品・飲料・お酒など多数の商品が特価で販売されます。主なセール対象商品最大12%ポイントアップキャンペーン AppleギフトカードなどAmazonポイント3%還元【対象者限定・9/5まで】 Kindle Unlimitedが2か月99円〜 Amazon Music Unlimited プライム会員登録がお得！Amazon Mastercard新規入会でポイント還元も！ ※本サイトは事業者からのアフィリエイト成果報酬によって運営し
NeMo Framework で日本語 LLM をファインチューニング - PEFT 編 -
- 5 users
- developer.nvidia.com
- テクノロジー
- 2023/11/30
Reading Time: 3 minutes NeMo Framework は生成 AI モデルを構築、カスタマイズ、展開するためのエンドツーエンドのクラウドネイティブフレームワークです。本記事では、NeMo Framework を使用して、日本語の大規模言語モデル (LLM) の PEFT (ファインチューニングの手法の一種)を実行する方法を説明します。 NeMo Framework とは NeMo Framework は、生成 AI モデルのワークフローをエンドツーエンドでカバーするフレームワークで、現在は LLM を中心とした NLP 向けのコンテナーが NGC 上で公開されています。こちらからアクセスして ”Download now-language” をクリックすると、承認後に NGC 上で NeMo Framework のコンテナーが入手できます (”Apply Now
【プロンプトあり】 Create.xyzで本格的なWebサイト制作をしてみよう｜ChatGPT研究所
- 5 users
- chatgpt-lab.com
- テクノロジー
- 2024/05/13
本記事は、実践的にCreate.xyzを用いてサイトを作成する方法を具体例とともに紹介していきます！最近追加されたCommand R+やDALLE-3などのAPI Integrationの内容の解説もしていきます。デモでは自社HPを作り、問い合わせフォームの内容を専用データベースに保存する方法をご紹介します。 Create.xyzで出来ることCreateを使うと、自然言語でサイトの外見や機能を記述するだけで、AIがコーディングを自動で行ってくれます。プロンプトテクニックとして、デザインやレイアウトを具体的に指定することも重要です。基本的な作り方については、以下の記事で解説しているので、ぜひこちらもご覧ください！⬇️ と言っても、一から十まで仕様書を書くことは初心者の場合大変なので、今回の記事にはCreateで作成できるサイトの設計書を書いてくれるGPTsとそのプロンプトを記載してあ
KoeMill
- 5 users
- mecha-uma.blogspot.com
- 世の中
- 2023/10/03
KoeMillは、音声認識による文字起こしを行うソフトウェアです。動画や音声から自動的に文字起こしができるため、煩雑な手作業を省くことができます。オフラインで動作するため、ネットワークの遅延などによる遅れやプライバシーに関する懸念もありません。また、GPUを利用することで高速な処理を実現します。 KoeMillを使えば、動画編集者やライターは、手軽に文字起こしを行うことができます。また、テキストの編集も容易でSubRip形式で保存したり、textやcsv形式で出力することもできます。これにより、作業時間を短縮し生産性を向上させることができます。