並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 91件

新着順 人気順

自動書き起こしの検索結果1 - 40 件 / 91件

  • 公用語が英語の組織で、日本語話者エンジニアがオススメする英語学習お役立ちツール【2022年初版】 - Money Forward Developers Blog

    エンジニアブログでは初めまして、CTO室グローバル部のnishimura.yukariです。 前部署のCIO室から会社の社内異動公募制度(チャレンジシステム)を経て現在の部門で働いています。 (異動に至る経緯や想いは色々あるのですが、ちょっと長すぎるので別の機会にまたnoteにでも・・・) 先日、当社CTOから発表した通り、マネーフォワードのエンジニアリング組織では今後3年以内の公用語英語化を進めています。 マネーフォワードCTOが考えていること(2021年9月) グローバル部はその先駆者として、東京勤務ながらチームの公用語を英語に切り替え、様々な国出身のエンジニアが集って開発を進めている部門です。 そんな部署に異動志望を出した私自身といえば、実は【マネフォにジョインするまで、流暢に英語を話す人を周囲でほとんど見たことがなかった】ほど、英語とは無縁の学習環境からの出発でした。 エンジニアら

      公用語が英語の組織で、日本語話者エンジニアがオススメする英語学習お役立ちツール【2022年初版】 - Money Forward Developers Blog
    • スマホだけで仕事が完結!?Word、Excel、PowerPointを統合した新しいOfficeアプリが有能すぎる!|@DIME アットダイム

      一気に導入が進んだテレワークだが、動き出した「働き方改革」への大きなうねりは、今回の事態が終息しても止まらない。自宅はもちろん、いつでもどこでも、場所を選ばずに働ける。そんな働き方が当たり前になる日は、そう遠くないかもしれない。すでに環境も整いつつある。マイクロソフトは今年2月から、これまでモバイル向けに提供してきた「Word」「Excel」「PowerPoint」の各アプリの機能を統合し、これひとつで様々なOfficeファイルを編集できる「Microsoft Office」アプリを正式にリリースした。従来のように複数のアプリを行き来する手間なく、1つのOfficeアプリ上で効率的に作業ができる。その便利な使い方を日本マイクロソフト Microsoft 365 ビジネス本部 プロダクトマーケティングマネージャーの広瀬友美さんに聞いた。 3つのアプリの機能を1つに。さらにスキャンや文字起こし

        スマホだけで仕事が完結!?Word、Excel、PowerPointを統合した新しいOfficeアプリが有能すぎる!|@DIME アットダイム
      • 無償入手可能な音声コーパス/音声データベースの一覧 - Qiita

        無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス

          無償入手可能な音声コーパス/音声データベースの一覧 - Qiita
        • 「メモする」ってどうしたらいいの? メモする道具のその先について

          先日、SNSでメモの取り方についての議論を見かけた。メモをまとめる速度が話の進展に間に合わない……という点についてのものだ。 確かにそういうことはあるだろうが、筆者はそれを見ながら「メモを完璧にとる、その場で完成させようとしているからではないか」という印象を受けた。 「メモをとる」のは日常的な作業だ。その量や内容はまちまちだろうが、誰もが行うことだ。メモ用紙やPC、ペンなど、「何を使ってメモをとるのか」という話はよく話題になる。 一方で、なぜメモを取るのか、メモをどうすべきか、という点については、あまりちゃんと議論されていないように思う。 さらにいえば「どの道具でメモを取るのか」も、メモの活用方法によって大きく変わってくる。 筆者はライターという、日常的に大量のメモを取り、それを生かして何かを作る仕事をしている。だから、多少なりとも「メモとは」という話をするだけのノウハウは持っていると思っ

            「メモする」ってどうしたらいいの? メモする道具のその先について
          • Twitter、ツイートの画像に代替テキストを追加する機能

            米Twitterは4月7日(現地時間)、ツイートの画像に代替テキスト(altテキスト)を追加する機能を追加したとツイートで発表した。 altテキストは、画像など非テキストコンテンツがWebブラウザで表示できない場合に代わりに表示するためにパブリッシャーが入力しておくテキスト。音声読み上げツールが読み上げるため、アクセシビリティの向上にも役立つ。 ツイートの画像の左下に「ALT」(日本では「代替」)バッジが表示されている場合、これをタップすると画像の内容を説明するテキストが表示される。 「ALT」を追加するには、ツイートに画像を追加すると画像の下に表示される[説明を追加]ボタンをタップして説明を入力する。最長1000文字まで入力可能だ。[保存]をタップすると画像に「ALT」バッジが追加される。 1つのツイートに複数の画像を追加する場合も個別のALTを入力可能だ。詳細は日本語のヘルプページを参

              Twitter、ツイートの画像に代替テキストを追加する機能
            • 自律駆動型組織をつくるためのオープンな情報共有の方法|tebiki ブログ

              弊社では、顧客情報や個人情報にはもちろん配慮しつつ、給与関連を除く全ての情報を社内共有しています。たとえば銀行残高も公開していて、新入社員によく驚かれたりします。この記事では、どういう意図と設計で情報公開しているのかを解説していきます。 貴山敬 (@tkiyama) ※Tebiki社のカルチャーや各種社内制度はこちらもご覧ください。 情報を隠すコストは大きく、たいてい運用で失敗する情報を隠すためには、議事録を含む様々なドキュメント/フォルダ/社内SNSのチャネル等で、細かく公開設定する必要があります。 実際に公開設定を真面目に管理したことある人はよくわかると思いますが、かんたんそうに見えて、実際はかなり難しい。以下のような例外パターンがたくさん生まれるので、正しい状態を維持するのはすごく手間がかかります。 部門単位で公開設定するが、個人単位で設定することもあり、部門と個人が混在する。 Xフ

                自律駆動型組織をつくるためのオープンな情報共有の方法|tebiki ブログ
              • Pixel 6の「日本語書き起こし」は仕事で使えるか 今できること、できないこと

                Pixel 6が出て以降、「音声からの日本語自動書き起こしがすごい」ことが話題になっている。 確かにすごいのだ。筆者も発売以降、取材で実際に使っているし、note版マガジンでは毎週金曜に掲載している音声コンテンツ「今週の壁打ち」の文字書き起こし部分を作るのにも使っている。とても便利だと思う。 一方で、日々使っていると課題も限界も見えてくる。 筆者は過去からいろいろな「音声書き起こし」サービスを仕事で使っているし、取材メモでも「タイプやペンの手書きと音」の同時記録にこだわってきた。その視点で考えていくと、実際にはどう使えばいいのかが見えてきた。 今回は「日本語音声書き起こしを仕事に使う」という点について、現状を考えてみたい。 この記事について この記事は、毎週月曜日に配信されているメールマガジン『小寺・西田の「マンデーランチビュッフェ」』から、一部を転載したものです。今回の記事は2021年1

                  Pixel 6の「日本語書き起こし」は仕事で使えるか 今できること、できないこと
                • これをチェックすればOK。iOS 18でiPhoneはこう変わる! 新機能まとめ #WWDC24

                  これをチェックすればOK。iOS 18でiPhoneはこう変わる! 新機能まとめ #WWDC242024.06.11 08:1478,732 小暮ひさのり モリモリで、たくましい進化が訪れます。 6月11日深夜から始まったApple(アップル)の開発者向けイベントWWDC 24にて、iPhone向け基本ソフトウェアの最新版「iOS 18」が正式に発表されました。 さすが年イチのアップデート。しかも今回はAppleのAI、Apple Intelligenceとの連携もあって、機能モリモリだったり、インターフェース自体が刷新されたりとここ数年で最大のアップデートとなっています。 では早速、今秋登場のiOS 18で、iPhoneはどう変わるのか? ざっとおさらいしてみましょう! ホーム画面:アイコンのカスタマイズ性がアップImage: Appleまず「見た目」をかなり柔軟にカスタマイズできるよう

                    これをチェックすればOK。iOS 18でiPhoneはこう変わる! 新機能まとめ #WWDC24
                  • 偉い人は「上座」に表示、議事録は自動で作成 ビデオ会議に新機能続々(アスキー) - Yahoo!ニュース

                    マイクロソフト「Teams」などビデオ会議アプリに新機能が続々登場している。機能勝負の世界になりそうだ。 【もっと写真を見る】 2週間ほど前、ネット上で日本企業がコンサルに「社内ビデオ会議で部長や役員を大きく表示してほしい」「上座に表示できませんか」という相談を持ちかけたという話題があった。 確かに日本企業のおける「会議」では偉い人が上座にいるなど、席が決まっていることが多い。その習慣をビデオ会議に持ち込みたいという、本当かフェイクかわからない話が注目されたのだった。 しかし、そんな日本企業の悩みを、あのマイクロソフトが解決しかねない「新機能」が登場した。 ●ビデオ会議でも偉い人は上座に座れる マイクロソフトは、コラボレーションツール「Teams」において「Together Mode」という機能を載せていくと明らかにした。 これまでビデオ会議の表示形式といえば「分割ビュー」として、出席者が

                      偉い人は「上座」に表示、議事録は自動で作成 ビデオ会議に新機能続々(アスキー) - Yahoo!ニュース
                    • Twitterの音声ツイート機能、自動書き起こしなど検討 視聴覚障害者向けに改善へ

                      音声ツイートは、スマートフォンで録音した音声を140秒単位のカードとして投稿できる機能。一部のiOSユーザー向けに先行提供しており、数週間中に全iOSユーザーに開放するとしている。 関連記事 Twitter、音声ツイートのテストを開始 140秒単位の録音カードとして Twitterが、録音した音声を投稿するテストを開始した。140秒単位の録音カードを投稿できる。140秒を超える場合は自動的にスレッドになり、1つの音声メッセージは最長25のスレッドになる。 Twitter、中国、ロシア、トルコの国家支援の情報操作アカウントを3万件以上停止 Twitterが、国家ぐるみの情報操作目的とみられるツイートを発信していたアカウント3万2242件を停止したと発表した。そのうちの2万件以上が中国のもので、香港問題や新型コロナウイルス関連の偽った情報を拡散しようとしていた。 Twitter、内容を読まずに

                        Twitterの音声ツイート機能、自動書き起こしなど検討 視聴覚障害者向けに改善へ
                      • ちだいの言ってることってこういうことでしょ

                        https://www.youtube.com/watch?v=aPME0zqGHFM&t=891s 1. 処理水をどんなに手元で薄めようと、数十年後には全部捨てることになるのだから、そのときの放射性物質の総量が重要である。 2. 海流は表層的なものでしかないので、全ての処理水が全世界の海に拡散して希釈されるわけではなく、福島近海に留まり続けるものがある。 3. 処理水に含まれているのはトリチウムだけではないのに、政府はトリチウムしか測定しないし、「トリチウムは生物濃縮しないから安全だ」としか言わない。 4. だから福島近海に残った放射性物質(具体的にはヨウ素129)が生物濃縮されて、その基準値超えの魚が中国などで捕獲されたらどうする?福島の漁師たちにまた危害が及ぶぞ? 念のため言っておくが、俺はこの言説の妥当性については何もわからん。 ただ、ちだいの動画を見るかぎりはこう言っているように

                          ちだいの言ってることってこういうことでしょ
                        • 何を使って取材し、どう書き起こしているか 今の仕事環境をまとめてみた

                          書き起こしはまさかの「Web版Word」最強説 以前は「録音の書き起こし」での選択肢はほとんどなかった。だが、今は日本語であってもいろいろな選び方ができる。お金も使っていろいろなサービスをテストして、なんとなく今のところの「ベストシナリオ」が見えてきた。 英語の取材は「Otter」ですることに変わりはない。こちらもいろいろ選択肢はあるのだが、機器を選ばない使い勝手と精度の両面で、いまだファーストチョイスである。 英語話者との取材はまだオンラインが主流なので、PC/Mac内でKrispを使って録音し、そのデータをOtterに読み込ませて書き起こしをする。そのまま英語で読むこともあるが、「DeepL」に通して日本語にし、おかしいところや、英語での取材時とニュアンスが違うと感じるところだけOtterの書き起こしを見て、さらに違うと思ったら聞き直す……という3段構えになった。それでも、英語だけのイ

                            何を使って取材し、どう書き起こしているか 今の仕事環境をまとめてみた
                          • Google、視線で操作できる会話アプリ 発話が不自由な人のコミュニケーションを支援

                            米Googleは12月8日(現地時間)、視線で操作できる会話アプリ「Look to Speak」をリリースした。ユーザーは、スマートフォンの前で視線を動かすことで、用意されたリストの中から話したい言葉を選べる。選択されたフレーズを読み上げる機能も備える。 アプリでは、画面を左右と上部で三分割。左右に話す言葉の候補、上部にキャンセルボタンなどを割り振っており、ユーザーは選択したい言葉やボタンの方向に視線を動かすことで操作できる。 視線の検知には顔認識技術を利用しており、感度も調整可能。よく使う単語やフレーズを優先的に表示する機能も搭載するが、取得したデータは外部に共有しない。屋外やシャワールームなどでも利用できるという。 言語障害や運動障害により自由に会話できない人が、伝えたいことを自分自身で表現できるようにする目的で開発したという。対応OSはAndroid 9.0以上。 関連記事 視覚障害

                              Google、視線で操作できる会話アプリ 発話が不自由な人のコミュニケーションを支援
                            • Google「Pixel 6」レビュー!9つの長所と1つの欠点(西田 宗千佳)

                              「日本語音声の自動書き起こし」に対応 オンデバイスAIについては、どうだろうか? いくつかの方向性があるが、筆者がまず注目したのは「音声認識」だ。 PixelにはGoogle純正の「レコーダー」というアプリが備えられている。このアプリが、Pixel 6では「日本語の自動書き起こし」に対応した。 使い方はシンプルだ。書き起こし対象として日本語を設定し、録音するだけでいい。声が聞こえると同時にテキスト化されていき、音声とともに記録されていく。 「音声書き起こし」機能自体は他の機種でも可能だが、Pixel 6の特徴は「オンデバイスAI」であること、すなわち、データをクラウドに送らずにテキスト化しているという点にある。したがって反応が素早く、プライバシー面でもプラスだ。 書き起こしの精度はもちろん100%ではないが、かなり高い。人間が「空耳」で聞き間違えるよりはミスの頻度が高い印象だが、それでも、

                                Google「Pixel 6」レビュー!9つの長所と1つの欠点(西田 宗千佳)
                              • 不動産業界のDXを推進するもの、阻むもの--DX銘柄2020選出の三菱地所とGAが語る

                                企業内におけるデジタルトランスフォーメーション(DX)が叫ばれて数年が経つ。不動産業界においてもその動きは急務で、新型コロナ感染拡大とともに非対面化、ペーパーレス化、テレワークなど、働き方改革も求められた。しかしDXと言っても「何から手を付ければいいのかわからない」「成果の出る方法が見つけられない」など、悩みを抱えている不動産会社も多いのではないだろうか。 10月6日、PropTech JAPANが主催したオンラインイベント「不動産業界におけるデジタルトランスフォーメーションの今後とは」には、経済産業省・東京証券取引所が選ぶ「DX銘柄2020」に選出された不動産会社である三菱地所 DX推進部主事兼spacemotio 代表取締役社長の石井謙一郎氏とGAテクノロジーズ 執行役員CAIOの稲本浩久氏が登壇。アナログでのやりとりが残る業界として名前を挙げられることの多い不動産業界におけるDXのや

                                  不動産業界のDXを推進するもの、阻むもの--DX銘柄2020選出の三菱地所とGAが語る
                                • Twitter、動画投稿に自動字幕追加 日本語でも

                                  米Twitterは12月14日(現地時間)、動画投稿の動画に自動的に字幕を表示する機能を追加したと発表した。モバイルアプリ(iOSおよびAndroid)とWebアプリでロールアウト中だ。米TechCrunchによると、日本語を含む30カ国語で表示可能という。 自動字幕は、ミュートした状態で表示される。端末のアクセシビリティ設定を有効にすると、ミュートを解除しても字幕を表示したままにできる。Webアプリの場合は、「CC」ボタンで字幕のオン/オフを切り替えられる。 ただし、上のツイートにあるように、同日以降にアップロードされた新しい動画のみが対象だ。下の画像は本稿執筆の約30分前に投稿されたもので、字幕が表示されている。 関連記事 Twitter版Clubhouse「Spaces」、フォロワー600人以上なら誰でも開設可能に TwitterがClubhouseのような音声チャットルームサービス

                                    Twitter、動画投稿に自動字幕追加 日本語でも
                                  • 音声スタートアップのVoicyが音声配信サービス業界カオスマップを発表 掲載されているサービスは国内外で展開する57種 - ロボスタ ロボスタ - ロボット情報WEBマガジン

                                    音声×テクノロジーで新しい音声体験を創造する株式会社Voicyが、各方面の音声にまつわるサービスを分類した「音声配信サービス業界カオスマップ」の2020年版を公開した。 掲載されているサービスは国内外で展開する57種。これを見ることで、現在立ち上がりつつある音声配信サービス業界がどのような構造で成り立っているのかをイメージしやすくなるだろう。 イメージの湧きづらい音声サービスの水先案内に 2016年に創業したVoicyは、音声配信サービス業界ではリーディングカンパニーと自負しており、急激に拡大している音声業界の網羅的な情報を整理することで、利活用の活発化、さらなる発展を考えているようだ。 たしかに、『ながらぎき』が出来ることが多い音声配信だけに、起動時にしかロゴを見る機会も少なく、一度聞き始めてしまうと「この業界のこの会社」といった形でサービスに対して意識することも少ない。業界をきちんと分

                                      音声スタートアップのVoicyが音声配信サービス業界カオスマップを発表 掲載されているサービスは国内外で展開する57種 - ロボスタ ロボスタ - ロボット情報WEBマガジン
                                    • 生成AIを使ったインタビュー分析自動化 〜UXデザインを超えてゆけ〜|しょーてぃー/ Experience Designer

                                      協力者@PM DAO yipingさん(UX/UI)  /  hasegawaさん(PM Associate) 結論現代人は忙しいので、結論を最初に書くことにする。 分析精度はかなり高い。 🚸 「UXデザインを超えてゆけ」シリーズ第1話が 100いいねを超えたため、続編を執筆しました。 なおこの記事企画はPVやいいね数をみて 需要がなければすぐやめて、 また一人でAIと山奥にこもる予定です笑 (仮説実行検証!) はじめにインタビューは定性調査の一環として重要性を持つ一方で、その分析へは多大なコストと労力が必要となる。本稿では、生成AIを活用したインタビューの定性分析方法の紹介をする。 課題定性調査のコストと費用対効果 定性調査は詳細な情報を提供するが、その分析には時間とリソースが必要である。また、効果が直接的にわかりにくい場合もある。結果として、多くの場合、コストセンターとなりやすい。

                                        生成AIを使ったインタビュー分析自動化 〜UXデザインを超えてゆけ〜|しょーてぃー/ Experience Designer
                                      • 営業支援AIツール「ACES Meet」に新解析機能リリース

                                        ACESが営業支援AIツール「ACES Meet」において、話者比率と話速の解析およびリアクション解析の機能をリリースしました。 このAIニュースのポイント 営業支援AIツールに、話者比率解析機能・話速解析機能・リアクション解析機能が追加 音声認識AIが話者比率、話速、リアクションを可視化し、成約・失注要因を分析できる オンライン商談における成約率の向上と現場の工数削減を目指せる ACESが営業支援AIツール「ACES Meet」において、話者比率解析機能および、話速解析機能、リアクション解析機能を新たにリリースしました。背景には成約・失注要因とされる、営業パーソンのトーク内容と話す割合(話者比率)、および話す速度(話速)の分析などがあげられます。 「ACES Meet」は、Zoomでのオンライン商談を録画し、独自AIによる話者ごとの自動書き起こしや重要なシーンの可視化を行うことで、オンラ

                                          営業支援AIツール「ACES Meet」に新解析機能リリース
                                        • その話、聞き逃さない!ChatGPTによる自動書き起こし&要約が可能なオーディオドッグ「HiDock H1」クラファン実施 | Techable(テッカブル)

                                          Tech その話、聞き逃さない!ChatGPTによる自動書き起こし&要約が可能なオーディオドッグ「HiDock H1」クラファン実施 人と話しているときやミーティングの最中に、「今この瞬間の話をメモに残したい」「話の内容の要点だけをまとめてほしい」と思うことはないだろうか。 HiDockの「HiDock H1 with HiNotes」(以下、HiDock H1)は最先端のハードウェア・ソフトウェアソリューションで、ノイズのない通話と音声録音、ChatGPTによる書き起こしと要約が可能。11ポートのドックを搭載し、デスクでも場所を取らないスグレモノだ。 現在クラウドファンディングサイトKickstarterおよびINDIEGOGOでプロジェクトを実施している。 ノイズを除去し、クリアな通話録音を実現HiDock H1は、電話での会話の際はノイズを消し、1000時間におよぶ会話を録音できる。

                                            その話、聞き逃さない!ChatGPTによる自動書き起こし&要約が可能なオーディオドッグ「HiDock H1」クラファン実施 | Techable(テッカブル)
                                          • ハイブリッド ワークを支援する新たな AI を発表 | Google Workspace ブログ

                                            スペースの要約機能、Google Meet のライブ共有や会議の文字起こし機能など、Google Workspace での AI を活用したイノベーションをご紹介します。 ※この投稿は米国時間 2022 年 5 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。 Google は、数年前から Google Workspace で機械学習を活用して、仕事をより生産的かつインパクトのあるものにするための支援を行ってきました。そして、本日、業界をリードする AI を活用した Google Workspace の新機能を発表します。この新機能により、ハイブリッド ワークの環境でより多くの成果を上げられるよう支援します。 お客様からだけでなく、Google 社内でも、複数の場所やデバイスにまたがる膨大な情報の把握に苦労しているという声を聞いています。情報過多は今に始まっ

                                              ハイブリッド ワークを支援する新たな AI を発表 | Google Workspace ブログ
                                            • Whisper 高速化したfaster-whisperを簡単に動かしてみる | 副業を始めるおじさんの記録

                                              CTranslate2と言う高速推論エンジンで変換したモデルを実装することで、 処理速度が約4倍に早くなって、メモリーの使用率は約1/3になったみたいです。 Fast-Whisperの実装 最初に、「編集」→「ノートブックの設定」から、 ハードウェアアクセラレートを「GPU」に設定しましょう。 以下のコマンドを入力し、Shift+Enterを押して実行しましょう。 GPUの情報が出てくれば、正常に設定変更できています。 !nvidia-smi 続けてコードを記載してきます。 これまでのWhisperの使用方法については、Whisper 音声・動画の自動書き起こしAIを無料で、簡単に使おうを参照ください。 !pip install git+https://github.com/guillaumekln/faster-whisper.git !apt install libcublas11 f

                                              • 英語博士論文執筆に使用したもの、あれこれ

                                                刷り上がった日の写真。大きさを伝えるために自分と写すしかないと思い自撮り。2024年夏。6年かけて博士論文を書き終え、ロンドン大学から学位を与えられた。わたしにとってはこれが人生で初めて書いた論文である。 わたしはヴァイオリニストで、高校から修士課程まで音楽科に通ったため学位を決める大きな審査はいつも演奏による実技試験であった。ゆえに「人生でひとつも論文を書いたことがない」という状態から、「自分の第二言語で博士論文を書く」という無謀なことに挑んだわけだが、今回のポストでは、そんな「アカデミックライティングに長けているわけではなくかつ英語も流暢なわけではなかった」人間が、英語での論文を仕立てるためにつかったツールなどまとめる。 学部からわしわし論文を書いてきた人からすればとても幼稚でちゃんちゃらおかしい部分があるだろうし、もはやそこはお見逃しいただきたい。このポストは「こんなふうに力づくで書

                                                  英語博士論文執筆に使用したもの、あれこれ
                                                • 英語音声を自動で文字起こし ドコモが「Otter」のBusinessプランを発売

                                                  NTTドコモは、3月9日に法人向け音声認識AIサービス「Otter」でBusinessプランを販売開始した。 Otterは、Otter.aiが提供する英語音声の自動文字起こしサービス。AI技術を活用し、認識した英語音声をリアルタイムに高い精度でテキスト化できる。前後の文脈に合わせて文章を自動修正し、画像挿入・文字編集・ハイライト操作も行えるリッチノート機能も搭載。話し手を明確に識別してラベリングし、直感的な操作で議事録(会話音声)データを共有できる。利用料金は1アカウントで1年あたり3万3000円(税込み)で、日本円での請求書払いが選択できる。 有料のBusinessプランでは、会話録音データの一元管理や、チーム内での固有名詞/人名の単語登録・共有が可能となっており、使用状況に関する統計レポートの確認もできる。使用者数100人以上ではSSO(シングルサインオン)認証を適応でき、Zoomミー

                                                    英語音声を自動で文字起こし ドコモが「Otter」のBusinessプランを発売
                                                  • ChatGPT"以外の"使える「無料AIサービス」にデジタル音痴の40歳ライターが挑戦!!  - IT・科学 - ニュース

                                                    業務効率を上げる便利ツールが急増中! 問いかけると自然な言葉で回答を返してくれる対話型AI「ChatGPT」が話題を呼んで、はや半年。後を追うように、実用的な無料AIツールが続々登場している。実際どこまで使えるのか!? AIツールに詳しい識者にリストアップしてもらったものを、デジタルツールに苦手意識がある『週刊プレイボーイ』本誌ライターが手当たり次第使って検証してみた! * * * ■指示文なしで文章を作成!今回、実際に使ってみたツールは10個。いずれもAIツールに詳しい「ナギ-AI活用術×図解」さんに選んでもらったもので、基本無料だが利用回数の制限があるものが多く、そのほとんどは有料版が存在する。 最初に使用したのが「Notion AI」だ。これはメモやプロジェクト管理、スケジュール管理などができる多機能ツール「Notion」上で使えるAI機能で、文章の作成・添削・要約から、アイデア出し

                                                      ChatGPT"以外の"使える「無料AIサービス」にデジタル音痴の40歳ライターが挑戦!!  - IT・科学 - ニュース
                                                    • 触ってみたら…廉価版という認識を改めました! 十分に安い「Google Pixel 4a」の必要十二分な「性能」 | GetNavi web ゲットナビ

                                                      ディスプレイはPixel 4aのほうが若干大きいが、ほぼ同サイズ。プロセッサと外側カメラのスペックを抑えたことに加えて、ワイヤレス充電とジェスチャー機能「Motion Sense」を省いたことが、コストダウンにつながっていると言えるでしょう。 ↑Pixel 4(右)よりもPixel 4aのほうが若干小さいが、画面は広い。価格はPixel 4が8万9980円(税込)〜で、Pixel 4aは半額以下の4万2900円(税込) Pixel 4aを手にした印象は、とにかく軽いということ。Pixel 4の重さは162gですが、Pixel 4aはさらに軽い143g。ちなみに、4.7インチ画面のiPhone SE(第2世代)は148gなので、Pixel 4aの軽さは頭ひとつ抜きん出ている印象です。 ↑Pixel 4aのサイズは144×69.4×8.2mm。片手で楽に持てて、画面のほとんどの場所に指が届く

                                                        触ってみたら…廉価版という認識を改めました! 十分に安い「Google Pixel 4a」の必要十二分な「性能」 | GetNavi web ゲットナビ
                                                      • Munechika Nishida on Twitter: "・日本語による書き起こし ・話者を分割 ・録音ファイルからの処理 ・低コスト というのは日本語自動書き起こし周りでの課題ですが、 なんというか、まさか「ウェブ版のWord」でそれができるようになっていたというのは、「青い鳥はそこにすでにいた」感が強い。"

                                                        ・日本語による書き起こし ・話者を分割 ・録音ファイルからの処理 ・低コスト というのは日本語自動書き起こし周りでの課題ですが、 なんというか、まさか「ウェブ版のWord」でそれができるようになっていたというのは、「青い鳥はそこにすでにいた」感が強い。

                                                          Munechika Nishida on Twitter: "・日本語による書き起こし ・話者を分割 ・録音ファイルからの処理 ・低コスト というのは日本語自動書き起こし周りでの課題ですが、 なんというか、まさか「ウェブ版のWord」でそれができるようになっていたというのは、「青い鳥はそこにすでにいた」感が強い。"
                                                        • ドコモ、自動翻訳アプリ「はなして翻訳」の法人向けサービスを無料トライアル 電話の音声をリアルタイム翻訳

                                                          NTTドコモは9月7日から、自動翻訳アプリ「はなして翻訳」の法人向け「電話翻訳」の無料トライアルを開始した。トライアルは12月まで実施する予定で、その後は法人向け有料サービスとしての商用化を計画している。 はなして翻訳は、スマートフォンを通して話した言葉をお互いの母国語に翻訳できるアプリだ。英語、中国語、韓国語、ドイツ語、フランス語、イタリア語、スペイン語、ポルトガル語、タイ語、インドネシア語、ロシア語、ベトナム語、ミャンマー語の13言語に対応している。 電話翻訳機能は、NTTドコモ回線が必須で(※)、英語、中国語、韓国語の3言語に対応している。今回のトライアルでは、個人向けに提供している発信時のリアルタイム翻訳に加え、着信時のリアルタイム翻訳にも対応する。外国人からの予約受け付けや各種問い合わせ、外国人従業員との勤怠に関するやり取りなどで利用することを想定しているという。 トライアルに参

                                                            ドコモ、自動翻訳アプリ「はなして翻訳」の法人向けサービスを無料トライアル 電話の音声をリアルタイム翻訳
                                                          • Adobe MAX 2021 のアップデート、新機能まとめ | パソコン工房 NEXMAG

                                                            年に1度の恒例、アドビ主催のクリエイティブイベント「Adobe MAX 2021」が、米国時間10月26日〜28日(日本時間:10月27〜28日)にオンラインで開催。400以上のセッションやパフォーマンスが行われ、多くの開発者や有名人が登壇しました。今回は、NEXMAGでおなじみのアドビ製品群の新機能や注目ポイントを中心に、2021年のAdobe MAXの要点を押さえていきましょう。 ※本コンテンツはAdobe MAX 2021を踏まえて、2021年11月時点に基づく情報です。 PhotoshopやIllustratorにWeb版が登場 Adobe MAXでは、アドビの製品群を利用できるサブスクリプションサービス「Adobe Creative Cloud」(以下Adobe CC)の大幅アップデートが発表されるタイミングでもあります。最新バージョン「Creative Cloud 2022(C

                                                              Adobe MAX 2021 のアップデート、新機能まとめ | パソコン工房 NEXMAG
                                                            • Microsoft PowerPoint - 200901_「AI技術を活用した会議録等の文字起こし作業自動化による自治体業務の負荷軽減及び効果」に関する共同研究報告書ver4

                                                              つくば公共サービス共創事業 AI技術を活用した議事録等の文字起こし作業自働化による自治体業務の負荷軽減及び効果 つくば市 株式会社NTTデータ Copyright © 2020 City of TSUKUBA , NTT DATA Corporation つくば公共サービス共創事業及び本共同研究について 3 Copyright © 2020 City of TSUKUBA , NTT DATA Corporation つくば公共サービス共創事業とは つくば公共サービス共創事業(通称、「つくばイノベーションスイッチ」)とは、既に民間では導入が進ん でいる先端ICT技術が、まだ公共サービスの分野では導入が進んでいないことに着目して、それらの先 端ICT技術を、市民サービスの向上及び行政課題の解決等に資する新しい製品やサービスの創出 に結びつけるため、民間事業者等との共同研究を実施するものである

                                                              • iOS 17の新機能 - FaceTimeで留守録の送信が可能に - iPhone基本の「き」(581)

                                                                iOS 17では、FaceTime通話に相手が出ない場合、ビデオメッセージを収録して送ることができるようになりました。別のアプリに移動することなく、FaceTimeだけで完了するのでとてもお手軽です。 ビデオメッセージを収録する方法 FaceTimeは、相手をコールして一定時間が過ぎると自動的に発信が終了します。iOS 17ではこのタイミングでビデオメッセージの収録と送信ができるようになりました。 FaceTimeで相手を呼び出し、応答がないと自動的に発信が終了します。終了後、この画面が表示されたら[ビデオ収録]をタップします カウントダウンに続いて録画が開始されます。話し終えたら録画停止ボタンをタップ。録画を確認するには再生ボタン、録画し直す場合は[再撮影]をタップします。送ってよければ送信ボタンをタップします これで、相手のFaceTimeの着信履歴にビデオメッセージが添付される形にな

                                                                  iOS 17の新機能 - FaceTimeで留守録の送信が可能に - iPhone基本の「き」(581)
                                                                • CasualConc - CasualTranscriber

                                                                  CasualTranscriber は、いわゆるテープ起こし、文字起こし作業を効率よく行うためのユーティリティです。 macOS の音声認識機能を使った自動文字起こし機能を追加した新しいバージョン (2.7) をリリースしました。 基本機能として、 ショートカットによるメディアファイルのコントロール(デフォルトではスキップ以外は設定されていません。環境設定で指定してください。) リンク付きタイムスタンプ タグ入力補助機能 特殊文字入力補助機能 省略テキスト入力機能 YouTube ビデオの操作(共有が許可されている物に限る) 選択範囲のメディア抽出・保存 音量ブースト 再生速度調整 簡易 PDF スライドショー機能 少し特殊な機能としては、次のような物があります。 簡易波形表示 テキストデータベース機能 ファイルデータベース機能 字幕追加および、字幕の付いたメディアファイルの書き出し(Qu

                                                                    CasualConc - CasualTranscriber
                                                                  • 生成AIで定性調査を10Xする試み

                                                                    はじめに インタビューは定性調査の一環として重要性を持つ一方で、その分析には多大なコストと時間が必要となる。この記事ではPM DAOで取り組んだ、生成AIを活用したインタビューの定性分析方法の紹介をする。 課題 定性調査のコストと費用対効果 定性調査は詳細な情報を提供するが、その分析には時間とリソースが必要である。また、効果が直接的にわかりにくい場合もある。結果として、多くの場合、コストセンターとなりやすい。 実践スキルの不足と教育機会の限定 定性調査は一定のスキルと経験を求められるが、それを身につける機会は十分には存在しない。多くの人々が概念や手法を理解しているものの、実践できる人はおそらく少ない。 解決策 インタビューの自動書き起こしによる効率化 従来、インタビューの書き起こしは多くの時間と労力を必要としていた。しかし、AIを利用すると、インタビューの音声を自動的にテキストへと変換でき

                                                                      生成AIで定性調査を10Xする試み
                                                                    • Android版「Google翻訳」、音声を翻訳テキストとして表示する機能をまずは8カ国語で

                                                                      米Googleは3月17日(現地時間)、Android版「Google翻訳」アプリで、音声をテキスト化しながら翻訳する機能を向こう数日間でロールアウトしていくと発表した。 まずは、8つの言語(英語、フランス語、ドイツ語、ヒンディー語、ポルトガル語、ロシア語、スペイン語、タイ語)間での翻訳に対応する。 GIF動画を見ると、マイクから入力したオリジナル言語がまずはそのままテキストとして表示され、すぐに翻訳先の言語に変換されるのが分かる。 現時点では、静かな環境で1人が話す状況で機能するだけだが、今後改善していく。Googleアシスタントの「通訳モード」は日本語でも既に使えるが、長い音声には向かない。 新機能を使うには、最新バージョンのGoogle翻訳のホーム画面で「Transcribe」(文字起こし)ボタンをタップして表示される画面で翻訳したい言語と翻訳先の言語を選択し、マイクアイコンをタップ

                                                                        Android版「Google翻訳」、音声を翻訳テキストとして表示する機能をまずは8カ国語で
                                                                      • ウェブ会議とチャットを統合したコラボレーションツール「Parque」の無料提供が開始

                                                                        パルケは10月19日、ウェブ会議とチャット機能を併せ持つコラボレーションツール「Parque(パルケ)」の提供を開始した。利用は無料だが、有料プランの提供も予定している。 Parqueはウェブ会議とチャットやメモの機能を持つコラボレーションツール。アカウントを持っていないユーザーでもURLを共有することでビデオ会議に参加できる。このほか、同時編集できるメモ機能や会話内容の自動書き起こし機能、英語への自動翻訳機能なども実装している。 また、ビデオのフレームを丸型とすることで、背景の映り込みを抑える仕様としたのも特徴。

                                                                          ウェブ会議とチャットを統合したコラボレーションツール「Parque」の無料提供が開始
                                                                        • 【2023年1月の主要SNSニュースまとめ】X(Twitter)サードアプリの禁止を正式発表、米TikTok 禁止法採決調整ほか! « 株式会社ガイアックス

                                                                          a]:flex [&>a]:flex-row [&>a]:justify-between [&>a]:py-[18px] [&>a]:border-t [&>a]:border-lightgray [&>a]:border-opacity-20 [&_li]:my-1 [&_li]:list-['-_'] [&_li]:py-[18px] [&_li]:border-t [&_li]:border-lightgray [&_li]:border-opacity-20 [&_.Label]:transition-all [&_.Label]:w-fit [&_.content]:transition-all [&_.content]:h-0 [&_.content]:pt-0 [&_.content]:px-5 [&_.content]:overflow-hidden [&_.toggle:

                                                                            【2023年1月の主要SNSニュースまとめ】X(Twitter)サードアプリの禁止を正式発表、米TikTok 禁止法採決調整ほか! « 株式会社ガイアックス
                                                                          • Google Workspace、ハイブリッドワークを支援するAIを活用した新機能

                                                                            Googleは5月12日(米国時間)、Google Cloud blogにおいて、ハイブリッド ワークを支援する新たなAIとして、AIを活用したGoogle Workspaceの新機能を発表したと伝えた。同日、同社は年次開発者会議「Google I/O」をオンラインで開催し、さまざまな発表が行われた。 Googleの多くのユーザーから、ハイブリッド ワークによってメールやチャット、会議の数が増加したと意見が聞かれていることから、Google Workspaceの最新のAIイノベーションは、従業員が重要なことに集中し、安全にコラボレーションを行い、仕事のやり方や場所を越えた人とのつながりを強化できるように設計されているという。 重要なことに集中するための機能として、Google ドキュメントに自動生成による要約機能を導入。今後数カ月にかけて、スペースにも要約機能を拡張し、やり取りの要約も提供

                                                                              Google Workspace、ハイブリッドワークを支援するAIを活用した新機能
                                                                            • 「Windows 11」の意外に興味深い点と“アップグレード不可”の訳

                                                                              関連キーワード Windows 11 | Windows 10 | ビジネスPC MicrosoftのクライアントOS「Windows 11」が2021年10月に提供開始してからしばらくたったが、まだ導入していない企業は少なくない。そうした企業はWindows 11のOSとしての改善内容や導入方法などについて疑問を持っている。ただし通常、いずれはWindows 11への移行が不可避。OSをアップグレードすることによる利点と機能を理解しておく必要がある。移行できない理由もまた同じだ。 「Windows 11」に無関心でも興味深い? その利点と“移行不可”の理由 併せて読みたいお薦め記事 「Windows 11」にまつわる疑問のあれこれ Windows 10から「Windows 11」への移行は“高過ぎるライセンス”をやめる好機 Windows 11を素直に喜べない“端的な理由”はこれだ 「W

                                                                                「Windows 11」の意外に興味深い点と“アップグレード不可”の訳
                                                                              • tl;dvでZoom会議の議事録作成を自動化!使い方と設定方法を完全解説 | クラウド型RPA「AUTORO(オートロ)」 | AUTORO

                                                                                生産性向上に役立つ、AI自動書き起こしツール「tl;dv」の始め方や使い方を解説します。この記事を読んで、オンライン会議自動化ツールの活用をマスターしましょう! tl;dvとは?引用:https://tldv.io/ja/ tl;dv(Too Long; Didn’t View)とは、オンライン会議の録画・文字起こし・要約などが、無料かつ無制限で利用できるツールです。zoomやGoogle Meetにおける会議を効率化し、議事録作成などの自動化をサポートします。 tl;dvのよくある質問tl;dvの読み方は?「tl;dv」は、そのまま「ティーエルディーヴィー」と読みます。この名称は、”too long; didn’t view”の略で、「長すぎて、観てない」という意味が込められているようです。tl;dvの会議要約機能などと照らし合わせると、「いつものオンライン会議は長すぎて観てません」とも

                                                                                  tl;dvでZoom会議の議事録作成を自動化!使い方と設定方法を完全解説 | クラウド型RPA「AUTORO(オートロ)」 | AUTORO
                                                                                • chatGPTのプロンプトをすぐに呼び出せる!Clipyを絶対に導入すべき!|フリーランス名鑑

                                                                                  chatGPTをどのように活かすかで、ビジネスマンの生産性は大きく変わりそうですね。 chatGPTを使うには便利なプロンプトをいくつ知っているかが大切です。 例えば、何かを聞き出すときも 「あなたは〇〇です。その前提で私の質問に答えてください。 もし完全な答えを出すのに必要な情報がある場合は、私に質問をしてください。分からないものを推測で答えないようにしてください。」 〇〇の中に編集者やソフトウェアエンジニアなど自分が聞きたい分野の役職を入れることで、より精緻な情報を得ることができます。(chatGPTは確率的に次にこの言葉が来るべきだ、というのを計算して出しているだけなので、前提条件をしっかり書いて、限定された空間の中から言葉を出力した方が欲しい情報が手に入ります。) ただ、上記のような文章をどこかにメモしておいて、そこに行って、コピーしてchatGPTにペーストするのは面倒ではないで

                                                                                    chatGPTのプロンプトをすぐに呼び出せる!Clipyを絶対に導入すべき!|フリーランス名鑑