並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 173件

新着順 人気順

文字起こし googleの検索結果1 - 40 件 / 173件

  • 急に仕事で英語を使うことになった社会人に贈るまとめ(便利ツール/コンテンツ) - Qiita

    急に仕事で英語を使うことになった社会人に贈るまとめ(便利ツール/コンテンツ/勉強本) 新規案件参画初日。 Goやk8sを使えることなってワクワクしていたあの日、 参画してすぐにチーム内のエンジニアで日本人が自分以外に一人であること、 それ以外のチームメンバー全員が外国籍のメンバーになることを知らされた そこのあなた! 数年前の私です(笑) さらに2ヶ月後には、開発チームで唯一の日本人になって死にそうになりました。 その時は突然にやってきます。 当時、私の英語の経験というと大学受験の対策のみと言っていいほどで、 そこから10年以上経過していたため、高校英語すらも怪しい状態でした。 英語学習を開始して 半年ほど経過した時のレベルがTOIEC450程度だったので、学習開始当初はおそらく400点を切っていたレベルであると思います。 そこから英語学習を開始し、2年ほど経過した今では、便利ツールを活用

      急に仕事で英語を使うことになった社会人に贈るまとめ(便利ツール/コンテンツ) - Qiita
    • ChatGPTを業務に組み込むためのハンズオン.pdf

      ChatGPTを業務に組み込むためのハンズオン 2023/06/26 一般公開用 デジタル庁 Fact&Data Unit 大杉直也 ↑マイナンバー交付数のダッシュボードを作っているところです 「Microsoft でテストされたアイデアのうち、改善を示すメトリクスを実際に改善できたのは3分の1にすぎない」 (Microsoft社 元Vice President) 「もしあなたが実験主導のチームにいるなら、70%の仕事が捨てられることに慣れてください。それに応じてプロセスを構築しましょう」(Slack社 Director) A/Bテスト実践ガイド p14より 一方で 「アイデアの価値を見積もることは難しい。このケースでは、年間1億ドルの価値ある単純な変更が何か月も遅れていた。」(同著 p5より) こともあります 午前中のアイデアソンで出たアイデアはちゃんと検証するまで価値があるかは不明です

      • 【2024年最新】共通テストを色んな生成AIに解かせてみた(ChatGPT vs Bard vs Claude2)|株式会社LifePrompt

        2023年の流行語大賞にも選ばれた「生成AI」。 ChatGPTだけでなく、Google BardやClaude2など似たようなAIチャットボットも登場し、性能も日に日に上がっている感覚がありますね。 しかし、結局どれが一番賢いんだろう?と思いつつひとまずChatGPTを使っている方も多いはず。 そこで、今どのチャットAIが一番頭良いのか白黒つけてしまおう!ということで、ちょうど週末に行われた大学入試共通テスト2024を使って学力テストを行いました! 参加する学生は、 ①GPT-4くん ②Google Bardちゃん ③Claude2さん の三名です 果たして誰が学力王の座に輝くのか・・・? 選手入場①GPT-4くん一人目は、皆さんご存じChatGPTです。Open AI予備校に月額$20の課金して学力武装しています。 特徴としては、プロンプトの研究が進んでおり、画像やPDFファイルの読み

          【2024年最新】共通テストを色んな生成AIに解かせてみた(ChatGPT vs Bard vs Claude2)|株式会社LifePrompt
        • Advanced Data Analysis(旧ChatGPT Code Interpreter)の活用方法を片っ端から試していく

          Advanced Data Analysis(旧ChatGPT Code Interpreter)の活用方法を片っ端から試していく ChatGPT Code Interpreterをとにかく触ってみる 「Code Interpreterが凄い!」と、みんなが騒いでいるのでとりあえずネットで目についた活用方法を片っ端から試していきたいと思います。 試したら追記していきます。 Code Interpreterのセットアップ 以下3ステップです。簡単ですね。よく分からなかったら別のサイトみてください。 ChatGPT Plusに課金 Setting Beta featuresでCode interpreterのトグルをオン ChatGPTのGPT4でCode Interpreterを選択 以下参考のスクリーンショットです。 Code Interpreterの活用例 ここから活用例を載せていきます

            Advanced Data Analysis(旧ChatGPT Code Interpreter)の活用方法を片っ端から試していく
          • 「英語仕事効率化」のための必携ツール7選: DeepL、Grammarly、Quillbotなどの活用方法 - ENGLISH JOURNAL

            英語を活用する仕事に関連するツールの中から、特に人気で効率的な7つをピックアップ。DeeplとGrammarlyの併用方法やQuillbotの使い方、そしてOtter.aiでの仕事効率化のコツなど、多様なニーズに応える情報を詳しく解説します。 英語の仕事効率化に役立つツール7選: 効率&品質アップの秘訣DeepL:外部翻訳支援ツールと連携、AI 翻訳のマストツールhttps://www.deepl.com/ 訳文の自然さで知られるAI翻訳ツール。対応言語は30弱、全部で700の組み合わせの翻訳が可能となっている。SNSや掲示板などの生の対話から学習をしているため、非常に今日性の高い訳文が取得できると評判だ。それ故に、時折過剰にネットスラング的な表現が提案されることもあり、「常に正確性の高い英文が取得できるわけではない」ということは認識しておきたい。 ブラウザ版とデスクトップ版(Window

              「英語仕事効率化」のための必携ツール7選: DeepL、Grammarly、Quillbotなどの活用方法 - ENGLISH JOURNAL
            • メモアプリ最強候補「Google Keep」。その魅力を3つのポイントで紹介 | ライフハッカー・ジャパン

              皆さんはGoogle Keep、使っていますか? メモアプリにはたくさんの選択肢があるので、ベストなものを探すのが面倒になってしまったり、妥協で同じものを使い続けている人もいるかと思います。 そんな人に、まず一度試してもらいたいのがGoogle Keepです。 なんと言ってもGoogleが提供するサービスですので、汎用性・拡張性はピカイチ。 今回はそんなGoogle Keepが思わず使いたくなる便利なポイント3つをご紹介します。 1. データ同期がとても便利Google Keepは、Googleのエコシステムに欠かせない存在。 ですので、デバイス間での同期はもちろんのこと、Googleドライブなど、Googleが運営するさまざまなサービスでコンテンツを簡単に共有することができるのです。 たとえば、Google Keep→Google ドキュメントへのコピーも簡単。出先や移動中にスマホでつく

                メモアプリ最強候補「Google Keep」。その魅力を3つのポイントで紹介 | ライフハッカー・ジャパン
              • エンジニア兼作家が東京都知事選挙の出馬表明記者会見をした会見全文|安野たかひろ

                昨日、都庁にて出馬表明記者会見を行いました。会見の全文を文字起こししたものを公開いたします。 会見全文本日は大変お忙しい中、急な呼びかけにもかかわらずお集まりいただきありがとうございます。 私、安野たかひろは、7/7に行われる東京都知事選挙に立候補いたします。本日は1)私が出馬に至った理由2)注力したい政策3)選挙期間中に行う3つの日本初のキャンペーンについてお話させていただきます。 自己紹介まず簡単に自己紹介をさせてください。私はこれまでに、3つの職業を経験してきました。1つはソフトウェアエンジニア、AIに関するエンジニアをしていました。2つ目は起業家です。AIスタートアップの経営者として、ユーザーにプロダクトの提供をしてきました。3つ目は作家です。主にSF、サイエンスフィクションを書いています。いくつもの職業をばらばらと経験してきたように感じる方もいらっしゃるかもしれませんが、実際には

                  エンジニア兼作家が東京都知事選挙の出馬表明記者会見をした会見全文|安野たかひろ
                • ビジネスとオープンソースの狭間で 〜 Embulk の場合 (前編)

                  2023 年はビジネスとオープンソースの関係が難しくなった年であったように思います。 6 月には、フルタイムの Ruby コミッターとして研究開発を行っていたお二人がクックパッド社の人員削減の影響を受けたことに端を発して、オープンソースに深く関わってきた一部のソフトウェア・エンジニアを中心に、ビジネスとオープンソースの関係について議論がありました。 8 月には HashiCorp 社が自社のオープンソース製品群のライセンスを Business Source License 1.1 (BSL) に変更したことも話題になりました。 また 2023 年は、一年を通して大規模言語モデル (Large Language Models; LLM) が話題になった年でもあり、ビジネスにも大きな影響がありました。 大規模言語モデルとオープンソースの関係に焦点を絞っても、「非オープンソースのライセンスで公開

                    ビジネスとオープンソースの狭間で 〜 Embulk の場合 (前編)
                  • [速報]Google、AIが支援してくれる「Duet AI」サービス群を多数展開へ。Google WorkspaceやBigQuery、Looker、Meet、Chatなど。Google Cloud Next '23

                    [速報]Google、AIが支援してくれる「Duet AI」サービス群を多数展開へ。Google WorkspaceやBigQuery、Looker、Meet、Chatなど。Google Cloud Next '23 Googleは、8月29日(日本時間の30日未明)から米サンフランシスコで開催中のイベント「Google Cloud Next '23」で、AIが人間の作業を支援してくれる「Duet AI」サービス群を多数発表しました。 同社が提供するオフィススイート製品であるGoogle Workspaceをはじめ、大規模データ分析サービスのBigQuery、オンライン会議サービスのGoogle Meet、チャットサービスのGoogle Chatなど、多数のサービス向けにAIによる支援サービスが展開されます。 オフィスツールから開発、運用、セキュリティ対応まで支援 今回発表されたものとすで

                      [速報]Google、AIが支援してくれる「Duet AI」サービス群を多数展開へ。Google WorkspaceやBigQuery、Looker、Meet、Chatなど。Google Cloud Next '23
                    • エイプリルフールに便乗しているサイトまとめ2024年版

                      By ほしのるる 毎年おなじみのエイプリルフールが今年も始まりました~!どれが本当でどれがウソなのか、もしかしたらネタのふりをしているだけでマジなのではないか?というようにして現実と虚構が溶け合っていくカオスな一日のはじまりはじまり~。 ◆エイプリルフールのネタのタレコミのやり方 この記事中に未掲載のネタで「エイプリルフールやってる!」というのを発見したときや「うちもエイプリルフールをやってます!」という自薦の連絡はネタのタレコミ用メールフォームから送信してもらえればOKです! ・掲載されやすくなる押さえるべきポイント GIGAZINE編集部員がサイトを見に行っても「どれがエイプリルフールのネタなのだ……?」ということで瞬時に判断できない&ネタの意味がわからず記事化をあきらめてしまうしかない……となったり、「どこかがいつもと違うらしいが元のサイトの状態を知らないので、どこがどう変化したかま

                        エイプリルフールに便乗しているサイトまとめ2024年版
                      • 俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ

                        こちらはエムスリー Advent Calendar 2023 1日目の記事です。 Overview エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。趣味は麻雀でフリー雀荘で毎年200半荘以上打ちます。好きな麻雀プロは園田賢さんです。 麻雀を始めるときに一番の障壁になるのは点数計算ではないでしょうか? 特に符計算が初心者の関門のようです。一方私のような初中級者でも突然のレアな点数申告にまごつくことがあります。 そこで、今回はその人に合った麻雀の点数計算問題(主に符計算が焦点となる問題)を生成して、自分で点数計算&点数申告の練習をする方法を探求したのでその紹介をします。麻雀用語が少しだけ登場するので、対象読者は麻雀を少しでもかじったことのあるエンジニアの方です。 Overview 麻雀の点数計算の難しさ 現状の点数計算の練習

                          俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ
                        • 身近なBtoCサービスを支えるアーキテクチャ大解剖 技術選定のポイントと今後の展望 - Findy Tools

                          公開日 2024/06/18更新日 2024/06/18身近なBtoCサービスを支えるアーキテクチャ大解剖 技術選定のポイントと今後の展望 多くのIT企業では、ユーザーに対してより高品質で安定した体験を提供するために、システムアーキテクチャを進化させ続けています。 本特集では、日常生活の中で多くのユーザーに利用されているサービスのアーキテクチャ設計に携わるエンジニアの方々から、技術選定の背景や意図、そして現在のアーキテクチャの課題から未来への展望まで、詳しく伺いました。この記事を通じて、各企業のエンジニアたちがどのように技術的な課題を克服し、システムの柔軟性と効率を高めているのか、知見を得ていただければ幸いです。 ※ご紹介は企業名のアルファベット順となっております アソビュー株式会社 アソビュー株式会社では「遊び」という領域に対し、マーケットプレイス型EC「アソビュー!」やD2C型SaaS

                            身近なBtoCサービスを支えるアーキテクチャ大解剖 技術選定のポイントと今後の展望 - Findy Tools
                          • トランプは良いこともするのか? - himaginary’s diary

                            サマーズが第二次トランプ政権の危険性について深刻な懸念を表明している。 以下は12/20ツイート。 The @FT's Unhedged asked me about the macroeconomic implications of a second Trump term: When you have a president who challenges the results of elections and brags about what he could do in one day as a dictator, it is not something that can be completely relied on. That is a profound threat to our long-run prosperity, and therefore short-run asse

                              トランプは良いこともするのか? - himaginary’s diary
                            • アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援

                              アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援 アトラシアンは、同社製品およびGoogleドライブやGitHubなどサードパーティのサービスを横断してAIが情報を学習し、統合的な検索やチャットによる回答を実現することでユーザーを支援してくれる新しいAIサービス「Atlassian Rovo」を発表しました。 AI breaks down yet another barrier! Today at Team '24 we announced Atlassian Rovo – a new product that unleashes a company’s knowledge so teams can make better decisions faster.

                                アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援
                              • 田渕 豊 (超伝導量子計算システム工学) - 講演録-23Aug

                                特別感謝→ 文字起こし:Notta.ai @大阪/23年8月講演 カッコ内は、講演中に突発的に喋って分かりにくくなったものをカッコで括ったり、意味を後で補ったものです。 皆さんこんにちは。理化学研究所の量子コンピュータ研究センターにいる田渕と申します。今日よろしくお願いいたします。ちょっとですねどんな話をしようかなって迷ったんですけれど、量子コンピュータはとりあえず面白いよと。面白いっていうのさえ伝われば、今日は成功だと思いましょう。 はいちょっと私の自己紹介から始めます。私出身が岡山県でして岡山県の倉敷市というところで、石油化学コンビナート中で生まれています。そこでは石油化学であったりと製鉄があったりと、すごい工業の盛んな町です。私は興味持ったのはああいうコンピュータですね。デジタルコンピュータで小さい頃から昔の古いハチハチを与えてもらって、10年もの前のコンピュータを与えられた私はこれ

                                  田渕 豊 (超伝導量子計算システム工学) - 講演録-23Aug
                                • superwhisperでの音声入力を試す

                                  superwhisperという、whisper.cppを使った音声入力ができるmacOSアプリケーションを最近使っています。 基本的にはggerganov/whisper.cppのモデルを使って、音声認識しながら文字入力ができるアプリケーションです。 特徴 Whisperの認識精度が高い かなり早く喋っても認識してくれる 日本語も認識してくれるモデルがある 日本語で喋って英語に翻訳してくれる機能もある オフライン対応 有料: サブスク と 買い切り の2種類のプランがある 無料で15分のトライアル、その後は選べるモデルが制限される 公式サイトのデモをみると、かなり早く喋っても認識してくれるのがわかります。 大抵の人にとっては、多分文字入力するよりしゃべったほうが早いぐらいの入力速度が出ると思います。 superwhisper 長文はそこまで得意じゃないけど、1行とか2行ぐらいの文章はかなり

                                    superwhisperでの音声入力を試す
                                  • 【2024年】AWS全サービスまとめ | DevelopersIO

                                    こんにちは。サービス開発室の武田です。このエントリは、2018年から毎年公開しているAWS全サービスまとめの2024年版です。 こんにちは。サービス開発室の武田です。 このエントリは、2018年から毎年公開している AWS全サービスまとめの2024年版 です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの?」という疑問を自分なりに理解するためにまとめました。 今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2023年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 247個 です。 まとめるにあ

                                      【2024年】AWS全サービスまとめ | DevelopersIO
                                    • 「ブログで稼ぐ」の昔と今 - とまじ庵

                                      数日前に「ブログの真実」を近々書くよ~っていう予告的な独り言的な記事を書かせていただきました。 tomag.hatenablog.com ということでみなさま楽しみにしていると思うので(ぇ?してない?)約束通り記事にしていこうと思いますw ブログバブルは夢のような時代 この記事に該当するブログの種類について 物販はクリックされても買われない時代へ 独自ドメインの優位性終了? 信じられるのはAdsenseだけ トップページは作り込んでも無駄 はてなブログの関連記事は優秀 まとめ ブログバブルは夢のような時代 今から7~8年前。西暦でいうと2016~2018年くらいの頃はブログバブルなんて呼ばれていて猫も杓子も「ブログで◯十万儲けました~♪」なんて雄叫びをあげていた時期。 はてなブックマークも全盛の頃でちょっと炎上系の記事を書いて100を超えるブクマが付きでもすれば数万のアクセスが殺到。それに

                                        「ブログで稼ぐ」の昔と今 - とまじ庵
                                      • AppleがWWDC24でパクったアプリまとめ

                                        AppleはWWDC24でiOS 18・iPadOS 18・macOS Sequoia・watchOS 11などの最新OSと、iPhone・iPad・Macで使えるパーソナルAIのApple Intelligenceを発表しました。AppleがWWDC24で発表した最新OSや新機能の中には既存アプリの模倣も多く存在しているとして、海外メディアが「Appleがパクったアプリ」をまとめています。 The apps that Apple sherlocked at WWDC 2024 | TechCrunch https://techcrunch.com/2024/06/12/the-apps-that-apple-sherlocked-at-wwdc/ Here are the apps Sherlocked by Apple during WWDC 2024 - 9to5Mac https:

                                          AppleがWWDC24でパクったアプリまとめ
                                        • ついにYouTubeがAIによる「自動翻訳吹き替え」機能を搭載へ

                                          Googleの社内スタートアップ部門であるArea 120の一部である「Aloud」は、AIによる音声・ムービーの文字起こしや吹き替えを研究しています。YouTubeがAloudからAIによる自動翻訳吹き替えに関する研究チームを引き継ぎ、同機能を2024年までに搭載することを2023年6月22日に発表しました。 Aloud - dubbing for everyone https://aloud.area120.google.com/ YouTube is getting AI-powered dubbing - The Verge https://www.theverge.com/2023/6/22/23769881/youtube-ai-dubbing-aloud 実際にYouTubeの吹き替え機能がどんな感じなのかは、以下のムービーでチェックすることができます。 Aloud: Let

                                            ついにYouTubeがAIによる「自動翻訳吹き替え」機能を搭載へ
                                          • 「Google Keep」がアップデート! 文字起こし、録音、リッチテキスト、新機能は何がすごい?【今日のワークハック】 | ライフハッカー・ジャパン

                                            「これ、マストだわ」モニター購入して気づいた、あったほうがいい周辺機器4選 #Amazon新生活セール

                                              「Google Keep」がアップデート! 文字起こし、録音、リッチテキスト、新機能は何がすごい?【今日のワークハック】 | ライフハッカー・ジャパン
                                            • 生成AIの活用事例 10選|masa_kazama

                                              「テクノロジーで人々を適切な医療に案内する」をミッションに、医療プラットフォームを提供しているUbie株式会社の@masa_kazamaです。 この記事は#Ubieアドベントカレンダー5日目にエントリーしています。 今年は生成AI一色の1年でした。Ubieでは、生成AIをプロダクト活用と社内生産性向上の観点で取り組んでいます。(取り組みの詳細は、こちらの記事で紹介しています。) この記事では、社内生産性向上観点で、社内の業務プロセスに溶け込んでいて、なくてはならない使い方になっている事例を10個ご紹介します。その中のいくつかは、実際に生産性が倍以上になっていたり、外部委託のコストが半分になったりしています。この記事が、生成AIを活用している人や活用していきたい人のご参考になれば幸いです。 プロダクト活用にもいくつか事例が出ており、問診の内容を大規模言語モデル(LLM)を活用して要約する機能

                                                生成AIの活用事例 10選|masa_kazama
                                              • 100万時間以上のYouTube動画をOpenAIがAIモデルのトレーニングに利用していたことが判明

                                                OpenAIが、AIモデルのトレーニングに用いるために100万時間を超える分量のYouTube動画をダウンロードして利用していたことがThe NewYork Timesの指摘でわかりました。なお、YouTubeと同じ親会社AlphabetのもとにいるGoogleは、OpenAIの行為に気付いていましたが、自分たちも独自のAIモデルのトレーニングにYouTubeの動画を活用していたため、行動を起こさなかったとのことです。 How Tech Giants Cut Corners to Harvest Data for A.I. - The New York Times https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html Google reporte

                                                  100万時間以上のYouTube動画をOpenAIがAIモデルのトレーニングに利用していたことが判明
                                                • ブルアカ エデン条約3章 グローバル版セリフ比較 (ネタバレ注意)

                                                  블루 아카이브의 핵심, "결국은 학원과 청춘의 이야기" | 웹진 인벤 - 인벤 https://m.inven.co.kr/webzine/wznews.php?idx=275674&iskin=webzine&lbTW=1bac9f62372f87ca6bd90c293c4a2d0 ブルーアーカイブ エデン条約3章 グローバル版のローカライズにあたり、クライマックスのセリフに変更が加えられている。 ニュアンスの調整目的のようだが、結構違う構成になっているように感じた。記事によると再録までしたらしい。 [블루 아카이브] 에덴조약 3장 히후미 일본서버/한국서버 대사 비교(エデン条約編 3章 ヒフミ 日本サーバー/韓国サーバー 代謝の比較 - YouTube https://www.youtube.com/watch?v=VVBUS1_GEKU 以下文字起こし 日本Ver グロ

                                                    ブルアカ エデン条約3章 グローバル版セリフ比較 (ネタバレ注意)
                                                  • 【2024年1月】エンジニアなら読むべき技術書TOP5 - Qiita

                                                    世界一流エンジニアの思考法 noteでも大人気! 米マイクロソフトのエンジニアが放つ最前線の仕事術 頭が先、手は後。一流の仕事のカギは順序にある。 ――楠木建(経営学者) 知的生産へのリスペクトがイノベーションの源泉だ。 ――落合陽一(メディアアーティスト) 「怠惰であれ!」「早く失敗せよ」―― 米マイクロソフトの現役ソフトウェアエンジニアの著者が、超巨大クラウドの開発の最前線で学んだ思考法とは? “三流プログラマ”でもできた〈生産性爆上がり〉の技術! ・試行錯誤は「悪」。“基礎の理解”に時間をかける ・より少ない時間で価値を最大化する考え方とは? ・「準備」と「持ち帰り」をやめて、その場で解決する ・マルチタスクは生産性が最低なのでやらない ・“脳の負荷を減らす”コミュニケーションの極意 ・コントリビュート文化で「感謝」の好循環を生む……etc. 仕事と人生を「自分の手でコントロールする

                                                      【2024年1月】エンジニアなら読むべき技術書TOP5 - Qiita
                                                    • Googleが音声から「テキストと音声の両方」に翻訳できる大規模言語モデル「AudioPaLM」を発表

                                                      Googleが「AudioPaLM」を発表しました。AudioPaLMはテキストベースの言語モデルである「PaLM 2」と音声ベースの言語モデルである「AudioLM」を統合したマルチモーダルアーキテクチャであり、テキストと音声を処理・生成し、音声認識や音声翻訳などのアプリケーションに利用できるとのことです。 [2306.12925] AudioPaLM: A Large Language Model That Can Speak and Listen https://doi.org/10.48550/arXiv.2306.12925 AudioPaLM https://google-research.github.io/seanet/audiopalm/examples/ AudioPaLMは、AudioLMから話す速さ、声の強さ、高さ、沈黙、イントネーションなどのパラ言語情報を保持する

                                                        Googleが音声から「テキストと音声の両方」に翻訳できる大規模言語モデル「AudioPaLM」を発表
                                                      • Google にメールを届けるために 2023 冬 | IIJ Engineers Blog

                                                        2015 年新卒入社。途中、2年ほど IIJ Europe に出向経験もあるが SMX の中の人として長年スパムメールと奮闘中。M3AAWG, JPAAWG にも参加し始め、メッセージングエンジニアとして頑張ってます。最近の趣味はぶらり都バス旅。 Google, Yahoo の Sender Guidelines について 前回、こんな記事を書いたもののいくつか説明を端折っていた部分があったので再度文字起こしをします。 # さらに、前回字面が強めだったので今回はもう少し優しめにします。 改めまして、IIJセキュアMX サービスの中の人、今村です。 師走に入り、気づいたらインフルエンザにかかり、、記事を公開するのに時間がかかってしまいました。 (みなさんもお気をつけください。) さて、2024/02 から Google, Yahoo! に一部のメールが受け取ってもらえなくなりますが、メール送

                                                          Google にメールを届けるために 2023 冬 | IIJ Engineers Blog
                                                        • 話題の日本酒「ソースコード」を読んで(飲んで)みた | DevelopersIO

                                                          こんにちは、AWS事業本部@福岡オフィスのべこみん(@beco_minn)です。 早速ですが皆さん、日本酒は好きですか?私はほぼ毎週近所の酒屋さんに買いに行くぐらい大好きです。 つい最近、こんな日本酒がSNSで話題になっていました。 「自分好み」を読み解いてシステムエンジニアに捧ぐ日本酒 クリアな飲み口に、豊かなお米の旨みが溢れ出る上質な味わい。料理と合わせても、様々な温度帯でも楽しめる1本に、思わず誰もが「自分好みの楽しみ方」を探してしまう。「読み解きたくなるロジック」が詰め込まれた、システムエンジニアたちに飲んでほしい純米吟醸酒です。 とのこと。 はい、買いました。ラベルのソースコードが気になったというのもあるんですが、純粋に味が気になったので買ってみました。 本記事では味の感想含め、ラベルの内容についても触れたいと思います。 飲んでみた コードの解読前にまずは飲んでみます。お酒は飲ん

                                                            話題の日本酒「ソースコード」を読んで(飲んで)みた | DevelopersIO
                                                          • 【無料】高精度&爆速で文字起こしが終わるAIツール「Gladia」がスゴイ | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

                                                            こんにちは、インハウスマーケティング部のかけるです。 生成AIによってライティング業務の効率化が進むなかで、「文字起こし」は生成AIが得意とする領域の一つです。 今回は数ある文字起こしAIのなかでも、実際に使ってみて良かった文字起こしAI「Gladia」について、その使い方や魅力をご紹介します! 「Gladia」は精度が抜群 https://www.gladia.io/ まず前提として、Gladiaの文字起こしの技術には、OpenAIがオープンソースとして公開している文字起こしAI「Whisper」が活用されています。 Gladiaの大きな魅力は、なんといっても音声から文字を起こす(Speech-to-Text)際の精度の高さです。 一般的に、音声認識の精度は「単語誤り率 (WER)」という、その音声認識モデルが音声をテキストへ変換する際にどれぐらい間違えてしまったのかという評価尺度があり

                                                              【無料】高精度&爆速で文字起こしが終わるAIツール「Gladia」がスゴイ | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
                                                            • 誰でも書ける『Web記事』の作り方|記事作成編 - イーアイデム「ジモコロ」

                                                              こんにちは! バーグハンバーグバーグ編集部です。 新人ライターさんから編集部によく寄せられる「どうやって記事を作ればいいですか!?」という声。 そこで、どんな人でも書けるようになる『Web記事の作り方』を、前回まで2回にわたって解説してきました。 今回は、実際に記事を作成する段階のコツを解説します! 今までと同じく、ジモコロ編集部のギャラクシー(左)と加藤(右)が、新人ライター瀬戸はるかさんに、解説する形で進めます! ▼登場人物 WEBライター|瀬戸はるか フリーの新人ライター。取材やインタビューはほぼ未経験。 ジモコロ編集長|ギャラクシー 雑誌の編集、通販番組の脚本を経てWEB編集者に。【ギャラクシーが書いた記事】 WEB編集者|加藤亮 編集プロダクションで編集とライティングを学んだ。【加藤が書いた記事】 文字起こしについて インタビューを記事にする時、自分でやってみて思ったのが、とにか

                                                                誰でも書ける『Web記事』の作り方|記事作成編 - イーアイデム「ジモコロ」
                                                              • OpenAIが「Sora」の学習にYouTube動画を使ったとすれば違反──YouTubeのモーハンCEO

                                                                米Google傘下のYouTubeのニール・モーハンCEOは4月4日(現地時間)、米Bloombergとのインタビューで、米OpenAIがもし自社のAIモデルのトレーニングにYouTube動画を使っているとすれば、それはYouTubeポリシーの「明らかな違反」になると語った。 OpenAIのミラ・ムラティCTO(最高技術責任者)は3月、米Wall Street Journalとのインタビューで、2月に発表した動画生成AIモデル「Sora」のトレーニングにYouTube、Facebook、Instaramなどの動画を使ったかどうか問われ、分からないと答えた。 モーハン氏は「クリエイターが努力して作った成果をYouTubeにアップロードするとき、彼らは利用規約が順守されると信じている」ので、「トランスクリプト(文字起こし)や動画などのダウンロードは許可されておらず、それは明らかな違反だ」と語っ

                                                                  OpenAIが「Sora」の学習にYouTube動画を使ったとすれば違反──YouTubeのモーハンCEO
                                                                • 毒親ブームと「宗教2世」問題|ダッヂ丼平

                                                                  はじめに20世紀のイギリスを代表する宗教社会学者ブライアン・ウィルソンは、1997年に来日した際、東洋哲学研究所が開催したセミナーで世界中の新宗教が共通して直面する課題について講演した。この講演の中で列挙された問題の大半は、新宗教が社会から受けるさまざまな攻撃と関連している。いうなればこの講演録は、一般社会の敵意と偏見が引き金となって新宗教に降りかかる困難を詳細にリストアップしたものだ[ウィルソン1998]。 このリストに挙げられているものの中で、特筆すべきなのはマスメディアの報道が引き起こす害悪と、背教者たちの語る残虐な話の2つである。背教者というのは新宗教研究における学術用語であり、かつて所属していた教団に敵対し、批判を熱心におこなう元信者を指して用いられる。 そして残虐な話とは、過去に所属していた教団がいかに酷い団体であるかを社会に訴える目的に特化した、虚偽の内容も含まれるようなバイ

                                                                    毒親ブームと「宗教2世」問題|ダッヂ丼平
                                                                  • NotebookLM を日本語でも提供開始。ウェブサイトや Google スライドにもサポート

                                                                    昨年の夏、Google は AI を活用したリサーチや執筆する際のアシスタントである NotebookLM を発表しました。そして本日より、 Google Labs で Gemini 1.5 Pro を搭載した更新版の NotebookLM を日本語を含む言語で 200 以上の国と地域に順次提供します。 私たちが NotebookLM で目指してきたのは、複雑な資料を理解して精査し、情報から新しい類似性を見つけ、下書きなどをすばやく作成するのに役立つツールの開発です。研究論文や取材記録、仕事でのドキュメントなどの参照文献(ソース)をアップロードすると、NotebookLM がそれらの重要な資料を理解し、必要なサポートを提供します。また、本日からお使いいただける NotebookLM では、英語で提供していたものから更新し、いくつかの新機能も導入します。 Google ドキュメント、PDF、

                                                                      NotebookLM を日本語でも提供開始。ウェブサイトや Google スライドにもサポート
                                                                    • ChatGPT と Whisper で発音練習アプリを作ってみた - NTT Communications Engineers' Blog

                                                                      この記事は NTTコミュニケーションズ Advent Calendar 2023 の15日目の記事です。 この記事では、ChatGPT と 音声認識モデルの Whisper を用いた発音練習アプリケーションをご紹介します。 ChatGPT に読み上げる文章を考えてもらい、その文章の読み上げた音声を Whisper で文字起こしします。 正確に発音できていれば、正確に文字起こしできる、という考えから、 原稿と文字起こし結果を比較すれば発音練習に使えるのではないかと考えました。 実際に使ってみた結果、発音のどこが悪かったのかといったフィードバックはもらえませんが、 自分の発話した音声に対して評価がつくだけでも、結構楽しく練習できると感じました。 音声認識を活用したアプリケーションは、一般に音声認識精度がネックになると思いますが、 このアプリケーションは音声認識精度が100%ではないことを逆手に

                                                                        ChatGPT と Whisper で発音練習アプリを作ってみた - NTT Communications Engineers' Blog
                                                                      • 生成AI専門メディア「PROMPTY」を運営する株式会社Bocek、国内外の生成AI関連サービス207社をまとめた「生成AI関連サービスカオスマップ 2023」を公開

                                                                        生成AI専門メディア「PROMPTY」を運営する株式会社Bocek、国内外の生成AI関連サービス207社をまとめた「生成AI関連サービスカオスマップ 2023」を公開 生成AIメディア「PROMPTY」を運営し、生成AIの導入をワンストップで提供する生成AI特化戦略コンサルティングファームである株式会社Bocek(本社:東京都大田区、代表:沖村 昂志)は、生成AI基盤チャットボットや画像生成AIなど、生成AIに関連する企業やサービスをカテゴリ別にまとめた「生成AI関連サービスカオスマップ 2023」を発表しました。 カオスマップ公開の背景 東京都が生成AI ChatGPTのガイドラインを発表し、全局で業務利用を開始するなど、生成AIの急速な普及に伴い、企業における生成AI導入が加速していると言えます。 弊社で運営する生成AIメディア『PROMPTY』や弊社の主力事業である生成AI特化のコン

                                                                          生成AI専門メディア「PROMPTY」を運営する株式会社Bocek、国内外の生成AI関連サービス207社をまとめた「生成AI関連サービスカオスマップ 2023」を公開
                                                                        • PixelからiPhoneに戻してみて思ったこと

                                                                          新生活に華を。 Google製のスマートフォン、Pixel 7 Proを使い始めて1年も経たないうちに何度も落としてしまい、最終的には壊してしまいました。海外にいたため修理不可能でした。 その後、日本へ帰ってきてすぐに表参道のアップルストアのきらびやかな照明に蛾のごとく引き寄せられ、iPhone 13を衝動買いしました。Pixel 7 Pro以前はiPhone 12 miniを使っていたので、出戻りしたとも言えます。 以下、iPhoneに回帰したメリットとデメリットについてお伝えします。 iPhone 13を買ってよかったことなぜiPhone 13を選んだのか。実は、当初狙っていたのはiPhone 13 miniでした。 しかし、ストア内に在庫はなく、すでに生産も終わっていて中古を探すしかないと店員さんに伺ったため、iPhone 13 miniの次に小さくて安いスマホを選んだ結果がiPho

                                                                            PixelからiPhoneに戻してみて思ったこと
                                                                          • 経理からプログラマへ、Lramaの今後、なぜBisonを倒したのか。深掘りRubyKaigi 2023 with spikeolaf & makenowjust 文字起こしレポート vol.2 - STORES Product Blog

                                                                            2023年6月15日に『深掘りRubyKaigi 2023 with spikeolaf & makenowjust』を開催しました。イベントの内容をほぼ全文文字起こし形式でお届けします。この記事は第2部です。 hey.connpass.com 登場人物 ゲスト makenowjust/藤浪 大弥さん spikeolaf/金子 雄一郎さん STORES fujimura/藤村 大介 shyouhei/卜部 昌平 hogelog/小室 直 パーサとの出会い fujimura:金子さんのパートにいきます。簡単にどんな話をRubyKaigi 2023でしたか紹介していただけますでしょうか? spikeolaf:ここ2年ぐらい、主にAnd the WorldっていうRubyKaigiの名物コンテンツを見ていると、パーサへの関心というのは高まってきていて、ここ何年かで何が問題かはだいぶ整理されてきて

                                                                              経理からプログラマへ、Lramaの今後、なぜBisonを倒したのか。深掘りRubyKaigi 2023 with spikeolaf & makenowjust 文字起こしレポート vol.2 - STORES Product Blog
                                                                            • LLM開発のためのデータエンジニアリング - Qiita

                                                                              LLM開発のためのデータエンジニアリング MLOps Advent Calendar 2023の24日目です。 Stability AIでデータ系のソフトウェアエンジニアをやっているcvuskです。主な仕事は日本語LLMのためのデータ開発です。Stability AIでは日本語LLMも各種開発しています。LLMの学習というと大量のGPUを用意して巨大なデータでモデルを学習する、というキラキラしたイメージ(?)が強いかもしれませんが、データが重要かつ苦労が耐えない課題であることは他の機械学習やディープラーニングモデルと違いありません。日本語のテキストデータは英語ほど入手しやすいわけではないのと同時に、データエンジニアリングや品質面でもいろいろと大変なことが多々あります。今回はLLMのためのテキストデータの用途やエンジニアリングについて整理します。 LLMの学習 LLMの学習は大きく分けて事前

                                                                                LLM開発のためのデータエンジニアリング - Qiita
                                                                              • 朝日新聞ポッドキャスト“【ヨッピーさんと語ろう】#2 「SNSで大炎上」の土佐市移住者カフェに行ってきました”を文字起こしした

                                                                                朝日新聞ポッドキャスト“【ヨッピーさんと語ろう】#2 「SNSで大炎上」の土佐市移住者カフェに行ってきました”を文字起こしした 今でも月に1、2回「土佐 カフェ」をTwitterやGoogleで検索してるんだけど、そしたらたまたま見つけたコンテンツ。かなり興味深い内容で、お、ヨッピーが発信してるぞって。で、カフェの部分だけ文字起こし。 人生で初めて文字起こししたけど、めちゃくちゃ時間かかるね、これ。昼飯ないなった。 文字起こしサイトもめちゃ助かりました。 https://youtubetranscript.com/?v=NcjKaBrBL84&t=400 ソース:朝日新聞ポッドキャストより https://www.youtube.com/watch?v=NcjKaBrBL84&t=400 6分40秒ごろから15分35秒くらいまで。 朝:朝日新聞神田大介記者(前から注目してる、かなり好きな記

                                                                                  朝日新聞ポッドキャスト“【ヨッピーさんと語ろう】#2 「SNSで大炎上」の土佐市移住者カフェに行ってきました”を文字起こしした
                                                                                • “問い” が “当たり前” に変わり、新たな問いが生まれる: 四半世紀の変革

                                                                                  Google 製品を利用してくださる世界中の方々、パートナーの皆さま、そしてGoogle 社員へ 今月、Google は 25 歳の誕生日を迎えます。この節目を迎えることができたのは、Google 製品をご利用いただき革新を続けることに挑戦してくださる皆さま、製品開発のために惜しみなく才能を注いできた過去から現在に渡る何十万人もの Google 社員、そして私たちと同様に Google の使命を信じてくださるパートナーの皆さまのおかげです。 改めて、全ての皆さまに感謝をお伝えします。そしてこれまでのことを少し振り返ってみたいと思います。 この 25 年間でテクノロジーがどれほど進化し、人々がそれにどのように適応してきたのかについて、私はずっと考えてきました。昔、私がアメリカに留学していた時、インドにいた父が初めてメールアドレスを取得しました。私は父とより早く(そして経済的に)連絡を取る手段

                                                                                    “問い” が “当たり前” に変わり、新たな問いが生まれる: 四半世紀の変革