本文「文字起こし google」を検索 - はてなブックマーク

121 - 160 件 / 2733件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

文字起こし googleの検索結果121 - 160 件 / 2733件

ブルアカエデン条約3章グローバル版セリフ比較（ネタバレ注意）
- 49 users
- anond.hatelabo.jp
- アニメとゲーム
- 2024/04/11
블루 아카이브의 핵심, "결국은 학원과 청춘의 이야기" | 웹진 인벤 - 인벤 https://m.inven.co.kr/webzine/wznews.php?idx=275674&iskin=webzine&lbTW=1bac9f62372f87ca6bd90c293c4a2d0 ブルーアーカイブエデン条約3章グローバル版のローカライズにあたり、クライマックスのセリフに変更が加えられている。ニュアンスの調整目的のようだが、結構違う構成になっているように感じた。記事によると再録までしたらしい。 [블루 아카이브] 에덴조약 3장 히후미 일본서버/한국서버 대사 비교(エデン条約編 3章ヒフミ日本サーバー/韓国サーバー代謝の比較 - YouTube https://www.youtube.com/watch?v=VVBUS1_GEKU 以下文字起こし日本Ver グロ
毒親ブームと「宗教2世」問題｜ダッヂ丼平
- 49 users
- note.com/d_yosoji_man
- 暮らし
- 2024/06/13
はじめに20世紀のイギリスを代表する宗教社会学者ブライアン・ウィルソンは、1997年に来日した際、東洋哲学研究所が開催したセミナーで世界中の新宗教が共通して直面する課題について講演した。この講演の中で列挙された問題の大半は、新宗教が社会から受けるさまざまな攻撃と関連している。いうなればこの講演録は、一般社会の敵意と偏見が引き金となって新宗教に降りかかる困難を詳細にリストアップしたものだ［ウィルソン1998］。このリストに挙げられているものの中で、特筆すべきなのはマスメディアの報道が引き起こす害悪と、背教者たちの語る残虐な話の2つである。背教者というのは新宗教研究における学術用語であり、かつて所属していた教団に敵対し、批判を熱心におこなう元信者を指して用いられる。そして残虐な話とは、過去に所属していた教団がいかに酷い団体であるかを社会に訴える目的に特化した、虚偽の内容も含まれるようなバイ
- 宗教
- mind
- religion
- society
- 社会
- あとで読む
Gemini アプリの機能大全（2024年11月末時点）：基礎から最新機能の活用方法まで紹介｜Gemini - Google の AI
- 49 users
- note.com/google_gemini
- テクノロジー
- 2024/12/21
こんにちは。Google の AI「Gemini（ジェミニ）」の公式 note 編集部です。先日の Gemini 2.0 の発表含め、Gemini では新しい機能を次々に発表しています。この記事では、誰でも簡単に利用可能な無料版 Gemini アプリと、より高性能で多くの機能を利用できる有料版「Gemini Advanced」がもつ 9 個の機能について、おさらいも兼ねて、具体的な活用法と合わせてわかりやすく解説したいと思います！ Gemini をまだ使ったことがない方はもちろん、普段 Gemini をお使いの方にもお役に立てるよう、ちょっとニッチな機能や、新しい機能まで、実例をたっぷり交えて紹介していきます。ぜひ、この機会に Google の AI「Gemini」の機能をもっと知って、フル活用してみてください。 ※本記事は、2024 年 11 月末時点までにリリースされた Gemi
音声文字起こし技術で業務効率化: Google Text to Speech と OpenAI Whisper の活用 - STORES Product Blog
- 49 users
- product.st.inc
- テクノロジー
- 2023/03/17
こんにちは、CTO室技術基盤グループの id:hogelog です。 STORES Product Blog でも多くの文字起こし記事がありますが、社内重要会議の文字起こしなど STORES 社内には様々なところで音声の文字起こし業務が存在します。そんな文字起こし業務ですが完全に人力で実施するのは作業コストがかなり高いです。今日はそのような業務を効率化する音声文字起こし技術とその変遷について紹介します。 Google Text to Speech の活用以前論より動くもの.fmを支える技術〜Podcast初心者が使っているツール紹介〜 - STORES Product Blog でも紹介しましたが STORES 社内では Google Text to Speech が STORES 社内の様々な文字起こし業務に活用されてきました。 product.st.inc Google Text
- 音声
- あとで読む
- AI
- tech
- ツール
- 技術
- google
脊髄反射でクレベリン🙅‍♂️と言うんじゃなくて効果について調べた
- 48 users
- anond.hatelabo.jp
- 暮らし
- 2021/01/17
(投稿しようとしたら全然できなくて泣いた、リンク数でスパムフィルターって単純すぎるルールベースすぎませんか！) 水素水とかクレベリンとかNMRパイプテクターとか、いかにもエセ科学っぽいやつら、なんとなくエセ科学って判断してm9(^Д^)してる人が自分含めほとんどだと思うんだよ。結局「twitterで皆が言ってたから」レベルで、エセ科学/陰謀論信じる人と大差ないんじゃないかと思って、まずはクレベリンについて調べてみた。調べたと言っても日本語の論文やらWebサイトを探しただけ、個人で実験するとか無理だし、僕は化学専攻だったわけじゃないし、英語苦手だし。「こんな論文or調査があるよ」とか「いや、それはお前が完全に読み間違えてる」とかあれば指摘してくれると嬉しい。クレベリンについて公式サイト ttps://www.seirogan.co.jp/cleverin/ 大幸薬品の製品、正露丸のメー
- 医療
- 科学
- 増田
- 社会
- COVID-19
- 心理
- 災害
「Android 13」は日本語の改行が自然に　TextViewに新機能
- 48 users
- www.itmedia.co.jp
- テクノロジー
- 2022/07/14
Googleは7月14日、現在ベータ版が配布されている「Android 13」の日本語関連機能として、アプリ内の文字表示などに使われる「TextView」での文節による改行と、IMEの未確定の変換候補をアプリ側が取得できるようになったと発表した。単語ごとにスペースで区切る英語などと異なり、日本語は単語をつなげて文章とするため、アプリ内の表記など、単語の途中で改行されてしまうことがあるという。大抵の場合はこの動作で問題はないものの、見出しや中央寄せの場合、見栄えが悪くなってしまう。そこでAndroid 13は、TextViewに文節を保ったまま改行できるようになる機能を追加した。変換候補の取得は、アプリで検索機能を提供する際を想定したもので、日本語での逐次検索が提供しやすくなるという。日本語の場合、例えばIMEで「かた」とひらがな入力している間は、アプリ内で漢字の「肩」を含むデータを検索
- android
- 日本語
- あとで読む
- Google
- 自然
- アプリ
- security
Google Meet、日本語でのAI文字起こし/議事録作成が可能に
- 48 users
- pc.watch.impress.co.jp
- テクノロジー
- 2025/03/14
【2024年1月】エンジニアなら読むべき技術書TOP5 - Qiita
- 47 users
- qiita.com/qiita01f
- テクノロジー
- 2024/01/06
世界一流エンジニアの思考法 noteでも大人気！　米マイクロソフトのエンジニアが放つ最前線の仕事術頭が先、手は後。一流の仕事のカギは順序にある。 ――楠木建（経営学者）知的生産へのリスペクトがイノベーションの源泉だ。 ――落合陽一（メディアアーティスト）「怠惰であれ！」「早く失敗せよ」―― 米マイクロソフトの現役ソフトウェアエンジニアの著者が、超巨大クラウドの開発の最前線で学んだ思考法とは？ “三流プログラマ”でもできた〈生産性爆上がり〉の技術！・試行錯誤は「悪」。“基礎の理解”に時間をかける・より少ない時間で価値を最大化する考え方とは？・「準備」と「持ち帰り」をやめて、その場で解決する・マルチタスクは生産性が最低なのでやらない・“脳の負荷を減らす”コミュニケーションの極意・コントリビュート文化で「感謝」の好循環を生む……etc. 仕事と人生を「自分の手でコントロールする
- エンジニア
- あとで読む
- qiita
- 本
- API
- review
- 書籍
- book
Googleが音声から「テキストと音声の両方」に翻訳できる大規模言語モデル「AudioPaLM」を発表
- 46 users
- gigazine.net
- テクノロジー
- 2023/06/27
Googleが「AudioPaLM」を発表しました。AudioPaLMはテキストベースの言語モデルである「PaLM 2」と音声ベースの言語モデルである「AudioLM」を統合したマルチモーダルアーキテクチャであり、テキストと音声を処理・生成し、音声認識や音声翻訳などのアプリケーションに利用できるとのことです。 [2306.12925] AudioPaLM: A Large Language Model That Can Speak and Listen https://doi.org/10.48550/arXiv.2306.12925 AudioPaLM https://google-research.github.io/seanet/audiopalm/examples/ AudioPaLMは、AudioLMから話す速さ、声の強さ、高さ、沈黙、イントネーションなどのパラ言語情報を保持する
- 人工知能
- Google
- 音声
- 学習
- techfeed
- AI
AmazonやAppleの音声認識アルゴリズムに「黒人の声を上手く聞き取ることができない」問題があると研究者が指摘
- 46 users
- gigazine.net
- テクノロジー
- 2020/04/19
音声認識アルゴリズムはスマートスピーカーやスマートフォンなど、さまざまなデバイスやアプリケーションに採用されており、もはや日常の一部となっています。ところが、AppleやAmazon、Google、IBM、Microsoftなどの音声認識アルゴリズムを使った実験で、「音声認識アルゴリズム白人の声と比較して黒人の声を上手く認識できない」問題があることが判明しました。 Racial disparities in automated speech recognition | PNAS https://www.pnas.org/content/117/14/7684 There Is a Racial Divide in Speech-Recognition Systems, Researchers Say - The New York Times https://www.nytimes.com/
Viceは死ぬべくして死に、404 Mediaは生まれるべくして生まれた | p2ptk[.]org
- 45 users
- p2ptk.org
- テクノロジー
- 2024/09/07
Viceは死ぬべくして死に、404 Mediaは生まれるべくして生まれた投稿者: heatwave_p2p 投稿日: 2024/9/72024/9/7 以下の文章は、コリイ・ドクトロウの「Vice surrenders」という記事を翻訳したものである。本稿はVice Mediaの崩壊について書かれたコラムだが、Viceの崩壊により生み出された404 Mediaについては、WirelessWire Newsに掲載された論考「ジャーナリスト自身が運営する404 Mediaにみる『オルタナメディア』の可能性」が大変に面白かったので、ご一読をおすすめしたい。 Pluralistic Viceは、まさに自らの生き様そのままに死んだ。より狡猾な捕食者にだまされ続け、その一方で自らの捕食本能を、自社の愚かな経営陣以上に騙されやすい者たちに向け続けた。安らかに眠れ。あのViceはもういない。 Viceを
- メディア
- SNS
- media
- あとで読む
- 企業
- 歴史
- web
Google にメールを届けるために 2023 冬 | IIJ Engineers Blog
- 45 users
- eng-blog.iij.ad.jp
- テクノロジー
- 2023/12/25
2015 年新卒入社。途中、2年ほど IIJ Europe に出向経験もあるが SMX の中の人として長年スパムメールと奮闘中。M3AAWG, JPAAWG にも参加し始め、メッセージングエンジニアとして頑張ってます。最近の趣味はぶらり都バス旅。 Google, Yahoo の Sender Guidelines について前回、こんな記事を書いたもののいくつか説明を端折っていた部分があったので再度文字起こしをします。 # さらに、前回字面が強めだったので今回はもう少し優しめにします。改めまして、IIJセキュアMX サービスの中の人、今村です。師走に入り、気づいたらインフルエンザにかかり、、記事を公開するのに時間がかかってしまいました。 (みなさんもお気をつけください。) さて、2024/02 から Google, Yahoo! に一部のメールが受け取ってもらえなくなりますが、メール送
- Gmail
- SPF
- メール
- mail
- あとで読む
- Google
- *あとで読む
いま売れに売れてるChromebookで1週間仕事をしてみた
- 45 users
- www.gizmodo.jp
- テクノロジー
- 2021/03/25
いま売れに売れてるChromebookで1週間仕事をしてみた2021.03.25 18:0055,668 Buy PR 三浦一紀最近、Chromebook（クロームブック）が話題ですね。なんでもChrome OSがmacOSのシェアを超えているとか。多くは教育機関やビジネス向けとして大量導入されているからだとは思いますが、それにしても普及率がハンパないですね。さすがにWindowsやmacOSと比べると機能的には物足りないところもあるのでしょうが、比較的安価でサクサク動くノートPCと考えると、かなりいい選択肢です。そこで、Chromebookでどれだけ仕事ができるのか検証するため、1週間Chromebookだけで仕事をしてみました。普段の仕事をChromebookだけでやってみる僕は普段MacBook Airを使って仕事をしています。仕事内容としてはWebの閲覧やメールのチェック、
- chrome
- あとで読む
- Google
- ガジェット
- PC
- 仕事
ChatGPT対抗のチャットAI「Claude」が公開、Googleが支援するOpenAIの元社員が設立したAIスタートアップが開発
- 45 users
- gigazine.net
- テクノロジー
- 2023/03/15
ChatGPTやDALL-E 2といったAIツールを開発したOpenAIの元社員が立ち上げたAIスタートアップのAnthropicが開発する、ChatGPTのようなチャットAIが「Claude」です。これまでNotionやQuora、DuckDuckGoといった主要パートナーと協力してクローズドアルファ版の開発を進めてきたというClaudeが、あらゆるユーザー向けに公開されました。 Anthropic | Introducing Claude https://www.anthropic.com/index/introducing-claude チャットAIのClaudeは、開発者コンソールのチャットインターフェイスにAPIを介してアクセスし、高度な信頼性と予測可能性を維持しながら、さまざまな会話およびテキスト処理タスクを実行できます。 Claudeは文章の要約・検索・ユーザーとの共同執筆・
MonotaROのデータ基盤10年史（後編） - MonotaRO Tech Blog
- 45 users
- tech-blog.monotaro.com
- テクノロジー
- 2021/12/23
こんにちは。データ基盤グループの香川です。本記事は、MonotaRO のデータ基盤の歴史についての社内での発表の文字起こし記事の後編になります。前編の記事： tech-blog.monotaro.com 前編ではデータ基盤の変遷の概要 2010年頃のデータ基盤販促基盤とDWH（2010~2015) データ基盤構想とBigQueryの導入（2015~2017年) 同期システムの改良とBigQueryデータ基盤の展開（2018) までお話しましたが、後半たる本記事では以下について説明をしていきます。他システムへのデータ提供とEC基盤の展開(2018) 2020年におけるデータ基盤へのデータ同期と利用状況データ基盤の課題：データの管理体制の未整備による局所最適化データ管理のグループ発足、Looker導入・DWH構築歴史を振り返っての学び歴史を振り返ることの意義最後に最後まで
話題の日本酒「ソースコード」を読んで（飲んで）みた | DevelopersIO
- 44 users
- dev.classmethod.jp
- テクノロジー
- 2024/02/12
こんにちは、AWS事業本部@福岡オフィスのべこみん(@beco_minn)です。早速ですが皆さん、日本酒は好きですか？私はほぼ毎週近所の酒屋さんに買いに行くぐらい大好きです。つい最近、こんな日本酒がSNSで話題になっていました。「自分好み」を読み解いてシステムエンジニアに捧ぐ日本酒クリアな飲み口に、豊かなお米の旨みが溢れ出る上質な味わい。料理と合わせても、様々な温度帯でも楽しめる1本に、思わず誰もが「自分好みの楽しみ方」を探してしまう。「読み解きたくなるロジック」が詰め込まれた、システムエンジニアたちに飲んでほしい純米吟醸酒です。とのこと。はい、買いました。ラベルのソースコードが気になったというのもあるんですが、純粋に味が気になったので買ってみました。本記事では味の感想含め、ラベルの内容についても触れたいと思います。飲んでみたコードの解読前にまずは飲んでみます。お酒は飲ん
- 酒
- あとで読む
- -
- プログラミング
- javascript
- programming
- 食
- ネタ
第1回　生成AIの得意・不得意 2024・夏 | gihyo.jp
- 43 users
- gihyo.jp
- テクノロジー
- 2024/07/25
皆さんこんにちは。スリーシェイク代表の吉田です。今回より生成AIを、金融業界や製造業、医療業界など各事業ドメイン固有の課題解決にどう使われているのか、具体的なユースケースを提示しながら、それを実現するアーキテクチャについて解説していきます。この連載を通して、これまで生成AIを実際のシステムに組み込むイメージが湧かない方への第一歩として手助けになれば幸いです。第1回は、生成AI自体の一般的な得意不得意を踏まえながらユースケースを解説します。生成AIが得意とする処理とは？生成AIが得意とするのは、「⁠専門性のない一般的な知識をベースにした」テキスト生成、コード生成、画像認識や画像生成が挙げられます。RAG（Retrieval-Augmented Generation）やプロンプトエンジニアリングにより固有ドメインに特化させることは可能ですが、教師あり学習データを前提としたMLやDeep
- LLM
- あとで読む
- AI
- article
- 画像
NotebookLMを活用して音声配信をもっと楽しむ方法
- 42 users
- zenn.dev/karaage0703
- テクノロジー
- 2024/10/02
NotebookLM NotebookLMはGoogleが提供している生成AIを活用したサービスです。なんと（2024年10月現在は）無料で使えます。 NotebookLMは、Googleの生成AI Geminiのロングコンテキスト（多くの量のプロンプトを扱うことができるという意味）の特徴を活かした、文章の要約やQA対応が得意です。文章は、直接プロンプトに入れている（と思われる）ので、単なるRAGとは違う（と思われ）ます。 RAGとロングコンテキストのどっちが良いのかというのは、色々議論があるようです。例えばLost in the Middle: How Language Models Use Long Contextsという論文では「ロングコンテキストの真ん中の情報は失われるよ」みたいなことが書いてありますがRetrieval Augmented Generation or Long-C
- AI
- 音声
- あとで読む
- LLM
- audio
- pdf
僕は CREing：ソフトウェアエンジニアにカスタマーサクセスを任せたときに起こるもの、を Autify で実現したいと思っている - えいのうにっき
- 42 users
- blog.a-know.me
- テクノロジー
- 2021/08/21
この文章で出てくる用語たち： SRE Site Reliability Engineering / Engineer 。前者のことを指して SREing, 後者のことを指して SREs, と表記することもあるサイトリライアビリティエンジニアリング - Wikipedia CRE Customer Reliability Engineering / Engineer 。「CRE」という言葉が使われるときはだいたい後者な気がする。前者を指してこの言葉が使われてるのはあんまり見ないな、という印象がある僕自身、前職でサーバーモニタリングSaaSに携わっていたこともあって「SRE」については最低限の知識というか、その概念の理解はあるつもり。でも最近目にしたこちらの記事を読んで、ああそうだった、と認識を新たにした表現があった。以下は、この記事の中の「そもそもSREとは何なのか」という問を受けて
東大学生新聞HP - Sechiyama-statement
- 42 users
- sites.google.com
- 世の中
- 2022/04/21
4月13日に行われた授業における瀬地山氏の弁解の書き起こしです。同氏の特に個人的な情報に関する部分は伏せております。仮にも授業の内容を文字起こしすることについて問題視する方もいるかもしれませんが、瀬地山氏自身が弁解で書き起こしの重要性を訴えているため、今回に関しては問題にはならないと考えております。その詳細は明かさないまでも、「精神科と関わりがあること」のみは明かすことについては、瀬地山氏が自身でLMS（授業より公開範囲が広い）に公開していること、授業で「ツイート等しないでほしい」と言っている部分にあたらないこと、それ自体は様々な解釈ができることから、その上で、瀬地山氏の主張の根幹に関わることから、公開は問題ないと判断しております。しかし、センシティブな案件のため、読者の皆様におかれましては、これ以上具体的にどのような関わりがあるかについての詮索は何卒お控えくださるようお願いいたします
プロの議事録はここが違う。一目置かれる議事録作りの8つのメソッド｜Shoichi Hasegawa
- 41 users
- note.com/hasebee
- 暮らし
- 2023/06/02
議事録は、書く側にも読む側にも「なんか面倒くさいな」と思われがちです。しかし、議事録をないがしろにするのは、情報流通を疎かにすることと同じ。議事録の質を高めることは、仕事の評価を高めるだけでなく、ビジネスを加速させる力となります。このnoteでは、「残念な議事録を少なくする」をテーマに、「文章を書くのが苦手」「情報の論理構造の整理が苦手」という方にも、実践可能な方法を書いていこうと思います。新人の仕事といえば…議事録今回、アドビさんの「みんなの資料作成」という企画に参加し、「新社会人向けに社内資料のノウハウ」をお伝えすることになりました。 Adobe Acrobat「みんなの資料作成」新人が任せられる資料の代表例といえば…議事録ではないでしょうか。多くの会議に必須な議事録ですが、面倒な仕事でもあります。現場では、新人メンバーが議事録をまかせられる傾向があります。ただ、新社会人の
【徹底比較】ChatGPTに「DeepResarch」登場。GeminiやGensparkの同機能と結果を比較｜たてばやし淳.エクセル兄さん@ ChatGPT書籍8冊執筆
- 40 users
- note.com/on_consul
- テクノロジー
- 2025/02/05
【徹底比較】ChatGPTに「DeepResarch」登場。GeminiやGensparkの同機能と結果を比較 ChatGPTにDeepResarch（ディープリサーチ）機能が登場。他のAIサービスと比較したい以前、Voicyで「2時間ほどかかるリサーチ作業をAIに任せたら、わずか5分で終わった」という話をしたことがあります。いわゆる「DeepResearch」というAIエージェントがWeb調査を自動化してくれるという内容でしたが、そこへついにChatGPTからも、同様の調査機能が登場して話題になっています。実は「DeepResearch」という名称を持つAI機能は他にもありましたが、ChatGPTの新機能はアウトプットの品質と精度が高いということで、各所で評判になっているのです。私も早速試したのですが、使い勝手が思った以上に良く、これならVoicyでも紹介したいと思うほど役立ちそうだと
- AI
- ChatGPT
- あとで読む
- 人工知能
- データ
- Google
OpenAIの文字起こしAI「Whisper」の使い方 | DXを推進するAIポータルメディア「AIsmiley」
- 40 users
- aismiley.co.jp
- テクノロジー
- 2023/01/12
OpenAIが発表した音声認識モデル「Whisper」は、日本語の音声でも精度高く文字起こしできるツールとして知られています。今回はアイスマイリー編集部が「AIニュース原稿の読み上げ音声を素材にどのくらい精度高く文字起こしできるのか」や「生活騒音下における読み上げ音声でも結果は変わらないのか」について調べてみましたので是非やり方を真似して試してみてください。記事後半ではWhisper APIおよびChatGPT APIを活用した文字起こしサービスである「writeout.ai」の紹介も行っていますので、業務への活用イメージとしてご活用ください。生成AIについて詳しく知りたい方はこちらの記事もご覧ください。生成AI（ジェネレーティブAI）とは？種類・使い方・できることをわかりやすく解説音声認識モデルとは？音声認識モデルとは、AIが人間の声を認識し、認識した音声をもとに何らかのデータ
- OpenAI
- Whisper
- AI
- 文字起こし
- 音声認識
【無料】高精度&爆速で文字起こしが終わるAIツール「Gladia」がスゴイ | 株式会社LIG(リグ)｜DX支援・システム開発・Web制作
- 40 users
- liginc.co.jp
- テクノロジー
- 2024/06/05
こんにちは、インハウスマーケティング部のかけるです。生成AIによってライティング業務の効率化が進むなかで、「文字起こし」は生成AIが得意とする領域の一つです。今回は数ある文字起こしAIのなかでも、実際に使ってみて良かった文字起こしAI「Gladia」について、その使い方や魅力をご紹介します！「Gladia」は精度が抜群 https://www.gladia.io/ まず前提として、Gladiaの文字起こしの技術には、OpenAIがオープンソースとして公開している文字起こしAI「Whisper」が活用されています。 Gladiaの大きな魅力は、なんといっても音声から文字を起こす（Speech-to-Text）際の精度の高さです。一般的に、音声認識の精度は「単語誤り率（WER）」という、その音声認識モデルが音声をテキストへ変換する際にどれぐらい間違えてしまったのかという評価尺度があり
- AI
- 音声
- あとで読む
- 動画
- ツール
- webサービス
初心者でもYouTube風「テロップ」を簡単に。世界一やさしい動画編集アプリ誕生秘話 | キャリアハック（CAREER HACK）
- 40 users
- careerhack.en-japan.com
- 学び
- 2020/06/23
動画編集で最も工数のかかる作業のひとつが「字幕テロップ」。アプリ「Telorain」では、初心者でも簡単にYouTube風のテロップが作成できる。仕掛け人はスーパークリエータ、大峠和基さん。開発の裏側には、ユーザーの「楽しさ」をつくるための試行錯誤があった。はじめての動画編集が「楽しめる」ように。 2020年5月にリリースされた動画編集アプリ「Telorain（てろれいん）」。日常の風景やVlogなどのショートムービーをアップロードするだけで、YouTuber風の字幕をつけることができるすぐれものだ。未踏事業で開発した、AIによりほぼ自動でプロクオリティのテロップを作れるiOSアプリ @telorainをローンチしました雑に撮った日常やVlogなどのショートムービーにTV/YouTuber風の字幕を付けて楽しむことができます紹介動画はtelorain(+AE)で作っています ▼無
- -
- アプリ
- 大学
- あとで読む
サーバーレス技術の今と未来についてServerlessDays TokyoのPreEventで話してきました - めもおきば
- 40 users
- d.nekoruri.jp
- テクノロジー
- 2024/09/20
𝕏にURL貼れなくなっているので、Zennにもマルチポストしています。 ServerlessDays Tokyo 2024 PreEvent 2024-09-21のServerlessDays Tokyo 2024にむけて、去年に引き続き、直前イベントでサーバーレス技術の今と未来について話してきました。いよいよ明日からメインイベントですので参加お待ちしています！ Serverless Update 2024 文字起こしスライド全体はDocswellさんで公開しています。 PreEventはYouTubeでアーカイブがあります。サーバーレスのおさらい「サーバーレス」は、誤解を招きやすい技術用語で様々な定義がありますが、ここでは2つの視点で定義します。運用者の視点としてのサーバーレスは、物理的なマシンや仮想マシン、EC2インスタンスのような「サーバー」を自分で管理するのではなく、そ
- AWS
- あとで読む
NotebookLM を日本語でも提供開始。ウェブサイトや Google スライドにもサポート
- 40 users
- blog.google
- テクノロジー
- 2024/06/07
昨年の夏、Google は AI を活用したリサーチや執筆する際のアシスタントである NotebookLM を発表しました。そして本日より、 Google Labs で Gemini 1.5 Pro を搭載した更新版の NotebookLM を日本語を含む言語で 200 以上の国と地域に順次提供します。私たちが NotebookLM で目指してきたのは、複雑な資料を理解して精査し、情報から新しい類似性を見つけ、下書きなどをすばやく作成するのに役立つツールの開発です。研究論文や取材記録、仕事でのドキュメントなどの参照文献（ソース）をアップロードすると、NotebookLM がそれらの重要な資料を理解し、必要なサポートを提供します。また、本日からお使いいただける NotebookLM では、英語で提供していたものから更新し、いくつかの新機能も導入します。 Google ドキュメント、PDF、
ChatGPT以外にも試す価値のある生成型AIツール10選 | Forbes JAPAN 公式サイト（フォーブスジャパン）
- 39 users
- forbesjapan.com
- テクノロジー
- 2023/04/17
最近テック分野の動向を追っている人なら、ChatGPTやBardについてよく耳にしているだろう。OpenAI（オープンエーアイ）やMicrosoft（マイクロソフト）、Google（グーグル）が大規模な言語モデルを続々と一般公開している。だが、より小規模なジェネレーティブ（生成型）AIプロジェクトもこの1年で多数展開されてきた。生成型AIツールは音楽、アート、文学などさまざまな分野に大きな影響を及ぼしている。画像を作成するツールもあれば、電子メールを下書きするものもある。あるツールは動画を制作する。しかし、いずれのツールもより多くの人がクリエイティブな分野に親しめるようにしながら時間を節約するために作られた。我々がいかに迅速に作業を行うか、法的・倫理面での予期せぬ問題、生成型AIが仕事に与える究極の影響についてはまだ結論は出ていないが、生成型AIが定着していることは明白になりつつある。
- AI
- ChatGPT
- ツール
- あとで読む
- アプリ
今年のオープンソース活動振り返り @ 2020
- 39 users
- efcl.info
- テクノロジー
- 2020/12/31
2020年のオープンソース活動の振り返り記事です。今までの振り返り。今年のOSS活動振り返り @ 2019 | Web Scratch 今年のOSS活動振り返り @ 2018 | Web Scratch 今年のOSS活動振り返り @ 2017 | Web Scratch 今年のOSS活動振り返り @ 2016 | Web Scratch 今年のOSS活動振り返り @ 2015 | Web Scratch 今年のOSS活動振り返り @ 2014 | Web Scratch 2020年のGitHubのPublicなContributionsは7000~9000ぐらいを推移していました。最近はPrivateリポジトリをメモやブックマーク管理などでも使うようになったので、Private比率は増えてPrivateなContributionsは13400でした。 GitHub Issuesを個人
- OSS
- Github
- あとで読む
- javascript
- article
- 開発
2024 の振り返り
- 38 users
- diary.sorah.jp
- テクノロジー
- 2025/01/06
2025 年に書いています。2024 を振り返ります。仕事現職 12 年目がそろそろ終わる。2023 末に Head of Security and IT というポジションを継いだり1、その上で Corporate Engineering チームではオフィスの池尻大橋移転があったので主にその方面の仕事をしたりしていた。一方プロダクト方面では Software Engineer (Platform) な帽子も引き続き持っていて、One Experience という、従来ばらばらに開発していたグローバル版に日本版のシステムをマージするという大掛りなプロジェクトをずっとやっていた。といっても、自分は前述の通り別の責務が増えてしまっていて、キックオフや方針決め、日英のブリッジ、セキュリティ面のコードレビューに関わったくらいで実作業はあんまりできていない 2。これらを総括すると引き続き仕事の 4
iPhoneより格安のPixel 7が想像以上のパフォーマンスを発揮 | Forbes JAPAN 公式サイト（フォーブスジャパン）
- 38 users
- forbesjapan.com
- テクノロジー
- 2022/12/10
最新のGoogle謹製Android端末、Pixel7とPixel7Pro。暗所に強いカメラに加え、GoogleのAIを活用したオリジナルプロセッサ「Tensor G2」などが特徴です。発売後もiPhoneから乗り換えたユーザーの多くがべた褒めしています。どれほど良いスマホなのか、私も気になったので両方とも購入して試してみました。サイズ感はiPhoneより若干大きめ右がPixel7 Pro 左がPixel7 まずはサイズ感から。横幅に関しては、iPhone14 Proの71.5mmに比べて双方とも数ミリ大きいです。Pixel7 Pro とPixel7は横幅は1mmしか違わないので、「持ち感」に関してはPixel7とPixel7 Proとの間には、あまり差を感じません。男性にしては手が小さめで、iPhone14 Proが片手で使うには限界の僕としては、Pixel7 Pro もPixe
サーバーレス技術の今と未来についてServerlessDays Tokyo 2024 直前イベントで話してきました
- 38 users
- zenn.dev/nekoruri
- テクノロジー
- 2024/09/22
ServerlessDays Tokyo 2024 PreEvent 2024-09-21のServerlessDays Tokyo 2024にむけて、去年に引き続き、直前イベントでサーバーレス技術の今と未来について話してきました。いよいよ明日からメインイベントですので参加お待ちしています！ Serverless Update 2024 文字起こしスライド全体はDocswellさんで公開しています。 PreEventはYouTubeでアーカイブがあります。サーバーレスのおさらい「サーバーレス」は、誤解を招きやすい技術用語で様々な定義がありますが、ここでは2つの視点で定義します。運用者の視点としてのサーバーレスは、物理的なマシンや仮想マシン、EC2インスタンスのような「サーバー」を自分で管理するのではなく、その管理をクラウド事業者に任せるという考え方で、要するに完全従量課金型のフル
- serverless
- あとで読む
- Azure
- aws
- column
【プレイバック2021】Google Pixel 6 Proの文字起こし機能だけで記事を書いてみた by 麻倉怜士
- 38 users
- av.watch.impress.co.jp
- テクノロジー
- 2021/12/24
誰でも書ける『Web記事』の作り方｜記事作成編 - イーアイデム「ジモコロ」
- 38 users
- www.e-aidem.com
- テクノロジー
- 2024/01/16
こんにちは！バーグハンバーグバーグ編集部です。新人ライターさんから編集部によく寄せられる「どうやって記事を作ればいいですか!?」という声。そこで、どんな人でも書けるようになる『Web記事の作り方』を、前回まで2回にわたって解説してきました。今回は、実際に記事を作成する段階のコツを解説します！今までと同じく、ジモコロ編集部のギャラクシー（左）と加藤（右）が、新人ライター瀬戸はるかさんに、解説する形で進めます！ ▼登場人物 WEBライター｜瀬戸はるかフリーの新人ライター。取材やインタビューはほぼ未経験。ジモコロ編集長｜ギャラクシー雑誌の編集、通販番組の脚本を経てWEB編集者に。【ギャラクシーが書いた記事】 WEB編集者｜加藤亮編集プロダクションで編集とライティングを学んだ。【加藤が書いた記事】文字起こしについてインタビューを記事にする時、自分でやってみて思ったのが、とにか
Googleドキュメントと Gemini の連携で、文書作成のワークフローが進化｜Gemini - Google の AI
- 37 users
- note.com/google_gemini
- テクノロジー
- 2025/04/02
こんにちは、Google の AI「Gemini（ジェミニ）」の公式 note 編集部です。このシリーズでは、Gemini と連携させることで、利便性と生産性がアップする、Google Workspace の活用法を紹介しています。今回のテーマは「Google ドキュメント」。一から長文の文章を作成したり、新たな企画書を作ったりするのは苦手だと感じている方は多いのではないでしょうか。Gemini と連携すれば、新たな文章の構成案や下書きを提案してもらったり、アイデア出しのサポートをしてもらったりすることが可能になります！　さらに、画像生成機能を活用し、企画書の趣旨に合ったビジュアルを添えることもできます。ハードルの高い「ゼロイチ」からのドキュメント作成も、ぜひ Gemini の機能を上手に活用し、得意に変えていきましょう！　まずは、無料の「Gemini アプリ」からぜひお試しください
- Gemini
- Google
- AI
- あとで読む
- 人工知能
LLMアプリケーションからAgenticアプリケーションの時代へ〜「LangChainとLangGraphによるRAG・AIエージェント［実践］入門」の出版に寄せて - Generative Agents Tech Blog
- 37 users
- blog.generative-agents.co.jp
- テクノロジー
- 2024/10/30
ジェネラティブエージェンツの西見（@mah_lab）です。 2022年11月のChatGPT公開前夜にGPT-3.5の最新モデルtext-davinci-003が公開され、このモデルもまた人間の書いた文章と見分けがつかない自然な生成できるとされ大いに話題になりました。しかし、大規模言語モデル（以下LLM）を活用したアプリケーション開発が本格的に活発化したのは、やはり2023年3月1日のChatGPT API（gpt-3.5-turbo）の公開からでしょう。 openai.com gpt-3.5-turboの登場、検索から生成へこのAPIは1kトークンあたり0.002ドルと、text-davinci-003の1/10の価格で提供されました。チャット向けにインストラクションチューニングされているため、チャットボットを開発するのに有用です。何よりも、一世を風靡していたChatGPTのようなアプ
- llm
- あとで読む
- 人工知能
- techfeed
- AI
OpenAIが「Sora」の学習にYouTube動画を使ったとすれば違反──YouTubeのモーハンCEO
- 37 users
- www.itmedia.co.jp
- テクノロジー
- 2024/04/05
米Google傘下のYouTubeのニール・モーハンCEOは4月4日（現地時間）、米Bloombergとのインタビューで、米OpenAIがもし自社のAIモデルのトレーニングにYouTube動画を使っているとすれば、それはYouTubeポリシーの「明らかな違反」になると語った。 OpenAIのミラ・ムラティCTO（最高技術責任者）は3月、米Wall Street Journalとのインタビューで、2月に発表した動画生成AIモデル「Sora」のトレーニングにYouTube、Facebook、Instaramなどの動画を使ったかどうか問われ、分からないと答えた。モーハン氏は「クリエイターが努力して作った成果をYouTubeにアップロードするとき、彼らは利用規約が順守されると信じている」ので、「トランスクリプト（文字起こし）や動画などのダウンロードは許可されておらず、それは明らかな違反だ」と語っ
「Googleドキュメント」の音声入力機能がアップデート--使い方を解説
- 37 users
- japan.cnet.com
- テクノロジー
- 2023/01/17
声は強力なツールだ。Googleの音声入力機能は、声による文字入力を支援するだけでなく、プレゼンにも活用できる。 Googleの音声入力機能を使えば、自分の声を使って、頭の中の考えを素早く簡単にデジタル化できる。 Googleは米国時間1月9日、音声入力でより正確かつ安定した文字起こしを実現するアップデートを段階的にリリースすると発表した。主な変更点は次のとおりだ。音声を文字起こしする際の変換ミスを削減文字起こしの漏れを最小化対象が大半の主要ブラウザーに拡大「Googleスライド」のキャプションに句読点を自動挿入強化された音声入力機能を実際に使えようになるのは大半のユーザーの場合、2月9日以降だ。その間に、Googleの音声入力機能を使って「Googleドキュメント」で入力・編集をしたり、Googleスライドのスピーカーノートに音声でテキストを入力したりする方法を紹介しよう。
- あとで読む
- google
「Pixel 7／7 Pro」速攻レビュー　性能重視ではないが、多くの人に“刺さる”と感じた理由
- 36 users
- www.itmedia.co.jp
- テクノロジー
- 2022/10/13
「Pixel 7／7 Pro」速攻レビュー　性能重視ではないが、多くの人に“刺さる”と感じた理由（1/4 ページ） Googleが自身で開発した「Pixel 7」「Pixel 7 Pro」が、10月13日に発売される。Pixelシリーズは、Googleが得意とするソフトウェアやAIを融合させ、新たな価値を提供するためのハードウェア。2021年に発売された「Pixel 6」「Pixel 6 Pro」からは、プロセッサも独自設計の「Tensor」になり、AIの活用が一段進んだ。コンピュテーショナルフォトグラフィーをリードするカメラ機能や、日本語を含めた文字起こし機能は、同モデルの代名詞になりつつある。最新モデルのPixel 7シリーズには、第2世代のTensorとなる「Google Tensor G2」を採用。この処理能力を生かし、カメラや画像処理に新機能が加わっている他、AIを使った顔認証
- Pixel
- android
- camera
- あとで読む
- AI
- google
Streamlit × GKE で構築する社内向けツール - enechain Tech Blog
- 36 users
- techblog.enechain.com
- テクノロジー
- 2024/12/10
この記事はenechain Advent Calendar 2024の10日目の記事です。はじめに enechain データサイエンスデスクエンジニアの藤村です。我々データサイエンスデスクは、電力や燃料に関するデータ分析や予測モデルの構築などの他に、enechainの様々なビジネスをサポートする社内向けツールの開発・運用も行っています。機械学習や数理最適化を活用したアプローチを中心に、最近ではLLMの活用にも取り組んでいます。本稿では、この取り組みでStreamlitアプリケーションをGKEでホストするに至った経緯や、その運用について紹介します。なぜ Streamlit なのか社内の業務を支援するツールを構築する際、常に課題となるのが「人間の判断をどのように介在させるか」という点です。ドメインやアルゴリズムの性質上、自動化が難しい部分も多く、人間の判断を介在させる必要のある場面