並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 26205件

新着順 人気順

speechの検索結果161 - 200 件 / 26205件

  • AIによる創作のコモディティ化。タイムリミット迫る

    我々は知らない内に創作の終末へと向かう特急列車に乗せられているのか? 去年の8月、画像AI、Midjourneyが登場した時、これで漫画の背景描けるやんと喜んだ。 Midjourneyで生成した絵をBlenderで3D化してUE5で遊べるようにしてみた pic.twitter.com/I1l0VVZLjz — 海行プログラム (@kaigyoPG) August 12, 2022 そして10月にNovelAIが出てきて、これで漫画のキャラも描けちゃうやんと思った。 従来のイラスト、マンガ、アニメ、ゲームは「絵を描くのがメッチャ大変」という前提があったからこそああいう収まり方に収束してただけで、毎秒絵を生成できるようになると話が違ってくる。例えばNovelAIでテキトーに生成しただけのエロCG集が乱立した事もそんな手があるとは予想できなかったが — 海行プログラム (@kaigyoPG) O

    • New models and developer products announced at DevDay

      GPT-4 Turbo with 128K context and lower prices, the new Assistants API, GPT-4 Turbo with Vision, DALL·E 3 API, and more. Today, we shared dozens of new additions and improvements, and reduced pricing across many parts of our platform. These include: New GPT-4 Turbo model that is more capable, cheaper and supports a 128K context windowNew Assistants API that makes it easier for developers to build

        New models and developer products announced at DevDay
      • ElasticsearchとKibela APIを使ってSlackでのCSお問い合わせ対応業務を改善した話 - BASEプロダクトチームブログ

        この記事はBASE Advent Calendar 2020の11日目の記事です。 devblog.thebase.in BASE株式会社 Data Strategy チームの@tawamuraです。 BASEではオーナーの皆様や購入者様のお問い合わせに対して、Customer Supportチームが主となって対応をしています。その中でもいくつかの技術的なお問い合わせに対しては、以下のようにSlackの専用チャンネルを通して開発エンジニアに質問を投げて回答を作成することになっています。 CSチームから調査を依頼されるお問い合わせの例 これらのCS問い合わせ対応は日々いくつも発生しており、CSお問い合わせ対応を当番制にして運用してみた話 でもあるように週ごとに持ち回り制で各部門のエンジニアが対応しているのですが、どうしても調査や対応に時間が取られてしまうという問題が発生していました。 dev

          ElasticsearchとKibela APIを使ってSlackでのCSお問い合わせ対応業務を改善した話 - BASEプロダクトチームブログ
        • Google Cloud Japan Customer Engineer Advent Calendar 2019

          https://medium.com/google-cloud-jp から派生したGoogle Cloud Japan の Customer Engineer (CE) が 書く Advent Calendar 2019 です。CE 達が是非紹介したい機能、いままで培ってきたノウハウ、知っておくと便利なTipsなどを公開予定です。 google-cloud-jp はGoogle Cloud Platform 製品などに関連するコミュニティが記載したテクニカル記事集です。掲載された意見はすべて著者個人のものであり、必ずしも Google のものを反映するものではありません。 12/1Kubernetes とGCPの世界をつなぐアクセス管理のはなし (Hiroki Tanaka)12/2Apache Hadoop のデータを BigQuery で分析するための移行手順 ( Keiji Yosh

            Google Cloud Japan Customer Engineer Advent Calendar 2019
          • 呉座・オープンレター事件の対立軸――キャンセルカルチャーだったのか?/田中辰雄 - SYNODOS

            1.はじめに 2021年、大学関係者の間で呉座・オープンレター事件が話題になった。本稿はこの事件で何が対立軸だったのかを、人々へのアンケート調査の形で調べることを目的としている。 事件のあらましを簡単に述べる。ベストセラー『応仁の乱』の作者である歴史学者、呉座勇一氏が鍵付きツイッターアカウントで、ある女性研究者を揶揄あるいは誹謗していることが明るみに出て、炎上する。呉座氏は謝罪し、NHKの大河ドラマの歴史考証役を降板した。その後、有識者よりこの事件を一般的な女性差別問題として広く世に問うオープンレターが出され、1300人もの学者らが署名する。半年後に呉座氏の所属機関は予定されていた呉座氏の採用を取り消した。 この事件はいろいろな角度から議論が可能で、すでに多くの記事が書かれている。オープンレターが出るころまでは呉座批判一色であったが、採用取り消しで呉座氏への同情論が出るようになり、最近では

              呉座・オープンレター事件の対立軸――キャンセルカルチャーだったのか?/田中辰雄 - SYNODOS
            • TOEICの品詞問題が苦手な人が絶対覚えるべき知識まとめ! | 英語を仕事で使えるレベルに伸ばす!認定英語コーチアキトの0→1英語塾

                TOEICの品詞問題が苦手な人が絶対覚えるべき知識まとめ! | 英語を仕事で使えるレベルに伸ばす!認定英語コーチアキトの0→1英語塾
              • 協調フィルタリングとベクトル検索エンジンを利用した商品推薦精度改善の試み | メルカリエンジニアリング

                こんにちは、メルカリのレコメンドチームで ML Engineer をしている ML_Bear です。 以前の記事 [1] では、item2vecと商品メタデータを用いた、メルカリのホーム画面のレコメンド改善のお話をさせていただきました。今回は商品詳細画面でレコメンド改善を行ったお話をさせていただきます。商品詳細画面の例は図1の通りです。ユーザーはアイテムの詳細な説明を見たいときにこの画面に来訪するため、同様の商品を推薦する自然な接点として非常に重要です。 まず、私たちが商品詳細画面で行った改善の概要を示します。各部の詳細については次節以降で詳しく触れます。 日本有数の大規模ECサービスにおいてベクトル検索ベースの商品推薦アルゴリズムを実装し、推薦精度の大幅な改善を実現しました。 協調フィルタリングとニューラルネットワーク (以下、NN) を利用した商品推薦アルゴリズムを構築し、コールドスタ

                  協調フィルタリングとベクトル検索エンジンを利用した商品推薦精度改善の試み | メルカリエンジニアリング
                • FOMO - Wikipedia

                  今やスマートフォンは常時、公私にわたりネットワークにつながり続けることを可能にした。こうなると「何か見逃しているものはないか」とひっきりなしに更新やメッセージをチェックせずにいられなくなることもある[1]。 FOMO(英: fear of missing out、フォーモ、取り残されることへの恐れ)とは、「自分が居ない間に他人が有益な体験をしているかもしれない」、と言う不安に襲われることを指す言葉である[2]。 また、「自分が知らない間に何か楽しいことがあったのではないか」、「大きなニュースを見逃しているのではないか」と気になって落ち着かない状態も指すことから、 「見逃しの恐怖」とも言う。社会的関係がもたらすこの不安は[3]、「他人がやっている事と絶え間なくつながっていたい欲求」と言う点で特徴づけられる[2]。 FOMOはまた「後悔に対する恐れ」とも言え[4]、それは社会関係、画期的体験、

                    FOMO - Wikipedia
                  • 科学における「キャンセルカルチャー」論争 - わが忘れなば

                    最近、英語圏において物理化学系の学術誌に発表されたあるエッセイを起点として、こんな専門誌を舞台に意外な、と思うほどの盛り上がりを見せた論争が起きた。それは、「キャンセルカルチャー」を巡るものなのだが、日本語圏ではこの論争についてほとんど紹介されていないようなので、今回の記事で簡単に紹介してみたい。 アンナ・クリロフ (Anna I. Krylov) が2021 年にアメリカ化学会が発行する物理化学の学術誌 The Journal of Physical Chemistry Letters に発表したエッセイ「科学を政治化することの危険 The Peril of Politicizing Science」*1は、左派的なイデオロギーが今日の科学界において検閲として働いていると指摘し、大きな評判を呼んだ。これに対して、同年フィリップ・ボール(Philip Ball)は、同誌において「科学はそも

                      科学における「キャンセルカルチャー」論争 - わが忘れなば
                    • オリパラの音楽担当になった小山田圭吾の悪評をredditに投稿しようと考えてる。

                      このグーグル翻訳を駆使した英文で大丈夫か教えてほしい。 (増田の仕様のせいで空行が入らないので読みにくいかも) 追記:ブコメですでに記事があるという指摘があったので、いまさら投稿しなくてもいいか。 なにかに流用したい人がいるかわからんが好きに使ってくれていい。 A creative member of the Tokyo Olympics opening ceremony music was found to have been a fierce bullying assailant in the past. Keigo Oyamada (born 1969) became a creative member of the Tokyo Olympics opening ceremony music. In an interview with a music magazine in the

                        オリパラの音楽担当になった小山田圭吾の悪評をredditに投稿しようと考えてる。
                      • 思考をコンピューターにリアルタイムで出力することにFacebookが成功

                        「思考をコンピューターで読み取る」というSFのような技術についての研究が、近年は実際に進んでいます。そんな中、2021年7月14日付けでFacebookが新たに、「脳卒中によって話す能力を失った人が、考えをコンピューターに出力する技術」を開発したと発表しました。 BCI milestone: New research from UCSF with support from Facebook shows the potential of brain-computer interfaces for restoring speech communication https://tech.fb.com/bci-milestone-new-research-from-ucsf-with-support-from-facebook-shows-the-potential-of-brain-comput

                          思考をコンピューターにリアルタイムで出力することにFacebookが成功
                        • DeepLearningについて、最近作ったもの、書いたもの、勉強したこと

                          こんにちは!逆瀬川 ( @gyakuse ) です。 今日は最近作ったもの、書いたもの、勉強したことを備忘録的にまとめていきたいと思います。 なぜ書くのか、なぜ学ぶのか DeepLearningの普及以降、Attention Is All You Need以降、Hugging Faceでの民主化以降、そしてStable DiffusionやChatGPTの登場以降、どんどんAGIへの距離が短くなってきています。未来は想定より大きく変わりそうです。どったんばったん大騒ぎのときはみんなが分かっておくべきことは効率的に共有すべきで、そのために書いています。書くためには論文等を読む必要があります。そしてそのためには基礎からしっかり学ぶことが大事です。次の一歩をみんなで歩んでいくために、学び、書いています。 間違ったことを言うかもしれませんが、それでも誰かのためになれば嬉しいです。あと、個人的にはこ

                            DeepLearningについて、最近作ったもの、書いたもの、勉強したこと
                          • 英語学習のためのデジタル環境整備

                            このブログの主目的は、(1)英語教育について根本的に考え直すこと、(2)英語教育現場の豊かな知恵をできるだけ言語化すること、です。このブログでの見解などは柳瀬個人のものであり、必ずしも柳瀬が所属する組織や団体などのものではありません。ブログ管理での技術的理由から「英語教育の哲学的探究2」よりこのブログに移行しました。 なお私が所属する京都大学・国際高等教育院・附属国際学術言語教育センター・英語教育部門のウェブサイトでは、学生さんの自律的な英語学習・使用を支援するための情報を多く提供しています。https://www.i-arrc.k.kyoto-u.ac.jp/english_jp 以下に紹介するのは、私が英語を学んだり使ったりするために使用しているデジタル環境(ウェブサイトやアプリ)の一部です。デジタル環境がそろうと英語を学び・使うことが楽しくなり、ますます英語に習熟することができます。

                            • 無償入手可能な音声コーパス/音声データベースの一覧 - Qiita

                              無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス

                                無償入手可能な音声コーパス/音声データベースの一覧 - Qiita
                              • NVIDIAが基調講演に使った「キッチンでしゃべるCEOの映像」が自社製ツールで作ったCGであることが明らかに

                                NVIDIAが2021年4月に行った基調講演について、ジェン・スン・ファンCEOが登壇するシーンの一部や撮影現場として用いられたキッチンなどが、3Dデザインコラボレーションプラットフォーム「NVIDIA Omniverse」で作成されたCGだったと明かしました。 NVIDIA Omniverse Changes the Way Industries Collaborate | NVIDIA Blog https://blogs.nvidia.com/blog/2021/08/11/omniverse-making-of-gtc/ Nvidia Reveals Its CEO Was Computer Generated in Keynote Speech https://www.vice.com/en/article/88nbpa/nvidia-reveals-its-ceo-was-co

                                  NVIDIAが基調講演に使った「キッチンでしゃべるCEOの映像」が自社製ツールで作ったCGであることが明らかに
                                • PyCon JP 2019で見たセッションの聴講記録20個分 / 資料・動画・関連リンクなど - フリーランチ食べたい

                                  2019年9月16日/17日に開催されたPyCon JP 2019で自分が直接/YouTubeで聴講したセッションについてのまとめです。主に下記の内容を書いています。 スピーカーURL 配信動画 スライド 発表内で出てきたライブラリなどのURL 自分の感想 「あのセッションで話していたライブラリなんだっけ」と思い出したい方やざっくり内容が知りたい方に読んでいただければ幸いです。PyCon JPに自分も発表者としても参加し、スタッフとして参加し、Webサイトの開発もしたので、それについては改めて書きたいと思います。 pycon.jp PythonとAutoML / 芝田 将 スピーカー: https://twitter.com/c_bata_ 動画: https://www.youtube.com/watch?v=Whkwu46DgBs スライド: https://www.slideshar

                                    PyCon JP 2019で見たセッションの聴講記録20個分 / 資料・動画・関連リンクなど - フリーランチ食べたい
                                  • AI Voice Generator & Text to Speech

                                    Rated the best text to speech (TTS) software online. Create premium AI voices for free and generate text-to-speech voiceovers in minutes with our character AI voice generator. Use free text to speech AI to convert text to mp3 in 29 languages with 100+ voices.

                                      AI Voice Generator & Text to Speech
                                    • 脳の信号をほぼ100%の精度で音声に変換するブレイン・コンピューター・インターフェースが登場

                                      脳の活動をテキストに変換して音声として読み上げることで、これまでで最も正確な97.5%の精度で思考を言葉にすることができるブレイン・コンピューター・インターフェース(BCI)が発表されました。この技術は、全身の筋肉の衰えにより言葉を話すことが難しくなる筋萎縮性側索硬化症(ALS)の人が、コミュニケーション能力を取り戻すのに役立つと期待されています。 An Accurate and Rapidly Calibrating Speech Neuroprosthesis | New England Journal of Medicine https://www.nejm.org/doi/full/10.1056/NEJMoa2314132 New brain-computer interface allows man with ALS to ‘speak’ again https://healt

                                        脳の信号をほぼ100%の精度で音声に変換するブレイン・コンピューター・インターフェースが登場
                                      • ウェブ上でネイティブアプリ並の機能を実現するPWAで利用できる機能をまとめてテストできるサイト「What PWA Can Do Today」

                                        プログレッシブウェブアプリ(PWA)は、ウェブ上でネイティブアプリと同様の使い勝手を実現するための仕組みで、2015年に概念が提唱されて以来、徐々に機能が増加しています。「What PWA Can Do Today」は、PWAで利用できるさまざまな機能について実際に試せるサイトです。 What PWA Can Do Today https://whatpwacando.today/ サイトにアクセスするとこんな感じ。最初に「Install to home screen」をクリックし、サイトをアプリとしてインストールします。 確認画面が表示されるので「インストール」をクリック。 デスクトップにアプリが追加されました。初回は自動で起動しますが、次回以降はこのアイコンをダブルクリックして起動します。 アプリを起動すると、さまざまな機能をテストできる画面が表示されました。「Media captur

                                          ウェブ上でネイティブアプリ並の機能を実現するPWAで利用できる機能をまとめてテストできるサイト「What PWA Can Do Today」
                                        • 「テックブログを書くハードルを少しでも下げたい」 OpenAIのAPIを使った「技術記事作成アプリ」の構想と実装

                                          毎回1つのテーマに絞り、テーマに対してのLTを行うTechDLT。「ChatGPT」をテーマにした「ChatGPTについてLT! TechDLT Vol.10」に登壇したのは、ほりゆう氏。OpenAI APIを用いた、技術ブログ記事作成アプリの開発について発表しました。 登壇者の自己紹介 ほりゆう氏(以下、ほりゆう):みなさま、本日はお時間をいただき、ありがとうございます。主催者のみなさま、参加者のみなさま、どうぞよろしくお願いします。「OpenAI APIを用いた技術ブログ記事作成アプリを開発した話」を紹介いたします。 まずは自己紹介からさせてください。私はエンジニアをしている堀越優希、ほりゆうと申します。もともと文系で、高等学校の国語科の教員をしていました。現在27歳です。エンジニアになったのは2020年の7月なので、今3年目くらいです。 ふだんはRailsやReactで開発をしていま

                                            「テックブログを書くハードルを少しでも下げたい」 OpenAIのAPIを使った「技術記事作成アプリ」の構想と実装
                                          • GitHub Copilot Chat 舐めていた - ちなみに

                                            marketplace.visualstudio.com GitHub Copilot と直接会話できる Copilot Chat 、皆さん使ってますか? 私は最近まともに使い始めました。 Copilot と言えば補完だけだと思っている人、以前ちょっとだけ触れて使えないと思った人(僕です)、いまのバージョンをもう一度触ってみてください、めっちゃ便利になっている。 www.youtube.com この動画が出来ることを追いかけるのに良さそうなので見てください。 ベースモデルがGPT-4に変わったりとかいろいろ変化はありますが、便利なのは Participant や Context の概念が入ったことだと思います。 Participantは @workspace みたいなやつで、Chat-GPTにおける GPTs みたいなやつ。例えば @workspace ならいま開いているプロジェクトについ

                                              GitHub Copilot Chat 舐めていた - ちなみに
                                            • DeNA目線で見る 音声変換の最先端 - Qiita

                                              (2021年5月13日追記)七声ニーナをリリースしました。DeNAの音声変換をご体験ください。 DeNAのAIシステム部、音声チームの豆谷と申します。私は2020年10月に新卒入社しましたが、2021年の新卒組として記事を書きます。 私は今まで音声合成や距離学習の研究をしてきて、音声変換(voice conversion;VC)については入社後キャッチアップしています。本記事では、DeNAの音声チームが注目する最先端の音声変換技術を紹介し、ユーザの喜びと驚きを生み出したいDeNA視点を交えながら解説します。 想定する読者は、音声変換に興味を持つ方、音声技術を生かして新たなエンタメ作りに挑戦したい方です。特に、 音声変換に関心がある学生がサクッと論文レベルで最先端の音声変換を把握できるようなお得な記事で 読者の「音声変換による新しいエンタメ作りに向けた研究開発の一歩」になる ように努めます。

                                                DeNA目線で見る 音声変換の最先端 - Qiita
                                              • カズオ・イシグロのキャンセル・カルチャー批判 - himaginary’s diary

                                                御田寺圭(白饅頭)氏の現代ビジネス記事が物議を醸している。同記事で白饅頭氏は、「リベラルは多様性を反映することを心掛けるべき」という趣旨のカズオ・イシグロの言を冒頭で引用した上で、リベラルにおける画一的な価値観への同調圧力を槍玉に挙げた。それに対し、記事を問題視する人たちは、そうしたリベラル批判をイシグロは口にしておらず、白饅頭氏はイシグロの発言を曲解している、と言う。 確かに、例えばこちらの白饅頭氏批判記事が指摘するように、白饅頭氏が引用した東洋経済のイシグロのインタビュー記事では、「キャンセルカルチャー」的なものへの懸念や言及は表明されていない。しかし実は、少し前のBBC記事でイシグロは、そうした懸念を明確に示している*1。この記事はBBCのインタビュー番組を基にしているが、こちらのテレグラフ記事では番組におけるイシグロの言葉がより長く引用されているので、以下に前半部分を紹介してみる。

                                                  カズオ・イシグロのキャンセル・カルチャー批判 - himaginary’s diary
                                                • GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

                                                  You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                    GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision
                                                  • Google Cloud Speech API vs. Amazon Transcribe - Qiita

                                                    文字起こしAPIガチンコバトル ググってざっと見れた範囲の「文字起こしAPI比較してみた」系記事では、数行(もしくは数分)レベルの非常に短い文字起こしを行いgood/badを述べているものが多いです。もしくはニュース動画のような"クリアすぎる音源"に対して行っているものも多いです。Amazon Transcribeについてバズっていたブログでも、英語での文字起こしで精度が高い話をしています。自然言語処理分野では英語の精度が高いのは知られているところですが日本語だとどうかというところが気になるところです。 自分が知りたいのは、 - 日本語の音源 - Podcastのように素人収録されたある程度ノイズが含まれた音源 - 1hくらいの長尺音源 - 複数人がクロストークしている音源 というような特徴を持った音声データに対してAPIだけでどこまで戦えるか(文字起こしできるか)だったので、いろいろ検証

                                                      Google Cloud Speech API vs. Amazon Transcribe - Qiita
                                                    • 「シーライオニング」と「ヌルヌルうなぎ論法」|ショーンKY

                                                      シーライオニングとは何か 最近「シーライオニングって何」という話が話題になっていた。これについて本場アメリカでどのように定義されているかを確認するため、ハーバード大学バークマンセンター"Perspectives on Harmful Speech Online: a collection of essays" (2017)収録のAmy Johnson "The Multiple Harms of Sea Lions" からテンプレ会話例を見てみよう。 "Where is the evidence for that opinion?" ... "But doesn’t [x] really mean [y]?" ... "What about [other issue]—how do you explain that?" ... "What’s wrong with a polite que

                                                        「シーライオニング」と「ヌルヌルうなぎ論法」|ショーンKY
                                                      • 同時通訳でスピーチがもっともらしくなる

                                                        1971年東京生まれ。デイリーポータルZウェブマスター。主にインターネットと世田谷区で活動。 編著書は「死ぬかと思った」(アスペクト)など。イカの沖漬けが世界一うまい食べものだと思ってる。(動画インタビュー) 前の記事:リモート他人の人生ごっこ > 個人サイト webやぎの目 登場人物 林:オリンピックの閉会式だけに出たい 岡田:ラジオDJ・ナレーター、英語ができて声がいい。僕のスピーチを英語で吹き替えてもらう 乙幡:デイリーポータルZライター。ナレーター経験あり、もっともらしい落ち着いた声を出す。モノマネが得意。 今回やろうとしていることの図 まずはもとのどうでもいい話 林:喋りながら同時にICレコーダーとかで録ってもらって、そのデータをメールとかメッセンジャーで送ってください。おれがプレミアで音声を重ねていくので。 岡田:ICレコーダーはこんなだよ。でもマイクは超いいやつだから 林・乙

                                                          同時通訳でスピーチがもっともらしくなる
                                                        • 米国政府によるTiktok禁止、何が問題なのか | p2ptk[.]org

                                                          米国政府によるTiktok禁止、何が問題なのか投稿者: heatwave_p2p 投稿日: 2023/3/252023/3/25 Electronic Frontier Foundation 言論と自由と結社の自由には、コミュニケーション技術を選択する権利も含まれる。何を言うか、どこで言うか、誰に言うかを政治家に指図させてはならない。 多くの人が世界中の人々と情報交換するために選択した技術であるTikTokに対し、米国で規制を求める声が高まっていることを我々は懸念している。そうした踏み込んだ行動に出る前に、政府は少なくとも現実の問題とその必要最低限(narrow tailerd: 厳密に調整された)の解決策を具体的な証拠に基づいて提示しなければならない。今のところ、政府はそれをやっていない。 ソーシャルメディアプラットフォームをふくめ、ほぼすべてのオンラインビジネスが膨大な個人データを収集

                                                            米国政府によるTiktok禁止、何が問題なのか | p2ptk[.]org
                                                          • Exclusive: Prime Minister Fumio Kishida on Japan's Future

                                                            Japanese Prime Minister Fumio Kishida inside the great hall at his official residence in Tokyo on April 28.Ko Tsuchiya for TIME The official residence of Japan’s Prime Minister is a spooky place. Inspired by American architect Frank Lloyd Wright, the stone and brick mansion in central Tokyo had been around for only three years when young naval officers charged in and assassinated Prime Minister Ts

                                                              Exclusive: Prime Minister Fumio Kishida on Japan's Future
                                                            • Xboxにて“運転免許証”のような悪質プレイヤー取り締まり新システム発表。違反点数を累積、最大1年間オンラインから締め出す - AUTOMATON

                                                              マイクロソフトは8月16日、Xbox One/Xbox Series X|Sにおいて悪質なプレイヤーを取り締まる新システムを導入することを発表した。違反点数が累積されていく、運転免許証のような仕組みが採用されるそうだ。 As Xbox continues to foster a safe and inclusive environment, we are introducing an enforcement strike system to help players better understand how their actions on the platform impact their overall gaming experience. Learn more here: https://t.co/RLA19oYSli — Xbox Wire (@XboxWire) August

                                                                Xboxにて“運転免許証”のような悪質プレイヤー取り締まり新システム発表。違反点数を累積、最大1年間オンラインから締め出す - AUTOMATON
                                                              • 声帯の損傷やマヒがある人でも話せるようになる「喉に貼るパッチ」が開発される

                                                                by Jun Chen Lab at UCLA 咽喉がんの手術や声帯ポリープなどの影響で声帯が使えなくなってしまった人でも話せるようになる「喉に貼るパッチ」を、カリフォルニア大学ロサンゼルス校の研究チームが開発しました。このパッチは小さくて伸縮性があり、発話に伴う筋肉の動きのみで発電するためバッテリーやプラグも不要とのことです。 Speaking without vocal folds using a machine-learning-assisted wearable sensing-actuation system | Nature Communications https://www.nature.com/articles/s41467-024-45915-7 New throat patch can turn muscle movements into speech https:/

                                                                  声帯の損傷やマヒがある人でも話せるようになる「喉に貼るパッチ」が開発される
                                                                • 自動文字起こしや自動音声読み上げモデルをオープンソースで開発する「Coqui」メンバーは元Mozillaエンジニア

                                                                  収録した音声をそのままテキストに自動で文字起こしするSpeech to Text(STT、音声テキスト変換)モデルや、入力したテキストを自動音声で読み上げるText to Speech(TTS、テキスト音声変換)モデルをオープンソースで開発する企業が「Coqui」です。 Coqui https://coqui.ai/ Coquiの創設者たちはもともとFirefoxやThunderbirdの開発で知られるMozillaに在籍していました。創設者たちは音声技術が大企業によって独占され、オープンソースで提供されなくなるかもしれないと考え、独立して企業を立ち上げ、オープンソースの音声認識エンジンを構築したとのこと。 CoquiのSTTモデル「Coqui STT」のリポジトリはGitHubにホストされています。Coqui SSTの特徴は、あらかじめ音声ライブラリが用意されているのではなく、あらかじめ

                                                                    自動文字起こしや自動音声読み上げモデルをオープンソースで開発する「Coqui」メンバーは元Mozillaエンジニア
                                                                  • Azure OpenAI Service On Your Data の仕組みと使う上で気を付けるべきポイント

                                                                    はじめに Microsoft Build 2023 で発表された Azure OpenAI Service の On Your Data のパブリックプレビューが開始 しました。体感的には On Your Data は日本国内の全 Azure OpenAI Service ユーザーのうち 8 ~ 9 割程度のユーザーが待ち望んでいた機能ではないかと感じます。(ryohtaka 調べ) What's new in Azure OpenAI Service - June 2023 New easy way to add your data to Azure OpenAI Service (YouTube) しかし、実際に On Your Data を活用するためには気を付けるべきポイントが数多く存在しており、正確な期待値を持ったうえで使うことが非常に重要になってきます。そこで、本記事では On

                                                                      Azure OpenAI Service On Your Data の仕組みと使う上で気を付けるべきポイント
                                                                    • 機械学習を用いたテキスト正規化手法の最新動向 高精度を実現する仕組み

                                                                      2019年9月19日「MACHINE LEARNING Meetup KANSAI #6」が開催されました。関西のIT企業が協力して開催している機械学習エンジニアのためのコミュニティイベント「MACHINE LEARNING Meetup KANSAI」。第6回となる今回は、LINE、オムロン、パナソニックシステムデザインの3社がプレゼンテーションを行いました。「機械学習を用いたテキスト正規化手法の動向」に登壇したLINE株式会社の朴炳宣氏は、LINEにおける音声合成技術の紹介と、近年のテキスト正規化手法の動向を解説しました。 機械学習を用いたテキスト正規化の今 朴炳宣氏(以下、朴):ただいま紹介いただきました、LINE株式会社の朴でございます。大勢の方の前でしゃべることはなかなかないので緊張していますが、よろしくお願いします。 まず自己紹介からですが、私、名前から察していただけるように、

                                                                        機械学習を用いたテキスト正規化手法の最新動向 高精度を実現する仕組み
                                                                      • OpenAI Whisper に追加学習をさせる試み | IIJ Engineers Blog

                                                                        地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 【IIJ 2022 TECHアドベントカレンダー 12/8(木)の記事です】 Whisperの追加学習に挑む2022年の冬 2022年アドベントカレンダー企画だそうです。 いかがお過ごしでしょうか。 私はもう興味を引くものに没頭するしか楽しみがないもんで、PCに向かってぼんやり面白いネタはないかなーと探す日々です。 最近はすっかりディープラーニングにズブズブで、とうとう数式かくのが面倒なあまり手書き入力のためのペンタブレットを買いました。てへ。 今回は9月から10月にかけてStabl

                                                                          OpenAI Whisper に追加学習をさせる試み | IIJ Engineers Blog
                                                                        • Twilioを利用した障害時の自動連絡網システムについて - BASEプロダクトチームブログ

                                                                          この記事はBASE Advent Calendar 2020の5日目の記事です。 SRE Groupのngswです。 Eコマースプラットフォーム「BASE」における障害発生時に、社内関係者に連絡網に基づいて電話発信するシステムを構築しました。 このエントリでは、その導入までの経緯と具体的な当該システムの説明をします。 TL;DR 「BASE」で問題が発生した際に意思決定者に電話発信する周知システムを構築した 「導入前に考えたこと」をまず主題として書いた 参考URL記事のまま手順であるが、それでも導入時に詰まった事柄など落ち穂拾い的に追記した 謝辞 Twilio FunctionsとStudioを使って連続架電を行う - Qiita 大変わかりやすい記事であり、ほぼすべてを参考にさせていただいた。このQiita記事がなければ短期間で実現することは不可能であったと考える 導入に至る経緯 07月

                                                                            Twilioを利用した障害時の自動連絡網システムについて - BASEプロダクトチームブログ
                                                                          • Twitterが抱える「モデレーション問題」をイーロン・マスクはどう舵取りするのか(集中連載「揺れるTwitterの動きを理解する」第3回) | テクノエッジ TechnoEdge

                                                                            ブロガー・著者・研究者。ブログLifehacking.jp管理人。著書に「ライフハック大全」「知的生活の設計」「リストの魔法」(KADOKAWA)など。理学博士。 @mehori イーロン・マスクによる買収で急激に変化しつつある巨大SNS「Twitter」の動きを解説する、堀正岳氏による集中連載の完結編である第3回は、モデレーション問題について。集中連載「揺れるTwitterの動きを理解する」の第1回、第2回はこちら。 連載第1回:イーロン・マスク氏はなぜTwitterの収益化を急ぐのか 連載第2回:なりすまし防止か有名人の証か。Twitterの認証バッジをめぐる経緯と混乱 英語圏ではTwitterを買収したイーロン・マスク氏のことを "Twitter's most important shitposter"「最も重要なクソツイッタラー」と紹介する人がいます。多少品がないとはいえ、この紹介

                                                                              Twitterが抱える「モデレーション問題」をイーロン・マスクはどう舵取りするのか(集中連載「揺れるTwitterの動きを理解する」第3回) | テクノエッジ TechnoEdge
                                                                            • Very Short Introductionの邦訳まとめ - 清く正しく小賢しく

                                                                              オックスフォード大学出版会のVery Short Introductionという有名な入門書シリーズがある。短くて内容も平易なので、まずはこの1冊という感じで推薦されることも多いシリーズだ。 さて、このシリーズは当然ながら邦訳もたくさん出ているのだが、複数の出版社がそれぞれの形で刊行しているため、どれがVery Short Introductionの邦訳なのか分からないという問題がある。 ありがたいことにオックスフォード大学出版会が以下のページに邦訳の一覧をエクセルのファイルで貼ってくれているが、ちょっと見にくい。*1*2 Very Short Introductions - Oxford University Press www.oupjapan.co.jp ということで、このページではVery Short Introductionの邦訳を一覧の形でまとめてみた。無秩序に並べていくのもな

                                                                                Very Short Introductionの邦訳まとめ - 清く正しく小賢しく
                                                                              • 【LLMの研究者向け】400本を超えるLLMに関する論文のリストを公開・更新しています - Qiita

                                                                                自身の研究のためにLLMに関する論文を表形式でまとめています。 このレポジトリでは特にさまざまな分野の論文を表にする(Comprehensive)ことを目的としています。具体的には以下のキーワードに注目しています。 CoT / VLM / Quantization / Grounding / Text2IMG&VID / Prompt / Reasoning / Robot / Agent / Planning / RL / Feedback / InContextLearning / InstructionTuning / PEFT / RLHF / RAG / Embodied / VQA / Hallucination / Diffusion / Scaling / ContextWindow / WorldModel / Memory / ZeroShot / RoPE / Spe

                                                                                  【LLMの研究者向け】400本を超えるLLMに関する論文のリストを公開・更新しています - Qiita
                                                                                • パターンプラクティスとは?英語学習への効果・正しいやり方を丁寧に解説 瞬間英作文との違いとは!? - ポリグロットライフ | 言語まなび∞ラボ

                                                                                  はじめに 今回はパターンプラクティスについて考えていきます。パターンプラクティスとはどのようなトレーニングなのでしょうか。英語学習への効果や正しいやり方を丁寧に解説していきます。瞬間英作文との違いも整理しています。パターンプラクティスを正しく理解して、ぜひ実践してみてください。 ↓こちらでトレーニングができます www.youtube.com パターンプラクティスとは パターンプラクティスの歴史 オーラルメソッドの普及 アーミーメソッドの展開 オーディオリンガルメソッドの開発 よくある勘違い 文型学習(文法学習)を無視する 置換・転換・拡張トレーニングをしないで満足する パターンプラクティスだけで話せるようになる パターンプラクティスの目的 パターンプラクティスの効果・メリット 運用可能な文法知識の獲得 簡単な小説を訳を介せずにスラスラ読める 「話すための瞬間英作文」でパターンプラクティス

                                                                                    パターンプラクティスとは?英語学習への効果・正しいやり方を丁寧に解説 瞬間英作文との違いとは!? - ポリグロットライフ | 言語まなび∞ラボ