並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 370件

新着順 人気順

speechの検索結果81 - 120 件 / 370件

  • イーロン・マスクが「Xの広告売上不振の原因はユダヤ人団体」だとして訴訟を起こすと脅迫

    イーロン・マスク氏が2022年にX(当時はTwitter)を買収して以来、主要広告主の多くがXへの出稿を停止し同社の広告収入が低迷するなど、Xは主要な収益源である広告事業での苦戦が続いています。そんな中、CEOの職を退きXのCTO兼任取締役となったマスク氏が、広告収入の低迷の原因はユダヤ人団体であるとして、告訴を示唆する発言をXに投稿しました。 Elon Musk blames Anti-Defamation League for ad sales slump, threatens lawsuit https://www.axios.com/2023/09/04/elon-musk-anti-defamation-league-x-ad-sales-slump Elon Musk 'likes' trending #BanTheADL posts as white supremacist

      イーロン・マスクが「Xの広告売上不振の原因はユダヤ人団体」だとして訴訟を起こすと脅迫
    • OpenAI Dev Dayで発表されたこと15選【プロンプトエンジニア必見 | 和訳 | まとめ】

      Context Windowとは、「最大の入出力の合計トークン数」を表します。 たとえば、Context Windowが8Kの場合は、4Kのトークン数が入力された場合、出力は4Kのトークン数の長さに制限されます。 トークン数について詳しく知りたい方は、こちらをご参照ください。 ちなみに、128KのContext Windowは、PDF約300ページ以上のテキストに相当するため、かなり感動的ですね! これまで、プロンプトエンジニアの多くは、Context Windowの制約に悩まされていたと思います。 この技術的な問題に対応するために、RAGを使用したり、Map ReduceやMap RerankやRefineを使用したり、Fine-tuningを駆使したりしていたと思います。 それに加えて、GPT-4は、API利用料金がGPT-3.5に比べて、かなり高価格であることが問題としてありました。

        OpenAI Dev Dayで発表されたこと15選【プロンプトエンジニア必見 | 和訳 | まとめ】
      • The Unification Church's Global Grasp for Power

        Reverend Sun Myung Moon gestures dramatically as he speaks at New York's Madison Square Garden. His chief associate, Col. Bo Hi Park, right, translates from Korean to English.Bettmann Archive/Getty Images It was 11.29 a.m. beneath pewter skies in Japan’s southern city of Nara when Shinzo Abe was handed the microphone. The nation’s former prime minister, wearing a navy blue jacket and crisp white s

          The Unification Church's Global Grasp for Power
        • WebKit Features in Safari 17.0

          Sep 18, 2023 by Jen Simmons and the Safari / WebKit Team Today’s the day for Safari 17.0. It’s now available for iOS 17 and iPadOS 17. [Update September 26th] And now, Safari 17.0 is available for macOS Ventura, and macOS Monterey, and macOS Sonoma. Safari 17.0 is also available in the vision OS Simulator, where you can test your website by downloading the latest beta of Xcode 15, which supports t

            WebKit Features in Safari 17.0
          • Mozilla/whisperfile · Hugging Face

            OpenAI Whisper - llamafile Whisperfile is a high-performance implementation of OpenAI's Whisper created by Mozilla Ocho as part of the llamafile project, based on the whisper.cpp software written by Georgi Gerganov, et al. Model creator: OpenAI Original models: openai/whisper-release Origin of quantized weights: ggerganov/whisper.cpp The model is packaged into executable weights, which we call whi

              Mozilla/whisperfile · Hugging Face
            • ローカル環境で音声・立ち絵付きのAIと会話できるソフトウェア ez-chat-llm を作りました。

              ※つくよみちゃんイラスト素材:花兎*さん 概要(忙しい人向け) 手軽にローカル LLM (音声・立ち絵付き) と会話できるソフトウェア ez-chat-llm を開発しました。動作の様子は動画 (https://www.nicovideo.jp/watch/sm43196446) からご覧いただけます。 ez-chat-llm は、GitHub のリポジトリ (https://github.com/offtoung/ez-chat-llm) から利用できます。また、Google Colab Pro をお使いの方は、ノートブックから簡単に試せます。 副産物として、Pythonから簡単に利用できる音声合成ライブラリ eztts ができました。なんと、このために音声合成モデルをフルスクラッチで学習するという手の込みようです。 上記の GitHubリポジトリをクローンしたディレクトリに入り、次のよ

                ローカル環境で音声・立ち絵付きのAIと会話できるソフトウェア ez-chat-llm を作りました。
              • 脳オルガノイドをコンピューターに接続、日本語の音声認識に成功

                ヒト「脳オルガノイド」をコンピューター・チップに接続し、単純な計算タスクを実行できるシステムが開発された。新しいバイオ・コンピューターの可能性を示している。 by Abdullahi Tsanni2023.12.12 24 9 米研究チームが、シャーレの中で培養されたヒトの脳細胞の塊である「脳オルガノイド」を電子チップに接続し、簡単な計算タスクを実行することに成功。新たな研究成果として発表した。 発表したのは、インディアナ大学ブルーミントン校のフェン・グオ准教授らの研究チーム。幹細胞から作製した脳オルガノイドをコンピューター・チップに取り付けた「ブレイノウェア(Brainoware)」と呼ばれるセットアップを構築。人工知能(AI)ツールに接続した。研究チームは、このハイブリッド・システムが、情報を処理、学習、記憶できることを明らかにした。初歩的な音声認識の実行にも成功したという。12月11

                  脳オルガノイドをコンピューターに接続、日本語の音声認識に成功
                • 受賞記念講演(1/4) | 永井玲衣 | 受賞者一覧 | (池田晶子記念)わたくし、つまり Nobody賞

                  2024年3月27日 第17回(池田晶子記念)わたくし、つまりNobody賞 受賞記念講演 「暴力に抗して」 永井 玲衣 この度は、第17回「わたくし、つまりNobody賞」という大変栄誉ある賞をたまわりまして、誠にありがとうございます。また、このような贈呈式を設けてくださったことに、心から感謝申し上げます。 わたしが哲学を志すきっかけになったのは、ジャン=ポール・サルトルの『実存主義とはヒューマニズムである』という講演録に出会ったためです。かれは、興奮する聴衆をかきわけ、両手をポケットにいれたまま、ノートも見ずに自分の言葉で話したといいます。かれの言葉に心をふるわせ、哲学の道にはいり、今こうしてここに立つことができています。彼にならって、ポケットに手をいれながら話したいのですが、わたしにはまだ道遠く、手紙をよむように、みなさまに言葉をとどけたく思います。 この暴力の時代に、ひたすら考え、

                  • チームの公用語を英語にした話 A story about making English our team's official language - ANDPAD Tech Blog

                    See below for the English version. この記事はANDPAD Advent Calendar 2023 22日目の記事です。 こんにちは、リアーキテクティングチームの白土(@kei_s)です。今回は、我々のチームの公用語を英語にしたお話のご紹介です。 リアーキテクティングチームとは ANDPADシステムでの複数のドメインに横断した問題に対応するため、「リアーキテクティングチーム(略称: リアーキチーム)」という名前の専任チームを組織し開発課題に対応しています。現在主に Rails アプリケーションに関連する改善を行っています。ブログやイベントで取り組みをいくつかご紹介しているので、興味があればぜひご覧ください! Kaigi on Rails 2022 「実践 Rails アソシエーションリファクタリング」で伝えきれなかったこと - ANDPAD Tech B

                      チームの公用語を英語にした話 A story about making English our team's official language - ANDPAD Tech Blog
                    • AWS Lambda でOpenAI の Whisper API を 認識精度の改善も含めて試してみた | DevelopersIO

                      はじめに AWS LambdaでOpenAIのWhisper APIを試してみました。 OpenAIには音声データから文字起こししてくれる「Whisper」という音声認識モデルがあり、WhisperをAPIの形で呼び出すWhisper APIが存在します。日本語ももちろん対応してます。 今回は、AWS LambdaがS3バケットに保存された音声データを元にWhisper APIで文字起こしして、精度を確認してみたいと思います。 OpenAIアカウントAPIキーの発行 OpenAIアカウント作成後、APIキーの発行をします。 APIキーの発行は、アカウントの View API keys をクリックします。 Create new secret key をクリックすると、API keyが発行されますので、コピーしておきます。 S3バケット 拡張子がwavの音声ファイルをS3バケットに保存しました

                        AWS Lambda でOpenAI の Whisper API を 認識精度の改善も含めて試してみた | DevelopersIO
                      • 人間らしい音声の合成を目指して感情の表現も可能なオープンソースの読み上げAI「StyleTTS 2」が登場

                        大規模音声言語モデル(SLM)と拡散モデルによる敵対的学習を利用して、人間レベルの読み上げ音声を合成できるText-to-Speech AI「StyleTTS 2」を、コロンビア大学の研究者らが開発しました。StyleTTS 2は参照する音声を必要とせず、読み上げるテキストに最適なスタイルを生成し、ネイティブスピーカーと同じくらいなめらかに英語を読み上げることが可能です。 [2306.07691] StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models https://arxiv.org/abs/2306.07691 GitHub - yl4579/StyleTTS2: StyleTTS

                          人間らしい音声の合成を目指して感情の表現も可能なオープンソースの読み上げAI「StyleTTS 2」が登場
                        • An Interview With Jack Dorsey

                          jack dorsey on his exit from bluesky, how twitter lost its way, jack’s strategy for ending censorship forever, new background on the elon saga, and the death of social media as we know it Bluesky was launched to become the open source protocol layer for social media platforms, but the team ended up “literally repeating all the mistakes we made” at TwitterJack’s challenges at Twitter: a hostile boa

                            An Interview With Jack Dorsey
                          • An Open Letter on the Misuse of Holocaust Memory | Omer Bartov

                            We the undersigned are scholars of the Holocaust and antisemitism from different institutions. We write to express our dismay and disappointment at political leaders and notable public figures invoking Holocaust memory to explain the current crisis in Gaza and Israel. Particular examples have ranged from Israeli Ambassador to the UN Gilad Erdan donning a yellow star featuring the words “Never Agai

                              An Open Letter on the Misuse of Holocaust Memory | Omer Bartov
                            • 【WhisperSpeech】Whisperがさらに高性能になった音声モデルを使ってエミネムにゆっくり喋らせてみた | WEEL

                              WEELメディア事業部LLMリサーチャーの中田です。 1月18日、Whisperを利用したText-to-Speechモデル「WhisperSpeech」のアップデート版を、Collaboraが公開しました。 このAIモデルを用いることで、テキストを入力するだけで、簡単にそのテキストを(AIが)読み上げることができるんです、、、! 参考:https://github.com/collabora/WhisperSpeech GitHubでのスター数は、すでに1700を超えており、期待度が高いことを示しています。 この記事ではWhisperSpeechの使い方や、有効性の検証まで行います。本記事を熟読することで、WhisperSpeechの凄さを実感し、そこら辺のTTSには戻れなくなるでしょう。 ぜひ、最後までご覧ください。 WhisperSpeechの概要 WhisperSpeechはCol

                              • 吹き出しに句読点があるのは少年漫画だけ?(デジタルリマスター)

                                聞いたところによると、漫画の吹き出しに句読点があるのは少年漫画だけなのらしい。へー、今までそんなの気にしたこと無かった、と思って見てみると、確かに句読点がある。 逆に少女漫画の吹き出しには句読点が無いのだという。へー、と思って見てると確かにない。句読点が無い。 どういう事なのか調べてみました。 ※2010年4月に掲載された記事を、AIにより画像を拡大して加筆修正のうえ再掲載しました。 あばよ涙、よろしく勇気、こんにちは松本です。 1976年千葉県鴨川市(内浦)生まれ。システムエンジニアなどやってましたが、2010年にライター兼アプリ作家として自由業化。iPhoneアプリはDIY GPS、速攻乗換案内、立体録音部、Here.info、雨かしら?などを開発しました。著書は「チェーン店B級グルメ メニュー別ガチンコ食べ比べ」「30日間マクドナルド生活」の2冊。買ってくだされ。(動画インタビュー)

                                  吹き出しに句読点があるのは少年漫画だけ?(デジタルリマスター)
                                • Top Website Accessibility Testing Tools For Inclusive Web Design

                                  In an increasingly digital age, the internet serves as a vital resource for information, communication, commerce, and entertainment. However, for the millions of people living with disabilities, navigating the web can present significant challenges. Web accessibility addresses these challenges by ensuring that websites, tools, and technologies are designed and developed to be usable by everyone, r

                                    Top Website Accessibility Testing Tools For Inclusive Web Design
                                  • 大承認AIブラザーズ! - CARTA TECH BLOG

                                    この記事はCARTA TECH BLOGアドベントカレンダー12/1の記事になります。 こんにちは! @jewel_x12 です!去年のアドベントカレンダーではAIの考えた料理を調理して食うという記事を書いてましたが、今回も懲りずに生成AIネタです。 techblog.cartaholdings.co.jp みなさんは……「承認」足りてますか……?「いいね!」とか「すごいね!」とかたくさんもらってますか? 自分は社歴も長くなり、フィードバックされるよりもすることの方が多くなってきて、もうちょっと「承認」がほしいところです。その底知れぬ承認欲求の器は満たされておりません。 承認欲求を満たしたい……でも他人からのフィードバックに依存するので、コントローラビリティが低い……どうにかこうにか、好きなときに好きなだけ承認欲求を満たせないでしょうか……?好きなときに好きなだけめちゃくちゃ褒めてくれるア

                                      大承認AIブラザーズ! - CARTA TECH BLOG
                                    • ちゃっかり繁栄する印度、しない日本

                                      2024年3月6日 田中 宇 印度は、2年前のウクライナ開戦以来、米国側と非米側の両方の利権や協力関係に乗っかり、良いとこ取りしてちゃっかり独自の繁栄と台頭を続けている。昨秋には年率8%以上の経済成長をした。 (India ‘easily’ world’s fastest-growing economy – IMF) 印度は、昔から中国と国境紛争で対立・戦争しており中国敵視だ。その点で米国やG7、AUKUSから仲間と見なされ、クワッド(米日豪印)など米国側の中国包囲網に参加し、経済的・軍事外交的な利得を得ている。 また印度は昔から、イスラム主義のパキスタンと対立・戦争してきた。近年はヒンドゥ第一主義を掲げるモディ首相らBJPが権力を握り、イスラム敵視を国是に定め、アヨドヤのモスクをヒンドゥ寺院に作り替える案件や、国内ムスリムへの弾圧を続けている。 印度は、パレスチナ問題においてもイスラム敵

                                      • 画像生成AIの病理学的論考 |嘯(しゃお)

                                        画像生成AIが広く使われるようになり、既に1年半以上が経過した。Midjourneyのサービス開始が2022年7月、Stable diffusionの公開が2022年8月である。画像生成AIは、文字を打ち込むことで画像を生成するという画期的な技術であり、その手軽さや品質から「創作」との相性がよくも思えるが、実際は様々な課題が表出し、現在解決に至っているとは言えない。単なる画像生成だけでなく、画像編集技術や付随的な陰影算出技術などが開発されているにも関わらず、である。画像生成AIに対する意見というのは好意的なものから否定的なものまで幅広く、その意見の幅は興味深い。ここでは、なぜ課題が生まれ、何が問題となっているのか、なぜ分断が生まれるのかという点に注目し、その背景的心理などを言語化し考察したい。生成AI利用の是非を問うものではなく、なぜ分断がここまで起きているのか、という点に注目する。あくま

                                          画像生成AIの病理学的論考 |嘯(しゃお)
                                        • 東工大の卒業式で祝辞、述べてみた|ina111 / 稲川貴大

                                          母校の東京工業大学の卒業式(正式には学位授与式、学部および大学院の2回)で来賓として祝辞を読む機会を頂いた。2024年3月26日。 東工大は24年10月には東京医科歯科大学と合併して東京科学大学となるので、「東京工業大学」としては最後の春の卒業式だった。 そんな大事な機会に、もっと王道的に凄い卒業生がアボガドロ定数ほどいる中で、私を推薦してくれた益学長には感謝です。 聞いてる卒業生・親御さんたちに、眠くならない時間を提供出来たので良かった。加えて、なにか新しいことやろうという気持ちの人が一人でも出てきたら嬉しい。 祝辞国内屈指の大学の卒業式に同席できて光栄です。 最初に、自己紹介します。 私は10年ちょっと前に機械系で学部、修士と東工大を出ました。 今は宇宙開発、民間でのロケット開発を行うベンチャー、スタートアップ企業の社長をしています。 創業時の11年前は数人で始めた会社は、今では170

                                            東工大の卒業式で祝辞、述べてみた|ina111 / 稲川貴大
                                          • Google Cloud上でGoogleの次世代のASR(自動音声認識)モデル「Chirp」を使ってみた | DevelopersIO

                                            こんちには。 データアナリティクス事業本部 インテグレーション部 機械学習チームの中村です。 この記事は、ブログリレー『Google CloudのAI/MLとかなんとか』の3本目の記事になります。 今回は、Vertex AIからGoogleの次世代のASR(自動音声認識)モデル「Chirp」を使ってみたいと思います。 Chirpについて 以下に詳しい説明があります。 Chirp: Universal speech model  |  Cloud Speech-to-Text V2 documentation  |  Google Cloud ChirpはGoogleの次世代音声認識モデルで、現在の音声モデルとは異なるアーキテクチャで学習させたモデルとなっているようです。 Google CloudではCloud Speech-to-Text V2における一つのモデルとして使用できます。その他

                                              Google Cloud上でGoogleの次世代のASR(自動音声認識)モデル「Chirp」を使ってみた | DevelopersIO
                                            • ついにX(旧Twitter)に広がるヘイトスピーチとフェイクニュースについて欧州委員会が調査開始、イスラエルとハマスの戦争がきっかけ

                                              ソーシャルメディアプラットフォームのX(旧Twitter)に偽情報や違法コンテンツがあふれている点が、欧州委員会(EC)が定めるデジタルサービス法(DSA)に違反している可能性があるとして、ECが正式な調査手続きを開始しました。 Commission opens formal proceedings against X under the DSA https://ec.europa.eu/commission/presscorner/detail/en/ip_23_6709 X to be investigated for allegedly breaking EU laws on hate speech and fake news | X | The Guardian https://www.theguardian.com/technology/2023/dec/18/x-to-be-i

                                                ついにX(旧Twitter)に広がるヘイトスピーチとフェイクニュースについて欧州委員会が調査開始、イスラエルとハマスの戦争がきっかけ
                                              • 自力でコード書けない非エンジニアがGPT4新機能ハッカソン24耐で優勝する話|Focus On The Interaction Magazine

                                                汝アプライせよ、さらば道は開かれん去る2023年11月17日、「GPT4ハッカソン24耐」というイベントが開催されました。 2023年11月6日にリリースされた、OpenAIのGPT-4を中心とした新しい機能を使って24時間で何か作ろう!と言うハッカソンです。 私はタイトルの通りコードが自力で書けないし、主催者のShi3zさんの開催告知には下記の通り「とにかくガチ勢だけ来てほしい」とあります。 Shi3zさんのnoteより勇気を持ってアプライするところから始まる学習もありますが、少し門外漢が過ぎるな、と指を咥えておりました。 ハッカソンの開催も目前に迫った11月12日、Shi3zさんから「GPTsで参加してもいいよ」の発信がありました。 Shi3zさんのnoteよりこの時点で開催5日前、私は朝から、職場、マンガ仲間、AI勉強している仲間などに呼びかけました。 参加するには、最低2名のチーム

                                                  自力でコード書けない非エンジニアがGPT4新機能ハッカソン24耐で優勝する話|Focus On The Interaction Magazine
                                                • GPTのAPIとText2Speechを組み合わせてAIとの会話体験を実装してみる | DevelopersIO

                                                  はじめに OpenAIのDevDayで発表されたText2SpeechのAPIを使ってみたいと思います。Text2Speechとは簡単にいうとテキストの読み上げ機能です。 日本語を読ませる場合、まだ少し英語訛りですが、なかなか人間っぽい発音を行います。 今回はこのText2SpeechのAPIを使って遊んでみたいと思います。 なにを作るのか? 先程記載したように、Text2Speechでは発話を行うことができます。 この特徴とGPTの会話ができる特性を組み合わせれば、会話っぽいことができるのではないかと思い実装してみました。 今回は試験的に実装を行うため、GPTには「動物博士」としてのロールを与えて動物の雑学を教えてもらいました。 完成形は以下のような動画になります。Text2Speechを利用しているため音声ONの状態での閲覧を推奨します。 発音が英語話者っぽくなっていることや漢字を稀に

                                                    GPTのAPIとText2Speechを組み合わせてAIとの会話体験を実装してみる | DevelopersIO
                                                  • toB 向け E ラーニングシステムに ChatGPT を導入して業務効率化を達成した事例について語ってもらいました | MEDLEY Developer Portal

                                                    2023-11-30toB 向け E ラーニングシステムに ChatGPT を導入して業務効率化を達成した事例について語ってもらいましたはじめにエンジニアの山田です。 弊社のニュースリリースにあるのですが、ジョブメドレーアカデミー(以下、アカデミー)では Azure OpenAI Service の GPT モデルを駆使した新機能「研修作成アシスタント」をリリースしています。 この生成 AI を活用した機能により研修作成担当者の作業時間を 75%軽減し、業務効率化に寄与するものになっています。 今回はこの研修作成アシスタントの開発について、担当した二人に話を聞きました。 インタビュイー紹介岸田さんSES 企業で業務システム開発、オフショア開発をしている会社でブリッジエンジニアという経験を経て、2019 年メドレー入社。 その後ジョブメドレーで開発をリード。現在はアカデミーのプロダクト責任者

                                                      toB 向け E ラーニングシステムに ChatGPT を導入して業務効率化を達成した事例について語ってもらいました | MEDLEY Developer Portal
                                                    • ロバート・デ・ニーロがスピーチ原稿を勝手に差し替えられ「よくもそんなことをするものだ」と激怒、Appleの検閲に対抗してオリジナルの原稿を読み上げ

                                                      俳優のロバート・デ・ニーロによる映画賞授賞式のスピーチ原稿が発表直前に差し替えられ、ドナルド・トランプ元大統領を批判する部分がごっそり削られるという事態が発生しました。デ・ニーロは原稿が変更されていることにスピーチを行うために登壇した壇上で気づいたそうで、差し替えを行ったAppleを非難しています。 Apple Removed Trump Comments From Robert De Niro Gotham Speech https://variety.com/2023/film/news/robert-de-niro-apple-censors-trump-criticism-gotham-speech-1235810832/ Robert De Niro accuses Apple of censoring Gotham Awards speech - The Verge https

                                                        ロバート・デ・ニーロがスピーチ原稿を勝手に差し替えられ「よくもそんなことをするものだ」と激怒、Appleの検閲に対抗してオリジナルの原稿を読み上げ
                                                      • GitHub - langgenius/dify: Dify is an open-source LLM app development platform. Dify's intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to p

                                                        Dify Cloud · Self-hosting · Documentation · Enterprise inquiry Dify is an open-source LLM app development platform. Its intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to production. Here's a list of the core features: 1. Workflow: Build and test powerful AI workflows on a visual ca

                                                          GitHub - langgenius/dify: Dify is an open-source LLM app development platform. Dify's intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to p
                                                        • 米大統領「習氏は独裁者」、首脳会談直後に発言 中国側は反発

                                                          [ウッドサイド(米カリフォルニア州) 15日 ロイター] - バイデン米大統領は15日、中国の習近平国家主席との会談後の記者会見で、習氏が事実上の「独裁者」という見方は変わっていないと述べた。 バイデン氏はこの日、サンフランシスコ郊外で習氏と約4時間にわたり会談した。その後に単独で行った記者会見で、習氏が独裁者だという見方を現在も抱いているか問われ、「われわれとはまったく異なる政治形態に基づく共産主義国を率いる人物という意味で彼は独裁者だ」と述べた。 バイデン氏は6月にも習氏を「独裁者」と表現し、中国の反発を招いた経緯がある。 バイデン米大統領(写真左)は15日、中国の習近平国家主席(同右)との会談後の記者会見で、習氏が事実上の「独裁者」という見方は変わっていないと述べた。カリフォルニア州ウッドサイドで撮影(2023年 ロイター/Kevin Lamarque) 米高官によると、習氏は今回の

                                                            米大統領「習氏は独裁者」、首脳会談直後に発言 中国側は反発
                                                          • CHI2024を振り返って

                                                            ヒューマンコンピュータインタラクション研究のトップカンファレンスであるACM CHI2024がハワイで開催された (5/11–5/16)。会議に出た感想を残しておく。 AIの席巻ある程度予想はしていたがAI、LLMと人間とのインタラクションをトピックにした発表が激増していた。CHIはパラレルセッションで、同時に20セッションぐらいが並行して発表が行われている。同時刻に開催される複数のセッションタイトルにAIやLLMが入っていて、もはやすべてを見るのが不可能な状態になっていた。 AIと銘打っていないセッションでも、要素技術として機械学習を使っているものは多いので、体感では半分以上の研究発表が何等かの意味でAIを使っている感じだった。少し前までは機械学習としってもSVMやCNN、LSTMぐらいでtransformersを使っていたら新しいね、ぐらいだったのだが、LLMが状況を変えていて「誰でも

                                                              CHI2024を振り返って
                                                            • グローバルサウスあれこれ - himaginary’s diary

                                                              篠田英朗氏の記事をはてぶしたのを契機にグローバルサウスについて少し調べてみたところ、篠田氏と同様、このグローバルサウスという概念に対し否定的な見解を示している西側の識者が幾人かいることが分かった。例えば、 ジョセフ・ナイによるProject Syndicate論説 David LubinによるFT論説 カーネギー国際平和基金(Carnegie Endowment for International Peace)のStewart Patrickによる論説 それらの批判を大雑把にまとめると、グローバルサウスと一言で言っても内実は多種多様であるため、そうした不均一性を無視して一括りに捉えるような用語には危険性がある、とのことである。 また、David Lubinは、従来使われてきた新興国市場(emerging markets)という言葉が、国際資本の投資対象の国、という商業的な意味合いを帯びてい

                                                                グローバルサウスあれこれ - himaginary’s diary
                                                              • Appleの機械学習チームがAppleシリコンで機械学習モデルをトレーニング・デプロイするためのフレームワーク「MLX」をGitHubで公開

                                                                GoogleやMeta、Microsoftなどの大手テクノロジー企業がAI開発を積極的に行っている一方、AppleはAIについて保守的であり、AI開発競争に出遅れているという見方もされています。そんなAppleが2023年12月、自社製プロセッサのAppleシリコン用の機械学習フレームワーク「MLX」をソフトウェア開発プラットフォームのGitHubで公開しました。 GitHub - ml-explore/mlx: MLX: An array framework for Apple silicon https://github.com/ml-explore/mlx Apple launches MLX machine-learning framework for Apple Silicon | Computerworld https://www.computerworld.com/artic

                                                                  Appleの機械学習チームがAppleシリコンで機械学習モデルをトレーニング・デプロイするためのフレームワーク「MLX」をGitHubで公開
                                                                • OpenAI’s GPT-4o mini Now Available in API with Vision and Fine-tuning Text Capabilities on Azure AI

                                                                  We recently launched OpenAI’s fastest model, GPT-4o mini, in the Azure OpenAI Studio Playground, simultaneously with OpenAI. The response from our customers has been phenomenal. Today, we are excited to bring this powerful model to even more developers by releasing the GPT-4o mini API with vision support for Global and East US Regional Standard Deployments. From Playground to API: Expanding Access

                                                                    OpenAI’s GPT-4o mini Now Available in API with Vision and Fine-tuning Text Capabilities on Azure AI
                                                                  • NVIDIAがデスクトップPC向けGPU「GeForce RTX 40 SUPER」を発表。ハイエンド〜ミドルハイGPUを強化

                                                                    NVIDIAがデスクトップPC向けGPU「GeForce RTX 40 SUPER」を発表。ハイエンド〜ミドルハイGPUを強化 ライター:米田 聡 米国時間2024年1月8日,NVIDIAは,米国・ラスベガスで行われる大規模展示会「CES 2024」に合わせて特別講演を行った。その中で,デスクトップPC向け新型GPU「GeForce RTX 4080 SUPER」「GeForce RTX 4070 Ti SUPER」「GeForce RTX 4070 SUPER」の3製品を発表した。 本稿では,3製品の概要に加えて,ゲーマーに関連した発表をざっくりとまとめてみたい。 「SUPER」の登場でGeForce RTX 40シリーズは合計7モデルへ 今回,発表となったGeForce RTX 40 SUPERシリーズは,GeForce RTX 40シリーズGPUのバリーションとして追加される3製品に

                                                                      NVIDIAがデスクトップPC向けGPU「GeForce RTX 40 SUPER」を発表。ハイエンド〜ミドルハイGPUを強化
                                                                    • スピーチライターの転職の参考になるポートフォリオ制作事例3選 | 転職ポートフォリオの作り方を学ぶならアームズ

                                                                      転職活動に備えて、いざ転職ポートフォリオを作ろうにも周りに相談できる人がおらず困っているという方も多いはず。 かといって、他人のポートフォリオを見れる機会なんてほとんどなく、同業者の事例を参考にしようにも、そもそも探し方が分からないなんてこともあるでしょう。 そこで、今回は「スピーチライターの転職の参考になるポートフォリオ制作事例3選」について解説します。 もしスピーチライターでの転職を考えているけど、ポートフォリオの作り方に悩んでいるという方は、ぜひ参考にしてみてください。 転職市場でのスピーチライターの需要について 求人ボックスによると、2024年5月時点で掲載されている正社員のライターの求人数は20,364件。 中でも、正社員のスピーチライターの求人数は10件と、ライターの全体求人数から比較すると約0.05%ほど。 それどころか未経験の求人に関しては、現状1件もヒットしませんでした。

                                                                        スピーチライターの転職の参考になるポートフォリオ制作事例3選 | 転職ポートフォリオの作り方を学ぶならアームズ
                                                                      • ずんだもん読み上げに感情を与える(Bert-VITS2のkey別マージ)

                                                                        この記事は本家Bert-VITS2のモデルをマージする方法を説明しています。Style-Bert-VITS2を使う場合は付属マージツールから面倒なことをすることなくマージできます。 宣伝 Style-Bert-VITS2のチュートリアル解説動画を作りました discordサーバー「AI声づくり研究会」によく出没しています 概要 Bertを組み合わせることで入力テキストに応じて感情豊かな読み上げ音声の生成が可能な Bert-VITS2 というTTS(Text-to-Speech、読み上げ音声合成)のライブラリがあります。 詳しくは 参照。 Bert-VITS2を使ってずんだもんの通常の声音のみを学習させたずんだもんのモデルと、感情豊かな別のモデルをうまくマージすることで、ずんだもんの声のまま感情豊かに読み上げることが出来るモデルを作ることができたので、その実験と、手っ取り早いマージツールの共

                                                                          ずんだもん読み上げに感情を与える(Bert-VITS2のkey別マージ)
                                                                        • 共同通信英語版「上川大臣が出産を伴わない女性の価値を問う」発言切り取り 撤回記事では「女性の出産」と捏造報道 - 事実を整える

                                                                          発言切り取りを世界に発信 ランキング参加中社会 共同通信英語版「上川大臣が出産を伴わない女性の価値を問う」 give birth は「生む」の意味もあるが…日本語の「うむ」が無い 追記:上川大臣の発言撤回に関する記事では「出産」としか理解できない記述 共同通信英語版「上川大臣が出産を伴わない女性の価値を問う」 Japan minister queries women's worth without birth in election speechhttps://t.co/UqO3qUvtCO#KyodoNewsPlus — Kyodo News | Japan (@kyodo_english) 2024年5月18日 Japan minister queries women's worth without birth in election speech https://t.co/UqO3q

                                                                            共同通信英語版「上川大臣が出産を伴わない女性の価値を問う」発言切り取り 撤回記事では「女性の出産」と捏造報道 - 事実を整える
                                                                          • LLM音声対話システムの応答を高速化してみた | CyberAgent Developers Blog

                                                                            はじめまして、CyberAgent AI Lab Intaractive Agentチームの技術研究員の大平といいます。 この記事は CyberAgent Developers Advent Calendar 2023 1日目の記事です。 ChatGPTの登場以降、自然なチャット対話はAPI呼び出しだけで簡単に実装できるようになりました。 更に人間のようなインタラクションを実現しようとすれば、音声対話に発展させたいと思う方も多いかと思われます。 しかし実際にLLMを使って音声対話システムを構築してみると、そのレスポンスの遅さに不満を感じることになります。 この記事ではよくあるシンプルなLLMを用いた音声対話に対していくつかの工夫を施し、その応答速度をできるだけ早めてみようという試みになります。 よくある構成として、以下を用います。 音声認識 Google STT LLM ChatGPT 3

                                                                              LLM音声対話システムの応答を高速化してみた | CyberAgent Developers Blog
                                                                            • iOS/macOSオンデバイスで爆速で動作する音声認識モデルWhisperKit - Sansan Tech Blog

                                                                              iOSエンジニアの堤です。先日3月28日に開催された弊社主催のLTイベントで、「WhisperKitがだいぶ良いので紹介する」というタイトルで発表しました。 スライドはこちら: www.docswell.com 本記事は、同発表をベースとしつつ、(LTでは時間が足りないので)発表ではカットした内容を盛り込んで記事として再構成したものになります。 WhisperKitとは iOS/macOSオンデバイスで動く音声認識のすごいやつ デモ:標準の音声認識フレームワークSpeechとの比較 Speech WhisperKit なぜ速いのか - WhisperKitの系譜 OpenAI Whisper whisper.cpp Core ML とは whisper.cpp から WhisperKitへ argmax社とApple モデルサイズとメモリ消費量 各モデルのファイルサイズ一覧 メモリ使用量

                                                                                iOS/macOSオンデバイスで爆速で動作する音声認識モデルWhisperKit - Sansan Tech Blog
                                                                              • 記事の削除依頼がきた。言論の自由はどうなるの?? - だけど生きていく!

                                                                                数日前に弁護士から、記事の削除依頼が届きました。 2024年3月に投稿した、某アンテナ業者に関する、レヴュー記事の削除依頼です。 結論から申しますと、該当の記事は削除しました。読んでくださったかた、今後の参考にと「はてブ」や「ブクマ」をしてくださったかた、またコメントをくださったかたにも、この場を借りてお詫びいたします。 削除することになってしまい、申し訳ありませんでした。 削除依頼をうけ、ブログ仲間さんやライブチャットの常連様たちに相談しご意見を聞いた結果、削除するにいたりました。 ちなみにライブチャットとは、オンライン上のクラブやスナックのような場所です。私はノンアダルトでチャットレディもやっていますので。 ライブチャットの詳細はこちら ライブチャットの常連様には経営者のかたもいて、訴えたり訴えられたりと、裁判の経験を持つかたもいます。 そのようなかたにも記事を読んでもらったところ、社

                                                                                  記事の削除依頼がきた。言論の自由はどうなるの?? - だけど生きていく!
                                                                                • 立憲「コミュニティノートは憲法違反! 腐敗組織の言論弾圧!! 検閲でないと証明しろ! 国会で取り上げる!!!」

                                                                                  原口 一博 @kharaguchi このコミュニティノート。さすがにどうかと思う。フェイクを私のいいねにまで付けるの辞めてほしい。作者の名前を明らかにできないなら、腐敗した組織による言論抑圧、検閲でないとどう証明するのだろう?ことは、言論の自由、検閲の禁止に関わる事だ。憲法違反ではないかとの疑いを拭う事ができない。国会で取り上げてみたい。 I find this community note concerning. It's really not appropriate to attach fake likes to my posts. If the author's name cannot be revealed, how can we prove that it's not censorship or suppression of speech by a corrupt organiz

                                                                                    立憲「コミュニティノートは憲法違反! 腐敗組織の言論弾圧!! 検閲でないと証明しろ! 国会で取り上げる!!!」