並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 339件

新着順 人気順

吾輩は猫であるの検索結果1 - 40 件 / 339件

  • 楽しく生きるための100冊 2019|さとなお(佐藤尚之)

    ボクが主宰している「コミュニティ4th」では、毎月「Bookトライブ」という読書会をやっています。 一冊課題図書を決めて、みんなで読んできて感想を言い合う、という会ですね。 そこでここ数年、何を読んできたか、というのはこちらに書きました。 で。 去年の年末、そのトライブによく来ている谷川敦さん(あだ名はタフマン)という30歳男子(当時)が、こんなようなことを相談してきました。 「教養のある大人になりたいなあ、とぼんやりとした憧れを持っているんですが、ほとんど本も読まずに30歳になってしまいました。来年はBookトライブの課題図書だけでなく、もっとたくさん本を読みたいと思うのですが、絶対読むべき本を100冊くらい教えてくれませんか?」 ・・・なるほど。 ちょっと上からになって申し訳ないけど、良い心がけじゃw。 よし、ここはボクだけでなく、驚異の本読みにして「Bookトライブ」の部長である高島

      楽しく生きるための100冊 2019|さとなお(佐藤尚之)
    • 「なるほど」って目上の人に使うと失礼ですか? 国語辞典の編纂者・飯間浩明さんに“本当のところ”を聞いてみた​​ - ミーツキャリアbyマイナビ転職

      「なるほど」は目上の人に使っちゃダメだよーー。こんな指摘を上司や先輩に受けたことのある方も少なくないでしょう。 昨今は、言葉遣いに関するビジネス書やWebサイトでも、しばしば同様の意見に出会います。SNSなどには、特に目上の人と話すとき、どんな相づちを使えばいいのか判断に困ってしまう、といったビジネスパーソンの声も数多く寄せられています。 そもそも「なるほど」ってそんなに「失礼」な表現なのでしょうか。「なるほど」に代わる便利な相づちってあるのでしょうか。そんな素朴な疑問を、今回は国語辞典の編纂者で言葉のプロである飯間浩明さんにぶつけてみました。 インタビューで語られたのは、「なるほど」の語源から、言葉や表現一般に対する飯間さんのスタンスまで、実に幅広いトピックです。この記事を読んで、日々の言葉遣いを振り返るきっかけにしてみてはいかがでしょうか。 飯間浩明(いいま・ひろあき)さん。1967年

        「なるほど」って目上の人に使うと失礼ですか? 国語辞典の編纂者・飯間浩明さんに“本当のところ”を聞いてみた​​ - ミーツキャリアbyマイナビ転職
      • 絵文字を支える技術について|nona

        はじめにこちらはmhidakaが建立したAdvent Calendar Day.3となります。 こんにちは、はじめまして、のなと申します。mhidakaさんのTweetを見つけて、初めてAdvent Calendarなるものを書いています。なにかお作法間違っていたら大目に見てください、よろしくお願いします。 軽く自己紹介をさせていただくと、普段はGoogleでAndroidのTextまわりの開発を行っており、DroidKaigiやShibuya APKで発表させていただいたりしています。最近はほぼ絵文字の話しかしてないので、絵文字おじさんと思われてそうですが、普段の仕事は絵文字に限らず、Androidの文字表示の部分は大抵面倒をみています。 今回この機会をいただいたので、どんな内容を書こうか迷ったのですが、やはり皆が読んで面白い内容というと、絵文字になるのかなぁ、ということで性懲りもなく絵

          絵文字を支える技術について|nona
        • 欧米の教養がうらやましく感じる(追記)

          昔やってたRPGの英語版攻略サイトをなんとなく見てたわけですよ 技名どう訳してんのかなと思って そしたらAd nihiloなんて技がある なんだろうと思って調べてみると、ラテン語で「無から」って意味らしい (追記:たしかに「無へ」だ!Ad Astraだもんな ウワーーーーだってGoogle検索したら結果にEx nihiloが出てたんだよう 真逆の訳だされてるとは思わんじゃんかよう 俺は悪くない!!) 言われてみればニヒルって虚無みたいな感じだったよなと思う 元の日本語版だと「リセットウェポン」 イマイチ冴えない こんな感じで欧米人がサラッとサブカルチャーの中にラテン語とかシェイクスピアの引用とかを入れてるのを見るとちょっと嫉妬してしまう まあ日本人だって枕草子とか吾輩は猫であるとかいろいろ独自のネタ元は持ってるんだけど、日本の古語とラテン語、ロミオとジュリエットと雪国を比べるとどうしてもち

            欧米の教養がうらやましく感じる(追記)
          • 夏目漱石の「吾輩は猫である」を笑って読破するためのガイド - 山下泰平の趣味の方法

            この記事はそれなりに時間をかけて書いたのだが、面白がってどうでもいいことを調べている間に、世の中は大変なことになっていた。 最早「吾輩は猫である」を読もうぜッ!! なんて雰囲気でもなさそうだ。ただし気が滅入って仕方がない時には、全然関係ないことをするのがお勧めなので、そのまま公開することにした。 最初に書いておくと私は漱石が好きなので、いつもよりも客観性に欠けたところが多くなっている。あと無駄に長い。当初はコンパクトにまとめようと考えていたのだが、どうでもいいことを調べながらダラダラ書いているうちに長くなり、結果的に15000文字程度になってしまった。どうもいいことが満載のこの記事を最後まで読めたとすれば、夏目漱石の「吾輩は猫である」なんて余裕で読破できると思う。他の作品を読みたい人はこちらも参考どうぞ。 cocolog-nifty.hatenablog.com 吾輩は猫であるを読もう 「

              夏目漱石の「吾輩は猫である」を笑って読破するためのガイド - 山下泰平の趣味の方法
            • ChatGPT API の使い方|npaka

              「OpenAI」の 記事「Chat completions」が面白かったので、軽くまとめました。 1. ChatGPT API「ChatGPT」は、OpenAIの最も先進的な言語モデルである「gpt-3.5-turbo」を搭載しています。「OpenAI API」から「gpt-3.5-turbo」を使用して独自アプリケーションを作成できます。 ・メールや文章のドラフト ・Pythonコードの生成 ・一連の文書に関する質問応答 ・会話型エージェントの作成 ・ソフトウェアへの自然言語インターフェースの追加 ・さまざまな科目の家庭教師 ・言語の翻訳 ・ビデオゲームのキャラクターのシミュレート 2. 使用料金使用料金は、以下で確認できます。 3. Colab での実行「gpt-3.5-turbo」は、マルチターンの会話を簡単にするように設計されていますが、会話のないシングルターンタスクでも役立ちます

                ChatGPT API の使い方|npaka
              • 国立国会図書館デジタルコレクションの遊び方 - 山下泰平の趣味の方法

                国立国会図書館デジタルコレクションは最高である。 「国立国会図書館デジタルコレクション」が面白い まずは遊んでみる 使いまくりたくなったら準備しておくと効率が良い 無料でできる 検索演算子だけ覚えておく 国立国会図書館デジタルコレクションの使い方を知っておく 国立国会図書館オンラインに登録しておく メモ環境を作る 有料でできる パソコンを用意する できれば良い椅子とモニタがあったほうがいい 速度を意識して使う 速くなるとどうなるのか そこに全てはない ものすごいものをどうでもいいことに使うということ 「国立国会図書館デジタルコレクション」が面白い 「国立国会図書館デジタルコレクション」が面白い。 dl.ndl.go.jp 「国立国会図書館デジタルコレクション」では著作権など権利状況に問題がないことが確認できた約36万点の資料が無料で公開されており、ようするに古い本が無限に読めるサービスだ。

                  国立国会図書館デジタルコレクションの遊び方 - 山下泰平の趣味の方法
                • 海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される

                  by Whooym 文字が適切に表示されずに読めなくなってしまう「文字化け」は、海外の技術者の間でも「Mojibake」で通用するとのこと。そんな文字化けの種類について、東京で自然言語処理(NLP)の開発をしているポール・オリーリ・マッキャン氏が解説しました。 A Field Guide to Japanese Mojibake https://www.dampfkraft.com/mojibake-field-guide.html マッキャン氏によると、文字化けは作成した時と異なる文字コードで文書を開くことで発生するとのこと。文章が文字化けすると無意味な文字列になってしまうので読めませんが、どのような文字コードが使われたかによって異なるパターンが表れるので、慣れると使われている文字コードの種類を推測することができるそうです。 ◆UTF-8 UTF-8はインターネット上では最も一般的な文字

                    海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される
                  • 必読書コピペにマジレスしてみる・海外文学編(1)

                    方針読んだ感想を思いついたままに、友達にだべるみたいに書く高校卒業後に読んだ本も含める読んだ人が「面白そう」と思ってくれたらうれしい文学はいいぞ古典はいいぞ時間の無駄なんかじゃないぞ、最高のエンタメだ元増田→anond:20210210225201ホメロス『オデュッセイア』「イリアス」は捕虜の奴隷女の配分をめぐった交渉がこじれた結果、勇者が拗ねて戦場に出ず、味方がどんどん死ぬところからスタートするので、昨今の倫理観からは問題があり、神話初心者にはこっちをお勧めしたい。「オデュッセイア」も家で待っている妻を忘れてよその女のところで数年過ごすが、まあ魔法をかけられていたということでこっちのほうがマシだ。舞台もあちこち移動するから飽きないし。 ユニークなのは、劇中劇的にオデュッセウスが時間をさかのぼって事件の進展を語る箇所があることで、ホメロスの時代にはすでに出来事が起きた通りに語る手法が飽きら

                      必読書コピペにマジレスしてみる・海外文学編(1)
                    • 最初の数行を入力すると小説の続きを書いてくれるAI登場 設定次第で俳句やニュースも

                      ユーザーが冒頭の文章を数行書くと、続きをAIが作文するWebサービス「AIのべりすと」が登場し、一部で話題になっている。例えば、「吾輩は猫である。名前はまだない。そんな吾輩は今」のように書き出しを入力すると「とある場所にいる。そこはどこかというと、我が家のリビングだ。ソファに腰掛けてテレビを見ているのは、俺の妹である美夏だ」のように続きを出力する。

                        最初の数行を入力すると小説の続きを書いてくれるAI登場 設定次第で俳句やニュースも
                      • 超高精度な国産音声認識AI「ReazonSpeech」が無償公開されたので文字起こし機能を使ってみた

                        東京に拠点を置くテクノロジー企業「レアゾン・ホールディングス」が、1万9000時間に及ぶ国内最大級の日本語音声コーパス「ReazonSpeech」を無償公開しました。同時に、OpenAIが開発した超高性能音声認識AI「Whisper」に匹敵する性能をアピールする文字起こしサービスも公開されていたので、実際に使ってみました。 超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開 - Reazon Human Interaction Lab https://research.reazon.jp/news/reazonspeech.html ReazonSpeech - Reazon Human Interaction Lab https://research.reazon.jp/projects/ReazonSpeech/ レアゾン・ホールディングスは「R

                          超高精度な国産音声認識AI「ReazonSpeech」が無償公開されたので文字起こし機能を使ってみた
                        • 好きなマンガを好きなだけ語り合うオフ会レポート(37作品を紹介)

                          はじめに 好きな本を持ち寄って、まったり熱く語り合う読書会、それがスゴ本オフ。 本に限らず、映画や音楽、ゲームや動画、なんでもあり。なぜ好きか、どう好きか、その作品が自分をどんな風に変えたのか、気のすむまで語り尽くす。 この読書会の素晴らしいところは、「それが好きならコレなんてどう?」と自分の推し本から皆のお薦めが、芋づる式に出てくるところ。まさに、わたしが知らないスゴ本を皆でお薦めしあう会なのだ。 今回のテーマは「マンガ」、何回読んでも爆笑してしまう作品や、ヘコんだときに癒してくれる短編集、価値観の原点となったマスターピースなど、様々な作品が集まった。いわゆるコミック本に限らず、アニメーションや物語詩など、王道から知る人ぞ知るやつ、直球変化球取り揃えて、キリがないほど集まった。 ▼気になるマンガに手が伸びる ▼懐かしいものから未知の作品まで ▼マンガが縁で「読み友」が増える まず私ことD

                            好きなマンガを好きなだけ語り合うオフ会レポート(37作品を紹介)
                          • 全モダンブラウザ対応のCSS機能が爆増。Chromium版Edgeのもたらす次世代CSS表現 - ICS MEDIA

                            2020年初め、Chromium版のMicrosoft Edge(以下新Edge)がリリースされました。新Edgeは「Microsoft Edge Legacy」(以下Edge Legacy)と比べて多くの機能が使えるようになっており、Chrome・Firefox・Safariのモダンブラウザと遜色ないレベルになっています。 先日5月29日にリリースされた「Windows 10 May 2020 Update」では、Edge Legacyの開発が終了することもアナウンスされており(参考記事「Windows 10 features we’re no longer developing - Windows Deployment」)、今後のWindows標準ブラウザは新Edgeとなっていくでしょう。 ウェブ制作の面で嬉しいことは、多くのCSSやJavaScriptの機能が使えるようになったことで

                              全モダンブラウザ対応のCSS機能が爆増。Chromium版Edgeのもたらす次世代CSS表現 - ICS MEDIA
                            • KindleのPC版アプリ、進化していた。本気で読み込むならスマホより捗る! | ライフハッカー・ジャパン

                              いつでもどこでも気軽に本を読めるのがモバイル端末の便利なところ。一方、PCでの閲覧はより情報収集に特化して活用できるのがメリットでした。 小さな画面のスマートフォンやタブレットで使っていた機能が、これからはPCでも使えると考えると、デスクトップならではの利点が見えてきます。 また、本の表示形式も、以前のバージョンでは「新しい商品」「タイトル」「著者」の3パターンのみでしたが、新アプリでは「出版日」でも並べ替えられるようになりました。 PCなら、一度に画面で表示できる数が増えます。ダウンロードしている本が多ければ多いほど、検索や分類、整理がサクサクと行なえるのは助かるはず。 ページのレイアウトの調整がより多様にPCで読書をする最大のメリットが、モバイルにはない大画面。ページをめくる時のなめらかさや操作性もかなり向上したと感じます。 旧バージョンは、文字の大きさ変更には対応していましたが、ペー

                                KindleのPC版アプリ、進化していた。本気で読み込むならスマホより捗る! | ライフハッカー・ジャパン
                              • ChatGPTに夏休みの読書感想文を出力させるプロンプト(ひな形)の無料公開: 生成AIに個人的な体験・感想を交えた作文をさせる検証(GPT監査シリーズ⑪)【日本マネジメント総合研究所合同会社】

                                ChatGPTに夏休みの読書感想文を出力させるプロンプト(ひな形)の無料公開: 生成AIに個人的な体験・感想を交えた作文をさせる検証(GPT監査シリーズ⑪)【日本マネジメント総合研究所合同会社】 報道機関各位 2023年7月15日 日本マネジメント総合研究所合同会社 この度、弊社理事長でGPT研究所の所長の戸村智憲が、「GPT監査シリーズ⑪」として、夏休みの読書感想文と生成AIについての監査レポートと、個人的な体験・感想を織り交ぜた読書感想文を出力させるプロンプトひな形を、下記の通り無料で公開致しました。 【ChatGPTプロンプトひな形(個人的な体験・感想を織り交ぜた読書感想文の出力検証用)】 優秀な信頼性あるプロの家庭教師として、〇の『〇』という書籍について、以下の制約条件を基にして、夏休みの宿題である読書感想文を出力して下さい。 制約条件1: 文字数は800文字以上で1200文字以内

                                  ChatGPTに夏休みの読書感想文を出力させるプロンプト(ひな形)の無料公開: 生成AIに個人的な体験・感想を交えた作文をさせる検証(GPT監査シリーズ⑪)【日本マネジメント総合研究所合同会社】
                                • 東工大など、日本語に強い大規模言語モデル「Swallow」を無償で公開

                                  東京工業大学(東工大)と産業技術総合研究所(産総研)の両者は12月19日、現在公開されている中で、日本語に強い生成AIの基盤である「大規模言語モデル」(LLM)としては最大規模となる「Swallow」を、米・MetaのLLM「Llama 2」の日本語能力を拡張することで構築し、Webサイト「TokyoTech-LLM」にて一般公開したこと、またオープンで商用利用も可能なことを共同で発表した。 同成果は、東工大 情報理工学院 情報工学系の岡崎直観教授、同・横田理央教授、産総研の共同研究チームによるもの。今回、東工大は主にデータの語彙拡張によるモデル学習・推論効率の改善に取り組み、産総研はモデル構築に必須である大規模計算資源としてAI橋渡しクラウド(ABCI)を提供すると同時に、主に継続学習によるモデルの日本語能力の改善を担当したとしている。 産総研のAI橋渡しクラウド「ABCI」(出所:東工

                                    東工大など、日本語に強い大規模言語モデル「Swallow」を無償で公開
                                  • 無料&音声をリアルタイムで変換できるAIボイスチェンジャー「Koemake RVC Player」レビュー

                                    オープンソースのAIボイスチェンジャー「Retrieval-based Voice Changer(RVC)」は、あらかじめ用意した音声から学習したモデルを作成し、リアルタイムで声質を変換することが可能です。このRVCで作成した音声変換モデルを手軽に実行できるボイスチェンジャーソフト「Koemake RVC player」を電々メイさんが無償でリリースしたので、実際に使ってみました。 Koemake Project https://koemake.com/ Koemake RVC Playerを動かすための推奨スペックは「VRAM4GB以上、NVIDIA製GPU搭載、Windows 10以上」となっているので注意が必要です。 Koemake RVC Playerをダウンロードするには、上記の配布サイトでユーザー登録をする必要があります。配布サイトにアクセスしたら、右上の「ログイン」をクリッ

                                      無料&音声をリアルタイムで変換できるAIボイスチェンジャー「Koemake RVC Player」レビュー
                                    • 日本語に特化した13億パラメータのGPT言語モデルを公開|rinna株式会社

                                      ~商用利用可能なライセンスで日本語のNLPコミュニティに貢献~ rinna株式会社(本社:東京都渋谷区/代表取締役:ジャン"クリフ"チェン、以下rinna社)は、日本語に特化した13億パラメータのGPT言語モデルを開発し、公開しました。 ■背景 rinna社はこれまでに、日本語の自然言語処理 (NLP) に特化したGPT (3.3億パラメータ) やBERT (1.1億パラメータ) の事前学習モデルを公開し、多くの研究・開発者にご利用いただいています。最近のNLPに関する研究では、モデルのパラメータ数が多いほど高い性能であることが知られています。 そこでrinna社は、これまでに公開してきたモデルより大規模な13億パラメータを持つ日本語に特化したGPT言語モデルを開発し、日本語のNLPコミュニティに貢献するために、この言語モデルをNLPモデルライブラリ Hugging Face に商用利用可

                                        日本語に特化した13億パラメータのGPT言語モデルを公開|rinna株式会社
                                      • rinna社、日本語に特化したGPT-2の大規模言語モデルを開発しオープンソース化

                                        rinna株式会社(本社:東京都渋谷区/代表取締役:ジャン“クリフ”チェン、以下rinna社)は、日本語に特化したGPT-2の大規模言語モデルを構築し、オープンソースとして公開しました。 ■背景 rinna社は、MicrosoftのAI&リサーチ部門でAIチャットボットの研究を行っていたチームがスピンアウトして2020年6月に設立したAI開発企業です。ディープラーニング技術を活用し、AIが文脈に応じた会話文を自動生成して人間と自然に会話する「共感チャットモデル」、AIが話し声や歌声で豊かな感情表現を可能にする「音声合成システム」などの技術を発表してきました。これらの最新技術は、当社が運営するAIチャットボット「りんな」や、会話内容や音声表現をカスタマイズしてキャラクター性を持たせたAIチャットボットである「AIキャラクター」の開発に応用され、企業のマーケティングなどにお使いいただいています

                                          rinna社、日本語に特化したGPT-2の大規模言語モデルを開発しオープンソース化
                                        • 2023年夏開始の新作アニメ一覧

                                          放送・配信中のアニメの終わりが近づき、新作の開始時期が近づいてきました。2023年夏に始まるアニメの数は約50本となっています。 特徴としては、近年の傾向に漏れず「異世界」・「転生」モノの多さが目立ちます。続編も含めて、要素を2つとも備えた作品が「実は俺、最強でした?」「無職転生 Ⅱ ~異世界行ったら本気だす~」「おかしな転生」「自動販売機に生まれ変わった俺は迷宮を彷徨う」「悲劇の元凶となる最強外道ラスボス女王は民の為に尽くします。」「レベル1だけどユニークスキルで最強です」「聖者無双〜サラリーマン、異世界で生き残るために歩む道〜」と7作品あります。 このほか、オリジナルアニメでは創作者集団GoRAが手がける「AYAKA ‐あやか‐」などがあります。 また、「五等分の花嫁∽」と「アイドルマスター ミリオンライブ!」はテレビアニメ放送より先に劇場先行上映が行われます。 以下、作品リストは放送

                                            2023年夏開始の新作アニメ一覧
                                          • A Field Guide to Japanese Mojibake

                                            When you open a document with an encoding different than the one it was created with, it's not possible to display the original text, and instead a garbled mess of corrupted characters are printed out. These are called "mojibake" in Japanese, and the word has also been borrowed into English. While mojibake aren't readable by humans, it turns out that different kinds of mojibake have different visu

                                              A Field Guide to Japanese Mojibake
                                            • 猫の本 おすすめ

                                              ホテルクラシカル猫番館/小湊悠貴猫はホテルの看板猫。主人公が作るパンがとても美味しそう ニャンニャンにゃんそろじー/有川浩ほかいろいろな猫好きによるアンソロジー 旅猫リポート/有川浩主人公サトルと飼い猫の関係がいい 吾輩は猫である/夏目漱石中学の教師に迷い込んだ猫による先生の家族や友人を猫目線にしている 猫のハローワーク/新美敬子なにかに夢中になってる猫は何かの仕事をしているようだと思いついた人間による猫へのインタビュー本 幸せになりたければねこと暮らしなさい保護猫7匹と暮らしている人の書いたねこ啓発本、猫はいいぞ! 猫にGPSをつけてみた 夜の森半径二キロの大冒険/高橋のら猫の行動範囲や習性について人間が猫を知ることができる一冊 100万回生きたねこ/佐野洋子100万回しなない猫がいたんですよ・・・ 世界から猫が消えたなら/川村元気猫と二人暮らししていた人が余命わずかになってしまって、こ

                                                猫の本 おすすめ
                                              • CyberAgentの日本語言語モデルを試してみる - きしだのHatena

                                                CyberAgentが日本語LLMを公開していたので、とりあえず動かしてみました。 サイバーエージェント、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供― | 株式会社サイバーエージェント モデルは次のように6サイズ提供されています。 ※ Rinna社も同時に新しいモデルを出したので試しています。 Rinnaの新しい3Bモデルを試してみる - きしだのHatena open-calm-small(160M) まずはopen-calm-small。160Mパラメータです。 このあたりは動作確認用なので、内容は気にしない。 GPUメモリは1.3GBくらいの消費です。 open-calm-medium(400M) 次にopen-calm-medium。400Mパラメータです。 このへんも細かいことは気にしないけど、なんかま

                                                  CyberAgentの日本語言語モデルを試してみる - きしだのHatena
                                                • 夏目漱石の小説 12作品の自筆原稿が所在不明「文化遺産が…」 | NHKニュース

                                                  文豪 夏目漱石が書いた代表的な小説のうち半数にあたる12作品について、自筆原稿の所在が確認できなくなっていることが分かりました。調査を行った専門家は、自筆原稿は作品の成立過程をたどる貴重な資料だとして「かけがえのないものであり、大切に受け継いでいくことが必要だ」と指摘しています。 この調査は夏目漱石の研究を続けている早稲田大学の中島国彦名誉教授が行いました。 漱石の自筆原稿が今どこに保管されているか調べたところ、代表的な24の小説のうち半数にあたる12作品で確認できなくなっていることが分かりました。 このうち「坊っちゃん」は、漱石の作家活動を支援した俳人の高浜虚子を介して関係者が原稿を譲り受け、複製も作成されましたが、その後、所有者が変わるなどして所在が分からなくなっていました。 「草枕」は30年ほど前に写真で撮影されていますが、その後、所在が分かっていないということです。 一方、「吾輩は

                                                    夏目漱石の小説 12作品の自筆原稿が所在不明「文化遺産が…」 | NHKニュース
                                                  • 無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ

                                                    画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)やローカルのWindows環境に導入して使ってみました。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper ○目次 ◆Hugging Faceの体験版を使ってみる ◆Google Colabに導入して使ってみる ◆Windows環境に導入してみ

                                                      無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
                                                    • 高速な文字列探索:Daachorseの技術解説 - LegalOn Technologies Engineering Blog

                                                      こんにちは。LegalForce Researchで研究員をしている神田 (@kampersanda) です。 LegalForce Researchでは現在、高速なパターンマッチングマシン Daachorse(ダークホース)を開発・運用しています。文字列処理の基礎である複数パターン検索を提供するRust製ライブラリです。以下のレポジトリで公開されています。 github.com 本記事はDaachorseの技術仕様を解説します。具体的には、 複数パターン検索に関係する基礎技術(トライ木・Aho–Corasick法・ダブル配列) Daachorseの実装の工夫と性能 を解説します。 以下のような方を読者として想定します。 文字列処理アルゴリズムやデータ構造に興味のある方 自然言語処理の要素技術に興味のある方 Rustライブラリに興味がある方 Daachorseについて 複数パターン検索の基

                                                        高速な文字列探索:Daachorseの技術解説 - LegalOn Technologies Engineering Blog
                                                      • 無料で自分の声を違うキャラクターなどの声にできるリアルタイム音声変換AIを簡単に使えるボイスチェンジャークライアント「VC Client」でどれぐらい声が変わるかレビュー

                                                        AI技術の進化によって、絵や文章だけではなく音声変換もAIでリアルタイムに行うことが可能になりました。ボイスチェンジャーAIにはRVC(Retrieval-based Voice Changer)やMMVCなどさまざまな種類が存在しますが、「VC Client」は複数ボイスチェンジャーAI向けモデルに対応しており、簡単にリアルタイム音声変換ができるとのことなので実際に試してみました。 GitHub - w-okada/voice-changer https://github.com/w-okada/voice-changer GitHubのレポジトリにアクセスします。 「事前ビルド済みのBinaryでの利用」の欄にあるテーブルで、「win」にある「通常」をクリック。 ダウンロードリンクが表示されるので、「このままダウンロード」をクリックします。なお、VC ClientはZIP形式で配布され

                                                          無料で自分の声を違うキャラクターなどの声にできるリアルタイム音声変換AIを簡単に使えるボイスチェンジャークライアント「VC Client」でどれぐらい声が変わるかレビュー
                                                        • 誰でも人にとって面白い文章を書ける気がする。作家・山下泰平さんが語る「ブログの享楽」とは?【書籍プレゼントあり】 - 週刊はてなブログ

                                                          はてなブログのユーザーに、自身とブログについて語っていただく【「ブログを書く」ってどんなこと?】シリーズ。今回は、明治・大正時代の娯楽小説や文化を中心にブログで発信している文筆家の山下泰平(id:cocolog-nifty/@kotoriko)さんに「ブログの享楽」についてインタビューで語っていただきました。 一見するとなじみのない文化や娯楽を軽快な語り口で紹介した記事が人気を博し、2019年には記事をきっかけにした書籍『「舞姫」の主人公をバンカラとアフリカ人がボコボコにする最高の小説の世界が明治に存在したので20万字くらいかけて紹介する本』(柏書房)を刊行した山下さん。今回は、そんな山下さんの間遠な情報をグッと分かりやすくするブログ術に迫ります! 書籍プレゼントキャンペーンもあるのでぜひ最後までご覧ください。 「楽しくなきゃダメ」ブログで明治・大正の文化を共有する理由とは? ──ブログで

                                                            誰でも人にとって面白い文章を書ける気がする。作家・山下泰平さんが語る「ブログの享楽」とは?【書籍プレゼントあり】 - 週刊はてなブログ
                                                          • 主婦が旦那の給料で大学院に行くのは駄目だ的な感覚はどこから来たのか - 山下泰平の趣味の方法

                                                            はじめに 主婦が旦那の給料で大学院に行くのが駄目な理由のようなもの 学問というものは自分の力で修めるべきものである 学問というものはリターンがある実利的なものである 学問というものは生活から離れた高尚なものである 謎の感覚は多い はじめに ちょっと前に主婦が大学院に行くのはどうなのかみたいな話が話題になっていた。この話題自体については、他人がなにしようがどうでもいいだろとしか言い様がない。しかし様々な発言の後ろに見え隠れする個々人の感覚は、かなり興味深かった。現在、私が調べている明治の文化と、そのままつながっているような部分が多くあったからだ。 そんなわけで、ちょっとまとめておくことにした。 慎重に扱うべき問題なので先に書いておくが、この記事では明治に存在した考え方や感覚について書いている。当然ながら明治以前にも、国内外に原形になるような考え方や感覚は存在しているが、この記事ではほとんど触

                                                              主婦が旦那の給料で大学院に行くのは駄目だ的な感覚はどこから来たのか - 山下泰平の趣味の方法
                                                            • 【猫の魅力】実家で猫を飼い始めたのだが、離れて暮らす姉の喜びっぷりが怖い - きママなあさこ

                                                              私と父の思い出 実家に突如子猫がやってきた 歓喜する姉の一部始終 実家に帰った姉 まとめ 私は幼い頃、どこからか猫を拾ってきては母に「猫を飼いたい」とねだる様な子だった。 連れてきては元に戻せないという魂胆があったのだろう。 今は義両親と同居しており、猫を飼いたいが義母が猫嫌いであるため飼えない。 そこは大人なので我慢だ。 高校生ぐらいになると猫熱は落ち着き猫を拾ってくることは無くなった。 長い反抗期があり、父に反抗するようになった。 広告 私と父の思い出 吾が父はクレイジーガイである。友達はまだいない。 夏目漱石の「吾輩は猫である」の冒頭を参考にしてみた。 頭がよく悪さはしないが、少し外れている父。 とにかくルールには厳しかった。 私が高校生の頃の門限は夕方6時だった。 ある日友達と遊んで、気付けば6時前になっていた。 帰ると夕方6時は過ぎてしまう。 これはヤバいと感じていた。 クレイジ

                                                                【猫の魅力】実家で猫を飼い始めたのだが、離れて暮らす姉の喜びっぷりが怖い - きママなあさこ
                                                              • にじさんじの野良猫・文野環はなぜ今盛り上がっているのか?

                                                                3月29日、にじさんじの野良猫・文野環が「バーチャル卒業式 ~卒業おめでとう~」という タイトルで配信を行い、不登校小学生の少年革命家として話題のYouTuberゆたぼんとコラボしました。 この突拍子のなさにはファンのみならず、にじさんじライバーたちも絶句。月ノ美兎が「野良猫って何?」と困惑するほどでした。 確かに今までも、文野環はゆたぼんの話題を配信で口にしてはいましたが、本当にアポを取ってリアルタイムコラボするなんて誰も思っていなかった。最初はコラ画像かと思った人もいたようです。 しかもコラボ終了後に小5だったことに気づくという展開。何の思想性もなさそうなところもミソで、どこからがエンタメ精神で、どこまでが単にやりたいだけだったのか、全く見当がつかない。ファンからは「天才」「伝説」と褒め称える声もあれば「冒険しすぎ」「狂気」とわけのわからなさにおののくく声もありました。 文野環は2年前

                                                                  にじさんじの野良猫・文野環はなぜ今盛り上がっているのか?
                                                                • 三上章とその著書、あるいは三上文法に関する読書案内(おまけ付き) - 誰がログ

                                                                  はじめに 読書案内 庵功雄 (2003)『『象は鼻が長い』入門』 益岡隆志 (2003)『三上文法から寺村文法へ』 金水敏 (1997)「4 国文法」『岩波講座 言語の科学 5 文法』 そのほか 寺村秀夫はどのように三上章の後継者か 「主語」の議論にフォーカスし過ぎるのは三上文法の過小評価では 「主語」に関する辞書の記述 日本語文法事典 日本語学大辞典 中間まとめ:三上の扱い おまけ1:「は」とか「主題」とか 「は」と主題の話なら山田孝雄も 「主題」を表す手段は様々な言語に様々な形である この辺りの読書案内 おまけ2:三上文法に関連するあれこれへの私見 主語廃止論と学校文法 ピリオド超え 三上の「土着文法」は日本語特殊論の対極にある 生成文法は主語を絶対視しているか 「「は」は主題」で本当に分かりやすいか おわりに 書いてみて 研究者・専門家のみなさま 引用文献(三上の著書を除く) 長いで

                                                                    三上章とその著書、あるいは三上文法に関する読書案内(おまけ付き) - 誰がログ
                                                                  • 東大にある美容院で東大生に人気の髪型にしてもらう

                                                                    1992年東京生まれ。普段は商品についてくるオマケとかを考えている会社員。好きな食べ物はちくわです。最近子どもが生まれたので「人間ってすごい」と本気で感じています。(動画インタビュー) 前の記事:夜の埋立地散歩 ~超穴場夜景スポットと地の果て~ > 個人サイト 日和見びより ルーツは日本最古の理容店 というわけで東京大学の本郷キャンパスへやってきた。東大は敷地も広大なので美容院くらいあってもおかしくないだろうという思いと、本当に構内に美容室が必要か…?という思いが混ざり合う。 目的の美容室は東大のランドマークともなっている安田講堂のすぐ近く、法文2号館の地下にある。 お店の名前は「kitadoko」だ。 法文2号館は設計者の内田祥三の名前から通称「内田ゴシック」と呼ばれるアーケードが美しい 渋い並びの地下のテナント。フォントがゴシック体なことと建物がゴシック調なことに関係はあるのか(多分な

                                                                      東大にある美容院で東大生に人気の髪型にしてもらう
                                                                    • Goでテストのフィクスチャをいい感じに書く | メルカリエンジニアリング

                                                                      Merpay Tech Openness Month 2022の6日目の記事です。 こんにちは、Merpay Credit Design Teamでバックエンドエンジニアをしている@youxkeiです。 テストを書く際、その前提条件としてデータベースの状態をフィクスチャとして準備して、データベースにデータを投入することがよくあります。このフィクスチャはYAMLなどの外部ファイルに書かれることもありますが、この記事ではテストコード上にGoで記述する方法を考えていきます。 この記事では、データベースはリレーショナルデータベースを想定していて、具体例として架空の図書館蔵書管理システムのデータベースを使っています。 素直にモデルを使う 多くの場合、以下のようにデータベースのそれぞれのテーブルに対してモデルが定義されています。 package model import ( "time" ) type

                                                                        Goでテストのフィクスチャをいい感じに書く | メルカリエンジニアリング
                                                                      • 自然言語処理の最先端Transformerを集合生成に応用する【逆転オセロニア】 | BLOG - DeNA Engineering

                                                                        はじめまして。9月初旬より約半月にわたり、AIエンジニアコースのインターンに参加させていただいた清水と申します。大学院は情報系の専攻で、最近は幾何学的な深層学習に関する研究に取り組んでいます。その過程で言語的なタスクを出口に用いることも多く、副次的に深層学習を利用した自然言語処理にも多少明るかったりします。 題目にあるTransformerとは、そうした分野にてここ数年にわかに注目を集めている仕組みの名です。自然言語処理の最先端研究ではまず流用されないことなどない、いわば伝家の宝刀レベルのモデルといってよいでしょう。 本記事ではこれを『逆転オセロニア』というゲームのデッキ編成に特化させ、現行手法よりも表現力に富んだ編成システムを実現した経緯についてお話しできればと思います。『日進月歩で強力になっていく機械学習手法の恩恵に与りたいけれど、所望の問題設定にドンピシャな手法なんてそうそうなくて思

                                                                          自然言語処理の最先端Transformerを集合生成に応用する【逆転オセロニア】 | BLOG - DeNA Engineering
                                                                        • 13億パラメーターを持つGPT言語モデルをrinnaが公開、日本語に特化

                                                                          GPTは、人間が使う会話や文章に出てくる単語の確率の組み合わせから次の単語の確率を計算する言語モデルだ。 例えば、「確率(吾輩は猫である)=確率(吾輩)×確率(は|吾輩)×確率(猫|吾輩,は)×確率(で|吾輩,は,猫)×確率(ある|吾輩,は,猫,で)」のような方法で計算する。この性質を用いて、「吾輩は」という単語を入力したとき、次の単語として確率が高い「猫」を予測できる。 性能は14パープレキシティー 関連記事 2021年の「AI/機械学習」はこうなる! 5大予測 2020年は、自然言語処理(NLP)のTransformer技術に基づくBERT/GPT-3や、画像生成のディープフェイクが大注目となる一方で、倫理に関する問題がさまざまな方面でくすぶり続けた。2021年の「AI/機械学習」界わいはどう変わっていくのか? 幾つかの情報源を参考に、5個の予測を行う。 Microsoft、自然言語処

                                                                            13億パラメーターを持つGPT言語モデルをrinnaが公開、日本語に特化
                                                                          • 日本語BERTモデルをPyTorch用に変換してfine-tuningする with torchtext & pytorch-lightning - radiology-nlp’s blog

                                                                            TL;DR ①TensorFlow版訓練済みモデルをPyTorch用に変換した (→方法だけ読みたい方はこちら) ②①をスムーズに使うための torchtext.data.Dataset を設計した ③PyTorch-Lightningを使ってコードを短くした はじめに 日本語Wikipediaで事前学習されたBERTモデルとしては, 以下の2つが有名であり, 広く普及しています: SentencePieceベースのモデル (Yohei Kikuta さん提供) TensorFlow版 Juman++ベースのモデル (京大黒橋研提供) TensorFlow版 PyTorch版(Hugging Face transformers準拠) このうち, SentencePieceベースのものは現在TensorFlow版のみの提供となっており, PyTorch版は存在しません。 そのため, 私のよう

                                                                              日本語BERTモデルをPyTorch用に変換してfine-tuningする with torchtext & pytorch-lightning - radiology-nlp’s blog
                                                                            • ヒートマップで表したい

                                                                              ヒートマップの表現がかっこいいなと思っていた。描き方を覚えて、いろんなものに無理やり当てはめてみたい。好きな寿司ネタとか。 ヒートマップでいろいろ表したい たとえば、ウェブサイト内のどこをユーザーが注目しているかを表すために、よく見られている箇所を赤、そうでない箇所を青で表したりするのが、ヒートマップのよくある使い方だ。 ヒートマップのグーグル画像検索結果 サーモグラフィみたいな表現がおもしろい。自分も真似して他の対象でやってみたいなあと思っていた。 というわけで今回そのための仕組みを作った。 ヒートマップ捏造システム 左のような適当な表を作ると、右のサーモグラフィ的な画像ができる仕組みだ。左側の表で数字が大きい場所ほど右側で赤くなっているのがわかると思う。 ごはんのときにどこを見るか ウェブサイトを訪れるユーザーがどこを見るか、に似た例で、自分が日常の風景でどこを見るか、というのをやって

                                                                                ヒートマップで表したい
                                                                              • RNNからTransformerまでの歴史を辿る ~DNNを使ったNLPを浅く広く勉強~ - arutema47's blog

                                                                                Amazon Prime 一ヶ月無料 Seq2seqからBERTまでのNLPモデルの歴史をざっとまとめる。 DNNは知ってるけどTransformerってなんだかわからない、って人におすすめです。 Abst. 画像認識にもTransformerが使われることが多く、DeepRLやGPT-3といったNLPモデルも身近になってきています。"Attention is 何?"と言えなくなってきたので勉強しました。 Feedforward NetworksからSeq2Seq, Attention機構からTransformer登場、そしてBERT GPTといった最新モデルまでの流れを広く浅く記述する予定。 またKaggle NLPコンペの上位解法から利用例を探る。 Tl;DR TransformerはSelf-Attentionという機構でデータ内の時系列的特徴を抽出でき、従来のRNNを始めとするNN

                                                                                  RNNからTransformerまでの歴史を辿る ~DNNを使ったNLPを浅く広く勉強~ - arutema47's blog
                                                                                • BERTの精度を向上させる手法10選 - Qiita

                                                                                  はじめに 自然言語処理タスクでBERTをfinetuningして使うことが当たり前になってきました。Kaggleなどのコンペや精度要件がきつい案件を行う場合に少しでも精度を向上させたいというシーンが増えてくると考えられます。そこで、精度向上手法をまとめます。タスクとしては分類タスクを想定しています。 文字数調整 学習済みのBERTに入力可能な単語数は最大512個です。そのため、512単語以上のテキストを使用する場合は特別な工夫が必要となります。ここの処理方法の変更が精度向上に寄与することが多いので要チェックです。 例として次のテキストから6単語取得することを考えます(句点も1単語とします) 吾輩 / は / 猫 / で / ある / 。 / 名前 / は / まだ / ない / 。 1. Head-Tail 吾輩 / は / 猫 / で / ある / 。 / 名前 / は / まだ / な

                                                                                    BERTの精度を向上させる手法10選 - Qiita