並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 85件

新着順 人気順

概要 言い換えの検索結果1 - 40 件 / 85件

  • GPT-4はどのようにして「不適切な回答」を回避するように学習されているのか - Qiita

    先日OpenAIより発表されたGPT-4が話題ですが、同タイミングで公表されたTechnical Reportを読んでみたところ、全99ページのうち後半60ページを占めるドキュメント「GPT-4 System Card」において解説されていた、言語AIが抱える危険性と、いかにしてGPT-4が危険な回答を回避するように学習されているかについての内容が非常に興味深かったため、簡単にまとめてみました。 https://arxiv.org/pdf/2303.08774.pdf サマリ GPT-4のリリースに向けて、OpenAIでは安全性を評価するために50人超の専門家らを含む"レッドチーム"を結成。2022年8月から8ヶ月に渡ってリスクの評価とその軽減に向けたチューニングを実施してきた リスク評価における実験の中には「自身をコピーするプログラムを実行できるGPT-4が自己増殖をしないか確認する」と

      GPT-4はどのようにして「不適切な回答」を回避するように学習されているのか - Qiita
    • デジタル庁2023年度事業 行政での生成AI利活用検証から見えた10の学び (1/3)|デジタル庁

      デジタル庁のAI担当の大杉直也です。この記事では、生成AIによる業務改善の一助になればと思い、実際の行政業務で生成AIの利活用を検討する際に得られた知見を共有します。 本記事は、「デジタル庁2023年度事業 行政での生成AI利活用検証の結果報告(以降、報告書とよびます)」で得られた知見を、よりわかりやすく具体的に示すために、「10の学び」の形式にまとめたものです。 その検証ではデジタル庁を中心とした行政職員を対象に、実際に複数種類のテキスト生成AIを取り扱える環境+ユースケースごとの独自開発を含むサポート体制を作り、(1)どの行政業務に対し、(2)どのようにテキスト生成AIを使えば、(3)どのくらい改善効果がありそうか、を調べました。また、報告書には含まれていなかった個別ヒアリング等による知見も反映させています。 文量が少し多くなってしまったため、全3回の構成で紹介いたします。第1回の本記

        デジタル庁2023年度事業 行政での生成AI利活用検証から見えた10の学び (1/3)|デジタル庁
      • 「全数調査なら何でもわかる」という誤解 - 間違えがちな母集団とサンプリングそしてベイズ統計 - - ill-identified diary

        この文章は pandoc-hateblo で tex ファイルから変換しています. PDF 版はこちら 2021/10/15 追記: 後半のベイジアンブートストラップに関する解説はこちらのほうがおそらく正確です ill-identified.hatenablog.com 概要挑発的なタイトルに見えるかも知れないが, 私はしらふだしこれから始めるのは真面目な話だ — 正直に言えばSEOとか気にしてもっと挑発的なタイトルにしようかなどと迷ったりはしたが. 「全数調査できれば標本抽出の誤差はなくなるのだから, 仮説検定は不要だ」という主張を見かけた. いろいろと調べた結果, この問題を厳密に説明しようとすると最近の教科書には載ってない話題や視点が必要なことが分かった. ネット上でも勘違いしている or よく分かってなさそうな人をこれまで何度か見かけたので, これを機に当初の質問の回答のみならず関

          「全数調査なら何でもわかる」という誤解 - 間違えがちな母集団とサンプリングそしてベイズ統計 - - ill-identified diary
        • Googleの本気ついに? 生成AI全開のGoogle Workspace発表

          Googleの本気ついに? 生成AI全開のGoogle Workspace発表2023.03.15 15:0049,529 福田ミホ 新時代、始まるか。 ChatGPTを開発するOpenAIと、そのパートナーとなったMicrosoftの勢いに飲まれてるようにも見えたGoogle。でも「世界中の情報を整理してアクセス可能にする」って掲げた通り、ずーーーっと前から言語も画像も分析しまくってたGoogleなんだから、ホントはChatGPTライクな機能も全然できてるのでは? と、何かもったいなく思っておりました。 でも、3月14日(米現地時間)、そんな期待に応えるかのようなGoogle Workplaceの新機能、そしてデモ動画が発表されました。 Video: Google Workspace / YouTube なんだかいろんな作業がやたらちゃっちゃと捗りそうで、来たか!って感じがします。何がで

            Googleの本気ついに? 生成AI全開のGoogle Workspace発表
          • よいミーティングの作り方 - 弥生開発者ブログ

            こんにちは、Misoca開発チームの黒曜(@kokuyouwind)です。 ついにECS execできるようになったことに咽び泣いていますが、今日の記事は全然関係ない話です。 社内向けに「どうすれば質の高いミーティングを作れるか」を検討した読み物記事を書いていたのですが、社外に出しても問題ない内容だったので開発者ブログに載せることになりました。 割と社内では評判が良かったので、参考になる部分があれば幸いです。 目次 目次 はじめに 要点 よいミーティングとは ミーティングとは よいミーティングの条件 目的の達成度 達成度と時間のバランス 効率の良いミーティング ミーティングの準備 ミーティングの目的とゴールを明確にする ミーティングの参加者を決める ミーティングの前提情報を洗い出す ミーティングの進行方法を決める ミーティングの実施 ファシリテーターの役割 タイムキーパーの役割 参加者の役

              よいミーティングの作り方 - 弥生開発者ブログ
            • Elasticsearchで分散表現を使った類似文書検索

              概要 Elasticseachに分散表現のベクトルに対する類似文書検索が実装されたということで、以下のElasticのブログ記事を参考に類似文書検索を試してみました。 Text similarity search in Elasticsearch using vector fields | Elastic Blog 類似文書検索とは、与えられたクエリの文書と似ている文書を文書集合内から検索する技術です。この際に必要となるのが「似ている」という概念で、計算機上でどうやって2つの文書間の類似度を数値として表現するかがポイントになります。例えば、互いの文書に出現する単語の一致度や重複度合いを測ったり、TF-IDFやBM25などで文書をベクトル化して比較する方法があります。ただしこれらの方法では、言い換え表現や表記の違いにより同じ意味の単語が異なる単語だと判定されたり、文書の中では重要でない単語に

                Elasticsearchで分散表現を使った類似文書検索
              • 今、改めて「淫夢ネタ」の問題点を整理する~今年も盛り上がるハッシュタグ #野獣の日 を見ながら|おしゃべりする鳩

                はじめに本日は2020年8月10日。今年もまたTwitterで #野獣の日 #野獣の日2020 というハッシュタグが盛り上がりを見せている。 いわゆる「淫夢ネタ」としてキャラクター化されている「野獣先輩」と、8/10という日付の語呂合わせである。 ネットのサブカル的文化に触れている人、特にニコニコ動画を見ている人では、まず間違いなく見たことがあるであろう淫夢ネタ。 あるいは、TwitterやYouTubeを見ていれば、それと知らずとも出くわしたことがあるに違いない。 問題点を指摘する人も少なからずいるが、10年以上の長きに渡って「愛され続けて」いるのが現状だ。 筆者も長いことこれを問題視している立場の人間である。 しかし一方で、長くネット/サブカル/オタク文化に触れてきた人間として、一体何が問題なの?…と思う人が多いことは理解できる。 恐らくだが、淫夢ネタに問題に感じる層と淫夢ネタを楽しん

                  今、改めて「淫夢ネタ」の問題点を整理する~今年も盛り上がるハッシュタグ #野獣の日 を見ながら|おしゃべりする鳩
                • グッドパッチの離職率改善を支えた施策「1・3・6インタビュー」|Penpen

                  (こちらの記事は私がグッドパッチ在籍時に公開されたものです。2023年3月付けで退職しており、それ以降のグッドパッチ社の状況を反映したものではありません。) はじめに従業員の離職は多くの会社にとって頭の痛い問題ですが、それを一発で解決してくれる施策はありません。考え得るいくつもの原因に向き合い、地道な改善を続けるしかないのだと思います。 私たちグッドパッチもかつて離職問題に苦しんだ企業です。待遇、評価、マネジメント、育成などあらゆる観点から原因を探り、対策を考えても思うように改善できない状態がずっと続いていました。 離職問題への対応、分析や施策立案は「報酬」や「業務内容」など全社や組織の目線で行われることが多いですが、本当にそれで十分でしょうか。 多くの場合、従業員が会社を辞める理由は個人的かつ複合的です。ひとつひとつで見れば些細と思えるモヤモヤ、わざわざ上司に言うほどでもない不満、本人に

                    グッドパッチの離職率改善を支えた施策「1・3・6インタビュー」|Penpen
                  • VTuberでわからない単語が出てきた時に見る記事とは (ブイチューバーデワカラナイタンゴガデタトキニミルキジとは) [単語記事] - ニコニコ大百科

                    VTuberでわからない単語が出てきた時に見る記事単語 ブイチューバーデワカラナイタンゴガデタトキニミルキジ 3.9万文字の記事 38 0pt ほめる 掲示板へ 記事編集 英数字・記号ア行カ行サ行タ行ナ行ハ行マ行ヤ行ラ行ワ行関連商品関連コミュニティ・チャンネル関連リンク関連項目脚注掲示板 この記事は、改良工事中です。 足りないと感じた項目は掲示板に書き込んでください。 VTuberでわからない単語が出てきた時に見る記事とは、VTuberの動画や各種ニコニコ大百科内のVTuber記事でよくわからない単語が出てきた時に開くページである。 元ネタ: ポケモンでわからない単語が出てきた時に見る記事 英数字・記号 - ア行 - カ行 - サ行 - タ行 - ナ行 - ハ行 - マ行 - ヤ行 - ラ行 - ワ行 掲載基準 本項では、単独項目を作るまでもないという用語を中心に取り扱う。 あまりに本来の

                      VTuberでわからない単語が出てきた時に見る記事とは (ブイチューバーデワカラナイタンゴガデタトキニミルキジとは) [単語記事] - ニコニコ大百科
                    • 新卒データサイエンティスト研修「DSOps研修」とは何か? | CyberAgent Developers Blog

                      1. DSOps研修のイントロ はじめまして,AI事業本部 Dynalystでデータサイエンティストをしている金子です. 最近Twitter上などで,「データサイエンティストとはなんなのか」,「データサイエンティストとはかくあるべき」といった議論を見かけます.最近でも以下のようなBlogや記事で「泥臭い現場で働く実務者としてのデータサイエンティスト」とはどのあるべきか,というような話題が触れられ,twitterなどを中心に話題になっていました. https://qiita.com/He110w0r1d/items/054f988e9a9b01c46572 AI事業本部では,3年ほど前からビジネスへの貢献や課題解決を,「実務者としてのデータサイエンティスト」の大まかな役割として設定し,さまざまな活動を行ってきました.今回の記事では,その中の中心的な活動の1つであるDSOps研修という新卒DS

                        新卒データサイエンティスト研修「DSOps研修」とは何か? | CyberAgent Developers Blog
                      • CISSP 勉強ノート

                        目次の表示 1. 情報セキュリティ環境 1-1. 職業倫理の理解、遵守、推進 職業倫理 (ISC)2 倫理規約 組織の倫理規約 エンロン事件とSOX法の策定 SOC (System and Organization Controls) レポート 1-2. セキュリティ概念の理解と適用 機密性、完全性、可用性 真正性、否認防止、プライバシー、安全性 デューケアとデューデリジェンス 1-3. セキュリティガバナンス原則の評価と適用 セキュリティ機能のビジネス戦略、目標、使命、目的との連携 組織のガバナンスプロセス 組織の役割と責任 1-4. 法的環境 法的環境 契約上の要件、法的要素、業界標準および規制要件 プライバシー保護 プライバシーシールド 忘れられる権利 データポータビリティ データのローカリゼーション 国と地域の例 米国の法律 [追加] サイバー犯罪とデータ侵害 知的財産保護 輸入と

                          CISSP 勉強ノート
                        • 新入生しょくん、まずは「論文の書きかた」を身につけよう――対談:山内志朗×戸田山和久(前編)|本がひらく

                          新入生のみなさん、入学おめでとうございます。新しい一歩を踏み出す前に覚えておきたいのが「論文の書きかた」。『新版 ぎりぎり合格への論文マニュアル』(平凡社新書)の著者・山内志朗先生(慶應義塾大学)と、『最新版 論文の教室』(NHKブックス)の著者・戸田山和久先生(名古屋大学)に、論文執筆をテーマに語り合っていただきました。大学新入生のみならず、学び直しを目論む社会人のみなさんにも必ず役に立つ「知の羅針盤」。まずはその前編をお届けします。 戸田山 きょうのお題は、山内さんの『新版 ぎりぎり合格への論文マニュアル』と私の『最新版 論文の教室』の刊行記念として、大学新入生や新社会人のみなさんを念頭に置いて、論文を書くってそもそもどういうことかを話し合ってみよう、ということです。 山内 私たちは大学時代からの同窓生で、ともに哲学の専攻です。生まれた年は一年違いますが、ともに黒田亘わたる先生のところ

                            新入生しょくん、まずは「論文の書きかた」を身につけよう――対談:山内志朗×戸田山和久(前編)|本がひらく
                          • 『死体を埋める百合』概念の源流とは何か、またはくみれいは如何にして死体を埋めたのか|ヤギ子 / yagiko

                            冒頭から物騒で申し訳ないが、『死体を埋める百合』という言葉がある。 言葉というよりかは言い回しの類だが、要は女性二人が死体を埋めるというシチュエーションに対し、「百合っぽさ」を感じるということである。この「百合っぽさ」については言葉で説明することは難しいが、平たく言えば「イイネ!」ということだ。要するにシチュエーション萌えの一種とご理解いただければ問題ない。 ことは私宛に届いた一通のマシュマロから始まる。 あまり知見が無い方のためにも、順を追って説明していきたい。 まず『死体を埋める百合(上のマシュマロでは死体埋め女女*と表記)』という言葉についてだが、これは一種のインターネットミームのような性格が強いとヤギ子は理解している。後述するが、Twitterなどではある年あたりを境にこの『死体を埋める百合』についての言及が急増加しており、何かをきっかけにしてこの言葉ないしは概念が一気に広まったと

                              『死体を埋める百合』概念の源流とは何か、またはくみれいは如何にして死体を埋めたのか|ヤギ子 / yagiko
                            • 「宇宙と宇宙をつなぐ数学 - IUT理論の衝撃」の感想

                              Amazonのレビューなどに書くと過去のレビューから身バレする可能性があるのと、わざわざ別アカウントを作ってまで批評するほどのものではないと思ったので、こちらに書きます。 初めに断っておきますが、本稿は別に加藤文元先生の人格や業績などを否定しているわけではありません。また、IUT理論やその研究者に対する批判でもありません。「IUT理論が間違っている」とか「望月論文の査読体制に問題がある」などと言う話と本稿は全く無関係です。単純にこの本に対する感想でしかありません。 ---- 加藤文元先生の「宇宙と宇宙をつなぐ数学 - IUT理論の衝撃」を読みました。結論から言って、読む価値の無い本でした。その理由は、 「ほとんど内容がない」 この一言に尽きます。数学書としても、一般書としてもです。 本書の内容と構成本書は、RIMS(京都大学数理解析研究所)の望月新一教授が発表した数学の理論である、IUT理

                                「宇宙と宇宙をつなぐ数学 - IUT理論の衝撃」の感想
                              • 【はてなブログカスタマイズ】はてなブログをcodocで課金記事化する - TOMOKO OOSUKI

                                こちらの記事に少し書いていたのですが petitmatch.hatenablog.com この記事では、codoc(コードク)を使って、はてなブログの記事を課金記事化する方法を紹介します。 1・codocって何? 2・はてなブログの課金記事化 (2-1)投げ銭記事の作り方(投げ銭ボタンの配置) (2-2)有料記事の作り方 (2-3)特商法表記について 【おまけ・1】codocには「自由課金」というのもある 【おまけ・2】課金する側からはどう見えるのか&画像入り解説記事(2021/3/6追記) 1・codocって何? 「codoc」というのは、 HTML編集ができる&JavaScriptの貼り付けができるブログ・サイトで、有料課金記事が作れるというサービスです。 ↓詳しくは あなたのコンテンツをあなたのサイトで販売・課金できる 有料コンテンツ配信&課金サービス codoc (コードク) —

                                  【はてなブログカスタマイズ】はてなブログをcodocで課金記事化する - TOMOKO OOSUKI
                                • 「LGBTQ報道ガイドライン」第2版が公開。「注意すべきフレーズ」が新設(松岡宗嗣) - エキスパート - Yahoo!ニュース

                                  性的マイノリティをめぐる報道が増加する中、より良い報道を求めてLGBT法連合会が主体となり策定した「LGBTQ報道ガイドライン - 多様な性のあり方の視点から」の第2版が18日、公開された。 一般社団法人fairも制作に携わり、新聞やテレビ、WEBメディアで働く有志の記者の協力を受けて改訂。第1版に引き続き、取材をする側、される側となる記者・当事者の双方に確認すべきポイントを提示した。 さらに第2版では、新たに「注意が必要なトピックやフレーズ」が追加。「LGBT男性」や「禁断の愛」といった表現の問題から、警察発表や事件報道の際のアウティングについての注意、トランスジェンダーに関する説明の望ましい表現などが説明されている。 よくある表現の懸念、言葉の変化を解説取材をする際、される際のチェックリストでは、アウティング(本人の性のあり方を同意なく第三者に暴露する行為)を防ぐために、本人のカミング

                                    「LGBTQ報道ガイドライン」第2版が公開。「注意すべきフレーズ」が新設(松岡宗嗣) - エキスパート - Yahoo!ニュース
                                  • 継続事前学習による金融ドメイン特化LLMの構築の検証 - Preferred Networks Research & Development

                                    この記事は、金融チームエンジニアの今城(@imos)と金融チームリサーチャーの平野(@_mhirano)による寄稿です。 概要 本稿では、ドメインに特化したLLMの構築の一環として、金融ドメイン特化のLLMの構築の検証を行いました。継続事前学習によるドメイン知識の獲得を模索し、特定のドメイン向けに専用のパラメータ数が多い高性能なLLMを提供を可能にすることを目指します。 実験では、nekomata-14bとPFNで構築した金融に特化したデータセットを用いて、継続事前学習を実施しました。 継続事前学習の結果として、金融ベンチマーク性能が向上することが確認できました。 出力の差としては、Instruction Tuningを施していないため、大きな差は見られないものの、一定の差が見られるケースもありました。 継続事前学習後のモデルは、https://huggingface.co/pfnet/n

                                      継続事前学習による金融ドメイン特化LLMの構築の検証 - Preferred Networks Research & Development
                                    • SEO業界には専門用語が多すぎる! わかりやすく言い換えて伝え、人を動かしていこう | Moz - SEOとインバウンドマーケティングの実践情報

                                      「リッチスニペット」「canonical」「404」「301」、SEO業界には専門用語が多すぎる! そもそも「SEO」からして意味がわからない! ―― さまざまな部署やパートナーと協力して進めなければいけないイマドキのSEOでは、専門用語を使わずに、相手がわかる言葉を使うのがベストだろう。 数年前、女友達たちとアスペンハイランドでスキーを楽しんでいたところ、山側からいきなりスキーヤーが突っ込んできた。相手はプロのスキーヤーで、ものすごいスピードを出していたため、片足のけがで済んだのは幸運だった。とはいえ、足に体重をかけることができず、現地の救急室に向かった。 診断のため医師や看護師が入れかわり検査すること数時間、初めて会う新たな医師が部屋に入ってきた。そして開口一番、こんな風に言われた。 内側半月板に放射状断裂があります。 何のことを話しているの私にはわからなかった。医師はその後も、患者相

                                        SEO業界には専門用語が多すぎる! わかりやすく言い換えて伝え、人を動かしていこう | Moz - SEOとインバウンドマーケティングの実践情報
                                      • ユーザープロンプトをLLMが言い換えて、LLM自身が理解しやすくする手法『RaR』 | AIDB

                                        ユーザープロンプトをLLMが言い換えて、LLM自身が理解しやすくする手法『RaR』 2023/11/13 AI論文解説 LLM プロンプト AIDB Research 本記事では、大規模言語モデル(LLM)に対するユーザーの質問・指示に対する応答の質を向上させる新しい手法「RaR(Rephrase and Respond)」について、論文をもとに紹介します。本研究はカリフォルニア大学ロサンゼルス校(UCLA)の研究者によって発表されています。 「RaR」は、LLMがユーザーの質問を自身が理解しやすい形に自ら言い換える手法で、GPTシリーズ(GPT-4、GPT-3.5)など複数のLLMで効果が確認されています。 RaRの実行プロンプトは比較的シンプルであり、LLMに質問の言い換えと回答を一度に行わせることが可能です。 以下ではRaRの研究背景、理論、実行プロンプト例、実験の内容と結果、デモン

                                          ユーザープロンプトをLLMが言い換えて、LLM自身が理解しやすくする手法『RaR』 | AIDB
                                        • 投資家用・スタートアップ支援用・大学支援用に改良中 更新中)tfidf etc embeddings cluster reconstructing vis: 特許など長文の、動的な文章間類似俯瞰図可視化・迅速閲覧・解析・探索手段。および第三の特許検索手法、動的な知識抽出管理手法、特許自動生成 (類似度ベクトルと小規模言語モデル及びChatGPTを用いた空白領域における特許生成追加) - Qiita

                                          投資家用・スタートアップ支援用・大学支援用に改良中 更新中)tfidf etc embeddings cluster reconstructing vis: 特許など長文の、動的な文章間類似俯瞰図可視化・迅速閲覧・解析・探索手段。および第三の特許検索手法、動的な知識抽出管理手法、特許自動生成 (類似度ベクトルと小規模言語モデル及びChatGPTを用いた空白領域における特許生成追加)自然言語処理NLP可視化Visualization特許 追記を繰り返しており整合性も取れておらず非常に読みにくい状態です.近日中に再整理します. 技術だけではなく方法論が重要となります。後ろ向きに検証し、前向きに予測することが重要となるでしょう。現在検証中です。 お題をいただけますと助かります。後ろ向き検証ではどうもわかりきったものを恣意的に選んで言えるかもしれない危惧があるところです。 個人的には、会社の方針に

                                            投資家用・スタートアップ支援用・大学支援用に改良中 更新中)tfidf etc embeddings cluster reconstructing vis: 特許など長文の、動的な文章間類似俯瞰図可視化・迅速閲覧・解析・探索手段。および第三の特許検索手法、動的な知識抽出管理手法、特許自動生成 (類似度ベクトルと小規模言語モデル及びChatGPTを用いた空白領域における特許生成追加) - Qiita
                                          • LLMにまつわる"評価"を整理する

                                            「LLMの評価」というフレーズを見て、どんなことを思い浮かべるでしょうか? おそらく大半はLLMモデル自体の評価のことを思い浮かべると思います。新しいモデルが出てきた時に𝕏で見かける「GPT-4o のMMLUベンチマークは89%!」みたいなアレ。 ですが、プロダクト開発にLLMを使っている人の間では、プロンプト等が十分な品質を出しているかの確認などにも評価という言葉を使っていることは多いのではないかと思います。 うまい具合に後者を区別するためにいい感じの呼び名を付与したい気持ちがあるのですが、英語圏での例を見てみるとシンプルに"Evals"と呼んでることもあれば Evaluating LLM System Evaluating LLM-based Applications などなど表現の仕方は様々になっています。 そしてそのプロダクト開発文脈での評価も、実態としてはオフライン評価やオンラ

                                              LLMにまつわる"評価"を整理する
                                            • ELYZA-tasks-100 でLLM14個の日本語性能を横断評価してみた - Qiita

                                              TL;DR 14個の「日本語が話せるLLM」(日本製・外国製問わず)の性能を、日本語データセット ELYZA-tasks-100 で横断評価しました 海外勢70Bモデルの性能が高いことがわかりました。7Bでは ELYZA-japanese-llama-2 や CALM2 の成績がよかったです モデルの回答・スクリプトへのリンクは記事内に貼っています JGLUE などのベンチマークは、モデルの性能を反映しているのか? 2023年は、かつてないほど多くの LLM が(クローズド・パブリック問わず)公開され、まさに LLM フィーバーの年でした。 一方で、どのモデルが高性能なのか、自分の利用用途に合ったモデルはどれなのか、とお悩みの方も多いのではないでしょうか。 LLM の性能を比較するときに役立つのが、ベンチマークです。 英語圏の LLM に関していえば、MMLU や HellaSwag、Wi

                                                ELYZA-tasks-100 でLLM14個の日本語性能を横断評価してみた - Qiita
                                              • DBMで単語辞書を作ろう - 豪鬼メモ

                                                データベースマネージャTkrzwを無事にリリースしたはよいが、ドッグフードは自分で食わないといけない。DBMを作るとまず最初にやりたくなるのが、それを使った単語辞書を作ることである。仕事柄、英和辞書と和英辞書はよく使うのだが、自分で作ったものを毎日便利に使っている。時間効率と空間効率に優れたDBMは辞書データを扱うのにうってつけだ。ということで、PythonでとDBMライブラリを使って単語辞書を実装していこう。 同じ仕組みで英和辞書でも和英辞書でも独和辞書でも中仏辞書でも何でも作れるが、当然ながら辞書データが必要である。私は普段、英辞郎のデータを購入して使っているが、ライセンス上、デモサイトの公開などには使えない。代わりに、この連載ではプリンストン大が公開しているWorldNetというデータベースを利用して英英辞書を作る方法を紹介する。ただし、入力データを先にTSV形式の中間データに落とし

                                                  DBMで単語辞書を作ろう - 豪鬼メモ
                                                • 米国大学院PhD出願に対する私なりの臨み方 - Counterfactualを知りたい

                                                  はじめに こんにちは、はじめまして、usaito(HP, twitter)です。2016年の4月に東京工業大学の第4類に入学し、その後工学院経営工学系に進みました。途中1年間休学したこともあり、2021年の3月に学士課程を卒業しました。大学入学から丸5年が経ったと思うと、あっという間だったなという感覚ととても長かったという感覚が入り混じっていてなんだか不思議な感じです。 さて、あとでも詳しくまとめますが、昨年12月に米国大学院の博士課程にいくつか出願し、結果的にCornell UniversityのDepartment of Computer Scienceに博士学生として進学することなりました。 本記事では、私が出願過程で経験したことや考えていたことをまとめます。 私としては詳細かつ赤裸々に経験をまとめたつもりですが、 客観的な情報源としてはすでに素晴らしいリソースがいくつも存在するので

                                                    米国大学院PhD出願に対する私なりの臨み方 - Counterfactualを知りたい
                                                  • 小池都知事の英語がすごい!新型コロナウイルス感染症に関する情報発信の動画で存在感 - ENGLISH JOURNAL

                                                    新型コロナウイルス感染症に関する公的な情報発信では、濃厚接触を避けるためもあり、動画が活用されています。その中で存在感を示しているのが、東京都の小池百合子知事。毎週、英語でもライブ配信を行っています。どんな内容をどんな英語で発信しているのか、チェックしてみましょう! ヒカキンとも共演!ネットで発信中の小池都知事はどんな人?2016年8月に第20代東京都知事に就任した小池百合子氏。カイロ大学に通い、政治家になる前はアラビア語通訳者やニュースキャスターとして活躍し、 英語が堪能 なことでも知られています。 小池氏の 公式Twitter の フォロワー数は72万人 。最近は新型コロナウイルスに関する情報を中心に、ほぼ毎日つぶやいているようです。 そして、このツイートにあるように、#うちで過ごそう #StayHome の情報発信として、 「ヒカキンTV」にも出演 !リモートでヒカキンさんとつながり

                                                      小池都知事の英語がすごい!新型コロナウイルス感染症に関する情報発信の動画で存在感 - ENGLISH JOURNAL
                                                    • 【語学学習】『総理通訳の外国語勉強法』中川浩一 : マインドマップ的読書感想文

                                                      総理通訳の外国語勉強法 (講談社現代新書) 【本の概要】◆今日ご紹介するのは、先日の「未読本・気になる本」の記事の中でも人気だった勉強本。 帰国子女でもないにもかかわらず、外務省のアラビア語の通訳として活躍されている中川浩一さんが、その語学勉強法を指南してくださいます。 アマゾンの内容紹介から。世界最難関のアラビア語を24歳になってから始め、天皇通訳、総理通訳まで務めた現役外交官が、苦難の道のりの中で編み出した秘伝の外国語習得術を惜しみなく伝授! グローバル社会で外国語を武器にしたいビジネスパーソン、英語を一からやり直したい日本人必読の書。 若干とはいえ、Kindle版がお買い得となっていますから、こちらもご検討ください! Reading / TMAB2003 【ポイント】■1.外国語の習得に「なぜ?」は不要 先述のとおり、私がエジプトに留学中、一緒に勉強したアメリカ人、フランス人たちは、

                                                        【語学学習】『総理通訳の外国語勉強法』中川浩一 : マインドマップ的読書感想文
                                                      • [多項式・形式的べき級数](1)数え上げとの対応付け | maspyのHP

                                                        概要 ある種の数え上げの計算は、多項式・形式的べき級数に対する計算と結び付けることができます。数え上げの問題を、多項式・形式的べき級数に対する計算と読み替えて、代数的な式変形により答を得る手法が、競技プログラミングにおいても注目され始めているようです。 さまざまな問題を文字式の問題に翻訳できるようになっておけば、文字式に対して理解を深めるだけで、幅広い問題に対する解決力を同時に伸ばしてしまうことができます。また、中高数学の学習で学んだ文字式や関数の式変形に対する能力が利用できることも魅力になると思います。 ここでは、数え上げの対象を多項式・形式的べき級数の問題に対応させる練習をしていきましょう。(逆に言うと、対応させた先の「多項式・形式的べき級数の問題を解く」方法の説明は、この記事では扱いません。) 多項式への言い換えは、経験がないうちは、唐突に感じてしまうことがあると思いますが、頻出のパ

                                                          [多項式・形式的べき級数](1)数え上げとの対応付け | maspyのHP
                                                        • 二十四節気スイング 冬至 3周目 カピバラもゆず湯に入ってます。 - 素振り文武両道

                                                          皆様、ご機嫌いかがでしょうか。 本日は【140】バットを振りました。 本日は二十四節気の22番目、 「冬至」(とうじ)になります。 カピバラがゆず湯に入ってます。 ヤフーニュースより。 https://news.yahoo.co.jp/articles/8a9ee66c4cfe4c511985c4e7535bd552910193f1 ということで、 12月の二十四節気は大雪と冬至です。 十二月、大雪、冬至。 「十二単衣(を着た人)が、 大西洋で、 ドジョウすくい」 と50回 【言って振り】ました。 「十二単衣」は12月の言い換えで、 「たいせいよう」は「たいせつ」 「ドジョウ」は「とうじ」の、 言い換えです。 他の◯月も人の属性に変換してます。 2月、忍者, 3月、散髪屋さん, 4月、ヨットマン, 5月、碁会所の店主, 6月、ロクロを回す陶芸家, 7月、質屋さん, 8月、薬局屋さん, 9月

                                                            二十四節気スイング 冬至 3周目 カピバラもゆず湯に入ってます。 - 素振り文武両道
                                                          • OpenAI の Model Spec の概要|npaka

                                                            以下の記事が面白かったので、簡単にまとめました。 Exampleは省略してるので元記事で確認してください。 ・Model Spec (2024/05/08) 1. Model Spec の概要1-1. Model Spec の概要これは「Model Spec」の最初のドラフトであり、OpenAI APIおよびChatGPTでのモデルの望ましい動作を指定する文書です。これには、一連の中核目標と、矛盾する目標や指示に対処する方法に関するガイダンスが含まれています。 OpenAIの目的は、研究者やデータラベル作成者がRLHF と呼ばれる手法の一部としてデータを作成するためのガイドラインとして「Model Spec」を使用することです。「Model Spec」はまだ現在の形式では使用していませんが、その一部はOpenAIでRLHFに使用したドキュメントに基づいています。また、モデルが「Model

                                                              OpenAI の Model Spec の概要|npaka
                                                            • 心理学リスト作ってみた!ブログ・アフィリエイト・自己啓発に役立てよう - 赤兎馬おじさんの足跡 ~経験値のお裾分け~

                                                              【なるほど心理学】は、初心者のおっさんが心理学を学びながら、アフィリエイトや ブログに役立てられそうな情報をインプットし、自分なりに落とし込んでいく腹黒さと 野望感たっぷりのシリーズです。 せっかくのブログ・アフィリエイトだから… 多くの読者様に興味を持たれる、魅力的なコンテンツを目指したい 読者様(あるいはペルソナ)に合わせた、効果的な文章を書きたい 無意識にココロを動かす、魔法の記事を発信したい おすすめする商品を購入し、もっと利用して欲しい あなたがこういう願望や目標をお持ちでしたら、是非本記事を読み進めてみて下さい。 当ブログにお立ち寄り頂きまして、ありがとうございます!m(_ _)m こう見えて実は、心理学を学んでみたらメンタルに磨きがかかった赤兎馬おじさん (@sekitoba1007)です。 ヘヴィ・メンタルかもしれません。🎸 なんていう小ボケはともかくとして、困難に直面し

                                                                心理学リスト作ってみた!ブログ・アフィリエイト・自己啓発に役立てよう - 赤兎馬おじさんの足跡 ~経験値のお裾分け~
                                                              • 二十四節気スイング 啓蟄 4周目 - 素振り文武両道

                                                                皆様、ご機嫌いかがでしょうか。 本日は【160】バットを振りました。 二十四節気のときに素振りをしてますが、今日は「啓蟄」けいちつ、です。 二十四節気の3月は、 散髪屋さんが、 毛を切り、 新聞を読む。 ということで、 「3月は啓蟄と春分です」の 言い換えです。 さて、本日は啓蟄関連のニュース記事の文章を読み、 バットを振りました。 ピンク字の6行を10回ずつ繰り返し 【言って振り】ました。 ヤフーニュースより引用, 仙台市、モクレンのつぼみが、 銀色の毛皮のように膨らみ、 開花が近づいている。 (河北新報) - Yahoo!ニュース, https://news.yahoo.co.jp/articles/46fcce8eb2635f42b334739bbcaca3f0e83d54ca 盛岡、ハクチョウは北帰行。 (岩手めんこいテレビ) - Yahoo!ニュース, https://news.

                                                                  二十四節気スイング 啓蟄 4周目 - 素振り文武両道
                                                                • PDCAサイクル スイング - 素振り文武両道

                                                                  本日は180本バットを振りました。 皆様こんばんは。 いかがお過ごしでしょうか。 今日は『PDCAサイクル』とはどんなものか、言いながらバットを振りました。 ウィキペディアより文章抜粋しました。 PDCAサイクル(PDCA cycle、plan-do-check-act cycle)とは品質管理など業務管理における継続的な改善方法。Plan(計画)→ Do(実行)→ Check(確認)→ Act(改善)の4段階を繰り返して業務を継続的に改善する方法。 素振りですが、 P プラン  計画【言って振る】×10 D ドゥー  実行   同  上 C チェック 確認   同  上 A アクト  改善   同  上 で40スイングでした。 そして「Aアクト改善」をもう一度×10【言って振り】ました。 覚えやすい文章にするとしたら、 「プランを立てて、 ドゥーしようかな、 まずズボンのチャックを確認し

                                                                    PDCAサイクル スイング - 素振り文武両道
                                                                  • 二十四節気スイング 大寒 - 素振り文武両道

                                                                    皆様、ご機嫌いかがでしょうか。 本日は【140】バットを振りました。 本日は「大寒」で二十四節気の二十四番目です。 一年の内でもっとも寒いということですが、今年はそうではなかったですね。 1月は小寒と大寒の2つですが(毎月2つですが)、 「一途な蒋介石とタイガーマスク」 と覚えてましたが、センシティブな表現なので改めます。 「いちご商人が城下町で代官と会う」 にします。 いちご商人=一月, じょうかまち=しょうかん(小寒) だいかん=だいかん(大寒) と覚えるように振りました。 それでは残りの2月から12月です。 月間の言い換えは、職業、生業、身分に統一しました。 忍者が一瞬薄着になる。 散髪屋さんが毛を切って新聞読む。 ヨットマンに声明する国王。 碁会所のオヤジがリカちゃん人形をショーケースに投げる。 ロクロを回す陶芸家が帽子かぶって化粧台の前に座る。 質屋さんが塩胡椒舐めながら大ジャン

                                                                      二十四節気スイング 大寒 - 素振り文武両道
                                                                    • 知的誠実さとは何か (2) ~ リソースの観点からの包括的な説明 - 已己巳己ブレイクダウン

                                                                      [概要]「知的誠実さ」の基準は、議論の参加者が、自分の手の届くリソースについてどのように認識しているのかによって決まり、これが一致していないと話が通じない状態となる。この枠組みによって、多種多様な「知的誠実さ」に関する意見の多くについて、それぞれの視点で正当性があることを説明できる。 目的と方針 目的:包括的な説明 方針:「リソース」に着目 仮説:知的誠実さの基準は「リソース逼迫度合いの認識レベル」に依存する Lv.1 協働 Lv.2 競争 Lv.3 衝突 リソース逼迫度合いの認識を整理すると何が分かるのか 注意点 どの認識を取りたがるかは目的によって変わる 「発散/収束」に対する考え方の違い Lv.1 観点の発散/収束 Lv.2 観点の発散/収束 Lv.3 観点の発散/収束 はてブにおける発散/収束 「議論とは何か」の考え方の違い Lv.1 観点の「議論」 Lv.2 観点の「議論」 Lv

                                                                        知的誠実さとは何か (2) ~ リソースの観点からの包括的な説明 - 已己巳己ブレイクダウン
                                                                      • 文章がうまい人がやっている「意外すぎる」訓練

                                                                        独学大全 古代ギリシアから最新論文まで、ありとあらゆる「知」を全網羅。 著者が独自に収集・開発した技法「ベスト55」を厳選した『独学大全』から、勉強の具体的な悩みに答えます。 バックナンバー一覧 『独学大全──絶対に「学ぶこと」をあきらめたくない人のための55の技法』を推してくれたキーパーソンへのインタビューで、その裏側に迫る。 今回インタビューしたのは、人文思想系から経済・ビジネスまで、幅広い分野の書籍を手がけるライター・編集者の斎藤哲也氏。「独学」が欠かせない職業柄、斎藤氏は『独学大全』をどう読んだのか? 今回は、同業者、そしてライター志望者に向けて、本書の活用法を語ってもらった。(取材・構成/藤田美菜子) 前回記事はこちら:プロのライターもうなる!「文章を書く人の奥義」が詰まった一冊 「自分ならどんな入門書が書けるか」を考える ――『独学大全』では、「学習の目標」を立てる重要性も強調

                                                                          文章がうまい人がやっている「意外すぎる」訓練
                                                                        • 小山晃弘氏の"「女性には生理というハンデがある」は完全に嘘"という記事への反論|suteaka

                                                                          元記事:「女性には生理というハンデがある」は完全に嘘 元記事の内容を読んだ上で、タイトルに「完全に嘘」という強い表現を使っていることから、これは仮説の提唱レベルではなく、科学的事実として主張しているものと私はみなしている。 本記事の内容は、「実験データに基づいた科学的根拠によって小山氏の論を否定するもの」ではなく、「そもそも小山氏の論は科学的根拠に基づいてない」としてその論を否定するものである。 有料記事の範囲は読んでなく、無料記事の範囲での反論である。 小山氏の主張概要小山氏の主張は、簡潔にまとめれば以下のようなものである。 ・女性の月経は10歳から15歳にかけて始まる ・もし月経によるパフォーマンス差が本当にあるのならば、10歳から15歳にかけて男女のパフォーマンス差が現れるはずである ・平成15年度の 小・中学校教育課程実施状況調査によると、算数(数学)と国語の男女の得点率はほぼ水平

                                                                            小山晃弘氏の"「女性には生理というハンデがある」は完全に嘘"という記事への反論|suteaka
                                                                          • 【旧皇族の皇籍復帰の憲法問題まとめ】宍戸常寿の養子縁組に関する「違憲の懸念」への反応と反論 - 事実を整える

                                                                            論点整理に対する反論 ※令和5年12月追記※ 内閣法制局は皇統に属する男系男子の養子縁組につき一定の条件のもとでは憲法14条の問題は生じないと明確に答弁しました。その論理構成はここで論じているものとは異なります。 ※※追記終わり※※ 【旧皇族の皇籍復帰(養子縁組)】に関する有識者会議 宍戸常寿の養子縁組に関する「違憲の懸念」 旧皇族の養子縁組(を法律や皇室典範で規定すること)は「門地による差別」? 1:皇室に人権規定は完全には適用されない 2:個別の身分行為の意思の対象選択自体には平等の要請は働かない 3:旧皇族の皇籍復帰・養子縁組はその他国民との「差別」と観念できない 4:その他「一般国民と旧皇族は同一に考えることはできない」など 皇族は皇室会議の議を経た婚姻から生まれた子が前提という事との整合性? 現行制度では皇位継承資格者は出生時より皇族であることが条件であることとの整合性? 天皇の

                                                                              【旧皇族の皇籍復帰の憲法問題まとめ】宍戸常寿の養子縁組に関する「違憲の懸念」への反応と反論 - 事実を整える
                                                                            • 【なるほど心理学】成功恐怖理論から学ぶブログ・アフィリエイトへの応用 - 赤兎馬おじさんの足跡 ~経験値のお裾分け~

                                                                              【なるほど心理学】は、初心者のおっさんが心理学を学びながら、アフィリエイトや ブログに役立てられそうな情報をインプットし、自分なりに落とし込んでいく腹黒さと 野望感たっぷりのシリーズです。 せっかくのブログ・アフィリエイトだから… 多くの読者様に興味を持たれる、魅力的なコンテンツを目指したい 読者様(あるいはペルソナ)に合わせた、効果的な文章を書きたい 無意識にココロを動かす、魔法の記事を発信したい おすすめする商品を購入し、もっと利用して欲しい あなたがこういう願望や目標をお持ちでしたら、是非本記事を読み進めてみて下さい。 当ブログにお立ち寄り頂きまして、ありがとうございます!m(_ _)m こう見えて実は、この記事を書くまで自分がこれまで成功しなかったのは、自らの才能 の無さが最大の原因だとばかり考えていた赤兎馬おじさん(@sekitoba1007)です。 夢を叶えるために、成功するた

                                                                                【なるほど心理学】成功恐怖理論から学ぶブログ・アフィリエイトへの応用 - 赤兎馬おじさんの足跡 ~経験値のお裾分け~
                                                                              • 日経のデータサイエンティスト3名(+外部1名)で自然言語処理コンペに出た話 — HACK The Nikkei

                                                                                情報サービスユニットの増田です。普段は自然言語処理やBtoBプロダクトのユーザログの分析などを担当するデータサイエンティストとして仕事をしています。 本記事では、世界最大級のデータサイエンスコミュニティプラットフォームである「Kaggle」にて2-5月に開催されていた自然言語処理コンペティション「NBME - Score Clinical Patient Notes」 に弊社のデータサイエンティスト3名(ほか、外部の機械学習エンジニアの方1名)でチームを組んで参加した体験談を紹介します。 コンペティション概要 このコンペティションのホストであるNBME(National Board of Medical Examiners)は、米国で医師免許試験を実施している機関です。受験者はその免許試験において、仮想的な患者が発言した内容に基づきカルテを記述します。そのカルテの採点は現状人手で行っている

                                                                                  日経のデータサイエンティスト3名(+外部1名)で自然言語処理コンペに出た話 — HACK The Nikkei
                                                                                • 平沢進の音楽世界観を多角的に紐解く - Music Synopsis

                                                                                  ※当記事は文字数が9万字以上ある記事になります。 そのため、時間がある時に閲覧すること、また字数の関係上スマートフォンでの閲覧よりもパソコンやタブレット端末での閲覧を併せて強く推奨します。 ・はじめに これまで久石譲・菅野よう子といったメジャーでありながら知名度も抜群であり多大なフォロワーがいる、いってみれば名実ともに全員が納得できる偉大な大家について書きました。つまり大衆が愛すべき作曲家に焦点を当てました。しかし今回はすこし捻った特集を組みました。 マイナーだけど何故かメジャーアーティストとして有名という音楽版の諸星大二郎とでも形容すべき人物、つまりは平沢進です。まず音楽版の諸星大二郎とはどういう意味なのか、という点についてです。 同業者からは絶大な支持があるもののより広域的な範囲では知られていないという存在を形容するものとして「ミュージシャンズ・ミュージシャン」という単語があります。

                                                                                    平沢進の音楽世界観を多角的に紐解く - Music Synopsis