コンテンツブロックが有効であることを検知しました。 このサイトを利用するには、コンテンツブロック機能(広告ブロック機能を持つ拡張機能等)を無効にしてページを再読み込みしてください。 ✕
コンテンツブロックが有効であることを検知しました。 このサイトを利用するには、コンテンツブロック機能(広告ブロック機能を持つ拡張機能等)を無効にしてページを再読み込みしてください。 ✕
「LLMのふるまい」関連研究 GPT-4に選択肢を与えるとき、順序を入れ替えるだけで性能に大きな変化があることが明らかに 大規模言語モデルにおける課題と応用例を整理した結果 ChatGPTの”ふるまいの変化”を定量的に分析した結果 従来の課題 LLMの登場と期待 大規模言語モデル(LLM)が登場して以来、その能力に多くの期待が寄せられています。LLMが人間のように自然言語を理解しているように見えたり、複雑な構造のテキストを生成する能力には多くの驚きがありました。 論理的一貫性への疑問 しかし、その一方で、LLMが「どれだけ論理的なのか?」という問いに対する明確な答えがない状況が続いています。LLMが高度な自然言語処理能力を持つ一方で、その論理的一貫性や一般化能力についてはまだ十分に理解されていません。 一般化の問題 LLMにおける一般化の能力に対する疑問とは、「LLMは大量のデータで訓練さ
今回研究者らは不完全情報ゲームであるポーカーに似たゲームに対応できるAIモデル『Suspicion-Agent』を開発しました。 アーキテクチャは、以下の3つの主要な要素で構成されています。 1. 観察インタープリタ(Observation Interpreter) ゲームの状態を解析し、エージェントに何が起きているのかを理解させる役割を果たします。ゲームの進行状況や他のプレイヤーの行動を観察し、それをエージェントが解釈できる形に変換します。 2. 計画モジュール(Planning Module) 観察インタープリタから得られた情報を基に、具体的な行動計画を立てる役割を持ちます。エージェントがどのように行動すべきかを決定する際の戦略を形成します。 3. 心の理論(Theory of Mind) 他のプレイヤーの行動や意図を理解し、それをエージェントの戦略に取り込む役割を果たします。他のプレ
心や性格に関する関連研究 ポーカーなど不完全情報ゲームを「心の理論」で上手にプレイするGPT-4ベースの『Suspicion(疑心)-Agent』松尾研など開発 「心の理論」においてGPT-3は人間の3歳、GPT-4は人間の7歳(基本の概念を理解しているレベル)に相当するとの研究報告 LLMの個別の性格(人格)特性を、プロンプトで「測定」「形成」する手法 従来の課題 精度の問題 SNSの投稿からメンタルヘルスを分析する研究は数多く行われてきました。しかし、これまでの手法では精度が高いとは言えませんでした。従来は、自然言語処理(NLP)技術を用いた「テキスト分類タスク」としてメンタルヘルス分析を行ってきました。これらの手法は、その解釈性が低いという問題がありました。ブラックボックスとも呼ばれます。 解釈性の欠如 解釈性が低いということは、その分析結果がどのように導き出されたのか、何を基にして
関連研究 ■GPT-4などのLLMに「自らの論理的な整合性をチェック」させるフレームワーク『LogiCoT』と実行プロンプト ■LLMの出力から誤り(ハルシネーション)を減らす新手法『CoVe(Chain-of-Verification)』と実行プロンプト ■LLMに自身のハルシネーション(幻覚)を「自覚」させ、減らす方法 従来の課題 手作りのプロンプト戦略 現在、プロンプトエンジニアリングの分野で広く用いられているChain-of-Thought(CoT)やその派生テクニックは、基本的には手作りです。特定のタスクや問題に対して最適なプロンプトを設計する際に、人の専門家が手動でプロンプトを生成しています。 自動化の必要性 手作りのアプローチは効果的である場合も多いですが、スケーラビリティに欠けるという問題があります。大規模言語モデル(LLM)が多様なタスクで使用される現代においては、プロン
尿酸値が高い人は「血管が痛み始める段階」 尿酸値は、メタボ健診の必須項目には入っていませんが、とても大切な検査項目です。 尿の中に排泄されることから「尿酸」という名前がついていますが、尿検査ではなく、血糖値やコレステロールと同じく血液検査で調べます。 そして、尿酸値が基準値を超えていると、血管障害が少し進み、「血管が傷み始める段階」になっていると考えられます。 尿酸とは、腎臓から捨てられる老廃物の1つです。抗酸化物質でもあるので、必ずしも悪者ではなく、ある程度の量は体に必要な物質です。中には遺伝的に尿酸がつくれず、極端に尿酸値が低い「低尿酸血症」の人がいます。そういう人は活性酸素によって血管が傷み、動脈硬化が進みやすい可能性があります。 一方、尿酸は多過ぎても血管の内皮細胞に炎症を起こし、やはり血管障害を進めてしまいます。 予防のためには6.0mg/dL以下をキープ 高尿酸血症の診断には「
2023年の初頭に大きな話題となり、大ブームを巻き起こしたAIサービス「ChatGPT」。今でもたびたびテレビで取り上げられ、その名前を聞かない日はないほど。 しかし、これまでもAIと会話ができるサービスは数多く存在したのに、なぜChatGPTだけがこんなに大ブレイクしたのでしょうか? その理由はChatGPTがこれまでのAIとは違い、「生成型」であること。「ジェネレーティブAI」とも呼ばれる生成型AIの特徴は、“新しいコンテンツを作り出せる”という点。つまりChatGPTは、まったく新しい文章を自分で生成することができるのです。 しかし、単純な質問に回答してもらうだけでは、ChatGPTの実力をフル活用できていません。ChatGPTは質問に答えるだけのチャットボットではなく、さまざまな用途に活用できます。テキスト生成AIなので、メールの文面や架空小説の創作なんて作業はお手のものです。 ほ
FinancialField編集部は、金融、経済に関する記事を、日々の暮らしにどのような影響を与えるかという視点で、お金の知識がない方でも理解できるようわかりやすく発信しています。 編集部のメンバーは、ファイナンシャルプランナーの資格取得者を中心に「お金や暮らし」に関する書籍・雑誌の編集経験者で構成され、企画立案から記事掲載まですべての工程に関わることで、読者目線のコンテンツを追求しています。 FinancialFieldの特徴は、ファイナンシャルプランナー、弁護士、税理士、宅地建物取引士、相続診断士、住宅ローンアドバイザー、DCプランナー、公認会計士、社会保険労務士、行政書士、投資アナリスト、キャリアコンサルタントなど150名以上の有資格者を執筆者・監修者として迎え、むずかしく感じられる年金や税金、相続、保険、ローンなどの話をわかりやすく発信している点です。 このように編集経験豊富なメン
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く