並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 16 件 / 16件

新着順 人気順

*テストの検索結果1 - 16 件 / 16件

  • OpenAI「GPT-4.5」がチューリングテストに合格したと、カリフォルニア大の研究チームが発表

    sponsored 「社内/社外への安全な共有」から「Office文書の共同編集」「電子署名」まで “仕事で使うDropbox”の基本と便利な使い方 ― 人気記事ベストセレクション sponsored 手軽なのに安心なサイバーセキュリティ対策「QTクイックセキュリティアセスメントサービスpowered by KDSec」 自社のセキュリティ対策の弱点を2週間で可視化 中小企業向け問診型のセキュリティ診断 sponsored 気軽に着けられるサイズと価格、最長14日間の動作や充実の睡眠モニタリングなどが特長 人気スマートバンドがさらに魅力的に進化! ファーウェイ「HUAWEI Band 10」レビュー sponsored JN-i238G200F-HSP-Wをレビュー 200Hzの23.8型ゲーミングディスプレーが2万980円!? さすがに安すぎるけど大丈夫? sponsored Wi-Fi

      OpenAI「GPT-4.5」がチューリングテストに合格したと、カリフォルニア大の研究チームが発表
    • runn と Testcontainers で「ちょうどいい」Go API テスト - Techtouch Developers Blog

      はじめに バックエンド API のテスト事情 バックエンドのテスト構成(これまでとこれから) テスト構成分類(これまで) テスト構成分類(これから) 「ちょうどいい API テスト」とは API テストに求める価値 実行の容易性 メンテナンスのしやすさ 技術選定のポイント runn の採用理由 Testcontainers の活用 実装例 API サーバー実体 APIテスト runn シナリオ APIテストコード おわりに はじめに バックエンドエンジニアの nome です。花粉症🤧なのでこの時期はリモート仕事の幸せを改めて実感しています。 テックタッチのバックエンドAPIでは、これまでユニットテストと Postman による API 統合テストを中心に自動テストを実施してきましたが、テストカバレッジの不足や実行・メンテナンスコストの課題がありました。 本記事では、これらの課題を解決する

        runn と Testcontainers で「ちょうどいい」Go API テスト - Techtouch Developers Blog
      • 実は長時間撮影が難しいiPhoneの4K/120fps動画、SSDや冷却機材など何が重要なのかテストしてみた[Sponsored]

          実は長時間撮影が難しいiPhoneの4K/120fps動画、SSDや冷却機材など何が重要なのかテストしてみた[Sponsored]
        • AIの知能評価テストには人間にとって重要な「質問をする能力」の評価項目がないという指摘

          近年は世界各国の企業や研究機関によって精度の高いAIが開発され、そのパフォーマンスを測定するためのベンチマークやテストも多数開発されています。アメリカのノースイースタン大学で歴史学教授を務めるダン・コーエン氏は、実際にAIのパフォーマンスを測定するテストを人力で解いてみた経験を踏まえ、AI向けのテストは「質問をする能力」という人間の重要な側面を見逃していると指摘しました。 Asking Good Questions Is Harder Than Giving Great Answers https://newsletter.dancohen.org/archive/asking-good-questions-is-harder-than-giving-great-answers/ コーエン氏は先日、Humanity's Last ExamというAIを対象にしたテストのうち、自身の専門分野で

            AIの知能評価テストには人間にとって重要な「質問をする能力」の評価項目がないという指摘
          • Playwright MCP を使って、自然言語で E2E テストを実行してみた - Qiita

            はじめに Playwright MCP を使って、自然言語から E2E テストを実行できるかどうかを試してみました。今回は、デスクトップ版の Claude を利用して、プロンプトを入力してテストを実行してみます。テスト対象のアプリケーションは、ブラウザベースで操作可能な TODO を管理するサンプルアプリを対象としました。 Playwright MCP の詳細については、公式のドキュメントを確認してください。 実行環境 Claude for Mac: 0.9.1 Claude Pro プラン(Free プランでも制限内で、実行はできます) @playwright/mcp: 0.0.9 テスト対象のサンプルアプリについて テストを実行するサンプルアプリケーションは TODO タスクを CRUD できるようなシンプルな WEB アプリです。以下のような機能があります。 タスクを新規作成、編集、

            • 「この求人を見た人は他にもこんな求人を見ています」をABテストしてみた - Techouse Developers Blog

              はじめに こんにちは、2023 年からジョブハウスでバックエンドエンジニアをしている ozachun です。 ジョブハウスは、工場やドライバーなどの仕事を探すことができる求人メディアです。 今日は、「この求人を見た人は他にもこんな求人を見ています」というレコメンド施策を例に、ABテスト基盤の実装やABテストを利用した結果ついて紹介します。 概要 Webアプリケーション上で、施策の評価を行う方法としてABテストがあり、日々多くの改善が行われています。本題に入る前に、レコメンドやABテストの概要、Webサイト上で、ABテストを実施する手段を紹介します。 レコメンド とは レコメンドは、ユーザの登録情報やWebサイト上の行動履歴を元に、商品を推薦する方法として用いられています。Amazonや楽天市場などのECサイトで良く見られ、サイト内の回遊やコンバージョン率の改善に成果を出しています。少し古い

                「この求人を見た人は他にもこんな求人を見ています」をABテストしてみた - Techouse Developers Blog
              • 共通テスト「情報I」の問題解けますか? 社会人も“リスキリング”の時代

                  共通テスト「情報I」の問題解けますか? 社会人も“リスキリング”の時代
                • タイ語<例文12件>道に迷った時に場所・道順を訊ねる超便利フレーズ【基本編】★音声・復習テスト付き

                  場所を尋ねる、道順を聞く、そして、場所・道順を教えることに関するタイ語のフレーズは多いので4回に分けてご紹介します。 ・場所・道順を尋ねる基本編・・・基本の場所の訊き方フレーズ ・場所・道順を尋ねる応用編・・・基本の訊き方から一歩発展したフレーズ ・場所・道順を教える基本編・・・場所・道順教えるときの基本フレーズ ・場所・道順を教える応用編・・・基本の場所・道順教え方から表現を広げるフレーズ 今回は「場所・道順を尋ねる基本編」です。 この度は『おきらく独学タイ語』にご訪問いただき誠にありがとうございます。 当サイトはタイ語を独学で勉強する初心者、初級レベル、中級レベルの方まで使えるように構成しております。 フレーズは全て日本語、タイ文字のタイ語、アルファベット式の発音、カナカナ式の発音を記載し、さらに学習のキーワード、単語・熟語ごとに色分けして理解しやすくしています。

                  • ユーザー待望? “Android版Chrome”で拡張機能をサポートするテスト、Googleが実施中か【やじうまWatch】

                      ユーザー待望? “Android版Chrome”で拡張機能をサポートするテスト、Googleが実施中か【やじうまWatch】
                    • GA4×A/Bテストのプロが本音で語る! Webサイトの分析&改善プロセスのリアル | 【レポート】デジタルマーケターズサミット2025 Winter

                      ユーザー行動分析の実践とデータ活用でサイトを進化させる企業のWebマーケティング支援を行うFaber Companyは、コンテンツマーケティングやSEOだけでなく、WebアナリティクスやCRO(Conversion Rate Optimization:コンバージョン率最適化)にも強みを持つ。同社の小川氏は、Webアナリストとして多くの有名企業でのサイト分析に長年携わってきた。同じく岩本氏も、CROツールやA/Bテストツール、ヒートマップツールなどを使ったコンバージョン改善を数多く手掛けてきた専門家だ。 本セッションでは、Webサイト改善の現場に立ち続けてきた二人が、アクセス解析やA/Bテストに関するよくある質問に答え、アクセス解析ツールを使用した分析の考え方や、改善策を導き出すためのプロセスについて解説する。早速、最初の質問から見ていこう。 Question① どこから着手するか初めの質問

                        GA4×A/Bテストのプロが本音で語る! Webサイトの分析&改善プロセスのリアル | 【レポート】デジタルマーケターズサミット2025 Winter
                      • 地学基礎を選択しなかった男が3時間勉強して共通テスト平均点越えを目指す | オモコロブロス!

                        こんにちは。鬼谷です。 先日、聴覚経由の刺激が欲しいな〜と思ってランダムに音楽を再生していたらサカナクションの曲が流れてきました。 『怪獣』というこの曲は、『チ。 ―地球の運動について―』というアニメの主題歌とのことです。 『チ。』は漫画を少し読んでいたので途中まで内容を把握しているのですが、ざっくり言うと、天動説が常識だった時代のヨーロッパで地動説を追究するために命を懸ける人たちの話です。現代の我々にとっては当たり前のことを証明しようとする話なのにめちゃくちゃ面白くて、「がんばれ!」と応援したくなります。 曲を聴きながらそんなことを考えていたら、ふと思い出したのです。 「俺、地学基礎を選ばなかったなあ……」と。 地学基礎とは高校で履修を選択する理科科目のうちの一つ。ほかに物理基礎・化学基礎・生物基礎があり、主に文系の人はこれら4つの中から2つを選択して学習し、センター試験や共通テストで受

                          地学基礎を選択しなかった男が3時間勉強して共通テスト平均点越えを目指す | オモコロブロス!
                        • リーナス・トーバルズがLinux 6.15-rc1のテストコードを汚物呼ばわりして激怒

                          by TED Conference ​Linuxカーネルの優しい終身の独裁者であるリーナス・トーバルズ氏が、Linux 6.15-rc1カーネルに含まれるテストコードがビルドプロセスを遅延させディレクトリ内に不要な一時ファイルを生成してしまっていたことに対し、怒りを爆発させたと報じられています。 Torvalds Frustrated Over "Disgusting" Testing "Turd" DRM Code Landing In Linux 6.15 - Phoronix https://www.phoronix.com/news/Linux-6.15-hdrtest-Turd Linus Torvalds rages against ‘random turd files’ in Linux 6.15-rc1 directories | Tom's Hardware https:

                            リーナス・トーバルズがLinux 6.15-rc1のテストコードを汚物呼ばわりして激怒
                          • テストの点数でも、足の速さでもない…成績表で"5"を取るために教師が小学生に求める「理不尽な評価基準」(プレジデントオンライン) - Yahoo!ニュース

                              テストの点数でも、足の速さでもない…成績表で"5"を取るために教師が小学生に求める「理不尽な評価基準」(プレジデントオンライン) - Yahoo!ニュース
                            • 売却査定サービスにおけるE2Eテスト高速化の取り組みについて - LIFULL Creators Blog

                              プロダクトエンジニアリング部の千葉です。 LIFULL HOME'S不動産査定とホームズマンション売却の開発に携わっています。 この記事では、売却査定サービスにおけるE2Eテスト高速化の取り組みについて紹介していきます。 売却査定サービスにおけるE2Eテストについて 環境 テスト観点 高速化の取り組み 背景 取り組み1 - 項目の精査と方法の最適化 取り組み2 - 処理の共通化 取り組み3 - ジョブの最適化 取り組み4 - 実行の並列化 取り組み5 - タイムアウト設定 結果 全体 Botでページを開いた際のHTTPステータスコード200の検証 モバイル端末でページを開いた際のHTTPステータスコード200の検証 PC端末での主要導線の確認 モバイル端末での主要導線の確認 まとめ 売却査定サービスにおけるE2Eテストについて 環境 売却査定サービスではE2Eテストを自動化するためのフレー

                                売却査定サービスにおけるE2Eテスト高速化の取り組みについて - LIFULL Creators Blog
                              • OpenAI「GPT-4.5」、チューリングテストに合格 7割超が“人間と誤認” 米カリフォルニア大

                                米カリフォルニア大学の研究チームは3月31日(現地時間)、米OpenAIのAIモデル「GPT-4.5」が、人間とAIを見分ける試験「チューリングテスト」に合格したとする査読前論文を発表した。試験では70%超がGPT-4.5を人間と誤認したという。 チューリングテストは、1950年にイギリスの数学者アラン・チューリングが提案した思考実験。テストでは、人間とコンピュータを回答者として用意。質問者は相手が人間かどうか分からない状況で、それぞれとテキストベースで会話し、どちらが人間か推測する。人間とコンピュータを見分けられない場合、コンピュータは“人間らしい”知性を示せたとしてテストに合格する。 今回の検証では、GPT-4.5に加え、同社のAIモデル「GPT-4o」、米Metaの「LLaMa-3.1-405B」(LLaMa)を用意。GPT-4.5とLLaMaについては、事前に“人間らしく”ふるまう

                                  OpenAI「GPT-4.5」、チューリングテストに合格 7割超が“人間と誤認” 米カリフォルニア大
                                • 【メダリスト】バッジテスト 6級女子FS 結束いのり「The Flower Fairy」(映画『カノンとベルの国』より)滑走シーン|score13「朝が来る」より

                                  score13「朝が来る」より、いのりの滑走シーンをご紹介! *ON AIR* 毎週土曜深夜1時30分~ テレビ朝日系全国24局ネット“NUMAnimation”枠で放送中! CSテレ朝チャンネル1 毎週日曜夜9時00分~ BS朝日 毎週月曜夜11時24分~ *STREAMING* ディズニープラス「スター」にて単独最速配信中! ディズニープラス「スター」 毎週土曜深夜2時00分~ その他サイトも毎週木曜深夜2時00分~以降、順次配信中 *MUSIC* オープニング主題歌:米津玄師「BOW AND ARROW」 エンディング主題歌:ねぐせ。「アタシのドレス」 *INTRODUCTION* スケーターとして挫折した青年・明浦路司が出会ったのは、 フィギュアスケートの世界に憧れを抱く少女・結束いのり。 リンクへの執念を秘めたいのりに突き動かされ、司は自らコーチを引き受ける。 才能を開

                                    【メダリスト】バッジテスト 6級女子FS 結束いのり「The Flower Fairy」(映画『カノンとベルの国』より)滑走シーン|score13「朝が来る」より
                                  1