はじめに 語彙力なくてすみません、 browser-use は、「AI エージェントがウェブブラウザを操作できるようにする」ためのライブラリです。 プロンプトで与えられた指示どおりに動き、ほかの技術と比較しても精度が抜群に高いです。 早速試してみます。 実践 複数のECサイトから特定の商品価格を取得することを目標とする。 Python は 3.11 以上が必要です。
生成AIでコードを書いている非エンジニア向けの、これだけ最低限勉強しておけば死なないリストがあればめちゃ買います。 — ハヤカワ五味 (@hayakawagomi) December 30, 2024 Twitter(X)をながめていたところ、メルカリで生成AI推進担当を務めているハヤカワ五味さんが上記のツイート(投稿)をされていたので、その答えめいたものを私なりにまとめておきます。「これだけ勉強しておけ」という分野とその理由、および学習のための教材を列挙したのが本記事です。 なお、本記事の内容は完全に私見ですので、勢いよくマサカリを投げるのはご勘弁ください。私に投げる代わりに「これ要らん/コレが要るぞ」みたいな話を、各々のnoteやQiitaでまとめてくださると、インターネットに知が放流されてみんなハッピーになります。 ※この記事を書き上げたあとに、以下のツイートを見て「それはそう」とな
年末年始の慌ただしい時期に、数ある選択肢の中からこちらの記事をお読みいただき、誠にありがとうございます。 人生を定期的に振り返ることには、本書で取り上げられているADR(Architecture Decision Records)に通じる素晴らしさがあります。過去の決定とその背景を記録し、将来の自分や他者が参照できる形で残すことは、個人の成長にとって貴重な資産となります。そんな観点から今年を振り返ってみると、2024年は私自身にとって大きな試練と変化の年でした。 印象的だったのは、ある時期に突然、技術に対する興味や情熱が完全に失われてしまったことです。それは技術分野に限らず、仕事全般や私生活にも波及し、何をするにも意欲が湧かない、深い無気力状態に陥ってしまいました。 しかし、この困難な時期を経て、いくつかの意味のある変化が生まれました。私は以前から技術書の書評を書いていましたが、これは主に
認可コードグラント RFC 6749で定義されるOAuthの認可コードグラントでは、認可サーバの実装として、認可エンドポイントとトークンエンドポイントの2つが必要です。リクエストは大きく分けて認可リクエスト (Authorization Request) およびトークンリクエスト (Access Token Request) の2つに分けられます。 全体のシーケンス図は以下の通りです。 PlantUMLのソースコード @startuml @startuml title 認可コードグラントにおけるシーケンス図 autonumber actor RO as "リソースオーナー" participant UA as "User-Agent" participant C as "クライアント" participant AS as "認可サーバ" participant RS as "リソースサーバ
初めに モチベーション 私はこれまでドメイン駆動設計で設計されたシステムの開発案件に参画した経験はありますが、1からドメイン駆動設計で設計での設計を行った経験がありませんでした。そのため個人でシステムを開発している際に設計に悩むことがあり、自身で1からドメイン駆動設計ベースの設計ができるようになることを目指して学習を進め、その過程で得た知見をまとめています。 特に以下のような点に焦点を当てています。 ドメイン駆動設計の理論をTypeScriptのコードベースで理解する 既存のドメイン駆動設計システムを理解するだけでなく、新規設計ができるようになるための知識の整理 ドメイン駆動設計(DDD)とは ドメインとは「システムが対象とする業務領域」のことです。 例えば不動産管理システムを例にすると、物件、オーナー、入居者などがドメインとなります。 ドメイン駆動設計の本質は、このような現場の業務知識や
はじめに 2024年のAI界隈では「RAG」が一巡し、その可能性と限界が明確になってきました。最も顕著な点は「RAGは魔法の杖ではない」という認識の広がりではないでしょうか? RAGは確かに、既存の文書やデータを活用したAIの応答精度向上に貢献してきました。しかし、単純な質問応答を超えた複雑なタスクの実行や、動的な状況への適応には限界があることも明らかになっています。この限界を超えるための次のステップとして注目を集めているのが「AIエージェント」です。 OpenAIのCEOであるサム・アルトマンが「次のブレークスルーはエージェントだ」と発言していたり Anthropic社員がこのようなスピーチをしたりしています。 AIエージェントとは AIエージェントは、特定のタスクや目的のために設計された自律的なAIシステムです。たとえば、会議の参加者の予定を自動で調整して最適な時間を設定するAIアシス
1. 生成AIチートシート もはやエンジニアの必須ツールとなってきた生成AI。ペアプロやエラー対応などプログラミングに関わるところから、ビジネス判断におけるブレスト相手として、日常の些細なタスクにまで対応する強い味方です。またそれら生成AIを応用したAIエージェントやワークフローを用いたプロダクトなどの開発も日進月歩で進んでいます。 本パートでは、日々進化する生成AIを最大限に活用できるよう、多種多様な生成AIを一覧化して網羅したものから、それらの利用方法・プロンプトエンジニアリングにまで踏み込んだチートシートを集めました。 プロンプトエンジニアリング ソフトバンク - ChatGPTから高度な回答を引き出すプロンプト文例集 業務に使えるプロンプトが幅広く掲載されており、実用的です! マイナビ - プロンプトエンジニアリング・チートシート マイナビから公開されているチートシート。役割の設定
最近、エンジニアは事業を理解すべきか?という話題をよく目にします。様々な経験や背景がある中での議論なため、多くの意見があり難しい話題だと思います。 エンジニアの主戦場は技術私は技術も事業も好きです。でもエンジニアです。 能力を表すのも求められるのも技術です。 まずは頭の中にあるアイデアを実現できる技術力は大前提で、その上で「エンジニアは事業を理解すべきか?」を考えるべきだと思っています。 事業への理解があることは、技術力がないことの免罪符ではありません。 むしろ事業への理解は技術力の一部です。 そもそも良いエンジニアに事業の理解は必要技術の意思決定において、前提や課題や目的の理解は大切です。仕事においては、事業や市場や顧客のドメインの理解がないと意思決定はできません。 エンジニアが事業をできる必要はありませんが、知識として事業を理解する必要はあります。 ちょっと不思議ですが、良いエンジニア
この記事はジンジニアアドベントカレンダー2024 25日目の記事です。 人事選考で安易に使われがちで、避けたほうが良い判断軸の項目に「コミュニケーション能力」や「地頭」があることが良く知られています(要出展)。ここではなぜコミュニケーション能力を問わないほうが良いかについて論じます。 コミュニケーション能力4象限 コミュニケーション能力を同質か多様か、能動か受動かという2つの軸で以下の4象限に分けてみます。 コミュニケーションスキル4象限 内訳をざっと細分化すると以下のようになるでしょうか。 同質な人に共感する シンパシー 共感力 親和性 同質な人に共感してもらう 共鳴力 信頼構築力 受容力 多様な人を理解する エンパシー 寛容力 異文化理解力 多様な人に理解してもらう 説明能力 発信力 橋渡し能力 一言でコミュニケーション能力といってもこのように様々な要素が含まれており、個々人の認識のズ
木浦 幹雄 / KIURA Mikio @ANKR DESIGN @kur デザインスタジオ @ankrdesign 代表。奈良先端大、Canon、CIID出身。未踏スパクリ認定。デザインリサーチ、UXリサーチ、プロトタイピングが大好きです。「デザインリサーチの教科書」著者「要点で学ぶデザインリサーチの手法125」監修。 お仕事の相談はDMでお気軽にどうぞ。 amzn.to/3mmUvLG ankr.design 木浦 幹雄 / KIURA Mikio @ANKR DESIGN @kur ビズリーチで「転職する気が無くても構いません!是非一度お話させてください!」って熱いメッセージが来たから「そこまで言うなら・・・」と思って気まぐれでオンライン面談してみたところ「ご自身で会社やられてるんですよね?転職の可能性あるんですか?なんで来たんですか?」って詰められてる。 2024-12-26 13
創業140年。江戸の粋が息づく老舗蕎麦『神田まつや』の主人が伝授 「乾麵のおいしいお蕎麦が増えています。材料も製麵技術もどんどんよくなっているのでしょう。昔と比べると格段の差です」 そう語るのは、東京・神田の老舗蕎麦店『神田まつや本店』6代目主人の小高孝之さんだ。 蕎麦はもちろん手打ちで、打ちたての香り高い蕎麦を提供している。贔屓筋でいつも満席の繁盛店で、厨房に注文を通す声がひっきりなしに行き交う。 そんな蕎麦の老舗に、「乾麵」でいかにすればおいしい蕎麦がつくれるのかを指南してもらった。蕎麦つゆも手軽な市販品を使った。手打ち麵と乾麵とでは茹で方から違ってくるが、小高さんはいつものように手際よく進めていく。 最後は必ず冷水で締める 乾麵をおいしくいただくには、一にも二にも茹で方にある。小高さんは、そのポイントをこう語る。 「まず浸漬。茹でる前に麵を水に浸しておくと、より香りが引き立ちます。浸
Devinとは、ソフトウェア開発におけるタスクを自動化・効率化してくれるAIプラットフォームです。2024年12月に正式リリースされました。 私が所属しているUbieにも先日導入されました。様々な作業ができますが、あるリポジトリで不足しているテストを書いてもらったところ、その便利さに感動して椅子から転げ落ちました。 本記事では、Devinの実際の使い方と、利用する上でのポイントを紹介します。 1. テストの作成をSlackで依頼する Slackで「これこれのテストを書いてほしい」と依頼すると、Devinがテストコードを生成し、GitHubに新しいPRを作ってくれます。 依頼例は次のとおりです。 こんにちは、 @Devin 以下の仕事をして - ubie-inc/リポジトリ名 repo にアクセスして - (テスト対象のパス) のテストを書いて - 次のテストの書き方を参考にして - foo
大規模言語モデル(LLM)を用いたAIは、驚くほど自然な文章やリアルな画像を生成できる能力を備えている一方で、危険なことに回答したり不適切な画像を生成したりできないように、セキュリティロックがかかっていることがほとんどです。しかし、意図的にLLMをだまそうと試みてロックを回避するジェイルブレイク(脱獄)の方法もしばしば話題になります。GoogleのAIチームでコンサルタントを務めた経験もある技術者のマット・ウェッブ氏は、特別なテクニックを使わなくても「ちょっとずつAIの思考をずらす」ことによるジェイルブレイクの例を解説しています。 Narrative jailbreaking for fun and profit (Interconnected) https://interconnected.org/home/2024/12/23/jailbreaking LLMには、爆弾の作り方といった
はじめに VSCodeは世界で多くの人が使っているコードエディタです。 開発の際に使用している人も多いのではないでしょうか。 今回はそんなVSCodeの拡張機能を一挙に紹介していきます。 拡張機能 VSCodeは世界中で支持されているコードエディタですが、最大の魅力が「拡張機能」です。 機能を追加して、より自分が使いやすいコードエディタにすることができます。 拡張機能のインストール 拡張機能のインストール方法をご紹介します。 アクティビティバーの拡張機能マークをクリックする(四角が4つあるマークです) インストールしたい拡張機能を検索する 拡張機能を選ぶ インストールをクリックする この4ステップで簡単に拡張機能をインストールできます。 オススメ拡張機能 ここからは、オススメの拡張機能をカテゴリごとに紹介します。 これは絶対入れるべき!基本機能 Japanese Language Pack
この記事は「RUNTEQ Advent Calendar 2024」23日目の記事になります。 はじめに プログラミングスクールRUNTEQでエンジニア兼講師をしているいっぺい(@ippei_111)と申します。 いきなりですが個人開発を行う時にアプリケーションのUIを考えるのに悩んだ経験はありませんか? エンジニアあるあるかもしれませんが、個人開発をする際に機能の実装はできるが、デザインの部分でどうしたら良いのか迷ってしまい、手が止まってしまうことがあると思います。 本来機能開発に時間をかけたいが、デザインに凝りすぎてしまい、余計な工数と時間がかかってしまうことも多々あると思います。 また、デザインに関する知識と経験がないエンジニアがデザインを考えると、「なんかダサいデザイン」「使いづらいUI」になってしまうのもエンジニアあるあるかと思います。 本記事では、デザインに不慣れなエンジニアで
「他人に期待するとギャップがあった時に勝手に裏切られた気持ちになるので期待しない」というスタンスをたまに聞く。実は自分もそのスタンスを取っていた時期がある。 今は少し考えが変わって、"相手に明確に期待を伝えること" と "相手がそのとおりに動くと期待すること" は分けて考えるほうがいいと思っている。このあたりの話を雑に書いてみることにする。 「相手に期待しない」というスタンスは、楽なようであんまり楽じゃない。たとえば夫婦生活でもそう。「期待しない」ってのは合理的で聞こえはいいが、よほど心の弾力を失っていないかぎりは結局だんだんと不満がたまってイライラしてくる。「俺、正直感情がなくて全てが滑稽に思える」を地でいけるくらいの人じゃないと厳しいと思う。 「相手にこうしてほしい」という期待を明確に伝えられるスキルは身につけたほうがいい。内容、タイミング、伝え方などスキルとして磨けるところは色々ある
WebAssemblyに特化したプログラミング言語「MoonBit」のコンパイラが、GitHubで公開されたことを、開発元である中国広東省深セン市にある研究組織「International Digital Economy Academy (IDEA)」が発表しました。 Today is the day! The MoonBit compiler is now publicly available on GitHub! After 2 years of private development, we’re ready to build an open, collaborative community around MoonBit.https://t.co/M8y3e9rkn2 pic.twitter.com/BbJRLf7Vnm — MoonBit (@moonbitlang) Decemb
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く