satojkovicのブックマーク - はてなブックマーク

脱・Kaggle初心者～一歩先に行くためのノウハウ

連載目次導入この連載では、近年話題のコンペティションプラットフォーム「Kaggle」について、リクルート所属のKaggle Master 4人がKaggleの仕組みや取り組み方、初心者から一歩先に行くためのノウハウについて解説を行います。第1回では、これからKaggleを始めようと思っている方向けに、Kaggleの仕組みや実際にコンペティションに出場した後の取り組み方、初心者におすすめのコンテンツについて解説を行いました。第2回では、ランクを上げていくために筆者が「実際に何をしていたか」について、実際の事例を交えながら解説していきます。

satojkovic 2024/05/23

リンク

その成長は何のため？――「成長」に息苦しさやうっとうしさを感じたら

その成長は何のため？――「成長」に息苦しさやうっとうしさを感じたら：仕事が「つまんない」ままでいいの？（41）（1/4 ページ）成長を追い求めることに、息切れしそうになることはありませんか。「成長！」「成長！」とあおり立てられることに、うっとうしさを感じることはありませんか。ビジネスシーンでは、よく「成長が大事」といわれます。例えば「理想的なエンジニア像」を挙げるとき、「別に成長なんてしなくてもいい」「ま、どうでもいいや。そんなに頑張らなくてもメシなら食えるし」というタイプと、「もっと成長しなきゃ」「ずっと成長し続けたい」というタイプでは、理想像は後者になりそうです。今は、社会の変化や技術の進歩がとにかく早い。「成長し続けないと周りから評価されなくなる」「AIが進化すると今の仕事が奪われてしまう」とメディアはあおります。エンジニアとして、ビジネスパーソンとしてこれからもメシを食っ

satojkovic 2023/09/07

リンク

Rubyの父まつもとゆきひろが就活生に贈る「失敗から学んだ7つの“格言”」

Rubyの開発者であるMatzことまつもとゆきひろさんは、日本一有名なプログラマーの一人で、世界でもその名が知られている。中学3年生からプログラミングを始め、大学卒業後の1990年にプログラマーとして就職。はた目には順風満帆の成功者に見えるかもしれないが、33年間という長いキャリアの中では「痛い目に遭っているし、他の人が痛い目に遭うのも見てきました」という。そのまつもとさんが、学生エンジニアのキャリアや就職活動を支援する「サポーターズ」が開催した、エンジニアを目指す学生のためのオンラインカンファレンス「技育祭2023春」で、失敗から学んだ7つの格言を、就活生に贈った。格言その1　言語もコードも「名前重要」格言の中で、まつもとさんが最も重視しているのは、「名前重要」だ。「名前重要……を格言と言ってるのは、私だけだと思いますが（笑）」人は、名前を付けて初めて概念を扱えるようになるとま

satojkovic 2023/04/27

リンク

思考の連鎖（Chain of Thought）でChatGPTからよりよい応答を引き出そう

思考の連鎖とは OpenAI Cookbookの「Techniques to improve reliability」ページでは言語モデルからの信頼性を高めるためのノウハウが紹介されています。そこでは「明確な指示を与える」「複雑なタスクは幾つかのタスクに分割する」「モデルがタスクから逸脱することがないようにプロンプトを構造化する」といったことが書かれています。そして、その中には「答えを出す前に説明するようにモデルに指示する」（Prompt the model to explain before answering）という項目があります。この中で出てくる概念に「思考の連鎖」（Chain of Thought、CoT）というものがあります。思考の連鎖とは「複雑なタスクを最終的に解決する過程における、中間的な推測ステップの連なり」といえます。こういう表現だと少し分かりにくいのですが、「リンゴが

satojkovic 2023/03/27

リンク

「ChatGPT」も提供予定　最先端のAIを利用できる「Azure OpenAI Service」を正式リリース

「ChatGPT」も提供予定　最先端のAIを利用できる「Azure OpenAI Service」を正式リリース：「GPT-3.5」「Codex」「DALL・E 2」にも対応 Microsoftは、OpenAIが開発した高度なAIモデルをさまざまなユースケースに適用できる「Azure OpenAI Service」の一般提供を開始した。 Microsoftは2023年1月16日（米国時間）、「Azure OpenAI Service」の一般提供を開始したと発表した。同サービスは2021年11月に発表され、これまでは限定プレビュー段階だった。企業はAzure OpenAI Serviceにより、AI関連技術を開発する非営利企業OpenAIが開発した「GPT-3.5」「Codex」「DALL・E 2」といった高度なAIモデルへのアクセスを申請し、これらをさまざまなアプリケーションの作成に利用

satojkovic 2023/01/30

リンク

［解決！Python］日付や時刻をYYMMDDhhmmssなどの形式に書式化するには

［解決！Python］日付や時刻をYYMMDDhhmmssなどの形式に書式化するには：解決！Python datetimeモジュールとtimeモジュールには、それらが提供する日付／時刻のデータを書式化するために使えるstrftime関数／メソッドがある。それらの使い方を紹介する。 # datetimeモジュールを使用 import datetime t_delta = datetime.timedelta(hours=9) JST = datetime.timezone(t_delta, 'JST') now = datetime.datetime.now(JST) print(repr(now)) # 出力例 #datetime.datetime(2021, 11, 4, 17, 37, 28, 114417, tzinfo=datetime.timezone #(datetime.ti

satojkovic 2022/12/14

リンク

無料でPython／機械学習できるAmazon SageMaker Studio Labとは？　Colabと比較

連載目次 Python／Rコードの実行や機械学習／データサイエンスの実装を無料でオンライン実行できる環境といえば、Google Colaboratory（略してColab）が特に有名である。2021年12月1日、そのColabに強力なライバルが現れた。「Amazon SageMaker Studio Lab」（アマゾン・セージメーカー・スタジオ・ラボ）だ*1。 *1　日本語では「ラボ」だが、英語では「ラブ（Lab）」と発音するのが普通。「スタジオ」は英語では「ステューディオ（Studio）」。「セージ（Sage）」とは、ハーブや花の名前ではなく「学び経験を積んだ賢者（Wise old man、例えばハリー・ポッターのダンブルドア校長は魔法の賢者）」のことで、賢者は「機械学習モデル」を暗喩すると思われるが、一説にはマーケティング目的で独自用語にするためにランダムな単語生成で命名されたという噂

satojkovic 2022/03/19

リンク

「数理最適化」とは――4つの応用事例、実問題適用への手順、機械学習との違い、使い分け方

「数理最適化」とは――4つの応用事例、実問題適用への手順、機械学習との違い、使い分け方：リクルート事例で分かる数理最適化入門（1）リクルートにおける数理最適化の応用事例の紹介を通じて、数理最適化とは何か、どのようにビジネスに応用できるのかを紹介する連載。初回は、数理最適化の概要、リクルートにおける4つの応用事例、実問題適用への手順、機械学習との違い、使い分け方などについて。近年多くの企業で、ビジネスでのデータ活用が当たり前になっています。中でも機械学習を用いた成功事例については、耳にしている読者の方も多いと思います。一方で、同じくデータ活用の技術である「数理最適化」は、さまざまな領域で成果を上げているにもかかわらず、その実態について知っている人はあまり多くないようです。本連載ではリクルートにおける数理最適化の応用事例の紹介を通じて、数理最適化とは何か、どのようにビジネスに応用できるの

satojkovic 2022/03/12

リンク

Microsoftが開発、Web UIで学習状況を可視化するAutoML OSS「Neural Network Intelligence」

Microsoftが開発、Web UIで学習状況を可視化するAutoML OSS「Neural Network Intelligence」：AutoML OSS入門（9）（1/3 ページ） AutoML OSSを紹介する本連載第9回は「Neural Network Intelligence」を解説します。Neural Network Intelligenceは、ハイパーパラメーターチューニングやニューラルアーキテクチャ探索、モデル圧縮、自動特徴量エンジニアリングなどの機能を持つツールキットです。Web UIで学習の進行状況や結果を確認できます。

satojkovic 2022/01/31

リンク

ColabCodeを使って、Google Colabの上でVS Codeを使ってみよう

ColabCodeを使って、Google Colabの上でVS Codeを使ってみよう：Visual Studio Codeで快適Pythonライフ（1/2 ページ） Google Colab上でVS Codeを動かす幾つかの方法のうち、ColabCodeというモジュールを使ってお手軽にこれを実現する手順を紹介します。

satojkovic 2022/01/25

リンク

Colab Pro／Pro+／Pay As You Goとは？　無料版との違い、比較表

2023年9月27日の最新情報に合わせて改訂しました（最初の公開は2020年3月17日）。主にGPUが選択可能になった点とColab Enterpriseの情報を追記し、全ての利用パターンで再検証して全面的に最新の内容にアップデートしました。機械学習／データサイエンス分野で特に人気の（Pythonなどの）実行環境であるGoogle Colaboratory（以下、Colab）は無償で使えるものの、無制限ではない。実行時間やメモリ容量などに制限がある。こういった制限を低減する有償プロ版「Colab Pro」が2020年3月に発表され、米国とカナダのみで申し込みできる状況だったが、それから1年後の2021年3月19日以降、日本でも申し込み可能になった（図1）。さらに、より強力な有償プロプラス版「Colab Pro+」が2021年8月に発表され、同日から日本でも申し込み可能になり、その約1年後

satojkovic 2022/01/22

リンク

Microsoft Research、バグを発見、修正するためのディープラーニングモデル「BugLab」を開発

Microsoft Research、バグを発見、修正するためのディープラーニングモデル「BugLab」を開発：バグを自動的に埋め込み、それを発見することで学習 Microsoft Researchは、コード内のバグを発見、修正するためのディープラーニングモデル「BugLab」を開発した。BugLabではラベル付きデータを使わずに、バグを自動的に埋め込み、それを発見する“かくれんぼ”ゲームを通じてバグの検出と修正をトレーニングする。

satojkovic 2021/12/19

リンク

クラウド「AI」API入門：AWS／Cognitive Services／Google Cloud／IBM Watsonの比較

クラウド「AI」API入門：AWS／Cognitive Services／Google Cloud／IBM Watsonの比較：AI・機械学習のクラウドサービス「AWS AIサービス」「Azure Cognitive Services」「Google Cloud AIビルディングブロック」「IBM Watson API」という主要AIサービスの一覧表を示し、各サービスを1行程度で説明する。自分でAI／機械学習モデルを作る前に、既存のAIサービスがないか（カスタマイズできないか）を、これで確認しよう。

satojkovic 2021/12/17

リンク

自分の強みを見つける問い「プログラムの何が好き？」

自分の強みを見つける問い「プログラムの何が好き？」：仕事を楽しめ！エンジニアの不死身力（20）（1/2 ページ） 2012年が始まってまもなく1カ月が過ぎようとしています。「一年の計は元旦にあり」という言葉どおり、今年１年もエンジニアとして活躍するために、新しいチャレンジを計画されていることと思います。新しいチャレンジを始める際には、「自分の強み」を知っておくことが大切です。なぜなら、苦手なことを克服するよりも、自分の強みや特性をきちんと自覚して生かせば、学習の成果が大きくなることが期待できるからです。ところで、もし「あなたの強みは何ですか？」と聞かれたら、答えがぱっと思いつきますか？そこで今回は、今年も充実した1年を送るために、自分の強みとなる“軸”の見つけ方を紹介します。強みとなる「自分の軸」とは何かそもそも「強み」とは何か、ということを考えてみましょう。強みは、一般的に

satojkovic 2021/12/17

リンク

検索エンジンの常識をApache Solrで身につける

表のような転置インデックス完成後は、クエリに対する結果を返す処理は簡単です。例えば、ユーザーが「Vim」というクエリを発行すると、検索エンジンは「Vim」を含む文書IDリストを返します。表では文書IDの「2」を返します。検索エンジンを取り巻く7つの技術検索エンジンのコア技術は前節で紹介したインデックスです。しかし実際に、検索インデックスだけで構成する検索エンジンから、検索サービスを構築するには多大なコストが掛かります。以下の節で検索エンジンを利用したシステム、検索サービスを構築する際に便利なコンポーネントを紹介します。これらの機能のいくつかは、多くの検索エンジンが組み込んでいます。一方で、簡素な検索エンジンは、以下で紹介するコンポーネントをサポートしていないため、ユーザーが独自に開発するか、その機能を持つコンポーネントを組み込む必要があるものもあります。【1】トークナイザ検索エン

satojkovic 2021/12/13

リンク

Web更新情報が手軽にとれるRSSの仕組み ― ＠IT

「RSSをとる」「RSSでチェックする」など、IT企業の会話に紛れ込んできているRSSという概念。RSSの効果、技術の仕組みを分かりやすく5分で説明します RSSがない時代は大変！いきなり「RSS」といわれても、知らない人にはどんな技術なのかさっぱり分かりません。しかし、何の略語かを知れば簡単に想像できます。「RSS」は「Rich Site Summary」（*1）の略語で、直訳すると「充実したWebサイトの要約」といった意味になります。RSSとは、その名前のとおりニュースサイトやブログなど、Webサイトの見出しや要約をまとめてくれる技術なのです。技術的な解説をする前に、RSSが登場したことによって、Webの更新がどれだけ便利になったか振り返ってみましょう。数年前、現在のようなRSSがなかった時代は、Webサイトチェックはなかなか大変でした。当時のWeb巡回方法は……、 Webブラウザ

satojkovic 2021/06/02

リンク

IT技術者としてのSkill＆Careerを、英語で棚卸しする

IT 技術者としてのSkill＆Careerを、英語で棚卸しする：IT エンジニアのための英文履歴書（1）（2/2 ページ） Work Experience（Professional Experience）職歴、これは必須項目です。職歴と後述するEducation（学歴）、どちらを先に書くかは特に決まりはありませんが、職歴のある人は職歴を先に書くとよいでしょう。新卒の場合は職歴がないので「Education」（学歴）を先に書きます。新卒でインターン経験のある人は、学歴のあとにインターン歴を書くとアピールになります。「職歴を先に」といっても、これは厳密な決まりではありません。要は、自分のアピールしたい順に持ってくればいいのです。例えば、「職歴はあるけど、今の仕事は大学の専攻とは関係なくて、今度は大学で得た知識を生かした仕事に就きたい」といった場合は学歴を最初に持ってくる、といった具合です

satojkovic 2021/05/02

リンク

第11回　機械学習の評価関数（二値分類／多クラス分類用）を理解しよう

評価関数については今回で最後となるので、ぜひ頑張って今回の分まで読み終えて、機械学習／ディープラーニングにおける代表的な評価関数を一通り押さえてほしい。本稿の最後では、TensorFlow／Keras（tf.keras）のcompile()＆fit()メソッドを使った場合に「評価」を実行するための基本的な方法も紹介する。二値分類用［応用編］（Binary classification）今回のLogLossとAUCは前々回と前回ほど評価関数の数式がシンプルではない。少し回り道になってしまうが、数式の意味をより深く理解するために、順序立ててグラフなどを示しながら説明していくのでお付き合いいただけるとうれしい。 LogLoss（Binary Logarithmic Loss）前回は二値分類用の正解率を解説した。正解率の場合、モデルからの出力結果は（基本的に）陽性（Positive、正例、例

satojkovic 2021/04/17

リンク

第4回　知ってる!?　TensorFlow 2.0最新の書き方入門（初中級者向け）

第4回　知ってる!?　TensorFlow 2.0最新の書き方入門（初中級者向け）：TensorFlow 2＋Keras（tf.keras）入門（1/2 ページ） TensorFlow 2.x（2.0以降）では、モデルの書き方が整理されたものの、それでも3種類のAPIで、6通りの書き方ができる。今回は初心者～初中級者にお勧めの、SequentialモデルとFunctional APIの書き方、全3通りについて説明する。連載目次前回までの全3回では、ニューラルネットワークの仕組みや挙動を図解で示しながら、TensorFlow（tf.keras）による基本的な実装方法を説明した。しかし実際には、TensorFlowの書き方はこれだけではない。 TensorFlowにおける、3種類／6通りのモデルの書き方 3種類のAPI 大きく分けて、下記の3種類があることを第2回で説明済みである。 Seq

satojkovic 2021/03/22

リンク

第5回　お勧めの、TensorFlow 2.0最新の書き方入門（エキスパート向け）

どの書き方を採用すべきか公式チュートリアルでは、「初心者向け」と「エキスパート向け」という2つのクイックスタートが用意されており、これは前掲の図における（1）と（4）に該当する。本連載ではそれに合わせて、初心者は（1）、初中級者以上は（4）をお勧めとしている。（4）や（5）のSubclassing（サブクラス化）モデルは、「Pythonを使ってコーディングしている」感がより強まる。それに伴い、どうしてもコード量が飛躍的に増えがちである。しかしこれは、（1）や（2）のSequentialモデルだとメソッド内に隠蔽（いんぺい）されていた学習処理を細かく制御したり、柔軟なカスタマイズができたりするというメリットの裏返しでもある。どの書き方にもメリット／デメリットはあるので、まずは使える書き方や、気に入った書き方から始めてみるのもよいだろう。特にKerasに慣れている人の中には、「（4）／（

satojkovic 2021/02/27

リンク

はてなブックマーク

タグ

ブックマーク / atmarkit.itmedia.co.jp (164)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス