タグ

開発と機械学習に関するmohnoのブックマーク (13)

  • ChatGPTのヤバさは、論理処理が必要と思ったことが確率処理でできるとわかったこと - きしだのHatena

    ChatGPTのヤバいところは、論理処理が必要だと思っていたことが、じつは多数のデータを学習させた確率処理で解決可能だと示したことだと思います。 たとえば、このように正規表現にマッチする文字列を生成するには、特別に専用の論理処理が必要だと思っていました。 前のブログのときには特殊処理が必要だと考えてましたね。 ウソはウソと見抜ける人じゃないとChatGPTを使うのは難しい - きしだのHatena けど、123_45678world.mdはマッチするのにマッチしないと言っているので、そのような誤りが入ることを考えると、どうも確率処理だけでやっているようです。 考えてみると、3層以上のニューラルネットであれば論理素子を再現できるので、ディープラーニングで論理処理を模倣することは可能なんですよね。 バックプロパゲーションでニューラルネットの学習 - きしだのHatena そもそも論理は、多数の

    ChatGPTのヤバさは、論理処理が必要と思ったことが確率処理でできるとわかったこと - きしだのHatena
    mohno
    mohno 2023/01/11
    テストは書けるんかな。「あとは論理的な確認を行うようにすれば完璧」←プログラムが正しいかどうか人的に確認しなきゃいけないなら、自分で書く方が速い予感(ChatGPTは電力消費が大きいらしいし)
  • 予算30万円台の深層学習用PCの買い方|shi3z

    深層学習をまじめにやるなら、どう考えても専用のPCが必要になる。 僕は現在、Memeplexというサービスを運営していて、これはさくらインターネットさんから大量のGPUを借りている。借りたGPUは、さくらインターネットの石狩データセンターで動いている。 さらに、ABCIは企画の段階から立ち会って、実際に仕事ではよく使っている。ABCIは5000以上のGPUを擁するGPUクラウド基盤で、その実態はスーパーコンピュータである。 ABCIを使えば、ほとんどの難しいタスクを恐ろしく安い料金で行うことができる。GoogleAmazon AWSのようなサービスを展開することができない邦においては、国家が設立し、民間利用可能なABCIは国民にとっての天叢雲剣あめのむらくものつるぎである。 それでもなお、手元には深層学習用のPCが必要だ。しかも一台では足りない。 ABCIがいかに安くても、PCほどの利

    予算30万円台の深層学習用PCの買い方|shi3z
    mohno
    mohno 2022/11/14
    機械学習しないから高性能GPUは使ってないけど、まともな開発者なら、その人件費を思えば、パソコンに30~40万くらいかけていいよね。資産会計が面倒になるからと安いパソコン使わされてるのはかわいそうというか。
  • メルカリを退職してロンドンのMetaに転職します 〜 外資Big Tech転職活動体験記|松岡玲音|note

    この度、3年半に渡って勤めたメルカリを2022年5月に退職し、この夏からロンドンのMetaにSenior Machine Learning Engineerとして転職することが決まりました!わいわい✌('ω')。その過程で、東京およびロンドンのBig Tech合計5社を数ヶ月かけて対策をし面接に臨んだので、そこで得たノウハウをここで共有できたらと思います。面接を受ける際にNDA(Non Disclosure Agreement)にサインするので具体的な面接の詳細には触れられませんが、伝えられる範囲でできる限り記述しています。 また、Metaから最終的に提示されたオファー条件を最後に記載してあります。なにぶん日においては給与の話は燃えやすいということもあり、その部分だけ某日の有名エンジニアに倣って有料にしてあるのですが、ご興味のある方は是非ご購入いただければと思います(1コイン分の金額で

    メルカリを退職してロンドンのMetaに転職します 〜 外資Big Tech転職活動体験記|松岡玲音|note
    mohno
    mohno 2022/05/29
    「模範回答(たまに効率が悪かったり可読性が低かったりもするw)」←某所にそういうのがあったけど、LeetCode にもあるのか。/しかし給与部分は有料って、そこはNDAに該当しないのか?
  • Pythonの波に飲み込まれたRuby、日本のケータイ敗戦との共通点

    プログラミングの学習を始めようとする人がする定番の質問がある。「どのプログラミング言語を選べばいいか」というものだ。 私はこのコラムで以前、JavaScriptからプログラミングを始めてはどうかと書いた。JavaScriptはWebブラウザーさえあれば動作するからだ。例えば「Chrome」であれば、F12キーを押して「Console」タブを選ぶだけで、JavaScriptの対話実行環境を利用できる。 関連記事: 保存していないクレジットカード情報が漏洩する謎、鍵はあのプログラミング言語 もっとも、JavaScriptは最初に学ぶ言語としては少し癖が強いとも感じている。どちらかというと、2番目か3番目に学ぶことで視野が広がるタイプの言語ではないだろうか。 私が初心者に勧めるとしたら候補は2つある。「Ruby」と「Python」だ。 私がRubyを勧める理由は、「プログラミングの楽しさ」を体験

    Pythonの波に飲み込まれたRuby、日本のケータイ敗戦との共通点
    mohno
    mohno 2022/01/14
    なんか「そういう道をたどってきたってことかー」と思って読んだが、後半は「個人の感想ですよね」感。
  • DeepLearning/機械学習を始めると必ずいるカス - BizDeep

    (2018.1227)なんか急にバズったのでちょっと追記しました。 ディープラーニング人材はやばい奴だらけ これから「AI仕事に導入したい!」と思う人は沢山いるでしょう。 ただ「ディープラーニング」や「AI」という言葉に関しては世間で色々な誤解がされており、正しく現状を理解できている人はとても少ないように思います。 ディープラーニングという言葉はAlexNetがでた2012年頃に流行り出しました。 実際に企業が仕事としてディープラーニングに手を出し始めたのはAWSGPUインスタンスをリリースした頃からだと思うので2014年ぐらいからでしょうか。 まだ流行り出して5年も経っていない技術であるため、最新の研究レベルでもディープラーニングの全容は明らかになっていなかったり(参照: ディープラーニングの解釈に関するサーベイ論文) 、正しくディープラーニングを理解するための教科書や参考書などもま

    DeepLearning/機械学習を始めると必ずいるカス - BizDeep
    mohno
    mohno 2018/12/27
    AlphaGo(AlphaZero)の成果が劇的なので誤解されやすい気もする。(あれはルールも勝ち負けの判定も明確) 「学習させるまでが大変なんだよ」って聞いてるので、あまり近寄りたくないw
  • Pythonしかやりたくない!?一つの言語にこだわる未経験者がエンジニアとして採用されない理由 - paiza times

    Photo by Ray Bouknight こんにちは、谷口です。 「Python最高!」 「Pythonってほかの言語と比べて何がいいの?」 「ほかの言語は知らんけどPython最高!」 「……」 みたいな若いエンジニア(もしくはエンジニア志望者)、皆さんの周りにもいませんか? エンジニアとして「好きな技術がある」のはもちろんとてもよいことですが、 実務経験もないのに「Pythonの求人にしか応募したくない」 「ほかの言語は使ったことがない」と言って好きな言語しかやりたがらない みたいな感じで、経験が浅いにもかかわらずこだわりが強すぎる人は、転職活動ではマイナスになってしまうケースがよくあります。(別にこれはPythonに限った話ではないのですが、特にPythonにこだわりたがる人があまりにも多いので例にしました…) 今回は、「この言語しかやりたくない!」と言う人が勘違いしていることと

    Pythonしかやりたくない!?一つの言語にこだわる未経験者がエンジニアとして採用されない理由 - paiza times
    mohno
    mohno 2018/04/19
    耳が痛い。まあ、Javaやんないと厳しいかなあ、とか思いつつ、やらなくてもなんとかなって9年経ったw Pythonの報酬はその通りだと思う。
  • 機械学習をやる上で線形代数のどのような知識が必要になるのか

    TL;DR 「機械学習をやるなら線形代数はやっとけ」的な話が出るけど具体的な話があまり見当たらない 研究でなく実務レベルで機械学習を扱う場合にどのような線形代数の知識が必要になるのか考えてみた 高校でやるベクトル・行列+αくらいあれば概念的には十分で、計算が苦じゃない基礎体力が重要では? 機械学習が流行ることで、機械学習に必要な数学的基礎にも話が及ぶことが多くなってきている。 特に、線形代数や微積に関しては基礎を押さえとけみたいなことを言う人が結構いる気がする。 中身のない話をしたい場合はまあそれだけでもいいのだけれど、具体的に何が必要になるのかを説明してくれてる人はあまりいない。少なくとも自分の観測範囲では。 レベル感が様々なので万人に通用する議論はできないのはしょうがないが、「自分としてはこれは必要だと思っている」みたいな意見は聞いてみたい。 自分の考えはどうだろう、ということで線形代

    機械学習をやる上で線形代数のどのような知識が必要になるのか
    mohno
    mohno 2018/04/15
    分数できない、は論外としても、開発やるなら中学レベルの代数・幾何くらいは理解する力がほしいよね。/↓高校で行列やらないとかビックリだけど:-O
  • Engadget | Technology News & Reviews

    Research indicates that carbon dioxide removal plans will not be enough to meet Paris treaty goals

    mohno
    mohno 2018/02/13
    AlphaZeroは囲碁(ゲーム)のルールを指定するだけと聞いたが、囲碁のルール記述がこの行数で表現できるのか、囲碁のルール記述を含まない行数なのかどちらだろう。あと TPU 載ってない iPhone じゃ動かないのでは?
  • AWSとマイクロソフトとグーグルのクラウド、38項目で徹底比較

    出所:Gartner「Magic Quadrant for Cloud Infrastructure as a Service, Worldwide」 大手クラウドサービスの競争が激しさを増している。米アマゾン ウェブ サービスの「Amazon Web Services(AWS)」、米マイクロソフトの「Microsoft Azure」、米グーグルGoogle)の「Google Cloud PlatformGCP)」という3強だ。米調査会社ガートナーによるIaaS(インフラストラクチャー・アズ・ア・サービス)の市場分析を見ても、3社がずぬけている。AWSでは2018年に「大阪ローカルリージョン」を、GCPは2019年に「大阪GCPリージョン」を開設する予定であるなど、日向けのサービス強化も相次ぐ。 クラウド市場をけん引するAWSの勢いは衰えをみせない。2017年度の売上高は175億ドル

    AWSとマイクロソフトとグーグルのクラウド、38項目で徹底比較
    mohno
    mohno 2018/02/13
    「世界3大クラウドを38項目について徹底比較」←誰が開発するのか、と思うと、機能の多寡や良し悪しで選ぶケースってあんまりない気もするけど。
  • お天気プロコンと圧縮アルゴリズムについて - 兼雑記

    https://beta.atcoder.jp/contests/wn2017_1/standings むっちゃ僅差で2位。残念。この212点差がどのくらい僅差かというと、最後にいじってたところにもう2行変更を入れることを思いつけていれば、軽く2000点は差がついて勝ててたと思いますし、そうでなくても後30分もあれば実装できた細かいヘッダの圧縮で逆転できた量です。自分に悔しがる気持ちというのがこれほど残ってたのか、と驚くほど悔しいです。でも勉強になったし楽しかったです。 やったことを書きつつ、そもそも圧縮アルゴリズムについて、私としては感動的だった知見を得られたので、書いてみようかと思います。 今回のコンテストは、チャンネル1つの(RGBじゃなくてグレースケールだと思えば良い)画像を64枚を可逆圧縮するというものでした。その64枚の画像は同じ座標について光の波長と時間を変えて気象衛星が観測

    お天気プロコンと圧縮アルゴリズムについて - 兼雑記
    mohno
    mohno 2018/01/16
    30年ほど前に、当時は普通に使だったディザパターンによる中間色表現に特化した画像圧縮を研究対象にした同級生がいたが、サンプル画像がことごとくエロだったので卒論発表で一枚も画像を見せなかったのを思い出したw
  • 機械学習案件を納品するのは、そんなに簡単な話じゃないから気をつけて - Qiita

    はじめに 昨日のTwitterで書いたこちらが非常に反響を呼びました。 半年間かけたデータ解析の仕事が全くうまくいかなかった 今回の失敗は契約書に納品物を明記していなかったこと 機械学習の依頼は学習済みモデルのファイルを納品しただけでは、先方は検収できず、結果支払いを受けられない この教訓をひとりでも多くの人に知ってもらいたい — キカガク代表 吉崎亮介 (@yoshizaki_kkgk) 2017年11月20日 そうなんですよね。 全く先方が悪いわけでもなく、私自身が「機械学習のお仕事=解析」だと思いこんでいたことが失敗の始まり。 結局のところ、機械学習系のプロダクトを依頼されて、学習済みモデルを作成して即納品とはいかず、検証結果を示されないと検収できないよとなってしまうので、結局アプリケーション側まで組み込まないと納得感はないんですよね。 この検証とは、訓練データと検証データを分けた時

    機械学習案件を納品するのは、そんなに簡単な話じゃないから気をつけて - Qiita
    mohno
    mohno 2017/11/22
    半年間かかりっきりだったのか知らないが「AIを使って○○したいんだけど、この仕事お願いできない?」という仕事で「〇〇が実現できたら払う」という契約で発注できるなら、したいところは多いと思う:-)
  • 線画着色webサービスPaintsChainerを公開した - Qiita

    http://paintschainer.preferred.tech こちらに先月記事にした線画の着色のデモを公開しました!! 反響の大きかった皆さんに試していただけます!!(ちょっと期待値が上がり過ぎてないといいですがw) http://qiita.com/taizan/items/cf77fd37ec3a0bef5d9d 以前の記事『初心者がchainerで線画着色してみた。わりとできた。』はこちら。 ⇓そしてこちらがもじゃくっきーさんの使用例になっております。 GPUを使っている関係上アクセスが集中したりすると遅くなったりサーバーが落ちたりする可能性もありますが、生暖かく見守っていただければと思います。←たくさんの方に広まったこともあって、めっちゃ重くなっています。ぐぬぬぬ 画面はこんな感じっす。 線画ファイルを選択するととりあえず自動で塗ってくれます。 ※ただし、現状ではgifや

    線画着色webサービスPaintsChainerを公開した - Qiita
    mohno
    mohno 2017/01/28
    「線画ファイルを選択するととりあえず自動で塗ってくれます」「ヒントを参考に着色してくれます」←えぇぇ、なにそれ、すごい! 頑張ればアニメーターの仕事が代替できたりするのかな?
  • TensorFlowでアニメゆるゆりの制作会社を識別する - kivantium活動日記

    ついにガロアが死んだ年齢を超えてしまったことに気がつき、自分がまだ何も成し遂げていないことを悲しく思う今日このごろです。 さて、今日はGoogleが出した機械学習ライブラリのTensorFlowの使い方について軽く説明しつつ、ゆるゆりの制作会社の識別を行おうと思います。 TensorFlowとは TensorFlowはGoogleが11/9に公開したApache 2.0ライセンスで使える機械学習ライブラリです。Googleは様々なところでプロダクトに機械学習を活用していますが、TensorFlowは実際にGoogle内部の研究で使われているそうです(TensorFlow: Google 最新の機械学習ライブラリをオープンソース公開 - Google Developer Japan Blog)。 Googleのネームバリューは恐ろしいもので、GitHubのStar数はすでにChainerやC

    TensorFlowでアニメゆるゆりの制作会社を識別する - kivantium活動日記
    mohno
    mohno 2015/11/19
    やっていることはわからんが、発想はすごい。
  • 1