データサイエンティストを生業にする手段と実態について述べる。 途中、具体例・境界値の例として私個人の話もするが、なるべく一般性のある話をする。 この記事で言いたいことは具体的には4つだ。 プログラミングスクールをディスるなら代わりの入門方法を提供しようよ。 もう「未経験文系から3ヶ月でデータサイエンティストで一発逆転物語」を止めろ。*1 おじさんは人生逆転したいなら真面目にやれ。 若者はワンチャンじゃなくて、ちゃんと化け物になれよ。 この記事についてはパブリック・ドメインとして転載・改変・リンク記載を自由にしてよいです。 (続き書いた) a. 入門は辛いが… b. 思考停止でプログラミングスクールに通うな。 なろう系・始めてみよう系資料一覧 (最速・最短ルート用) まずは動かしてみよう。強くてニューゲームが体験出来るぞ! 入門以前の本 一般向け業界本 (AI業界と展望がわかる本) 技術者入
PDFは扱いにくい PDFファイルをPythonで扱うのは大変です。 表がPDFの中に埋め込まれているケースも割とあります。 例えば 平成30年 全衛連ストレスチェックサービス実施結果報告書の中にはたくさんの表データが埋め込まれています。 例えばファイルの40ページの【表14 業種別高ストレス者の割合】を抜き出したいと思ったとします。 この表を選択して、Excelにコピペしてみましょう。 コピーして、Excelに貼り付けます。 おや?うまくいかないですね。 1つのセルの中に、全部のデータが羅列されてしまっています。 実はPythonを使ってこのPDF中の表を比較的簡単にcsvやExcelに変換することができます。 PythonでPDFの表をcsvに PythonでPDF内の表(テーブル)をcsvやexcelに変換する手順は2ステップです。 ステップ1. PDFから表をpandasのData
Facebook、プログラムコードを別のプログラミング言語に翻訳する「TransCoder AI」を開発 FacebookはC++、Java、Pythonなどの高水準言語で書かれたプログラムコードを別のプログラミング言語に変換するニューラルトランスコンパイラを開発したという。このシステムは教師なし学習を採用しており、同社は従来よりもかなり効率が改善したとしている。 既存のプログラムコードを別の言語に移行するには、両方の言語について専門的な知識が必要な上、コストがかかってしまいがちだ。たとえばオーストラリアのコモンウェルス銀行はプラットフォームをCOBOLからJavaに移行するために5年の歳月と約7億5,000万米ドルを費やした。 Facebookは教師なし学習というアプローチ法に取り組み、C++、Java、Python間でソースコードを変換することができる「TransCoder」を開発した
$ python3 test.py Building net ... Source | Train? | Layer description | Output size -------+--------+----------------------------------+--------------- | | input | (?, 608, 608, 3) Load | Yep! | conv 3x3p1_1 +bnorm leaky | (?, 608, 608, 32) Load | Yep! | maxp 2x2p0_2 | (?, 304, 304, 32) Load | Yep! | conv 3x3p1_1 +bnorm leaky | (?, 304, 304, 64) Load | Yep! | maxp 2x2p0_2 | (?, 152, 152, 64) Load
English version 要約 dockerはデフォルトでセキュリティ機構(Spectre脆弱性の対策)を有効にします。この影響で、RubyやPythonのようなインタプリタは速度が劣化します。特にCPU律速なプログラムで顕著に遅くなります(実行時間が倍くらいになることがあります)。 現象 Rubyで1億回ループするコードを、直接ホスト上で実行する場合と、docker上で実行する場合で実行時間を比較してみます。 直接ホスト上で実行した場合: $ ruby -ve 't = Time.now; i=0;while i<100_000_000;i+=1;end; puts "#{ Time.now - t } sec"' ruby 2.7.1p83 (2020-03-31 revision a0c7c23c9c) [x86_64-linux] 1.321703922 sec docker
システムの構成を社内で共有したり外部に説明したりする際に、システム構成図を作成した経験のあるエンジニアは多いはず。ダイアグラム作成ソフト「Diagrams」を使うと、AnsibleやSubiquityといった「Infrastructure as Code(IaC)」に関連するサービスのように、プログラミング言語のPythonでコードを書くことで、クラウドやオンプレミスの構成図を描くことができます。 Diagrams · Diagram as Code https://diagrams.mingrammer.com/ まずはDiagramsの動作に必要なパッケージをインストールします。今回Diagramsのインストールに利用するのはUbuntu 18.04です。 sudo apt install -y python3 python3-pip graphviz 続いてDiagramsをインスト
歯車ってカッコいいですよね。大小ざまざまな歯車が組み合わさって連動して動いている時計のムーブメントなんて、いくらでも眺めていられる気がします。 記事の目的 歯車をプログラミングで描いてみます。歯車の種類はいろいろありますが、平歯車に絞ってチャレンジします。上の画像にあるような、我々一般人が歯車と聞いて最初に思い浮かぶタイプの歯車です。上のような、それっぽい感じの歯車が、それっぽくかみ合っているアニメーションを生成するところがゴールです。 一応世界標準のISO規格を意識した上で進めますが、準拠と言うにはほど遠い、「なんちゃって歯車」です。 歯車を作る まずは歯車を1つ描いてみることにします。 必須の3要素 さて、平歯車を作るにあたって、決めなければいけないところは多々ありますが、最も大事なのは以下の3点です。 m: モジュール(歯のサイズ) z: 歯の数 α: 圧力角 それぞれ順番に説明して
なお、distrolessのイメージは2種類(3通りの名前)がありますが、Python 3.5はバグ修正はせず、セキュリティ修正のみでサポート期限が2020/9/13というステータスなので、本エントリーでは3.7の方のみを扱います。 gcr.io/distroless/python3: Python 3.5.3 gcr.io/distroless/python3-debian9: Python 3.5.3(上のイメージと同一) gcr.io/distroless/python3-debian10: Python 3.7.3 一応サンプル等もありますが、どれも1ファイルで構成されたサンプルスクリプトばかりです。前回のsite-packagesにコピーする方法を軽く試したところうまく動かず、シェルもpipもensurepipもないため、ビルドイメージにすることもできません。いろいろ調べた結果、
「○○100本ノックとは」? プログラミング関係のエクササイズ集・Tips集的なものです。ちょっとしたテクニックや、基礎がまとまっているので解いてみると練習になります。 最初にやるのは退屈かもしれませんが、学習の停滞期にやってみると、思わぬ発見があるのではないかなと思います。 この記事では、Python関係の100本ノックを簡単にまとめてみました。自分が知っているのは、以下くらいですが、他にも良いもの(絶対ある気がします)知っている人はぜひコメントなどで教えてください。 画像処理100本ノック 画像処理100本ノック!! 追記:本家が惜しくも無くなってしまっていたので、fork(?)されていたものにリンク張り替えました。 解説・Google Colaboratoryで実行するときは以下記事参考にしてみてください。 ディープラーニング ∞本ノック 注:元サイトが消えてしまったので、私がfor
今回は、yaml で、PythonのデータからYAML形式に変換したり、YAML形式のファイルを解析して要素を出力できるようになりました。 Pythonによるスクレイピング&機械学習開発テクニック増補改訂 Scrapy、BeautifulSoup、scik [ クジラ飛行机 ]の第3章を参考にさせていただきながら、取り組んでいます。 今回からは、Ubuntuの環境を構築して取り組んでいます。 環境構築については、Dockerを使われる方は、以下をご参照ください。 oregin-ai.hatenablog.com OSから、Ubuntuを導入して取り組む方は、以下をご参照ください。 oregin-ai.hatenablog.com では、振り返っていきたいと思います。 PythonのデータをYAMLに変換する。 1.YAMLとは何か 2.全体像 3.Pythonのデータを作成 4. Pyth
はじめに Python言語サミット2020が4月の15日、16日の2日間で開かれました。これはPython実装の開発者(本家のCPythonに加えてPyPyなども)が集まる会議で、単にプレゼンし合う場というよりは言語本体や標準ライブラリの現状や今後に関する議論をして合意を目指すという会議とのこと。 今年はコロナウイルス蔓延の影響で、ご多分に漏れずオンライン開催となったそうですが、2日間の議題を見るとなかなか興味深いものが並んでいます。 全ての文字列をf文字列にする CPythonのパーサーをPEGベースの物にする (C)Pythonの仮想マシンの形式仕様記述 実装非依存のC言語拡張API CPythonのドキュメンテーション保守の変革 ライトニングトーク pip, PyPI そしてパッケージングに今後何を求める? 「マルチコアPython」プロジェクトの失敗を振り返る Pythonの型導入
おはようございます。 Python誠 こと、佐藤 誠 です。 Pythonでレトロゲームを作ろう! この連休が無駄に過ぎ去ってしまわないように、今日からPythonの記事をできるだけ毎日アップしていきたいと思います。(・・・果たして可能か?🤔) 内容は、今ノリに乗っているプログラミング言語「Pthon(パイソン)」で、簡単な2Dレトロゲームを作る方法を、ポイントを絞って記事にしていきたいと思います。 www.makotoblog.net 目標のレトロゲームは!? 目指すは・・・ 『スーパーマリオ』や『魔界村』などのアクションゲーム。 『グラディウス』や『ゼビウス』などのシューティングゲーム。 『ドラクエ』や『イース』などのRPG(ロールプレイング)ゲーム等々・・・ それらのレトロゲームに負けないPythonでの2Dゲームづくりを、ポイントを絞って説明していきます! それでは、早速行ってみ
セガは4月27日(月)、同社公式の技術ブログを更新し、プログラミング言語「Python」(パイソン)の勉強会に関する事例を紹介している。 プログラミング「Python」をご存知ですか? 学びたいと思っているPython超初心者のセガ社員向けに社内勉強会が開かれました。ビジュアルプログラミングや作業分解した様子をお届けします。 【#セガ技術ブログ 更新!】#Python の勉強会(入門編)の事例紹介 ⇒https://t.co/Iy8V6ACLBz #SEGATECHBLOG pic.twitter.com/haWmUxquQM — セガ公式アカウント🦔 (@SEGA_OFFICIAL) April 27, 2020 勉強会はPythonを学びたいと思っている初心者のセガ社員に向けて開催されたもので、きっかけとなったデザイナーとプログラマーの橋渡し役となるテクニカルアーティスト(TA)やゲ
ビープラウドの清水川貴之さん@shimizukawa , 清原弘貴さん@hirokiky、@tell-kさんが執筆(ビープラウド監修)した「自走プログラマー」が出版されます(大手書店は2020年2月18日から先行販売、電子書籍は2月22日販売開始、一般書店は2月27日販売開始です)。 自走プログラマー ~Pythonの先輩が教えるプロジェクト開発のベストプラクティス120 作者:清水川 貴之,清原 弘貴,tell-k出版社/メーカー: 技術評論社発売日: 2020/02/22メディア: Kindle版 自走プログラマーの前書きには「プログラミング入門者が中級者にランクアップするのに必要な知識をお伝えする本」と書かれています。 私なりに、入門、初級、中級以上のそれぞれのプログラマーのレベルをイメージしてみました。 入門プログラマー プログラミングの文法を学びながら書いている。プログラムが完成
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く