タグ

2016年1月27日のブックマーク (7件)

  • 私が選ぶ2015年の”新しい”Pythonモジュール トップ5 | POSTD

    最近、このモジュールをに紹介したところ、そのシンプルさと実用性に驚いていました。 joblib joblibの存在は以前から知ってはいたものの、実際のところはよく理解しておらず、いろいろな機能を寄せ集めたようなモジュールだと思っていました。まあ、その印象は今もあまり変わりませんが、実は非常に便利なモジュールだったのです。私は Flowminder の同僚から再度joblibを勧められて、このモジュールをデータ分析用のコードに幅広く使用しました。では、その機能について紹介しましょう。joblibは大きく分けて、 キャッシング 、 並列化 、 永続化 (データの保存と読み込み)の3つの機能から成ります。実を言うと、私はまだ並列プログラミングの機能は使ったことがないのですが、あとの2つの機能は頻繁に使ってきました。 キャッシング機能とは、シンプルなデコレータを使って、関数を簡単に”メモ化”する

    私が選ぶ2015年の”新しい”Pythonモジュール トップ5 | POSTD
  • Python におけるバックスラッシュ (\) の扱いと、row stirng と正規表現における注意点

    1. エスケープシーケンスにより表現する文字 Python で、バックスラッシュを文字列として出力したい。 print r'\' しかし、これではシンタックスエラーとなる。 他の言語と同様に、特定の文字の前にバックスラッシュ (\) を付けると、特殊な文字や機能を表わす。 例えば、「改行」を文字列の中に含むには、\n を記述する。 print 'hoge\npiyo' 文字列を出力させた結果は、 hoge piyo `\n’ は改行を表わし、これをエスケープシーケンスと言う。 エスケープシーケンス - Wikipedia とは、 コンピュータシステムにおいて、通常の文字列では表せない特殊な文字や機能を、規定された特別な文字の並びにより表したもの。狭義には、エスケープコード (0x1B, ESC) に始まる一連のバイト列のことをいう。 エスケープシーケンスとして、他に以下のような種類がある。

    Python におけるバックスラッシュ (\) の扱いと、row stirng と正規表現における注意点
  • インスタグラムを武器にしてぽっちゃり女性が婚活半年で結婚を決めたお話。

    私が婚活とソーシャルメディアの研究を格的に始めた2015年はじめぐらいから、インスタグラムが格的にブレイクし始めていた。 インスタグラムというのは、ソーシャルメディアの写真版といった感じだ。Facebookが記事投稿がメインであるのに対し、インスタグラムは写真ありきのメディアだ。どちらも文字もかけるし、写真もアップロードできる。同じような機能がついているが目に見えない住み分けがされている。 しかし、インスタグラムとFacebookを連携している人も多い。 インスタグラムでアップしたものを同時にフェイスブックでも投稿されるように設定しているのだ。 うわーっ、婚活中のツイッターやFacebookの使い方を考えなければいけないのに、さらにインスタグラムまで手を付けなければいけないのかぁぁぁぁ!!

    インスタグラムを武器にしてぽっちゃり女性が婚活半年で結婚を決めたお話。
  • 一流企業のマネジャーが明かす、学歴重視の新卒採用をやめられない理由

    1967年、岐阜県大垣市生まれ。2006 年からフリー。主に人事・労務分野で取材・執筆・編集を続ける。著書に『あの日、負け組社員になった・・・』『震災死 生き証人たちの真実の告白』(共にダイヤモンド社)や、『封印された震災死』(世界文化社)など。ウェブサイトでは、ダイヤモンド社や日経BP社、プレジデント社、小学館などで執筆。 日に巣う「学歴病」の正体 今の日には、「学歴」を基に個人を評価することが「時代遅れ」という風潮がある。しかし、表には出にくくなっても、他者の学歴に対する興味や差別意識、自分の学歴に対する優越感、劣等感などは、今も昔も変わらずに人々の中に根付いている。 たとえば日企業の中には、採用において人事が学生に学歴を聞かない、社員の配属、人事評価、昇格、あるいは左遷や降格に際しては仕事における個人の能力や成果のみを参考にする、という考え方が広まっている。しかし実際には、学

    一流企業のマネジャーが明かす、学歴重視の新卒採用をやめられない理由
  • 「Amazonの個人情報や購買情報は流出している」はマジでした。 - canadieの日記

    結果から先に書くと、即答に近い形で個人情報が漏れた。購買情報に関しては聞いてもないのに勝手に教えてくれた。 予想より反響が大きかったので文末にgmailを使った対策を追記した。 なお、米Amazonと同様、数日遅れて問い合わせ内容についてのメールが来たので追記しました。 Amazonのカスタマーサービス経由でアカウント情報が流出したことが判明 - GIGAZINE http://gigazine.net/news/20160125-amazon-customer-service-backdoor/ こーんな記事があったものだから、嘘くせえと思って実際に(英語めんどくさいので日の)カスタマーサービスにチャットで問い合わせてみた。いうまでもなく、ソーシャル・エンジニアリングはクラックの基である。セキュリティにうるさいAmazon社がこんなにザルなわけがないと思ったからだ。 なお、ニセの住所

    「Amazonの個人情報や購買情報は流出している」はマジでした。 - canadieの日記
    satojkovic
    satojkovic 2016/01/27
    え…
  • 統計屋のためのAWK入門 - あんちべ!

    はじめに 稿はAWKという言語を用いて、 ごく簡単にデータ分析用の前処理*1をするための解説記事です。 AWKは短いコマンドを記述するだけで多様なデータ処理を可能にします。 特にデータの抽出に関して恐るべき簡易さを提供します。 具体的には、input.txtというファイルの中から "fail"という文字列を含む行を抽出したければ次のように書くだけです。 awk /fail/ input.txt つまり、スラッシュ記号で文字列を指定するだけで その文字列を含む行を抽出できるのです。 大変簡単ですね! また、awkはLinuxMacには標準で入っており、 Windowsでもawk.exeを一つ用意するだけなので、 面倒なインストール作業や環境構築は不要で誰でも即座に使えるため、 自分で書いた処理を他人に渡したり*2各サーバに仕込むなども簡単に出来ます。 複雑な処理をする場合はPython

    統計屋のためのAWK入門 - あんちべ!
  • 2016年現在のWindows機によるAnacondaを用いたPythonでのデータマイニング環境構築 - あんちべ!

    はじめに 数年前、Windows機にPythonでのデータマイニング環境を構築するには様々な困難が待ち受けていました。依存関係にあるライブラリのバージョンが合わないというよくある話から、ライブラリをインストールする順番によって無事に動いたり動かなかったりするなど初心者殺しな落し穴があちこちで口を開いていました。ところが、2016年1月現在、全く新規に環境構築しようとしてAnacondaを利用してみたところ、意外なほど簡単に環境構築できました。 Anacondaはデータマイニングの便利なライブラリを集めて一括でインストール・利用できるようにしたパッケージです。内包されているライブラリは様々な数値解析、機械学習、自然言語処理、可視化、DB連携、データハンドリング、さらには最近話題のディープラーニングなど多岐に渡り、これを入れておけばデータマイニングを行う大抵の場面で対応できるでしょう。そこで、

    2016年現在のWindows機によるAnacondaを用いたPythonでのデータマイニング環境構築 - あんちべ!