タグ

ブックマーク / blog.kzfmix.com (51)

  • 「ワークライフシナジー」読んだ

    ちょっと前に、会社の裁量労働に関するワーキンググループに入れられてた。そこでの議論は正直僕にはあまり参考にならなかったけど、ワークライフバランスとか持続的な働き方、生き方というのものに目を向ける良い機会にはなったと思う。 里山ビジネスでも感じたが、このではワークライフバランスとは両者を天秤にかけてバランスをとるのではなく、お手玉をやるようにボールをジャグリングする感覚でバランスをとるのだと。さらに仕事と生活というものは来切り離されるものではなく、双方の充実がシナジーを伴ってどちらにもいい影響を与える様にすべきだろうという主張。すばらしい。 長い労働時間がより多くの成果を生み出す訳ではない。むしろ仕事と生活をうまくブレンドしたほうが生産性が上がる 仕事人間は過度に会社に期待している、会社も期待しているだろうという思い込む 生きること(living)と存在していること(existing)は

    「ワークライフシナジー」読んだ
    Gln
    Gln 2024/04/25
  • py4chemoinformaticsを書きました

    この記事は、創薬 (dry) Advent Calendar 2019 の4日目の記事です。 分生に来ていますが図書コーナーのbono関連図書のモテ期襲来が圧巻でした。 chemoinformaticsなみなさんもこれを期に購入してbioinformaticsも勉強しましょう。これからは両方できてなんぼですよ。 ところで、標題の通り我々(@iwatobipenと私)はpy4chemoinformaticsを書きました。そのきっかけがちょうど去年の分生で、ある出版社の方につないでもらいchemoinformaticsの書籍を検討してもらう機会をいただいたのですがボツになってしまいました。その際に目次を書いて提出したのですが、まぁ折角章立てしたんだしGitHubに残そうぜってことになった次第です。 私としてはMishima.sykとしてなんとなく何かを残しておきたかったのと謝辞を書きたかったと

    py4chemoinformaticsを書きました
    Gln
    Gln 2019/12/04
  • Finding activity cliffs in ChEMBL

    Activity cliffs are pairs of structurally similar compounds with large differences in activity, like inhibitory potency. I searched them in ChEMBL database with pychembldb. I haven't maintained it for a long time but It works well even in Python3.7 :-) My strategy for finding them is filtering assay data by whether it has confidence_score 9 (Direct single protein target assigned) and has enough da

    Finding activity cliffs in ChEMBL
    Gln
    Gln 2019/06/18
  • 「アブダクション」を読んだ

    年末からイノベーションに関するをいろいろ読んでいたのだけどその流れでたどり着いた。これは名著でしょう。年明け早々いいにあえてラッキーだ。 創薬ではある種の論理に基づいて、化合物の探索、合成を行う事になるわけだが、それはいわゆる定量的構造活性相関解析(QSAR)、定量的物性構造相関解析(QSPR)さらには動態特性(QSPkR)というような構造(やその特性)と変換したいパラメータの関連性からある程度論理的に探索対象を決定していくのが主流だ。ただし、このようなやり方では、ある意味推測が容易な答えしか出さないことが多いし、正しい答えの出るであろう予測の範囲もごく限られてしまうことが多い。予測範囲以外のものをアウトライヤーと呼び、予測の範囲外としてしまうが、実際にはそういう化合物の答えが知りたかったりするので常に苦労する。 我々は帰納的な推論から出発して、その枠を限りなく広げていきたいのだが、そ

    「アブダクション」を読んだ
    Gln
    Gln 2019/04/27
  • ファーマコフォアについてのよもやま話

    ファーマコフォアはもともとは、同じターゲットで複数の異なる骨格の薬剤とか開発化合物を3次元的に重ね合わせて共通の特徴を抽出するLBDD的な手法により推定されていてCatalystを使って計算するのが一般的だったように思います。 で、ファーマコフォアを作ろうとする話で触れられているように、ファーマコフォアをSBDDの側から解釈するとターゲット蛋白質でのポケット内で、強く相互作用している残基とリガンドの官能基の相互作用を見ていることになるわけです。 というわけで、ターゲットのアポ体の構造がわかっていたり、新規なスキャフォールドが欲しかったり(知財の関係で)する場合にターゲットのポケットの中で水素結合をする可能性のある残基や主査に水素結合ポイントを定義して三点ファーマコフォアでスクリーニングするというようなこともよくやっていましたが、これは結構ヒット率低かったです。 そもそも、ファーマコフォアポ

    ファーマコフォアについてのよもやま話
    Gln
    Gln 2019/03/15
  • 「AI創薬・ビッグデータ創薬」を読んだ

    薬事日報社からの出版だけど、タイトルがキャッチー過ぎてどうなんだろう?と思ったが、内容は良かった。 でもタイトルと内容があっているのかというと正直微妙なところである。というのは世間一般で期待感の高まっているAI創薬と書でのAI創薬の定義がちょっと違うからかなと思う。 自分がタイトルつけるなら「ゲノム創薬2.0」とかそんな感じにするかと思った。実際1,2章はそういう内容だった。 第一章ではビッグデータを「従来の医療情報のビッグデータ」と「新しい生命医療情報のビッグデータ」の2つに分けて考え、後者の方はGWASやNGSと絡めて予防医療とか層別つまりpersonal medicineの方向に着実に向かっているということが丁寧にかかれていて分かりやすかった。 GWASのデータからターゲット探索するのは最近批判されていたけど、やっぱり大規模スタディーからなんかいいものみつかるんじゃないかなーと期待

    「AI創薬・ビッグデータ創薬」を読んだ
    Gln
    Gln 2017/07/01
  • 「Redmineによるタスクマネジメント実践技法」を読んだ

    創薬研究というのは細かな作業が沢山あり、変化の激しいテスト工程なのに、そのインフラにはBTSとかITSとかないのが不自然だと思っていて、この前寄稿したときにちと触れといた。僕はソフトウェア業界にいるわけじゃないけど、問題解決の方法論としては似たような部分があるから参考になるんじゃないかと常々思っていたら、ズバリなが出ることを知ってすぐに予約しといた。 で、一昨日届いたので今日の移動時に一気に読んだ。 チケット駆動開発的なアプローチは自分の仕事管理では既に取り入れていたのであった。自分では文書駆動開発だと思っていたけど書を読んだら、これは明らかにチケット駆動開発のコンテクストだよなと。 個人的には第一部の技法は非常に勉強になった。第二部は実際にRedmineをどう使うかという話はソフトウェア開発としては色々面白かったが、自分ではRedmine使ったことがないので、ピンと来ない話も幾つかあ

    「Redmineによるタスクマネジメント実践技法」を読んだ
    Gln
    Gln 2017/06/19
  • 実践コンピュータビジョンの8章をScikit-learnで

    kNN, Naibe Bayesm, SVM, (Random Forrest)をScikit-learnでやってみた。データはiPython NotebookでReSTで出力したものをpandocでmarkdown_strictに変換しなおしてblogに貼り付けた。 描画用のヘルパー関数とデータセットの生成 from matplotlib.colors import ListedColormap import Image from numpy import * from pylab import * import pickle def myplot_2D_boundary(X,y): x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1 y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1

    実践コンピュータビジョンの8章をScikit-learnで
    Gln
    Gln 2014/09/23
  • Cytoscapeでchemoinformatics

    Chemviz2を使い始めたのでメモ インストール Cytoscapeのサイトから3.xの最新バージョンをダウンロードしてインストール Apps -> App ManagerからChemviz2を探してインストール 使ってみる pychembldbを使ってノード用の属性ファイルとnetworkファイルを作った。ネットワークはとりあえずランダムにつないでみた。 Cytoscapeを起動して"network.sif"をインポート。続いてテーブルファイルとして"node.csv"をimport プライマリキーはsmilesにする。 構造描画の設定はApps -> Chemoinformatics Tools -> SettingsでSmiles Attributesをnode.shared.nameを選んでおく。 構造描画するときには右クリックしてオプションダイアログのApps -> Chemi

    Cytoscapeでchemoinformatics
    Gln
    Gln 2014/08/10
  • あらかじめクラスタ数を決めないでクラスタリングする方法(Affinity Propagation)

    K-meansのように予めクラスタ数を指定すると、「そのクラスタ数は正しいの?」っていう疑問が浮かぶと思う。 「なんらかの統計値に基づいて適切なクラスタに分割して欲しい」そんな願いを叶えるのがAffinity Propagationというクラスタリングアルゴリズムである exemplara(セントロイドとかクラスタ中心)になるべきパラメータ(responsibility)とクラスタメンバに属しやすさ(availability)を交互に更新していって収束させる手法なので、K-meansのような初期値依存性がないらしい。 クラスタ数は類似度行列の対角要素(自分との類似度)に依存する(デフォルトはmedian)のでここを変更するとクラスタ数も変わるんだけどね。 Scikit-learnではAffinity Propagationが実装されているのでsykのケミストリースペースを作ってクラスタリン

    あらかじめクラスタ数を決めないでクラスタリングする方法(Affinity Propagation)
  • 製薬向けのRedmineハンズオンを開催して三島バルでぶらついてタップルームで地ビール飲んだ

    製薬やLS業界向けRedmineハンズオンお疲れ様でした。オープンソースなツールはベンダーのセミナーでは発表しにくいし、情報共有できるような機会も限られているので、色々情報交換できて有意義な週末でした。 僕はRedmine,Git,Sphinxの話をしたのですが、参加者のスキルがいまいちわからなかったために全て導入編みたいな感じになってしまったけど、使いはじめるきっかけにしていただけたらいいなぁと思います。 個人的にはHTSやメディシナルケミスト向けの事例は面白かったですね。イテレーション繰り返すような場合はカンバンのほうが使いやすいのかなと思った。あとはH2L、リードファインディングはカンバンのほうがいいやろねと。HTSはスクリーニングっていうよりは実験計画法みたいな感じで考えたほうがいいんだろうなぁ。 かんばん!~もし女子高生がRedmineで「スクラム」開発をしたら Redmine

    製薬向けのRedmineハンズオンを開催して三島バルでぶらついてタップルームで地ビール飲んだ
  • ChEMBLのアッセイのコンフィデンスレベル

    IC50とKiのトレンドをChEMBLのデータセットから探るという論文を読んでいたら、データ抽出のフィルターにconfidence level == 9を入れていたので、これは何かなぁと。 >>> from pychembldb import * >>> for c in chembldb.query(ConfidenceScore).all(): ... print c.description ... Default value - Target unknown or has yet to be assigned Target assigned is non-molecular Target assigned is subcellular fraction Target assigned is molecular non-protein target Multiple homologou

    ChEMBLのアッセイのコンフィデンスレベル
  • ChEMBLのデータからMMP用のsdfセットを作成する

    pychembldb使えば楽勝だというということの証明をしようと思ったが、意外に面倒くさかった。 ヒトのアッセイ系 信頼レベルマックス(Direct single protein target assigned) アッセイのタイプはBinding という条件でデータを引っ張ってくる。その後構造数<2のファイル(MMPにならない)を削除して、メタデータ(アッセイID, Uniprotのアクセッション番号、一般名称、データ元のジャーナル)を吐き出したあと、活性データをTSVに出力するようにしている。 最初はsdfのほうに活性情報も付けておけば楽勝じゃないかと思ったが、スキーマ見てたら測定タイプが正規化されてないうえに、AssayじゃなくてActivityのほうについてることに嫌な予感がしたので調べた。 やはり、pIC50とIC50が混在してたり、InhibitionとIC50が混在していた。

    ChEMBLのデータからMMP用のsdfセットを作成する
  • pychembldbでつくるChEMBLウェブサービス

    Flaskとpychembldbを使えばChEMBLウェブサービスみたいなのは簡単に作れるよと、朝の30分くらいを使ってちょっとやってみた。 pychembldbSQLAlchemyのラッパーなので、Flaskのほうではルーティングを設定して、ハンドラ関数用意すればいいだけ。特にFlaskはJSON化する関数が用意されているのでJSONで返すのはラク。 @app.route("/chemblws/compounds/<chembl_id>") def compound_by_ChEMBLID(chembl_id): compound = chembldb.query(Molecule).filter_by(chembl_id=chembl_id).one() result = {...} return jsonify(result) という感じでDictionaryを用意してxmlかjs

    pychembldbでつくるChEMBLウェブサービス
  • インフォグラフィック寄りのD3.jsみたいなものが欲しい

    分析するヒトはとっくにしてるし、分析しないヒトは絶対にしないしという状況なので、キャズム理論でいうところのアーリーマジョリティ、レイトマジョリティを相手にしているが結構苦戦している。 ブラウザでアクセスできて非常に使いやすい分析ツールとか導入しても響かないし、ハンズオンやっても「時間がもったいないなぁ」というネガティブなレスポンスが返ってくるので、戦略的に間違っているのかもしれない。というより、分析のキャズム的にはマジョリティはずっと後方にいるのだろうなぁと感じている。 さて、やり方ちょいと変更して、ストーリーを重視戦略はどうやろかねーと。最近インフォグラフィックの書籍がいくつか出てきたので、1冊買って読んでみました。というより、いつも見ているVISUALTHINKINGのヒトが出版したので買ったのだけどね。 インフォグラフィックと図解の大きな違いは、相手への伝わり方です。インフォグラフィ

    インフォグラフィック寄りのD3.jsみたいなものが欲しい
    Gln
    Gln 2013/07/02
  • 創薬にredmineを持ち込むという無理ゲーに突っ込むか否か

    去年辺りから色々思うところがあって、ここのところまとめていくつか社外発表したし、原稿も書いたしでそろそろアレかなぁと思っていて腑抜けみたいなみたいなノリで過ごしてたのだけど、先週、他業種の方々と色々と話をする機会があって、結局のところ自分は無理ゲーを言い訳にしてなすべきことをなしてないだけじゃないか!と自省したので、創薬にredmine的なものを持ち込むところまでは頑張るか頑張るまいかと悩み始めたのであった。 というあたりで悶々していた一週間だった。そんなわけでちょっと創薬系のエントリ連投というアクセス数を確実に減少させる悪手を繰り返していた。 自分の技術力がそれなりにあがったのと、ライブラリとか充実してきてて、チーム組まなくても独りでそこまでは到達しそうかなぁという感触がつかめたというのが1つ、いきなりredmine的なものを持ち込もうとしても上手くいくチャンスがゼロなので、仕事をやり慣

    創薬にredmineを持ち込むという無理ゲーに突っ込むか否か
    Gln
    Gln 2013/06/30
  • MMPで発表してみたら結構レスポンスが多くて楽しかった

    先週はgWT絡みで、今週はMMP絡みの発表をしてきた。それぞれ独立している仕事ではあるのだけど、プロジェクトの大いなる流れというかストリームというかそんなやつをきちんとコントロールしたいというのがそもそもの動機だったりするのでそういう意味ではつながっていると思います。 あと、いくつか質問をうけたので答えられるものはここに記しておきます。 sdfからgspのコンバートってどうすんの? openbabelのPythonラッパーを入れていればここに書いてるスクリプトで動くと思います。結合情報をアトム情報を吐き出せばいいだけなので他のツールでも同様にやればいいはずです。速度が気になる場合はsdfパーサーを書かなければいけないので面倒かも。 個人的にはpygwtというsdf2gsp gsp2sdfを後ろで面倒見てくれるモジュールを作りかけなので、出来たらgithubにあげておくかもしれません。 py

    MMPで発表してみたら結構レスポンスが多くて楽しかった
  • python-pptxで表をつくってみた

    python-pptxがテーブル対応していたので早速使ってみた。これはヤヴァイ、スクリプトで自動化したら快適になりそうな予感がする。 が、いまのとこ6行以上を指定するとファイルが出力できない模様。 from pptx import Presentation from pptx.util import Inches from pychembldb import * prs = Presentation() title_only_slidelayout = prs.slidelayouts[5] slide = prs.slides.add_slide(title_only_slidelayout) shapes = slide.shapes shapes.title.text = "10.1016/S0960-894X(01)80693-4" rows = 6 cols = 6 left =

    python-pptxで表をつくってみた
  • PythonでOpenCVを利用するのは簡単そうだ

    遅ればせながらDeep Learningアツいぜっていう感情の高まりがアップしたので、画像いじりが再燃した。ちなみにglitchとか好きです Deep Learningはここらへんを読むと良いです。 ニューラルネットの逆襲 Deep learning Pythonとdeep learningで手書き文字認識 データマイニングコンペティションサイト Kaggle にも Deep Learning ブームがきてるかと思ったのでまとめる opencvはbrewで入れた。ffmpegを入れておく必要があります。 Mac OSX (Mountain Lion) の homebrew で OpenCV のインストール Ruby:homebrewでopencvがインストールできない あと上記URLを参考に。 PythonからOpenCVを使う import cv2 cap = cv2.VideoCapt

    PythonでOpenCVを利用するのは簡単そうだ
  • PythonでAndroidアプリ

    About もう5年目(wishlistありマス♡) 最近はPythonDeepLearning 日酒自粛中 ドラムンベースからミニマルまで ポケモンGOゆるめ

    PythonでAndroidアプリ