Glnのブックマーク - はてなブックマーク

「ワークライフシナジー」読んだ

ちょっと前に、会社の裁量労働に関するワーキンググループに入れられてた。そこでの議論は正直僕にはあまり参考にならなかったけど、ワークライフバランスとか持続的な働き方、生き方というのものに目を向ける良い機会にはなったと思う。里山ビジネスでも感じたが、この本ではワークライフバランスとは両者を天秤にかけてバランスをとるのではなく、お手玉をやるようにボールをジャグリングする感覚でバランスをとるのだと。さらに仕事と生活というものは本来切り離されるものではなく、双方の充実がシナジーを伴ってどちらにもいい影響を与える様にすべきだろうという主張。すばらしい。長い労働時間がより多くの成果を生み出す訳ではない。むしろ仕事と生活をうまくブレンドしたほうが生産性が上がる仕事人間は過度に会社に期待している、会社も期待しているだろうという思い込む生きること(living)と存在していること(existing)は

Gln 2024/04/25

リンク

py4chemoinformaticsを書きました

この記事は、創薬 (dry) Advent Calendar 2019 の4日目の記事です。分生に来ていますが図書コーナーのbono関連図書のモテ期襲来が圧巻でした。 chemoinformaticsなみなさんもこれを期に購入してbioinformaticsも勉強しましょう。これからは両方できてなんぼですよ。ところで、標題の通り我々(@iwatobipenと私)はpy4ch emoinformaticsを書きました。そのきっかけがちょうど去年の分生で、ある出版社の方につないでもらいchemoinformaticsの書籍を検討してもらう機会をいただいたのですがボツになってしまいました。その際に目次を書いて提出したのですが、まぁ折角章立てしたんだしGitHubに残そうぜってことになった次第です。私としてはMishima.sykとしてなんとなく何かを残しておきたかったのと謝辞を書きたかったと

Gln 2019/12/04

リンク

Finding activity cliffs in ChEMBL

Activity cliffs are pairs of structurally similar compounds with large differences in activity, like inhibitory potency. I searched them in ChEM BL database with pychem bl db. I haven't maintained it for a long time but It works well even in Python3.7 :-) My strategy for finding them is filtering assay data by whether it has confidence_score 9 (Direct single protein target assigned) and has enough da

Gln 2019/06/18

リンク

「アブダクション」を読んだ

年末からイノベーションに関する本をいろいろ読んでいたのだけどその流れでたどり着いた。これは名著でしょう。年明け早々いい本にあえてラッキーだ。創薬ではある種の論理に基づいて、化合物の探索、合成を行う事になるわけだが、それはいわゆる定量的構造活性相関解析(QSAR)、定量的物性構造相関解析(QSPR)さらには動態特性(QSPkR)というような構造(やその特性)と変換したいパラメータの関連性からある程度論理的に探索対象を決定していくのが主流だ。ただし、このようなやり方では、ある意味推測が容易な答えしか出さないことが多いし、正しい答えの出るであろう予測の範囲もごく限られてしまうことが多い。予測範囲以外のものをアウトライヤーと呼び、予測の範囲外としてしまうが、実際にはそういう化合物の答えが知りたかったりするので常に苦労する。我々は帰納的な推論から出発して、その枠を限りなく広げていきたいのだが、そ

Gln 2019/04/27

リンク

ファーマコフォアについてのよもやま話

ファーマコフォアはもともとは、同じターゲットで複数の異なる骨格の薬剤とか開発化合物を3次元的に重ね合わせて共通の特徴を抽出するLBDD的な手法により推定されていてCatalystを使って計算するのが一般的だったように思います。で、ファーマコフォアを作ろうとする話で触れられているように、ファーマコフォアをSBDDの側から解釈するとターゲット蛋白質でのポケット内で、強く相互作用している残基とリガンドの官能基の相互作用を見ていることになるわけです。というわけで、ターゲットのアポ体の構造がわかっていたり、新規なスキャフォールドが欲しかったり（知財の関係で）する場合にターゲットのポケットの中で水素結合をする可能性のある残基や主査に水素結合ポイントを定義して三点ファーマコフォアでスクリーニングするというようなこともよくやっていましたが、これは結構ヒット率低かったです。そもそも、ファーマコフォアポ

Gln 2019/03/15

リンク

「AI創薬・ビッグデータ創薬」を読んだ

薬事日報社からの出版だけど、タイトルがキャッチー過ぎてどうなんだろう？と思ったが、内容は良かった。でもタイトルと内容があっているのかというと正直微妙なところである。というのは世間一般で期待感の高まっているAI創薬と本書でのAI創薬の定義がちょっと違うからかなと思う。自分がタイトルつけるなら「ゲノム創薬2.0」とかそんな感じにするかと思った。実際1,2章はそういう内容だった。第一章ではビッグデータを「従来の医療情報のビッグデータ」と「新しい生命医療情報のビッグデータ」の２つに分けて考え、後者の方はGWASやNGSと絡めて予防医療とか層別つまりpersonal medicineの方向に着実に向かっているということが丁寧にかかれていて分かりやすかった。 GWASのデータからターゲット探索するのは最近批判されていたけど、やっぱり大規模スタディーからなんかいいものみつかるんじゃないかなーと期待

Gln 2017/07/01

リンク

「Redmineによるタスクマネジメント実践技法」を読んだ

創薬研究というのは細かな作業が沢山あり、変化の激しいテスト工程なのに、そのインフラにはBTSとかITSとかないのが不自然だと思っていて、この前寄稿したときにちと触れといた。僕はソフトウェア業界にいるわけじゃないけど、問題解決の方法論としては似たような部分があるから参考になるんじゃないかと常々思っていたら、ズバリな本が出ることを知ってすぐに予約しといた。で、一昨日届いたので今日の移動時に一気に読んだ。チケット駆動開発的なアプローチは自分の仕事管理では既に取り入れていたのであった。自分では文書駆動開発だと思っていたけど本書を読んだら、これは明らかにチケット駆動開発のコンテクストだよなと。個人的には第一部の技法は非常に勉強になった。第二部は実際にRedmineをどう使うかという話はソフトウェア開発としては色々面白かったが、自分ではRedmine使ったことがないので、ピンと来ない話も幾つかあ

Gln 2017/06/19

リンク

実践コンピュータビジョンの8章をScikit-learnで

kNN, Naibe Bayesm, SVM, (Random Forrest)をScikit-learnでやってみた。データはiPython NotebookでReSTで出力したものをpandocでmarkdown_strictに変換しなおしてblogに貼り付けた。描画用のヘルパー関数とデータセットの生成 from matplotlib.colors import ListedColormap import Image from numpy import * from pylab import * import pickle def myplot_2D_boundary(X,y): x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1 y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1

Gln 2014/09/23

リンク

Cytoscapeでchemoinformatics

Chemviz2を使い始めたのでメモインストール Cytoscapeのサイトから3.xの最新バージョンをダウンロードしてインストール Apps -> App ManagerからChemviz2を探してインストール使ってみる pychem bl dbを使ってノード用の属性ファイルとnetworkファイルを作った。ネットワークはとりあえずランダムにつないでみた。 Cytoscapeを起動して"network.sif"をインポート。続いてテーブルファイルとして"node.csv"をimport プライマリキーはsmilesにする。構造描画の設定はApps -> Chemoinformatics Tools -> SettingsでSmiles Attributesをnode.shared.nameを選んでおく。構造描画するときには右クリックしてオプションダイアログのApps -> Chemi

Gln 2014/08/10

リンク

あらかじめクラスタ数を決めないでクラスタリングする方法(Affinity Propagation)

K-meansのように予めクラスタ数を指定すると、「そのクラスタ数は正しいの？」っていう疑問が浮かぶと思う。「なんらかの統計値に基づいて適切なクラスタに分割して欲しい」そんな願いを叶えるのがAffinity Propagationというクラスタリングアルゴリズムである exemplara(セントロイドとかクラスタ中心)になるべきパラメータ(responsibility)とクラスタメンバに属しやすさ(availability)を交互に更新していって収束させる手法なので、K-meansのような初期値依存性がないらしい。クラスタ数は類似度行列の対角要素（自分との類似度）に依存する（デフォルトはmedian）のでここを変更するとクラスタ数も変わるんだけどね。 Scikit-learnではAffinity Propagationが実装されているのでsykのケミストリースペースを作ってクラスタリン

Gln 2014/07/11

リンク

製薬向けのRedmineハンズオンを開催して三島バルでぶらついてタップルームで地ビール飲んだ

製薬やLS業界向けRedmineハンズオンお疲れ様でした。オープンソースなツールはベンダーのセミナーでは発表しにくいし、情報共有できるような機会も限られているので、色々情報交換できて有意義な週末でした。僕はRedmine,Git,Sphinxの話をしたのですが、参加者のスキルがいまいちわからなかったために全て導入編みたいな感じになってしまったけど、使いはじめるきっかけにしていただけたらいいなぁと思います。個人的にはHTSやメディシナルケミスト向けの事例は面白かったですね。イテレーション繰り返すような場合はカンバンのほうが使いやすいのかなと思った。あとはH2L、リードファインディングはカンバンのほうがいいやろねと。HTSはスクリーニングっていうよりは実験計画法みたいな感じで考えたほうがいいんだろうなぁ。かんばん！～もし女子高生がRedmineで「スクラム」開発をしたら Redmineの

Gln 2013/10/11

リンク

ChEMBLのアッセイのコンフィデンスレベル

IC50とKiのトレンドをChEM BLのデータセットから探るという論文を読んでいたら、データ抽出のフィルターにconfidence level == 9を入れていたので、これは何かなぁと。 >>> from pychem bl db import * >>> for c in chem bl db.query(ConfidenceScore).all(): ... print c.description ... Default value - Target unknown or has yet to be assigned Target assigned is non-molecular Target assigned is subcellular fraction Target assigned is molecular non-protein target Multiple homologou

Gln 2013/07/10

リンク

ChEMBLのデータからMMP用のsdfセットを作成する

pychem bl db使えば楽勝だというということの証明をしようと思ったが、意外に面倒くさかった。ヒトのアッセイ系信頼レベルマックス(Direct single protein target assigned) アッセイのタイプはBinding という条件でデータを引っ張ってくる。その後構造数<2のファイル（MMPにならない）を削除して、メタデータ(アッセイID, Uniprotのアクセッション番号、一般名称、データ元のジャーナル)を吐き出したあと、活性データをTSVに出力するようにしている。最初はsdfのほうに活性情報も付けておけば楽勝じゃないかと思ったが、スキーマ見てたら測定タイプが正規化されてないうえに、AssayじゃなくてActivityのほうについてることに嫌な予感がしたので調べた。やはり、pIC50とIC50が混在してたり、InhibitionとIC50が混在していた。

Gln 2013/07/10

リンク

pychembldbでつくるChEMBLウェブサービス

Flaskとpychem bl dbを使えばChEM BLウェブサービスみたいなのは簡単に作れるよと、朝の30分くらいを使ってちょっとやってみた。 pychem bl dbはSQLAlchemyのラッパーなので、Flaskのほうではルーティングを設定して、ハンドラ関数用意すればいいだけ。特にFlaskはJSON化する関数が用意されているのでJSONで返すのはラク。 @app.route("/chem blws/compounds/<chem bl_id>") def compound_by_ChEM BLID(chem bl_id): compound = chem bl db.query(Molecule).filter_by(chem bl_id=chem bl_id).one() result = {...} return jsonify(result) という感じでDictionaryを用意してxmlかjs

Gln 2013/07/07

リンク

インフォグラフィック寄りのD3.jsみたいなものが欲しい

分析するヒトはとっくにしてるし、分析しないヒトは絶対にしないしという状況なので、キャズム理論でいうところのアーリーマジョリティ、レイトマジョリティを相手にしているが結構苦戦している。ブラウザでアクセスできて非常に使いやすい分析ツールとか導入しても響かないし、ハンズオンやっても「時間がもったいないなぁ」というネガティブなレスポンスが返ってくるので、戦略的に間違っているのかもしれない。というより、分析のキャズム的にはマジョリティはずっと後方にいるのだろうなぁと感じている。さて、やり方ちょいと変更して、ストーリーを重視戦略はどうやろかねーと。最近インフォグラフィックの書籍がいくつか出てきたので、１冊買って読んでみました。というより、いつも見ているVISUALTHINKINGのヒトが出版したので買ったのだけどね。インフォグラフィックと図解の大きな違いは、相手への伝わり方です。インフォグラフィ

Gln 2013/07/02

リンク

創薬にredmineを持ち込むという無理ゲーに突っ込むか否か

去年辺りから色々思うところがあって、ここのところまとめていくつか社外発表したし、原稿も書いたしでそろそろアレかなぁと思っていて腑抜けみたいなみたいなノリで過ごしてたのだけど、先週、他業種の方々と色々と話をする機会があって、結局のところ自分は無理ゲーを言い訳にしてなすべきことをなしてないだけじゃないか！と自省したので、創薬にredmine的なものを持ち込むところまでは頑張るか頑張るまいかと悩み始めたのであった。というあたりで悶々していた一週間だった。そんなわけでちょっと創薬系のエントリ連投というアクセス数を確実に減少させる悪手を繰り返していた。自分の技術力がそれなりにあがったのと、ライブラリとか充実してきてて、チーム組まなくても独りでそこまでは到達しそうかなぁという感触がつかめたというのが1つ、いきなりredmine的なものを持ち込もうとしても上手くいくチャンスがゼロなので、仕事をやり慣

Gln 2013/06/30

リンク

MMPで発表してみたら結構レスポンスが多くて楽しかった

先週はgWT絡みで、今週はMMP絡みの発表をしてきた。それぞれ独立している仕事ではあるのだけど、プロジェクトの大いなる流れというかストリームというかそんなやつをきちんとコントロールしたいというのがそもそもの動機だったりするのでそういう意味ではつながっていると思います。あと、いくつか質問をうけたので答えられるものはここに記しておきます。 sdfからgspのコンバートってどうすんの？ openbabelのPythonラッパーを入れていればここに書いてるスクリプトで動くと思います。結合情報をアトム情報を吐き出せばいいだけなので他のツールでも同様にやればいいはずです。速度が気になる場合はsdfパーサーを書かなければいけないので面倒かも。個人的にはpygwtというsdf2gsp gsp2sdfを後ろで面倒見てくれるモジュールを作りかけなので、出来たらgithubにあげておくかもしれません。 py

Gln 2013/06/13

リンク

python-pptxで表をつくってみた

python-pptxがテーブル対応していたので早速使ってみた。これはヤヴァイ、スクリプトで自動化したら快適になりそうな予感がする。が、いまのとこ6行以上を指定するとファイルが出力できない模様。 from pptx import Presentation from pptx.util import Inches from pychem bl db import * prs = Presentation() title_only_slidelayout = prs.slidelayouts[5] slide = prs.slides.add_slide(title_only_slidelayout) shapes = slide.shapes shapes.title.text = "10.1016/S0960-894X(01)80693-4" rows = 6 cols = 6 left =

Gln 2013/06/04

リンク

PythonでOpenCVを利用するのは簡単そうだ

遅ればせながらDeep Learningアツいぜっていう感情の高まりがアップしたので、画像いじりが再燃した。ちなみにglitchとか好きです Deep Learningはここらへんを読むと良いです。ニューラルネットの逆襲 Deep learning Pythonとdeep learningで手書き文字認識データマイニングコンペティションサイト Kaggle にも Deep Learning ブームがきてるかと思ったのでまとめる opencvはbrewで入れた。ffmpegを入れておく必要があります。 Mac OSX (Mountain Lion) の homebrew で OpenCV のインストール Ruby:homebrewでopencvがインストールできないあと上記URLを参考に。 PythonからOpenCVを使う import cv2 cap = cv2.VideoCapt