タグ

MMPに関するGlnのブックマーク (2)

  • ChEMBLのデータからMMP用のsdfセットを作成する

    pychembldb使えば楽勝だというということの証明をしようと思ったが、意外に面倒くさかった。 ヒトのアッセイ系 信頼レベルマックス(Direct single protein target assigned) アッセイのタイプはBinding という条件でデータを引っ張ってくる。その後構造数<2のファイル(MMPにならない)を削除して、メタデータ(アッセイID, Uniprotのアクセッション番号、一般名称、データ元のジャーナル)を吐き出したあと、活性データをTSVに出力するようにしている。 最初はsdfのほうに活性情報も付けておけば楽勝じゃないかと思ったが、スキーマ見てたら測定タイプが正規化されてないうえに、AssayじゃなくてActivityのほうについてることに嫌な予感がしたので調べた。 やはり、pIC50とIC50が混在してたり、InhibitionとIC50が混在していた。

    ChEMBLのデータからMMP用のsdfセットを作成する
  • MMPで発表してみたら結構レスポンスが多くて楽しかった

    先週はgWT絡みで、今週はMMP絡みの発表をしてきた。それぞれ独立している仕事ではあるのだけど、プロジェクトの大いなる流れというかストリームというかそんなやつをきちんとコントロールしたいというのがそもそもの動機だったりするのでそういう意味ではつながっていると思います。 あと、いくつか質問をうけたので答えられるものはここに記しておきます。 sdfからgspのコンバートってどうすんの? openbabelのPythonラッパーを入れていればここに書いてるスクリプトで動くと思います。結合情報をアトム情報を吐き出せばいいだけなので他のツールでも同様にやればいいはずです。速度が気になる場合はsdfパーサーを書かなければいけないので面倒かも。 個人的にはpygwtというsdf2gsp gsp2sdfを後ろで面倒見てくれるモジュールを作りかけなので、出来たらgithubにあげておくかもしれません。 py

    MMPで発表してみたら結構レスポンスが多くて楽しかった
  • 1