ご注文はリード化合物ですか?〜医薬化学録にわ〜

自分の勉強や備忘録などを兼ねて好き勝手なことを書いていくブログです。

2020-01-01から1年間の記事一覧

触媒医薬品:新しい医薬品の形と落ちこぼれの夢

この記事は創薬 (dry) Advent Calendar 2020 の 13 日目の記事です。 クリスマスに書く advent calendar とは adventar.org クリスマスですし、飲みながら書いているので、偶にはポエミーな記事でも。 医薬品のモダリティの多様化が叫ばれて久しいですが、も…

化学構造生成器 Chemical VAE の使い方

この記事は創薬 (dry) Advent Calendar 2020 の 12 日目の記事です。 一週間以上遅刻してすみません・・・(というか早く wet の方も書かねば)。 adventar.orgケモインフォマティクスで盛んに研究されているものの一つに、構造生成器というものがあります。…

Deep Graph Library によるグラフ畳み込みネットワークの基本(追記予定)

最近、論文を書いてたり会議が増えたり人事関連で色々あったり投資を始めたりごちうさを観たりで忙しく、中々記事を書けていませんでしたが、久々にブログを更新しました。AI ブーム、深層学習ブームは化学分野でも続いていますが、化学者としては、構造式を…

生物活性物質データベース ChEMBL の使い方

QSAR モデルを構築するためには、多くのデータが必要です。 化合物とその生物活性についてまとめられたデータベースは色々ありますが、よく使われるものの一つに ChEMBL というデータベースがあります。 www.ebi.ac.uk アルツハイマー病治療薬であるドネペジ…

新しい化合物の表記法 SELFIES

色々と書きたいことは多いのですがサボり癖が強く忙しかったり疲れてたり、少し考えて文章を書きたかったりで、少し久々の更新ですが、新しい知識を最近得たのでシェアも兼ねて記事を書きます。 化合物を扱うとき、我々化学者は構造式を使うことが一般的です…

Jupiyter Notebook 上での構造式描写

ケモインフォマティクスと他の情報分野との最大の差異は、構造式を扱うことであると思います。 有機化学にとって構造式は切っても切れない関係にあり、それはプログラミング上においても例外ではありません。 構造式の情報を確認するのにも、RDKit は有用な…

実践的(?)線形重回帰

Python を使って機械学習をしてみたい、という実験系化学者の方も多いと思います。 しかし、ググってみても機械学習の方法論とかは出てくるけど、痒いところに手が届かない、という事例は多いはずです(私もそうです)。 そこで、線形重回帰分析による LogS …

小ネタ:塩を除去する関数

化合物データを機械学習に用いるとき、前処理で塩を除去する操作を行います。 例えば、酢酸ナトリウム塩のナトリウムを除いて、酢酸にする、といった具合です。 RDKit には Chem.SaltRemover という関数があるのですが、個人的にこれは使いにくいと思ってい…

分子記述子算出ライブラリ Mordred

機械学習でデータを解析する際、入力するデータは数字である必要があります。一方、化合物は化学者にとって分かりやすい構造式として表記されることが多いです。そのため、構造式を数字に落とし込む必要があります。構造式の数字表現としては色々ありますが…

クロスバリデーションのやり方と GBDT

初回の記事からだいぶ時間が経ってしまいました・・・。 三日坊主とかいう次元ではない。 最近、久々に深層学習以外の機械学習手法に時間をかけて取り組んでいるのですが、最近少し気になった内容があるので、それについて書いていきます。 線形重回帰など一…

ケモインフォマティクス とは?/化学構造データを読み込もう

このブログはケモインフォマティクスも一応テーマにしているので、その内容も少しずつ書いていこうと思います。 偉大なる先人のブログを見れば事足りそうですが・・・ こことか datachemeng.com こことか future-chem.com こことか iwatobipen.wordpress.com…

ブログ開設

はじめまして、「にわ」と申します。 大昔(中学生ぐらい)の時にしょうもないブログをやっていたことがありますが、アラサーにもなって改めてブログを始めようと思いました。 ブログを始めた理由としては ・情報系の人や製薬企業に勤めている方も一定の割合…