ご注文はリード化合物ですか?〜医薬化学録にわ〜

自分の勉強や備忘録などを兼ねて好き勝手なことを書いていくブログです。

2020-08-01から1ヶ月間の記事一覧

Jupiyter Notebook 上での構造式描写

ケモインフォマティクスと他の情報分野との最大の差異は、構造式を扱うことであると思います。 有機化学にとって構造式は切っても切れない関係にあり、それはプログラミング上においても例外ではありません。 構造式の情報を確認するのにも、RDKit は有用な…

実践的(?)線形重回帰

Python を使って機械学習をしてみたい、という実験系化学者の方も多いと思います。 しかし、ググってみても機械学習の方法論とかは出てくるけど、痒いところに手が届かない、という事例は多いはずです(私もそうです)。 そこで、線形重回帰分析による LogS …

小ネタ:塩を除去する関数

化合物データを機械学習に用いるとき、前処理で塩を除去する操作を行います。 例えば、酢酸ナトリウム塩のナトリウムを除いて、酢酸にする、といった具合です。 RDKit には Chem.SaltRemover という関数があるのですが、個人的にこれは使いにくいと思ってい…

分子記述子算出ライブラリ Mordred

機械学習でデータを解析する際、入力するデータは数字である必要があります。一方、化合物は化学者にとって分かりやすい構造式として表記されることが多いです。そのため、構造式を数字に落とし込む必要があります。構造式の数字表現としては色々ありますが…

クロスバリデーションのやり方と GBDT

初回の記事からだいぶ時間が経ってしまいました・・・。 三日坊主とかいう次元ではない。 最近、久々に深層学習以外の機械学習手法に時間をかけて取り組んでいるのですが、最近少し気になった内容があるので、それについて書いていきます。 線形重回帰など一…

ケモインフォマティクス とは?/化学構造データを読み込もう

このブログはケモインフォマティクスも一応テーマにしているので、その内容も少しずつ書いていこうと思います。 偉大なる先人のブログを見れば事足りそうですが・・・ こことか datachemeng.com こことか future-chem.com こことか iwatobipen.wordpress.com…

ブログ開設

はじめまして、「にわ」と申します。 大昔(中学生ぐらい)の時にしょうもないブログをやっていたことがありますが、アラサーにもなって改めてブログを始めようと思いました。 ブログを始めた理由としては ・情報系の人や製薬企業に勤めている方も一定の割合…