2021-01-01から1年間の記事一覧
世の中はワクチンや東京オリンピックや AlphaFold2 で盛り上がっていますが、久々に書く記事は流行とは少し離れた内容です。最適化手法というと、基本的な最急降下法や、それこそ流行りのベイズ最適化などがありますが、その一つに、粒子群最適化(partial s…
以前の記事で、ランダムフォレスト(RF)による記述子の特徴量解釈について、少し触れました。aimedchem.hatenablog.com予測に関する記述子の役割をより深く考察するのに、shapley 値を用いた SHAP というものがあります。 Shapley 値はゲーム理論に基づき算…
機械学習モデルを研究や開発の現場で活用しようとする試みが盛んですが、様々な要因で難航しているのではないでしょうか。 その一つとして、折角苦労して作ったモデルが役に立たない、ということが挙げられます。機械学習モデルを作ることが目的ではなく、(…
ケモインフォマティクスにおける Mordred は、化学構造から簡便に記述子を算出してくれる便利なライブラリです。aimedchem.hatenablog.comしかし、どんな分子でも記述子を計算してくれる訳ではなく、時々計算が出来ずにエラーを吐き出します。 エラーの種類…
ケモインフォマティクスでは回帰問題、あるいは判別問題をよく扱います。様々な機械学習モデルがあると思いますが、最も使いやすいモデルとして、ランダムフォレスト(RF)があります。RF の数学的原理を解説しているサイトは多数あるので、ここでは触れませ…
ケモインフォマティクスと聞くと、機械学習的なアプローチを思い浮かべる人も多いかと思いますが、伝統的には、解析ツールを化学者に提供する、というのも重要な役割です。例えば Gaussian や GAMESS は有用な量子化学計算ソフトウェアですが、そのグラフィ…
明けましておめでとうございます。 今年も、創薬化学、ケモインフォマティクス を中心にブログを更新していこうと思います。量子化学計算といえば、Gaussian や GAMESS を利用している方も多いと思いますが、Python には量子化学計算をしてくれるライブラリ…