2018年9月26日水曜日

<文献検索から>(29) サポートベクターマシンを用いたマイクロ近赤外分光計と教師ありパターン認識を用いた医薬品原材料判別



題名:Pharmaceutical Raw Material Identification Using Miniature Near-Infrared (MicroNIR) Spectroscopy and Supervised Pattern Recognition Using Support Vector Machine
著者:Lan Sun, Chang Hsiung, Christopher G. Pederson, Peng Zou, Valton Smith, Marc von Gunten, and Nada A. O’Brien
出典:Applied Spectroscopy 2016, Vol. 70(5) 816–825



医薬品原材料の識別Raw Material Identification: RMIDまたは包装ラベルの確認は、製薬業界で一般的な品質管理の方法である。 従来、製薬RMIDは、クロマトグラフィー、湿式化学、および滴定などの実験室ベースの分析技術で行ってきた。 これらの技術のほとんどは破壊的で、作業時間がかかり、膨大な数の分析を扱うことは難しい。近赤外NIR、中赤外MIR、およびラマンRaman分光法を含む振動分光法は、非破壊、少量のサンプルで、 高速データ収集が可能である。 ポータブルNIRMid-IRRaman分光器の進歩により、大量のサンプルのオンサイトおよびIn-situ分析が原材料識別に実用化されている。
   中赤外分光法は、中赤外分光領域で強い吸収係数があるため、サンプルの厚さが制限され、場合によっては、Kbr等の赤外透明材料を使用して試料を希釈する必要がある。そのためNIRよりもRMID用としてはあまり一般的ではない。NIRRamanは、医薬品分析に広い範囲で適用可能だが、それぞれメリットとデメリットがある。Raman分光法はスペクトルピークが明確で優れた選択性を持ち、一般的な容器材料内のサンプルを簡単に非接触で測定できる。しかし、サンプルからの蛍光が測定に影響する場合があり、高エネルギーレーザー出力は、サンプルを変質させることがある。逆に、NIRは蛍光の問題が無く、プラスチックまたはガラスの容器を通して測定することもできる。 一方NIRは、スペクトルがブロードでピークが重なり合っているために、多変量データ解析を必要とする。過去10年間で、計算能力とアルゴリズムは大幅に改善され、NIRはより強力で使いやすいものになったので、ここでは分析ツールとしてNIRを選択した。
   判別分析の研究では主成分分析PCA、線形判別分析LDASIMCAPLS-DA等多くの方法が用いられ良好な結果が報告されている。しかし、幾つかの課題が残っている。その一つはモデルの移植性、つまりマスター機器から何台かのターゲット機器に多変量解析モデルを移植することである。もう一つの課題は、RMIDでは対象となるAPIや賦形剤が多岐にわたっているために、数百の判別をしなければならないということである。
   この研究では、小型のポータブルNIR分光器を用いてモデル移植性と大規模サンプルの課題を検討した。2種類のサンプルが用意された。一つのサンプルセットは、アセトアミノフェン、アスコルビン酸、タルク、2酸化チタン等19種類のAPIActive Pharmaceutical Ingredient)と賦形剤からなり、それぞれのサンプルは、2,3種類のグレードあるいは物理的性質の異なるものを含む。このサンプルは、A, B, C三つのサンプルセットに分けられ、モデル移植性の検討のために使用された。 もう一方のサンプルセットは、製薬メーカーから提供された一般的に使用される253サンプルでAPIと賦形剤から構成されている。 このサンプルでは大規模サンプルの分類方法について検討した。
    判別アルゴリズムとしてはSIMCA, (Soft Independent Modeling of Class Analogy),
PLS-DA(Partial Least Square Discrimination analysis), LDA (Linear Discriminant Analysis), QDA (quadratic discriminant analysis)を比較した。19種類のサンプルを含む第1のサンプルセットセットでAをトレーニングセットとしてモデルを作成しB,Cをテストセットとした。6台の小型NIR分光器を使用し、1台で作成したモデルを他の分光器に移植して計30回の評価を行いモデルの移植性を調べた。SVMの予測成功率96.43%で他のモデルに比較して高い結果が得られた。
   大規模な分類に対するケモメトリックモデルの能力を調査するために、253種類の医薬化合物のサンプルセットを使用した。このサンプルセットでは主な違いは化学構造だが、一部では材料の粒子サイズ、製剤の差(コーティングの有無)などがある。目標は、化学的および物理的な差異を有する化合物のすべてを区別することができるかどうかを試験するである。前処理としては、1次微分とSNVが適用された。サンプルスペクトルの半分をトレーニングセット、残り半分をテストセットとして使用した。モデルの全てを、これらの253化合物の前処理されたスペクトルに適用した。スペクトラムの半分をトレーニングセットとして使用し、残りの半分をテストセットとして使用した。SIMCA, PLS-DA, LDA, QDA, SVM(非線形、線形、階層線形)7つのモデルを使用して比較を行った。SVM非線形モデルは良い結果を得られなかったが、SVM線形モデルは96.57%の予測成功率、階層SVM線形モデルでは97.92%の予測成功率を出し、他のモデルより良い結果となった。
                                       以上