2018年9月26日水曜日

<文献検索から>(29) サポートベクターマシンを用いたマイクロ近赤外分光計と教師ありパターン認識を用いた医薬品原材料判別



題名:Pharmaceutical Raw Material Identification Using Miniature Near-Infrared (MicroNIR) Spectroscopy and Supervised Pattern Recognition Using Support Vector Machine
著者:Lan Sun, Chang Hsiung, Christopher G. Pederson, Peng Zou, Valton Smith, Marc von Gunten, and Nada A. O’Brien
出典:Applied Spectroscopy 2016, Vol. 70(5) 816–825



医薬品原材料の識別Raw Material Identification: RMIDまたは包装ラベルの確認は、製薬業界で一般的な品質管理の方法である。 従来、製薬RMIDは、クロマトグラフィー、湿式化学、および滴定などの実験室ベースの分析技術で行ってきた。 これらの技術のほとんどは破壊的で、作業時間がかかり、膨大な数の分析を扱うことは難しい。近赤外NIR、中赤外MIR、およびラマンRaman分光法を含む振動分光法は、非破壊、少量のサンプルで、 高速データ収集が可能である。 ポータブルNIRMid-IRRaman分光器の進歩により、大量のサンプルのオンサイトおよびIn-situ分析が原材料識別に実用化されている。
   中赤外分光法は、中赤外分光領域で強い吸収係数があるため、サンプルの厚さが制限され、場合によっては、Kbr等の赤外透明材料を使用して試料を希釈する必要がある。そのためNIRよりもRMID用としてはあまり一般的ではない。NIRRamanは、医薬品分析に広い範囲で適用可能だが、それぞれメリットとデメリットがある。Raman分光法はスペクトルピークが明確で優れた選択性を持ち、一般的な容器材料内のサンプルを簡単に非接触で測定できる。しかし、サンプルからの蛍光が測定に影響する場合があり、高エネルギーレーザー出力は、サンプルを変質させることがある。逆に、NIRは蛍光の問題が無く、プラスチックまたはガラスの容器を通して測定することもできる。 一方NIRは、スペクトルがブロードでピークが重なり合っているために、多変量データ解析を必要とする。過去10年間で、計算能力とアルゴリズムは大幅に改善され、NIRはより強力で使いやすいものになったので、ここでは分析ツールとしてNIRを選択した。
   判別分析の研究では主成分分析PCA、線形判別分析LDASIMCAPLS-DA等多くの方法が用いられ良好な結果が報告されている。しかし、幾つかの課題が残っている。その一つはモデルの移植性、つまりマスター機器から何台かのターゲット機器に多変量解析モデルを移植することである。もう一つの課題は、RMIDでは対象となるAPIや賦形剤が多岐にわたっているために、数百の判別をしなければならないということである。
   この研究では、小型のポータブルNIR分光器を用いてモデル移植性と大規模サンプルの課題を検討した。2種類のサンプルが用意された。一つのサンプルセットは、アセトアミノフェン、アスコルビン酸、タルク、2酸化チタン等19種類のAPIActive Pharmaceutical Ingredient)と賦形剤からなり、それぞれのサンプルは、2,3種類のグレードあるいは物理的性質の異なるものを含む。このサンプルは、A, B, C三つのサンプルセットに分けられ、モデル移植性の検討のために使用された。 もう一方のサンプルセットは、製薬メーカーから提供された一般的に使用される253サンプルでAPIと賦形剤から構成されている。 このサンプルでは大規模サンプルの分類方法について検討した。
    判別アルゴリズムとしてはSIMCA, (Soft Independent Modeling of Class Analogy),
PLS-DA(Partial Least Square Discrimination analysis), LDA (Linear Discriminant Analysis), QDA (quadratic discriminant analysis)を比較した。19種類のサンプルを含む第1のサンプルセットセットでAをトレーニングセットとしてモデルを作成しB,Cをテストセットとした。6台の小型NIR分光器を使用し、1台で作成したモデルを他の分光器に移植して計30回の評価を行いモデルの移植性を調べた。SVMの予測成功率96.43%で他のモデルに比較して高い結果が得られた。
   大規模な分類に対するケモメトリックモデルの能力を調査するために、253種類の医薬化合物のサンプルセットを使用した。このサンプルセットでは主な違いは化学構造だが、一部では材料の粒子サイズ、製剤の差(コーティングの有無)などがある。目標は、化学的および物理的な差異を有する化合物のすべてを区別することができるかどうかを試験するである。前処理としては、1次微分とSNVが適用された。サンプルスペクトルの半分をトレーニングセット、残り半分をテストセットとして使用した。モデルの全てを、これらの253化合物の前処理されたスペクトルに適用した。スペクトラムの半分をトレーニングセットとして使用し、残りの半分をテストセットとして使用した。SIMCA, PLS-DA, LDA, QDA, SVM(非線形、線形、階層線形)7つのモデルを使用して比較を行った。SVM非線形モデルは良い結果を得られなかったが、SVM線形モデルは96.57%の予測成功率、階層SVM線形モデルでは97.92%の予測成功率を出し、他のモデルより良い結果となった。
                                       以上



2018年3月5日月曜日

<文献検索から>(28) 予測値の不確実性推定を伴う近赤外分光法と部分最小二乗法による水質モニタリング


題名:Monitoring Process Water Quality Using Near Infrared Spectroscopy and Partial Least Squares Regression with Prediction Uncertainty Estimation

著者P. B. Skou, T. A. Berg, S. D. Aunsbjerg, D. Thaysen, M. A. Rasmussen, and F. van den Berg

出典:Applied Spectroscopy 2017, Vol. 71(3) 410–421
膜濾過システムは、乳製品製造のいくつかの工程で使用され、製品および成分の様々なサイズの分子を分離する。膜ろ過技術を使用した乳製品の加工方法は、今後数年で大きく成長すると予測されている。チーズホエイ(Whey)タンパク質は、異なる機能特性を有する広範囲の製品に使用することが出来る。
  <Wheyとは? 全乳または脱脂乳からチーズを作る際に得られる液体。製菓・製パンなどの原料や 家畜飼料として利用される。乳清(にゆうせい)。>
  酪農産業の水使用量は、生産工程または浄化プロセスの下流のプロセス水の効率的な再利用によって大幅に削減できる。 ホエイ及びミルクは、多量の水分を含み、プロセス水の供給源として利用できる可能性がある。しかし、微生物学的な安全性と衛生性は食品や酪農業界にとって非常に重要である。乳糖、尿素、塩類などの有機化合物は逆浸透膜を通過することが報告されている。 プロセス水工程にプロセス分析技術(PAT: Process Analytical Technology)の考え方を適用することにより、リスクを継続的かつリアルタイムに監視することができる。尿素は、逆浸透膜透過液中の主要な化合物としてGC-MS分析によって同定されているが、時間がかかり、測定に労力が必要である。尿素は、近赤外分光法(NIRS)によっても測定可能で、迅速で、労力も少なく、または自動化測定も可能である。
  尿素および乳糖は、水の吸収ピークのはざまのスペクトル範囲20802325nmに特徴的な吸収パターンがある。チーズ製造工程で予想される尿素濃度は100600ppmであり、低濃度と水の吸収ピークの干渉は、検出限界を上げて、予測不確実性を増加させる。 部分最小二乗回帰(PLS)などの多変量モデリング手法は、単変量解析法に比べて予測誤差と検出限界を低くすることができる。PLSに代表される多変量解析法の予測不確実性の信頼できる推定値がなければ、検出限界を確立することはできず、リアルタイムのリスクアセスメントは実現できない。
  リアルタイムモニタリング用の検量線開発をする場合、代表的な下記の2つの方法がある。(1)測定対象となる既知濃度の試薬と測定に潜在的に悪影響を及ぼす溶液を混合し近赤外分析計で測定する。(2)プロセスから収集した実サンプルについてラボで測定し、同時に測定した近赤外分析計のスペクトルと関連付ける。ここでは、酪農プロセス水における尿素濃度予測のための2つの検量線作成法を比較し、予測不確実性を推定する方法を提示する。最後に、NIRSPLSを組み合わせたプロセス水のリアルタイムリスクアセスメントの可能性を示す。
検量線モデルの予測値分散は下記のようにあらわすことが出来る。
 
各サンプル予測値の分散=検量線誤差+モデル誤差+機器誤差+基準値誤差 ……(1)
注)検量線誤差は、モデル、基準値、機器等を含んだ検量線計算結果のバラツキ
  モデル誤差は、検量線の平均二乗誤差から機器誤差と基準値誤差を引いたものと定義。

  プロセス水サンプルは、本格的な生産システムで膜透過液から収集され、可視/紫外分光光度計を用いて340nmでの吸収から濃度測定を行った。ラボサンプルは尿素(9溶液)およびラクトース(3溶液)および脱塩水を様々な比率で組み合わせることによって作成した。ラボサンプルとプロセスサンプルから尿素濃度予測用の2種類の検量線をPLSにより作成した。スペクトルのバラツキは、5回の繰り返し測定スペクトルから平均値に近い3スペクトル及び3日間に測定した同じサンプルの測定スペクトル(ラボサンプルのみ)より計算した。
  ラボサンプルを使用すると何度も繰り返し測定が可能で長期間の再現性を得ることが出来る。一方繰り返し性、再現性が実際のプロセスのものと異なるという危険性がある。プロセスデータでは同じサンプルでも採取日が異なると変成する可能性がある。2つのサンプルから得られた検量線は異なる予測値と不確かさを持つ。検量線作成と検定結果は、検量線の予測誤差はラボサンプルを使用した検量線の方が良い(RMSEC:9.7/10.2ppmLab/Process))が、実プロセスでの検定結果では、プロセスサンプルの方が良い(RMSEP: 13.0/12.1ppmLab/Process))ことを示している。
予測値誤差分散は、(1)式に各誤差を入れて求められた。平均予測誤差(RMSEP)と平均予測不確実性(SPE)を比較すると、プロセスモデルよりラボモデルの方が、差が大きくなった。下表参照

 


RMSEP(ppm)


SPE(ppm)


ラボ


13


15.1


プロセス


12.1


12.4

    原因としては、プロセスサンプルを用いた検証時に予測値が基準値に対し少し偏りを持つためと推測する。SPEは、RMSEPと非常に近いことが分かる。これは、PLSモデルが合理的に作成されていれば、RMSEPSPEを正確に推定できることを示唆している。作成した検量線を限外濾過膜、逆浸透膜、逆浸透膜ポリッシャーの3種の膜を通した後のプロセス水のスペクトルに適用し尿素を測定した。限外濾過膜使用サンプルでは、計算から得られた予測誤差分散を外れることがあったが、その他の濾過膜では予測誤差分散内であった。プロセスモニタリングのための予測モデル構築には、ラボとプロセスサンプルの両方を組み合わせて最良の予測性能が得られることが多い。予測性能向上のためには、ラボサンプルを作り直しプロセスサンプルを長期にわたり収集し追加することで予測性能が向上する。




2018年1月7日日曜日

<文献検索から>(27)近赤外分光法とケモメトリックスモデルを用いたシプロフロキサシン錠の分類


題名:Classification of Ciprofloxacin Tablets Using Near-Infrared Spectroscopy and Chemometric Modeling
著者:N. Fuenffinger, S. Arzhantsev, and C. Gryniewicz-Ruzicka
出典:Applied Spectroscopy 2017, Vol. 71(8) 1927–1937

 
出所不明な医薬品、ラベル間違い、偽造医薬品等は、使用者に重大なリスクをもたらす世界的な問題である。米国の個人が摂取した薬物の約40%は、他国で製造されていて、誤ラベル等による使用者への影響が懸念されている。米国食品医薬品局(FDA)は、医薬品の品質と認証を評価するための迅速で信頼できるスクリーニング方法を開発している。医薬品指紋認証は、製品を特定し、その製品を製造元に追跡し、製品品質の変化を検出するための方法の開発を必要とする。2008年、FDAは、イオン移動度分光法、X線蛍光分光法、ラマン分光法、近赤外(NIR)分光法などの技術を使用して、米国への医薬品輸入の迅速なスクリーニング方法の開発を目的としたプロジェクトを開始した。これまでの研究では、ニューラルネットワーク、SIMCA soft independent modeling)法、K-最近傍法などのパターン認識分類手法を高速液体クロマトグラフィー測定に適用することによって医薬指紋認証をすることが可能であることが示されている。

NIR分光法は、医薬品を安全で迅速かつ効果的にスクリーニング可能なコストパーフォーマンスの高いツールである。この研究の目的は、いくつかの製造業者からのシプロフロキサシン塩酸塩錠剤の分類に関するNIRおよびケモメトリクスの能力を決定することである。シプロフロキサシンはヒト毒性の低い合成フルオロキノロン抗生物質であり、ブドウ球菌、肺炎連鎖球菌、ヘモフィルスおよび緑膿菌などの広範囲の生物に有効であることが証明されている。
米国およびインドの6つの製造業者から53ロットにわたる1025のシプロフロキサシン錠剤のNIR吸収スペクトルを収集し評価した。NIRスペクトルは、フーリエ変換NIRアナライザーを用いて 1製品あたり合計24の錠剤を分析した。各錠剤からのスペクトルは、8.0cm -1の分解能で400010,000cm -1の領域にわたって32回のスキャンを平均することによって計算した。前処理は、Savitzky-Golayアルゴリズムを使用して一次微分しSNVStandard Normal Validate)変換を行った。

製薬指紋認証の究極の目標は、(1)製造業者を特定することができるモデルの開発、 (2)医薬品の投与量を特定 (3)工程または原材料の変化に起因するロット間の変動、を評価することである。ここでは、最初の2つの目標のいずれかがシプロフロキサチン錠剤のNIRスペクトルから達成可能であるかどうかを特定するための客観的方法として、教師なし分類モデルの階層クラスター分析(Hierarchical Cluster Analysis : HCA)による分析を行った。HCAと二乗ユークリッド距離測定から得られた結果は、製造業者間でNIRスペクトルの最大の違いが生じることを示している。これらの知見に基づいて、シプロフロキサシン錠剤の成分の違いを予測する目的で、主成分分析の主成分を用いてデータ量を縮小した後に二次判別分析(QDA)モデルを構築した。 QDAを使用して、正確に96%以上の精度で907錠の錠剤を正確に分類することができた。