2018年3月5日月曜日

<文献検索から>(28) 予測値の不確実性推定を伴う近赤外分光法と部分最小二乗法による水質モニタリング


題名:Monitoring Process Water Quality Using Near Infrared Spectroscopy and Partial Least Squares Regression with Prediction Uncertainty Estimation

著者P. B. Skou, T. A. Berg, S. D. Aunsbjerg, D. Thaysen, M. A. Rasmussen, and F. van den Berg

出典:Applied Spectroscopy 2017, Vol. 71(3) 410–421
膜濾過システムは、乳製品製造のいくつかの工程で使用され、製品および成分の様々なサイズの分子を分離する。膜ろ過技術を使用した乳製品の加工方法は、今後数年で大きく成長すると予測されている。チーズホエイ(Whey)タンパク質は、異なる機能特性を有する広範囲の製品に使用することが出来る。
  <Wheyとは? 全乳または脱脂乳からチーズを作る際に得られる液体。製菓・製パンなどの原料や 家畜飼料として利用される。乳清(にゆうせい)。>
  酪農産業の水使用量は、生産工程または浄化プロセスの下流のプロセス水の効率的な再利用によって大幅に削減できる。 ホエイ及びミルクは、多量の水分を含み、プロセス水の供給源として利用できる可能性がある。しかし、微生物学的な安全性と衛生性は食品や酪農業界にとって非常に重要である。乳糖、尿素、塩類などの有機化合物は逆浸透膜を通過することが報告されている。 プロセス水工程にプロセス分析技術(PAT: Process Analytical Technology)の考え方を適用することにより、リスクを継続的かつリアルタイムに監視することができる。尿素は、逆浸透膜透過液中の主要な化合物としてGC-MS分析によって同定されているが、時間がかかり、測定に労力が必要である。尿素は、近赤外分光法(NIRS)によっても測定可能で、迅速で、労力も少なく、または自動化測定も可能である。
  尿素および乳糖は、水の吸収ピークのはざまのスペクトル範囲20802325nmに特徴的な吸収パターンがある。チーズ製造工程で予想される尿素濃度は100600ppmであり、低濃度と水の吸収ピークの干渉は、検出限界を上げて、予測不確実性を増加させる。 部分最小二乗回帰(PLS)などの多変量モデリング手法は、単変量解析法に比べて予測誤差と検出限界を低くすることができる。PLSに代表される多変量解析法の予測不確実性の信頼できる推定値がなければ、検出限界を確立することはできず、リアルタイムのリスクアセスメントは実現できない。
  リアルタイムモニタリング用の検量線開発をする場合、代表的な下記の2つの方法がある。(1)測定対象となる既知濃度の試薬と測定に潜在的に悪影響を及ぼす溶液を混合し近赤外分析計で測定する。(2)プロセスから収集した実サンプルについてラボで測定し、同時に測定した近赤外分析計のスペクトルと関連付ける。ここでは、酪農プロセス水における尿素濃度予測のための2つの検量線作成法を比較し、予測不確実性を推定する方法を提示する。最後に、NIRSPLSを組み合わせたプロセス水のリアルタイムリスクアセスメントの可能性を示す。
検量線モデルの予測値分散は下記のようにあらわすことが出来る。
 
各サンプル予測値の分散=検量線誤差+モデル誤差+機器誤差+基準値誤差 ……(1)
注)検量線誤差は、モデル、基準値、機器等を含んだ検量線計算結果のバラツキ
  モデル誤差は、検量線の平均二乗誤差から機器誤差と基準値誤差を引いたものと定義。

  プロセス水サンプルは、本格的な生産システムで膜透過液から収集され、可視/紫外分光光度計を用いて340nmでの吸収から濃度測定を行った。ラボサンプルは尿素(9溶液)およびラクトース(3溶液)および脱塩水を様々な比率で組み合わせることによって作成した。ラボサンプルとプロセスサンプルから尿素濃度予測用の2種類の検量線をPLSにより作成した。スペクトルのバラツキは、5回の繰り返し測定スペクトルから平均値に近い3スペクトル及び3日間に測定した同じサンプルの測定スペクトル(ラボサンプルのみ)より計算した。
  ラボサンプルを使用すると何度も繰り返し測定が可能で長期間の再現性を得ることが出来る。一方繰り返し性、再現性が実際のプロセスのものと異なるという危険性がある。プロセスデータでは同じサンプルでも採取日が異なると変成する可能性がある。2つのサンプルから得られた検量線は異なる予測値と不確かさを持つ。検量線作成と検定結果は、検量線の予測誤差はラボサンプルを使用した検量線の方が良い(RMSEC:9.7/10.2ppmLab/Process))が、実プロセスでの検定結果では、プロセスサンプルの方が良い(RMSEP: 13.0/12.1ppmLab/Process))ことを示している。
予測値誤差分散は、(1)式に各誤差を入れて求められた。平均予測誤差(RMSEP)と平均予測不確実性(SPE)を比較すると、プロセスモデルよりラボモデルの方が、差が大きくなった。下表参照

 


RMSEP(ppm)


SPE(ppm)


ラボ


13


15.1


プロセス


12.1


12.4

    原因としては、プロセスサンプルを用いた検証時に予測値が基準値に対し少し偏りを持つためと推測する。SPEは、RMSEPと非常に近いことが分かる。これは、PLSモデルが合理的に作成されていれば、RMSEPSPEを正確に推定できることを示唆している。作成した検量線を限外濾過膜、逆浸透膜、逆浸透膜ポリッシャーの3種の膜を通した後のプロセス水のスペクトルに適用し尿素を測定した。限外濾過膜使用サンプルでは、計算から得られた予測誤差分散を外れることがあったが、その他の濾過膜では予測誤差分散内であった。プロセスモニタリングのための予測モデル構築には、ラボとプロセスサンプルの両方を組み合わせて最良の予測性能が得られることが多い。予測性能向上のためには、ラボサンプルを作り直しプロセスサンプルを長期にわたり収集し追加することで予測性能が向上する。