Заключение

Сравнение разных методов

Сопоставление различных методов начнем с характеристик $RMSEC$ и $RMSEP$, которые наиболее полно отражают качество моделирования.

Fig44
Рис. 44 Среднеквадратичные остатки обучения ($RMSEC$) и проверки ($RMSEP$) в различных методах калибровки веществ $A$ и $B$

На Рис. 44 показаны среднеквадратичные остатки обучения и проверки, вычисленные для различных методов калибровки. Первое, что можно заметить на этих графиках – явное превосходство калибровки на латентных переменных: PCR, PLS и PLS2, перед традиционными подходами. Вторая интересная особенность состоит в том, что, часто, $RMSEP$ больше, чем $RMSEC$. Это типично для правильной калибровки, если только различие между $RMSEP$ и $RMSEC$ не так разительно, как в случае множественной калибровки (MLR) или пошаговой регрессии (SWR) вещества $B$.

Fig45
Рис. 45 Смещение в обучении ($BIASC$) и в проверке ($BIASP$) для различных методов калибровки веществ $A$ и $B$.

На Рис. 45 представлены величины смещений, полученные на обучающей выборке ($BIASC$) и на проверочной ($BIASP$) выборке. Здесь опять мы видим превосходство проекционных методов, которые дают значительно меньшие величины систематических отклонений. Аналогично, почти всегда $BIASC$ меньше, чем $BIASP$, а для UVR и MLR отличие обучения от проверки особенно заметно.

Fig46
Рис. 46 Коэффициенты корреляции в обучении и в проверке для различных методов калибровки веществ $A$ и $B$.

На Рис. 46 показаны величины коэффициентов корреляции между стандартными и оцененными откликами. Видно, что проекционные методы не только дают лучшие значения $R^2$ (ближе к единице), но и, кроме того, представляют правильный баланс между обучением и проверкой.

Fig47
Рис. 47 Стандартные ошибки в обучении ($SEC$) и в проверке ($SEP$) для различных методов калибровки веществ A и B.

На Рис. 47 показаны стандартные ошибки в обучении ($SEC$) и в проверке ($SEP$). Из-за того, что в нашем примере все смещения малы по сравнению с $RMSE$, эти графики не добавляют нам новых открытий по сравнению с уже исследованными зависимостями показанными на Рис. 44.

Fig48
Рис. 48 Полная дисперсия остатков в обучении ($TRVC$) и в проверке ($TRVP$)
Объясненная дисперсия остатков в обучении ($ERVC$) и в проверке ($ERVP$) для различных методов калибровки веществ $A$ и $B$.

На Рис. 48 слева приведена полная дисперсия остатков в обучении ($TRVC$) и в проверке ($TRVP$), а справа – объясненная дисперсия остатков в обучении ($ERVC$) и в проверке ($ERVP$). На этих графиках мы снова видим те же закономерности, что и ранее – методы калибровки на латентных переменных лучше традиционных. Можно также отметить, что графики $ERV$ неудобны для анализа качества моделирования – на них плохо заметны недостатки или преимущества различных методов.

Выводы

Подведем итоги исследования различных методов калибровки. Итак, мы видели, что:

  • калибровка по одному каналу приводит к недооценке – величины $RMSEC$ и $RMSEP$ слишком велики;
  • множественная калибровка, напротив, ведет к переоценке – величина $RMSEC$ значительно меньше, чем $RMSEP$;
  • наилучшие результаты дает калибровка на латентных переменных (PCR и PLS) – достигается правильный баланс между величинами $RMSEC$ и $RMSEP$.