Заключение
Сравнение разных методов
Сопоставление различных методов начнем с характеристик $RMSEC$ и $RMSEP$, которые наиболее полно отражают качество моделирования.
На Рис. 44 показаны среднеквадратичные остатки обучения и проверки, вычисленные для различных методов калибровки. Первое, что можно заметить на этих графиках – явное превосходство калибровки на латентных переменных: PCR, PLS и PLS2, перед традиционными подходами. Вторая интересная особенность состоит в том, что, часто, $RMSEP$ больше, чем $RMSEC$. Это типично для правильной калибровки, если только различие между $RMSEP$ и $RMSEC$ не так разительно, как в случае множественной калибровки (MLR) или пошаговой регрессии (SWR) вещества $B$.
На Рис. 45 представлены величины смещений, полученные на обучающей выборке ($BIASC$) и на проверочной ($BIASP$) выборке. Здесь опять мы видим превосходство проекционных методов, которые дают значительно меньшие величины систематических отклонений. Аналогично, почти всегда $BIASC$ меньше, чем $BIASP$, а для UVR и MLR отличие обучения от проверки особенно заметно.
На Рис. 46 показаны величины коэффициентов корреляции между стандартными и оцененными откликами. Видно, что проекционные методы не только дают лучшие значения $R^2$ (ближе к единице), но и, кроме того, представляют правильный баланс между обучением и проверкой.
На Рис. 47 показаны стандартные ошибки в обучении ($SEC$) и в проверке ($SEP$). Из-за того, что в нашем примере все смещения малы по сравнению с $RMSE$, эти графики не добавляют нам новых открытий по сравнению с уже исследованными зависимостями показанными на Рис. 44.
Объясненная дисперсия остатков в обучении ($ERVC$) и в проверке ($ERVP$) для различных методов калибровки веществ $A$ и $B$.
На Рис. 48 слева приведена полная дисперсия остатков в обучении ($TRVC$) и в проверке ($TRVP$), а справа – объясненная дисперсия остатков в обучении ($ERVC$) и в проверке ($ERVP$). На этих графиках мы снова видим те же закономерности, что и ранее – методы калибровки на латентных переменных лучше традиционных. Можно также отметить, что графики $ERV$ неудобны для анализа качества моделирования – на них плохо заметны недостатки или преимущества различных методов.
Выводы
Подведем итоги исследования различных методов калибровки. Итак, мы видели, что:
- калибровка по одному каналу приводит к недооценке – величины $RMSEC$ и $RMSEP$ слишком велики;
- множественная калибровка, напротив, ведет к переоценке – величина $RMSEC$ значительно меньше, чем $RMSEP$;
- наилучшие результаты дает калибровка на латентных переменных (PCR и PLS) – достигается правильный баланс между величинами $RMSEC$ и $RMSEP$.