Классическая калибровка
Классическая калибровка опирается на использовании того же принципа линейности, по которому строились модельные данные:
$$\mathbf{X} = \mathbf{СS}$$
Здесь $\mathbf{X}=\mathbf{X}_c$ и $\mathbf{C}=\mathbf{Y}_c$ – это обучающая часть исходных данных (не центрированных), а $\mathbf{S}$ – это матрица "чистых спектров" (она же матрица чувствительности).
Если матрица $\mathbf{S}$ известна априори, то концентрации определяются так
$$\mathbf{C} = \mathbf{XS}^{+}$$
где $\mathbf{S}^{+} = \mathbf{S}^\mathrm{t}(\mathbf{SS}^\mathrm{t})^{−1}$ – это псевдообратная матрица. Этот случай называется прямой калибровкой. Однако, на практике матрица чистых спектров, как правило, неизвестна и ее приходится восстанавливать из обучающих данных.
Калибровка по одному каналу
Это самый простой, наивный вид калибровки. Если для каждого аналита из всех данных $\mathbf{X}$ выделить один канал (длину волны), то получится несколько векторов $\mathbf{x}$. Тогда, используя обучающие данные, можно построить для каждого вещества простейшую одномерную регрессию –
$$x=sc+b$$
одну для вещества $A$ ($C=C_A$), а другую для $B$ ($C=C_B$). Формулы для оценивания коэффициентов $s$ (наклон)и $b$ (отсечение) можно найти в любом пособии по линейной регрессии, например, здесь. В Excel это проще всего сделать с помощью функции ЛИНЕЙН
(LINEST
). После того, как эти коэффициенты найдены, значения концентраций можно вычислять по уравнению
$$c=(x–b)/s$$
На Рис.14 приведен пример построения двух этих регрессий для каналов 31 ($A$) и 98 ($B$). График показывает, как проходят линии регрессий для веществ $A$ и $B$.
Обратите внимание, что в каждом калибровочном уравнении присутствует свободный член $b$. Это противоречит исходному уравнению, но зато позволяет учесть влияние фона, или, как в нашем случае, присутствие посторонней примеси (вещества $C$). Величины коэффициентов $s$ (наклон) соответствуют значениям "чистых" спектров. На Рис. 15 показаны "чистые" спектры веществ $A$ и $B$ и соответствующие значения коэффициентов $m$.
Для визуальной оценки качества калибровки традиционно используются графики "измерено-предсказано", в которых по оси абсцисс откладываются известные (стандартные) концентрации y, а по оси ординат соответствующие им величины оценок $\hat{y}$, найденные (предсказанные) с помощью построенной калибровки. Такие графики показаны на Рис. 16. Помимо вышеупомянутых данных (точки), на таких графиках обычно показывают линии регрессии $ky+b$. Коэффициенты $k$ (наклон) и $b$ (отсечение) характеризуют "качество" калибровки. В идеальном случае $k=1$ и $b=0$. Чем дальше от идеала, тем хуже калибровка. Кроме того, на таких графиках обычно приводится значение коэффициента корреляции $R^2$ между $y$ и $\hat{y}$.
В Табл. 1 приведены характеристики качества однофакторной калибровки веществ $A$ и $B$, вычисленные в соответствие с формулами раздела 1.4.
Разумеется одномерную калибровку можно проводить по любому каналу. На листе UVR
для этого достаточно изменить значения в ячейках C2
и D2
, которые соответствуют двум каналам – для веществ $A$ и $B$. и проверить как меняется качество калибровки. Так наилучшее значение $RMSEP=0.173$ для вещества $A$ достигается при калибровке по 31 каналу, а наихудшее значение $RMSEP=0.702$ получается при $λ = 97$. Соответственно для вещества $B$ имеем: наилучшее значение $RMSEP=0.151$ для $λ = 98$ и наихудшее $RMSEP=0.611$ для $λ = 20$.
Существует мнение, что калибровку лучше проводить в точке, где соответствующий "чистый спектр" имеет максимум. Из рассмотренного примера видно, что это не так. В точке $λ = 45$ (максимум $A$) $RMSEP=0.205$, а в точке $λ=55$ (максимум $B$) $RMSEP=0.484$.
Метод Фирордта
Впервые задача анализа спектрофотометрических данных была рассмотрена в работе Карла фон Фирордта (Karl von Vierordt) в 1873 г. Исследуя изменения гемоглобина в крови, он предложил метод калибровки, который и теперь, спустя 140 лет, еще очень популярен у некоторых аналитиков.
Метод Фирордта похож на метод одноканальной калибровки. В нем также выбирается по одному каналу для каждого вещества, но регрессионные уравнения рассматриваются не независимо, а совместно
$$\tilde{\mathbf{X}}_\mathrm{c} = \mathbf{Y}_\mathrm{c} \mathbf{S}$$
Здесь матрица $\tilde{\mathbf{X}}_\mathrm{c}$ имеет столько столбцов, сколько определяется веществ (у нас 2), матрица $\mathbf{Y}_\mathrm{c}$ – это известные значения концентраций в обучающем наборе (у нас 2), а матрица $\mathbf{S}$ – это неизвестная квадратная (у нас 2×2) матрица чувствительности, которую нужно оценить. Заметим, что в традиционном методе Фирордта свободный член отсутствует в полном согласии с уравнением $\mathbf{X} = \mathbf{CS}+\mathbf{E}$,
Для оценки матрицы чувствительности $\mathbf{S}$ умножим это уравнение слева на транспонированную матрицу концентраций $\mathbf{Y}_\mathrm{c}$:
$$ \mathbf{Y}^\mathrm{t}_\mathrm{c}\tilde{\mathbf{X}}_\mathrm{c} = \mathbf{Y}_\mathrm{c}^\mathrm{t} \mathbf{Y}_\mathrm{c}\mathbf{S} $$
Тогда матрица –
$$ \hat{\mathbf{S}} = \big( \mathbf{Y}_\mathrm{c}^\mathrm{t} \mathbf{Y}_\mathrm{c} \big)^{-1} \mathbf{Y}_\mathrm{c}^\mathrm{t} \tilde{\mathbf{X}}_\mathrm{c} $$
будет оценкой матрицы чувствительности.
На Рис. 17 показано применение метода Фирордта для модельного примера, где для калибровки выбраны два канала 29 и 100.
График "предсказано-измерено" представляет результаты калибровки сигнала (спектров $\mathbf{x}$) для выбранных каналов. Элементы матрицы чувствительности $\mathbf{S}$ соответствуют значениям матрицы "чистых" спектров. На Рис. 18 показано это соответствие.
Для оценки и предсказания значений концентрации веществ $A$ и $B$. нужно вычислить матрицу обратную к матрице чувствительности $\mathbf{S}$. Сделать это просто, т.к. эта матрица квадратная. Тогда матрица $\mathbf{V}$:
$$\mathbf{V} = \hat{\mathbf{S}}^{-1}$$
будет линейным "оценивателем" матрицы концентраций $\mathbf{Y}$. Для того, чтобы найти оценки величин концентраций в обучающем наборе, надо матрицу $\mathbf{V}$ умножить на матрицу соответствующих спектров $\tilde{\mathbf{X}}_\mathrm{c}$ –
$$\hat{\mathbf{Y}}_\mathrm{c} = \tilde{\mathbf{X}}_\mathrm{c} \mathbf{V}$$
Аналогично, для оценки концентраций в проверочном наборе, матрица $\mathbf{V}$ умножается на $\mathbf{X}_\mathrm{t}$ –
$$\hat{\mathbf{Y}}_\mathrm{t} = \tilde{\mathbf{X}}_\mathrm{t} \mathbf{V}$$
Графики "предсказано-измерено" показаны на Рис. 19
В Табл. 2 приведены характеристики качества калибровки по методу Фирордта веществ $A$ и $B$, вычисленные в соответствие с формулами главы 1.
Качество калибровки сильно зависит от того, какие каналы выбраны в качестве аналитических. Часто рекомендуется действовать таким образом. Строится график $F(λ)= S_A/S_B$ , где $S_A$ и $S_B$ – это "чистые спектры". На нем определяют такие точки $λ_1$ и $λ_2$, в которых разница $|F(λ_1) – F(λ_2)|$ максимальна. Способ правильный, но построить график $F(λ)$, не зная чистых спектров, невозможно.