Выпуск #4/2013
Ю.Каламбет, С.Мальцев
Доверительные интервалы градуировки при взвешенном МНК
Доверительные интервалы градуировки при взвешенном МНК
Просмотры: 2851
Представлена теория построения доверительных интервалов градуировки в случае некоторых вариантов неодинаковых дисперсий ошибок измерений. Описана реализация построения доверительных интервалов в программе "МультиХром". Рассмотрены случаи с постоянной абсолютной и относительной ошибкой измерения и вариант, когда стандартное отклонение пропорционально квадратному корню сигнала. Обсуждаются проблемы построения доверительных интервалов в общем случае неодинаковых (гетероскедастичных) ошибок измерения.
Теги: confidential interval dispersion standard deviation. calibration градуировка дисперсия доверительный интервал стандартное отклонение
Специально оговорим терминологию: в отличие от ГОСТ Р ИСО 11095-2007 [1] мы сознательно используем термин "градуировка", принятый в российской метрологической школе, а не термин "калибровка", пришедший из прямого перевода англоязычной литературы.
При оценке среднего значения случайной величины по ограниченному числу измерений можно построить два доверительных интервала (ДИ): ДИ оценки среднего значения и ДИ распределения. Первый показывает, насколько точно мы оценили среднее, второй указывает, насколько очередное измерение может отличаться от среднего значения. Определение среднего является частным случаем градуировки, при котором число независимых параметров равно нулю.
Аналогично случаю доверительного интервала при определении среднего, у градуировки тоже есть два доверительных интервала, один из которых показывает, насколько точно построена градуировка (аналогично ДИ среднего), другой - доверительный интервал, в который с заданной вероятностью попадает новое измерение (аналогично ДИ распределения). Они отличаются друг от друга на величину ДИ ошибки единичного измерения. Независимые ДИ суммируются как квадратный корень из суммы квадратов. ДИ ошибки единичного измерения считается одинаковым для всех точек и оценивается по этой же градуировке.
При решении обратной задачи (восстановить количество по отклику детектора) приходится искать пересечения прямой, соответствующей отклику, с градуировкой и границами доверительного интервала градуировки (рис.1). Как нетрудно заметить, границы доверительного интервала предсказания становятся несимметричными (граница доверительного интервала градуировки симметрична относительно градуировки по оси Y, но не по оси X). Эта ситуация легко просчитывается на компьютере, но в литературе и даже нормативных документах [2] часто представляют приближенный вариант симметричного доверительного интервала в обратной задаче, полученный из ДИ по оси Y делением на наклон градуировки в соответствующей точке (для линейной градуировки это просто ее коэффициент). Приближенное значение соответствует ситуации, когда границы ДИ параллельны самой градуировке. Чаще всего в литературе изображается градуировка с границами ДИ нового измерения при единичном измерении.
Простейший случай неодинаковой точности измерений – измерения количества вещества в сложной матрице, когда в составе анализируемой пробы достаточно много мешающих измерению веществ. Ошибка единичного измерения может заметно вырасти на их фоне. С другой стороны, параллельные определения заметно уменьшают ДИ измерения. В этом случае необходимо независимо оценивать ДИ отдельного измерения и складывать его с ДИ градуировки, так что граница, соответствующая новому измерению на рис.1, достаточно условна. Не следует забывать, что приводимые в литературе и нормативной документации [2] формулы доверительного интервала при нескольких параллельных определениях относятся к случаю одинакового распределения ошибки в градуировочных и рабочих анализах.
Более запутанной становится ситуация в тех случаях, когда ошибка измерения зависит от величины сигнала. Встречаются ситуации, когда постоянной следует считать, к примеру, относительную ошибку измерения, или когда ошибка пропорциональна квадратному корню сигнала (важнейший пример – масс-спектрометрический детектор). Это обстоятельство оказывает влияние как на градуировку, так и на доверительный интервал.
Для того чтобы метод наименьших квадратов (МНК) работал правильно, необходимо, чтобы все измерения в системе уравнений имели одинаковое стандартное отклонение (СО). В случае, когда СО измерения зависит от величины сигнала, это требование не выполняется. Чтобы устранить возникшую трудность, надо разделить каждое уравнение на стандартное отклонение, соответствующее измеренной величине Y. Решение такой системы уравнений называется взвешенным методом наименьших квадратов. В случае взвешенного МНК можно оценить ДИ построения градуировки, но в общем случае невозможно определить ДИ измерения. Однако имеется частный случай, при котором можно построить оба интервала, когда стандартное отклонение ошибки измерения является функцией величины сигнала. Математическое решение такой задачи приведено во врезке [3].
В программе "МультиХром" принята система статистических весов для дисперсий, а поскольку дисперсия равна квадрату СО, то и веса являются квадратами коэффициентов, на которые делятся уравнения. Используемый набор весовых функций:
МНК без взвешивания (веса всех точек одинаковы);
1/отклик – ошибка пропорциональна корню из отклика (площадь или высота хроматографического пика);
1/отклик2 – ошибка пропорциональна отклику;
1/количество – ошибка пропорциональна корню из количества;
1/количество2 – ошибка пропорциональна количеству.
Для случая прямо пропорциональной градуировки второй и четвертый, а также третий и пятый варианты взвешивания эквивалентны, при этом применение третьего и пятого вариантов аналогично получению среднего коэффициента градуировки.
В версии 3.х программы "МультиХром" взвешивание доступно только в расширенном варианте градуировки, в упрощенном режиме применяется МНК без взвешивания. В предшествующих версиях взвешенный МНК доступен, но доверительный интервал не рассчитывается.
Формулы расчета доверительных интервалов приведены во врезке, реализация расчета ДИ проведена для случая единичного измерения.
Некоторые иллюстрации оценки ДИ нового измерения в разных случаях приведены на рис.2–6. Исходные данные сгенерированы на компьютере в соответствии с видом градуировки и моделью ошибки, уровень доверительной вероятности выбран равным 0,95.
Расчет доверительных интервалов в программе значительно облегчает выбор плана построения градуировки и позволяет аналитику понять, достаточно ли в градуировке точек (и сколько точек нужно добавить, чтобы стало достаточно). Уникальное свойство ПО "МультиХром" – возможность расчета ДИ для неодинаковых дисперсий измерения. Проблема расчета ДИ при неодинаковых дисперсиях измерений актуальна не только в случаях с известной зависимостью дисперсии от величины сигнала. Общее решение этой проблемы нам пока неизвестно, однако несложно предположить, каким оно будет: необходимо делать раздельную оценку ДИ градуировки и измерения, и комбинировать их для получения прочих оценок.
Литература
1. ГОСТ Р ИСО 11095-2007. Линейная калибровка с использованием образцов сравнения.
2. Danzer K., Currie L.A. Guidelines for calibration in analytical chemistry, Part 1. Fundamentals and single component calibration.– Pure and Applied Chemistry. – 1998, v.70, p.993–1014.
3. Себер Дж. Линейный регрессионный анализ/ Перевод с английского под редакцией М.Б.Малютова. – М: Мир, 1980.
При оценке среднего значения случайной величины по ограниченному числу измерений можно построить два доверительных интервала (ДИ): ДИ оценки среднего значения и ДИ распределения. Первый показывает, насколько точно мы оценили среднее, второй указывает, насколько очередное измерение может отличаться от среднего значения. Определение среднего является частным случаем градуировки, при котором число независимых параметров равно нулю.
Аналогично случаю доверительного интервала при определении среднего, у градуировки тоже есть два доверительных интервала, один из которых показывает, насколько точно построена градуировка (аналогично ДИ среднего), другой - доверительный интервал, в который с заданной вероятностью попадает новое измерение (аналогично ДИ распределения). Они отличаются друг от друга на величину ДИ ошибки единичного измерения. Независимые ДИ суммируются как квадратный корень из суммы квадратов. ДИ ошибки единичного измерения считается одинаковым для всех точек и оценивается по этой же градуировке.
При решении обратной задачи (восстановить количество по отклику детектора) приходится искать пересечения прямой, соответствующей отклику, с градуировкой и границами доверительного интервала градуировки (рис.1). Как нетрудно заметить, границы доверительного интервала предсказания становятся несимметричными (граница доверительного интервала градуировки симметрична относительно градуировки по оси Y, но не по оси X). Эта ситуация легко просчитывается на компьютере, но в литературе и даже нормативных документах [2] часто представляют приближенный вариант симметричного доверительного интервала в обратной задаче, полученный из ДИ по оси Y делением на наклон градуировки в соответствующей точке (для линейной градуировки это просто ее коэффициент). Приближенное значение соответствует ситуации, когда границы ДИ параллельны самой градуировке. Чаще всего в литературе изображается градуировка с границами ДИ нового измерения при единичном измерении.
Простейший случай неодинаковой точности измерений – измерения количества вещества в сложной матрице, когда в составе анализируемой пробы достаточно много мешающих измерению веществ. Ошибка единичного измерения может заметно вырасти на их фоне. С другой стороны, параллельные определения заметно уменьшают ДИ измерения. В этом случае необходимо независимо оценивать ДИ отдельного измерения и складывать его с ДИ градуировки, так что граница, соответствующая новому измерению на рис.1, достаточно условна. Не следует забывать, что приводимые в литературе и нормативной документации [2] формулы доверительного интервала при нескольких параллельных определениях относятся к случаю одинакового распределения ошибки в градуировочных и рабочих анализах.
Более запутанной становится ситуация в тех случаях, когда ошибка измерения зависит от величины сигнала. Встречаются ситуации, когда постоянной следует считать, к примеру, относительную ошибку измерения, или когда ошибка пропорциональна квадратному корню сигнала (важнейший пример – масс-спектрометрический детектор). Это обстоятельство оказывает влияние как на градуировку, так и на доверительный интервал.
Для того чтобы метод наименьших квадратов (МНК) работал правильно, необходимо, чтобы все измерения в системе уравнений имели одинаковое стандартное отклонение (СО). В случае, когда СО измерения зависит от величины сигнала, это требование не выполняется. Чтобы устранить возникшую трудность, надо разделить каждое уравнение на стандартное отклонение, соответствующее измеренной величине Y. Решение такой системы уравнений называется взвешенным методом наименьших квадратов. В случае взвешенного МНК можно оценить ДИ построения градуировки, но в общем случае невозможно определить ДИ измерения. Однако имеется частный случай, при котором можно построить оба интервала, когда стандартное отклонение ошибки измерения является функцией величины сигнала. Математическое решение такой задачи приведено во врезке [3].
В программе "МультиХром" принята система статистических весов для дисперсий, а поскольку дисперсия равна квадрату СО, то и веса являются квадратами коэффициентов, на которые делятся уравнения. Используемый набор весовых функций:
МНК без взвешивания (веса всех точек одинаковы);
1/отклик – ошибка пропорциональна корню из отклика (площадь или высота хроматографического пика);
1/отклик2 – ошибка пропорциональна отклику;
1/количество – ошибка пропорциональна корню из количества;
1/количество2 – ошибка пропорциональна количеству.
Для случая прямо пропорциональной градуировки второй и четвертый, а также третий и пятый варианты взвешивания эквивалентны, при этом применение третьего и пятого вариантов аналогично получению среднего коэффициента градуировки.
В версии 3.х программы "МультиХром" взвешивание доступно только в расширенном варианте градуировки, в упрощенном режиме применяется МНК без взвешивания. В предшествующих версиях взвешенный МНК доступен, но доверительный интервал не рассчитывается.
Формулы расчета доверительных интервалов приведены во врезке, реализация расчета ДИ проведена для случая единичного измерения.
Некоторые иллюстрации оценки ДИ нового измерения в разных случаях приведены на рис.2–6. Исходные данные сгенерированы на компьютере в соответствии с видом градуировки и моделью ошибки, уровень доверительной вероятности выбран равным 0,95.
Расчет доверительных интервалов в программе значительно облегчает выбор плана построения градуировки и позволяет аналитику понять, достаточно ли в градуировке точек (и сколько точек нужно добавить, чтобы стало достаточно). Уникальное свойство ПО "МультиХром" – возможность расчета ДИ для неодинаковых дисперсий измерения. Проблема расчета ДИ при неодинаковых дисперсиях измерений актуальна не только в случаях с известной зависимостью дисперсии от величины сигнала. Общее решение этой проблемы нам пока неизвестно, однако несложно предположить, каким оно будет: необходимо делать раздельную оценку ДИ градуировки и измерения, и комбинировать их для получения прочих оценок.
Литература
1. ГОСТ Р ИСО 11095-2007. Линейная калибровка с использованием образцов сравнения.
2. Danzer K., Currie L.A. Guidelines for calibration in analytical chemistry, Part 1. Fundamentals and single component calibration.– Pure and Applied Chemistry. – 1998, v.70, p.993–1014.
3. Себер Дж. Линейный регрессионный анализ/ Перевод с английского под редакцией М.Б.Малютова. – М: Мир, 1980.
Отзывы читателей