Моделирование в электроэнергетике — Аппроксимация опытных данных. Метод наименьших квадратов
Аппроксимация опытных данных. Метод наименьших квадратов
Аппроксимация опытных данных – это метод, основанный на замене экспериментально полученных данных аналитической функцией наиболее близко проходящей или совпадающей в узловых точках с исходными значениями (данными полученными в ходе опыта или эксперимента). В настоящее время существует два способа определения аналитической функции:
— с помощью построения интерполяционного многочлена n-степени, который проходит непосредственно через все точки заданного массива данных. В данном случае аппроксимирующая функция представляется в виде: интерполяционного многочлена в форме Лагранжа или интерполяционного многочлена в форме Ньютона.
— с помощью построения аппроксимирующего многочлена n-степени, который проходит в ближайшей близости от точек из заданного массива данных. Таким образом, аппроксимирующая функция сглаживает все случайные помехи (или погрешности), которые могут возникать при выполнении эксперимента: измеряемые значения в ходе опыта зависят от случайных факторов, которые колеблются по своим собственным случайным законам (погрешности измерений или приборов, неточность или ошибки опыта). В данном случае аппроксимирующая функция определяется по методу наименьших квадратов.
Метод наименьших квадратов (в англоязычной литературе Ordinary Least Squares, OLS) — математический метод, основанный на определении аппроксимирующей функции, которая строится в ближайшей близости от точек из заданного массива экспериментальных данных. Близость исходной и аппроксимирующей функции F(x) определяется числовой мерой, а именно: сумма квадратов отклонений экспериментальных данных от аппроксимирующей кривой F(x) должна быть наименьшей.
Рис.1. Аппроксимирующая кривая, построенная по методу наименьших квадратов
Метод наименьших квадратов используется:
— для решения переопределенных систем уравнений, когда количество уравнений превышает количество неизвестных;
— для поиска решения в случае обычных (не переопределенных) нелинейных систем уравнений;
— для аппроксимации точечных значений некоторой аппроксимирующей функцией.
Аппроксимирующая функция по методу наименьших квадратов определяется из условия минимума суммы квадратов отклонений расчетной аппроксимирующей функции от заданного массива экспериментальных данных. Данный критерий метода наименьших квадратов записывается в виде следующего выражения:
— значения расчетной аппроксимирующей функции в узловых точках ,
— заданный массив экспериментальных данных в узловых точках .
Квадратичный критерий обладает рядом «хороших» свойств, таких, как дифференцируемость, обеспечение единственного решения задачи аппроксимации при полиномиальных аппроксимирующих функциях.
В зависимости от условий задачи аппроксимирующая функция представляет собой многочлен степени m
Степень аппроксимирующей функции не зависит от числа узловых точек, но ее размерность должна быть всегда меньше размерности (количества точек) заданного массива экспериментальных данных.
∙ В случае если степень аппроксимирующей функции m=1, то мы аппроксимируем табличную функцию прямой линией (линейная регрессия).
∙ В случае если степень аппроксимирующей функции m=2, то мы аппроксимируем табличную функцию квадратичной параболой (квадратичная аппроксимация).
∙ В случае если степень аппроксимирующей функции m=3, то мы аппроксимируем табличную функцию кубической параболой (кубическая аппроксимация).
В общем случае, когда требуется построить аппроксимирующий многочлен степени m для заданных табличных значений, условие минимума суммы квадратов отклонений по всем узловым точкам переписывается в следующем виде:
— координаты узловых точек таблицы;
— неизвестные коэффициенты аппроксимирующего многочлена степени m;
— количество заданных табличных значений.
Необходимым условием существования минимума функции является равенству нулю ее частных производных по неизвестным переменным . В результате получим следующую систему уравнений:
Преобразуем полученную линейную систему уравнений: раскроем скобки и перенесем свободные слагаемые в правую часть выражения. В результате полученная система линейных алгебраических выражений будет записываться в следующем виде:
Данная система линейных алгебраических выражений может быть переписана в матричном виде:
В результате была получена система линейных уравнений размерностью m+1, которая состоит из m+1 неизвестных. Данная система может быть решена с помощью любого метода решения линейных алгебраических уравнений (например, методом Гаусса). В результате решения будут найдены неизвестные параметры аппроксимирующей функции, обеспечивающие минимальную сумму квадратов отклонений аппроксимирующей функции от исходных данных, т.е. наилучшее возможное квадратичное приближение. Следует помнить, что при изменении даже одного значения исходных данных все коэффициенты изменят свои значения, так как они полностью определяются исходными данными.
Аппроксимация исходных данных линейной зависимостью
(линейная регрессия)
В качестве примера, рассмотрим методику определения аппроксимирующей функции, которая задана в виде линейной зависимости. В соответствии с методом наименьших квадратов условие минимума суммы квадратов отклонений записывается в следующем виде:
— координаты узловых точек таблицы;
— неизвестные коэффициенты аппроксимирующей функции, которая задана в виде линейной зависимости.
Необходимым условием существования минимума функции является равенству нулю ее частных производных по неизвестным переменным. В результате получаем следующую систему уравнений:
Преобразуем полученную линейную систему уравнений.
Решаем полученную систему линейных уравнений. Коэффициенты аппроксимирующей функции в аналитическом виде определяются следующим образом (метод Крамера):
Данные коэффициенты обеспечивают построение линейной аппроксимирующей функции в соответствии с критерием минимизации суммы квадратов аппроксимирующей функции от заданных табличных значений (экспериментальные данные).
Алгоритм реализации метода наименьших квадратов
1. Начальные данные:
— задан массив экспериментальных данных с количеством измерений N
— задана степень аппроксимирующего многочлена (m)
2. Алгоритм вычисления:
2.1. Определяются коэффициенты для построения системы уравнений размерностью
— коэффициенты системы уравнений (левая часть уравнения)
— индекс номера строки квадратной матрицы системы уравнений
— индекс номера столбца квадратной матрицы системы уравнений
— свободные члены системы линейных уравнений (правая часть уравнения)
— индекс номера строки квадратной матрицы системы уравнений
2.2. Формирование системы линейных уравнений размерностью .
2.3. Решение системы линейных уравнений с целью определения неизвестных коэффициентов аппроксимирующего многочлена степени m.
2.4.Определение суммы квадратов отклонений аппроксимирующего многочлена от исходных значений по всем узловым точкам
Найденное значение суммы квадратов отклонений является минимально-возможным.
Аппроксимация с помощью других функций
Следует отметить, что при аппроксимации исходных данных в соответствии с методом наименьших квадратов в качестве аппроксимирующей функции иногда используют логарифмическую функцию, экспоненциальную функцию и степенную функцию.
Логарифмическая аппроксимация
Рассмотрим случай, когда аппроксимирующая функция задана логарифмической функцией вида:
Поиск неизвестных коэффициентов осуществляется по методу наименьших квадратов в соответствии со следующей системой уравнений.
Решаем полученную систему линейных уравнений. Коэффициенты аппроксимирующей функции в аналитическом виде определяются следующим образом:
Экспоненциальная аппроксимация
Рассмотрим случай, когда аппроксимирующая функция задана экспоненциальной функцией вида:
Для применения метода наименьших квадратов экспоненциальная функция линеаризуется:
Поиск неизвестных коэффициентов осуществляется по методу наименьших квадратов в соответствии со следующей системой уравнений.
Решаем полученную систему линейных уравнений. Коэффициенты аппроксимирующей функции в аналитическом виде определяются следующим образом:
Степенная аппроксимация
Рассмотрим случай, когда аппроксимирующая функция задана степенной функцией вида:
Для применения метода наименьших квадратов степенная функция линеаризуется:
Поиск неизвестных коэффициентов осуществляется по методу наименьших квадратов в соответствии со следующей системой уравнений.
Решаем полученную систему линейных уравнений. Коэффициенты аппроксимирующей функции в аналитическом виде определяются следующим образом:
Выбор наилучшей аппроксимирующей функции определяется значением среднеквадратического отклонения. В связи с этим следует по методу наименьших квадратов определить несколько аппроксимирующих функций, а затем по критерию наименьшего среднеквадратического отклонения выбрать наиболее подходящую функцию.
Для того, чтобы добавить Ваш комментарий к статье, пожалуйста, зарегистрируйтесь на сайте.
simenergy.ru
Лекция 8. Метод наименьших квадратов
Постановка задачи
Определение вида функциональных зависимостей, получаемых в физическом эксперименте, имеет очень важное значение. Так, в результате эксперимен-
тов часто получают совокупность точек (x1 , y1 )…(xN , yN ), абсциссы которых{xk } различны. Одно из назначений численных методов – определение формулы видаy = f (x), которая связывает эти переменные, точнее – выбор класса допустимых формул, коэффициенты в которых должны быть определены.
Если все численные значения {xk },{yk } известны с несколькими знаками
точности, то интерполяционный полином может быть с успехом использован, иначе это невозможно. В некоторых экспериментах применяется специализированное оборудование, позволяющее получить измеряемые точки, по крайней мере, с пятью знаками точности. Однако большинство экспериментов проводится на оборудовании, которое надежно дает только три или меньше знаков точности. Часто в измерении присутствует экспериментальная ошибка. И хотя
записываются три цифры для значений {xk },{yk }. Подразумевается, что ис-
тинное значение f (xk ) удовлетворяет равенству: |
|
f (xk)= yk+ εk | (8.1) |
где εk – ошибка измерения.
Для определения лучшего приближения функции к полученным точкам, проведем исследование ошибок (также называемыхотклонениями илиос-
татками): |
|
εk = f(xk )− yk , для 1≤ k≤ N. | (8.2) |
Существует несколько норм, которые можно использовать с остатками в (8.2), чтобы измерить, насколько далеко от данных лежит кривая y = f (x).
Максимальная ошибка: | E∞ ( f)= max{ |
|
|
| f (xk )− yk |
| } |
|
|
| (8.3) | |||||||||
|
|
|
|
| ||||||||||||||||
|
|
| 1≤k≤N |
|
|
|
|
|
|
|
|
|
|
|
|
|
| |||
|
|
|
|
|
|
|
|
| ||||||||||||
|
|
| 1 |
| N |
|
|
|
| |||||||||||
Средняя ошибка: | E1 | ( f )= | ∑ |
| f (xk )− yk |
|
|
|
|
| (8.4) | |||||||||
|
|
|
|
| ||||||||||||||||
|
|
|
|
| ||||||||||||||||
|
|
| N | k=1 |
|
|
|
|
|
|
|
| 1 |
| ||||||
|
| ( f )= | 1 | N |
| 2 | 2 | |||||||||||||
Среднеквадратическая ошибка: | E2 | ∑ |
| f (xk )− yk |
|
| (8.5) | |||||||||||||
|
|
| ||||||||||||||||||
|
| |||||||||||||||||||
|
|
| N | k=1 |
|
|
|
|
|
| ||||||||||
|
|
|
|
|
|
|
Рассмотрим это на примере.
Пример 1. Сравнить максимальную, среднюю и среднеквадратичную ошибки для линейного приближения функцииy = f (x)= 8,6 − 1,6 x по за-
данным точкам (−1;10),(0;9),(1;7 ),(2;5),(3;4),(4;3),(5;0) и(6;−1).
51
|
| 12 |
|
|
|
|
| yk |
|
|
|
|
|
|
|
| |
|
| 10 |
|
|
|
|
| f(xk) |
|
| 8 |
|
|
|
|
|
|
|
| 6 |
|
|
|
|
|
|
|
| 4 |
|
|
|
|
|
|
|
| 2 |
|
|
|
|
|
|
|
| 0 |
|
|
|
|
|
|
| -1 | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
|
| -2 |
|
|
|
|
|
|
Рис. 8.1 | График функции y = f (x)= 8,6 − 1,6 x с нанесенными точками |
Найдем ошибки, используя значения функции f (xk ) иεk , полученные в таблице 8.1.
| Вычисления для нахождения E1 ( f ) | и E2 ( f) | Таблица 8.1 | |||||
|
| |||||||
xk | yk | f (xk )= 8,6− 1,6 xk |
|
| εk |
|
| εk2 |
|
| |||||||
|
|
|
| 0,2 |
| |||
-1 | 10 | 10,2 |
| 0,04 | ||||
0 | 9 | 8,6 |
| 0,4 | 0,16 | |||
1 | 7 | 7,0 |
| 0,0 | 0,00 | |||
2 | 5 | 5,4 |
| 0,4 | 0,16 | |||
3 | 4 | 3,8 |
| 0,2 | 0,04 | |||
4 | 3 | 2,2 |
| 0,8 | 0,64 | |||
5 | 0 | 0,6 |
| 0,6 | 0,36 | |||
6 | -1 | -1,0 |
| 0,0 | 0,00 | |||
|
| ∑ |
| 2,6 | 1,40 |
E∞ ( f)= max{0,2;0,4;0,0;0,4;0,2;0,8;0,6;0,0}= 0,8
E1 ( f)= 81 (2,6)= 0,325
E2 |
| 1,4 | 1 2 | ≈ 0 ,41833 | |
( f )= | 8 |
|
| ||
|
|
|
|
|
Ясно, что максимальная ошибка наибольшая и если одна точка плохая, то ее значение определяет E∞ ( f ). Средняя ошибкаE1 ( f ) – просто среднее абсолютных величин ошибок разных различных точек. Она часто используется
52
благодаря простоте вычисления. Ошибку E2 ( f ) часто используют при изуче-
нии ошибок статистической природы.
Наилучшая построенная линия определяется путем минимизации одной из величин, заданных выражениями (8.3) – (8.5). Таким образом, можно найти три наилучшим образом построенные линии. Традиционно выбирается третья нор-
ма E2 ( f ) потому, что ее намного легче минимизировать.
Метод наименьших квадратов
Пусть зависимость между переменными x иy представлена таблицей данных, полученных в эксперименте:
X | x1 | x2 | … | xN |
|
|
|
| yN |
Y | y1 | y2 | … |
Требуется полученные данные описать некоторой функциональной зависимостью вида y = f (x). Такая зависимость должна отразить основную тенденцию изменения переменнойy с изменением переменнойx и сгладить слу-
чайные погрешности измерений, которые неизбежны в эксперименте.
Задача нахождения эмпирической формулы (формулы, служащей для аналитического представления опытных данных) состоит из двух основных этапов.
На первом этапе необходимо установить вид зависимости y = f (x), т.е.
решить |
| является | ли | она линейной | f (x)= a0 + a1 x, | квадратичной | |||||
f (x)=a | 0 | +a | 1 | x+a | 2 | x2, | логарифмической | f (x)=a +a | 1 | ln(x) | или какой-либо |
|
|
|
|
| 0 |
|
|
иной. Для этого экспериментальные точки наносятся на координатную плоскость и по их расположению выдвигают гипотезу о виде эмпирической зависимости.
На втором этапе, когда общий вид эмпирической функции выбран, необходимо определить числовые значения ее параметров a0 , a1 , a2 ,…, an . Критери-
ем выбора значений параметров является метод наименьших квадратов
(МНК).
В методе наименьших квадратов аппроксимирующая функция (полином) строится на основании того, что сумма квадратов невязок по всем точкам должна быть наименьшей. Т.е.:
N |
| N |
|
|
|
|
|
| |
F = ∑δk | =∑( f(xk )− yk )2 min, | (8.6) | |||||||
k=1 | k=1 |
|
|
|
|
|
| ||
где δk – невязки. |
|
|
|
|
|
|
|
|
|
Если взять полином в виде: |
|
|
|
|
|
|
| ||
f (x)=a +a | 1 | x+a | 2 | x2 +…+a | m | xm | , | (8.7) | |
0 |
|
|
|
|
|
| |||
то F= F(a0 ,a1 ,…,am ) |
|
|
|
|
|
|
|
|
|
Заметим, что степень полинома m должна быть меньше числа точекN . (В случаеm = N − 1 получим полином Лагранжа).
53
f (x)=a0 +a1 x
Линейная аппроксимация (интерполяция)
В этом случае m = 1 , тогда аппроксимирующая функция будет иметь вид: (8.8)
Согласно МНК значения ее параметров подбираются таким образом, чтобы отклонение экспериментальных точек (xk ; yk ) от выбранной кривой было минимальным. Т.е. параметрыa0 ,a1 должны быть такими, чтобы сумма квадратов отклонений наблюдаемых значенийyk от рассчитанных по функции
(8.8), была минимальной. Сумма квадратов отклонений от линейной функции (8.8) имеет вид:
| N |
|
| F (a0 , a1 )= ∑(a0 + a1 xk − yk )2 min | (8.9) |
Величина E2 ( f ) | k=1 |
|
будет минимальной тогда и только тогда, когда будет |
минимальной величина (8.9).
Величина F (ao ,a1 ) есть функция двух переменных. Необходимым усло-
вием экстремума такой функции является равенство нулю всех ее частных производных:
|
| ∂F(ao | ,a1 ) | = 0 | ∂F(ao ,a1 ) | = 0 | (8.10) | |
Они имеют вид: |
| ∂a0 | ∂a1 | |||||
|
|
|
| |||||
∂F(a0 , a1 ) |
|
|
|
|
|
| ||
| N |
|
|
| ||||
| = 2∑(a0 +a1 xk −yk )=0 |
|
| |||||
∂a0 |
|
| ||||||
| k=1 |
|
| (8.11) | ||||
| ∂F(a0 , a1 ) | N |
|
| ||||
|
|
|
| = 2∑(a0+ a1xk− yk) xk= 0 |
| |||
∂a1 |
| |||||||
| k=1 |
|
|
|
Таким образом, после преобразования имеем нормальную систему двух линейных уравнений относительно неизвестных параметров регрессииa0 ,a1 .
|
| N | N |
|
|
a0 N | + a1∑xk= | ∑yk |
| ||
|
| k=1 | k= | 1 | (8.12) |
| N | N |
| N | |
a0∑xk+ a1∑xk2 = ∑ykxk |
| ||||
| k=1 | k=1 |
| k=1 |
|
Решение системы – значение параметров a0 ,a1 можно найти методом обратной матрицы1. Представим систему (8.12) в матричной форме:
N |
|
|
|
|
| N |
|
|
∑xk | a |
|
| ∑yk |
| или | ||
k=1 |
|
| a | 0 |
| = k=1 |
| |
N |
|
| 1 | N |
|
| ||
∑xk2 |
|
| ∑yk | xk |
| |||
k=1 |
|
|
|
|
| k=1 |
|
|
1 Основы работы с матрицами в MS Excel представлены в приложении 1
54
studfiles.net
Аппроксимация полиномов n степени методом наименьших квадратов
Библиографическое описание:
Селютин А. Д. Аппроксимация полиномов n степени методом наименьших квадратов // Молодой ученый. 2018. №16. С. 91-96. URL https://moluch.ru/archive/202/49571/ (дата обращения: 24.06.2019).
Вданной статье рассмотрено решение проблемы уменьшения суммы квадратов отклонений определённых функций от искомых переменных для полиномиальных уравнений n степени. Приведено подробное решение для уравнений 2 степени, рассматриваемой проблемы. Представлена рабочая программа.
Ключевые слова: метод наименьших квадратов, полиномы, полиномиальная регрессия, оконное приложение.
Метод наименьших квадратов — один из методов статистики, имеющий различное практическое применение, в основе которого лежит минимизация суммы квадратов отклонений функций от подлежащих нахождению переменных [4].
История создания.
Одной из основных задач, для решения которой применяется метод наименьших квадратов, является решение систем линейных уравнений, в которых число неизвестных переменных меньше, чем число уравнений. Впервые, метод был применён в 1796 году Фридрихом Гауссом, а в 1805 году Адриен Лежандр опубликовал метод под насущным названием. Метод в дальнейшем был доработан и улучшен [4].
Суть метода.
Допустим, что x — группа nнеизвестных переменных: –набор функций от группы переменных. Целью является подбор таких x, чтобы значения функций были близки к yi [3]. Следовательно, суть метода наименьших квадратов может быть выражена следующей формулой:
Полиномиальная регрессия.
Допустим, что имеется nзначений переменной yи соответствующих переменных x. Необходимо аппроксимировать корреляцию между yи xопределённой функцией f(x,a), где a–известные параметры.
В случае, когда имеется некоторая полиномиальная регрессионная зависимость, например: можно определить параметры системы, учитывая, что а также
Тогда, матричные уравнения будут иметь следующий вид:
Цель работы.
Целью проводимой работы является вывод рабочих формул, минимизирующих сумму квадратов отклонений полиномиальной функции 2 степени, а также создание практической программы, позволяющей находить коэффициенты квадратичной функции и полинома nстепени. Приложение будет являться оконным (будет предусмотрена возможность построения графика по заданным точкам).
Математическое решение проблемы для полиномов 2 степени.
Пусть дан полином второй степени вида:
Пусть задана функция
Тогда: (двойку можно сократить)
В итоге имеем: (Преобразуем к виду (1) см. ниже)
Тогда: (двойку можно сократить)
В итоге имеем: (Преобразуем к виду (2) см. ниже)
Тогда: (двойку можно сократить)
В итоге имеем: (Преобразуемк виду (3) см. ниже)
Составим систему линейных уравнений:
Решим систему. Найдём определитель системы:
Найдём первый частный определитель системы:
Найдём второй частный определитель системы:
Найдём третий частный определитель системы:
, b=, c=.
Решение проблемы для полиномов n степени.
Пусть дан полином вида: , где , а длина отрезка известных нам значений [2].
Необходимо найти такие параметры , чтобы сумма квадратов отклонений от в точках была минимальной, то есть
Задача сводится к решению системы уравнений:
Для решения будем использовать метод Гаусса. Результат решения системы можно наблюдать в работе оконного приложения на языке программирования C#.
Программа
Оконное приложение на языке программирования C# для определения коэффициентов аппроксимации полиномов nстепени.
Основная работа программы приходится на обработчик нажатия кнопки вычислить. Считывается степень полинома. Вычисляется кол-во точек. Далее по заданным точкам заполняется матрица сумм. Далее матрица сумм приводится к такому виду, чтобы на главной диагонали не было нулей. Высчитываются коэффициенты аппроксимации.
Программа позволяет импортировать данные из текстового файла, строить график получившейся функции и сохранять его в формате.png, экспортировать в текстовый файл получившиеся коэффициенты.
Оконные формы приложения:
Рис. 1. Оконное приложение, реализующее метод наименьших квадратов для полиномиальных уравнений n степени.
Рис. 2. Полученный график, аппроксимированной функции.
Программа доступна к использованию по ссылке: https://yadi.sk/d/G9WiaoGe3UYqsJ
Вывод
В ходе работы были выведены рабочие формулы, минимизирующие сумму квадратов отклонений полиномиальной функции второй и n-ой степени, а также была создана практическая программа, позволяющая находить коэффициенты аппроксимируемой функции.
Разработанная программа может применяться при расчётах в эконометрике для наглядного определения зависимостей одних зависимостей от других, также в оценке параметров однофакторной эконометрической модели и других областях науки.
Литература:
- Письменный Т.Д — Конспект лекций по высшей математике
- NetBeansURL: https://netbeans.org/ (Дата обращения: 5.4.18).
- Аппроксимация функций полиномом методом наименьших квадратов.URL: http://www.alexeypetrov.narod.ru/C/sqr_less_about.html (Дата обращения: 6.4.18)
- Материал из Википедии — свободной энциклопедии. Метод наименьших квадратов. URL: https://ru.wikipedia.org/wiki/Метод_наименьших_квадратов (Дата обращения: 6.4.18).
Основные термины (генерируются автоматически): оконное приложение, частный определитель системы, сумма квадратов отклонений, вид, практическая программа, полиномиальная функция, полиномиальная регрессия, матрица сумм, квадрат, язык программирования.
moluch.ru
Как пользоваться сервисом «Метод Наименьших Квадратов» · Как пользоваться Контрольная Работа РУ
Расскажу, как пользоваться сервисом «Метод наименьших квадратов» онлайн.Линейная аппроксимация МНК
Допустим вам даны данные эксперимента: и вы хотите произвести линейную аппроксимацию на прямую (нелинейная тут) с доверительной вероятностью p=0,95. Чтобы воспользоваться данным сервисом, нужно подготовить данные эксперимента, а именно перенести эти данные в файл программы excel с расширением xls. Пример файла можно скачать тут. Все, данные подготовлены, нажимаем кнопку «Аппроксимировать». перейти к сервису: >> здесь << Результат для приведенного примера будет таким:Сделаем линейную аппроксимацию методом наименьших квадратов для данных.
Попытаемся представить данные в виде y = a*x + b.
xi | yi | xi — x | (xi — x)2 | yi — y | (xi — x)(yi — y) | |
---|---|---|---|---|---|---|
1.0 | 1.1 | -2.0 | 4.0 | -0.41 | 0.82 | |
2.0 | 1.3 | -1.0 | 1.0 | -0.21 | 0.21 | |
3.0 | 1.5 | 0.0 | 0.0 | -0.01 | 0 | |
4.0 | 1.7 | 1.0 | 1.0 | 0.19 | 0.19 | |
5.0 | 1.95 | 2.0 | 4.0 | 0.44 | 0.88 | |
Сумма | 15.0 | 7.55 | 10.0 | 2.1 |
где x = (1.0 + 2.0 + 3.0 + 4.0 + 5.0)/5 = 15.0/ 5 = 3.0,
y = (1.1 + 1.3 + 1.5 + 1.7 + 1.95)/5 = 7.55/ 5 = 1.51,
a = ∑(xi — x)(yi — y)/∑(xi — x)2 — суммы i=1 до 5, зн. из таблицы
Посчитаем среднеквадратичные ошибки определения a и b:
т.к. Sa2 = ∑[(yi — a*xi — b)2]/(n — 2)/∑[(xi — x)2],
то Sa = √0.001/(5 — 2)/10.0 = 0.0057735026919
т.к. Sb2 = ∑[(yi — a*xi — b)2]/(n — 2)*(1/n + (x)2/∑[(xi — x)2]),
то Sb = √0.001/(5 — 2)*(1/5 + 3.02/10.0) = 0.0191485421551
При доверительной вероятности p=0.95: абсолютные ошибки определения a и b:
При такой вероятности p и количестве измерений n=5 кол-во степеней свободы f=4, зн. коэффициент Студьента (таблица) равен t=2.7764451052, тогда:
абсолютные ошибки для a и b:
Δa = t*Sa = 2.7764451052*0.0057735026919 = 0.0160298132888
Δb = t*Sb = 2.7764451052*0.0191485421551 = 0.0531648761383
Последний знак у a после запятой по счёту — 2й, значит у Δa оставляем 3 знаков после запятой
Последний знак у b после запятой по счёту — 2й, значит у Δb оставляем 3 знаков после запятой
Поэтому аппроксимация будет выглядеть так:
y = a*x + b, гдеa = 0.21 ± 0.016
b = 0.88 ± 0.053;
Нелинейная аппроксимация
Есть ещё обобщённый метод наименьших квадратов, который позволяет аппроксимировать до нелинейных функций. Им тоже можно воспользоваться по ссылке >> здесь << только нужно выбрать методОбобщенный (нелинейный)Если ввести такие данные как эти и указать нелинейную функцию k1/(x^k2)*sin(k3*x), то получиться такой результат:
Найденные аппроксимированные параметры:
- k1 = 1.62408905511
- k2 = 0.228873651613
- k3 = 1.98234923393
Получается график функции:
f(x) = k1/(x^k2)*sin(k3*x) = 1.62408905511498*x^(-0.228873651613201)*sin(1.98234923393379*x)
www.kontrolnaya-rabota.ru
6.6. Линейная аппроксимация по мнк
Пусть зависимоcть y от x задана в дискретной форме: {x1, y1; x2,y2; … xn,yn}. По этим данным можно построить такую аппроксимирующую функцию, график которой будет располагаться между узлами интерполяции близко к ним, но не обязательно точно проходить через все узлы. Такая зависимость носит сглаживающий характер и строится, например, для того, чтобы описать экспериментальные данные с помощью функции заданного вида. Необходимо определить лишь параметры этой функции. Для решения такой задачи используется метод наименьших квадратов — МНК. Его суть заключается в минимизации полной квадратичной невязки между построенной функцией и значениями yi в узловых точках:
где F(x) – искомая аппроксимирующая функция.
Часто в качестве приближения, строящегося по МНК, берутся полиномы степени l, , гдеl<n-1. В простейшем случае строится полином первой степени, т.е. линейная функция: F(x) =ax+b. Коэффициенты a и b находятся с помощью метода наименьших квадратов по следующим формулам:
, .
Для нахождения коэффициентов, можно использовать стандартные функции системы MathCAD и Excel.
В MathCAD имеется функция line(vx, vy), которая возвращает линейные коэффициенты по значениям векторных аргументов vx и vy.
В Excel имеется функция ЛИНЕЙН, у которой также имеются два аргумента, состоящих из диапазонов ячеек. На первом месте диапазон ячеек соответствующий ординате. После ввода этой функции (например, «=ЛИНЕЙН(F10:F12;E1:E3)» ) выводится только один линейный коэффициент. Для вывода обоих коэффициентов необходимо выделить две ячейки (включая первую слева) потом нажать «F2», а затем комбинацию клавиш «crtl», «shift», «enter».
Лабораторная работа №8
Используя исходные данные из предыдущей работы, построить линейную функцию по методу наименьших квадратов. Вычислить полную квадратичную невязку полученной функции. Вычислить значение функции при заданном значении аргумента.
Физическая задача №3
Полагаем, что измерение интенсивности радиоактивного распада было выполнено для (К+1) моментов времени с заданным интервалом времени . Эти измерения дали таблицу, состоящую из К+1 (К=3-5) значений количества распадовдля моментов времени.
Используя метод наименьших квадратов, определить константу распада, период полураспада и значение суммы квадратов невязок.
Знание закона радиоактивного распада
(1)
подсказывает вычислить значения и использовать метод наименьших квадратов для величин, отыскивая параметры линейной зависимости. Тангенс угла наклона линейной зависимости определяет константу радиоактивного распада.
В отчете должен быть представлен график прямой вместе с экспериментальными точками. Заметим, что закон радиоактивного распада является вероятностным и выполняется сравнительно точно для больших значений. Периоды полураспада радиоактивных изотопов изменяются в очень широких пределах. Например, период полураспада изотопа азота равен 10 минутам, а период полураспада изотопа хлора 300 000 лет [1]. В заданиях период полураспада равен часам (и ответ следует выдавать в часах).
Из определения периода полураспада следует его связь с постоянной распада:
. (2)
Параметры задачи преподаватель выдает студенту по аналитическим формулам
, .
В этих формулах — номер студента в группе, а— номер измерения (, время в этой формуле измеряется в часах. Между номером студента и периодом полураспада имеется линейная зависимость.
В отчете показать вывод уравнений, позволяющих решить задачу, график с прямой в логарифмическом масштабе для и экспериментальными точками, выписать значения постоянной распада и времени полураспада в часах.
275
studfiles.net
2.3. Аппроксимация линейной комбинацией функций.
Mathcad предоставляет пользователям встроенную функцию linfit для аппроксимации данных по методу наименьших квадратов линейной комбинацией произвольных функций.
Функция linfit(x, y, F) имеет три аргумента:
вектор x – x–координаты заданных точек,
вектор y – y–координаты заданных точек,
функция F – содержит вектор столбец функций, который будет использоваться для построения их линейной комбинации.
Задаем функцию F (аппроксимирующая функция ищется в виде F(x)=:
Построим аппроксимирующую функцию:
Вычислим стандартное отклонение
:
Графики аппроксимирующего полинома функции и данных аппроксимации :
2.4. Аппроксимация функцией произвольного вида.
Теперь построим аппроксимирующую функцию дробно–рационального типа f(x)= — ax/(b+x3).
Для этого воспользуемся функцией genfit(x,y,v,F ) , с помощью которой вычисляем коэффициенты аппроксимирующей функции .
Функция имеет следующие параметры:
x, y – векторы, содержащие координаты заданных точек,
F(x,u) – функция, задающая искомую функциональную n–параметрическую зависимость и частные производные этой зависимости по параметрам.
u — вектор столбец искомых коэффициентов .
v – вектор, задающий начальные приближения для поиска козффициентов.
— вектор столбец искомых коэффициентов.
Поскольку нулевой элемент функции F содержит искомую функцию, определяем функцию следующим образом:
Вычисляем среднее квадратичное отклонение
3. Метод наименьших квадратов.
Функция y=f(x) задана таблицей значений в точках.
Используя метод наименьших квадратов (МНК), найти многочлен наилучшего среднеквадратичного приближения оптимальной степениm=m*.
За оптимальное значение m* принять ту степень многочлена, начиная с которой величина стабилизируется или начинает возрастать.
ПОРЯДОК(алгоритм) РЕШЕНИЯ :
1. Задать векторы x и y исходных данных.
2. Используя функцию mnk (см. ниже пример решения в среде Mathcad ), найти многочлены Pm, m=0,1,2,…, по методу наименьших квадратов.
Вычислить соответствующие им значения .
3. Построить гистограмму зависимости отm, на основании которой выбрать оптимальную степень m* многочлена наилучшего среднеквадратичного приближения.
4. На одном чертеже построить графики многочленов Pm, m=0,1,2,…, m*, и точечный график исходной функции.
Пример решения в среде Mathcad .
Векторы исходных данных:
Функция mnk, строящая многочлен степени m по методу наименьших квадратов,
возвращает вектор a коэффициентов многочлена:
Входные данные :
x, y — векторы исходных данных;
n+1 — размерность x,y.
Вычисление коэффициентов многочленов степени 0,1,2,3 по методу наименьших квадратов:
Построение функции P , которая возвращает значение многочлена степени m в точке t (многочлен задается с помощью вектора коэффициентов a) :
Функция возвращает значение среднеквадратичного уклонения многочлена P(a,m,t) :
Вычисление значений , где m=0,1,2,3 :
Гистограмма
Вывод:
оптимальная степень m*=2;
многочлен наилучшего среднеквадратичного приближения:
P2(x)=-1.102+1.598x+0.717.
Графики многочленов степени 0,1,2 и точечный график исходной функции:
studfiles.net
Лекция № 3. Аппроксимация функций. Метод наименьших квадратов.
1. Интегральное среднеквадратичное приближение функций ортогональными многочленами.
Пусть на отрезке задана функцияи определена система функций
Обобщённым полиномом (многочленом) порядка (степени) nназывают функцию вида
, где- некоторые постоянные.
Обобщённый многочлен называют многочленом наилучшего среднеквадратического приближения функциина отрезке, если расстояние от многочлена до данной функции по среднеквадратичной норме (среднеквадратичное отклонение) является наименьшим. Иначе говоря, выполняется условие:
— наименьшее.
Задачу о нахождении такого многочлена называют задачей об интегральном среднеквадратичном приближении (аппроксимации) функциина отрезкеобобщённым многочленом. Эта задача сводится к нахождению коэффициентовиз условия (1).
Если функция и система функцийопределены на множестве точек, то приближение функциимногочленомназывают точечным среднеквадратичным приближением на множестве точек. При этом для обобщённого многочлена наилучшего приближениясреднеквадратичное отклонениена системе точек.
Задача нахождения многочлена наилучшего приближения функциина отрезкеупрощается, если система функцийобладает свойством ортогональности на данном отрезке.
Введём сначала ряд определений.
Определение 1. Скалярным произведением функций ина отрезкеназывается определённый интеграл от их произведения на этом отрезке. Обозначим скалярное произведение, каки запишем:
.
Определение 2. Нормой функции на отрезкеназывается число. Функция, для которой существует интеграл, называется интегрируемой с квадратом на отрезке.
Определение 3. Функции иназываются ортогональными на отрезке, если их скалярное произведение на этом отрезке равно нулю, то есть
.
Определение 4. Система функций называется ортогональной на отрезке, если все функции этой системы попарно ортогональны на этом отрезке.
Коэффициенты обобщённого многочлена
называются коэффициентами Фурье функции относительно ортогональной системы функций, если они определяются по формулам
Теорема. Для любой функции, интегрируемой с квадратом на отрезке, обобщённый многочленп-го порядкас коэффициентами Фурье функцииотносительно ортогональной на отрезкесистемы функцийявляется многочленом наилучшего среднеквадратичного отклонения этой функции, причём квадрат наименьшего среднеквадратичного отклонения определяется соотношением
, где— коэффициенты Фурье, определяемые по формулам (3).
2. Метод наименьших квадратов. Эмпирические формулы.
Пусть данные некоторого эксперимента представлены в виде таблицы значений переменных х иу.
Можно поставить задачу об отыскании аналитической зависимости между переменными, то есть некоторой формулы , явным образом выражающей зависимостьу отх. Естественно требовать, чтобы график искомой функцииизменялся плавно и не слишком уклонялся от экспериментальных точек. Поиск такой функциональной зависимости называют “сглаживанием” экспериментальных данных.
Задачу о сглаживании экспериментальных данных можно решать методом наименьших квадратов. Согласно методу наименьших квадратов, указывается формула
,
где — числовые параметры.
Наилучшими значениями параметров (которые обозначим) считаются те, для которых сумма квадратов уклонений функцииот экспериментальных точекявляется минимальной, то есть функция
в точке () достигает минимума. Отсюда, используя необходимые условия экстремума функции нескольких переменных, получаем систему уравнений для определения параметров:
.
Если система (6) имеет единственное решение , то оно является искомым и аналитическая зависимость между экспериментальными данными определяется формулой. Заметим, что в общем случае эта система нелинейна.
Рассмотрим подробнее аппроксимирующие зависимости с двумя параметрами: . Используя соотношения (6) и опуская несложные выкладки, получим систему двух уравнений с двумя неизвестнымии:
.
В частном случае аппроксимации экспериментальных данных с помощью линейной функции имеем:
.
Система (7) для этого случая является линейной относительно неизвестных и:
.
Если для переменных х иу соответствующие значения экспериментальных данныхне располагаются вблизи прямой, то выбирают новые переменные
так, чтобы преобразованные экспериментальные данные в новой системе координатдавали бы точкименее уклоняющиеся от прямой. Для аппроксимирующей прямойкоэффициенты можно определить из уравнений (8), где вместоиподставляют соответствующие значенияи. Нахождение зависимостей (9) называют, выравниваем экспериментальных данных. Функциональная зависимостьопределена неявно уравнениемразрешимым относительноу в частных случаях.
Пример 1.Установить вид эмпирической формулы, используя аппроксимирующие зависимости с двумя параметрамии, и определить наилучшие значения параметров, если опытные данные представлены таблицей:
1 | 2 | 3 | 4 | 5 | |
7,1 | 27,8 | 62,1 | 110 | 161 |
Решение.
Легко заметить, что экспериментальные точки лежат приблизительно на одной прямой. Положими составим таблицу для экспериментальных данных в новых переменных:
0,000 | 0,693 | 1,099 | 1,386 | 1,609 | |
1,960 | 3,325 | 4,129 | 4,700 | 5,081 |
Точки лежат приблизительно на одной прямой, в чём легко убедиться, построив их в системе координат. Наилучшие значения параметровинаходятся из системы уравнений (8):
.
Решив эту систему, получим: . Неявное уравнение, выражающее связь между переменнымииимеет вид. Отсюда легко получить прямую зависимость между переменными в виде степенной функции:
.
Для сравнения можно привести таблицу экспериментальных данных, и данных, полученных с помощью найденной формулы:
1 | 2 | 3 | 4 | 5 | |
7,1 | 27,8 | 62,1 | 110 | 161 | |
. | 7,16 | 27,703 | 61,081 | 107,04 | 165,39 |
Формула, полученная в результате решения приведённого примера, является частным случаем аппроксимирующей зависимости с двумя параметрами, имеющей вид . Параметры этой зависимости можно было бы найти из системы нелинейных уравнений (7) непосредственно, однако применение способа выравнивания существенно упрощает вычисление параметров. В данном случае.
Рекомендации по переведению экспериментальных данных в аппроксимирующие зависимости с двумя переменными приведены в следующей таблице.
№ | Выравнивание данных (преобразование переменных) | Эмпирическая формула |
1 | ||
2 | ||
3 | ||
4 | ||
5 | ||
6 |
Одну из шести предложенных формул преобразования следует выбирать одновременно с проверкой линейной зависимости к исходным данным. Условием выбора наилучшей эмпирической формулы является наименьшее уклонение исходных или преобразованных экспериментальных данных от прямой. Его можно определить по формуле:
.
Для наилучшей эмпирической формулы значение будет наименьшим.
Задание.
Экспериментальные данные содержатся в таблицах. Для каждой из них выполнить следующие операции:
Нанести экспериментальные точки на координатную сетку.
Выбрать одну из шести предложенных формул преобразования к новым переменным так, чтобы преобразованные экспериментальные данныенаименее уклонялись от прямой.
Методом наименьших квадратов найти наилучшие значения параметров
и в уравнении прямой.
Найти явный вид эмпирической формулы и построить график эмпирической функции.
а)
1 | 2 | 3 | 4 | 5 | |
1,1 | 1,4 | 1,6 | 1,7 | 1,9 |
б)
1 | 2 | 3 | 4 | 5 | |
1,05 | 1,55 | 1,7 | 1,75 | 1,8 |
в)
1 | 2 | 3 | 4 | 5 | |
7,5 | 6,2 | 5,5 | 3,5 | 3,0 |
г)
1 | 2 | 3 | 4 | 5 | |
0,4 | 0,55 | 0,13 | 0,09 | 0,07 |
studfiles.net