Шпоры по ТВ
|
y=a+bx, где y – зависимая (результативная) переменная, х – независимая (факторная) переменная.
Пусть переменная x задается точно (без ошибок), тогда отклонение наблюдений yi от зависимости y=a+bx является случайным и параметры a и b можно найти из условия минимизации суммы квадратов ошибок ?i=yi–a–bxi
n
S= ??i2? min,
i=1
n
S= ?( yi–a–bxi)2? min,
i=1
Рассмотрим функцию двух переменных
n
S(а, b)= ?( yi–a–bxi)2,
i=1
найдем ее минимум:
?S(a,b)
=0
?a
?S(a,b)
=0
?b
Имеем
2?(yi-a-bx)(-1)
=0
2?(yi-a-bx)(-xi)
=0
После преобразований получим:
n
na+b?xi
i=1
n
=?yi
i=1
n n
a?+b?xi2
i=1 i=1
n
=?xiyi
i=1
Эта система носит название системы нормальных уравнений Гаусса, т.к. получена из условия минимизации суммы квадратов отклонении, в предположении, что xi – фиксированы, т.е. отклонения перпендикулярны оси ОХ.
Решив систему относительно a и b получим искомое уравнение зависимости, которое носит название регрессии Y на Х.
Аналогично, предположив, что искомая зависимость имеет вид x=c+dy, где значения yi – фиксированы, мы получим уравнение регрессии X на Y.
Если X и Y – система двух нормально распределенных случайных величин, то преобразуя систему Гаусса (см. выше), уравнение регрессии Y на Х можно записать
y -?y= r
?y
(x-?x)
?x
Соответственно уравнение регрессии X на Y имеет вид
х -?х= r
?х
(y-?y)
?y
55. Data Mining – интеллектуальный анализ данных.
Прикольно. А я чёто не дадумался шпоры у себя выложить..
Молодцы!