Понедельник, Июль 5th, 2010

Шпоры по ТВ

Data Mining переводится как «добыча» или «раскопка данных». Нередко рядом с Data Mining встречаются слова «обнаружение знаний в базах данных» (knowledge discovery in databases) и «интеллектуальный анализ данных». Их можно считать синонимами Data Mining. Возникновение всех указанных терминов связано с новым витком в развитии средств и методов обработки данных. Традиционная математическая статистика, долгое время претендовавшая на роль основного инструмента анализа данных, откровенно спасовала перед лицом возникших проблем. Главная причина — концепция усреднения по выборке, приводящая к операциям над фиктивными величинами (типа средней температуры пациентов по больнице, средней высоты дома на улице, состоящей из дворцов и лачуг и т.п.). Методы математической статистики оказались полезными главным образом для проверки заранее сформулированных гипотез (verification-driven data mining) и для “грубого” разведочного анализа, составляющего основу оперативной аналитической обработки данных (online analytical processing, OLAP). В основу современной технологии Data Mining (discovery-driven data mining) положена концепция шаблонов (паттернов), отражающих фрагменты многоаспектных взаимоотношений в данных. Эти шаблоны представляют собой закономерности, свойственные подвыборкам данных, которые могут быть компактно выражены в понятной человеку форме. Поиск шаблонов производится методами, не ограниченными рамками априорных предположений о структуре выборке и виде распределений значений анализируемых показателей.

48. Понятие экономического временного ряда и его составляющие. Тренд динамического ряда. Способы выявления тренда. Построение моделей временных рядов в Excel.
Большое количество данных в экономике, коммерции, технике и т.д. можно представить в виде временных рядов. Определим дискретный временной ряд как последовательность измерений значений переменной (процесса) за определенный период через одинаковые промежутки времени:
Z1, Z2, Z3, … Zt, … Zn (*)
Последовательные наблюдения в (*) обычно зависимы. С детерминистской точки зрения (*) можно представить как: Zt=f(t)+?t, где t=1, 2, …, n;
f – гладкая (непрерывная и дифференцируемая) функция, характеризующая долгосрочное движение в зависимости от времени – тренд;
?t — случайный ряд возмущений, наложенный на систематическую часть. Такой подход, несмотря на заслуженную критику, используется и в настоящее время.
Анализ временных рядов преследует => цели:
1.описание поведения ряда;
2.построение модели для объяснения наблюдений;
3.п. 1 и 2 используют для прогноза, исходя из предположения, о сохранении тенденции развития в будущем.
Для достижения поставленных целей используют модели, основанные на детерминистском, стохастическом, спектральном и других подходах. В общем случае можно предположить в модели наличие => компонент:
1.тренд или долгосрочное колебание;
2.регулярное движение относительно тренда;
3.сезонная компонента;
4.остаток.

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Категория: Шпоры

Один комент

09.09.2010
Дмитрий

Прикольно. А я чёто не дадумался шпоры у себя выложить..
Молодцы!