Статистика


Методы спектрального анализа



Методы спектрального анализа особенно важны для определения скрытых периодичностей в данных.
Пусть, например, имеется временной ряд изменения индекса РТС:
Методы спектрального анализа

Проведем преобразование ряда: возьмем первую разность D(-1) и откроем диалог Spectral (Fourier) analysis — Спектральный (Фурье) анализ.
Методы спектрального анализа

Следующие графики спектральной плотности строятся несколькими щелчками мыши:

Методы спектрального анализа

Многомерное шкалирование



Откройте модуль Многомерное шкалирование из переключателя модулей STATISTICA, который вызывается после нажатия кнопки Пуск в Windows.
Многомерное шкалирование
Создайте файл данных и запустите процедуру обработки, как показано на рисунке внизу.
Модуль многомерного шкалирования — единственный модуль системы, который работает не с исходными данными, а с матрицами: корреляционной или матрицей близости. Впрочем, к этим матрицам всегда легко перейти от исходных данных.
Многомерное шкалирование

После нажатия кнопки ОК система произведет вычисления и следующее окно результатов появится на экране:
Многомерное шкалирование

Нажмите теперь на кнопку Graph final configuration, 2D в окне и вы увидите двумерный график, где отчетливо видны несколько групп близких акций:

Многомерное шкалирование

Теперь трудно обозримая матрица представлена на плоскости и легко “читается”.
Этот график — то, за что идет борьба в многомерном шкалировании: набор многомерных данных представлен ясно и отчетливо.

Статистика - Технический анализ данных




Технический анализ — это исследование динамики рынка с целью прогнозирования будущего.
Как замечает Джон Дж. Мэрфи в книге “Технический анализ фьючерсных рынков”, трейдеру главное поймать тенденцию рынка и следовать ей, используя в своих целях: если вы поймали тенденцию, вы на коне, нет, — выброшены из седла. Но весь вопрос в том, как поймать тенденцию?
Поймать тенденцию на рынке не проще, чем поймать ветер в парус или волну в виндсерфинге. Чтобы убедиться в этом достаточно открыть любой информационный финансовый бюллетень, — будь то итоги торгов на биржах или новости внебиржевого рынка, — количество цифр поражает воображение. Как действовать в такой ситуации?
На помощь приходит наука статистика и система STATISTICA, реализующая в среде Windows апробированные средства статистического анализа.
На первом этапе анализа используются наиболее естественные для человека графические методы. На графиках человеческий глаз сразу видит скрытые закономерности, связи в данных, - то чего нельзя увидеть в цифрах, - воспринимая картину в целом, а не отдельные ее части. Все те графики, которые традиционно используются в техническом анализе рынков, — а также существенно более сложные, — можно построить в системе STATISTICA.

Статистика - Графический анализ



Вначале расскажем об общих графических возможностях STATISTICA.
STATISTICA включает в себя большое количество разнообразных категорий и типов графиков. Это всевозможные графики на плоскости и в пространстве, включая аналитические графики, деловые графики и диаграммы, специализированные статистические графики (гистограммы, матричные, категоризованные графики, диаграммы рассеяния и др.), пиктографики. Имеются два основных типа графиков, отличающиеся подмножеством данных, на которых они строятся: Статистические графики, - графики для визуализации всех значений переменных (столбцов) электронной таблицы. Они включают в себя Stats Graphs — Статистические графики и Quick Stats Graphs — Быстрые статистические графики.
Вторая группа — Пользовательские графики. Графики для визуализации значений из предварительно выделенного блока электронной таблице. Эта группа графиков включает в себя Custom Graphs — Пользовательские графики и Block Stats Graphs — Блоковые статистические графики.
STATISTICA полностью поддерживает технологию OLE (в режимах и сервера, и клиента), при помощи которой вы можете внедрять документы (например, изображения, таблицы и др.) из различных приложений в графический документ STATISTICA и наоборот.
В систему STATISTICA включены удобные инструментальные средства для проведения интерактивного графического анализа данных. При помощи так называемой Кисти, включенной в STATISTICA, вы можете выделить какие-либо точки на графике (например, выбросы значений переменной) и провести дальнейший статистический анализ без значений, которые соответствуют этим точкам.
Эти точки могут быть помечены специальным маркером или меткой. Численные значения, соответствующие выделенным точкам на графике, могут быть отмечены в специальной электронной таблице, которая связана с графиком, а также просмотрены в специальном Редакторе данных графика. Таким образом, можно провести графический анализ, называемый обычно термином: “что будет, если?” Например, трейдер может сосредоточиться на нескольких точках, считая, что ими определяется дальнейшая тенденция, исключив остальные точки.
Наиболее распространенный тип графиков, используемый для анализа данных на фондовых, товарных, фьючерсных рынках, — так называемые, столбиковые графики. Эти графики строятся в диалоговом окне 2D Range Plots.

Язык STATISTICA BASIC



Апробированные стратегии — это одно, но решение, в конечном итоге, принимает сам трейдер и, наверняка, у него имеется собственная стратегия, которую ему хочется реализовать, а не использовать описанные, например, в книге Мэрфи или в других руководствах. В таких ситуациях имеющийся в системе язык STATISTICA BASIC является незаменимым инструментом.
Он прост и достаточно мощен, чтобы покрыть все потребности при формировании стратегии, (обычно эти стратегии связаны с пересечением определенных верхних или нижних уровней прямыми, что служит сигналами к покупке или продаже).
Пользователю доступны следующие библиотеки STATISTICA BASIC: математическая библиотека, включающая различные математические функции, генераторы случайных чисел, графическая библиотека, библиотека таблиц вывода, позволяющая создать и настроить таблицы вывода, библиотека матричных функций, статистические функции и т.д.
Для написанных программ удобно создавать собственные кнопки и выводить их на панель управления. Теперь рабочее окно трейдера выглядит, например, следующим образом:










Для написания программ в STATISTICA имеется Function Wizard. С его помощью работа на STATISTICA BASIC превращается в удовольствие, все операции, реализованные в языке, можно выбрать в диалоговом режиме. На рисунке показано, как с помощью Function Wizard выбирается операция нахождения следа матрицы.
Язык STATISTICA BASIC


Статистика - Анализ временных рядов



Графические методы относятся к средствам дескриптивной или описательной статистики, их применяют на первом этапе анализа.
Часто этих методов недостаточно для построения численных прогнозов и необходимо использовать более сложные аналитические методы, — методы индуктивной статистики.
Если аналитику достаточно понятно, что делать при той или иной тенденции, то бывают промежуточные ситуации, — а их не так мало, — когда действия не очевидны, здесь уже нельзя запустить систему слежения и пойти ловить рыбу.
Впрочем, и здесь самому аналитику решать: использовать или нет сложные методы или положиться на интуицию.
Для анализа флуктуирующих во времени данных используются методы анализа временных рядов. Типичные примеры рядов: курсы акций, различны индексы: Dow Jones Industrial, Standard&Poors 500, USD Index, Bank of England, индекс РТС — индекс Российской торговой системы и другие. Эти индексы важны при принятии решений на финансовых рынках.
Анализ временных рядов в STATISTICA производится в модуле Time Series Analysis/Forecasting — Анализ временных рядов/Прогнозирование.
В модуле имеются разнообразные методы, позволяющие провести всестороннее исследование временных рядов, учитывая особенности их поведения. Различные виды сглаживания: скользящее среднее, медианное, а также всевозможные преобразования рядов доступны в модуле. С их помощью можно проводить разнообразные исследования: сглаживания рядов, выделение циклов, скрытых периодичностей, прогнозировать.
STATISTICA предлагает следующие методы для анализа временных рядов:
ARIMA — Модель авторегрессии и проинтегрированного скользящего среднего.
Interrupted time series analysis — Анализ прерванного временного ряда (модели ARIMA с интервенцией).
Exponential smoothing & forecasting — Экспоненциальное сглаживание и прогнозирование .
Seasonal decomposition (1, 2) — Сезонная декомпозиция 1 и 2 (в том числе месячная и квартальная).
Distributed lags analysis — Анализ распределенных лагов (регрессионная модель для двух временных рядов).
Spectral (Fourier) analysis — Спектральный (Фурье) анализ.
Термин ARIMA часто не переводится, иногда вместо ARIMA или модель авторегрессии и проинтегрированного скользящего среднего говорят просто модель авторегрессия и скользящего среднего. Это наиболее популярная параметрическая модель временного ряда. Особенность реализации модели в STATISTICA в том, что в рамках одного диалога можно провести все этапы классической схемы Бокса-Дженкинса: идентификация модели с помощью автокорреляционных и частных автокорреляционных функций, оценка параметров, оценка адекватности, прогноз будущих значений. В анализе можно учесть сезонные компоненты (в системе реализована мультипликативная сезонная модель). Эти модели можно применять как в трендовой так и нейтральной части рынка.

Статистика - Анализ многомерных данных



Финансовые данные не только флуктуируют во времени, но и являются многомерными.
Из наблюдений за несколькими факторами рынка важно увидеть момент формирования тенденции рынка, необходимо следить за поведением различных игроков, привлекать дополнительную информацию, т.е. наблюдать рынок в многомерном пространстве.
В системе STATISTICA имеются широкие возможности анализа многомерных данных: канонический анализ, дисперсионный анализ, множественная регрессия, многомерное шкалирование, кластерный анализ, дискриминантный анализ, факторный анализ и его новейшее развитие — методы структурного исследования, — SEPАTH.
Классической задачей канонического анализа является построение такой линейной комбинации индексов производства, которая позволяет наиболее точно предсказать общий индекс цен; дискриминантный анализ позволяет классифицировать игроков на бирже или использоваться при назначении кредитных ставок тем или иным клиентам.
Следующий пример работы в модуле многомерного шкалирования является типичным для диалога в других модулях.
Предположим, вы имеете несколько типов акций и просите оценить экспертов степень их близости, например, в 10 бальной шкале. В итоге располагаете следующей матрицей:
Статистика - Анализ многомерных данных

Такого рода матрицы называют матрицами сходства.
Чем выше сходство, тем больший рейтинг выставляет эксперт паре акций, например, степень близости акций А7 и А1 имеет рейтинг 3.83, а акций А7 и А10 рейтинг 5.91. Экспертов несколько, их показания усредняются. Каждый из них работает, т.е. выставляет рейтинги в соответствии со своими собственными представлениями. Вопрос состоит в том, можно ли таким образом получить объективное знание и на основании его рационально строить стратегию своих действий?
Очевидно, глядя на эту матрицу, трудно понять, насколько близки те или иные акции в общей совокупности. Конечно, хотелось бы рассмотреть эти данные на общем плане, например, представить их на плоскости в естественно интерпретируемых шкалах. Эту задачу можно решить в модуле многомерное шкалирование.

Галерея графиков



Из спускающегося меню Graphs — Графики или из Галереи графиков STATISTICA, доступной по кнопке
Здесь доступна также подгонка: линейная, логарифмическая, экспоненциальная, сплайновая и определенная пользователем, см. рисунок ниже. Выберите тип графика: High-Low Close.

Галерея графиков

Столбиковый график продаж акций ЛУКОЙЛ показан на рисунке. На графике данные на каждый день представлены столбиком (отсюда и название графика): указана максимальная цена в течение дня, минимальная и цена закрытия, т.е. цена на момент закрытия торгов. Черта на столбце обозначает цену закрытия (closing price).
Галерея графиков

Гистограмма по сделкам с акциями позволяет увидеть в каком диапазоне группировались цены в течение дня.
Галерея графиков

Ящиковые графики



Ящиковые графики показывает разброс данных, выбросы, экстремальные значения:
Ящиковые графики


Далее показан линейный график, на котором отмечена только цена закрытия для каждого последующего дня. Такой график, как считают многие аналитики, наиболее достоверно отражает картину движения цены.
Ящиковые графики

Графические инструменты



Далее показан линейный график, на котором отмечена только цена закрытия для каждого последующего дня. Такой график, как считают многие аналитики, наиболее достоверно отражает картину движения цены.
Для определения этого необходимо вычерчивать различные линии трендов, например, восходящих, — через последовательно возрастающие точки спадов или нисходящие — через понижающиеся пики. Продолжая прямую, трейдер прогнозирует, какая тенденция доминирует сейчас на рынке, соответственно каковы его действия: покупать или продавать.
В STATISTICA имеется весь необходимый инструментарий для проведения линий на графиках, вычерчивания каналов, т.е. всего того, что необходимо аналитику. Удобный сервис позволяет экспериментировать с различными линиями. Все эти возможности легко доступны в окне графики.
В окне графики, на панели инструментов STATISTICA, имеется набор представленных кнопок
Графические инструменты
Существуют специальные диалоговые окна окна для выбора линий нужного Вам вида, а также для форматирования (моделирования) фигур и изменения основных параметров графика (см. ниже).
Графические инструменты

Графические инструменты



На следующих графиках показано, как в системе STATISTICA вычерчиваются линии тренда, каналы и используется веерный принцип, что является необходимой деталью технического анализа.
Графические инструменты

Графические инструменты




    Организация: Управление - Планирование - Cтатистика