Название | Как предсказать курс доллара. Поиск доходной стратегии с языком R |
---|---|
Автор произведения | Владимир Георгиевич Брюков |
Жанр | Ценные бумаги, инвестиции |
Серия | |
Издательство | Ценные бумаги, инвестиции |
Год выпуска | 2018 |
isbn |
# эти пакеты нужны нам для текущей работы
# перед каждой сессией нужные пакеты надо загружать в память компьютера
# далее читаем файл с загруженными для работы данными:
> Мои.данные<-read.zoo('Данные.csv', sep = ";", header=TRUE, FUN=as.Date)
# если бы R понимал по-русски, то эту команду можно было бы ввести так:
# Мои.данные<-чтение.zoo('Данные. csv', знак раздела = ";", заголовок=ИСТИНА, Функция=as.Date)
# FUN =as.Date по-русски можно было перевести: функция=как.Даты
# as.Date переводит загружаемые данные в нужный формат календарных дат
# в результате файл Excel в формате csv с загружен из рабочей директории
> options("scipen"=100, "digits"=8)
# устанавливаем количество сокращаемых после запятой знаков=8
# избавляемся от экспоненциального формата представления цифр
# options по-русски означет опции, а digits– цифры
# "scipen" – порядок использования научной нотации в R
> head(Мои.данные)
# по умолчанию загружает первые 6 строк файла Мои.данные
# head в переводе на русский означает голова, заголовок, верхняя часть
# если бы R понимал по-русски, то эту команду можно было бы ввести так:
# > начало(Мои.данные)
# смотрим первые 6 строк с загруженными данными – см. рис. 4
Рис. 4
>tail(Мои.данные)
# tail в переводе на русский означает хвост, задняя часть
# Смотрим последние 6 строк с загруженными данными– см. рис. 5
Рис. 5
> dim(Мои.данные)
[1] 5852 15
# смотрим количество строк и колонок в загруженном файле.
# всего загружено 5852 строки и 15 колонок с 15 переменными.
> День_торгов.мес<-(Мои.данные[1:5831, 1])
# переменные будем обозначать на кириллице, хотя, как правило, используют латиницу
# в квадратных скобках укажем сначала номера загружаемых строк, а затем номер столбца
# символ 1:5831 означает номера строк сверху вниз по порядку 1,2 … 5830, 5831.
# строки 5832: 5852 с данными за апрель 2018 года пока не будем использовать
# неиспользованные данные будут нам нужны для последующего тестирования
> Долл.США_Руб <-Мои.данные[1:5831, 2]
# Долл.США_Руб <-Мои.данные [1:5831 наблюдений, 2-й столбец загруженного файла]
> Евро_Руб <-Мои.данные[1:5831, 3]
> Евро_Долл.США<-Мои.данные[1:5831, 4]
> Нефть<-Мои.данные[1:5831, 14]
> Золото<-Мои.данные[1:5831, 15]
# присваиваем названия тем загруженным данным, которые сейчас будем использовать
Далее построим уравнение регрессии, включив в него в качестве зависимой переменной Долл.США_Руб, а в качестве независимых переменных – фундаментальные факторы, которые, по нашему мнению, влияют на его курс – Евро_Долл.США, Евро_Руб, Нефть и Золото.
Как известно, задачей регрессионного анализа является расчет формулы, описывающей связь между зависимой переменной Y (ее называют также результативным признаком) и независимыми (их называют также факторными) переменными X1, X2, … , Xn. При этом формула связи результативного признака Y с факторами X1, X2, … , Xn, либо с одним фактором X, получила название уравнения регрессии.
В