Название | Как не ошибаться. Сила математического мышления |
---|---|
Автор произведения | Джордан Элленберг |
Жанр | Математика |
Серия | |
Издательство | Математика |
Год выпуска | 2014 |
isbn | 978-5-00100-466-0 |
Вот как это работает. Вы хотите установить взаимозависимость между двумя параметрами, скажем между стоимостью обучения в университете и средним баллом по отборочному тесту SAT принятых на учебу студентов. Возможно, вы считаете: чем выше средний балл SAT, тем дороже учебное заведение, – но посмотрите на данные, которые говорят, что это далеко не универсальный закон. В Университете Элона, расположенном на окраинах Берлингтона (штат Северная Каролина), средний совокупный результат по математике и английскому языку составляет 1217 баллов; при этом университет взимает плату за обучение в размере 20 441 доллара в год. Обучение в Колледже Гилфорда, расположенном рядом, в городе Гринсборо, обходится немного дороже – 23 420 долларов, но средний результат первокурсников по SAT составляет там всего 1131 балл.
Вместе с тем, если вы посмотрите на весь список учебных заведений Северной Каролины – тридцать один частный университет, данные об оплате за обучение и о среднем балле которых были представлены в 2007 году в «Сети ресурсов для построения карьеры штата Северная Каролина», – вы увидите четкую тенденцию{31}.
На представленном ниже рисунке каждая точка графика соответствует одному из колледжей. Вы видите те две точки, которые находятся в правом верхнем углу, с высоким средним баллом SAT и столь же высокой платой за обучение? Это Университет Уэйк Форест и Университет Дэвидсона. Одинокая точка в нижней части рисунка соответствует единственному частному учебному заведению в этом списке, плата за обучение в котором меньше 10 тысяч долларов, – Колледжу медицинских наук Кабаррус.
Данный рисунок четко показывает, что в учебных заведениях с более высоким средним баллом SAT цена за обучение, как правило, выше. Но насколько выше? Именно здесь на сцену выходит линейная регрессия. Очевидно, что точки на рисунке не образуют прямую линию, но видно, что они находятся не так уж далеко от прямой. Пожалуй, можно было бы вручную нарисовать прямую линию, проходящую посередине этого облака точек. Линейная регрессия исключает угадывание и позволяет найти прямую линию, максимально приближенную ко всем точкам[55]. В случае университетов штата Северная Каролина эта прямая выглядит так, как на следующем рисунке.
Коэффициент
54
Более подробную информацию об этих исследованиях можно найти в статье, опубликованной в Journal of Stuff I Totally Made Up in Order to Illustrate My Point («Журнал, придуманный мною для освещения собственной точки зрения»).
31
Эти цифры взяты с сайта North Carolina Career Resource Network (www.soicc.state.nc.us/soicc/planning/c2c.htm), который позже был закрыт.
55
В данном контексте «максимальная приближенность» определяется следующим образом. Если вы замените фактическую плату за обучение в каждом университете оценкой, которую подразумевает прямая, а затем вычислите разность между расчетной и фактической платой за обучение, после чего возведете каждое из этих чисел в квадрат и сложите все эти квадраты, то получите общий показатель того, насколько прямая не проходит по точкам. Надо выбрать прямую, у которой этот показатель минимален. Такое суммирование квадратов напоминает о Пифагоре; в действительности геометрия, лежащая в основе линейной регрессии, – не что иное, как теорема Пифагора, преобразованная и доработанная для решения задач с гораздо большей размерностью. Однако эта история требует больше алгебраических выкладок, чем я хотел бы здесь приводить. Более подробное описание соответствующих аспектов корреляции и тригонометрии можно найти в главе 15.