Путеводитель по истории Искусственного Интеллекта. Леонид Черняк

Читать онлайн.



Скачать книгу

миллиардов. На сотни тысяч ядер кластеры потребляют мегаватты энергии, а человеческий мозг – 20 ватт. Каким же надо быть безудержным оптимистом, чтобы говорить о реальной возможности сильного AI, превосходящего возможности человека? А ведь находятся!

      До того, когда AI обретет потенциал, хотя бы как-то сопоставимый с самым примитивным живым мозгом еще очень далеко, на нынешнем уровне развития электроники просто не о чем говорить. Поэтому схема работы современной обучаемой AI-системы на нейронных сетях в некотором роде искусственна, в отличие от мозга даже простейших. Она разделена на два этапа, первый – training, как следует из названия на нем тренирует или обучает искусственную нейронную сеть, являющуюся грубой моделью мозга, а на втором обученная нейронная сеть переносится в другую сеть, этот процесс называется inference, что можно перевести логическим выводом иди умозаключением. В то же время мозг простейшего живого совмещает training с inference.

      О компьютерах и AI

      Даже при такой упрощенной схеме реализации AI классические компьютеры, построенные по ФНА с ограниченным количеством центральных процессоров (Central Processing Units, CPU) с задачей training не справляются. Фундаментальная причина заключается в том, что они строятся на процессорах, состоящих из ядер типа SISD (Single Instruction, Single data), то есть задуманы для обработки одного потока данных одним потоком инструкций, для распараллеливания число ядер может достигать нескольких десятков. Даже собранные вместе десятки мощных процессоров оказывается неспособными к моделированию работы мозга нейронной сетью с тысячами узлов, требуемой при решении задач CV и NLP. Временный выход из положения совершенно случайно нашелся в виде Graphics Processing Units (GPU), эти созданные для работы с графикой компьютерных игр процессоры относятся к типу SIMD (Single Instruction, Multiple Data), они состоят из тысяч небольших ядер, на них проще воспроизвести нейросеть и специализированный компьютер будет обладать большей производительностью. Сегодня большая часть задач training решается на GPU. Для inference обученная сеть чаще всего переносится на CPU или GPU, а также на программируемых матрицах (Field Programmable Gate Array, FPGA).

      По оценкам аналитиков до 95 % всей процессорной нагрузки, связанной с AI, приходится на inference, то есть на решение прикладных задач с использованием обученных нейросетей, сюда же входит Edge AI, так называют класс автономных систем, реализующих AI на оконечных устройствах. Как следствие, эта область является наиболее привлекательной для разработчиков новых процессорных архитектур. Преодолеть нынешнюю монополию GPU в задачах training если и удастся, то нескоро.

      Есть несколько альтернативных разработок, часть из них попадает в категорию умных процессоров (Intelligence Processing Unit, IPU). Одну из них ведет компания GraphCore, пытающаяся создать аппаратными средствами графовую модель представления знаний. Компани Mythic стремится к объединению в памяти работы с цифровыми и аналоговыми данными. Значительное внимание привлекает к себе разработка компании Wave Computing, она дала своему процессору название DPU (Dataflow Processing Unit), из чего следует стремление революционизировать