Название | Искусственный интеллект на пальцах: от пикселей до решений |
---|---|
Автор произведения | Андрей Васильевич Зубков |
Жанр | |
Серия | |
Издательство | |
Год выпуска | 2025 |
isbn |
Как текст превращается в числа
Человек воспринимает текст как осмысленный набор слов, но для компьютера это просто последовательность символов. Нейросети не могут работать с буквами напрямую, поэтому текст нужно превратить в числа. Это можно сделать разными способами:
Преобразование в код ASCII или Unicode каждый символ заменяется своим числовым кодом (например, буква А это 65 в ASCII). Но этот метод слишком примитивен, так как не учитывает смысла слов.
Мешок слов (Bag of Words, BoW) текст представляется в виде списка слов, где каждое слово заменяется на число, показывающее, сколько раз оно встречается в тексте. Например, фраза кот спит на диване превратится в вектор: 1, 1, 1, 1, если учитывать только уникальные слова.
Word Embeddings (векторное представление слов) это более сложный и мощный способ. Каждое слово превращается в многомерный вектор (например, длиной 300 чисел), который отражает его смысл. Например, слова король и королева будут иметь похожие векторы, так как они связаны по смыслу.
Как звук превращается в числа
Звук это колебания воздуха, которые мы воспринимаем как речь или музыку. Компьютер же записывает звук в виде цифрового сигнала последовательности чисел, где каждое число отражает амплитуду звуковой волны в конкретный момент времени.
Чтобы представить звук в виде данных, он записывается с определенной частотой (например, 44 100 измерений в секунду для аудиофайлов CD-качества). Полученный сигнал можно разложить на частоты, чтобы понять, какие ноты звучат в музыке или какие фонемы произносит человек. Именно так работают голосовые помощники: они анализируют звуковой сигнал, разбивают его на части и распознают слова.
Пример числового представления звука:
0.12, 0.15, 0.22, -0.05, -0.10, -0.08
Чем больше точек измерения, тем точнее представление звука, но тем сложнее его обработка.
Зачем все это нужно?
Почему так важно переводить данные в числа? Потому что только так нейросети могут их анализировать. После преобразования данных в числа можно применять к ним математические операции: искать закономерности, выявлять шаблоны и делать предсказания.
Пример: если нейросеть обучили на миллионах изображений котов, она может найти общие признаки (уши, усы, глаза) и правильно определять котов на новых картинках.
То же самое работает и для текста: если нейросеть анализировала тысячи отзывов, она может определить, какие слова чаще встречаются в положительных или отрицательных комментариях, и предсказать настроение новых отзывов.
Вывод
Чтобы нейросеть могла работать с изображениями, текстами и звуками, все эти данные нужно сначала превратить в числа. Это ключевой этап, без которого искусственный интеллект не смог бы анализировать мир. В следующих главах мы разберемся, как нейросети обрабатывают такие числовые данные и как на их основе принимаются решения.
Глава 2.2. Упрощение мира
Когда человек смотрит на мир, он видит его во всей сложности: цвета,