Название | Как информация управляет миром |
---|---|
Автор произведения | Сезар Идальго |
Жанр | Прочая образовательная литература |
Серия | civiliзация |
Издательство | Прочая образовательная литература |
Год выпуска | 2015 |
isbn | 978-5-699-85453-0 |
Таким образом, стоимость автомобиля Bugatti определяется физическим порядком, которым и является информация, несмотря на продолжающиеся споры о том, что она собой представляет.[19] Клод Шеннон, отец теории информации, говорил, что информация – это мера минимального объема данных, необходимого для передачи сообщения. То есть это количество битов, требуемое для передачи данных об организации, например о порядке атомов, составляющих автомобиль Bugatti.
Тем не менее для лучшего понимания определения «информация», сформулированного Шенноном, лучше начать с чего-нибудь более простого, чем автомобиль Bugatti. Я буду использовать в качестве примера твит. Твит – это сообщение, состоящее из 140 символов, которое используется на сервисе Twitter. Твит, как и Bugatti, представляет собой небольшой пакет информации, но, в отличие от Bugatti, он создается в качестве акта коммуникации. Тем не менее с точки зрения теории Шеннона это не имеет значения. Согласно Шеннону, информация – это минимальный объем данных для передачи любого сообщения. Будь то твит, состоящий из случайных символов, или самое остроумное сообщение, которое вы когда-либо видели, все это не имеет значения с точки зрения теории информации Шеннона.
Итак, сколько же информации содержится в твите? Чтобы представить содержимое твита в количественном выражении, рассмотрим гипотетическую игру для двух пользователей сервиса Twitter, Эбби и Брайана. В этой игре Эбби и Брайан должны угадать твиты друг друга, используя только вопросы типа «да/ нет». Для игры в эту игру у них есть книга, которая содержит все возможные твиты, которые могут быть написаны. Игра начинается тогда, когда Эбби случайным образом выбирает твит из своей книги. После этого она просит Брайана угадать ее твит, используя только вопросы типа «да/нет». Шеннон учит нас тому, что объем информации, заключенной в твите, равен минимальному количеству вопросов типа «да/нет», необходимых Брайану для того, чтобы угадать твит Эбби со стопроцентной точностью.[20] Однако каково количество этих вопросов?
Для простоты будем считать, что Эбби и Брайан используют «алфавит» из тридцати двух символов: строчных латинских букв и таких дополнительных символов, как пробел (), косая черта (/), запятая (,), точка (.), а также «собака» (@) и решетка (#). Кроме того, будем считать, что у Эбби и Брайана есть таблицы, в которых каждый символ соответствует числу (a = 1, b = 2, […], @ = 31, # = 32).
Лучшим способом угадывания твита Эбби является использование Брайаном каждого вопроса для разделения пространства поиска возможных твитов пополам. Брайан может сделать это, отгадывая сообщение Эбби символ за символом. Если Брайан решит использовать данную стратегию, то его первым вопросом типа «да/нет» будет: «Число, соответствующее первому символу, больше 16?» Если Эбби ответит отрицательно, то Брайан будет знать, что первый символ в твите Эбби расположен между буквами a и p. Имея это в виду, Брайан должен будет задать второй вопрос, который разделяет пополам оставшийся набор символов: «Число, соответствующее первому символу, больше 8?» Если Эбби
19
Поскольку у слова «порядок» много значений (например, расположение предметов одежды в вашем шкафу или порядок блюд, заказываемых в ресторане), я хотел бы уточнить значение данного слова, поскольку я собираюсь использовать его в дальнейшем. Когда я использую слово «порядок», я имею в виду физический порядок – способ расположения частей системы (например, способ расположения вещей в вашем шкафу). По определению, физический порядок является информацией. Именно физический порядок отличает автомобиль Bugatti до аварии от того, что от него осталось после нее.
20
Это самый простой из возможных случаев, который можно использовать для иллюстрации теории Шеннона, поскольку он предполагает, что все твиты и символы равновероятны. В реальности все символы и строки символов не являются равновероятными. Сообщение с большой степенью вероятности будет содержать последовательность символов http://, чем последовательность символов qwzykq. Если Брайан знает об этих различиях, он может использовать их для того, чтобы уменьшить количество вопросов, необходимых для угадывания твита. Если вам неудобно использовать такие допущения, предположите, что Эбби и Брайан прибыли с разных планет, и что об алфавите Эбби Брайану известно только то, что он основан на тридцати двух разных символах.