Название | Искусственный интеллект: начала многомерного строчного множества. Сингулярность неизбежна |
---|---|
Автор произведения | Сергей Владимирович Соболенко |
Жанр | Компьютеры: прочее |
Серия | |
Издательство | Компьютеры: прочее |
Год выпуска | 0 |
isbn | 9785449043382 |
Разумеется, для того, чтобы сформировать «умное» и разветвленое многомерное множество требуются серьезные усилия, особенно в областях классификатора, относящихся к неживым объектам и понятиям. Но не будем забегать вперед. Подробно об этом можно прочитать в 4 главе.
2.1. Общее и частное
Остановимся на простых операциях со множествами MSM.
Например, мы имеем задачу найти общее свойство нескольких элементов, объектов реального мира.
Пусть это будет:
ABВACAAB Яблоко
АВВАСААС Апельсин
ABBBAA Трава
ABВAAAB Сосна
Для этого мы всего лишь сравниваем попарно слова-множества и запоминаем результат в совпадающей части:
в 1 паре ABBACAAB и ABBACAAC это будет ABBACAA – ФРУКТ
далее мы сравниваем полученное и следующее —
ABBACAA и АВВВАА – получаем АВВ – РАСТЕНИЕ, и сравниваем теперь его с последним:
АВВ и ABВAAAB – также находим общее АВВ – Растение;
Так мы получили ответ, что все 4 объекта относятся к «растениям».
Возьмем еще один пример:
AAAAAABABA Эмоции
AAAAAABBAA Симпатия
AAAAAABAAABA Миф
Так же сравниваем левые части кода этих слов-множеств, находим общее, и это будет AAAAAAB — Субъективное. И это совсем неочевидный ответ, который имеет место быть.
Для того, чтобы найти лишнее в ряде элементов, потребуются уже некоторые хитрости:
ABABACCABA Коза
ABABACCAAA Корова
ABABACDAA Лошадь
AAADAACBBA Стол
ABABABAAA Акула
И хотя для человека кажется очевидным лишнее (Стол), компьютерный алгоритм пришлось некоторое время совершенствовать для того, чтобы научить определять лишний элемент наиболее точно.
Сделать это можно следующим образом:
Мы сравниваем поочередно каждое из слов-множеств со всеми присутствующими; причем сравниваем по-хитрому, получая в качестве ответа процентное соотношение «попадания» в искомое.
Например, имея некие коды A B C D E, мы можем получить средневзвешенную оценку общности так:
А и В = 95%, А и С=93%, А и D=5%, А и E=50%, итого (95+93+5+50) /4=60.75%
Проделав тот же самый фокус в цикле, мы получим такие значения для каждого элемента, и тогда нам останется только выбрать тот, который имеет самую низкую оценку.
Если взглянуть на процедуру процентного сравнения детальнее, сначала мы сравниваем каждый символ позиционно с первого до последнего. Затем оцениваем нахождение всех частей одного слова в другом. То есть, если у нас есть строка «ABCDEF» мы берем и сравниваем подстроку AB, потом BC, потом CD, потом DE и EF. Затем группу трех символов ABC, BCD, CDE и DEF. Затем сравниваем группы четырех символов ABCD, BCDE и CDEF, и наконец пять – ABCDE и BCDEF. Так же мы снижаем оценку схожести, если «слова» отличаются по длине.
В указанном выше примере правильным решением для