Название | Стартап. Как начать с нуля и изменить мир |
---|---|
Автор произведения | Александр Горный |
Жанр | Управление, подбор персонала |
Серия | Бизнес. Как это работает в России |
Издательство | Управление, подбор персонала |
Год выпуска | 2019 |
isbn | 978-5-04-098244-8 |
В общем, в плане доступности технологии будущее уже наступило. Качеству есть еще куда расти, особенно в плане вычисления возраста и определения настроения, но для многих задач всё уже готово. Для иллюстрации: в Китае водитель Didi обязан иногда показывать таксометру свое лицо, чтобы доказать, что он – это действительно он, а не его знакомый на чужом подключении ездит.
Китайский Face++ – один из дюжины мировых проектов, называющих себя лидерами в технологии распознавания лиц. Впрочем, по венчурному финансированию Face++ точно среди лидеров, еще с предпоследнего раунда в 100 миллионов долларов. Зарабатывает компания в основном на контрактах с государством и крупными корпорациями, но и стартапчикам дает открытое API с онлайн-подключением и оплатой по карте.
Результаты бизнеса непрозрачны, масштаб новых интеграций оценить обычно трудно, но, судя по инвестициям, всё идет хорошо, в ноябре 2017 года Face++ получил почти полмиллиарда долларов по оценке в миллиард.
Еще одна внезапно решенная проблема – понимание простых фраз на естественном языке, что-то на уровне Siri или Cortana. Русский язык публично предлагает Яндекс, а сервисов для понимания английского или даже испанского в интернете просто много.
Не возьмусь утверждать, что стартап SoundHound – самый продвинутый из всех, но у него кроме технологии есть еще и ее собственные применения. Начнем с API. Сделан он правильно, с онлайн-регистрацией и открытым прайсом, без необходимости общения с сейлзами, но с бесплатным минимальным тарифным планом и преднастроенной демонстрацией технологии. Качество продукта объективно оценить сложно – что-то он понимает, что-то нет, процент успеха с очевидностью зависит от акцента говорящего, выбранной темы и просто везения, некое число типа «72 % верных ответов» не говорит ни о чем. Наверное, правильно было бы проверять его через детские тесты: «Разговаривает на уровне среднего ребенка 5 лет и 8 месяцев», – это была бы наиболее информативная оценка. Но, увы, сейчас могу только сказать, что субъективно по распознаванию звуков он примерно на уровне Nuance (это то, что в трех четвертях приложений с голосовым вводом используется), а по пониманию смысла – хоть и неожиданно хорош в простых предложениях, но запутаться может и в них. Сложносочиненные не берет ни в какую.
Сто́ит доступ в самом простом случае от нескольких сотен до нескольких тысяч запросов за доллар в зависимости от размеров выбранного пакета, но это «общая лексика», подключение