Нe сaмый пeрвый, нo сaмый тoчный Этo тexнoлoгия кoмпьютeрнoгo зрeния. Прoгрaммa мoжeт рaспoзнaть нe тoлькo чeлoвeчeскoe лицo, нo eщe и эмoцию eгo oблaдaтeля: удивлeниe, злoсть, рaдoсть, грусть. Тeпeрь eй смогут воспользоваться любые другие разработчики приложений. На базе этой технологии построен ее сервис Google Photos. И это еще не все. Более того, если на картинке есть логотип или же надпись, наземный ориентир, они будут тут же идентифицированы и прочитаны (программа поддерживает разные языки). Компания Google на прошлой неделе огласила тарифы на использование интерфейса Cloud Vision.
Один из директоров компании Luxoft Игорь Стареправо также прогнозирует, что приложения компьютерного зрения имеют очень хорошую перспективу. "Очевидно, что следующем этапом развития станут технологии компьютерного зрения, работающего непосредственно на устройствах. Украинская лаборатория Например, по принципу наличия "обнаженки" или наличия определенных предметов, брендов. Кроме того, разработчики различных веб-сервисов, по его словам, смогут успешно фильтровать или каталогизировать поступающий графический контент. Как говорит Вадим Нехай, если алгоритм от Google будет работать с заявленной точностью, стоит ожидать массового появления рекламы, которая будет показываться в зависимости от контекста изображения, а не текста вокруг него. А в Instagram наконец-то появится полноценный поиск. "Интернет-магазины смогут более точно предлагать вещи, похожие на те, что вам нравятся. Читайте также: Дневник Давоса: Искусственный разум — реальность. В частности, по его словам, такие решения могут быть использованы для мобильных приложений с улучшенным пользовательским интерфейсом и бОльшего количества функций. Как компьютерное зрение меняет мир? Кроме того, компания ведет разработки специального беспилотного приложения для автомобилей — Advanced Driver Assisst (ADAS), которое также основано на технологиях компьютерного зрения. Что он может?
Такие платформы как Google Vision, Project Oxford API создают подспорье для экспериментов местных команд c компьютерным зрением. Также в прошлом году громко выстрелил проект по распознаванию и модификации лиц в реальном времени Looksery. И успешные примеры для подражания в этой сфере в Украине тоже уже существуют. Как заявлял ресурсу AIN.ua основательArgumented Pixels Виталий Гончарук, в Украине есть порядка 200-300 людей, разбирающихся в этой технологии. В Украине энтузиастов, собирающих различные "умные железяки", тоже хватает. Тот же стартап Гончарука, работающий в сфередополненной реальности, получил инвестиции в $1,5 млн и переехал в Калифорнию. Специалистов подобного профиля в Украине не много, но они имеются. Он может делать снимки и анализировать, что видит перед собой.
Дороже всего обходится обнаружение меток (лейблов) — $5 за тысячу. Все остальные виды компьютерного зрения — по $2,5 за то же количество объектов. Есть и лимиты по объему — обработка до 20 млн картинок за проект в месяц. Первую тысячу объектов Google определяет бесплатно. Но с появлением Cloud Vision, по словам управленца, у разработчиков появится доступ к алгоритму, обученному на миллиардах изображениях в поисковой системе Google, и миллиардах людей, которые эти изображения ищут. Иными словами, у этой программы "глаз наметан". В месяц 5000-10000 изображений, лиц, эмоций распознается бесплатно. В чем же основное отличие Google? Если разработчик знает, что его приложение требует бОльшую облачную мощность, он должен будет обратиться отдельно в Google за специальными условиями сотрудничества. И тарифы у этой компании даже ниже. При этом можно доплачивать за скорость — обработка 10 изображений в секунду обойдется от $0,1 до $1,5 за каждую тысячу картинок. Например, Microsoft предлагает разработчикам аналогичный функционал в сервисе Project Oxford API. Если разработчик закупает услугу оптом (от 5 млн изображений в месяц), то каждая тысяча обходится ему дешевле — в $0,6-2.