Организация «Yandex» воплотила технологию компьютерного зрения в пасмурном помещение данных «Yandex.Диск»: теперь сервис дает возможность находить картинки, имеющие документ запроса в поисковике.
В базе поиска надписей на фотографиях находится система зрительного узнавания знаков. Система состоит из 2-ух элементов — классификатора иллюстраций и модуля узнавания. Предварительно классификатор (бездонная нейронная сеть) отнимает из всех подходящих фотографий те, на которых находится документ. Применение автомобильного учебы дает возможность достичь отличного качества узнавания, так как метод базируется не на какие-то определённые требования, а на опыт теста млн различных документов.
Когда картинки с текстом отобраны, система находит на них линии, скорее всего имеющие документ, — отличать их помогает ещё одна нейронная сеть. На следующем раунде метод оставляет исключительно те линии текста, в которых он убежден. Дальше модуль узнавания делит линии текста на некоторые знаки. Для любого знака устанавливается несколько наиболее потенциальных видов узнавания. К примеру, это могут быть буквы «О», «о» и цифра «0», крайне похожие друг на дружку.
После этого в дело входит языковая модель — система решает, какой из символов-кандидатов подходит предпочтительнее. Этот аппарат базируется на словари и рассматривает не только лишь подобие знаков с теми, которые знает система, но также и контекст, другими словами примыкающие знаки. Если из нескольких потенциальных знаков формируется знаменитое системе слово, то она может решить, что на иллюстрации написано как раз оно.
Сейчас сервис дает возможность находить по тексту картинки форматов JPEG, GIF и PNG. В следствиях поиска выводятся не только лишь иллюстрации, аналогичные введённому запросу, но также и документы и папки, в наименованиях и описаниях которых есть обозначенное слово.
Система может узнавать документ на фотографиях, различных по виду, содержанию и качеству. Пунктуальность узнавания текстов на российском языке составляет около 80 % для отсканированных бумаг, приблизительно 63 % для снимков с надписями и 100 % для снимков экрана. Кроме российского языка, система также распознаёт британский, российский и турецкий. Пунктуальность узнавания текстов всего потока фотографий превосходит 70 %.