Очередная попытка OIR

Метки: Хай-тек

Сообщения

09:29 10.06.2015
Очередная попытка OIR

Всем нам хорошо известны продукты класса OCR(Optical character recognition) - это программы распознающие текст с изображений, некоторым знакомы и программы класса VR (voice recognition) - программы распознающие речь и переводящие её в текст.

Как ни странно, но это относительно простые программные решения, которые поступили в широкий обиход после "обкатки" в спецслужбах.

Наверное многим еще знакома опция фото/видеокамер поиск и захват на предварительном изображении лиц для автофокусировки(делает изображение лиц более четкими) - такие квадратные рамочки.

В детективных кинофильмах вы могли встречать программы распознающие лица, отпечатки пальцев.

Эти программы не имеют ничего общего с тем, как человек получает подобную информацию.

Они основаны на довольно сложных математических вычислениях (векторный /кластерный анализ и т.п.) и вероятностных допущениях, малейший шум(помеха) на изображении или звуковой дорожке может привести к ошибке или полному сбою алгоритма.

Т.е. даже ребенку проще объяснить чем отличается один объект от другого, чем сделать тоже самое с использованием высшей математики компьютеру.

История этих программ происходит из середины прошлого века, с начала эпохи ЭВМ человеческий ум лелеял надежду создать ИИ(искусственный интеллект), пока это удалось только в Голливуде, а на практике мы до сих пор не имеем даже корректных электронных переводчиков... а нам уже скармливают новые "черные ящики" - Нейронные сети, БигДата и пр.

Прошу простить за столь затянутое предисловие, перехожу к сути топика.

Недавно сайт Auntminnie.com анонсировал израильский стартап класса OIR(Optical image recognition), т.е. распознавания изображений как таковых - Zebra Medical Vision (www.zebra-med.com)

Ребята взяли базу данных КТ со всего мира - порядка 10 млн. верифицированных случаев - и самообучающийся алгоритм OIR, который раньше использовался для поиска в интернете изображений нарушающих авторские права, в надежде прогнав эту базу данных через алгоритм получить нечто вроде электронного радиолога, или словами использованными в анонсе "The bionic radiologist", т.е. бионического радиолога.

Глава стартапа Elad Benjamin в анонсе представил краткую схему работы алгоритма, в моем вольном переводе - "Наш алгоритм представляет из себя черный ящик в который с одной стороны входят диагностические изображения, а с другой выходит диагноз."

Дас из Фантастиш! В ящик лучше не заглядывать, высшая математика сродни гаданию на кофейной гуще, т.е. глубоко неточная наука, с общими принципами подобных черных ящиков, если кому-то все-таки интересно, можно ознакомиться в книге - Принципы распознавания образов. Д.Ту., Р. Гонсалес, изд. Мир 1978 г.

Да, с тех пор не многое изменилось, "ящики" стали меньше(спасибо прогрессу), красивее(спасибо Ст.Джобсу), но они все еще тупее ребенка...

Поэтому хочется от всей души пожелать участникам стартапа удачи, т.к. дело их темное.