Nashev Apr 12 2010 at 10:36

Думаю, следующей революцией будет голосовой ввод информации

2 min

1.7K

Тут недавно подумалось — почему ни я, ни тем более мои родичи, в быту не пользуются компьютером, чтобы например записать, куда положили очередную вещицу в процессе, например, ежегодного доставания летних вещей и убирания зимних? Это несмотря на то, что когда нужна какая-то вещь, приходится мучительно вспоминать «куда ж её положили», фантазировать на тему «где она могла бы сейчас быть» и перерывать все возможные полки и ящики в порядке уменьшения надежд на удовлетворительный результат.

Строгий учёт на складе большой торговой или промышленной компании — понятно дело не только ведётся на компьютере, но и долгое время оформлялся бумажками с подписями и печатями. Но дома этим никто заниматься не будет, и я в первую очередь. Снабдить все вещи rfid-метками и все шкафы считывателями, как это делают на некоторых продвинутых складах — я б тоже пожалуй не смог бы. На это не хватило бы не только денег, но и педантичности при подключении считывателей и приклейке меток.

Но мне подумалось, что убирая очередную вещь в очередное место — я б практически не напрягаясь прокомментировал бы это вслух. Для обработки этого компьютеру достаточно микрофона и (вот то самое, чего пока не хватает!) распознавателя речи, который бы распознанный текст складывал в базу, обеспечивающую поиск. Мне нужно, чтоб когда я говорю что «что-то» кладу «куда-то», я потом у компьютера мог спросить (это — уже можно и письменно, хотя если распознаёт, то почему-бы и не устно) — куда я клал нужное мне «что-то», и он смог бы найти все случаи, когда я ему об перекладывании этого «что-то» сообщал.

Устное заполнение заметок, заданий, напоминалок, анкет, форм, запросов на поиск и многого такого открыло бы широчайшие просторы для применения компьютеров там, где сейчас использование упирается в то, что приходится набирать текст руками, глядя на экран.

Эта технология перевернула бы мир бытового использования компьютеров! Вот на что нужно тратить их мощности.

P.S. По хорошему, надо бы вместе с текстом хранить и записанную речь. Примерно так же, как DJVU и PDF умеет хранить текстовый слой для сканированных изображений, и видеоролики иногда хранят субтитры для звуковой дорожки. Фактически, нужен движок автоматического формирования субтитров для аудио-записей.

И так же как для OCR, нужны средства вычитки и правки распознанного из звука текста. С гистограммками для наглядности и ориентирования. Для достоверности, перепроверки, и облегчения восприятия, было бы полезно хранение таких аудиозаписей с текстовым слоем в качестве значений текстовых полей.

Так же нужно, чтобы средство записи и сохранения в базу голосом же и управлялось. Само резало услышанное на слова и предложения, и некоторые из слов не только записывало, но ещё и выполняло.

Tags:

Hubs:

Lumber room