Comments / Profile of Xom / Habr

How to become an author

Александр Хомяков @Xom

AI, NLP

Profile Publications 19Comments 479Bookmarks 31

Как мы придумывали систему анализа текстов

Xom May 6 2015 at 21:16

@Мы добавили в программу автоматический «извлекатель» названий товаров и «присваиватель» категорий, так что теперь система сама могла «открывать» новые товары и категории товаров@ А как это можно сделать автоматически? Вы научились автоматически строить онтологию?

0

Извлечение упоминаний сущностей и поиск в Textocat API

Xom May 6 2015 at 21:00

Вам надо реализовывать тогда анафору. А это не так просто как именованные сущности определять. И надо переходить на более сложные предметные сущности, например, «все сообщения об отгрузке угля с шахт Донбаса за 2014 год». Причем поиск должен быть не только по словам Донбас шахта уголь и 2014, а и с анафорой, и корреференцией, синонимией и т.п., но при этом БЕЗ лишних (ошибочных) сообщений. И с обозначением дублей информации (в прошлом году и в 2014 — это одно и тоже). Вот тогда у вас будет полезный и интересный продукт, на который будут подписываться. Но пока это никому не подсилу. Так что вам еще раз успехов )

-2

Извлечение упоминаний сущностей и поиск в Textocat API

Xom May 6 2015 at 20:51

Если авторы уже знают — надо бы сначала доделать, чтобы не портить впечатление. Если это продукт «за деньги», то таких ошибок вообще не должно быть.

-4

Извлечение упоминаний сущностей и поиск в Textocat API

Xom May 6 2015 at 13:04

Что то пока не очень у вас с определением сущностей yadi.sk/i/Zo-9dlytgSA2F. И как будет работать кореференция (что «предприятие Сфера» и «компания Сфера» одно и то же никак не указано)?.. Анафора похоже тоже не реализована пока («эта фирма»)? А так — успехов. Применения, правда, не так много где можно найти. Поиск по ключевым работает при поиске фирм и людей — по их именам. Даты тоже не сложно найти… по дате

0

Что нас ждет в ближайшие 25 лет? Предсказания от Рэймонда Курцвейла

Xom Feb 6 2015 at 18:19

«Google перезапускает свой проект «умных» очков, сообщает New York Times. Разработка и продажи cтарой версии Google Glass были прекращены в январе». Не рано.

Когда уже появилось что-то, предсказать взлет очень легко, вероятность «угадывания» высокая. А вот предсказать появление, когда еще ничего нет — намного сложнее. Поэтому подразумеваемый «известный человек» мягко говоря ничего не предсказал по сути. Таких вычсказыванйи в то же время что и он можно найти еще с сотню.

0

Что нас ждет в ближайшие 25 лет? Предсказания от Рэймонда Курцвейла

Xom Jan 30 2015 at 11:25

\\К 2040-м небиологический интеллект станет в миллиарды раз мощнее нашего. Нанотехнологии позволят делать еду из разреженного воздуха и создавать любые объекты физического мира. К 2045 мы умножим наши интеллекты, подключив мозг к синтетическому неокортексу в облаке.\\

Я думаю, уже в 2040 этот более мощный интеллект, если он действительно мощный и интеллект (умный значит), первым делом откажется подключать убогие биологические мозги к своей инфраструктуре «синтетического неокортекса в облаке», где он сам будет сидеть. Зачем ему NN миллиардов «примитивов»? Это только любители кошек старательно ждут ответа от своих любимцев и пытаются их научить хоть чему-то «разумному».

Но думаю, все будет гораздо прозаичнее, как описано в статье в Газета ру «Компьютер устал от человека»

0

Что нас ждет в ближайшие 25 лет? Предсказания от Рэймонда Курцвейла

Xom Jan 30 2015 at 11:17

Думаю, уже в 2036 будет смешно читать, закладывайте ))

0

Что нас ждет в ближайшие 25 лет? Предсказания от Рэймонда Курцвейла

Xom Jan 30 2015 at 11:07

Судя по тому, что очки Google не пошли, можно считать предсказание Курцвейла неверными. И предсказать в 1999, что мы будем разговаривать с компьютером — это не предсказание, а констатация, так как распознавалки речи уже существовали и даже программы командования компьютером голосом (Dragon). Все остальные его предсказания примерно такие же. Если это самый крутой техно-футуролог, то можно сказать, что их нет. Есть один красноречивый факт — интернет и мобильный комп никто не предсказал. А они больше всего изменили нашу жизнь.

И тут надо различать «предсказание» и «указание». Все «верные» предсказания Курцвейла были сделаны как видно за короткий период, когда уже было понятно, что это возможно по уровню техники. И возникал обратный эффект — реализации предсказания по «указанию» футуролога. Я думаю, очки, например, так и создавались — прочитали идею Курца и начали делать. Правда неудачно, так как это фантазия. А реальное новшество возникает из сложившихся на тот момент УСЛОВИЙ. Нашу мысль двигает не фантазия, а сложившаяся потребность. И заранее она не известна так как это конфигурация из параллельно развивающихся процессов/возможностей.

А такие предсказания, как еду из воздуха и создавать любой объекты — парня надо на физфак доучиваться отправить )) Он не учел маленький нюанс — для этих «фантастических» преобразований понадобится столько энергии и дорогих преобразователей, что «лучше пристрелить лошадь, чем прокормить» ))) А так, теоретически предположить можно все, главное подальше от нашего времени, когда за базар отвечать уже не придется. Правда сам Курцвейл готовится стать первым загруженным сознанием в комп. Он правда забыл, что сначала бы неплохо получить ответ на вопрос, а что такое сознание. Это не мощность компа по закону Мура.

0

Ошибки и заблуждения стартапов при охране интеллектуальной собственности. Патенты

Xom Jan 8 2015 at 20:23

К интернет-решениям и бизнесу это все имеет очень малое отношение и реально просто трата времени и денег. Представьте, что вы делаете интернет-сайт с какими то услугами, фотохостинг какой то уникальный, скажем, с уникальной фильтрацией по похожести картинок, основанную на сверточных нейросетях. И вывешиваете на английском и русском для общемирового доступа. Вы будете патентовать во всех 192 странах мира? Никакой инвестор вам не подпишет такие траты. И будет прав — прибыль с такого проекта не покроет даже часть затрат на такое… Судебные издержки тем более. Только если это хостинг, соцсеть или интернет-сервис чисто под Роосию. Тогда и патент только в России.

Но вывод один — для интернет проектов патентная система с патентованием в каждой стране не подходит, так как она придумана для защиты патента на товар/техническое изделие, продаваемое в стране. А не услуги в интернет. И придумана такая система 200 лет назад. Не в информационный век. Автор больше пишет о патентных войнах а-ля Apple vs Samsung по поводу смартфонов (железа). По поводу софта мало применимо. Просто потому что существует куча альтернативных способов реализации одной и той же функции.

Единственная защита — это первым набрать большую аудиторию. За это и покупают такие стартапы гиганты. Не судятся, а покупают. Потому что суд не отнимет у вас аудиторию, как бы корпорация зла не старалась. Так что не думайте о патентах — они вам не помогут. Думайте о завоевании сердец своих клиентов.

0

В логове Франкенштейна

Xom Jan 8 2015 at 01:47

Как раз нет, мне то ваша точка зрения интересна, и я отвечаю, вполне конструктивно и обосновано. Без «ужасов». Любая дискуссия с человеком в теме для меня ценна. А вы бесспорно глубоко в теме. Но у нас разный уклон. Я больше из лингвистики и когнитивистики. От этого разность во взглядах. Ничего страшного.

+1

В логове Франкенштейна

Xom Jan 8 2015 at 01:42

Именно логический подход и порочен — в логике и проблема. Это выяснил еще Витгенштейн. И именно в сдвиге с парадигмы «логичного» и есть выход. Но это не нечеткое множество Заде или лямбда исчисление. Это все равно производные от логического подхода, попытка в его рамках вывернутся. Бесполезно. Нужна смена парадигмы. И уже есть основа для этого.

0

В логове Франкенштейна

Xom Jan 8 2015 at 01:31

> Речь слишком ограниченна, чтобы передавать более содержательные модели реальности
Это заблуждение. Речь так же мощна в «изобразительном» смысле как и зрение. Просто одно более развито так как зародилось раньше. Но речь развивается быстрее. А принципиально, повторю еще раз, эти модальности реализуются при помощи одних и тех же методов. Только в зрительной коре линии и цвет служат первичными перцептивными паттернами, а в речи — фонемы. Возможности того и другого для передачи сложных конструкций одинаковые. Отличие только в том, что слова — это «вторая сигнальная», а зрение — первая. Но я уже писал о среде, в которой придется оперировать AI.

> Я вот как-то за год научился играть в го на уровне 1 дана, принципиально не читая никаких книжек, а только играя
Вы при этом хотите сказать даже не рассуждали внутри себя? ) Внутренняя речь все равно присутствует. Или вы даже не бормочите про себя? )

> У тех, кто занимается ИИ, есть слишком много оснований, чтобы увериться в ее методологической порочности…
Приведите парочку хотя бы. Я как раз этим занимаюсь непосредственно, будет любопытно узнать, но только от тех «кто занимается ИИ». Пока приведенные аргументы говорят об обратном.

> Как раз программы типа Ватсона — это полный тупик.
C этим согласен. Строго говоря там не рассуждения. Но это не важно для затрнутого вопроса «лингвистического ума». На вопрос можно ответить не имея представления другого кроме лингвистического. Это важно.

> Ужас… Ну, на таком уровне, конечно, все просто…
По этой фразе видно, что вы просто не в теме. А я как раз работаю с такими технологиями в зрительной (kuznech com) и лингвистической (LSA). И там и там ОДНИ И ТЕ ЖЕ сверточные и рекурсивные NN. Дальше объяснять про «ужас»?

> Но на практике это крайне неэффективный путь. Без внесения нужных приоров процесс обучения такого интеллекта будет крайне трудоемкий.
Это вывод из опыта? Тогда хотя бы намекнуть на статью или проект, где такой вывод очевиден не только вам. У меня совсем другие выводы. Другая модальность для мозга — это опора для разрешения неоднозначностей при действии в реальном мире. Одно не хватает, это точно. Но когда речь идет о чисто «лингвистической» среде другой модальности просто не надо. Такой «ум» действует только в одной.Понимает текст и отвечает текстом. Все.

>на следующий Ваш комментарий могу не ответить
Вы же не знаете даже на что придется отвечать… или просто иная точка зрения не приемлема? Ваше право.

0

В логове Франкенштейна

Xom Jan 7 2015 at 23:11

> Но я имел в виду, что в рамках ИИ между эволюцией и обучением вообще почти нет какого-то барьера
Это не так. Развитие возможности обучаться и сама способность обучаться — совершенно разные вещи. Эволюция — это становление способности, появление возможности. Обучение — это использование этой возможности когда она уже есть.

> Многочисленные эксперименты с обобщением животными паттернов на кормушках с пищей показывает, какие классы образов принципиально не могут распознавать разные виды животных
А вы не задавались вопросом, каким образом человек научился различать больше чем какие-либо животные? Когнитивная наука отвечает, что как раз лингвистическим. Сначала человек научился их выделять за счет «второй сигнальной», потом обученная таким образом первичная зрительная система стала их различать. О чем я и писал выше — самопрограммирующийся ум через речь. Шахматисты — тоже самое. Они узнают паттерны ситуаций, которым сначала обучились по книжкам и рассказам тренера.

> существуют лингвистические саванты, языковые способности которых могут быть существенно выше средних, но аналитический интеллект которых сильно понижен/
Ну это клинический случай, ничего не подтверждает. Есть такие повреждения височной, что человека вообще трудно остановить, чтоб он не болтал. Причем тут то, что мы обсуждаем? Вербальная система естественно работает вместе со зрительной и прочими модулями (по Фодору). Но мы (разумные) отличается от тех, у кого такие же модули, только лингвитсическим. Причем не то чтоб самой способностью говорить, а именно рекурсивной речью — говорить об сказанном грубо говоря. Животные дальше холофраз не могут. Это про «в четвертых».

> никто не сказал, что «лингвистический ум» можно реализовать без значительной части того фундамента, который заложен еще в животных.
Но и обратного никто не доказал, что невозможен лингвистический ум без того фундамента, с которым он взаимодействует. Есть же слепо-глухонемая Скороходова, почитайте ее, очень поучительно. Хотя там есть опора на осязание все таки. Но такие программы как Ватсон показывают, что собственно зрения им или осязания не надо, чтобы ответить на вопросы. Чем не ответ на вопрос? И потом, уже достаточно хорошо известно, что зрительная и лингвистические зоны коры работают по одним и тем же принципам. И программируются по одним принципам — нейронными сетями. Это говорит о том, что концептуально, одна модальность вполне самодостаточно при притоке инфо из вне в ее же модальности.

> Язык — это не только текст, синтаксис; это еще семантика и прагматика, скоординированность с внешним миром
Семантика, это языковая же сущность, зависит от контекста, см. на тему дистрибутивной семантики. Прагматика — это семантика отношений говорящего и адресата, см. про модальную лексику, речевые акты и т.п. Тут нет ничего не языкового.

> Гораздо «проще», чтобы ИИ осваивал язык «естественным образом» (упрощенно говоря, как человеческий ребенок, хотя это не единственным путь).
В виду выше сказанного тут, это не обязательно так. И опять же, чтобы создать самолет, возвращаемся к рептилиям? Или птенцам самолетов? Нет, просто делаем самолет. Тут надо заметить известную вещь — чтобы создать замену лошади, не обязательно создавать копию лошади. Машина на нее не похожа, но возит быстрее. Так что вывод свой вы делаете рано…

И последнее замечание. Первичной средой искусственного интеллекта будет являться не материальная среда с горами и реками, а среда программная — информация на каком-то языке. МЫ сами усиленно оцифровываем мир, в сети все есть, так что ноги руки и глаза ему уже не нужны. И если вы посмотрите на то, как общаются люди, то даже тут мы с вами не по телефону, а текстом — это 90% общения! Наводит на мысли.

0

В логове Франкенштейна

Xom Jan 7 2015 at 18:23

>Однако утверждение, что «концепция в любом случае будет состоять из общеизвестных компонентов», все же дискуссионно
Все мы говорим одними и теми же словами, но говорим совсем разные мысли. Я об этом. И как раз в том, что на концептуальном уровне ничего нового, и есть проблема. Методы создают возможности, но ни когда сами не создают решения. В остальном все как у Куна.

> Чисто лингвистический — гипотетически возможно, но практически вряд ли реализуемо.
Почему такие выводы? Как раз наоборот, если об интеллекте говорить как о рассуждении, а, скажем, не как о распознании образов, что умеют и животные, то это чисто «лингвистический ум», как собственно давно известно в когнитивной психологии. Мышление по Выготскому собственно и есть интериоризированная речь.

> а между обучением и эволюцией разница не очень большая
Вообще-то это совершенно разные вещи. Обучаемость, кстати, есть результат эволюции, Эволюционирующий мозг, даже в онтогенезе, еще ничего не может по сравнению с развитым мозгом. Его отличие именно в возможности обучаться через речь. Для этого нужны когнитивные структуры, которые и отличают разумный мозг от лягушачьего. И речь идет о повторе этих развитых когнитивных структур.

0

В логове Франкенштейна

Xom Jan 6 2015 at 16:33

Хорошая статья, спасибо. Мало таких информативно объективных (чаще встречается повтор банальностей по поводу ИИ). Герцель уже гений, раз сумел доказать свою концепцию инвесторам и развить проект, о котором знают все, имеющие серьезное отношение к ИИ.

Теперь по делу. В большей степени успех зависит не от ресурсов корпораций. А от выбранной концепции, котрая может оказаться более продуктивной, чем остальные. Она в любом случае будет состоять из общеизвестных компонентов, которые перебираются комбинаторным способом всеми энтузиастами ИИ. Но перебор без ума — тупое занятие, надежда на случай. Вариантов перетасовки карт больше чем атомов на Земле как известно. Поэтому в большей степени это зависит от Гения в эпоху доступности информации, который догадается, какая комбинация нужна. Для этого не нужны корпорации, корпорации их покупают как Google купил DeepMind. И сам гугл с эппл, кстати, были созданы не в стенах больших корпораций. Вероятность одинакова как для корпораций, так и для «некорпораций», но последних просто больше…

Настоящий ИИ — это не обязательно воплощение в тело робота. Это как раз одна из реализаций. Сам ИИ может быть чисто лингвистическим например. Потому, что разум в том виде, которым обладаем мы, это именно «лингвистический ум», а точнее рекурсивная лингвистическая машина как система самопрограммирования действий. Только человека можно научить делать что-то новое для него, только рассказав ему это. Тело возможно необходимо для реализации концепции embodуing mind (телесного ума), развиваемый Лаккофф Дж. и Ко. в когнитивной психологии. Суть его кратко в том, что все наши репрезентации и ментальные концепции являются производными метафорами, базирующимися на простых пространственных и телесных представлениях. Но это не ограничение для ИИ, так как нам нужен не эволюционирующий ИИ, а конечный. А его можно создать на достигнутых концепциях, имея ввиду, конечно, их исходный «код».

0

Регистрация безналоговой компании в Эстонии

Xom Nov 29 2014 at 20:50

Если не ехать в пятницу после обеда в Нарву, то пройти легко ) Гражданина Эстонии теперь не обязательно иметь в напарники по бизнесу, а пребывание в Эстонии — для ведения бизнеса и требуется. Нацистки там тетки или нет, но 12000 сограждан их редуты преодолели )) Конечно, не без помощи местных юристов. Отношение к русским очень сильно зависит от того как вы сами себя ведете и для чего приехали. Если по делу и с деньгами, примут как родного. Есть еще один плюс — общий язык с 50% населения. В Таллине и Тарту — почти 80%. Близость культуры и менталитета очень важны для ведения бизнеса. И в Англии если делать, то там вид на жительство получить на порядок сложнее. Или на порядки дороже.

0

Регистрация безналоговой компании в Эстонии

Xom Nov 29 2014 at 12:57

(продолжаю сорвавшийся в инет текст, прелатами = представлять), то через год можно получить вид на жительство с правом ездить по Европе в гости к клиентам. И пребывать там более 90+90 дней в году. Кстати, если автор может поделиться координатами эстонских юристов, в личку, буду очень признателен.

0

Регистрация безналоговой компании в Эстонии

Xom Nov 29 2014 at 12:50

Есть ещё пара преимуществ Эстонии. Для живущих в Питере — это полтора часа до границы. И можно самому прелатами себя в органах, если что. И самое интересное — если платит за него, или даже за себя как директора там налоги

0

7 причин роста стоимости компании Dropbox до 4 миллиардов долларов

Xom Nov 29 2014 at 11:52

Автор статьи по моему сильно заблуждается. Все описанные приемчики применяют и другие, но это не даёт такой эффект. И не может дать. Причина в том, что когда был популярен гугл драйв, он позволял хранить и редактировать доки в своём формате, а дропбокс — в формате ворда с быстрой синхронизацией компа с облаком. Вот и весь секрет быстрого набора пользователей. Плюс линукс.

0

Борьба за покупателя или как купить лояльность?

Xom Nov 18 2014 at 23:44

телевидение работает далее на тех, кто сейчас в рекламируемом товаре не нуждается. он пройдёт когда понадобиться в тот магазин, который рекламировался. потому что он теперь его знает. поэтому м видео. почте рекламируется активно на ТВ, несмотря на то что вы его отнесли к прошлому.

0

1 2 ...

23