Pull to refresh
-26
0
Эдуард Хачукаев @Cybersoph

Разработчик Баз Знаний и Баз Смыслов

Send message

А разве нейросетки способны самообучаться? Разве нейросетки это не программы, использующие алгоритмы от разработчиков для выявления ЗАКОНОМЕРНОСТЕЙ в массивах Данных?
Разве человек умеет решать задачи без алгоритмов, основанных на Знаниях?

Вообще-то то, что автор назвал «Граф знаний», на деле является Графом Семантических Связей — ГСС, что далеко не тождественно друг-другу.
Граф Знаний пытаются сформировать давно, но проблема заключается в неразработанности машинного формата «Знаний».
С появлением реального Графа Знаний появится и СИИ — Сильный Искусственный Интеллект, способный к мыслительной деятельности.
А так, в целом, зачётная статья.
Тааак, проверим… Берём сложносочинённое предложение на русском языке и смотрим, что выдаётся на выходе на английском языке:

«Не заметив, что на мосту, где было совершенно темно, шоссе, давно требующее починки, о которой некому было позаботиться, размыто дождями, в этих местах почти не прекращающимися, покрыто выбоинами, заполненными, о чем было нетрудно догадаться, густой грязью, завалено мусором, велосипедист, как мешок с картошкой, со всего маху свалился в яму.»

«Not noticing that on the bridge, where it was quite dark, the highway, which had long been in need of repair, which had no one to take care of, was blurred by the rains, in these places almost constant, covered with potholes filled, which was not difficult to guess, dense mud, swamped with garbage, cyclist, like a sack of potatoes, with all the fly fell into the pit.»

На «интеллектуальный» перевод мало похоже. На смысловой перевод — тем более. И вот почему:
1. Смысловой кластер «cyclist fell into the pit» не выделен и не поставлен во главу предложения в соответствии с правилами английской грамматики.
2. Идиоматические выражения типа: «со всего маху» переводит подстрочным методом конца 70-х годов прошлого века.
3. Инкрустированные в смысловые конструкции пояснительные обороты не выявляются первичным анализом текста на русском языке и потому на языке перевода выглядят неграмотно.

А с чем сравнить?
Вот перевод от Яндекс:

«Without noticing that on the bridge, where it was completely dark, the highway, long in need of repair, which no one could take care of, was washed away by the rains, in these places almost non-stop, covered with potholes, filled, as it was easy to guess, with thick mud, littered with garbage, the cyclist, like a bag of potatoes, fell into the hole at full speed.»

Не лучше справляется и Гугл:

«Not noticing that on the bridge, where it was completely dark, the highway, which had long needed to be repaired, which no one had to take care of, was washed out by the rains in these places almost not stopping, covered with potholes, filled with what was easy to guess, thick dirt, littered with garbage, a cyclist, like a bag of potatoes, fell into the pit from all over.»

Желательный по качеству английский вариант перевода должен быть хотя бы на следующем уровне:

<The bicycle-rider fell down into pit likewise a bag with potatoes not noticing that the highway on the bridge, where it was completely dark and no one long time had to take care of about it’s repair demanding, is blurred by rains in these places almost not stopping, covered with potholes, thick by mud, that was not hard to guess, and filled with garbage.>

В этом случае можно говорить уже об «интеллектуальном» или «смысловом» переводе.

Группа учёных из Ижевска под руководством Останина А.Л. сделала ОТКРЫТИЕ в области иммунологии и получила на это ДИПЛОМ НА ОТКРЫТИЕ в США!
Далее, этот же коллектив создала инновационный продукт C.E.S.I., защитив его несколькими патентами, в том числе и международными, который может повысить уровень иммунитета человека в 2 раза, в 10 раз, в 100 раз и даже более, причём сравнительно очень быстро.
В результате применения CESI больной раком даже 4-й степени тяжести, которому врачи отводили жить не больше недели, вставал и уходил здоровым. Не нужны операции, химиотеапии, БЦЖ, облучение и пр.
У российских учёных 100% результат!!! Более того, препарат CESI позволяет замедлить старение организма и оздоровить неонкологически больные органы.
Если кому-то, от которого отказалась традиционная медицина, нужна срочная помощь в лечении рака, то можно обратиться в их московский научно-исследовательский центр.
А почему вы априорно отрицаете тот факт, что в памяти компьютера может храниться что-то кроме самого ответа в текстовом виде?

Rikkitik, семантические оси, «Семось» Ёлкина и многое другое, включая и Ваш пример, мы действительно изучали, но постепенно отбрасывали за импотентностью по отношению к конечной цели.

Наконец, мы перешли к визуализации текста и развили его до протокола обмена между машинами в формате:
Dynamical Binary Latent Variable Models for 3D Human Pose Tracking.

Мы развиваем именно этот формат для Знаний. Но если Вы знаете что-то лучшее, то мы будем Вам благодарны за инфу, да и заодно поделимся деньгами шейхов, мы не жадные.

Если это столь Вам интересно, могу прислать гифки, на которых строятся наши разработки. Пишите в личку.
У меня в памяти есть вопрос «когда был написан первый том ХТК» и ответ на него — «1722». Согласно определению, это знание. Теперь я открываю QnAMaker, и вбиваю в него тот же вопрос и ответ. Получаю «ассоциативную связку вопроса и ответа, запомненную в памяти». Это знание или нет?

К сожалению, НЕТ, уважаемый lair!
Нет, потому что Вы вбиваете в прогу КОД, кодированную инфу, которая призвана обратиться к той части памяти человека, где в формате человеческого сознания записан вопрос, соответствующий языковому коду.
А потом уже этот «памятный» вопрос вызывает в сознания «памятный» ответ.
Мы только можем догадываться в каком именно формате хранятся Знания в человеческой Памяти (в Сознании).
Если это было бы так легко, как Вы описали, то думающая машина давно была бы создана. Но не всё так печально. Дождитесь продолжения этой темы и возможно, что ответов на Ваши вопросы будет больше.
lair
В моей же терминологической системе ряд способностей (capabilities) разрабатываемой системы — это процессы.

Ну, вот, Вы и вставили свои полноценные три копейки, хотя я и отвечал не Вам, а Rikkitik. Но мне это нравится, когда люди высказывают свои мнения, а не освистывают актора, что является контрпродуктивным занятием. Мне также понятно, что Вы ревнуете.
В чём же Ваша методологическая ошибка? Вы, наверное, не слышали про «фантомные» слова. Их, как бы нет в тексте, в речи, но они незримо присутствуют. Поэтому у Вас не «автообновление», а Процесс автообновления. Просто люди привыкли сокращать свою речь, опуская слова и подстраивая оставшиеся слова под требуемый синтаксис.
Rikkitik
Кстати, чем вам не нравится описание процесса мышления как способности принимать решения на основе связей и закономерностей данных, поступивших за время существования особи?

1. Процесс мышления у Вас тождественно понятию «способность».
Во-первых, Вы отождествили термин, имеющий временную основу с термином, имеющим свойственность. Процесс не может быть способностью. Это и методологически неверно.
Во-вторых, способностью обладают Объекты, а Процесс не относится к Объектам. Процесс характеризует состояние Объекта, например, Процесс движения, затухания, получения и так далее.

2. Когда даётся какая-либо дефиниция термина, то методологически правильно описать Модель раскрываемого понятия. Например, «треугольник это геометрическая фигура, образованная тремя отрезками прямых линий, соединённых последовательно в замкнутую цепь, образуя три внутренних угла фигуры». Подобное описание позволяет, как по заданной программе, восстановить в сознании Модель термина «треугольник» и чётко представить себе его форму. Поэтому такие дефиниции как: «Бег — это способность передвигаться» не является строгим определением. Правильно сказать, что: «Бег это процесс передвижения...» А потом уже сказать, что: «Способностью к бегу обладают люди, животные...» Если же Модель не строится, то и смысл понять невозможно. Например, «звук вкуса обоняет слух». Синтаксически верно, а Модели нет.

3. Мышление это Процесс последовательных процедур, осуществляющих анализ входной информации и синтез решений на основе результата анализа. Человек анализирует с помощью Знаний и синтезирует с помощью Знаний. Машина это делает пока при помощи Данных, которые поступают на её вход. Соответственно, и результат. Если бы она умела анализировать при помощи Знаний, то могла бы задавать вопрос: «А почему это на входе у меня Х, а не Z? Давайка я узнаю это!» Пока что машина «мыслит» только одним условным оператором (импликативным операндом), а у человека их аж 8 (восемь!).

lair
//Критики постулата нет//
Это тоже неправда, кстати, я вам уже высказывал по поводу проблем в ваших утверждениях.

Где rjyrhtnyj критика постулата, что «Мышление основано на оперировании Знаниями? Ау, где аргументированное опровержение?»
Есть только оценки типа: «вода», «неправда» и так далее.

oryorangepants
то, что вы написали — сплошная вода без каких-либо реальных результатов и метрик

Ок, назовите метрики процесса Мышления. Будем оперировать Вашим метриками, которых, я подозреваю у Вас самого не имеется и хотели бы узнать от меня.

Mike_soft
на мой взгляд, более важная для государства задача — не подпускать вот таких к «денежным вливаниям».

Тут саудиты объявили конкурс на разработку программы «Цифровой Пророк». Денег вывалено немало — 10 лямов зелёными.
Суть проекта в том, что требуется создать такую программу, которая устранила бы основную проблему в Исламе — разночтение в анализе проблемных ситуаций в Исламе и разные способы их преодоления. Причину разнообразия видят в одном. Отсутствие живого Пророка (сас), анализ ситуации и синтез решения проблематики которого всегда были единственно правильными.
С этой целью планируется программным образом переработать Сунну Пророка (сас), чтобы извлечь на машинном уровне все Знания из неё и понять технологию Посланника Аллаха (сас), на основе которой он принимал свои решения, изложенные в Сунне.
Данным проектом саудиты планируют объединить мусульман разных сектантских направлений и устранить тем самым имеющиеся в их обществе противоречия и конфликты.
Итак, тот, кто докажет, что он сможет создать такую программу, получает на свои изыскания 10 млн USD.
Что тут плохого?

Конструктивный коммент — это приведение альтернативного примера в решении обсуждаемой проблемы.
Есть постулат о том, что машине для понимания Смысла (текста, контекста, ситуации) нужны Знания. Постулат либо принимается, либо критикуется.
Критики постулата нет, принятия — тоже. Комменты сводятся к стебу.
Lair
Ухищрения — это то, как вы раз за разом отказываетесь проходить любые стандартные метрики на понимание текста, что о многом говорит.

Вооо… Это очень важно! Спасибо за информацию, Вы нам сильно помогаете.
Rikkitik

Не совсем так. Мы говорим, что Супер Интеллект можно построить только на основе функции «Мышления», которое, в свою очередь, базируется на Знаниях. Это во-первых. Во-вторых, мы утверждаем, что пока машина не может оперировать Знаниями, поскольку не определён машинный формат Знаний, о чём я собираюсь рассказать в следующей публикации.
Если Вы считаете, что мы гордимся этими двумя заявлениями, то таки ДА!
Какие результаты показывает ваша машина на Winograd Schema Challenge, датасет 16-го года?

Виногрвд — пока это всё лингвостатистичекая обработка естественно-язычных текстов. Ухищрения, одним словом.
Мы же говорим о создании Национального Корпуса Знаний — задача государственной важности и уровня государства. Большие денежные вложения в секретные, в общем, дела.
Поэтому дерзайте! Возможно, что именно Ваш машинный формат Знаний будет наиболее удачным, например, для России.
Так то же самое и о вашей работе можно сказать, слово в слово — откуда же у вас такое стойкое чувство превосходства?

Сказать, конечно, можно всякое..., но!
Вот проанализируем типичный пример, который распознаётся «мыслящей машиной».

"Следователь прокуратуры Татьяна Кротова изъяла деньги в квартире Собчак. Теперь она просит вернуть их ей".

Современная лингвистика может сказать, сколько здесь глаголов, существительных, местоимений и всё такое прочее. Поняла бы машина только на основе законов и правил лингвистики, кто она, кому что вернуть и так далее? Нет, конечно! Почему? Потому что обрабатываются Данные — здесь графемы, которые имеются в БД в виде словарных статей и ВСЁ!
А мы говорим, что в памяти машины должны быть Базы Знаний, чтобы машина понимала, о чём идёт речь. И без Знаний этого не достичь. То есть, в машине должны быть записаны в особом формате «Знания о Мироздании», применяя которые машина легко обходит проблемы полисемии — омонимии, анафоры… и распознаёт Смысл контекста не хуже человека. Но для этого, повторюсь, нужны Знания в машинном формате.
В этом фишка нашего подхода к Супер Интеллекту. Другие же утверждают, что искомой цели можно добиться и одной обработкой Данных, как это наблюдается у Моделей Имени Варламова.

Уважаемый автор, а что вы думаете про технологию МИВАР? Там вроде научились извлекать смысл из текста. И создавать базы знаний на основе миваров.


Я не знаю, может быть Вы из фирмы господина Варламова и могу Вас чем-то обидеть, но всё же скажу следующее.
Я Варламова знаю лично, бывал неоднократно на его фирме и знаком с его технологией извлечения «сущностей» из текста методом "Моделей Имени Варламова".
Конечно же, никакого смысла из текста там не могут извлекать, никаких «Баз Знаний» тоже нет. Одни БД.
Если же Вы сможете показать мне как «мивары» извлекают смысл и, тем более, покажете «базы знаний», то я был бы Вам очень признателен.
lair
Во-вторых, почему в качестве эталона «нормального человека» выбирается именно двухлетний ребенок, а не человек любого другого возраста?

Прошу Вас внимательно читать и понимать мои тексты.
Фраза про двухлетку была моей РЕПЛИКОЙ (как пример) на Ваше абсурдное утверждение об обучении любого человека по книжкам и аудиозаписям. Ведь это может относить ко всем детям и двухлетним и трёхлетним.
Неужели трудно понять, что человека сначала обучают языку и заполняют его память Знаниями в виде ассоциации Образов и их языковых идентификаторов.
lair
Представляю ребёнка-двухлетку, учащегося по книжкам или аудиозаписям известных профессоров.
Вначале дети набираются азов Знаний с помощью учителей.
И только потом переходят к САМООБУЧЕНИЮ, которое не надо путать с обучением.
lair
PS по моему мнению, «понимание» текста — это способность дать на поставленный к тексту вопрос такой же ответ, какой дал бы человек или, если мы не доверяем одному человеку, группа экспертов. Соответственно, «такой же» — это либо точное совпадение, если оно возможно в задаче (в SQuAD, если я не ошибаюсь, именно так, там ответом служит слово из текста), либо «принятый за равный» аналогичной группой экспертов.

Ок, как говорится, я «понимал» Ваше «понимание». Спасибо Вам, что ответили.

Теперь я должен ответить Вам на Ваши вопросы. Извиняюсь за стиль написания – это наследие пребывания в Массачусетском ТИ, где привык к такому стилю.

Итак, по-Вашему понимание => «способность». И Ваша дефиниция на мой взгляд соответствует простому синтаксическому разбору предложения. Ладно.
Вы знаете, что дети до школы не владеют ни морфологией, ни синтаксисом, но тем не менее прекрасно понимают взрослых без этих разделов лингвистики.

По-нашему сие трактуется как:
Понимание – это Процедура распознавания чего-то (например, смысла контекста) путём аналитического сравнения распознаваемого объекта (например естественно-язычного текста) с хранящимися в памяти человека (а в будущем и в базе компьютера) эталонами смыслов, в результате которой (то биш — процедуры) либо идентифицируется анализируемый объект как понятый и не требующий дальнейшего распознавания, либо как непонятый и требующий дальнейшего распознавания.

А вот способностью к пониманию смысла пока обладает только человек. В то же время способностью к пониманию данных обладает и животное и компьютер, поскольку у них есть Память Данных и, соответственно, База Данных.

Технология понимания смысла человеком построена на методологии сравнения с базой смыслов, хранящейся в его памяти, и инструментарии в виде языка и знаний, которыми он владеет.

Таким образом, постулируем, без языка и знаний нельзя извлечь Смысл, то есть невозможно понять!

Дело в том, что сегодня компьютер способен распознавать только Данные, например, отдельные слова и символы, хранящиеся в БД. Но человек с помощью слов строит словесные конструкции, которым придаёт новые значения (смыслы). И если этих смыслов нет в компьютерной памяти и нет знаний в машинном формате, то и сравнивать нечего ни с чем.

Эти проблемы решены нами теоретически и воплощаются в практической плоскости.

Далее Вы спрашиваете: «насколько хорошо ваш прототип справится с этой задачей?»

Ответ: «На 100%, если в Базе Знаний компьютера имеются все необходимые Знания».

Следующий Вас вопрос: «Вы утверждаете, что задача SQuAD вам не подходит как метрика? Объясните, почему.»

Ответ: «Потому что скуадовские метрики, или добрая дюжина других «форматных знаний» — суть односложные Данные. Знания, с помощью которых мы понимаем Смысл, сокрытый языковом сообщении, являются НАДЛИНГВИСТИЧЕСКОЙ структурой.
Например, идёт поток Данных: песок, цемент, вода, гравий… Здесь нет ни Знаний, ни Смыслов, хотя многие могут утверждать обратное.
В Сознании человека при произнесении этих Данных возникают ранжированные по приоритетам ассоциации: фундамент, раствор, стена, бетоноблок и такое прочее. Эти ассоциации рождают представления о конструкциях, в которых используются эти компоненты, то есть, Данные.
Нормальный человек обучается двуканально, то есть, аудио-визуально. Ребёнку бабушка показывает пальчиком на маму и произносит «мама», показывает на папу и говорит «папа».
В сознании человека возникает устойчивая связка: визуальный фигурный Образ и аудиальный языковый Образ.
Если, например, произнесена фраза: «слух видит запах вкуса», то не имея в памяти нужных ассоциаций с соответствующими Образами, нельзя понять, о чём идёт речь. Иначе, нельзя извлечь Смысл, поскольку нет нужных Знаний.
Создание Баз Знаний и Баз Смыслов является на сегодня национальной задачей, решение которой может привести к резкому скачку в области технических ускорителей смысловых анализаторов и креаторов новых Знаний.

тестируются алгоритмы понимания текста

насколько хорошо ваш прототип справится с этой задачей?

Уважаемый lair,
Мне нравится, что разговор становится более серьёзным.
Я готов дать Вам самый полный расширенный ответ, если Вы мне дадите дефиницию термина «понимание». Что означает по Вашему мнению понятие «понимание»?
Пожалуйста, дайте ответ. От просьбы по дефиниции «разум» Вы уже ушли.
Воо, самое интересное. Почему отличается? Какие отличительные признаки этого формата?

Уважаемый lair, в день знаний 1 сентября 2017 года, адресуя свои слова всем учащимся России, Президент РФ Владимир Путин на всероссийском открытом уроке «Россия, устремлённая в будущее» в Ярославле высказал мысль о том, что тот, кто станет лидером в сфере Искусственного Интеллекта, тот «будет властелином мира».
Мы усердно работаем над этим из амбициозных соображений. На кону ну очень большой приз. Нет резона с кем-то им делиться, когда в руках целый журавль вместо мелкой синицы. Я и так дал Вам сильную наводку.
А Вы бы поделились в этом случае?
1
23 ...

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity