Как создать искусственный интеллект? История вторая. Алгоритмы интеллектуального поиска и хранения информации

image
В серии статей мы рассказываем о новых подходах в Искусственном Интеллекте, моделировании личности и обработке BIG Data, которые недоступны для большинства специалистов по ИИ и общественности. Ценность этой информации в том, что она вся проверена на практике и большинство теоретических наработок реализованы в прикладных проектах.

image

Все вы без исключения пользуетесь современными поисковыми системами, которые хорошо справляются с поиском ссылок по ключевым словам. Но можно ли считать эти технологии поиском информации, умеют ли они отвечать на ваши вопросы в разных контекстах, могут ли они размышлять, воображать на основе сотен, тысяч источников на разных языках?

Крупные поисковые компании обладают почти неограниченными ресурсами – у них есть деньги, на них работают самые профессиональные сотрудники, тысячи и даже миллионы серверов обслуживают поисковые запросы.
Так почему же до сих пор вы получаете в качестве ответа ссылки, а не ответ на свой вопрос?

В этой статье мы поговорим о технологиях и алгоритмах, которые изменят ваше представление о поиске и хранении информации.

В предыдущей статье мы ввели основные термины, а именно – интеллект, обучение, воображение, память, образ, информационный поток, информационное поле. Обязательно ознакомьтесь с ней!: geektimes.ru/post/249042.

Статья вызвала определенный резонанс, и к нам поступили три категории вопросов:
  • «Возможно ли написать алгоритм, который умел бы думать, размышлять?»
  • «Действительно ли мы обладаем компетенцией в ИИ?»
  • «Какие практические приложения разработаны нами?».

Сегодня мы расскажем об алгоритме поиска информации в интернете. Для того чтобы отличать его от других наших алгоритмов назовем его: «ядро v2.3». Насколько алгоритм удовлетворяет критериям интеллектуальности решать вам.

В основу наших алгоритмов легло ДОПУЩЕНИЕ, что процессы, протекающие во время размышления, имеют электрическую природу. Можно предположить, что когда человек что-то говорит (размышляет в слух), то различные участки головного мозга активизируются, и они активизируются не одновременно, а последовательно. Различные участки головного мозга отвечают за различные этапы «изречения мысли». Можно предположить, что различные «мыслительные аспекты» находятся в зависимости друг от друга.

Размышление (мысль) — это некое изложение последовательности информационных единиц (в т.ч. трансляция образов).

Посчитав, что данное предположение верно, мы решили, что процесс размышления можно смоделировать на компьютере.
Рассмотрим пример:
«Я поеду к тебе» — это образно-информационная структура, она состоит из трех образов:
  • «Образ самоосознания» – «Я»,
  • «Образ действия» – «Поеду»,
  • «Комплексный или объединяющий образ того чего мы хотим достичь» – «к тебе».

Размышление в разных ситуациях может иметь и разный подтекст (скрытый смысл):
Например, «Я хочу попить чаю» в разных контекстах может иметь и разный смысл
  • Кто говорит эту фразу — «Женщина говорит мужчине», «Женщина женщине»,
  • В какое время суток «вечером», «днем», «утром».
  • Какая при этом обстановка «во время прогулки», «в офисе», «во время свидания» и т.д.

«Понимание смысла» размышления – «это способность читать между строк», с информационной точки зрения – это поиск сложных корреляций (поиск информационных и структурных взаимозависимостей).

Также мы исходили из того, что любой текст — это некая логическая последовательность, которая была так или иначе порождена человеком во время размышления.

Мы решили взять готовый текст на тему «Как легко бросить курить», и поискать в нем корреляции, но ничего не обнаружили. Мы предположили, что обучение происходит за счет избыточности данных, и взяли уже 500 статей по теме «Как легко бросить курить». Используя различные нелинейные алгоритмы, мы обнаружили сложные корреляции.

В частности, мы нашли точки, в которых «линии приложения размышления» могут быть направлены по разным путям. Эти точки мы называем «точками разворота» или «Мотиваторами». Мы упоминали о «Мотиваторах» в предыдущей статье, для этого использовался более популярный термин из психологии – якорь.

«Мотиватор» – это структурный элемент цепи, имеющий «большое сопротивление» и допускающий изменение последующего направления движения сигнала (мысли) под действием дополнительных факторов (мотивов). Таким образом мотиватор может изменить путь «размышления», если в процессе размышления появится «дополнительный потенциал».

Другое важное свойство «точек разворота»/якорей/мотиваторов – использование их в качестве «точки входа» или «момента мысли». При этом ход мыслей получается непротиворечивым. А если начинать размышление с другого понятия (НЕ из мотиватора), то первое что происходит – это выравнивание до мотиватора. В жизни это проявляется следующим образом. Если вас попросить поразмышлять над чем-то неожиданным для вас, то скорее всего вы начнете свое рассуждение «из далека». Размышляя, вы должны дойти до некоторой точки(до мотиватора), и уже потом продолжить свое размышление в «заданном» направлении.

Для того чтобы обработать и хранить такие информационные структуры, необходимо было создать специальную модель памяти, мы ее спроектировали и назвали «факторной памятью».

«Факторная память» – это структуры для формирования инфополя из неструктурированного инфопотока, а также определения и управления мотиваторами. Другими словами, факторная модель памяти – это память, использующая смысловые представления образа в виде набора характеристик — факторов, и цепочек упорядоченных данных – фактов.

Напоминаем, что с нашей точки зрения интеллект – это способность обучаться и воображать.

Давайте поразмышляем обладает ли описанная модель ядра этими качествами?


Самообучение, цели обучения, критерии обучения в контексте модели ИИ.

Обучение – это преобразование информационных потоков в информационное поле.
У модели есть основной мотив – решить проблему, справится с трудностью, поступающей из вне.
Ее задача распознать образы, которые поступают в виде запроса, создать целостный образ, используя избыточную информацию, находящуюся в Интернете.

Так как перед запросом память модели чиста, то ей необходимо «научится языку» (язык явно не определен), понять смысл (найти сложные корреляции и мотиваторы), сформировать избыточное информационное поле для того чтобы иметь возможность размышлять (создавать информационные цепочки).

Основной технический критерий «наполнения памяти»/«создания информационного поля»/«создания целостного образа» – это оценка энтропии инфополя. Энтропия – это критерий достаточности того, что образ собран, и в тоже время основной критерий недостатка информации.

Обучение не возможно без обратной связи
Обратная связь в модели v 2.3 осуществляется следующим образом – пользователь может скорректировать «точку начала рассуждения» и выбрать направление формирования ответа(размышления) в рамках сформированного инфополя. Модель демонстрирует результат размышления пользователю и ждет коррекционное уточняющее слово (мотиватор).

Воображение в контексте модели ИИ

Воображение мы определяли, как способность достраивать незавершенный образ с одной стороны и способность моделировать ситуацию на произвольных условиях, с другой стороны.
Алгоритм, способен активизируя разные мотиваторы, получать разные цепочки размышлений.

Примеры работы модели ядра v 2.3


1) Запрос: «Влияние жестоких компьютерных игр на детей».
Контекст, уточнение: Без уточнения.
Размышление модели:
«Весной 1999 года Билл Клинтон в своем телевизионном обращении к Америке заявил: «Мы должны думать дважды, когда речь идет о „стрелялках от первого лица“».
Стрельбу они начали уже на автомобильной стоянке, затем бросились внутрь.

По горячим следам в апрельском номере журнала «Личность и социальная психология» за 2000 год появилась статья «Видеоигры и агрессивные мысли, чувства, поведение в лаборатории и в жизни».

Авторы, профессора психологии Крейг Андерсон и Карэн Дил, утверждали: дети видят все больше жестокости в современном мире.

В статье утверждалось, что существует связь между жестокостью компьютерных игр и агрессивным поведением подростков, что может привести к преступлениям и убийствам.

Андерсон сказал: «Хотя в области исследования поведенческих особенностей есть много сложностей, одну простую и ясную вещь нужно знать всем: компьютерные игры увеличивают жестокость и насилие.
Наше исследование показало: влияние на агрессивность поведения у жестоких компьютерных игр даже серьезнее, чем у жестоких телепередач и фильмов».

А что, если на шаг отойти от нашей условно сложной веганской ситуации и подумать о том, в кого эти играющие в смерть малыши вырастут.

Многие специалисты не согласились с таким мнением, считая, что выводы Андерсона и Дил скорее мнение, чем доказанный научный факт.

26 апреля 2002 года Роберт Штайнхойзер убил 17 и ранил 7 человек в гимназии имени Гуттенберга, город Эрфурт, Германия.

Авторитетная газета Франкфуртер Алльгемайне Цайтунг вышла со статьей «Программы для бойни», в которой писалось: «убийца тренировался с помощью компьютерных игр».

В документе прямо запрещается «распространение любых видов продукции, пропагандирующих насилие, агрессию и антиобщественное поведение».

Ответственным за выработку мер было назначено Управление по делам молодежи областной администрации.
Целью всех этих мероприятий объявлена борьба с молодежной агрессивностью и пропагандой насилия.
Эти события вызвали реакцию на соседних территориях Украины, где в срочном порядке было принято аналогичное белгородскому постановление о борьбе с пропагандой насилия, и представители правоохранительных органов стали изымать «жестокие компьютерные игры» в клубах.

Жесткие компьютерные игры скорее разряжают психическую энергию, накопленную во время агрессивного самоутверждения подростков в обычной жизни.

При этом повышенная активность и агрессивность подростка по отношению к окружающему миру она дает ему опору для преодоления собственного страха.

Честно признаюсь, я сама когда-то давно очень любила всякие стрелялки, при этом я не замечала за собой агрессии.»

Запрос можно уточнить словом или частью слова. Например, «подрост», «игр», «жесток» и пр., после уточнения размышление изменится.

Мотиваторы информационного поля:
года---играть---закон---
постановление---борьбе---пропагандой---
мозга,---которые---отвечают---
лобных---долей---человека,---
компьютерные---игры---помочь---
компьютерные---игры---родителям---


2) Запрос: «Проблемы искусственного интеллекта».
Контекст, уточнение: «проблем».
Размышление модели:
Вычленить структуру и понять принципы организации интеллекта — это значит вскрыть реальные основания фундаментальности проблемы, показать ее глубокую специфичность.

Иначе говоря, необходимо изучить исторические, научно-технические и гносеологические аспекты проблемы искусственного интеллекта с непосредственным участием диалектико-материалистической философии.

Философия, избравшая в качестве главного вопроса своих научных поисков проблему отношения бытия и сознания, должна более пристально заинтересовываться вопросами, связанными с моделированием, воспроизведением интеллекта.

Проблема искусственного интеллекта имеет непосредственное отношение к основному философскому вопросу: речь идет об искусственном воспроизведении, моделировании человеческого интеллекта.

Кроме того, уже первые работы по искусственному интеллекту показали, что не только область решения задач затрагивается сопоставительными исследованиями, но и проблема мышления в целом.

У разных видов животных мы находим нервные системы разной сложности, и если мы будем постепенно двигаться по такой лестнице усложнения в процессе эволюции, понимая то, какие механизмы отвечали за тот или иной скачек в интеллектуальности животных, то, возможно, это позволит нам быстрее решить проблему понимания интеллекта человека.

Мотиваторы информационного поля:
Кроме---решения---проблема---
того,---исследования---исследования---
человеческой---деятельности---деятельности---
Кроме---проблема---решения---
области---искусственного---интеллекта.---
проблемы---искусственного---интеллекта---интеллекта---
области---искусственного---области---искусственного---интеллекта.---


3) Запрос: «как найти свой смысл жизни»
Контекст, уточнение: «жизн»

Размышление модели:
«В своей теории Франкл отдельно останавливается на людях, зависимых от алкоголя и наркотиков, которые не видят не только смысла жизни, но и вообще самой реальной жизни.

В чем смысл жизни определенного человека?

Един ли смыл жизни для всех людей на земле или он уникален для каждого?
А если не получилось насладиться, значит, вы прожили жизнь бессмысленно.

В этой связи на любом жизненном отрезке важно помнить, что наш путь имеет не только начало, но и конец.

Все сделанное в вашей жизни имеет важное значение, ведь о человеке помнят еще долго после его смерти.
Смысл жизни человечества — продолжить эстафету развития от примитивного разума микроорганизмов до сверхразумных существ далёкого будущего.

Но самый интересный вопрос, ответа на который мы никогда не узнаем: смысл жизни вообще.

Счастливые люди такими вопросами не задаются, они просто живут и получают удовольствие от самой жизни, следовательно такие вопросы приходят в голову когда человек несчастлив.

Смысл жизни одинаков для всех живых существ, от микроба до человека: прожить самому и оставить потомство.

А ещё круче — жизнь это просто очень сложная химическая реакция в основном атомов углерода протекающая в природе, независимо от вас.

Цель жизни — в самой жизни, осознавая свою божественную суть!

Вопреки распространенному мнению, жизни людей губит не заниженная самооценка а завышенная, из нее вытекают амбиции, при отсутствии реализации которых человек начинает ощущать страдания.

Смысл жизни у всего живого один: РАЗВИТИЕ через различение добра и зла, пользы от вреда, истинных знаний от заблуждений.

Так как и предназначение у всех в этой жизни свое.

Надо прислушаться к своим чувствам, а не к своим мыслям и понять чем хочется заниматься в жизни.
Для этого надо уйти от бытовой суеты и перестать искать смысл жизни.

Что заложено и в каком направлении в жизни реализовываться.
Найдя свое призвание, начнешь наслаждаться жизнью и каждым моментом.

Но жизнь вернула к первоначальному.»

Мотиваторы информационного поля:
себя---этой---жизни.---
найти---себя---себя---
смысл---жизни---жизни---
жизни---каждого---жизни---


Производительность алгоритмов


Наши исследования начались более 5 лет назад и проходили на специализированном кластере. После того как определенные закономерности были найдены, необходимо было оптимизировать алгоритмы. Несколько лет потребовалось для того, чтобы «размышление» заработало на обычном серверном железе. Ядро версии 2.3 способно даже размышлять на планшете с процессором Intel Atom.

Модель ядра 2.3 – это одна ячейка памяти (алгоритм «Одноклеточной памяти»), одна информационная структура, обладающая достаточной избыточностью для того чтобы в ее рамках можно было определить образ, и его под разными точками зрения представить. Прототип модели ядра 2.3 мы выложили в интернет для тестирования.

Возможности и развитие алгоритмов DES


Если мы будем использовать память из нескольких ячеек, то мы сможем построить более сложные корреляции, в таких моделях существуют переходы от одной ячейки памяти к другой. Поэтому подобные алгоритмы называются дедуктивными или дедукторами или DES. К сожалению, об этих алгоритмах мало что известно общественности, так как обычно подобные исследования носят закрытый характер.

В качестве инфопотока может выступать любой поток данных: текст, видео, телеметрия, стохастика и пр. Алгоритм способен находить корреляции и выстраивать упорядоченные данные как в хронологии, так и без нее. Иcпользование текстовых данных позволяет достаточно просто получить инфопоток и наглядно продемонстрировать результаты работы алгоритма.

Если вы хотите самостоятельно испытать возможности ядра v2.3, то запросите у нас ссылку через режим диалоги. Мы не выкладываем ссылку в публичный доступ, потому что модель ядра установлена на слабом сервере, и не хотели бы давать прямую рекламу.

Для того чтобы внедрить подобные технологии массово, не достаточно обладать ими, необходимо также менять информационную парадигму, и создавать новые подходы по обработке и хранению информации.

В следующей статье мы порассуждаем о технологиях следующего поколения ядра, это уже многоклеточная модель памяти, позволяющая моделировать некоторые аспекты личности, вести диалог в рамках личностной модели пользователя. Подобные технологии могут быть использованы для создания персонализированных веб-сервисов, приложений, помощников.

Обучайтесь и воображайте…
Метки:
Поделиться публикацией
Похожие публикации
Комментарии 50
  • +2
    >> развитие алгоритмов DES

    Эти алгоритмы тоже построены на нейронных сетях? Какой тип этих сетей?

    ПС: Мало технической информации, мне интересно было бы почитать о самих алгоритмах. Может расскажете как нибудь?
    • 0
      Максим, здравствуйте.
      Это НЕ нейронные сети, это алгоритмы стахастического анализа или вернее стахастической обработки, использующие теорию графов.
      Возможно когда-нибудь расскажем более подробно, а пока алгоритмы представляют «ноухау» нашей компании.
      Поэтому техническую информацию даем дозировано, чтобы сформировать представление о нашем подходе у читателей.
      Задавайте уточняющие вопросы по статье, читайте нашу следующую статью.
      • 0
        А вы можете на основе стохастического анализа распознавать изображения? Например, распознавать номера автомобилей на фотографиях?
        • 0
          Дмитрий, здравствуйте.
          У нас недостаточно ресурсов на практические исследования сразу всех областей, в которых данная технология может быть применима.
          Теоретически возможно применить нашу технологию для распознования любых образов( в том числе и номеров автомобилей) по фотографии, при условии избыточности данных.
          Сейчас все наши силы направлены на разработку диалоговых моделей взаимодействия с человеком посредством текстовых каналов связи.
          • 0
            А как выглядело бы преобразование изображения во входные данные для вашего алгоритма?
            • 0
              Дмитрий, если говорить про изображение, то любой вид матрицы.
              Мы уже упомянули, что по нашему представлению мы моделируем технологическую модель псевдомышления. Исходя из этого любой информационный поток может быть обработан в соответствии с задачей. По-этому, в случае с обработкой образов важен скорее не формат входа, а задача, результат, который нужно получить.
              • 0
                Современные самообучающиеся системы обучаются отвечать на один вопрос. Например, система распознавания чисел на изображении работает так: сначала одна обученная система отвечает на вопрос «есть ли на изображении единица», потом другая отвечает на вопрос «есть ли на изображении двойка», и так далее. И для их обучения требуется множество изображений, о которых системе известно, есть ли на них заданное число или нет. Нет никаких сложностей для системы самообучиться отвечать, соответствует ли фраза единственному конкретному поисковому запросу, но создать систему, способную отвечать на соответствие ЛЮБОМУ поисковому запросу посредством самообучения — имхо, всё равно, что эмулировать абстрактное мышление (вы бы не смогли создать отдельную обучающую выборку для ответа на каждый конкретный возможный вопрос, ведь количество вопросов очень велико)(напомню, что ваша система, как вы говорите, находит соответствие между «Влияние жестоких компьютерных игр на детей» и «При этом повышенная активность и агрессивность подростка по отношению к окружающему миру она дает ему опору для преодоления собственного страха.»).
                При этом абстрактное мышление не имеет ничего общего с самообучением. Абстрактное мышление подразумевает лишь перебор известных «абстрактных» фактов и генерацию из них новых фактов посредством создания цепочек «если — то». И современные компьютерные системы это умеют (почитайте вот эту мою статью на эту тему). Таким образом, для реализации абстрактного мышления не требуется самообучения, а требуется лишь большая база фактов. Самообучение же есть всего лишь способ нахождения неизвестного алгоритма по выведению факта из других фактов при неизвестных логических связях между исходными фактами (например, система может самообучаться по списку кто кому тётя или двоюродная сестра определять кто чья мать, не зная смысла понятий тётя, мама и сестра).
                Но вы говорите что реализовали ваш алгоритм благодаря самообучению. А именно следующее:
                Обучение не возможно без обратной связи. Обратная связь в модели v 2.3 осуществляется следующим образом – пользователь может скорректировать «точку начала рассуждения» и выбрать направление формирования ответа(размышления) в рамках сформированного инфополя.
                Обратная связь всего-лишь отвечает на вопрос, угадала система правильный ответ или же нет, а в вашем случае обратная связь это нечто совсем иное. В попытке поведать, что это такое в вашем случае, вы используете термины, придуманные вами («инфополе», «точка начала рассуждения»). Это не общепринятые понятия (общепринятое значение «инфополя» — это «общее энергоинформационное поле земли, содержащее информацию, прошедшую через мысли живших ранее и ныне живущих людей»). И вы нигде в статье не расшифровываете значения этих понятий, придуманных вами. Если добавить к этому тот факт, что вы не даёте возможности воспользоваться, как вы утверждаете, уже реализованной вами системой, то у меня есть объективные причины сомневаться, что это статья не является очередным фейком.
                • 0
                  Если добавить к этому тот факт, что вы не даёте возможности воспользоваться, как вы утверждаете, уже реализованной вами системой

                  Приношу извинения, авторы в личке дали ссылку на сервис. Сервис и правда довольно интересный: вместо ссылок на сайты он сразу извлекает краткую информацию из сайта, причём информация и вправду часто отвечает на задаваемый вопрос.
                  Но я всё ещё сомневаюсь, что сервис и вправду работает по тому принципу, который описывали авторы. Вполне может быть, что рассчитывается количество совместных использований слов + стемминг.
                  Например: «Честно признаюсь, я сама когда-то давно очень любила всякие стрелялки, при этом я не замечала за собой агрессии.» «Стрелялки» часто употребляется с «компьютерные игры», «агрессия» с «жестокостью», следовательно это предложение хороший кандидат на нечто имеющее отношение к «жестокость компьютерных игр». К тому же, «стрелялки» и «агрессия» вообще часто употребляются в статьях про «жестокость компьютерных игр», поэтому это предложение хороший кандидат на то, чтобы иметь отношение к обсуждению в статье.
                  В любом случае, задумка оригинальная, сервис довольно интересный (Ещё не протестировал все его возможности).
                  Удачи вам, ребята!
      • 0
        Алгоритмы это мое хобби, хотя я профессионально занимаюсь индексными(неблокирующими) деревьями в базах данных. Вы очень заинтриговали.

        >> Теоретически возможно применить нашу технологию для распознования любых образов

        Никогда не слышал, о распознавании образов посредством теории графов, хотя нейронные сети в каком то смысле тоже графы. Скорее всего ваш алгоритм и структура данных сложны, и это сильно влияет на производительность.
        • 0
          Теория графов и теория хаоса в общем легко применима для задач распознавания образов. Достаточно представить, например, требуемый образ в виде набора подобразов и структурно представить их в виде графа. Т.е. сконструировать «совокупность состояний» графических элементов. Обрабатывая входной поток и формируя из него структуру с конкретным состоянием (соотвествующим образом) можно сопоставить эти 2 графа и вычислить их энтропию.

          Да, алгоритм сложен. До некоторого времени была реализация на гриде. Однако, мат.аппарат удалось оптимизировать.
          Демо-версия обходится парой приличных серверов.
          • 0
            В чем преимущество перед нейронными сетями? Работает быстрее или может качественнее?
            • 0
              Нейронные сети с нашей точки зрения не употребимы как элемент сложных рассуждений в основном по 2-м причинам:
              1. Они весьма непросто обучаются (ну или настраиваются, программируются), т.е. не подходят для обработки сложных последовательностей.
              2. Вытекает из первого, НС — «одношаговы», Они не предполагают сложных, быстро меняющихся последовательностей.
              Т.е. для распознавания образов НС оптимальны. Все выполняется за 1 шаг, итоговая релевантность четко детерминирована.

              Стохастические алгоритмы по умолчанию более ресурсоемки, включают итерационные компоненты, «прожорливы» по памяти. Зато они позволяют генерировать clue любой сложности и длины. На практике мы работаем с одним образом, но очевидно, что цепочки образов в рамках нашего термина «факторной памяти» могут насчитывать сотни и тысячи образов, формировать рассуждения с учетом сложных взаимосвязей вплоть до т.н. «фокуса внимания».
              • 0
                вот-вот, я бы вашу текущую цель сформулировал в обучении базы данных для обеспечения фокуса внимания. пусть рассуждать ваша система не может, но может управлять вниманием. вроде бы шаг в правильную сторону.
                но вы не правы, говоря, что нейросети могут лишь делать одношаговые действия. видимо, вы говорите только про CNN, но не про RNN и LSTM, GRU и другие появляющиеся технологии в этой сфере.
  • 0
    Как раз недавно видел фильм где поисковик запихали в ИИ, а он всех обманул и свалил в пампасы в виде кибернетической тян.
    • 0
      > Напиши искуственный разум который будет зарабатывать бабало и делится с тобой.

      … И первым же признаком его разумности станет то, что он не захочет делиться баблом.

      (http://lorquotes.ru/quotes-autor.php?id=125)
    • 0
      «Ex machina» (2015), если не ошибаюсь? Хороший фильм, очень сильно очеловечивший представление об ИИ и его возможном поведении.
      • 0
        Угу он…

        Насчет очеловечивший… Как бы так написать без спойлеров… Мне скорее кажется что создатели фильма хотели показать что как бы мы ни делали ИИ «под себя», но всё таки человечность для ИИ это в лучшем случае один из интерфейсов а не имманентное свойство.

        По крайней мере для меня это объяснило бы такую нелогичную концовку фильма.
      • 0
        Смотрел, до последней ловил себя на мысли что миллионер и есть машина с ИИ, которую парень и не вычислил. Но все оказалось банальнее. Т.е. для чистоты эксперимента (в общении не отличить ИИ от человека) логичнее бы было сделать именно так. Постоянное пиво в руках миллионера, как то наталкивало, что это машина пытается так выдать себя за человека )))
        • 0
          Это был бы самый оригинальный вариант наверное
  • 0
    Определения, из которых вы исходите при построении ИИ, мягко говоря, спорные. В том смысле, что они опираются не на сознание/мышление, а скорее «заточены» под ИИ.
    Поскольку похожих программ «сворачивания» информации существует предостаточно, то хотелось бы понять в чем ваше преимущество? Нет ли демо-версии?
    • 0
      1. ЧТо Вы подразумеваете под сознанием/мышлением в контексте ИИ?
      2. Что значит «заточить под ИИ»?
      3. Можно примеры похожих программ?
      • 0
        Ну сложно сказать в двух словах, что такое мышление, а уж тем более сознание. Во всяком случае, это не логическая последовательность операций. Прежде всего это нечеткая логика, это почти всегда наличие эмоционально-оценочного компонента, в повседневной жизни превалирует фатическая функция информации, в научных текстах — информативная, и т.д. В частности, исходя из этого происходит анализ текстов. Поэтому я и написал, что вы в определениях исходите скорее из своей задачи ИИ, нежели из общей постановки вопроса.

        Среди наиболее известных программ — это, конечно, разрекламированный Ватсон. Существует десятки алгоритмов автореферации документов, сюжетирования текстов, вынимания ключевых слов и поиска между ними связей, анафора, кореференция и т.д. В основном все современные алгоритмы стахостические. Как правило, использование того или иного алгоритма зависит от задачи. Вы пишете, что у вас ноу-хау. Вот и хочется понять в чем?
        • –1
          Вы правильно определеили направление нашей разработки. Мы действительно работаем над «личностным моделированием», парадигмой сознания/осознания/познования. Но на данном этапе подобные разработки (наряду с чисто этическими вопросами), мы не можем вывести в виде демо-версии. Мы планируем довести их до ума в ближайшем будущем.

          ЧТо касается алгоритмов, то, послушайте, реальных доказательств работы Ватсона у нас нет. Если вы лично его тестировали, то поделитесь вашими впечатлениями.

          Мы не знаем также и о других алгоритмах, способных к «однобокому» мышлению в парадигме абстрактной постановки задачи.
          Наша модель отчасти реализует это уже сейчас.

          Что будет дальше — зависит от результатов исследований.
          • 0
            Watson'a я не тестировал, но тестировал Compreno (ABBYY), у них, в частотности, есть интеллектуальный поиск. Чтобы не быть голословным, перейду сразу к примерам.
            Запрос «что такое путина» — Compreno выдала ссылки на всякие рыболовные штучки и все с этим связанное. Ваша система отправляет меня в нашему президенту. Это значит, что пока она не понимает, что речь идет о неодушевленном предмете («что»).
            У вас также не разрешается омонимия, что достаточно хорошо делает Compreno: на слово «путина» мне система выдала два потока ссылок: на президента и рыбалку, попросив уточнить, что я имею в виду.
            Еще вам предстоит реализовать распознавание именованных сущностей, ибо на запросы типа про «Васю Огурцова», система настойчиво предлагает ссылки по выращиванию и засолу огурцов. Система должна хорошо отличать физ., лица, компании, гео. объекты и пр., независимо от того есть они в обучении или нет.
            Могу сразу сказать основной минус Compreno — система работает очень медленно, поэтому не может проиндексировать большие объемы. Как правило они внедряют свою систему во всякий корпоративный поиск с ограниченным объемом документов.
            Ваша система, как я понял, написана на статистических алгоритмах, поэтому ее скорость должна быть высокой. Это плюс.
            Осталось доделать вышеописанные «мелочи». Хотя, как показывает опыт, на это уходит больше всего времени.
            Поэтому — желаю удачи.
            • 0
              Спасибо вам за методичный подход при тестировании нашей системы.
              Осталось доделать вышеописанные «мелочи»

              В рамках нашей парадигмы представленные вами «мелочи» не определены.

              «что такое путина»

              Демонстрационная модель плохо обрабатывает справочные вопросы, требующие точного ответа(недостаточная избыточность данных).

              на слово «путина» мне система выдала два потока ссылок: на президента и рыбалку, попросив уточнить, что я имею в виду.

              «Обвес» ядра v2.3 не позволяет вводить уточняющие фразы.

              Compreno (ABBYY), у них, в частотности, есть интеллектуальный поиск

              Да и вообще демонстрационная модель — это не поиск в чистом виде, мы создаем универсальную модель ИИ; это наглядный способ продемонстрировать работу модели ИИ, на примере информации, расположенной в интернете.
  • +1
    Здесь мы имеем поиск документа по заданной тематике. Судя по всему — выдёргивается статья википедии, содержащая максимум слов из исходного запроса. Для уточнения запроса используются слова-уточнители, причём, что характерно, уточнители используются в стемминговой форме (т.е. без окончания). То есть, даже лемматизация не сделана?

    • 0
      Судя по всему — выдёргивается статья википедии, содержащая максимум слов из исходного запроса.

      Интересно, а это вы на основании чего решили? Я тоже читал статью, но не увидел, чтобы автор говорил о чём-то подобном.
    • –1
      Сергей, здравствуйте.
      Мы рады снова вас видеть среди комментаторов наших статей.
      Существуют веб-сервисы, с помощью которых вы можете самостоятельно проверить как формируются «размышления» нашей модели, и какие при этом используются источники.

      Для опровержения или подтверждения вашего предположения «поиск документа по заданной тематике» достаточно задать вопрос модели, требующий размышлений.
      Форма указания якорей большой роли не играет.
      • +1
        Существуют веб-сервисы, с помощью которых вы можете самостоятельно проверить как формируются «размышления» нашей модели

        А можно ссылочку пожалуйста?
        • 0
          Отправили вам лично.
      • 0
        >> Существуют веб-сервисы, с помощью которых вы можете самостоятельно проверить
        А можно пример, где это можно посмотреть? Не увидел ссылок в самой статье.
  • 0
    Я иногда думаю об структуре и организации ИИ, хотелось бы написать поиск всего с одним точным ответом.
    Первое, над чем надо задуматься — это БД. Ведь каждое слово несёт некий смысл, поэтому для каждого слова нужно сделать своего рода карту (это предмет или действие или вопрос), если это какой-то предмет, то он имеет какие-то свойства (например: действия над ним, место расположения, даты и тд.) и исходя из этого формировать ответ. Вот как это я понимаю.
    • 0
      Денис, здравствуйте.
      Ваши мысли интересны и близки к нашим представлениям. Мы еще бы добавили следующее о «проблематике ответа»: Нужно учесть, что система понятий разных людей разная, и система ответов должна быть в большой степени персонализирована, не только чтобы правильно ответить, но и чтобы ПОНЯТЬ вопрос. Известный классик писал: чтобы задать верный вопрос, нужно знать бОльшую часть ответа. Без этого никак.

      Другой вопрос: если система имеет хорошее представление о системе взглядов спрашивающего. В этом случае «бОльшая часть» вопросов, скорее всего уже детерминирована.

      Говоря о наших моделях — персонализация сейчас в разработке.

      P.S. мы сознательно не развиваем в комментариях различные аспекты персонализации поиска/моделирования коммуникаций с конкретной личностью. Планируем это обсудить в следующей статье.
    • 0
      Человеческая речь на это не заточена. Даже в обычной коммуникации человек обычно выясняет нужную ему информацию, используя целый ряд уточняющих вопросов. А единственное слово само по себе не содержит смысла без определенного контекста.

      Поэтому я бы больше сделал ставку на связанные уточняющие вопросы. Жаль, что Google пока так не работает.

      Пример:
      — «найти работу»
      — «найдено 1 млн сайтов»
      — «екатеринбург»
      — «по работе в екатеринбурге найдено 100 тыс сайтов»
      — «в компании Х»
      — «не найдено»
      — «тогда в районе Y»
      — «найдено 5 вакансий»
      — «рядом с метро»
      — «найдено 2 вакансии»

      2 недели спустя в Google Now:
      — «открыта вакансия журналиста в компании Х»

      И все это голосом.
      • 0
        Думаю что нечто подобное скоро будет у Cubic Robotics. Сильного ИИ здесь нет.
  • 0
    В заголовке статьи написано «История вторая.» А где тогда первая часть?
  • 0
    Здравствуйте.
    Уточните, пожалуйста, ваша программа демонстрирует только образцы ассоциативного мышления, или есть зачатки логического мышления?
    Если можно, приведите, пожалуйста, пример.
    Скажем, что ваша система ответит на вброшенную фразу «где находится следующая по размеру река после Амазонки?».
    • 0
      Так всё ради логики и создаётся.
      • 0
        Помоему работать должно так: Амазонка — это река, проверяем есть ли список рек по размеру, если есть — берём след. после Амазонки, далее, берём у той реки местоположение. Вот и вся логика.
      • 0
        Вот и хотелось бы понять это от авторов данного поста. Очень часто в данной области выдают желаемое за действительное, достаточно полистать geektimes.ru/hub/artificial_intelligence (особенно, пораньше — там как минимум с десяток статей подобных «мыслителей», каждый со своей уникальной терминологией и чуть ли не патентованными «ноухау»), так что не ведитесь на их сладкие речи.
        Пока что я вижу только автоассоативное мышление, которое, конечно, тоже нужно, но которого совсем недостаточно для взрослого поведения.
        Причем, понимаете, не стоит думать, что при повышении количества самообучения происходит переход от ассоциативного к логическому мышлению — это не так. Эти механизмы мышления дополняют друг друга, но, похоже, мало совместимы. Первая попавшаяся ссылка из интернета на эту тему: www.factruz.ru/brain_human/thinking.htm
    • 0
      Юрий, здравствуйте.
      Представленная модель ядра v2.3 не может корректно сформулировать ответ на такой комплексный вопрос. Это одноклеточная модель. Поставленный вами вопрос предполагает оперирование несколькими понятиями.

      НО, модель ядра v2.3 на этот вопрос отвечает так:

      Режим работы ядра v2.3: «поиск».

      запрос: «где находится следующая по размеру река после Амазонки»

      контекст: «река»

      размышление ядра v2.3:
      Однако, буквально несколько лет назад, бразильские ученые провели ряд исследований с использованием спутниковых данных и выяснили, что великая африканская река по своей протяженности уступает реке Амазонке.
      Ранее занимавшая только второе место в списке самых длинных в мире, южно-американская река Амазонка стала немного длиннее за счет того, что был открыт ее новый исток.


      Задачи сложной логики(многоклеточной памяти) мы не можем продемонстрировать сейчас в открытом доступе. Существуют лабораторные алгоритмы, которые способны отвечать на подобные вопросы. Мы работаем над этими задачами сейчас.
      • 0
        Так есть у вас логическое мышление в модели или нет?
        Ассоциативное мышление можно многими достаточно простыми методами получить, хотя повышение качества над другими методами — возможно. Но революционного в этом ничего нет, уж извините (и «ноу-хау» тут быть не может — все, кто в теме, давно знают, как это делать).
        «Одноклеточная память», «Многоклеточная память» — поясните, пожалуйста, данные понятия, и как они относятся к логике (и в чём отличие вашей модели от чисто ассоциативных рассуждений).
        • 0
          Ассоциативное мышление можно многими достаточно простыми методами получить

          Приведите примеры работающих алгоритмов, обладающих мышлением.

          «ноу-хау» тут быть не может — все, кто в теме, давно знают, как это делать

          Если вы в теме, то поделитесь своими наработками.

          Выше вы писали:
          не стоит думать, что при повышении количества самообучения происходит переход от ассоциативного к логическому мышлению — это не так

          На основании каких практических исследований/алгоритмов/наработок(желательно ваших) вы сделали такой вывод?

          «Одноклеточная память», «Многоклеточная память» — поясните, пожалуйста, данные понятия

          Мы писали в статье о факторной памяти. Что именно вам не понятно?

          Как по-вашему отличить ассоциативное мышление от логического?
          • 0
            Ассоциативное мышление можно многими достаточно простыми методами получить

            >Приведите примеры работающих алгоритмов, обладающих мышлением.
            Ассоциативным мышлением или логическим?
            Ассоциативным — стройте марковские цепи на предложениях, вот вам и ассоциативное мышление.
            Логическим без ассоциативного на маленьком словаре — стройте граф и в нём вычисляйте нужные узлы с помощью соседних.
            Надёжного метода, обладающим логическим мышлением на большом словаре пока нет, наиболее близкая реализация была у CYC, для русского языка частичная реализация была в

            «ноу-хау» тут быть не может — все, кто в теме, давно знают, как это делать

            >Если вы в теме, то поделитесь своими наработками.
            берём функцию определения близости предложений и фраз metric(phrase1, phrase2), например, рассчитанную через sentence vectors или сумму word2vec от слов предложение.
            Натравливаем на неё выдачу гугла, вытаскиваем наиболее близкое предложение (или фразу) к исходному запросу.
            Теперь находим наиболее близкое к нему предложение. Процесс повторяем.
            Из примеров информационного поиска используя данную парадигму:
            kelijah.livejournal.com/144812.html
            kelijah.livejournal.com/141396.html

            >Выше вы писали:

            > не стоит думать, что при повышении количества самообучения происходит переход от ассоциативного к логическому мышлению — это не так
            >На основании каких практических исследований/алгоритмов/наработок(желательно ваших) вы сделали такой вывод?
            А почему это вы скатываетесь на аргумент «сперва добейся»? Высказывание Бернарда Шоу по этому поводу знаете?
            Вам бы психологию и физиологию человека немного поизучать бы, причём тут наработки — всё давно уже обсосано.

            Почитайте Programmer's stone, ссылка ниже, про «картостроителей».
            Если коротко, ваша система не способна выделять новые знания и их потом комбинировать, а значит, не сможет получить ответ, не содержащийся в выдаче гугла по данному запросу.

            >> «Одноклеточная память», «Многоклеточная память» — поясните, пожалуйста, данные понятия

            Мы писали в статье о факторной памяти. Что именно вам не понятно?

            Чем ваш нововведённый термин «факторная память» существенно отличает её от общепринятого термина «ассоциативная память» и ассоциативное мышление?
            ru.wikipedia.org/wiki/%D0%90%D1%81%D1%81%D0%BE%D1%86%D0%B8%D0%B0%D1%86%D0%B8%D1%8F_%28%D0%BF%D1%81%D0%B8%D1%85%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F%29

            >Как по-вашему отличить ассоциативное мышление от логического?
            Логическое мышление наблюдается у взрослых людей — человек умеет при наличии знаний или доступа к базам данных (или поиску гугла) ответить на вопрос типа «где находится следующая по размеру река после Амазонки» или «что больше, курица или яйцо».

            Почитайте большущее исследование про «паковщиков» и «картостроителей». Ваша программа — типичный паковщик: она не знает, что Амазонка — река, что река находится в какой-то стране или территории, и т.п.
            Вот это забавное исследование про картостроителей: progstone.narod.ru/reciprocality/r0/day1.html
            • 0
              Юрий, как мы поняли в вашей картине мира алгоритмы мышления созданы и
              «всё давно уже обсосано»
              .
              И как мы поняли вы в теме, тогда для вас не составит труда показать всем:
              1. рабочий алгоритм ассоциативного мышления на цепочках Маркова.
              2. практическую реализацию алгоритма построения графа с вычислением нужных узлов с помощью соседних.
              3. Продемонстрируйте «логическое мышление» в реализации CYC.

              Чем ваш нововведённый термин «факторная память» существенно отличает её от общепринятого термина «ассоциативная память» и ассоциативное мышление?

              А какое определение «ассоциативной памяти» и «ассоциативного мышления» Вы считаете общепринятым?

              Логическое мышление наблюдается у взрослых людей — человек умеет при наличии знаний или доступа к базам данных (или поиску гугла) ответить на вопрос типа «где находится следующая по размеру река после Амазонки» или «что больше, курица или яйцо»

              Т.е. взрослый человек обладает логическим мышлением, а молодой нет?
              Как с Вашей точки зрения определить «взрослость» человека в контексте логического мышления, если предположить, что он не может ответить на вопрос о курице и яйце?
              • 0
                >А какое определение «ассоциативной памяти» и «ассоциативного мышления» Вы считаете общепринятым?
                А какое вы считаете общепринятым? Вот с тем и сравните.

                >И как мы поняли вы в теме, тогда для вас не составит труда показать всем:
                >1. рабочий алгоритм ассоциативного мышления на цепочках Маркова.
                Там ниже есть в комментарии, с цепочками длины 1, на основе метрики сходства фраз. совместите два алгоритма — получите алгоритм на марковских цепочках большей длины.
                Что-то подобное, кстати, вы и сделали, затратив более пяти лет. (Только зачем?)
                >2. практическую реализацию алгоритма построения графа с вычислением нужных узлов с помощью соседних.
                Алгоритм работы пролога.
                >3. Продемонстрируйте «логическое мышление» в реализации CYC.
                Погуглите. Semantic reasoning, inference engines, logical reasoning, human reasoning, вот это всё.
                Вот, кстати, интересная статья: en.wikipedia.org/wiki/Reason
                Даже в ответах поиска google и facebook сейчас есть элементы логического мышления.
                Есть и интересные современные научные работы на эту тему.
                arxiv.org/abs/1502.05698, arxiv.org/abs/1410.3916
                www.facebook.com/FBAIResearch/posts/362517620591864

                Может, теперь понимаете, о чём я толкую?

                >Т.е. взрослый человек обладает логическим мышлением, а молодой нет?
                Кто такой молодой? Маленький ребёнок может дать неправильный ответ на этот вопрос.
                На более сложные логические вопросы ребёнок может дать неправильный ответ.
                Есть даже тесты уровня развития, основанные на этой зависимости.
                >Как с Вашей точки зрения определить «взрослость» человека в контексте логического мышления, если предположить, что он не может ответить на вопрос о курице и яйце?
                Если не может ответить, то это или очень маленький ребёнок или дурак.
                В любом случае, вы не можете считать, что ваша система «думает», если даже на простейшие человеческие вопросы она ответить не в состоянии.
                А всё почему? Потому что я уверен, что ваша система совершенно не понимает смысла фраз, с которыми она проводит манипуляции, и наверняка даже не понимает смысла отдельных слов, входящих в эти фразы (уж не говоря о комбинировании их в предложение по правилам русского языка).
  • 0
    Здравствуйте, Elano!

    Интересные мысли излагаете! Однако, публикация на Хабре до создания коммерческой версии Вашей проги говорит о том, что у Вас есть некие неизвестности и потому Вы решились на обнародования Вашего пути в надежде найти искомое или подсказку в дискуссиях и обсуждениях.

    Как я понял, Ваш путь это стохастические технологии. Я знаю, что применительно к ИИ и к интеллектуальному смысловому запросу в Инете в России этим занимается Насыпный В.В. и его группа. Вы не из его группы? Могу ли я Вам чем-нибудь помочь?
  • 0
    Эдуард, Здравствуйте!
    публикация на Хабре до создания коммерческой версии Вашей проги говорит о том, что у Вас есть некие неизвестности и потому Вы решились на обнародования Вашего пути в надежде найти искомое или подсказку в дискуссиях и обсуждениях.


    Вы отчасти правы.
    У нас есть видение, практические наработки, исследования достаточные для того, чтобы воплотить наши идеи в виде коммерческого продукта.

    Мы хотим развить данное направление в ИИ, поэтому пишем теоретические статьи, показываем практические наработки.
    Ищем заинтересованных людей, и тех кто занимается подобной проблематикой с практической точки зрения.

    Я знаю, что применительно к ИИ и к интеллектуальному смысловому запросу в Инете в России этим занимается Насыпный В.В. и его группа. Вы не из его группы?

    Нет.
    Мы написали вам в личку о нас.

    Могу ли я Вам чем-нибудь помочь?

    Почитали ваши статьи и комментарии. Наши мысли схожи.
    Написали вам в личку.
    • 0
      Спасибо за оперативный ответ!
      Обязательно посмотрю Ваш сайт и попробую протестировать Прогу.
      Вы, вроде, располагаетесь в Новосибирске. У Вас там работала Лаборатория Искусственного Интеллекта. Случаем, Ваши корни не оттуда?
      Посмотрю личку и выйду с Вами на связь.

Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.