Pull to refresh

Comments 8

Почему называется само-обучаемый? До-обучаемый, сам он ничему не учится, по коду.

Отличная и подробная статья! Попробую сделать.

Статья понравилась! Интересно было бы посмотреть на бота в действии

Понятно, что проект для себя и написан в свободную минуту, поэтому нет смысла спрашивать про вещи, которые могут сломаться при эксплуатации суровым пользователем.

Но спрошу про некоторые вещи из любопытства:

  1. Из файла с записями берётся 10 тысяч, потому что на данном этапе предполагается, что там больше точно не будет?

  2. Вроде бы параметры Count Vectorizer по умолчанию рассчитаны на английский язык. Там регулярка не выбрасывает русские буквы? Также думаю замена списка стоп-слов может улучшить работу. Не пробовали TfIdfVectorizer или даже word2vec/fasttext?

  3. Проводили ли какую-нибудь оценку эффективности работы ML- алгоритма?

  4. Не уверен, насколько задачу поиска ближайшего соседа из датасета стоит решать как классификационную. Не является ли более удобным вариантом расчёт дистанции, скажем, косинусной меры, между векторами из базы и пришедшем?

Вот здесь можете посмотреть на бота в действии: https://t.me/tgbot20220522_bot.

Ниже смотрите как сделать запрос к вики: https://habr.com/ru/post/667008/#comment_24366630

Еще думаю, что в боте могут быть проблемы при его использовании несколькими пользователями одновременно, так как проверки вида if command =="не так", if reply=="вики " и другие подобные не привязаны к конкретному пользователю.

Запустил вашего бота, в очередной раз удивился развитию технологий :)

Я так понял, в одной из функций вы фильтруете "грязный" ответ из Википедии. Однако на вопрос о гипотизе Римана он мне выплюнул это:

Ответ

Гипо́теза Ри́мана — сформулированная немецким математиком Бернхардом Риманом в 1859 году математическая гипотеза о том, что дзета-функция Ри́мана

ζ

принимает нулевые значения только в отрицательных чётных числах:

0

=

ζ

=

ζ

=

ζ

=

, и комплексных числах с вещественной частью

1

2

{\displaystyle }

.

Думаю, было бы круто добавить показ формул (например, конвертировать Latex в картинки) и убрать сломанные теги викиразметки.

Спасибо за код, благодаря ему примерно понял как работают боты .

Протестировал код, запустил его на Heroku. Для деплоя на Хероку помог вот этот ответ: https://ru.stackoverflow.com/a/896235/363117 .

Реализация немного запутанная. Запутанность заключается в том, что непонятно когда нужно ввести слово "вики". А нужно ввести в такой последовательности:

  1. задать вопрос;

  2. написать "не так";

  3. ввести "вики";

  4. ввести еще раз тот же вопрос, и в этом случае сработает запрос к Википедии.

принципе бот хороший, но я бы посоветовал перейти на aiogram

Почему у меня ругаеться на эту строчку кода?

  a = f"{question}\{message.text.lower()} \n"
                                              ^
SyntaxError: invalid syntax

Sign up to leave a comment.

Articles