Книга «Машинное обучение»

    image Привет, Хаброжители к нам из типография наконец-то пришла новинка от Хенрика Бринка, Джозефа Ричардса и Марка Февероволофа.

    Эта книга позволит программистам, аналитикам данных, статистикам, специалистам по обработке данных и всем остальным применить машинное обучение к решению реальных задач или хотя бы просто понять, что оно собой представляет. Читатели, не прибегая к глубокому теоретическому изучению конкретных алгоритмов, получат практический опыт обработки реальных данных, моделирования, оптимизации и развертки систем машинного обучения. Для тех, кому интересна теория, мы обсуждаем математическую основу машинного обучения, объясняем некоторые алгоритмы и даем ссылки на материалы для дополнительного чтения. Основной акцент делается на практических результатах при решении поставленных задач.


    Книга предназначена для тех, кто хочет применять машинное обучение к решению различных задач. В ней описываются и объясняются процессы, алгоритмы и инструменты, относящиеся к основным принципам машинного обучения. Внимание акцентируется не на способах написания популярных алгоритмов, а на их практическом применении. Каждый этап построения и использования моделей машинного обучения иллюстрируется примерами, сложность которых варьируется от простого до среднего уровня.

    Структура книги


    Часть I «Последовательность действий при машинном обучении» знакомит с пятью этапами основной последовательности машинного обучения:

    • В главе 1 «Что такое машинное обучение?» рассказывается, что представляет собой машинное обучение и для чего оно нужно.

    • В главе 2 «Реальные данные» подробно рассматриваются характерные стадии подготовки данных для моделей с машинным обучением.

    • Глава 3 «Моделирование и прогнозирование» обучает с помощью распространенных алгоритмов и библиотек созданию простых ML-моделей и генерированию прогнозов.

    • В главе 4 «Оценка и оптимизация модели» ML-модели подробно рассматриваются с целью оценки и оптимизации их производительности.

    • В главе 5 «Основы проектирования признаков» рассказывается о том, как увеличить количество необработанных данных, используя информацию из поставленной перед нами задачи.

    В части II «Практическое применение» вводятся техники масштабирования моделей, а также техники извлечения признаков из текста, изображений и временных рядов, увеличивающие эффективность решения многих современных задач с машинным обучением. Эта часть содержит три главы с практическими примерами.

    • Глава 6 «Пример: чаевые для таксистов» — первая, полностью посвященная рассмотрению примера. Мы попытаемся предсказать шансы таксиста на получение чаевых.

    • Глава 7 «Усовершенствованное проектирование признаков» знакомит с более сложными техниками проектирования признаков, предназначенными для извлечения значений из текстов, изображений и временных рядов.

    • В главе 8 «Пример обработки естественного языка» усовершенствованные техники проектирования признаков используются для предсказания тональности рецензий на фильмы.

    • Глава 9 «Масштабирование процесса машинного обучения» знакомит с техниками, дающими ML-системам возможность работать с большими объемами данных, обеспечивающими более высокую скорость прогнозирования и уменьшающими время их ожидания.

    • В главе 10 «Пример с цифровой рекламой» на большом объеме данных строится модель, предсказывающая вероятность перехода по рекламному баннеру.

    Как читать эту книгу


    Тех, кто пока не имеет опыта в области машинного обучения, главы с 1-й по 5-ю познакомят с процессами подготовки и исследования данных, проектированием признаков, моделированием и оценкой моделей. В примерах кода на языке Python используются такие популярные библиотеки, как pandas и scikit-learn. Главы с 6-й по 10-ю включают в себя три практических примера машинного обучения наряду с такими продвинутыми темами, как проектирование признаков и оптимизация. Так как основная вычислительная сложность инкапсулирована в библиотеках, приведенные фрагменты кода легко адаптировать к вашим собственным ML-приложениям.

    Об авторах


    Хенрик Бринк — специалист по обработке и анализу данных и разработчик программного обеспечения, имеющий огромный практический опыт машинного обучения как в области производства, так и в сфере научной деятельности.

    Джозеф Ричардс — старший научный сотрудник в области прикладной статистики и предсказательной аналитики. Хенрик и Джозеф совместно основали компанию Wise.io, которая занимается разработкой решений с машинным обучением для промышленности.

    Марк Феверолф — основатель и президент компании Numinary Data Science, специализирующейся в области управления данными и предсказательной аналитики. Он работал статистиком и разработчиком аналитических баз данных в области социальных наук, химической инженерии, производительности информационных систем, планирования объема производства, кабельного телевидения и приложений для рекламы в Интернете.

    » Более подробно с книгой можно ознакомиться на сайте издательства
    » Оглавление
    » Отрывок

    Для Хаброжителей скидка 25% по купону — Машинное обучение
    Поделиться публикацией
    Похожие публикации
    Комментарии 27
    • +3
      Было бы интересно прочесть эту книгу. Очень хочу научиться применять нейронные сети и машинное обучение для разного рода задач как в стартапах так и в быту.
      • 0
        в быту?
        • 0
          Я об «умном доме» говорил. Естественно целый дом делать «умным» я не хочу, но вот истории подобны этой — вдохновляют и каждый наверняка найдёт, что бы он автоматизировал в своём быту (необязательно дома кстати).
      • 0
        Уже купил.
        • +2
          Сделал заказ, где скачать так и не нашел, написал в поддержку, в почте ссылка на заказ есть, но в личном кабинете заказов нет. Просьба сделать сайт человеческим.
          • 0

            Да там вcё не очевидно сделано. Мне в итоге прямо на почту ссылка пришла.

          • +6
            Хотел как-то купить книгу, но не понял, зачем вам мой номер телефона?
          • +1
            Оплатил, купил книгу, а ссылки на скачивание нет!
            Почему по почте не пришла ссылка?
            Как вообще получить оплаченный товар?
            • 0
              По телефону издательства (800)500-42-17 никто не отвечает, либо сбрасывают трубку.
              Что вообще происходит?
              • 0
                Надеюсь, что мои улетевшие в трубу 412 руб. были последними деньгами, которые вы получили.
                Не рекомендую никому покупать книги у издательства «Питер»
                «Почитал», блин, книжку :(
            • +2
              Ау, «Питер»!
              Почему в 2017-м году приходится оплаченный товар на вашем сайте искать через помощь на хабре?
              Я оплатил, но ничего не получил, в обратной связи обращения уходят в никуда, нет истории переписки.
              Сильно попахивает лохотроном.
              У вас сайт фрилансеры на коленке делали что ли?
              Чтобы я ещё раз у вас что-то заказал? Никогда!
              • +3

                Купил у них уже около 5 книг. Мне все ссылки на почту приходили, возможно у них проблема с отправкой почты на Ваш ящик. У меня ящик на gmail, с ним проблем нету.


                Тут не "лохотрон" а идеализированное представление о доставке контента через электронную почту. :)

                • –2
                  А я больше ни одной книги у них не куплю. Это была первая «покупка» и последняя.
                  Заметьте, даже здесь они не отвечают.
                  Как и на телефоны, по обратной связи и. т.д.
                  Поэтому при первой же проблеме вы ничего решить не сможете.
                  Задумайтесь — а оно вам надо, рисковать так?
                  • –2
                    Вот, дозвонился по вышеуказанному номеру телефона.
                    Проблему решили, книгу получил.
                    • +3

                      И стоило устраивать истерику в коментариях, когда вашу проблему решили за 2 часа? :-)
                      Не быстро, конечно, но все равно довольно неплохо для интернет торговли...

                • 0
                  Попробуйте поискать в спаме. Бывает, что письмо попадает в нежелательный список. Если почтовый адрес правильно указали, то только в этом проблема. «Питер» ни разу не обманывал меня, да и смысла в этом не вижу абсолютно.
                • +2
                  Купил, бегло пролистал и начал читать. Если вы хотите увидеть in-depth разбор чего-то про ML, то эта книга явно плохой выбор. Здесь всё очень поверхностно с упором на то, «что писать, куда смотреть», и с желанием охватить побольше тем.

                  И ещё хотелось бы, чтобы вы как-то поменяли схему работы с курьерской доставкой в Москву. Дважды заказывал книги и дважды курьер приезжал совершенно без предупреждений. Один раз ему повезло застать меня дома. Второй раз — нет, и пришлось переназначать встречу. Крайне неудобно.
                  • 0
                    Спасибо, написали в личку для уточнения.
                    • 0
                      А может Вы всё же отправляете и за границу, в страны Европа? Иначе придётся заказать через какой-нибудь интернет магазин и соответственно без скидки.
                      • 0
                        Отправляем, любой почтовой службой, правда доставка очень дорогая будет. Напишите на сайте или сюда в личку город. Рассчитаем.
                  • +1
                    Всегда было интересно, почему именно язык питон ассоциируется с машинным обучением, что в этом языке такого магического? (опыта программирования на питоне не имею)
                    • 0
                      1. Питон за счёт нестрогой типизации и многих других вольностей позволяет очень быстро готовить данные, а правильно препарированные данные — немалая часть успеха в ML.

                      2. Есть такая штука, как IPython Notebook — интерактивная среда, где можно очень быстро экспериментировать без необходимости компиляции программы каждый раз.

                      Эти два фактора и сделали Питон де-факто стандартом для аналитика данных. Дальше всё обросло зрелыми и быстрыми библиотеками для машинного обучения и сделало Python лидером в ML.
                      • 0
                        А что насчет lua? Ведь он тоже нестрого типизированный язык. Так же, на сколько я понял — самый быстрый скриптовой язык. Тогда почему именно Питон? Не считая вашу штуку, как IPython Notebook, не особо понятен хайп, сложивший вокруг него.
                        • 0
                          У них разная специализация. В базовый комплект Lua не входит почти ничего, т.к. он задумывался как встраиваемый язык с тем, чтобы быстро накидать алгоритм и дёрнуть внешний API. У Python нет таких ограничений — в комплекте поставки очень богатая стандартная библиотека для решения всех «бытовых» задач.

                          И, конечно, 1-based индексация массивов это какой-то ад.

                          >> не особо понятен хайп, сложивший вокруг него

                          Когда-то был сделан выбор в пользу Python, и он оброс таким количеством библиотек для ML, что альтернативы на сегодняшний день просто нет. Можно, конечно, привести в пример R, но он уже уступает по популярности, особенно с популяризацией нейронок и библиотек под них.
                    • 0
                      Проблем с покупкой электронной версиии не обнаружил ;).
                      Думаю и hardcopy не вызовет проблем — в этой части там нет разницы, только доставка.
                      Письмо со ссылкой благополучно пришло и ссылка работает.

                      Теперь увы немного дегтя :(.

                      По сайту:
                      — поле ФИО неплохо бы разделить на 2/3 отдельные части и таки определить что требуется (ФИО — в строгом смысле это инициалы);
                      — уже немного раздражает неспособность разработчика (возможно по нежеланию или отсутствию времени/мотивации) переключать клавиатуру в полях для мобильных устройств — для e-mail есть более удобный формат клавиатуры;
                      — доставка заказа в формате .zip наверное экономит место на сервере издательства (и работу разработчика), но у покупателя вызывает «некоторые» проблемы после получения;
                      — ограничение в 30 дней выглядит странно, было бы разумнее таки хранить информацию в учётной записи. Там же можно было предоставлять доступ к 3-м вариантам для скачивания: zip/PDF/ePub;
                      — два предыдущих пункта запросто решаются на сервере при любой форме хранения ;).

                      Как-то так. Пошёл читать. По содержимому уже отдельно — нужно таки время на сам процесс и переваривание информации.

                      PS. Изначальный комментарий почему-то не был одобрен, это его немного исправленная и дополненная версия.
                      В ePub много пустых страниц (в конце каждого раздела первого уровня) и странное отображение информации в таблицах, несколько затрудняющее чтение.
                      Сама книга (по первой главе) хорошо написана и качественно переведена.
                      • 0

                        Эх, жаль что на питоне вся практическая часть ...

                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                        Самое читаемое