Сегодняшняя статья будет посвящена сравнению моделей работы с иерархическими данными в PostgreSQL, через Django приложение. В статья я специально не использую чистую реализацию в базе данных, т. к. меня интересует именно производительность в среде, приближенной к боевой.
В сегодняшней статье я хотел бы, как можно подробнее, рассмотреть интеграцию приложений Python и MS Excel. Данные вопрос может возникнуть, например, при создании какой-либо системы онлайн отчетности, которая должна выгружать результаты в общепринятый формат ну или какие-либо другие задачи. Также в статье я покажу и обратную интеграцию, т.е. как использовать функцию написанную на python в Excel, что также может быть полезно для автоматизации отчетов.
Добрый день, уважаемые читатели.
Пролетели 2 недели и я представляю Вам новую подборку материалов на тему анализа данных. В этот раз материала получилось довольно не много, но от этого статьи и заметки попавшие в дайджест не становятся менее интересными.
Итак, из сегодняшней подборки вы узнаете как классифицировать текст с помощью наивного Байеса, узнаете как увеличить скорость градиентного спуска. Кроме этого будет очередная статья о том, чем должен пользоваться аналитик и какими навыками обладать и еще много чего интересного
Сегодня в производство была запущена опытная партию универсальных микропроцессоров Эльбрус-8С, с расчётная рабочей частотой в 1.3 ГГц. Вычислительная мощность данного процессора 250 Гфлопс, а производится он по технологии – 28 нм. Получение готовых образцов микросхем ожидается в октябре 2014 года.
Микропроцессор Эльбрус-8С — полностью российская разработка, которой занимается ЗАО «МЦСТ». Его кристалл спроектирован по технологии 28 нм, имеет 8 процессорных ядер с улучшенной 64-разрядной архитектурой Эльбрус 3-го поколения, кэш-память 2-го уровня общим объёмом 4 мегабайта и 3-го уровня объёмом 16 мегабайт.
Добрый день, уважаемые читатели.
Пролетели 2 недели и пришло время нашей подборки материалов по анализу данных. Сегодняшний дайджест получился большим, и признаюсь често сам осилил не все, что в него попало. Но так как на вкус и цвет товарище нет, то я решил выложить всю подборку.
Итак, из сегодняшней подборки вы узнаете о том как использовать хранилища данных различных типов в одном проекте, посмотрите какими большими данными может обладать бизнес и как их анализ может ему помочь. Также в нашей подборке будет статья посвященная алгоритму FTCA, а также будет материал про сравнени различных алгоритмов машинного обучения.
Добрый день, уважаемые читатели.
Представляю вашему вниманию дайджест новостей и полезных материалов из мира анализа данных. Предыдущий дайджест пользовался большой популярностью и поэтому я решил сделать их регулярными. Периодичность таких подборок будет 1 раз в 2 недели.
В сегодняшней подборке вы узнаете что общего у статистики и науке об анализе данных, как можно выявить ложную корреляцию, а также какие алгоритмы правят современным миром. Помимо этого вы получите небольшие шпаргалки по методам машинного обучения и NoSQL базам данных, ну и еще много чего интересного.
Исследователь Кавел Литару, из Джордтаунского университета, собрал каталог из 250 миллионов событий произошедших в мире с 1979, который ежедневно обновляется и доступен каждому желающему кто хочет его изучить.
Каждая запись набора имеет 58 атрибутов. А сам набор делится на 300 различных категорий. На настоящий момент каталог имеет объем 100 Гб, а хостером является Goolge.
Частенько читаю Хабр и заметил что в последнее время появились Дайджесты новостей по многим тематикам, таким как веб-разработка на php, разработка на Python, мобильные приложения, но не встретил ни одного подборки по популярному сейчас направлению, а именно анализу данных и big data.
Ниже я решил собрать небольшую подборку материалов по данной теме. Т.к. на русском материалов не так много, в данный дайджест попали в основном англоязычные статьи.
Кого заинтересовала данная тема прошу подкат. А также жду замечаний, пожеланий и дополнений, буду очень рад обратной связи.
Компанией Hitachi разработала сканер-считыватель «Finger Vein» для работы с венозным рисунком пальца, который планируется использовать для аутентификации в современных системах. Компанией Itcard S.A, которая предоставляет сервисное обслуживание банков в Польше, совместно с японскими инженерами внедрят данное инновационное оборудование на всей территории европейского государства.
NASA объявило о проведении испытаний принципиально нового летательного аппарата, который в агентстве планируют эксплуатировать для доставки астронавтов и полезного груза на поверхность Марса с полезной нагрузкой.
Компании ЗАО «МЦСТ» и КБ «Панорама»провели испытания разрабатываемого целью которых, являлась проверка функционирования отечественной ГИС Оператор на программно-аппаратной платформе «Эльбрус».
Данная ГИС принята на снабжение ВС РФ приказом министра обороны РФ № 598 от 15 августа 2013г., что делает ее стратегически важным ресурсом. Предназначена она для управления картами местности, снимками и матрицами на основе атласа карт, создания карт оперативной обстановки, отображения 3D моделей местности и оперативной обстановки.
Минобороны Великобритании инвестирует 270 миллионов фунтов в разработку альтернативы GPS. Новинка будет носить название "квантовый компас". На ее разработку планируется потратить 3 — 5 лет, а заниматься ею будут ученым из Национальной физической лаборатории в Портон Даун.
Сотрудники Швейцарской высшей технической школы Цюриха разработали специальную пленку, которая при повреждении выпускает очень горячую пену для защиты от злоумышленных действий. Подобную технологию ученые предлагают использовать для защиты от вандализма и краж в банкоматах.
Добрый день, уважаемые читатели.
Сегодня я расскажу вам о том, как можно построить простенькую систему анализа данных на Python. В этом мне помогут framework cubes и пакет cubesviewer. Сubes представляет собой framework'ом для работы с многомерными данными с помощью Python. Кроме того он включает в себя OLAP HTTP-сервер для упрощенной разработки приложений отчетности и общего просмотра данных. Сubesviewer представляет собой web-интерфейс для работы с вышеуказанным сервером.
Британский физик Стивен Хокинг, в своей статье, рассказал, что недооценка угрозы со стороны искусственного интеллекта может стать самой большой ошибкой в истории человечества.
Компания Immerz, принадлежащая физику Шахрияру Афшару, запускает серийное производство игрового жилета с тактильной обратной связью, на разработку которого было потрачено почти 5 лет. Планируется, что он появится в продаже уже в этом году.
В начале апреля агентство по перспективным оборонным научно-исследовательским разработкам США (DARPA) объявило о создании новое управления биотехнологий (Biological Technologies Office, BTO).
Российская компания МЦСТ, специализация которой разработка универсальных микропроцессоров, микроконтроллеров и управляющих вычислительных комплексов, сообщила об успешном завершении испытаний нового процессора «Эльбрус-4С» (Эльбрус-2S), который готов к серийному производству.
Добрый день, уважаемые читатели.
В сегодняшней статье я покажу основы разбора HTML разметки страниц с помощью библиотеки lxml для Python.
Если вкратце, то lxml это быстрая и гибкая библиотека для обработки разметки XML и HTML на Python. Кроме того, в ней присутствует возможность разложения элементов документа в дерево. В статье я постараюсь показать, насколько просто ее применение на практике.