Pull to refresh
9
0
Артём @Myonin

data scientist

Send message

Понятия не имею, зачем Вам это надо, но вот:



Это все. Но у меня данные немного битые, может, там ещё где-то есть.

Я где-то год назад смотрел по новостным заголовкам. Основных наблюдений два: 1. статьи с более короткими заголовками имеют больше просмотров и комментариев; 2. новостные заголовки стали менее информативными.

По пункту 2. По правилам новостной журналистики заголовок должен раскрывать содержание новости. Раньше так и было. Например, раньше: «Иван Иваныч осудил случившиеся». Сейчас: «Иван Иваныч прокомментировал» Открываешь новость, а там: «Без комментариев», — сказал Иван Иваныч.
Да, лемматизация превратила Дмитрия Пескова в «дмитрий» и «песок».
Хотел поиграться с данными, но не получилось. Файл lenta-ru-data-set_19990901_20171204.json при распаковке выдаёт ошибку CRC. MongoDB где-то половину объектов из json распознаёт. Файл точно целый? Возможно, это у меня где-то косяк.
Хотелось бы верить ) Сам большой фанат R, но все знакомые мне по реальной жизни data scientists/engineers работают на Python. Недавно искал работу в МСК, из дюжины где-то компаний, которые посетил, R использует только одна. И то только для создания прототипов.
Очередной коллектив отечественных разработчиков перешёл на R. Теперь вас двое.

Я для изучения новой области знаний использую следующий алгоритм:


  1. Получаю самую общую информацию о предмете (смотрю подкасты, читаю популярные статьи, видео из разряда "как стать" — пару вечеров);


  2. Очерчиваю в этой пока что мутной области небольшой участок и начинаю изучать теорию (неделю-пару недель — не дольше);


  3. На основании полученных знаний начинаю делать какой-либо проект, имеющий практическую пользу (по времени — как получится);


  4. По завершении проекта пробегаю ещё раз по ранее изученной теории, но воспринимаю её уже по-другому, с позиции полученного опыта, гораздо системнее.

Потом выбираю другой участок знаний, чаще всего смежный, и цикл повторяется. Постепенно эта мутная область обретает очертания, как бы закрашивается.


Можно начать сразу с практики, так тоже пробовал, но результат получается гораздо более убогий. Эффективнее сначала потратить немного времени на изучение теории. Ключевое слово — немного, без систематической практики изучать теорию вообще смысла нет, она не усваивается.


В чем я безоговорочно согласен с автором — это в необходимости ежедневного обучения и практики. Даже по полчаса в день (каждый день, без перерывов) — эффект всё равно будет.

Я им только один раз пользовался, пока что исследование сервиса развлекло гораздо больше, чем его использование.

Но, судя по динамике тематических запросов на вордстате и гуглтренд, интерес к подобным услугам стабильно растёт. Экономическая обстановка способствует — и для водителей, и для пассажиров поездка обходится дешевле.
Это идиоматическое выражение. Данных по Омску у меня нет, но, подозреваю, уехать оттуда гораздо проще. В Омске проживает свыше миллиона человек, а в Клинцах — 80 тыс. Но проверять я это на практике, конечно, не буду.

Information

Rating
Does not participate
Location
Брянск, Брянская обл., Россия
Date of birth
Registered
Activity