Pull to refresh
0
0
Send message

R: обработка пропущенных значений

Reading time 6 min
Views 27K
Пропущенные значения в данных — обычное в реальных задачах явление. Нужно знать, как эффективно работать с ними, если цель — уменьшить погрешность и построить точную модель. Давайте рассмотрим разные варианты обработки пропущенных значений и их реализацию.
Читать дальше →
Total votes 17: ↑15 and ↓2 +13
Comments 1

Сам себе Гутенберг. Делаем параллельные книги

Reading time 12 min
Views 22K

Lingtrain parallel books


Upd. 04.12.2021 — Наш телеграм канал


Если вам нравится изучать языки (или вы их преподаете), то вы наверняка сталкивались с таким способом освоения языка как параллельное чтение. Он помогает погрузиться в контекст, увеличивает лексикон и позволяет получить удовольствие от обучения. Читать тексты в оригинале параллельно с русскоязычными, на мой взгляд, стоит, когда уже освоены азы грамматики и фонетики, так что учебники и преподавателей никто не отменял. Но когда дело все же доходит до чтения, то хочется подобрать что-то по своему вкусу, либо что-то уже знакомое или любимое, а это часто невозможно, потому что такого варианта параллельной книги никто не выпускал. А если вы учите не английский язык, а условный японский или венгерский, то трудно найти вообще хоть какой-то интересный материал с параллельным переводом.


Сегодня мы сделаем решительный шаг в сторону исправления этой ситуации.


Из чего делаем


На входе у нас будут два текстовых файла с оригинальным текстом и его переводом. Для примера возьмем книгу "Убить пересмешника" Харпер Ли на русском и английском языках.


Начало документов выглядит так (отрывки приведены в таком виде, в котором они были найдены в сети):

Выровнять пересмешника
Total votes 106: ↑106 and ↓0 +106
Comments 67

Lingtrain Aligner. Написал приложение для создания параллельных книг, которое вас удивит

Reading time 6 min
Views 22K

title


Здравствуй, читатель. Хотелось бы ненадолго отвлечь твое внимание от новостей и историй данной технической статьей. Поэтому пусть такой "кликбейтный" затравочный заголовок не вводит тебя в заблуждение.


В этой статье я расскажу как сделать параллельную книгу, имея на руках два текста на разных языках. Я написал веб-приложение, которое упрощает процесс выравнивания, превращая сырые тексты в книги и параллельные корпуса. Хочу поделиться с сообществом этим проектом, а также узнать ваше мнение. Технические детали я описывал здесь и здесь, код приложения открытый. Поехали.


Установка


Приложение я оформил в виде docker контейнера, поэтому запустить его у себя на машине не должно составить труда. Также можно запустить приложение из исходников, инструкция есть в репозитории.


Итак, для запуска приложения у себя на компьютере нужно выполнить следующие команды:


docker pull lingtrain/aligner:v4
docker run -v C:\app\data:/app/data -v C:\app\img:/app/static/img -p 80:80 lingtrain/aligner:v4

C:\app\data и C:\app\img — это папки на вашем компьютере.


Контейнер скачается с репозитория Docker Hub и запустится на 80-м порту. Откроем приложение в вашем любимом браузере по адресу localhost.


Lingtrain app 1


Сделаем три шага: загрузка, выравнивание, генерация.

Смотреть демо
Total votes 76: ↑75 and ↓1 +74
Comments 45

Ваш компьютер на самом деле не ваш

Reading time 15 min
Views 68K

Вот он. Наступил. Получите и распишитесь.

Речь, конечно, идет о мире, предсказанном Ричардом Столлманом в 1997 году. О мире, о котором нас предупреждал Кори Доктороу.

В современных версиях macOS вы не можете просто включить компьютер, запустить текстовый редактор или просмотрщик электронных книг и писать или читать, не передавая и не журналируя ваши действия.

Оказывается, текущая версия macOS отправляет в Apple хэш (уникальный идентификатор) при запуске каждой программы. Многие люди не были в курсе этого, так как хэш передается незаметно и только при наличии выхода в интернет. А сегодня серверы работали очень медленно и не успевали проверять хэши. Как результат, все приложения не открывались, если имелся выход в интернет.

P. S. Перевел статью целиком только из-за того, что текущий перевод вообще не соответствует уровню статей Хабра.

Расшифровать хэши за Apple
Total votes 86: ↑79 and ↓7 +72
Comments 102

Топ IT-книг прошлого века, которые актуальны до сих пор

Reading time 14 min
Views 78K
«Физические законы — это не Python, их не изменить в новых версиях, то есть материал в книге (по электронике) будет актуален всегда».
ne555, из комментариев на Хабре

image

Одна из главных проблем технической журналистики — устаревание информации вследствие быстрого развития технологий. Можно написать самый полный, понятный и красочный гайд на свете, но он через пару месяцев канет в небытие после страшного слова «апдейт».

К счастью, это касается не всех аспектов гик-писательства, например, в сфере электроники наблюдается завидное для других IT-областей постоянство. Поэтому «спаянный» десятилетия назад контент, на котором росли будущие инженеры, зачастую будет актуален для их детей и даже внуков.

Вдохновившись историей «второго рождения» учебника по электронике 1979 года (а точнее, комментариями к ней), мы решили собрать для вас подборку книг по электронике, которым в 2020 году исполнилось от 25 до 69 лет, но которые при этом не утратили своей актуальности. А чтобы не ограничиваться собственными нейтрально-редакторскими вводными, мы попросили прокомментировать эту подборку победителя «ТехноТекста-2019» в номинации «Научно-популярное», старожила Хабра, разработчика интегральных микросхем для космоса и потомственного инженера Валерия Шункова aka @amartology.

Осторожно: прочтение книг из этой подборки может вызвать острое желание взяться за паяльник. Вдохновляйтесь, творите и делитесь своим опытом с Хабром, ведь именно по просьбе сообщества мы добавили в список номинаций «ТехноТекста-2020» новую — «Железо и его разработка».
Читать дальше →
Total votes 95: ↑89 and ↓6 +83
Comments 98

50 сайтов для изучения дизайна

Reading time 15 min
Views 71K
Мы подобрали для вас популярные онлайн-курсы, на которых Вы сможете изучить основы графического и веб-дизайна, и могли начать свой путь от новичка к профессионалу или усовершенствовать уже имеющиеся навыки из любой точки мира.



Итак, «поехали»:
Читать дальше →
Total votes 23: ↑22 and ↓1 +21
Comments 2

Рационализируем процесс письма в блочной тетради

Reading time 4 min
Views 31K

Вася Пупкин пишет в данный момент: излагает свой поток мыслей в блочной тетради. Но тут у Васи приключилась беда: страница кончилась. И причем на правой странице разворота, что очень неприятно. Это означает, что если Васе для того чтобы написать следующую порцию своей мысли, нужно иметь перед глазами предыдущий шаг, то Васе придется мотать листок бумаги туда-обратно.



Знакомая ситуация? Ох уж эти переносы знака равенства между разворотами… Именно о данной проблеме и о том, как можно сделать так, чтобы коварная тетрадь больше никогда не прервала ваш поток мыслей, я и хочу поговорить.

Читать дальше →
Total votes 46: ↑42 and ↓4 +38
Comments 68

Пора начать учиться правильно

Reading time 8 min
Views 18K

Статья посвящается всем тем, кто:


  • до сих пор не может уснуть, после увиденной схемы паттернов из книги Банды Четырех

    Страшная вещь
    image
  • смущается количеству страниц в технической литературе
  • вечно боится, что всё прочитанное затеряется на задворках памяти
  • до сих пор перечитывает бесчисленное множество конспектов
  • уверен, что поняв тему, ты её изучил и запомнил
  • уверен в своих знаниях, хотя причин тому нет
  • хочет узнать побольше об эффективных способах узнавать новое и, самое главное, — запоминать новое.

Что значит «научиться»?


Прежде, чем говорить о том, как эффективно учиться, не помешает дать определение слову «научиться».

Научиться — значит быть способным извлечь знание из головы тогда, когда это нужно.
Значит, неважно как много вы тратите время на обучение, если оно не позволяет вам пользоваться знаниями — оно бесполезно.
Читать дальше →
Total votes 7: ↑7 and ↓0 +7
Comments 18

Правильная работа с закладками: как работать эффективнее и запоминать больше

Reading time 8 min
Views 91K
Принцип гиперссылок, создающий основу для интерактивных медиа, воплощает процесс ассоциаций, нередко рассматриваемый в качестве одной из важнейших составляющих человеческого мышления.

Л. Манович, «Язык новых медиа».


Когда кто-нибудь из моих знакомых открывает при мне браузер, я вижу стену из сотен старых и новых закладок. Некоторые из них настолько старые, что за время, прошедшее с добавления, фавиконки и описания страниц успели смениться несколько раз. Как правило, список продолжается далеко вниз и скрывается где-то внизу HD-экрана, заставляя забыть о надежде найти что-либо.

В какой-то момент меня стало удивлять, почему многие пользователи не обращают внимание на очевидные преимущества, которые даёт «закладочная система», ведь она позволяет не только быстрее работать, но и запоминать больше (напомню, главная функция закладок как раз и состоит в запоминании)!

Данная статья посвящена азам создания собственной системы браузерных закладок и будет полезна всем, кто ощутимо много работает с информацией и заинтересован в повышении личной эффективности и снижении информационной нагрузки.

Материал собирался на основе анализа функционала браузеров Mozilla Firefox, Google Chrome, Opera, Yandex.Browser, Opera Mobile и Chrome Mobile, которые у меня стоят больше в целях проверки вёрстки сайтов, но также позволили сравнить закладочные возможности браузеров сами по себе.
Читать дальше →
Total votes 22: ↑19 and ↓3 +16
Comments 68

Книга «Как тестируют в Google» — бесплатная электронная версия

Reading time 11 min
Views 65K
image Привет, Хаброжители!

В книге описано тестирование программных продуктов в Google: как устроены процессы, как организованы команды, какие техники используются, кто ответственен за качество. Принципы, на которых построено тестирование в Google, применимы в проектах и компаниях любого размера. Авторы книги сами работали над продуктами Google, создавая инструменты тестирования, настраивая процессы и занимаясь непосредственно тестированием.

Книга рассчитана на профессионалов из индустрии разработки программного обеспечения: специалистов по тестированию, программистов, менеджеров.
Читать дальше →
Total votes 21: ↑21 and ↓0 +21
Comments 0

Как я веду Zettelkasten в Notion уже год: стартовый набор и полезные трюки

Reading time 8 min
Views 171K

Zettelkasten — крутой метод хранения идей и знаний — сейчас на слуху, его уже обсуждали на Хабре. Я веду такой в Notion уже год, потому что Notion лучше всех воплощает три главных принципа Zettelkasten: взаимосвязанность, категоризацию, актуальность. Метод улучшил качество моего обучения и исследований, и без него как-то уже не так. 

Я почитал русскоязычные и англоязычные ресурсы и не нашел ни нормального шаблона для Notion, ни объяснения как реализовать главные преимущества метода Zettelkasten. Под катом и то, и другое. 

UPD: На текущий момент, статья безбожно устарела, потому что за еще один год я набрался опыта, помогая другим людям организовать их Цеттели и наблюдая за чужим опытом. А еще Notion выпустил несколько фич, заточенных именно под Цеттель. И теперь мне совестно, как новички страдают, разбираясь в теме после меня.

Эту статью можно почитать для понимания основ, но актуальные источники информации тут:

  • У меня в Психотронке можно следить за подготовкой обновленной версии, ну и написать мне за помощью. А можете не следить: версия 2.0 выйдет на Хабре.
  • В русскоязычном сообществе Zettelkasten в Телеграме сидят люди, которые хорошо разбираются в теме. Мы обожаем помогать новичкам.

Дисклеймер: ни Notion, ни автор метода мне за статью не платили.
Читать дальше →
Total votes 49: ↑49 and ↓0 +49
Comments 88

Zettelkasten: как один немецкий учёный стал невероятно продуктивным

Reading time 18 min
Views 364K
Изображение предоставлено автором. Основано на фотографии Патрика Томаса с Ансплэша

Это перевод статьи Дэвида Клира о методе ведения заметок Zettelkasten, благодаря которому немецкий социолог Никлас Луман написал более 70 книг и 400 научных статей. Стоит читать, если вы хотите создать собственную базу знаний, систематизировать идеи и перестать забывать важные мысли.

Статья бережно перенесена из блога бегущего редактора. Кстати, следить за анонсами новых статей можно в моём телеграм-канале. Подписывайтесь, чтобы ничего не пропустить!
Читать дальше →
Total votes 52: ↑48 and ↓4 +44
Comments 82

Прощай, Google! 15 Альтернативных поисковиков, которые не шпионят, а сажают деревья и раздают воду

Reading time 5 min
Views 233K


Аве Кодер!

В этой статье речь пойдет о крутых инди поисковиках, которые могут составить конкуренцию поисковым гигантам, а также удовлетворить вкусы как утонченного мусьё, так и идейного борца за личную жизнь.
Читать дальше →
Total votes 62: ↑54 and ↓8 +46
Comments 113

Об оценках сроков в разработке ПО

Reading time 8 min
Views 41K
В течение всей истории разработки ПО мы искали надежные способы оценки времени на реализацию задач и проектов. Но и спустя более чем 60 лет существования отрасли наши прогнозы все еще оставляют желать лучшего. Может быть, дело не в том, как именно мы пытаемся оценивать, а в том, что мы вообще опираемся на оценки?

К примеру, возьмите методологию Scrum, по которой сегодня работают многие компании. Центральная идея Scrum — брать в спринт не больше задач, чем ваша команда способна за это время выполнить. На первый взгляд, звучит разумно. К сожалению, слишком часто на практике этот подход приводит к замедлению работы команды в обмен на иллюзию планирования. Позвольте объяснить, почему.
Читать дальше →
Total votes 89: ↑87 and ↓2 +85
Comments 78

60+ игр для гиков

Reading time 35 min
Views 52K
Приветствую всех брутальных Хабрачан и чувственных Хабрачаночек!

Благодаря вашей поддержке я смог написать статьи про сериалы в мире IT. Вместе мы прошли через многое. В последней статье я попросил вас рассказать своё мнение о том, стоит ли мне писать статью про гиковские игры и вы снова поддержали меня. Спасибо за это!

Что же, как я и обещал — подборка 60+ игр для гиков перед вами. Сразу хочу оговорить один момент. Все мы гики. У кого-то есть любимые игры, которые могли сюда не попасть. Напишите о них в комментариях. Все ваши комментарии очень ценны и добавляют интереса в наш диалог. Часть из игр моей подборки непосредственно про IT и вокруг нас с вами, часть — не про IT, но гику эти игры наверняка понравятся. Часть игр чему-то учат, часть — просто веселят и развлекают.

Так как подборка очень большая, я не буду детально описывать каждую игру, но расскажу интересные особенности про все. Сортировал игры я не по значимости, а по алфавиту, чтобы было проще и читать, и искать.

И ещё один момент. Поздравляю всех с наступлением лета! Думаю, в этот непростой год, когда сложно выбраться отдохнуть — цифровые развлечение будут совсем не лишними.

Что же. Давайте не будем тянуть время и поговорим о подобранных мною для вас играх!


Total votes 53: ↑48 and ↓5 +43
Comments 83

Почему канадский английский считают «грязным» и при чем тут Киану Ривз

Reading time 6 min
Views 24K
Сегодня мы расскажем о диалекте английского языка, на котором говорит свыше 17 миллионов людей.

Историческое становление английского языка в Канаде, соседство с США и французский в качестве второго государственного создали диалект со своими особенностями и интересными фишками.

А еще канадский — это объект постоянных шуток как британцев, так и американцев, которым этот диалект почему-то кажется очень смешным. Многие даже называют его «грязным вариантом британского». Почему так? Давайте разберемся.


Total votes 15: ↑15 and ↓0 +15
Comments 19

Trello — эффективная система управления знаниями для небольшой IT-команды

Reading time 6 min
Views 11K
Когда мы говорим о базе знаний, то обычно представляем сложную систему в большой IT-компании или корпорации. Они используют базу, чтобы хранить инструкции, документацию, курсы, карты навыков. Но базы знаний нужны даже небольшим командам. Например, дизайнерам, чтобы хранить ссылки на сайты для вдохновения, примеры для заказчиков, онлайн-сервисы для работы и статьи.



Использовать громоздкие продукты вроде Confluence для этого неудобно, маленьким командам лучше подойдет Trello. Этот простой и практичный инструмент позволяет за один вечер организовать удобное хранилище знаний, которое легко поддерживать и обновлять. Именно так поступили в команде веб-дизайнеров Atman Digital и остались довольны. Как они используют базу знаний в Trello, в чем преимущества такого подхода и кому подойдёт, расскажет Роман Хорин — генеральный директор агентства Atman Digital.
Total votes 18: ↑16 and ↓2 +14
Comments 0

Новичкам фондового рынка: честные разговоры о трейдинге

Reading time 12 min
Views 124K
Блог RUVDS на Хабре видел всё: популяризацию JavaScript и крутые переводные материалы, яхтинг, вопросы образования и профессионального развития, бургеры, сыры, пиво и календари с кибердевушками. Задумка поговорить об основах трейдинга и работы на фондовом рынке возникала у нас давно, и вот почему. Большинство компаний, пишущих на биржевую тематику, имею чёткую цель: получить клиентов для своих инструментов и брокерских счетов, а значит, в их статьях инвестирование — исключительно привлекательное занятие, которое должно стать хобби каждого гика. Единственное, что мы можем предложить начинающим трейдерам — это VPS с торговыми платформами, и у нас нет мотивов представлять мир торговли на фондовом рынке как средство разбогатеть. 

Мы решили сделать серию статей об основах торговли и наиболее популярных активах для новичков. Честно, без воззваний нести деньги брокеру или открывать свой счёт в конкретном банке. Ну а решать, ваш это путь или нет, — исключительно вам. Иногда гораздо выгоднее и даже быстрее освоить новый стек разработки и прокачать свою заработную плату и стабильный доход до нужного вам уровня.

Total votes 71: ↑48 and ↓23 +25
Comments 46

10 интересных репозиториев на GitHub, полезных любому разработчику

Reading time 4 min
Views 82K
Представляем вам перевод статьи Simon Holdorf, опубликованной на сайте medium.com. В ней вы найдете ссылки на полезные репозитории, с помощью которых можно прокачать навык разработки ПО.


Фото с ресурса Unsplash. Автор: Vishnu R Nair

GitHub — это лучшая платформа для обмена фреймворками, библиотеками и техническими решениями. Однако найти среди этого многообразия действительно полезные репозитории сложно. Поэтому я решил составить список из десяти интересных репозиториев, которые, на мой взгляд, пригодятся любому разработчику.

Каждый из них имеет множество звезд на GitHub, что только подтверждает их популярность, актуальность и полезность. Одни репозитории научат вас чему-то новому, благодаря другим вы сможете создать какие-то классные штуки. В целом, используя их, можно основательно прокачать навык разработки программного обеспечения.
Читать дальше →
Total votes 88: ↑83 and ↓5 +78
Comments 14

Про фразовые глаголы

Reading time 7 min
Views 61K
Фразовые глаголы английского языка гораздо проще, чем кажутся. Они работают точно так же, как в русском языке приставки. Выдающийся советский актёр Зиновий Гердт, узнав однажды о недостойном поступке, совершённом знакомым ему писателем, сказал: «Разрешите с вами раззнакомиться». Думаю, мало кто слышал в живой речи глагол «раззнакомиться». Но интуитивно всё равно понятно, что это противоположность «ПО-знакомиться».

Почему это так легко и понятно? Потому что в раннем детстве мы глубоко усвоили значения русских приставок и с тех пор оперируем ими легко и бессознательно. Так же легко и бессознательно 7-8-летние английские дети оперируют частицами во фразовых глаголах, на ходу сочиняют новые фразовые глаголы, которых нет ни в одном словаре.

Безответственные преподаватели рекомендуют значения фразовых глаголов «просто запоминать», не пытаясь понять их внутреннюю логику. Это порочная практика: фразовых глаголов только самых распространённых – тысячи. «Выучить» их принципиально невозможно. Вот, скажем, let – это «позволять, пускать». А фразовый глагол «let in on» означает «посвящать в тайну». Запомнить такое способен только человек, который понимает переносные значения частиц, образующих фразовые глаголы.

Если правильно усвоить эти переносные значения, можно начать понимать даже такие фразовые глаголы, с которыми сталкиваешься впервые. Знание нескольких принципов освобождает от необходимости знания многих фактов.
Читать дальше →
Total votes 119: ↑117 and ↓2 +115
Comments 157

Information

Rating
Does not participate
Registered
Activity