Pull to refresh
1
0
Виктор @Wik0

Гравировка

Send message

Как превратить книгу о Гарри Поттере в граф знаний

Reading time12 min
Views10K

Обработка естественного языка — это не только нейронные сети, а данные — это не только строки, числа и перечисления. Область работы с данными простирается намного дальше. К старту флагманского курса по Data Science представляем вашему вниманию перевод из блога разработчиков графовой базы данных neo4j о том, как при помощи SpaCy и Selenium извлечь из книги граф взаимоотношений героев. Подробности и код, как всегда, под катом.

Читать далее
Total votes 21: ↑16 and ↓5+11
Comments0

Планет какого типа во Вселенной больше всего?

Reading time10 min
Views5.9K

Как художник видит экзопланету Проксима b. Считается, что она недружелюбна для жизни из-за того, что не имеет атмосферы из-за свойств родительской звезды. Это, как говорят астрономы, «глазеющий» мир – одна сторона планеты постоянно смотрит на звезду, и жарится в её свете, а другая замерзает. Возможно, именно таких планет больше всего во Вселенной.

В астрономии есть один популярный миф о том, что Солнце – это типичная звезда. Если речь о том, что Солнце ничем особенным не выделяется – то да, так и есть. Оно состоит из тех же ингредиентов, что и остальные звёзды. Это 70% водорода, 28% гелия, 1-2% других элементов. Энергию оно получает из ядерного синтеза, происходящего в ядре. В каком-то смысле, это «типичная» звезда, входящая в подавляющее большинство из примерно 1024 звёзд, содержащихся в границах наблюдаемой Вселенной.

Однако на самом деле Солнце ярче и массивнее, а продолжительность его жизни короче, чем у 95% звёзд Вселенной. Если выбрать любую случайную звезду, то с вероятностью 80% это будет красный карлик – он будет меньше, холоднее, тусклее и меньше по массе, чем наше Солнце. Большинство звёзд не такие, как наше Солнце.
Читать дальше →
Total votes 20: ↑19 and ↓1+18
Comments3

Используя Луну в качестве зеркала, ученые подтвердили, что Земля обитаема

Reading time1 min
Views13K
Астрономы придумали новый способ поиска экзопланет и потенциально обитаемых миров — с помощью их спутников. Проверили они это на примере Луны и Земли.

image
Читать дальше →
Total votes 48: ↑22 and ↓26-4
Comments28

Личный опыт невыгорания на удалённой работе

Reading time4 min
Views37K
Уже не помню когда, и при каких обстоятельствах услышал, что работу нужно менять каждые пять лет. Этого времени достаточно, чтобы достичь профессионализма и… чтобы работа стала рутиной, наскучила. Это первый, хотя и не обязательный шаг к выгоранию. В любом случае, скука ещё никому не добавляла здоровья и могла подтолкнуть к действиям с нехорошими последствиями. Лекарства от рабочей рутины ровно два: либо работа и хобби должны совпадать, либо в жизни должно быть что-то ещё, что придавало бы ей вкус и тягу продолжать жить и работать. В конце концов, мы живём на контрасте. Устаём от одного и получаем отдых в другом.
Читать дальше →
Total votes 45: ↑31 and ↓14+17
Comments83

Целостность данных в микросервисной архитектуре — как её обеспечить без распределенных транзакций и жёсткой связности

Reading time9 min
Views62K

Всем привет. Как вы, возможно, знаете, раньше я все больше писал и рассказывал про хранилища, Vertica, хранилища больших данных и прочие аналитические вещи. Сейчас в область моей ответственности упали и все остальные базы, не только аналитические, но и OLTP (PostgreSQL), и NOSQL (MongoDB, Redis, Tarantool).


Эта ситуация позволила мне взглянуть на организацию, имеющую несколько баз данных, как на организацию, имеющую одну распределенную гетерогенную (разнородную) базу. Единую распределенную гетерогенную базу, состоящую из кучи PostgreSQL, Redis-ов и Монг… И, возможно, из одной-двух баз Vertica.


Работа этой единой распределенной базы порождает кучу интересных задач. Прежде всего, с точки зрения бизнеса важно, чтобы с данными, движущимися по такой базе, все было нормально. Я специально не использую здесь термин целостность, consistency, т.к. термин это сложный, и в разных нюансах рассмотрения СУБД (ACID и CAP теорема) он имеет разный смысл.


Ситуация с распределенной базой обостряется, если компания пытается перейти на микросервисную архитектуру. Под катом я рассказываю, как обеспечить целостность данных в микросервисной архитектуре без распределенных транзакций и жесткой связности. (А в самом конце объясняю, почему выбрал для статьи такую иллюстрацию).


Total votes 77: ↑76 and ↓1+75
Comments73

Information

Rating
4,258-th
Location
Тамбов, Тамбовская обл., Россия
Date of birth
Registered
Activity