Comments / Profile of sebres / Habr

How to become an author

Sergey G. Brester @sebres

Senior Engineer; Data Scientist; Security Auditor

Profile Publications 30Comments 1.5KBookmarks 414

Глобальная блокировка интерпретатора (GIL) и её воздействие на многопоточность в Python

sebres Nov 9 2021 at 15:36

Что, простите?!

CPU-bound вычисления в питоне выполняются однопроцессно

Нет! Это издержки GIL. Если лень смотреть в исходники, просто см. результат для многопоточного исполнения (натяжение "ручника" зависит от количества потоков, что при N threads < M CPU core однозначно указывает на overhead от "чрезмерной" блокировки).

Странный пример...

Пример как пример... Можно попробовать что-нибудь другое (не "CPU-bound"), результат не изменится. А можно попробовать что-нибудь без GIL (Iron, PyPy STM, хоть тот же PoC Сэма) и узреть разницу.

только в данном случае переключать поток

Никакой поток тут нигде не переключается (напрямую)... каждый поток исполняет собственный изолированный код (с собственным циклом и своими переменными - с полностью независымыми объектами PyObjectи PyVarObject) и context-switch если и происходит, то исключительно на lock-ах в GIL (совершенно не нужном здесь, т.к. пересечений и shared references нет совсем).
Пример собственно это и показывает.

0

Глобальная блокировка интерпретатора (GIL) и её воздействие на многопоточность в Python

sebres Nov 1 2021 at 21:02

Как-то пытался объяснять последствия изоляции всего и вся GIL-ом в python, и накидал маленький пример для наглядности:

https://gist.github.com/sebres/230c4bfafc36c99074202dc59b194a95

Если что, в приведенном примере ("тупой" инкремент в цикле 100M раз) для 4-х потоков, python медленнее ~~вашего любимого языка без GIL~~ tcl в 15 раз (35 сек. vs. 2.3 сек.), а однопоточно более чем в 3 раза.
И это при том, что собственно код исполнения не "пересекается" нигде - не использует общих (shared) объектов.

0

Ускоряем pow

sebres Oct 22 2021 at 14:24

Несомненно, что бинарное возведение в степень на практике даёт неточный результат.

Ну дак а я о чем, "Погрешность: нет" - как бы не совсем верно, если про этот алгоритм...

Я про другое: что «родная» pow даёт столь же неточный результат.

В рамках double - конечно.
Я вам больше скажу, например тот же bigfloat.pow (даже с precision 400) также выдает "неточный" результат (и он менее точен чем нативный pow):

bigfloat.pow, precision 400 ...

>>> pow(1.000001, 134217728, precision(400))
BigFloat.exact('19497974326443151952384768395025354130242292944980784774315.431771682120918607912604365932634709150271941538088343395908095', precision=400)
>>> pow(1.0000001, 134217728, precision(400))
BigFloat.exact('674530.47602706407027793197206421845263783142259940138702038470170721140355151884268337259494331459943481248761388507182459', precision=400)
>>> pow(1.00000001, 134217728, precision(400))
BigFloat.exact('3.8273676342578585041456476752437466436493872281452027009938444315573508186002376274873069800877205918834944719451685524823', precision=400)

Для сравнения возьмем корни от обоих (этот алгоритм у bigfloat насколько знаю точнее чем pow):

bigfloat.root в сравнении с Wolfram ...

>>> setcontext(precision(220)); p = getcontext().precision;
>>> root(pow(1.000001, 134217728), 134217728)
BigFloat.exact('1.0000009999999999177333620536956004798412322998046875000000000000000', precision=220)
>>> root(BigFloat.exact('1.94979745417325751802166478351188792876322264823289192517468e58', precision=p), 134217728)
BigFloat.exact('1.0000010000000000000000000000000000000000000000000000000000000000002', precision=220)
>>>
>>> root(pow(1.0000001, 134217728), 134217728)
BigFloat.exact('1.0000001000000000583867176828789524734020233154296875000000000000000', precision=220)
>>> root(BigFloat.exact('674530.47074108455938268917802974681284444414341034203174237732783', precision=p), 134217728)
BigFloat.exact('1.0000001000000000000000000000000000000000000000000000000000000000003', precision=220)
>>>
>>> root(pow(1.00000001, 134217728), 134217728)
BigFloat.exact('1.0000000099999999392252902907785028219223022460937500000000000000000', precision=220)
>>> root(BigFloat.exact('3.8273676654778624379533125217738601044713095101002538124954655334', precision=p), 134217728)
BigFloat.exact('1.0000000100000000000000000000000000000000000000000000000000000000001', precision=220)

Но если округлить результаты до оригинальной accuracy - то все результаты верны.
Что не отменяет факт, что результат pow может сильно отличатся и погрешность есть, хоть и небольшая - для bigfloat.pow (и BinaryPower) около 11.04e-7%, а для pow - 08.04e-7%, что очень неплохо для степени 134217728.

│ algorithm    │       error % │
├──────────────┼───────────────┤
│ BinaryPower  | 0.0000011043% │
│ bigfloat.pow │ 0.0000011042% │
│ native pow   │ 0.0000008045% │

+1

Ускоряем pow

sebres Oct 21 2021 at 20:14

Ну у Wolfram precision и accuracy настраиваемые (если не ошибаюсь оно умеет длинную FP-арифметику, exact quantities и всё такое)...
Пример алгоритма был для double (aka 64 bits IEEE normalized double-precision floating-point number) и C/C++...
Я это о чем, собственно - что-то математически правильное (и доказуемо верное) в конкретной реализации на конкретном языке для какой-либо платформы может вылиться в неслабую такую погрешность (из-за переполнений, недостаточной precision промежуточных результатов и т.п.)...

+1

Ускоряем pow

sebres Oct 21 2021 at 19:25

Алгоритм: Бинарное возведение в степень ...
Погрешность: нет

Я бы не стал так категорично...

  $ echo '
  #include <stdio.h>
  #include <assert.h>
  #include <math.h>
  
  double BinaryPower(double b, unsigned long long e) {
    double v = 1.0;
    while (e) {
      if (e & 1) v *= b;
      b *= b;
      e >>= 1;
    }
    return v;
  }
  
  int main()
  {
    unsigned e = 134217728;
    double barr[] = {1.000001, 1.0000001, 1.00000001, 0}, *b = barr;
    while (*b) {
      printf("calc %.10g ** %u:\n  fast pow ==> %.16f\n  native   ==> %.16f\n",
        *b, e, BinaryPower(*b, e), pow(*b,e));
      b++;
    }
    return 0;
  }
  // ' > test.c; gcc -O2 -Wall -Wextra test.c -o test; ./test
  calc 1.000001 ** 134217728:
-    fast pow ==> 19497974326417947731259943008814618865863786077838628618240.0000000000000000
+    native   ==> 19497974384856317387011039256973190612600604089375799640064.0000000000000000
  calc 1.0000001 ** 134217728:
-    fast pow ==> 674530.4760286132805049
+    native   ==> 674530.4755217875353992
  calc 1.00000001 ** 134217728:
-    fast pow ==> 3.8273676342423024
+    native   ==> 3.8273676116718129

Как видим ошибка может быть довольно значительной, я уж не говорю про -Ofast (без -fno-fast-math).

Поправка: пример компилился в -m32toolchain... для -m64 погрешности действительно нет (по крайней мере на этих числах).

0

Microsoft и NVIDIA представили крупнейшую в мире генеративную языковую ИИ-модель

sebres Oct 18 2021 at 14:53

А правильно было бы как-то так:

A girl with a plait on a spit mowed the grass with a scythe.

+1

Ботнет Mēris: расследуем крупнейшую DDoS-атаку в истории интернета

sebres Sep 15 2021 at 18:48

В приведённой таблице не микротики (и вероятно даже не зомби-хосты), а грубо говоря количество точек с активным TCP-listener на 5678 порту, ибо:

Возможно, Mikrotik и Linksys не единственные, но у нас нет другого выбора, кроме как предположить, что 328 723 – это и есть число хостов в активном ботнете.

Например, у меня рутер тоже 5678 портом наружу торчит, но ваш покорный слуга использует его для совершенно других нужд (порт то как бы для RRAC изначально), и у меня не микротик, но меня возможно тоже посчитали.

Странно, что сперва речь шла про комбинацию с портом 2000:

Однако конкретная комбинация порта 2000 с «Bandwidth test server» и порта 5678 с «Mikrotik Neighbor Discovery Protocol» почти не оставляет почвы для сомнений в наших выводах.

Но просканировали почему-то только на предмет открытости TCP 5678:

... мы решили проверить TCP-порт 5678 с помощью Qrator.Radar

0

Компания IBM создала первый в мире 2 нм процессор и изготовила тестовые образцы

sebres May 7 2021 at 18:47

Бог с ней с новостью… А то что этот "полу-новость-полу-пост" выглядит практически переводом (без плашки и указаний источника) никого не смущает?

+7

Чему равно выражение -3/3u*3 на С++? Не угадаете. Ответ: -4. Приглашаю на небольшое расследование

sebres May 6 2021 at 15:22

Давайте уже говорить про адекватно определённые целые типы.

А давайте ~~без давайте~~ не передёргивать — что имелось ввиду я думаю понятно, ну или если хотите замените char на int8_t.

Я не думаю, что T-деление более странное, чем F-деление.

Кавычки на слове "странный" вы старательно не заметили по видимому. Если что это была попытка в сарказм.

ни тесты не помогут против такого, когда компилятору вдруг взбрело в "голову"

И как оно не проявится на тестах? Когда код покрывают тестами, оно должно быть для всех corner case. Если компилятору что то там "взбрело в голову", вплоть до UB, то ваши тесты должны это показать, иначе у вас покрытие как минимум не полное.

Оно уже изначально контринтуитивно.

Нет. Точка.
Оно оправдано и обосновано.

-2

Чему равно выражение -3/3u*3 на С++? Не угадаете. Ответ: -4. Приглашаю на небольшое расследование

sebres May 6 2021 at 15:00

Компилятор транслирует код из С++ через несколько представлений в код процессора (читай Ассемблера).

Ну да, ну да...

А у Ассемблера правил меньше, но они чёткие и ясные.

То-то все всегда всё пишут на ассемблере. А например какие-нибудь SIMD или псевдоинструкции и подобное ну очень ясные и понятные.

И делить -3 на 3u командой DIV сразу вылезет боком.

Вы удивитесь возможно, но делить можно совсем без DIV инструкций.
Я уж умолчу когда C-код компилится во что-нибудь другое, не нативное, типа LLVM (clang -emit-llvm), не говоря уже про экзотику типа WASM и т.д. и т.п.

Есть еще теория компиляторов. Там за такие преобразования сразу с экзамена долой.

У нас с вами разные профессора по видимому преподавали — мне например объясняли почему так и зачем оно может быть нужно.
А может и вам объясняли да позабылось, эта картинка ничего не напоминает?

Есть еще и другие языки программирования. На них такого поведения не наблюдается.

Правда?!.. Дайте угадаю, вы пришли в С/С++ из так называемых "высокоуровневых" языков?
А по теме если — ну вот при чём тут другие языки? В качестве примера разделите -300001 на 50000 на сях или плюсах и затем на вашем любимом "другом" языке.

Вероятно картина будет следующая...

// C/С++
-300001/50000 = -6
-300001%50000 = -1
--------------------
-6*50000 + -1 = -300001

// некий другой язык:
-300001/50000 = -7
-300001%50000 = 49999
--------------------
-7*50000 + 49999 = -300001

Подсказка — ни то, ни другое не является неправильным, это просто разные подходы (а именно remainder vs. residual arithmetic), и обоим есть соответствующее обоснование в парадигмах конкретного языка.

Хорошо задокументированная бага становится фичей! Многие не видят уже багу, а видят фичу.

Это не бага от слова совсем. Если вы не понимаете зачем это нужно, это не значит, что это сразу внезапно ошибка.
Ну почитайте классику в конце-то концов.

В качестве примера вопрос для "на подумать" — у вас есть две целочисленные переменные фиксированной (что важно), но при этом разной разрядности (ибо одно грубо говоря на 1 бит короче), которые вы делите или умножаете друг на друга… Как наиболее оптимально сделать это без объявления такого действия UB, максимально используя их разрядность (или оставаясь в заданной размерности), при этом согласуя их conversion rank и т.п., чтобы в большем числе случаев результат оказался предсказуемо "хорошим"? (заметьте не математически правильным, ибо это просто нереально при вероятном переполнении)… Другими словами — как оттянуть тот момент переполнения?

0

Чему равно выражение -3/3u*3 на С++? Не угадаете. Ответ: -4. Приглашаю на небольшое расследование

sebres May 6 2021 at 13:48

Даже с 20 годами опыта легко расслабиться и пропустить подобную диверсию где-то в коде, особенно когда это осложнено макрами, шаблонами и прочими факторами, которые сбивают очевидность, рассеивая внимание и делая неочевидными влияющие факторы (где какой тип).

Ну да, странно же в языках типа C/C++ с целочисленными типами фиксированной разрядности… где и переполнение точно таким же образом словить можно (вас не смущает например что (char)127+2 == -127?), и несколько "странный" остаток при делении отрицательного на положительное число (см. remainder vs. residual arithmetic) и т.п.

Я стесняюсь спросить а те 20 лет опыта точно в C/C++?
Кроме того ну есть же warnings, тестовое покрытие и т.д.

Шутки типа "участие unsigned int приводит к беззнаковой операции, а участие unsigned short — нет, ибо он вначале конвертируется в signed int" ещё усложняют это.

Ничего оно тут не усложняет — приведение типов к большей разрядности это тоже часть usual arithmetic conversions и это просто тупо — вопрос приоритетов.

0

Чему равно выражение -3/3u*3 на С++? Не угадаете. Ответ: -4. Приглашаю на небольшое расследование

sebres May 5 2021 at 14:48

Кастить -4 к беззнаковому в общем случае полная ерунда, поэтому если кастишь, то должен быть точно уверен зачем.

Совершенно верно!
Тут как бы деление с остатком (внезапно это 1), т.е. чтобы из -4 сделать -3 (или 4294967293), нужно по всем правилам добавить тот остаток после умножения, т.е. написать такое:

// (4294967293 / 3 * 3 + 4294967293 % 3) == 4294967293 == -3 (as signed int) 
(-3/3u)*3 + (-3%3u)
// ну или кастить собственно до деления:
-3/(signed)3u*3

Я вообще не понимаю о чем тут баттхерт и почему вдруг стандарт надо переписать?! Потому что человек вдруг ~~открыл для себя~~ увидел usual arithmetic conversions в действии? Ну ОК тогда.

+4

[Пятничное] Все мы немного Сизиф

sebres Apr 16 2021 at 19:05

Невозвращенца в этот раз забрали уже два конвоира Танат и Фанат

Хмм… Как бы Танатос, Фанатос, Танат и Фанат — это всё одно лицо (др.-греч. Θάνατος).
Раздвоился?

0

Как нас разводят с (бес)платной подпиской

sebres Mar 16 2021 at 20:07

практически все риски берут на себя банки

Нет. Все риски (ну как все — один) на себя берёт пользователь выдавший Lastschrift-мандат третьей стороне. Выдав его, он "обязан" собственноручно проверять свой счет (самостоятельно мониторить те Lastschrift списания со счета), а также наличие средств на том счете. При этом у него есть 8 недель чтобы отозвать платеж, если тот мандат выдавался фирме "списавшей" деньги, и до 13 месяцев, если он совсем неправомерный (мандат не был выдан вовсе или был отозван).

0

Не блокировка, а замедление

sebres Mar 12 2021 at 15:50

Да ну? Вот прямо штраф, вот прямо государству? ...

и

Так я же именно про это и говорил

ну как бы не совсем про это, nicht wahr? :)

В праве действительно есть параграф про денежный штраф, не говоря уже про срок…
Я просто уточнил, для "сумлевающихся" так сказать, что таки — да, "вот прямо штраф".

+1

Не блокировка, а замедление

sebres Mar 12 2021 at 15:10

за 20 лет постоянных торрентов, не было никаких штрафов.

~~Слабоумие и~~ отвага? Или upload (раздача) в торрент-клиенте отрублен?
Почитайте мой ответ выше.

+1

Не блокировка, а замедление

sebres Mar 12 2021 at 15:04

Было бы интересно посмотреть на Bußgeldbescheid :)

Да пожалуйста, вот вам даже приговор суда (BGH I ZR 48/15), первый попавшийся…
В этом случае Bußgeldbescheid не будет, будет только Kostenentscheidung (с оплатой штрафа, если назначат + Gerichtskosten, и т.п.).

А вообще зависит от того, доведут ли дело до суда, ибо очень часто решается досудебным договором (aussergerichtlich), ну и если довели, как судья на то посмотрит…
В худшем случае может грозить Urheberrechtverletzung, а Urheberrecht ужесточили (кажется в 2019 или 2020):

"Privatpersonen droht in diesem Fall entweder eine Geldstrafe oder eine Freiheitsstrafe von bis zu drei Jahren."

"В этом случае частным лицам грозит либо денежный штраф, либо лишение свободы на срок до трех лет."
(А если вдруг признают что вы тем занимались в коммерческих целях то до 5 лет).

В общем, тут довольно много нюансов, и ходящая среди эмигрантов из СНГ страшилка про «штрафы за скачивание фильмов» по факту очень сильно преувеличена.

За "скачивание" — то действительно чушь, но проблема с торрентами — как правило — это параллельное "распространение", ибо торрент-клиенты тот ваш стрим могут тут же расшарить.

Из моих знакомых — около десятка случаев, причем половина не доводили до суда (оплатили требования + стоимость адвокатов + подписали договор), вторая же часть тупо не оплачивала, и тут как свезло, или не успели в срок (в этих делах Verjährungsfrist — 3 года от конца года в котором Abmahnung прилетел), просто потому что ~~суды переполнены~~ судей не хватает, или на вас попросту забили (потому что рыбка пожирнее нашлась), или всё таки довели до суда, и тогда — всё по полной программе.
А доказать что-то там всё очень сложно, и там не как в уголовном праве — презумпции невиновности нет. Т. е. доказывать например, что вашим WLAN воспользовались какие-то "злоумышленники" (а вы и знать не знали) придется именно вам (вашему адвокату).
Посадить то из них никого не посадили, но одному штраф не маленький такой присудили. Ну а судебные издержки и адвокаты истца оплачиваются всеми (если вина признана хотя бы частично).

+3

Не блокировка, а замедление

sebres Mar 11 2021 at 21:14

В логику ТСПУ вставили проверку для замедления на все .*t.co.*, вместо, например, ^t.co$.

Ну для поиска первой регулярки .* спереди/сзади без якорей как бы не нужны, точки перед доменом (в обоих вариантах) надо проэскейпить, и лучше к якорю для начала добавить туже точку (чтобы ловить и под-домены) или какой другой lookbehind для границ домена, т.е. будет что то вида:

- `.*t.co.*`, вместо, например, `^t.co$`
+ `t\.co`, вместо, например, `(?:^|\.)t\.co$`

+1

США и Германия на дипломатическом уровне просят помощи у Тайваня с поставками микросхем

sebres Feb 24 2021 at 13:43

Ну ну, расскажите мне как тут всё "нормально"… Я уже как бы добрую четверть века в Германии инженером оттрубил и весь этот outsourcing тренд можно сказать изнутри пережил… Про "просрали" речь действительно не идет (но то ваши а не мои слова), однако назвать это "нормальным" у меня язык точно никак не поворачивается.

0

США и Германия на дипломатическом уровне просят помощи у Тайваня с поставками микросхем

sebres Feb 23 2021 at 19:36

Да да… сначала вывезли всё и вся, что только каким-либо способом реально было перетащить (аутсорсинг наше всё)… а теперь будем "активно" строить.
А всё остальное от сырья до инженеров по видимому само появится. Особенно интересно когда в том дефиците чипов прослеживается например нехватка поли-Si пластин, крупнейшим поставщиком которых (наряду с другими не менее важными типами сырья) внезапно является опять Китай… Т.е. активно строить будем вероятно всё, обеспечивающее всю ту цепочку производственного процесса от и до.
А если ещё вспомнить всем известную немецкую бюрократию, кучу регулирующих органов, то всё это строительство в особенно прекрасном свете предстаёт.

+1

4

5 6 ...