271828 Oct 30 2019 at 16:50

Зачем нужны ranges из C++20 в простой числодробилке?

7 min

11K

Programming*C++*Functional Programming*

From sandbox

+39

Comments 76

Antervis Oct 30 2019 at 17:13

они слишком абстрактны и нужны только для очень абстрактного кода

скорее «они очень абстрактны потому, что нужны для любого не очень абстрактного кода».

Моя личная претензия к с++20 (даже не к ranges как таковым) — отсутствие генераторов, с помощью которых уже можно было бы выразить и ranges, и корутины.

khim Oct 31 2019 at 00:12

Чем генераторы от корутин отличаются???

-2

Antervis Oct 31 2019 at 03:15

корутина — частный случай генератора. И даже если за счет плюсовой шаблонной магии любой генератор можно выразить корутиной, приделать к ним range-like интерфейс всё равно непросто.

-1

khim Oct 31 2019 at 14:11

Вообще у нормальных людей короутина — это частный случай генератора.

Chaos_Optima Oct 31 2019 at 16:34

Вы наверно хотели сказать что генератор это частный случай корутин.
Antervis
Генераторы можно делать с помощью корутин, а можно делать и без корутин. А вот корутины с помощью генератора делать это я слабо себе представляю. И да в С++20 корутины же будут. В vs19 их можно включить кстати. Также корутины можно эмулировать по средством потоков или файберов.
Вот например

int main()
{
  auto gen = generator(std::tuple<int, int, int>)
  {
    for (int z = 1; ; ++z)
      for (int x = 1; x <= z; ++x)
	for (int y = x; y <= z; ++y)
	  if (x*x + y*y == z*z)
	    co_yield(std::make_tuple(x, y, z));
  };

  for (int i = 0; i < 100 && (bool)gen; i++)
  {
    auto val = gen.next();
    printf("(%i,%i,%i)\n", std::get<0>(val), std::get<1>(val), std::get<2>(val));
  }

  return 0;
}

cpp.sh/8dy27

khim Oct 31 2019 at 17:33

Вы наверно хотели сказать что генератор это частный случай корутин.

Ммм. Не стоит комментировать, едучи в автобусе, даже если там больше нечем особо заняться…

Выразался очень смутно, но имел в виду то же, что и вы. Собственно как пишет Wikipedia: Generators, also known as semicoroutines, are a special case of (and weaker than) coroutines, in that they always yield control back to the caller (when passing a value back), rather than specifying a coroutine to jump to

Но это у нормальных людей так. У Antervis генераторы явно не такие, как у нормальных людей, раз через них и ranges и корутины выражаются… потому и возник вопрос: а что он, собственно, под словом «геренатор» подразумевает?

Конечно та же Wikipedia рассказывает как корутины эмулировать на генераторах… но тут надо понимать, что эмулировать можно вообще всё на почти всём (главное вначале машину Тьюринга построить, а дальше задача сводится к предыдущей), вопрос же не в этом.

Antervis Nov 3 2019 at 00:00

Вы наверно хотели сказать что генератор это частный случай корутин.
Antervis
Генераторы можно делать с помощью корутин, а можно делать и без корутин

генератор в частном случае может являться zero-cost абстракцией. Корутина таковой (в нынешней инкарнации) не является, и поэтому делать zero-cost генераторы через корутины не получится. Из-за этого нет смысла объединять интерфейсы корутин и ranges, чего, собственно, мне бы и хотелось. «Генератором» я и назвал такой объединенный интерфейс, который не обязан удовлетворять требованиям корутины, но позволяет писать код через yield/await.

И да в С++20 корутины же будут. В vs19 их можно включить кстати

и в gcc есть ветка с корутинами.

khim Nov 3 2019 at 01:48

генератор в частном случае может являться zero-cost абстракцией.

корутина в частном случае — тоже может. В общем — ни там, ни там нет.

На самом деле с короутинами история STL повторяется. Если посмотреть на существующую реализацию, то память уже не выделяется, но какие-то «следы» в коде остаются… думаю со времением и их изведут.

Корутина таковой (в нынешней инкарнации) не является, и поэтому делать zero-cost генераторы через корутины не получится.

Почему нет? В языке это ничто не запрещает, а компиляторы, я думаю, подтянутся…

«Генератором» я и назвал такой объединенный интерфейс, который не обязан удовлетворять требованиям корутины, но позволяет писать код через yield/await.

Осталось понять чем это от существующего предложения отличается…

и в gcc есть ветка с корутинами.

А в clang не нужна ветка — там это опция компилятора.

Antervis Nov 3 2019 at 03:52

корутина в частном случае — тоже может.
…
В языке это ничто не запрещает, а компиляторы, я думаю, подтянутся…

теоретически язык вообще мало что запрещает, пока что только с std::unordered_* облом. А пока практической возможности нет, смысла тянуть это в язык тоже нет.

Если посмотреть на существующую реализацию, то память уже не выделяется

строчка 5 асма — call operator new.

-1

khim Nov 3 2019 at 04:24

А пока практической возможности нет, смысла тянуть это в язык тоже нет.

C++ так не работает. STL стал «zero-cost абстракцией» примерно лет через десять после того, как его в стандарт включили. Важна теоретическая возможность, а не то, что делают реальные компиляторы «здесь и сейчас». Если вам этот подход не нравится — вам нужно работать с каким-нибудь другим языком, C++ всегда так был устроен…

Если посмотреть на существующую реализацию, то память уже не выделяется
строчка 5 асма — call operator new.

Смтрю в книгу — вижу фигу. А ничего что эта строчка при работе программы (то есть функии bar в вашем случае) никогда не вызывается? От выделения памяти все компиляторы уже давно избавились, а вот оптимизации… да, «провисают» пока. Ну ничего — лет через 10 поправят.

UFO just landed and posted this here

khim Oct 31 2019 at 22:19

По крайней мере, в значительной части случаев это всё ведёт к более краткому, выразительному и понятному коду.

К сожалению подавляющее большинство программистов не умеют в математику и для них функциональный подход выглядит сложнее, чем даже все эти короутины и ranges. Смиритесь.

Я тоже не понимаю почему — это просто такой факт, который я вижу на практике.

picul Oct 30 2019 at 18:07

Ну или можно сравнить с весьма компактным вариантом, который не пытается эмулировать контейнеры там, где они не нужны:

Код

template <typename T>
double integrate(T generator) {
    double acc = 0;
    double t;
    while(generator(t)) {
        acc += dt_fixed * f(t);
    }
    acc -= 0.5 * dt_fixed * f(0);
    acc -= 0.5 * dt_fixed * f(tau);
    return acc;
}

long long int i = 0;
double res = integrate( [&i, n_nodes](double& t)
{
    t = static_cast<double>(i);
    ++i;
    return i < n_nodes;
} );

(Возможно где-то ошибся, но идея думаю ясна.)
Сам я рэнжи не смотрел, лишь слышал о плохой производительности, так что ничего об их (не)целесообразности сказать не могу. Но их нетривиальность с ходу вызывает опасения, что их начнут использовать не к месту, тем самым усложняя код.

271828 Oct 31 2019 at 10:11

Тоже хороший вариант, добавил его в репозиторий в виде v6.cpp. Выполняется около 4.5 с при компиляции и g++, и clang++.
Меня в нём смущает висячая long long i, чтоб её убрать, надо делать генератор объектом класса (который хранит i), писать конструкторы и в итоге получится не сильно короче, чем с итераторами. Хотя этот вариант в целом попроще.

picul Oct 31 2019 at 13:37

Чтоб убрать висячий каунтер, надо всего то обернуть код в {}, в крайнем случае можно вынести в отдельную функцию. Без обид, но опять создаете проблемы на пустом месте.

271828 Oct 31 2019 at 14:23

Мне кажется, не на пустом. Представьте, вам справку писать придётся по этому коду. И вы напишете "Вот так это нужно использовать… И не забываем оборачивать в {}!"? Не самый это изящный вариант. И функции нечистые я не люблю. А с итератором сразу понятно, что внутри грязная функция спряталась.

picul Oct 31 2019 at 14:59

Это можно использовать как угодно, главное знать что должен из себя представлять генератор (именно об этом в справке и напишут). Если так изящнее — ОК, пусть будет изящнее. Просто нужно учитывать, что часто впоследствии код читают другие люди, и для них важнее быстро разобраться, чем всячески избегать нечистых функций.

mobi Oct 30 2019 at 20:07

А ключик -march=native в g++ влияет на производительность?

khim Oct 31 2019 at 00:17

Скорее на воспроизводимость. Он означает «включи те фичи, которые вот тут, на этом конкретном процессоре, имеют смысл».

Отличная штука для того, чтобы собрать что-nj для себя и использовать, категорически недопустима для замеров скорости.

Потому что фиг его знает что именно у вас там в CPU есть — это ж не только от модели CPU может зависеть, некоторые фичи могут и от версии операционки или BIOS зависеть!

271828 Oct 31 2019 at 09:10

Как ни странно, но для моего Xeon-а — нет, не влияет. Только для clang++ v1 стал на 0.5 с быстрее с ним, для остальных всё осталось в пределах +- 0.1-0.2 с.

Refridgerator Oct 31 2019 at 05:52

Будем интегрировать методом трапеций вот такую функцию:

А какой в этом смысл, если эта функция прекрасно интегрируется аналитически? На что у меня потребовалось меньше времени, чем на прочтение следующего абзаца.

-6

271828 Oct 31 2019 at 08:51

Конечно, тестировать производительность лучше всего на примере, для которого заранее известен ответ, иначе можно написать очень быстрый, но неправильный код. Аналитический ответ, кстати, есть в тексте статьи.

Refridgerator Oct 31 2019 at 09:11

Для заранее известного ответа можно использовать системы компьютерной алгебры, которые с произвольной точностью считать умеют. И метод трапеций очевидно не так быстро сходится, по сравнению с другими — тоже не самый лучший выбор. Закономерно возникает сомнение, что и дальше по тексту у вас будет оптимальное решение.

-9

devpony Oct 31 2019 at 11:27

Статья не про численное интегрирование. И не про интегрирование вообще. Она даже не в хабе «Математика». Статья про новую фишку C++20.

Автор подобрал максимально простой пример, в котором эту фишку можно использовать, понятный большинству читателей. Вместо интегрирования методом трапеций тут могло быть вообще всё что угодно, использующее цикл с переменным шагом.

Refridgerator Oct 31 2019 at 17:01

Я понимаю, что математика нужна не каждому программисту, но автор всё-таки позиционирует себя как «физик-теоретик», а от физика-теоретика ожидаешь содержания чуть более интересного, чем школьные примеры. Статья бы только выиграла, будь в качестве примера хотя бы эллиптический интеграл. И ещё больше бы выиграла, если бы код из неё можно было бы взять и использовать «как есть» в реальных задачах.

-5

khim Oct 31 2019 at 17:25

Статья бы только выиграла, будь в качестве примера хотя бы эллиптический интеграл.

Статья бы, конечно, проиграла, если бы в качестве примера был взят эллиптический интеграл.

Потому что важно не то, что умеет автор стартьи (он же не для себя статью пишет!), важно что знают и умеют читатели.

Так вот про интегралы и как их считать — рассказывается даже в школьной программе, а вот эллиптических — там уже нет.

Если ваша задача рассказать про фишки C++, а не про математику кривых — то лучше, чтобы эллиптических интегралов в статье бы не было.

И ещё больше бы выиграла, если бы код из неё можно было бы взять и использовать «как есть» в реальных задачах.

Возможно, но тут проблема курицы и яйца: пока ranges не в релизе — их мало кто использует, а когда будет набрана статистика использования — писать «вводную» статью типа обсуждаемой… уже поздновато.

Refridgerator Oct 31 2019 at 18:36

Статья бы, конечно, проиграла, если бы в качестве примера был взят эллиптический интеграл.

То есть, если бы автор начал статью не с «найти интеграл функции ...» а с «посчитать длину кривой» было бы хуже?

Потому что важно не то, что умеет автор статьи (он же не для себя статью пишет!), важно что знают и умеют читатели.

Если статья о том, что все и так знают, то какой вообще смысл её читать?

-2

khim Oct 31 2019 at 19:13

Если статья о том, что все и так знают, то какой вообще смысл её читать?

Естественно статья должна включать что-то, чего люди не знают. Но все «посторонние» вещи — желательно свести к минимуму.

То есть, если бы автор начал статью не с «найти интеграл функции ...» а с «посчитать длину кривой» было бы хуже?

Да, потому что понять — откуда там вообще берутся проблемы гораздо сложнее.

devpony Nov 1 2019 at 14:12

Если статья о том, что все и так знают, то какой вообще смысл её читать?

Статья не об интегралах, а о ranges в C++20. Интегралы тут вообще сбоку, как пример.

playermet Oct 31 2019 at 19:55

Нет уж, спасибо, как-то не хочется видеть обозрение трехстрочных фич языка на примерах с постшкольным матаном (я в курсе про термин, если что, поправлять не надо).

Refridgerator Nov 1 2019 at 05:35

Извлечение корня изучают ещё в школе и даже раньше, чем тригонометрию. Это операция, обратная возведению в квадрат. Что страшного в корне, я упорно не понимаю.

Математику за то и не любят, что её дают на примерах, отдалённых от реальности; и многие вещи, звучащие страшно и непонятно, на деле оказываются простыми и очевидными — если их излагать не как «вешь в себе», а применительно к реальным задачам.

-2

playermet Nov 1 2019 at 11:06

Математику за то и не любят, что её дают на примерах, отдалённых от реальности

Это можно ставить в упрек статьям по математике, но никак не статьям в которых сама математика — пример использования чего-то.

З.Ы. Мое сообщение выше действительно стоило плевка в карму? Серьезно?

Refridgerator Nov 1 2019 at 15:55

Я не знаю, моя карма пострадала сильно больше, если вам станет от этого легче.

-2

Refridgerator Nov 3 2019 at 04:48

del

Refridgerator Nov 3 2019 at 04:51

Я вам поставил (а не «плюнул») минус не столько за содержание, сколько за мотивацию. Вы шли мимо, увидели, что кого-то сильно минусуют, и решили попинать его за компанию, ничем при этом не рискуя. Это низко и недостойно. Самоутверждаются за чужой счёт только те, кому утвердиться больше нечем — у вас нет ни статей, ни сколько-нибудь значимых комментариев в обозримый промежуток времени.

По содержанию. Изображая из себя знающего человека вы прокололись, назвав эллиптический интеграл «термином» — в то время как это никакой не термин, а функция. По основной теме статьи — ranges — вы также ничего сказать не смогли.

Вы никак не подтвердили свою квалификацию, чтобы позволить себе подобного рода высказывания. Я считаю, что вам и подобным вам нет места на Хабре. Ваше последующее прилюдное нытьё по поводу потери единицы кармы лишь подтвердило это.

Ну а если другим членам сообщества, минусующим мои комментарии, ваши более интересны — имеют на то полное право.

P.S. Чтобы читать о фичах языка без матана и прочей шелухи, нужно читать просто документацию.

-2

playermet Nov 4 2019 at 09:25

Вы шли мимо, увидели, что кого-то сильно минусуют, и решили попинать его за компанию

Это только в вашем видении. А в моем видении я прочел статью, спустился в комментарии, прочел их, и в ответ на утверждение с которым не согласен выразил свое мнение, без хамства и брани. Собственно, для этого и существуют комментарии.

Изображая из себя знающего человека вы прокололись, назвав эллиптический интеграл «термином»

Вообще-то, под «термином» подразумевался «матан». Очень любят его поправлять, вот я и подстраховался.

прилюдное нытьё по поводу потери единицы кармы

Обидно конечно, но меня возмутила совсем не потеря кармы, а то, в ответ на какой комментарий она последовала. Я бы понял, если бы там был переход на личности, превышение градуса, введение в заблуждение, или хотя бы напряженный спор между нами. Но там было весьма нейтрально выраженная одним коротеньким комментарием точка зрения по совершенно безобидной теме. Скорее я поверю что вы просто в отместку за минуса прошлись по всем несогласным не глядя, чем в мотивацию которую вы описали выше.

Refridgerator Nov 4 2019 at 14:19

Нет, «в отместку» досталось только вам. Если вам это показалось несправедливым — мне жаль, но никто не считает минусы в свою сторону справедливыми. Возможно, это добавит вам мотивации написать свою статью, накопить кармы и поставить минус мне в ответ. Возможно также, что прочитав вашу статью, я изменю своё мнение и сменю минус на плюс (хотя вряд ли вы об этом узнаете).

kovserg Oct 31 2019 at 07:40

«Воспользуемся трудами его плодов. Код скажет всё сам за себя:»

Лучше расскажите как в C++20 построить график этой функции и сохранить его pdf.

-3

271828 Oct 31 2019 at 08:54

MathGL, как вариант?

nckma Oct 31 2019 at 09:17

for(long long i = 1; i < n_fixed - 1; ++i) {

 double t = dt_fixed * static_cast(i);

 acc += dt_fixed * f(t);

 }

Чего-то я туплю, но почему у вас этот подсчет называется методом трапеции?

271828 Oct 31 2019 at 09:29

Тем не менее в примерах мы почти до самого конца "забудем" про настоящий метод трапеций и для простоты будем рассматривать его версию с постоянным шагом, держа при этом в голове то, что сетка может быть произвольной.

Меня интересовал вопрос — как сетку в интегрирующую функцию передать, а не как именно написать метод трапеций для этой функции. По сути здесь речь об удобстве написания/поддержки без потери производительности. Честный метод трапеций, с переменным шагом там есть в конце (в репозитории — файл v5.cpp).

nckma Oct 31 2019 at 09:51

Честно говоря я не про шаг спрашивал…
Мне всегда казалось что площать трапеции вычисляется как-то так:
s=(f(t0)+f(t1))*h/2
где t1=t0+delta_t

271828 Oct 31 2019 at 09:57

Это и написано в v5.cpp. Если же t_{i+1} — t_i = const (то есть не зависит от i), то из метода трапеций получается то, что написано в v1-v4. Просто формулу трапеций так можно преобразовать в случае постоянного шага. Вычислений при этом меньше, скорость — выше.

khim Oct 31 2019 at 14:25

Я думаю претензия была просто в том, что не стоит метод правых прямоугольников назвывать методом трапеции.

Хотя было бы, наверное, проще так и написать, чем пытаться «эзоповым языком» на этот вариант вывести.

271828 Oct 31 2019 at 15:08

Метод правых/левых прямоугольников менее точен, чем метод трапеций. Я же говорил про то, что википедия зовёт формулой Котеса.

khim Oct 31 2019 at 15:39

Вот только формула Котеса опирается на тот факт, что у нас трапеции имеют одинаковую ширину.

А вы проде как шаг менять собрались…

hhba Oct 31 2019 at 15:06

Общности в таком подходе — хоть отбавляй, а что с производительностью? С потреблением памяти? Если раньше у нас всё суммировалось на процессоре, то теперь приходится сначала заполнить участок памяти, а потом читать из него. А общение с памятью — довольно медленная вещь.

Хм, ну подождите, если ставится задача «делаем универсальную функцию интегрирования трапециями, в которую снаружи передается набор узлов», то без трат памяти не обойтись. Кто-то где-то в другом месте этот набор генерирует и так или иначе записывает его в память, чтобы нам передать. Этот генератор может быть разным по устройству, не обязательно компилируемым вместе с функцией интегрирования, возможно набор узлов вообще по почте приходит.

К слову, если ваш второй пример запустить, то (количество узлов я взял поменьше, а то у меня чего-то bad alloc вылезал) результат таков: 1.3 секунды занимает заполнение вектора и 3.8 секунды собственно вычисление интеграла, отсюда и берется «худший результат из сравниваемых». Да и вообще сравнение получается немного странным:
1) Постоянный шаг, вычисление аргумента «по месту».
2) Постоянный шаг, вычисление аргумента где-то снаружи, но с учетом времени этого вычисления (!?).
3) 4) Постоянный шаг, вычисление аргумента «по месту» (если я правильно понимаю этот код, простите мое плохое знание С++ и ленивых вычислений).
5) Переменный шаг, вычисление аргумента «по месту».
То есть везде какие-то отличия по сути, что же мы сравниваем?

Но вообще спасибо за статью, узнал новое для себя!

P.S.: Я же верно понимаю, что для варианта 5 теряется совместимость с вектором?

271828 Oct 31 2019 at 15:24

А почему во всех вариантах вычисление сетки должно учитываться (по времени), а во втором — нет? Так нечестно.
std::vector плох не только скоростью. Если интегрируемая функция достаточно тяжело вычисляется на каждом шаге, то общение с памятью не будет "бутылочным горлышком, конечно. Но может банально памяти не хватить под этот вектор, например.
5 вариант не потерял совместимость с вектором, просто t_i в вектор нужно положить другие (в смысле другие числа, а тип тот же; vector<double>). Но работает это не быстро (14 секунд в моих условиях, из них 9 на заполнение вектора, из которых можно 1.5 секунды сэкономить, если сделать заранее reserve).
А сравниваем мы и скорость, и удобство, ну и потребление памяти, если хотите.

hhba Oct 31 2019 at 16:01

А почему во всех вариантах вычисление сетки должно учитываться (по времени), а во втором — нет? Так нечестно

Потому что во всех вариантах это именно вычисление, а во втором — работа с памятью. И в зависимости от свойств системы результат получается разным. Я бы сказал так, что либо второй вариант в вашей статье лишний, либо наоборот — все остальные лишние. И, разумеется, самой идеи рассказать таким образом о ranges это никак не умаляет.

std::vector плох не только скоростью

Конкретно вектор ничем вообще не плох. Плох (или «плох») любой способ формирования набора узлов, который требует промежуточной памяти. А тут уже нет никакого выбора — либо вам без памяти не обойтись (набор получен по сети), либо нет никакого смысла хранить его в памяти (и вычисляем на каждом шаге, любым из предложенных вами способов).

5 вариант не потерял совместимость с вектором

Пардон, но если посмотреть на код в for()?

271828 Oct 31 2019 at 23:02

Пардон, но если посмотреть на код в for()?

for (auto t: t_nodes | ranges::v3::views::drop(1)) работает и в том случае, если t_nodes есть vector<double>. О времени для такого варианта я выше и говорил.

hhba Nov 1 2019 at 09:27

А можете тогда пояснить, что делает ranges::v3::views::drop(1)? А то в документации на сайте Ниблера написано что-то невнятное.

271828 Nov 1 2019 at 12:20

Отбрасывает первый элемент и оставляет всё остальное.
Что вот мне совсем не нравится в ranges — очень скудная документация. В примерах у Ниблера drop даже не встречается. Но есть take — это, наоборот, взять n первых элементов, отбросив всё остальное. И оба они ленивые, то есть можно работать с бесконечной последовательностью, а уж потом сделать take, например.

hhba Nov 1 2019 at 12:57

Вот, значит я правильно понял описание. И тогда единственный смысл этой операции — отбросить первый узел (который до цикла был взять через begin). При этом весь код до вызова integrate() может быть удален, насколько я понимаю (само собой потребуется альтернативный код для заполнения вектора). Но тогда непонятно, почему вдруг время так выросло по сравнению с вариантом 2.

271828 Nov 1 2019 at 13:45

Там основное время — заполнение вектора, а поскольку шаг в этом примере переменный, то функция step_f, вычисляющая t_i, уже не такая простая. Я подозреваю, что всё дело в ней. Сами же integrate в v2 и v5 тоже разные, честная версия из v5 заметно медленнее версии из v2, в которой используется тот факт, что шаги одинаковые. Но шагов в v5 меньше, чем в v2. В общем, довольно проблематично их сравнивать.

hhba Nov 1 2019 at 14:32

Да, наверное дело в этом.
Ну и в очередной раз мы говорим о проводимых сравнениях. :)

Насчет модификаторов интервала, я не совсем понял (и сходу не нагуглил, точнее нагуглил нечто обратно противоположное) — это что-то общее для всех контейнеров С++, или только для интервалов?

hhba Nov 2 2019 at 14:22

Прочитал наконец статью по ссылке — элементы подпространства ::view и есть по сути модификаторы для любых контейнеров.

khim Oct 31 2019 at 15:40

Хм, ну подождите, если ставится задача «делаем универсальную функцию интегрирования трапециями, в которую снаружи передается набор узлов», то без трат памяти не обойтись.

Не обязательно. Если снаружи передаётся короутина, то она может порождать набор «лениво».

hhba Oct 31 2019 at 15:53

Если корутина — то да, а если именно массив значений, полученный по сети?

khim Oct 31 2019 at 17:16

Если это массив значений, то никакие ranges не нужны.

hhba Oct 31 2019 at 17:21

… и это та мысль, которую я хотел высказать, но боялся )))

А если стоит задача генерировать узлы «на месте», то можно генерировать их прямо в теле функции, а можно передать указатель на функцию-генератор (привет Си), а можно корутину, или вот ranges, или вообще что угодно еще, с примерно одинаковым результатом.

khim Oct 31 2019 at 17:28

вообще что угодно еще, с примерно одинаковым результатом.

Не совсем. Ranges — это некоторая абстракция, которая легко получается из корутин или генераторов.

Вообще мне кажется на практике ragnges, реализованные через корутины могут оказаться самым распространённым вариантом…

UFO just landed and posted this here

hhba Nov 1 2019 at 09:59

Вообще я не призывал обойтись без темплейтов, просто приводил альтернативные примеры получения (не хранения) набора узлов «на месте».

Зачем войд-звездочка и пара функций? Вот вам без звездочек и пары функций (сказал он с хитрой улыбкой):

#include <iostream>

double integrate(int generator()) {
    for(int i {}; i < 42; i++) {
        std::cout << 1.1 * static_cast<double>(generator()) << std::endl;
    }
    return 0.0;
}

int Generator()
{
    static int count {};
    return count++;
}

int main() {
    integrate(Generator);
    return 0;
}

-1

UFO just landed and posted this here

hhba Nov 1 2019 at 16:07

А вы на каждый набор параметров генератора будете писать свою функцию?

Все зависит от обстоятельств. Если генератор в принципе должен быть параметризован (что не факт, и, кстати, выше это требование не предъявлялось), то это можно сделать разными способами, а можно не суметь сделать вообще.

А запускать вычисления в том же потоке ещё раз с нуля как будете?

Тут конечно не поспоришь, в приведенном выше примере придется мутить несколько более сложный генератор (и конечно в стиле "о Боже, что это").

-1

UFO just landed and posted this here

hhba Nov 1 2019 at 16:47

Эм, не совсем понял, что вы имеете в виду в привязке к конкретному примеру — интегрировать в несколько потоков? Или в каждом из потоков считать свой интеграл, но по одному и тому же генерируемому функцией-генератором набору? Если второе, то thread_local с тем же самым вышеприведенным кодом вполне будет работать, почему нет?

UFO just landed and posted this here

hhba Nov 1 2019 at 17:10

Здесь я должен честно признать, что в моих задачах всегда хватало «запуска пачки std::thread руками» (образно выражаясь). Я смутно себе представляю, зачем может потребоваться делать то, о чем вы говорите.

UFO just landed and posted this here

hhba Nov 2 2019 at 10:44

общий параллелизм охота ограничить каким-то фреймворком для управления параллелизмом

Ну, это тогда надо смотреть, что за фреймворк… Если он действительно ведет себя так, как описано выше, то возможно не только в вычислении интеграла возникнет фатальная проблема.

4e1 Oct 31 2019 at 15:21

Про icc — надо дизасемблировать и тогда сравнивать. Например, он любит анролить и инлайнить поболее gcc/clang.

klirichek Oct 31 2019 at 17:59

range что с сеткой, что без неё всё равно остаётся последовательным.
А хотелось бы магии, чтобы для задач вроде подобной сгенерировался такой код, который разбил бы range на subranges, и запустил их в параллель на нескольких ядрах.
Но для этого сами исходники (итератор, который знает свои границы и умеет шагать вперёд) не очень хороши. Ну разве что сделать тестовый прогон без финальных вычислений, и там эти самые границы разметить (собрать таблицу значений итератора), а потом уже выдать каждому потоку/задаче по собственному диапазону/подтаблице. Но это уже не так прямолинейно.

kovserg Oct 31 2019 at 18:52

Тут недавно про julia писали, так там это есть из каробки. И для любителей дифуров много чего есть.

ps: Еще надо быть готовым что при распараллеливании результаты вычислений могут отличаться, так как (a+b)+c не равно a+(b+c) для double.

271828 Oct 31 2019 at 23:31

Есть такая штука, как OpenMP. В v1.cpp она сходу даёт ускорение в 10 раз (у меня 16 ядер), но заставить её работать с range-based for loop (for (auto t: ts)...), и тем более с ranges у меня не получается. Возможно, просто время позднее и руки кривые.

MaxakCh Oct 31 2019 at 23:32

Интересно как изменится производительность в V2 вектор заменить на «голый» массив?
P.S.

… а v4 в три раза быстрее, чем v1

а вот это совсем странно.

Show the best of all time