Braiko Oct 30 2015 at 20:28

Сортировка без if-ов

2 min

39K

C++*Algorithms*

Comments 71

lair Oct 30 2015 at 20:35

Квадратичная алгоритмическая сложность?

Интересно, кстати, а повторяющиеся числа по условию задачи могли быть?

Braiko Oct 30 2015 at 21:17

Повторов по условию нету.

3bab00n Oct 31 2015 at 16:54

Если повторов нет, то можно вот так сделать:

#include <iostream>

using namespace std;

int main() {
    int arr[] = {34, 12, 24, 65, 63, 22};
    int arraySize = (sizeof(arr) / sizeof(*arr));
    unsigned char buf[101]={0};

    for (int k = 0; k < arraySize; k++) {
	buf[arr[k]]++;
    }

    unsigned char i=0;
    for (int k = 0; k <= 100; k++) {
	arr[i]=k;
	i+=buf[k];
    }

    for(int a:arr){
        cout<<a<<endl;
    }
    return 0;
}

NeoCode Oct 30 2015 at 20:39

Кстати, в реальной практике столкнулся с тем что иногда алгоритмы без if'ов могут быть полезны. При разработке прошивки для микроконтроллера обнаружилось (реально, осциллографом) что наличие if'ов в процедуре обработки прерывания существенно замедляет эту самую обработку. Ну и оказалось проще придумать и написать нечто на арифметических и битовых операциях, но без условных переходов.

ZnW Oct 30 2015 at 20:48

Не знаю, насколько это применимо к «реальной практике», но:
Когда писал свой буфер глубины для изометрического движка, который строился на обработке пикселей процессором (велосипед от скуки, развлекал себя), как раз пригодилась замена if'а, выкидывающего пиксель, на нехитрую формулу с альфой двух пикселей. Прирост был, т.к. пикселей было много (:

BelBES Oct 30 2015 at 21:08

Еще бывает полезно избавиться от if'ов для того, чтобы немного помочь предиктору ветвлений.

UFO just landed and posted this here

zo_oz Oct 31 2015 at 01:39

Вот тоже самое хотел написать, выход из цикла в любом случае будет jnz/jz или loop по cx/ecx/итд
Можете пояснить чем это отличается от if?

p.s. код платформозависим) кто вам сказал что в int 32 разряда?

UFO just landed and posted this here

Randl Oct 31 2015 at 14:15

Надо заменить на int32_t из cstdint

kosmos89 Oct 31 2015 at 15:14

В современных процессорах есть предсказатель ветвлений, который накапливает статистику по jump'ам и спекулятивно выполняет ту ветвь которая до этого часто выполнялась. Поэтому если сброс конвейера и будет, то только на первой-второй итерации.
В более старых процессорах без предиктора, но со спекулятивным выполнением просто считалось, что jump назад всегда будет выполняться (потому что это очень похоже на цикл), а jump вперед — нет (потому что это похоже на выход из цикла).

UFO just landed and posted this here

DaylightIsBurning Oct 31 2015 at 12:10

if очень сильно бьют по производительности в OpenCL, там по сути просто выполняются все ветки кода и потом просто ненужные выкидываются…

Torvald3d Nov 1 2015 at 12:51

и не только огл, а практически на любой simd архитектуре

Torvald3d Nov 2 2015 at 11:17

Поясните, кто не согласен — где я ошибся? При simd архитектуре выполняется одна команда сразу над всеми нитями в варпе, соответственно ветвление возможно только в одном случае — когда этот варп прогоняется по всем веткам.

kosmos89 Nov 2 2015 at 12:21

На самом деле не всегда. Если в варпе все нити пойдут по одной и той же ветке, то никакого пеналти не будет.

vagran Oct 31 2015 at 16:04

Это очень актуально при написании шейдеров. Открывая статью, даже ожидал увидеть, что речь идёт о работе с GPU. А ветвления там не приветствуются из-за того, что код выполняется параллельно на сотнях ядер. Если один и тот же код выполняется на разных ядрах разное время, то выполняется дорогая синхронизация.

zelyony Oct 30 2015 at 20:50

https://graphics.stanford.edu/~seander/bithacks.html

DanmerZ Oct 31 2015 at 14:32

Спасибо за ссылку!

-1

UFO just landed and posted this here

DanmerZ Oct 31 2015 at 14:52

Рад за вашу учительницу, но по ссылке сборник хаков, а не руководство к действию :)

ankh1989 Nov 1 2015 at 01:50

SWAP(x, x) это типа контрпример такой? Никто так писать никогда не будет, поэтому на этот сферический контрпример в вакууме (вращающийся где то на орбите между Землей и Марсом) никто никогда не наткнётся. А вот SWAP(x, y) работает даже когда x = y, лишь бы это разные переменные были.

-3

Mrrl Nov 1 2015 at 09:31

SWAP(a[x],a[y]) написать могут. И случайно может оказаться x==y.

dimanonim Nov 1 2015 at 11:15

А почему не надо делать это через xor?

-2

geovas333 Oct 30 2015 at 20:57

Надо бы взять на вооружение, когда рассказывать уже нечего, а до конца занятия времени валом!

p.s. что-то код у вас длинноват.

a = [5,7,3,2,7,9,8]
def bsort(x):
    for i in range(len(x)):
        for j in range(len(x)-1):
            a = x[j]
            b = x[j+1]
            x[j]   = int ((a+b)/2.0 - ((a-b)**2)**0.5/2.0)
            x[j+1] = int ((a+b)/2.0 + ((a-b)**2)**0.5/2.0)
    return x
print a
print bsort(a)

lair Oct 30 2015 at 21:02

А вот если известно, что числа не повторяются, то можно решить за O(N).

Как-то так

let ub = 100

let sort (input: _[]) =
    let founds = Array.zeroCreate ub
    input |> Array.iter (fun e -> founds.[e] <- 1)

    let output = Array.zeroCreate (input.Length + 1)
    founds
    |> Seq.indexed
    |> Seq.scan (fun (prevPos, _) (i, v) ->
        let pos = prevPos + (1*v)
        let target = pos*v
        (pos, i)
        ) (0, 0)
    |> Seq.iter (fun (pos, i) -> output.[pos] <- i)
    
    output |> Array.skip 1

На самом деле, и для повторяющихся тоже можно.

Update: какой-то у меня странный баг, перепроверю. Но идея понятна.

lair Oct 30 2015 at 21:07

Исправленный код

let sort (input: _[]) =
    let founds = Array.zeroCreate ub
    input |> Array.iter (fun e -> founds.[e] <- 1)

    let output = Array.zeroCreate (input.Length + 1)
    founds
    |> Seq.indexed
    |> Seq.scan (fun (prevPos, _, _) (i, v) ->
        let pos = prevPos + (1*v)
        let target = pos*v
        (pos, target, i)
        ) (0, 0, 0)
    |> Seq.iter (fun (_, pos, i) -> output.[pos] <- i)
    
    output |> Array.skip 1

lair Oct 30 2015 at 21:24

Ну да, а если решать для повторяющихся, то общий случай оказывается проще. Shame on me.

Уупс

let sort input =
    let founds = Array.zeroCreate ub
    input |> Seq.iter (fun e -> founds.[e] <- founds.[e] + 1)

    founds
    |> Seq.indexed
    |> Seq.collect (fun (i, v) -> Seq.replicate v i)
    |> Seq.toArray

ankh1989 Nov 1 2015 at 01:53

Мм… этот код для 64-битных чисел потребует 2**64 байт памяти?

-1

lair Nov 1 2015 at 02:02

Нет, O(N).

-1

ankh1989 Nov 2 2015 at 01:06

ну если у нас три числа 3, 7, 2^64-3, то сколько надо будет памяти?

lair Nov 2 2015 at 01:18

По условию задачи числа находятся в диапазоне от 0 до 100.

halyavin Oct 30 2015 at 21:08

Вы не смогли додуматься до сортировки подсчётом?

geovas333 Oct 30 2015 at 21:18

Это как-то так?

Скрытый текст

a = [5,7,3,2,7,9,8]
def psort(x):
    b = range(100)
    c = []
    for i in range(len(b)): b[i] = 0
    for i in range(len(x)): b[x[i]] += 1
    for i in range(len(b)):
        for j in range(b[i]): c.append(i)
    return c
	
print a
print psort(a)

-1

miriarder Oct 30 2015 at 21:23

Думаю, что это как-то так.

geovas333 Oct 30 2015 at 21:28

Ух, помню оказывается! Значит можно с чистой совестью ложиться спать…

excoder Oct 30 2015 at 21:20

«Сортировка месива» – в этом что-то есть…

+15

Braiko Oct 30 2015 at 21:22

Спасибо, исправил

excoder Oct 30 2015 at 23:48

Да я не с целью исправить :) После нескольких лет разработки спелл-чекера душа радуется таким примерчикам со смыслом.

VioletGiraffe Oct 30 2015 at 22:51

На входе месиво, на выходе массив :)

UFO just landed and posted this here

Mirn Oct 30 2015 at 21:46

статья конечно хороша как эксперимент.
Так можно не только для ифов делать и всю логику линейной сделать.
Я ранее подобное описывал в каментах.
НО
я как то наталкнулся на свой код 15 летней давности… больше я так делать не буду никогда ни прикаких условиях как бы задача оптимизации не стояла. Код который нельзя исправить через 5-10 лет когда ты вообще забыл ЧТО ЭТО мне больше не нужен.
Даже если есть задача оптимизации и надо выжимать буквально байты, то можно делать это средствами самого языка не уродуя понимание и смысл.
А в микроконтроллерах уже есть неявное устранение IF. Например в ARM Cortex Mx инструкции с предикатами — часть инструкций испольняются если выставлен флаг а часть нет. Даже если этого не хватает то можно применить чёрную магию (для Россиян): например научить DMA и железо писать или читать данные аппаратно напрямую в lock-free очередь — экономиться и размер и скорость повышается. Причём в разы повышается. Так например поступил WIZNET в своих езернет чипах. Есть бит бандинг, алиасы регионов, аппаратные ускорители и прочие шалости. Все они неплохо заменяют то что описано в статье и совсем не портят сам исходник.

nikitasius Oct 31 2015 at 02:02

Поскольку я до этого жил в теплом мире фреймворков и библиотек

Прямо бальзам на сердце противнику фреймворков!

-4

raid Oct 31 2015 at 10:07

В myAbs какая-то тёмная магия. Можете пояснить, как оно работает?

Braiko Oct 31 2015 at 10:24

Это работает для платформ, где int занимает 4 байта.
int oldByte = (a >> 31)& 0x1; // тут мы получаем старший бит и логически добавляем его к 0x1. В результате oldByte равна 1 если число отрицательное и 0 если положительное.
в случае если число отрицательное то выражение (1+oldByte-1) равно 1, а (oldByte-1) равно 0. В итоге возвращается -а, а поскольку а уже отрицательное то минус перед ним делает его положительным. В противном случае (1+oldByte-1) равно нулю а (oldByte-1) равно -1. В результате выходит -а*(-1) то есть просто а. Поскольку а положительное то возвращается просто а.

-1

ZnW Oct 31 2015 at 11:38

>(1+oldByte-1)
Серьёзно? Может, я что-то упускаю, но нельзя ли это записать «несколько проще»?

leshabirukov Oct 31 2015 at 12:59

Вот так вроде должно работать:

int myAbs(int a){
    int sign = a >> 31;
    return (a ^ sign)-sign;
}

Iceg Oct 31 2015 at 14:57

можно же упростить

int myAbs(int a){
    int sign = a & 0x80000000;
    return a ^ sign;
}

ZnW Oct 31 2015 at 11:37

--Не та ветка

mambet Oct 31 2015 at 12:58

Мне в своё время очень понравилась эта идея:
rosettacode.org/wiki/Sorting_algorithms/Sleep_sort

DmitryLeonov Oct 31 2015 at 14:13

Что особенно забавно — и сама эта задача, и полученный взамен пустяк с подсчетом разных цифр в числе решаются практически одинаково. Преподаватель все-таки добился желаемого.

UFO just landed and posted this here

lair Oct 31 2015 at 14:41

Я подозреваю, что преподавать намекал на сортировку без сравнений (т.е., такую, в которой два элемента входных данных не сравниваются между собой на больше/меньше). А если вы вкладываете условия в обходе массива в недопустимые, то задача не имеет решения.

Mrrl Oct 31 2015 at 21:38

А если вы вкладываете условия в обходе массива в недопустимые, то задача не имеет решения.

Что, серьёзно?

lair Oct 31 2015 at 21:39

Хм, а вы знаете, как обойти массив, не используя условие?

Mrrl Oct 31 2015 at 21:55

Знаю, но это потребует очень альтернативной архитектуры программы. Основная проблема — что я не знаю, как выйти из функции, которая занимается обходом. Передать управление в другую функцию (которая, используя тот же протокол, может передать его ещё дальше) — легко.

Mrrl Oct 31 2015 at 22:10

Примерно так (суммируем элементы массива):

int Array[100],Sum,Idx;
int Len=100;

int PC;

void Func_0(){
  Sum=Idx=0;
  PC=1;
}
void Func_1(){
  PC=3+((Idx-Len)>>31);  // 3 or 2
}
void Func_2(){
  Sum+=A[Idx++];
  PC=1;
}
void Func_3(){
  printf("All done\n");
  exit(0);
}


void (*(Func[]))()={Func_0,Func_1,Func_2,Func_3};

void MainLoop(){
  PC=0;
  for(;;) Func[PC]();
}

lair Oct 31 2015 at 22:46

Уважаю.

Mrrl Oct 31 2015 at 23:22

Собственно, то же самое можно было сделать с помощью одного switch внутри бесконечного цикла: он тоже транслируется в переход по массиву. К сожалению, компилятор никогда не поверит, что возможные значения переменной, из которых идёт выбор, все перечислены в case, и вставит перед переходом парочку проверок.

Iceg Nov 1 2015 at 01:29

Прикольно. Только в Func_1 надо вычитать из тройки, вроде.

Mrrl Nov 1 2015 at 09:23

Значение (a >> 31) для int a равно 0 или -1. Можно было написать (int)((unsigned int)a >> 31) — это слегка честнее. И тогда надо было бы прибавлять.

Mrrl Oct 31 2015 at 21:52

Можно было чуть проще (опять же в предположении 32-битных целых):

void sort(int *A,int N){
  for(int a=0;a<N;a++){
    for(int b=a+1;b<N;b++){
       int s=((A[a]-A[b])>>31)&(A[a]^A[b]);
       A[a]^=s;
       A[b]^=s;
    }
  }
}

Хотя если числа окажутся по модулю больше 2³⁰, приём может не сработать.

ankh1989 Nov 1 2015 at 02:06

Менее хитро и медленнее, но зато не зависит от разрядности чисел:

bool s = a[i] > a[j]; // true -> 1, false -> 0
a[i] = a[i] * !s + a[j] * s;
a[j] = a[i] * s + a[j] * !s;

Этакое матричное умножение получилось.

Mrrl Nov 1 2015 at 09:29

Две проблемы.
bool s = a[i] > a[j] — на половине процессоров реализуется как cmp + условный переход, а это тот же if. В половине остальных есть условное выполнение команды — не знаю, куда отнести, и только в оставшихся возможен set по флагу/условию.
!s — тоже не очень хорошо, лучше int s и 1-s.

Mrrl Nov 1 2015 at 09:30

И, кстати, при s=1 работать не будет — нужна временная переменная.

ankh1989 Nov 2 2015 at 12:55

Хм… мда, получилось менее хитро и медленнее и неправильно :)

Sirion Nov 2 2015 at 08:37

Эм… А ничего, что

if(условие){
    какой-то код
}

можно тривиальным образом трансформировать в

while(условие){
    какой-то код
    break;
}

-1

Mrrl Nov 2 2015 at 09:54

Ничего. Все for (с непустой второй частью), while, switch,?:, !, сравнения чисел и прочие проверяющие конструкции приравниваются к if.
К счастью, эмулятор машины Тьюринга легко пишется без if-ов, а любую программу можно переписать на машину Тьюринга.

Sirion Nov 2 2015 at 14:55

В авторском решении for присутствует, ещё как. Впрочем, я вчитался повнимательнее в комменты и понял, о чём вы.

algorithmist Nov 4 2015 at 06:41

Не знаю, писали ли об этом выше. Но, как мне кажется, речь шла вовсе не о трюках, вроде замены if на abs, который в свою очередь заменяется битовой арифметикой. А о гораздо более глубоких вещах. Которые реально используются, к примеру, чтобы написать быстрый bilateral filter или median-filter на 2d матрице.

Смысл идеи в том, чтобы вычислять гистограммы значений. Глобально, или в локальных окнах. Гистограммы быстро вычисляются в обоих случаях, и дают массу полезной информации. К примеру сортировка массива, после того, как есть гистограмма, представляется тривиальной (даже с повторяющимися элементами). Так же быстро по гистограмме вычисляются median, bilateral -свертка и многое другое.

algorithmist Nov 4 2015 at 06:53

Вообще, «программа без IF» надо читать не буквально (потому что по сути IF есть даже в битовых операциях, не говоря уж о циклах и прочем), а «программа, допускающая большую степень параллелизации». И тогда все становится на свои места.
Потому что min/max/if, если они не являются абсолютно локальными, мешают параллельному вычислению (это же относится и к динамическим массивам), а циклы с фиксированным количеством итераций, пре-аллокированные массивы и т.п. не мешают.

Show the best of all time