Пользователь
0,0
рейтинг
21 апреля 2010 в 14:10

Разработка → Только 10% программистов способны написать двоичный поиск

Дональд Кнут (известный тем, что его книги никто не читает) пишет, что хотя первый двоичный поиск был опубликован в 1946 году, первый двоичный поиск без багов был опубликован только в 1962.

Алгоритм двоичного поиска похож на то, как мы ищем слово в словаре. Открываем словарь посередине, смотрим в какой из половин будет нужное нам слово. Допустим, в первой. Открываем первую часть посередине, продолжаем половинить, пока не найдем нужное слово.

С массивами так: есть упорядоченный массив, берем число из середины массива, сравниваем с искомым. Если оно оказалось больше, значит искомое число в первой половине массива, если меньше — во второй. Продолжаем делить оставшуюся половину, когда находим нужное число возвращаем его индекс, если не находим возвращаем null.


В статье утверждалось, что только 10% программистов могут решить эту задачу. Да не может быть! Вот лохи, подумал я, зарядил Firebug, каких-то 5 минут и… нерабочая версия готова. Еще одна итерация, и еще, и еще. В сумме полтора часа, и в конечном решении все равно 2 ошибки. Стыдно как!

Если вы никогда не писали двоичный поиск, я предлагаю вам написать этот алгоритм на любимом языке и выложить его в комменты без тестирования. Любой хороший программист сходу напишет этот поистине детский алгоритм. Потратьте столько времени, сколько нужно. В комменте укажите язык, затраченное время, и ссылку на ваш труд на pastie.org.

На Википедии правильное решение.

Маленький гостинец для тех, кому все это кажется банальным. Почти все реализации двоичного поиска и сортировки слиянием содержат ошибки. Это говорит человек, написавший двоичный поиск для JDK.

Спойлер.
Распространенные ошибки:
— не работает с массивом из 0/1/2 элементов
— не находит первый или последний элемент
— некорректно работает, если элемента в массиве нет
— некорректно работает, если в массиве есть повторяющиеся элементы
— обращение к элементами за пределами массива
— козырная, которая была в JDK, переполнение целого при вычислении среднего индекса

P.S.
Кто-то скажет, что эта функция уже есть в стандартной библиотеке.
Это так, согласен. Но это не значит, что от решения таких задач нет толку. Смотрите, если все простые задачи уже решены за нас в стандартной библиотеке, значит нам остались только более сложные задачи, которых там нет. Как мы будем решать эти более сложные задачи, если мы не умеем решить даже простую задачу из стандартной библиотеки?

Я вам скажу как. Очень плохо. Я делал проверку кода, когда работал в команде. Многие программисты не могли родить простейший код даже с 20 попытки! Они привыкли сидеть на готовом, и не способны написать что-то сложнее композиции foo(bar()), а если и напишут, то реализация будет медленная, путанная, и с ошибками.
Алексей Лебедев @alisey
карма
95,2
рейтинг 0,0
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое Разработка

Комментарии (538)

  • +7
    Ой да ну, ну с первого раза не напишу, а напишу гарантированно. Помню в универе проходили много алгоритмов сортировки. Двоичный написать понимая его просто, а понимают его все кто о нем знает, другое дело, что не все о нем знают, просто потому что не было у них таких дисциплин и сами не интересовались.

    Другое дело какие-нибудь пирамидальные сортировки:), это я не напишу, хотя бы потому что не помню алгоритма, да и насколько помнь реализация не сильно короткая.
    • +2
      Серега, я тоже думал что напишу. Вот написал. Конечно, если пишешь его по 10 разу то никаких проблем не будет. Пост для тех, кто не писал двоичный поиск, но считает себя годным программистом.
      • +14
        Мне кажется годный программист, как раз этим и отличается, что может разобраться и реализовать незнакомый алгоритм. А время затраченное на это, определяет годность.
        • +1
          Ну так и я о том же. Конечно задача покажется легкой, если её проходили в универе и реализовывали на доске всей группой.
          • 0
            Помню, как мы с товарищем ее на уроке информатики разбирали)
            • +1
              Этот алгоритм у меня был домашним заданием в 9 классе.Эти строки кода запомнятся, наверное, на всю жизнь, так как потратил минут 30, чтобы написать + ещё часа 3 на отладку.)
      • +11
        В детстве, на олимпиадах мы писали и двоичный поиск и волновой в графе и даже строковую арифметику «с закрытыми глазами», по памяти. При этом ни разу не обошлось без пары-тройки-четверки отладочных прогонов и обидных багов.
        Так что гарантированно будут проблемы и на 10й раз и на 50й. Людям свойственно ошибаться. :)

        А что до профпригодности программиста, то если он не впал в ступор от слов «бинарный поиск», то и это уже неплохо.
        • +2
          Буквально вот недавно закончил писать реализацию B-дерева. Вроде просто, а в процессе написания багов было отловлена целая куча
        • 0
          тоже в детстве писали реализацию карандашом на бумажке

          кстати, а как это — без тестирования?
          я даже на листике сначала придумываю и пишу тесты, а потом по ним валидный код.
          иначе как, в голове все тесты держать нужно?
          • 0
            На бумажке — можно.
        • 0
          А мы с друзьями часть алгоритмов писали просто выключая монитор и печатая на клавиатуре не глядя на то, что получается… Ни разу не получилось полностью правильно. В самом похожем на истину варианте вместо скобки "[" была напечатана "{"… Мелочь, но не компилится…
          • 0
            Это мне напомнило как я писал на спектруме программу вывода цветных полос для настройки телека.
            Естественно, раз телек не настроен, то на нем нифига не видно :)
            Но ничего, насобачился — раза с пятого уже печатал без ошибок.
            Но это не показатель — во первых, программка из трех строчек, а во-вторых на спектруме не бывает опечаток в операторах.
      • +1
        Специально для тех кто сомневался в моих способностях и опустил карму:):
        pastie.org/927644
        • +3
          На вскидку: как минимум баг с переполнением целого там есть )
          • 0
            Ммм, что, где?:)
            • 0
              Когда размер массива превышает половину макимального значения MAX, допустимого для $m, будет получена ошибка (несмотря на то, что все входные/выходные данные не превышают MAX).
              • 0
                * сорри, случайно отправил не дописав до конца *

                По сути это из самых незначительных багов. В стандартных условиях он и не появится. Но тем не менее — про вашу рализацию нельзя сказать, что она совсем без багов :)
                • 0
                  Сорри, может я туплю, но я абсолютно не понимаю о чем Вы:) Примерчик данных нельзя привести?:), реально не врубаюсь:)
                  • 0
                    Не очень жизненный)
                    Возьмите массив из 2^39 элементов, нужный — последний.
                    • 0
                      А понял, действительно очень жизненный пример:)
                    • +1
                      Зачем же 2^39? Достаточно 2^31 )
                      • +1
                        Затем, что это PHP)
                        $ php -r «echo pow(2, 39). ' '. pow(2, 40);»; echo
                        549755813888 1.09951162778E+12
          • +1
            Баг с переполнением — это уже тонкие вещи, все остальное похоже правильно. Необычный способ.
        • 0
          ДА сколько же на хабре невменяемых:) Комменты плюсуют, а карму наоборот. Объясняйте хоть чего не так или просто радость слить кого-то. Обиженные с детства?:)
          • +3
            Это зависть мужик, не парься!
          • НЛО прилетело и опубликовало эту надпись здесь
        • –1
          Как на счёт таких данных:
          $array = array(10,3,0,2,1);
          echo BSinArray($array, 10);

          Результат -1. А должно быть 0.
          • +2
            По условию массив упорядочен. То есть array(0, 1, 2, 3, 10)
    • +3
      Напишете сразу и без ошибок? Без единого прогона? Я вот честно признаюсь — с ходу не напишу. С одного-двух-трех прогонов — напишу. И не думаю, что вы как программист сильно круче меня :-Р
      • +2
        Вообще то я и написал, что с первого раза без ошибок наверное не напишу, но в принципе напишу, ничего сложного там нет:)
        • +2
          Как минимум одна нетривиальная вещь есть, которая долгое время крутилась в библиотеке JDK. Автор кода работает в Google.
          • +1
            О каком коде, пардон, речь? И о котором авторе?
          • +3
            угу, нашёл.
    • 0
      Простой то он простой. Вот только написать его без ошибок на различных частных случаев сходу без тестирования практически невозможно
    • 0
      Вместо «алгоритмов сортировки» — стоит читать «алгоритмов поиска». Хотя изучали и то, и другое и много чего еще:)
  • 0
    unsigned int binary_find(int *arr, unsigned int max_index, int num)
    {
    int i = 0, j = 0, k = 0;
    unsigned int ret = 0;

    j = max_index;
    do {
    k = (i + j) / 2;

    if(arr[k] == num) {
    ret = arr[k];
    break;
    }
    else if(arr[k] > num)
    --j;
    else if(arr[k] < num)
    ++i;

    } while ( i
    • +1
      Что-то покоцалось, лучше на Pastie, там сохраняется форматирование.
      • +1
        • +4
          Мм, это не совсем двоичный поиск. У вас просто одна из границ плавно ползет к искомому числу, как если бы вы листали в словаре страницы. А здесь именно нужно именно на каждом шаге брать половину от предыдущего набора. Сначала есть весь массив, на слеющем шаге остается половина, потом четвертина, восьмерина. То есть: ...else if(arr[k] < num) j = k;
          • +1
            Да, заметил уже.
        • 0
          Имхо, ошибочка. Вместо --j и ++i должно быть j=k и i=k, в этом суть половинного деления, а вы сдвигаете на одну позицию крайние позиции.
    • 0
      Первая ошибка:
      k = (i + j) / 2;

      Если элементов в массиве непарное количество, будет нехорошо )
      • +2
        Ошибся, беру слова обратно. Будет использоваться только целая часть.
      • +2
        если не парное количество, все будет нормально

        плохо будет, если индексы будут большими и на втором шаге алгоритма они попадут в дальнюю часть интервала
      • 0
        а еще i+j может перевалить за max_int и вот тогда будет реальная бяка
  • +4
    12 минут
    Не тестировал

    pastie.org/927541
    • 0
      Язык — Javascript, если что…
    • +1
      На вот таком массиве повиснет: [1,2]
      У меня то же самое было, а потом еще долго думал над костылем. Правильное решение красиво в этом смысле, там без костыля.
      • +1
        Подправил свой код. 3 ошибки. 2 тестовых прогона. Вроде, без костыля.
        • 0
          Да, вот это оно :)
          А если еще while перенести наверх, то этот if не нужен: if (pos >=0 && pos < arr.length), и получаем почти классическое решение. В классическом еще защита от переполнения целого тут: pos = Math.floor((start+end)/2);
  • НЛО прилетело и опубликовало эту надпись здесь
    • +5
      Это типа умный прагматичный подход?
      Вот скажем, я хочу взять программера на задачи по коллаборативной фильтрации. Хочу знать, годен ли он. Или лучше — он хочет знать, потянет ли он. Что ему, бесплатно потратить неделю своего времени на реализацию практической задачи? Нет конечно. А вот такие игрушечные задачи прекрасно позволяют оценить уровень.
      • НЛО прилетело и опубликовало эту надпись здесь
        • +2
          Если Вам нужно что-то написать:
          1. Посмотрите, возможно ли реюзать ваш старый код.
          2. Если реюзать старый код нельзя, посмотрите, можно ли купить.
          3. Если купить нельзя, напишите реюзебл решение.

          по-моему из Совершенного Кода.
  • 0
    pastie.org/927546

    Два прогона. Первый раз сглюкнула интендация в TextMate. Второй раз сообразил что во второй строке надо дописать +indexFrom :)
    • +1
      и да. Я никогда не писал двоичный поиск потому что не было необходимости изобретать велосипед. Времени потратил на написание… ну минуты три вместе с двумя прогонами.
    • +5
      Что произойдет в случае what = 8? :)
      • +1
        Ха. Хороший момент, спасибо! Лишний доказывает, что все мы люди и всем нам свойственно ошибаться.
        • 0
          * лишний раз.
    • –1
      Ну, рекурсивно неинтересно.
      • +3
        Почему? это всего лишь один из способов реализации. Ну хотите я разверну рекурсию с парой индексов начало-конец и заверну это в цикл while fromIndex < toIndex? Ну и так можно, это всего лишь вариант решения, а по сути — идентичный алгоритм (однако рекурсия в этом случае гораздо выразительнее, т.к. алгоритм рекурсивен по своей сути).
        • +2
          Просто в классическом варианте без рекурсии проще запутаться, на мой взгляд. А так — да, идентичный, никто не спорит. Правда требует O(log N) памяти, если компилятор/интерпретатор не оптимизирует хвостовую рекурсию.
    • +1
      Рекурсию в таком алгоритме стыдно.
  • 0
    20 минут — php
    http://pastie.org/927547
    • +1
      Если искомого числа нет в массиве, то…
    • +1
      А если $lookingFor отсутствует в масиве?
      • +1
        ать, попался :)
        там нужна еще проверка на пересекаемость границ
        • +1
          Как-то так думаю pastie.org/927664
          Вот только сейчас закончил)) Правда не программист, а админ и отвлекают постоянно на работе(
          • 0
            Если длина массива = 1, то… выйти
            • +1
              Верно, если длина масива == 1, то выйти, но перед этим проверяется равен ли единственный елемент масива искомому и если равен, то задача решена)
              • 0
                Ага, проглядел.
    • +1
      Что будет если размер массива равен нулю? (подсказка: оно вылетит с диким грохотом).
  • 0
    Прочитал заголовок, думал будет какой-то жутко умный алгоритм с битовыми операциями. А оказалось речь про банальную дихотомию :)
    • +4
      вот у меня от слова дихотомия сводит скулы. а от фразы binary search мне становится все очень быстро понятно. не надо умничать.
      • +6
        А почему бы не называть вещи своими именами? Прям вот от давнего греческого слова скулы сводит, а от английского не сводит. Фраза на русском «двоичный поиск» ничего не сводит?
        • +4
          От binary search и двоичный поиск у меня скулы не сводит, потому что по-английски и по-русски я говорю свободно, в отличии от греческого.
      • +16
        я не умничаю, мне действительно слово «дихотомия» ближе и понятнее, чем «бинарный поиск». Видимо, тяжелое детство в физмате сказывается :)
        • –2
          По Вашему нику заметно, что вы с особым трепетом относитесь к греческому :)
          • +8
            если судить по нику, то скорее к латыни
            • 0
              Мне, кстати, тоже «дихотомия» как-то ближе ;-)
  • –4
    минуту или 2
    ну 5 чтоб дописать красиво

    да, раньше не раз такое писал
  • +6
    Ну, как бы, и что? Есть 10% программистов, умеющих писать двоичный поиск. Есть 50% знаючих PHP, есть 0,01% способных создать аналог Windows или Linux с нуля. Никто не умеет всего. Тем более, что писать двоичный поиск с нуля — странная идея при наличии библиотек под любую платформу. Этак можно сказать «только 2% помнят, как пробивать дырки на перфокартах».

    Умение или неумение написать двоичный поиск с первого раза правильно — не есть формальный признак хорошего программиста.
    • +9
      Согласен. Но умение написать широко известный алгоритм, воплотив его в исходном коде — это есть то качество, которое отличает программистов от не-программистов.
    • +1
      Никто не умеет всего. Если человек делает сайты даже, ему нужно решать алгоритмические задачи посложнее двоичного поиска. Хорошо ли он их решает? Как узнать? Сравнить не с чем. А тут просто, пишешь за 5 минут, сравниваешь свою реализацию с классической, оцениваешь свой уровень.

      Совсем не странная идея, если не подходить к этому как к упражнению или к тесту.
    • 0
      Если человек не знает элементарных вещей, то хорошо ли он будет понимать сложные?
    • +3
      «Умение или неумение написать двоичный поиск с первого раза правильно»
      Представляете веб-дизайнера, который умеет рисовать только темно-синие квадраты?

      Я вот так же не могу представить программиста, который умеет или не умеет написать двоичный поиск. Каждый программист каждый раз решает разные задачи, и важно только общее умение программировать (сюда относим всю логику, умение концентрироваться итд итп). Дело не в том, что алгоритм так важен и «никогда не знаешь, когда придется самому с нуля его написать», а в том, что это просто пример задачи определенной сложности и коварности. Неспособность решить эту задачу означает неспособность решить более алгоритмически сложные задачи. Нехватило внимательности, чтобы самому найти ошибку (и посчитал программу завершенной, а она еще глючная). Нехватило аккуратности, чтобы предположить, что на входе — пустой массив. итд. Придумал интересный сложный тест в уме, но нехватило концентрации чтобы в уме его прогнать по своему алгоритму итд.

      Все эти качества — однозначно важны для программиста, и нехватка их вредит во всех проектах.

      Тут отличительная особенность — надо написать _правильный_ код, а не тот, который «вроде работает», при этом действительно у всех вокруг он работает, но где-то в Урюпинске у кого-то не работает (наверное потому что сам дурак). Потом багрепорт еще откудато. И еще. Потом наконец-то проблема отлавливается. Это нормальный процесс в наше время (обычный). А здесь необычно требуется самому закодить хоть и не очень сложный алгоритм, но сделать это правильно. И не «с первого раза» — можно хоть сто раз переписывать, но «хоть с миллионного» раза, но ДО того момента, как показал код и назвал его решением.
      • 0
        Очень хорошо сказал.
  • +10
    Дети, ей Богу!

    Не ошибается только тот, кто ничего не делает. Я например текст набираю с ошибками, но потом их правлю, правда не всегда. :) А вот программы надо просто грамотно тестировать. В этом плане мне нравиться Code Jam, где тебе дают минимальный тест, потом функциональный, а потом еще и тест на производительность.

    А реализовывать поиск делением попалам надо где-то там, в школе. И тогда же читать книги Кнута, жаль что из всего 3.
    • +4
      И тогда же читать книги Кнута, жаль что из всего 3

      Уже 4.
      • 0
        4я не целиком
    • –1
      А ты много вспомнишь из книг Кнута, читая их в школьном возрасте? Или высшая математика плавно перебралась в школу?

      Вряд ли знание того, что алгоритм выполнятся O(log2 n * sqrt(n + n2)), сильно пригодится рядовому программисту.

      Программист лишь должен пользоваться трудами других. Если стоит задача отсортировать числа, то я возьму справочник и выберу лишь тот алгоритм сортировки, который наиболее пригодный в моем случае и чья эффективность проверена математиками. Не всякий программист является математиком, так же как и не всякий математик — программистом.
      • +4
        >Вряд ли знание того, что алгоритм выполнятся O(log2 n * sqrt(n + n2)), сильно пригодится рядовому программисту.

        ARRRGH!!!
        Быдлокодеру не пригодится, программисту — обязательно пригодится.
        • +2
          Как бы тебе это сказать… O(log2n * sqrt(n + n2)) = O(n * log2n)

          Боюсь ты сам себя только что записал в быдлокодеры. Надеюсь твой работодатель этого не узнает.
          • +4
            Окружающие не виноваты в том, что не бросаются сразу исправлять ваши ошибки.
          • +2
            Я про принцип, а не про формулу, на которую даже не посмотрел.
        • –1
          антикульт быдлокодера уже достал. к месту и не к месту.
          даже отличные программисты пишут быдлокод во многих случаях в реальной жизни.
          • 0
            Слово некрасивое, да. Но по сути-то верно.

            >даже отличные программисты пишут быдлокод во многих случаях в реальной жизни.
            Халтурят в разных ситуациях все. Но хороший программист, в отличие от плохого, может написать хороший код [при желании, разумеется]. =)
            • 0
              нет. то, что люди понимают как быдлокод — далеко(!) не всегда является халтурой!

              ps: в тему — habrahabr.ru/blogs/development/91665/
      • +1
        • 0
          Ну если Вы такой придира, то стоило хотя бы поменять местами члены выражения: O(n) = O(√ n + n2)

          Вообще-то это предназначалось для человека, использующего .NET: log2 n O(n) = log2 n O(√n + n2)

          Это по поводу того, насколько актуально знать программисту сей факт.
  • +3
    статья напомнила о числе 95% :)
    // lurkmore.ru/95%25
    • 0
      5% из настоящих программистов = идиоты :)
  • +8
    * ворчит *
    Из приходящих на собеседование «программистов» только 10% вообще знают, что такое двоичный поиск.
    • 0
      Я помню в 14 лет пришел в контору собеседоваться. Они так снисходительно, у нас информационная система, нужно хранение документов, редактирование, доступ с любого компьютера. Как будешь делать? Я говорю, ну, хранить в XML, отдавать буду HTML (как раз только начал интересоваться вебом). Они — хаха! Да нет друг, здесь база данных нужна, Delphi. Вот ты знаешь что такое реляция? Переспрашиваю: корелляция? — Нет, ре-ля-ция. — Не знаю. — Ну иди гуляй.

      А сейчас ни один человек в здравом уме не станет делать это на Delphi. С MySQL на нужном им уровне я научился работать за день. Толку от того, что я знал бы как это называется. Главное по сути понимать, или уметь освоить.
      • +6
        * ворчит опять *
        А очень было бы неплохо, если бы программист знал хотя бы основы реляционной алгебры… А то налепят по образцу восемь левых джойнов, а потом у них запрос к таблице в 40 записей пять минут выполняется…
        • +1
          Основы реляционной алгебры никак не научат его, что каджый DROP TABLE в MySQL лочит все таблицы почти на полсекунды. Я не спорю, вы дело говорите, но есть другая сторона.
          • +1
            Дела не в джоинах, а в не понимании структуры БД. А даже если и знаешь ее, то с опытом все приходит.
            Потом как раз начинаешь «пользоваться» фичами, когда обычный джоин нулюет запись слева, если правая нуль. Повторюсь, опыт решает.

            А по теме можно сказать одно. Требовать от программиста знания чего-то просто неверно. Не зря есть такие вещи как испытательный срок. Если видишь, что человечек умненький, но чего-то не знает, это не значит, что ему что-то помешает в этом разобраться и даже стать в итоге лучше тебя… Разные фирмы работают в своих сферах, изучить все не вариант
          • 0
            Drop table как бы операция, которая должна выполняться на продакшене не чаще, чем раз в раз-в-патч, или лучше раз-в-релиз? Или вы дропаете их настолько часто, что это замедляет производительность?
            • 0
              CREATE TEMPORARY TABLE, anybody?
              • 0
                К DROP TABLE никакого отношения пост не имеет =) Я про LEFT JOIN/JOIN =)
        • +1
          Джоины в СУБД очень оптимизированны. У меня есть запрос с десятком Лефт Джоинов, которые получают пачку данных из таблиц по несколько тысяч записей за доли секунды.
          Более того — опытные администраторы БД мне советовали пользоваться Джоинами, а не несколькими мелкими запросами. Они утверждают, что боязнь Джоинов у не очень опытных программистов от непонятия механизмов, которые работают внутри СУБД.
          • –2
            Замечу, что несколько тысяч записей — это не слишком большой объем БД.
            • 0
              замечу, что я и не говорил, что это большой объем БД.
              человек сказал: 40 записей — 300 секунд
              я сказал: тысячи записей — доли секунды (практически столько же, как 10 запросов без джоинов)
            • 0
              Ладно, ладно. Я лично писал partitioned-wise joins на оракле, 5-6 джойнах, в одной из таблиц 4 миллиарда записей. Работало in reasonable time! :)
          • 0
            Это смотря какая СУБД. Приведенный случай касался MySQL, у которой, конечно, хороший оптимизатор, но ждать от него гениальности нельзя.
            • 0
              ну я тоже про MySQL говорил. он отлично оптимизирует работу с Джоинами.
              • 0
                Повезло вам с ним :)
              • +1
                Эта, мужики, а давно в mysql оптимизатор то есть?
        • –2
          Left join — это ещё ничего, а вот когда налепят восемь inner join-ов — вот это да. Или того хлеще, просто перечислят таблицы во from через запятую.
          • 0
            Left join — это ещё ничего, а вот когда налепят восемь inner join-ов — вот это да

            А чем плохо 8 inner join'ов?

            Или того хлеще, просто перечислят таблицы во from через запятую.

            Сам факт еще ни о чем не говорит. Если в where указаны условия пересечения этих таблиц, то это равносильно inner join, иначе cross join. Поэтому с таким же успехом вы можете негодовать по поводу использования join'ов вообще.
            • –3
              Inner join-ы плохи тем, что это очень процессороёмкая операция на объёмах данных, отличающихся от самых минимальных. Понятно, что это не означает, что от inner join-ов нужно отказываться совсем, но если есть выбор между inner и left при гарантированно одинаковом результате (например, если у нас все данные гарантированно консистентны, а NULL-ов просто не бывает) — то выбирать надо однозначно left.

              А cross join крайне требователен к памяти.
              • +2
                Не могли бы вы немного по-подробнее рассказать почему «inner join более процессороемкий, чем left join»
              • 0
                Что означает — самых минимальных? Выборка в, скажем, 500 000 строк, это минимальный объем данных? Для веб-приложения на бесплатном хостинге под мускулом? А для Data Warehouse на enterprise-level СУБД, на выделенных серверах с отдельным SAN?
              • 0
                Это на какой СУБД такая разница между inner join и left?
          • +1
            1) Inner Join ничуть не сложнее, чем Left Join, даже, наверно, чуть проще, так как результат меньше

            2) Перечисление таблиц во From, c точки зрения MySQL, ничем не отличается от inner join
          • 0
            А просветите, в чем такой явный минус от 8 летф джойнов? Недостаток денормализации? Или вы думаете, он мержит промежуточные resultsets на диске, и возрастает нагрузка на IO? Я не уверен, что согласен с вашим высказыванием (И что я его правильно понял).
        • 0
          А было бы еще лучше для таких целей нанимать БДА :)
          • 0
            Ну так наняли в итоге. Меня :)
        • 0
          Не, те кто просто не знают — это еще нормальные.
          Хуже всего те, кто мало того что не знает, так еще и знать не хочет!
    • 0
      И даже не все кандидаты в президенты…

      www.youtube.com/watch?v=k4RRi_ntQc8
      Barack Obama — Computer Science Question
  • +1
    Минуты 4, Python:
    a=range(50,200,2);
    bsearch = lambda a,s,i=False,step=False:(not step and bsearch(a,s,len(a)/2,len(a)/4+1)) or (a[i]==s and str(i)) or (s<a[i] and bsearch(a,s,i-step,step/2+step%2)) or (bsearch(a,s,i+step,step/2+step%2));
    bsearch(a,178);
    bsearch(a,54);
    
    • +11
      вы уверены что это python? :D
    • +25
      Не нужно так писать на питоне :)
      • +1
        Согласен, но я же писал не компонент для использования, а быстрое решение конкретной задачи.
        Писать на продакшн так не нужно, согласен =)
        • +1
          Ну вы писали для людей, поэтому можно было бы и понятнее расписать.
          • 0
            Я, скорее, писал для проверки — сколько времени мне потребуется чтобы написать подобный алгоритм. =)
    • 0
      Чистосердечное признание
      После первого написания содержало два бага:
      — вместо step сначала проверялась на положительность i — исправил по ходу написания
      — вместо строки возвращалось число — зацикливание, если искомый элемент имеет индекс 0.
      • 0
        Теперь по повожу распространенных ошибок из спойлера:
        — не работает с массивом из 0/1/2 элементов
        Работает. При нулевой длине отлично возникает исключение — обрабатывайте.
        — не находит первый или последний элемент
        Находит
        — некорректно работает, если элемента в массиве нет
        Это есть. Нужно после проверки на равенство добавить: or (step==1 and '-1')
        — некорректно работает, если в массиве есть повторяющиеся элементы
        Корректно. Возвратит индекс первого, на который наткнется
        — обращение к элементами за пределами массива
        Не особо понял, но есть такая замечательная вещь — исключения.
    • +7
      На любом языке могу писать как на Хаскелле? :)
      • +1
        hpaste.org/fastcgi/hpaste.fcgi/view?id=24986#a24986
        Вот кстати мой вариант на Хаскелле, одна ошибка была котороую я поправил, может еще остались, зато наглядно :)
    • +2
      За это я и люблю питон!
    • –2
      Если мне на собеседовании пишут такой код (были красавцы), обычно именно на этом я и ставлю точку.
      • +4
        Вы на собеседовании требуете написания на листочке красивого кода с комментариями?
        • –2
          На доске, комментариев не надо ;-) И красивого тоже не надо — надо понятного.
          • +2
            Код вполне понятен. Тем более на доске условие в lambda-функции было бы расписано на несколько строк (в каждой по or). Вас смущают названия переменных?
            • +5
              Понимаете, есть такая закономерность — какой у программиста первый позыв в плане стиля, так примерно и будет выглядеть его код, который будет создаваться в моменты стресса, под давлением сроков, production failure — то есть когда нет времени сделать все красиво, надо сделать быстро чтобы работало. Это делается временно и потом остается на века. Поэтому лучше делать сразу все правильно.

              Лямбда-функции, замыкания и прочая — это очень хорошо и классно, и если правильно использовать — вполне читаемо и поддерживаемо. Но если инлайн лямбда-функция занимает больше одной строки — это называется spaghetti code, и такого не надо.
              • +2
                В данном случае lambda-функция вполне уместна.
                Кстати, можно писать и не в одну строку. Единственная причина, почему у меня написано в одну — это то, что все это набиралось в консоли.
                • –8
                  Видимо, в консоли отсутствуют клавиши перевода строки и пробелы :)
                • +1
                  У меня там повыше код на Хаскелле и без лямбд, по-моему вполне читабельно, хотя конечно больше занимает.
                  Можно конечно в одну строчку написать, чтоб непонятно было, сам так люблю делать, но не в production коде :)
                  А к вам зря придрались, можно писать ясный код на работе и для себя совсем другой, главное чтоб себе было ясно и удобно.
                  А программист который пишет всегда в одном стиле — это Junior.
                  • +1
                    Выглядит, и правда, куда понятнее.
                    В вашем решении присутствует та же проблема, что и у меня — переполнение стека функций. Хотя, чтобы ее решить придется отказаться от такой приятной вещи, как рекурсия =)

                    На самом деле меня больше не претензии к коду смутили, а то, что за подобный код на собеседовании можно попрощаться с кандидатом.
                    • +2
                      У меня отлично работает на массивах порядка 100000 элементов (больше не проверял), я думаю хаскель способен соптимизировать тут рекурсию в хвостовую (обычно так и бывает), хотя стоит проверить.

                      А насчет собеседований, у меня довольно большой опыт по набору, и я бы такого человека спросил во-первых почему он так написал, во-вторых если решение работает это уже плюс, а если он еще сможет переписать по-другому в более традиционной форме это бы для меня был еще больший плюс, так что такой товарищ имел бы однозначное преимущество перед тем кто сразу выдал стереотипное решение.
                      Те, кто выдает шаблонные решения на собеседованиях обычно потом хуже работают по моему опыту.
                      • 0
                        не «соптимизировать рекурсию в хвостовую», а соптимизировать хвостовую рекурсию в цикл.
                        • 0
                          Хаскель делает из рекурсии циклы?
                          • +1
                            любой компилятор Хаскелля обязан выполнять оптимизацию хвостовых вызовов (и не только рекурсивных). Если это хвосторекурсивный вызов, то скорее всего оптимизатор преобразует его именно в цикл
                            • 0
                              он не обязан. Он просто это сделает, ради повышения производительности.
                              • 0
                                да нет. он как раз обязан. по стандарту.
                                • 0
                                  ссылочку?
                                  • 0
                                    мда… опять надо было сначала обновить. извините
                                • 0
                                  беру слова обратно. похоже что, в отличии от SML и Ocaml, в стандарте хаскелля этого нету. и это печально
                                  • 0
                                    в CL кстати тоже это не требуется, но всячески было бы круто иметь. А вот в schema например это чуть ли не must have.

                                    Кстати, а разве есть стандарт на O'Caml?
                                    • 0
                                      вот в Scheme точно есть :)
                                      ocaml нет стандарта, но там есть «стандартная» реализация и она дефакто стандарт.
                                  • 0
                                    Это не печально, из-за ленивости Хаскелю нет нужды оптимизировать хвостовую рекурсию.
                                    • 0
                                      не совсем понимаю как это связано с ленивостью. можно подробней?
                        • 0
                          Совсем нет, есть рекурсия хвостовая, а есть не хвостовая, но которая может быть преобразованна в хвостовую, тут как раз этот случай.
                          А то что хвостовая рекурсия на самом деле потом превратится в цикл это всем понятно.
                          • 0
                            если вы про этот код #, то там все вызовы на хвостовых позициях, ничего преобразовывать не надо.
                            • 0
                              Правда ваша, я просто думал про другой код который я писал паралелльно и думал, что тут у меня также, а счас глянул, а там оказывается все проще, действительно хвостовая. Как говорится написал и забыл :)
                          • 0
                            А можете показать пример не хвостовой рекурсии, в хвостовую?
                            • –1
                              Один из способов это аккумулирование результата

                              factorial 0 = 1
                              factorial n = n * factorial(n-1)

                              tailFactorial n = helper n 1
                              where
                              helper 0 a = a
                              helper n a = helper (n-1) (n*a)
                              • 0
                                Нет, это понятно.

                                Я хотел пример рекурсии, которую компилятор сам так прооптимизирует!
                                • 0
                                  Не думаю что-то есть такие компиляторы. К тому же в некоторых случаях в ленивых языках от такого преобразования может стать хуже)
                                  • 0
                                    собственно я о том же. Вот и хотел увидеть код, который компилятор сможет соптимизировать
                    • +1
                      хвостовая рекурсия же
              • +1
                Знаете, проблема сроков — это проблема менеджмента. И если у вас давление сроков и т.п. — то у вас, наверное, лучше не работать, ибо менеджмент у вас слаб.
                • –1
                  Не в менеджменте дело (то есть и в менеджменте, но не всегда в нем). В компании, где я сейчас работаю, проблемы со сроками случаются реже на порядок, чем во всех остальных, в которых я работал до этого — но они случаются, и когда они случаются, надо уметь достойно выходить из таких ситуаций.
                  • 0
                    Кто называет сроки?
                    • 0
                      Вы не поверите — иногда они образуются сами, вообще без какого бы то ни было участия с нашей стороны. Если интересно — расскажу об одном из наших проектов, который пришлось завершать в супер-пожарном режиме.
                      • 0
                        Вот когда «оно само» — это точно просчёт менеджмента.
                        • +1
                          Не, это не просчет. Это повод уволить его. Если технический специалист говорит что А делать 2 недели, то это проблема менеджера, что он заложив почку, пообещав счастья через 3 дня.
                          • 0
                            А если технический специались говорит, что это делать три дня, а делает это три недели? Это тоже просчет менеджера?
                            • 0
                              Это проблемы уже тех. специалиста.

                              Вообще хороший менеджер умножает на коэффициент программиста, а потом результат на 2.
                      • +1
                        С радостью выслушаю. Но это проблема менеджмента!
              • +1
                > код, который будет создаваться в моменты стресса, под давлением сроков, production failure — то есть когда нет времени сделать все красиво, надо сделать быстро чтобы работало. Это делается временно и потом остается на века. Поэтому лучше делать сразу все правильно.

                Какие-то у вас стрессы и сроки «детские» видимо. :-)

                Когда реально сроки давят и бизнес-процесс стоит — тогда надо написать «грязно», но чтобы работало. Чтобы падало раз в полчаса, но шелловый скрипт автоматом перезапускал. В общем, чтобы через 2 часа после постановки задачи бизнес процесс пошел. А не так, что код красивый, комменты на месте и внятные, ошибок нет, но готово только послезавтра, когда заказчик уже застрелился.
                • +1
                  Добавлю, что после таких «кредитов» в ущерб архитектуре обязательно должен идти этап восстановления и наведения красоты. Только вот этот этап обычно пропускают. Из-за менеджмента, который не видит целесообразности, и из-за программеров, которые исповедут принцип «работает — не трожь». В результате мусор накапливается, работа замедляется, сами себе же роют могилу, вместо исправления багов патчат битые данные в базе.
                  • 0
                    Сейчас один проект как раз на такой фазе.

                    И с вашим комментом я согласен, разумный он. И оплату получаю почасовую (так что за причесывание кода отдельно можно деньги получить). И… все равно сомневаюсь — надо ли? Потому что да — работает — не трожь. Тем более, прямо перед самым запуском проекта, после всех долгих тестов.
                    • 0
                      Перед самым запуском не стоит, и времени может не хватить на переделку, и тесты придется прогонять по новой. Риск слишком велик.

                      Но если потом с этим кодом приходится иметь дело, наверное себе же дешевле будет его переписать. Это как с ремонтом в доме. Пока только протекает кран — можно подставлять кастрюльки. Но поломки, если их не чинить, накапливаются. Перегорает лампочка, забивается труба, перестает работать слив. Неисправление отнимает все больше времени.

                      Вроде бы, вопрос только в том, насколько быстро все рухнет. И вот здесь реальность меня удивила. Оно никогда не рухнет. Просто превратится в помойку, а удовольствия от жизни на помойке никакого.
                    • 0
                      А можно узнать маштабы команды?
                      • +2
                        Да небольшая — 2-3 человека (смотря кого считать человеком :-))

                        И проект тоже не очень большой, но замудреный — некоторые алгоритмы писались на «интуитивно-анальном понимании принципа работы», поэтому без комментариев там через год уже не разобраться, а лишний if или лишняя вложенность и без того замудреный алгоритм делают совсем непонятным.
                        • 0
                          Хм. Знаете, у вас маленькая команда.

                          Я говорил про системы несколько большего объема и которые разрабатывают не один десяток человек.

                          При длине проекта в полгода и размере команды в 3, его можно за полгода повторить, с нуля.
                        • 0
                          «смотря кого считать человеком» — вижу, накипело :)
                          • 0
                            да нет, все не так мрачно :-)
                            просто роли у всех разные и техническая вовлеченность в реализацию — тоже.
                            • 0
                              а с этого момента я хочу больше деталей!
                              • 0
                                не очень понимаю любопытство — проект не столь интересен с технической точки зрения. еще один проект на 2-3 человека. совсем не яндекс или mail.ru по интересности реализации. Возможно вы где-то не так меня поняли и представляете какой-то мегапроект.

                                А что касается «человечности», раз уж спросили, то «человек под вопросом» — это менеджер, который участие в проекте принимает (обсуждает фичи напр), но код не пишет.
                    • 0
                      Вот таким способом и получается антипаттерн «многослойный говнокод», который в итоге хрупок и нереюзабелен настолько, что его проще выкинуть в мусор целиком.
                      • +1
                        Все верно.
                        Но дилемма в том, чтобы выбрать одно из двух
                        1) выпустить стабильный продукт (который дествительно стабильный, оч хорошо оттестированный итд)
                        2) причесать код, и зарелизить нетестированную версию (либо еще месяц тестировать все с нуля)
                        где-то случайно сделать что-то вроде:

                        исходный код:
                        if(a)
                        b
                        c

                        ошибка при причесывании:
                        if(a){/*comment*/
                        b /*comment*/
                        c /*comment*/
                        }

                        скомпилируется. работать возможно будет. глючить — тоже. хотя казалось бы, до причесывания код сто тысяч раз проверяли во всех тестах — все работает идеально :-)

                        у любого действия есть свои плюсы и минусы, и то, что вроде как right way с точки зрения программиста, который любит работать с красивым кодом — не всегда right way с точки зрения успешности проекта.
                        • 0
                          «у любого действия есть свои плюсы и минусы, и то, что вроде как right way с точки зрения программиста, который любит работать с красивым кодом — не всегда right way с точки зрения успешности проекта.»
                          У кода есть следующие достоинства (в порядке убывания приоритета):
                          1. Работоспособность (в идеале — корректность).
                          2. Читабельность.
                          3. Гибкость.
                          4. Красота (получается, что в случае чего красотой жертвуют в первую очередь).
                          Проблема в том, многие менеджеры и разработчики, пожарящие перед релизом забывают простую истину — недоработки при исполнении увеличивают общие трудозатраты.
                          Надо заранее иметь в виду, что запуск первого релиза за счет недели аврала — это минимум две недели отставания от запуска второго. Если после выхода промежуточного релиза нет готовности безжалостно сносить пожарный говнокод, то отставание может составить месяц и более. Более того: чем больше пожарного кода — тем менее предсказуемы сроки выхода следующих релизов.
                          • 0
                            тут немного другая ситуация.
                            Да, как и везде, «надо — вчера». И чем раньше будет релиз — тем лучше, тем более, что первоначальные оптимистичные сроки уже прошло. НО нет пожара. Пишется «обвязка», мелочи-красивости, не затрагивающие само ядро проекта. А оно и оттестировано уже очень хорошо, и изменения в него практически не вносятся. Именно по этой причине (то что код там не очень читаем, но при этом очень надежен — насколько только можно судить об этом на основании долгих тестов) и не хочется делать с ним ничего, что хоть как-то изменит md5sum исходников :-). Потому что если это сделать — то мы получим не только удобочитаемый код, но и саму программу, которая черт знает как работает — вроде по идее наши правки были только в области «красивостей» и никак не должны влиять на логику программы, но ведь кто знает — так что по хорошему, после месяца тестирования и дописывания комментария /* this function does something */ — чтобы убедиться что все в порядке, надо б еще месяц тесты погонять.
                  • 0
                    Знаете, после того как вы один раз наступите в в дорожку с таким кодом, вы оттуда не вернетесь. Ваш менеджмент познает, что деля ваши сроки на два, то получается результат.

                    Вообще есть интересная проблема, что красивый дизайн приложения подразумевает что оно будет жить 100500 лет. Только вот, не факт, что компания доживет пока вы будете делать красивый дизайн.
                    • 0
                      Обратная ситуация: говнокод, хотели продать проект побыстрее, потом кризис, невыгодная ситуация, да и конкуренты как-то рванули вперед, приходится продолжать свой бизнес. В результате теперь любая новая фича требует нечеловеческих усилий на реализацию, а несколько программистов вычерпывают говна full-time.

                      Но всем похуй. Менеджмент не способен понять ситуацию (не успеваете? сколько людей добавить?), программеру комфортно и так, лишь бы платили.
                      • 0
                        Грань тонкая, да.

                        Ситуация когда приходиться программистов делать говно, много лучше, чем когда они это хотят делать.
                    • 0
                      Еще есть такое заблуждение, что красивый дизайн садятся, делают, сдают готовый.

                      Красивый дизайн кристаллизуется в течение 100500 лет, неудачные решения отмирают, удачные остаются. Это работает только в том случае, если находятся люди, способные отличить одно от другого.

                      Красивый дизайн красив не маникюром и педикюром, а тем, что эффективно решает поставленные задачи.
                • +1
                  Хе-хе. Только переписать это не получается, ибо всегда есть такой бардак в голове у менеджера, и это становится стилем работы.

                  Сказать что это плохо? Нет. Это жизнь. Но все-таки это проблема менеджмента.
          • –1
            Поддерживаю. А то потом будут такой же production-код лепить.
          • 0
            Зачем на доске? Стиль псевдо-академичности чтоли придать?
            • +1
              Не совсем. Чтобы кандидат объяснял, что он пишет. Если он уткнется в лаптоп, хрен ты из него что выбьешь, а вот у доски он волей-неволей начнет вслух рассуждать и объяснять. А мне именно это и надо.
              • 0
                Не примите близко к сердцу, но что-то странное у вас там, то вам лямбда функции не нравятся, то у доски писать заставляете… Многие люди вообще на доске в жизни код не писали, мне вот например сложнее мыслить с доской, нежели «уткнувшись в лэптоп», так зачем же ставить претендента, у которого и так стресс в виде собеседования, ещё и в дополнительно неудобное положение у доски?

                И вообще, зачем кандидат должен объяснять что он пишет в процессе? Вот написал, если не работает, тогда пусть объясняет, а если всё ок, то к чему лишнии слова? Код — куда красноязычнее чем любая вербальная речь.
      • +2
        хм, спрашивать на собеседование код? Это же моветон. Все передовые рекуртеры просят спарвку из психдиспансера! Настоящий программист без справки не программист!
        • –4
          Ну вот мы как-то так любим чтобы наши программисты умели программировать, да.
          • 0
            программист должен уметь держать в голове много абстракций. Научить его питону или другому языку — это дело пары недель. А вот научить его держать в голове кучу абстракций — нельзя. Это уже состояние психики и оно граничит с шизофренией. Собственно из-за этого и стоит спрашивать справку.

            На собеседование можно понять только ширину кругозора. И прикинуть, сможете ли вы заинтересовать такого кадра, или нет.
            • 0
              А кто говорит про кучу? Я же не требую его вкратце рассказать мне про то, как работает collaborative filtering или чем maximum entropy классификатор отличается от баесовского? (хотя в каких-то случаях буду требовать именно этого, но это очень особые ситуации). Я всего лишь прошу знания основ. Вы же не считаете, что знание, сколько битов в байте, что такое сортировка и что такое двоичный поиск чем-то запредельно сложным и абстрактным?

              Ну а если вы знаете это, и вы действительно хороший программист, для вас не составит ни малейшего труда написать код. Да, на доске, да, возможно, с ошибками — но написать, а не рассуждать о своем кругозоре и огромном опыте.
              • 0
                Сколько битов в байте. Это факты. Мы с вами можем знать разные факты, как нам быть?

                Какой код? Давай те пример задачи?
                • 0
                  Пример задачи? На что? На сколько битов в байте? Ну посчитайте что ли сколько битов установлены в байте, а сколько — нет ;)
                  • 0
                    >Ну посчитайте что ли сколько битов установлены в байте, а сколько — нет ;)

                    И не просто посчитайте, а с минимальным использованием памяти. А потом — с минимальным использованием времени ;)
                  • 0
                    Давай те больше условий! Язык реализации, например. Ну и платформу, например.
      • +1
        Какой вы важный господин! Теперь мы знаем, что вы не пальцем деланные, а право имеете! Принимать и не принимать. Вот только песня совсем не о том
        • –2
          Вам отказали на собеседовании? Не переживайте. У вас еще будет шанс.

          А я не имею права принимать или не принимать — я лишь имею право сказать, понравился мне кандидат или нет. Если кандидат пишет спагетти-код, то он мне сразу перестает нравится.
          • 0
            вам нужен человек который думает и имеет мозги, или кодогенератор?
            • +1
              Мне нужно чтобы человек не только умел думать, но и умел писать код. К сожалению, сейчас очень мало внимания уделяется умению именно хорошо кодить, слово «кодер» стало чуть ли не ругательным — все менеджеры, лидеры, и прочая, кодеры — быдло. А я кодер. Очень хороший кодер, который умеет кодить эффективный код, который работает быстро и надежно. И на собеседовании я требую от людей того же самого — а именно, умения писать красивый, чистый, хорошо и быстро работающий код. Я что, чего-то странного хочу?
              • 0
                Точно так же считаю. Я в роли лидера начал немного терять связь с реальностью. — «Че? Вот на это ты потратил 2 дня? Да это же шаблончики, тут полчаса максимум». А потом сам сел за эти шаблончики, и за день до ума не довел.
              • 0
                Что есть эффективный код? Где его можно посмотреть?
                • 0
                  Хватит троллить. Эффективный код — это код, который работает быстро, надежно, легко поддерживается, и содержит минимальное количество ошибок.
                  • +3
                    Код либо работает быстро, либо выглядит красиво, либо его легко поддерживать.

                    А про ошибки, все проще, их более менее const. И этот показатель не зависит не от чего.
                    • –1
                      Вы какой-то скучный тролль. Просто чтобы поддержать беседу, сообщу, что бывает код, который красиво выглядит и быстро работает. А еще его легко поддерживать, потому что когда программист писал его, он думал, что этот код после написания станет частью проекта, которому жить много-много лет.
                      • 0
                        Знаете, бывают ситуации когда, например, boxing/unboxing тормозит. Или арифметические операции.

                        Я не скучный троль, мы просто с вами в разных нишах.
                • 0
                  Эффективный код — это код, который достигает желаемого эффекта.

                  Если желаемый эффект — по-быстрому преобразовать набор данных и выкинуть код на помойку — то можно писать в одну строку, с goto и переменными lolcat и loldog.

                  Если желаемый эффект — производительная, надежная и масштабируемая система — то нужно писать так, как говорит sigizmund.
                  • –1
                    Ага, знаю я одну систему, так ее девелопит команда в 100 человек. Архиекторы и оптимизаторы перфоманса и т.д.

                    Вы думаете ей от этого легче? Ой нет. Тоже самое сделает 1 человек закрывшись на полгода.

                    Есть такая штука промышленное программирование, а есть жизнь. Почему-то они ортогональны.
                    • 0
                      Не, архитекторов и оптимизаторов нафиг. Были, знаем. Нужно чтоб каждый кодер знал свое дело. Команда в 100 человек на один репозиторий — это медленная смерть проекта от ожирения.
                      • +1
                        Нет, это интересная жизнь. В таких коммандах можно годами получать зп и ничего не делать!
                        • 0
                          Хаха, да, прав.
                      • +2
                        Архитекторов и оптимизаторов нафиг — и кодеры сразу потеряют свою ценность. Потому что они не будет знать, что делать.
                        • 0
                          Тут могут быть вопросы интерпретации, кого вы называете архитектором и кодером. Если архитектор — это средний чувак с гордым словом «architect» в названии должности и горой UML диаграмм на столе, а код он в глаза видел 5 лет назад, то кодерам без него будет гораздо лучше. Все равно вменяемой архитектуры с таким подходом он в жизнь не родит.
                          • 0
                            Такой «архитектор» — только в кавычках.
                            • 0
                              а какой архитектор, по вашему мнению, должен быть в контексте индустрии?
                              • +1
                                Кодирующий прототипы и каркасы, владеющий используемыми командой средствами разработки. В противном случае архитектор превращается в эрзац менеджера, скрещенного с экс-разработчиком, причем обе половины — худшие.
                    • 0
                      Не сделает. Линус бы тоже не сделал нормальное, полноценное ядро один.
                      • 0
                        Если выкинуть дрова — то вполне.
                        • 0
                          Если выкинуть дрова, то он нафиг никому не был бы нужен, кроме самого Линуса (ну, может ещё полдесятка человек).
                          • 0
                            знаете, я вспоминаю времена, когда фактор использования Linux говорил о том, что у человека есть мозг. И, не сказать, что я был против. Мне они нраивлись… И да. я бы их сохранил!
                            • 0
                              Да, хорошие были времена.

                              >И да. я бы их сохранил!

                              Зачем?
                              • 0
                                Сейчас приходиться делать все тоже самое. Просто сложностей и прослоек стало больше.
                                • 0
                                  ГМ, да ну? 5-6 лет назад, как помню, KDE были совершенно неюзабельным продуктом. Полтора года назад — гораздо, гораздо лучше.

                                  В те времена, о которых вы тут говорите, линукс был совершенно неориентирован на обычного пользователя.

                                  Если есть ностальгия по тем временам, подскажу. Возьмите Solaris/AIX/NetBSD, и вспомните те времена. Если хочется хардкора, возьмите QNX :-D
                                  • 0
                                    Предчувствую возможное негодование и упрек в троллизме. Я просто не согласен, что сейчас стало сложней и хуже. Я считаю, в этом плане линукс )особенно убунту) взял совершенно новую планку для себя за последние 3-4 года.
                                    • 0
                                      хм, какую планку? планку что его нельзя понять? Планку что ушло сообщество и к тебе относятся как к говну, написавшему патчи? Планку про то, что в lkml приходят люди, у которых не получается собрать ядро?

                                      Мне в этом подходе нравится netbsd. Там на этапе установки, хорошая такая, планка.
                                  • 0
                                    >5-6 лет назад, как помню, KDE были совершенно неюзабельным продуктом. Полтора года назад — гораздо, гораздо лучше.

                                    Категорически не согласен!
                                    6 лет назад было КДЕ 3.3 (если мне память не изменяет, то в Debian Sarge было как раз 3.3.2), за которым я просидел довольно долго (пока не апгрейднулся до Etch).
                                    1.5 года назад было КДЕ 4.1, за которым я не смог просидеть и дня — валилось на каждый чих, глючило повсеместно.
                                    • –1
                                      Я помню KDE первых версий. Помню gnome 1.4

                                      Знаете, лучше особо с тех времен не стало. Хуже стало.
                                  • 0
                                    Дык, и ни нужны обычные пользователи, как вы говорите. Я гик — и хочу назад свою игрушку!
                • 0
                  Java Effective Programming, Джошуа Блоха, например :) если вы яваист.
                  • 0
                    Ну или бессмертный Effective C++ Programming ;)
                    • 0
                      эти книги учат меня как готовить инструменты. Инструмент, язык, это удел подмастерья. Мастеру, творцу, все-равно на чем писать.
                      • +1
                        Было бы классно, если бы мастер и творец научился писать сперва по-русски.
                      • +1
                        Ха. Если перефразировать чуть-чуть, то быдлокодеру абсолютно все равно, на каком языке писать быдлокод (на любом языке можно написать программу на фортране). Это я к тому, к чему приводит такой подход — думать, что инструмент не важен.

                        Понимание общих философских принципов не отменяют необходимость хорошо знать инструмент (если вы все еще программист, а не архитектор/менеджер).
                        • +1
                          Знаете, я программист.

                          Изучить основы использования новой библиотекой это от дня до недели. Почему? Потому что я знаю много библиотек, и обычно хватает прочесть example или философскую байду.

                          Да, я не узнаю багов и сокральных знаний. Они преобретуться если я захочу ограничивать свой дизайн этой библиотекой.

                          Кстати, вы можете называть меня быдлокодером. Я не против.
                          • –1
                            Если это библиотека типа Log4J — да. Если это Spring / Hibernate / JBoss / ..- нет. А люди, знания которых по упомянутым монстрам ограничиваются однодневным чтением философской байды, конечно же есть. И они нужны. Называются — менеджеры :-D
                            А программисты с таким уровнем знаний, извините, на хрен не нужны.
                            • 0
                              Скажите мне, а что сложного в hibernate? Нет, ну вот правда? Большой, сложный ORM…
                              Далее, не понятно, что вы имеете ввиду знание про технологию или библиотеку.

                              Далее, вы путаете менеджеров и руководителей группы. Менеджер, его больше интересуют бюджеты, сроки и риски, чем библиотеки и прочие средства ограничение.
                              • 0
                                Скажите мне, а что сложного в hibernate? Нет, ну вот правда? Большой, сложный ORM…
                                — Сложного концептуально — сам подход ORM. В нем есть концептуальные сложности и проблемы, преобразования объектной модели в реляционную, ну вы сами отлично знаете.

                                Но даже если оставить их в стороне, то сам хибернейт, за один день вы не изучите. И за неделю не изучите. Требуется разработать на нем пару крупных проектов, чтобы стать знатоком его. Я бы сказал, требуется стать знатоком БД (ошибочное, уродское заблуждение, что можно писать хороший код на ORM, не понимая хорошо работы СУБД!!!), потом изучить хибернейт и набить шишек в нем, и потом в своем мозгу слить две эти вещи воедино, тогда можно эффективно использовать Hibernate, и достигать производельности И простоты и удобства.

                                Я знаете ли, видел людей, которые освоили хибейнтейт быстренько, «а че, он же несложный, и с базой не надо работать, он сам все сделает».
                                Они потом удрученно рассказывали, что у них тормозят все сложные экраны, и они переписывают их на HQL-запросы (!!!), т.е. по сути, отходят от Java-программирования. Граф объектов может выглядить стройно, но не все понимают, что при неправильном использовании хибернейта он раскладывается в обращения к десяткам и десяткам таблиц.

                                Это к тому, что людям, которые понимают общий подход, а детальные знания о багах, фичах, потенциальных проблемах, наиболее частых ошибках, собираются приобрести потом, в процессе, и за один день, техлидам в сложном и напряженном проекте делать нечего, ИМХО.

                                Это все разумеется, не в укор Вам, я просто привел пример.
                                — «Далее, не понятно, что вы имеете ввиду знание про технологию или библиотеку»
                                — То, что вы называете «инструмент», и хотите быть выше этого.

                                — Далее, вы путаете менеджеров и руководителей группы. Менеджер, его больше интересуют бюджеты, сроки и риски, чем библиотеки и прочие средства ограничение.
                                — А руководитель группы — это не менеджер?

                                Я не путаю, я намеренно упрощаю. Иные менеджеры очень любят лезть в технические мелочи и читать про технические новинки. Если хотите, можем разбить их на тимлидов, техлидов, PM-ов и прочих, в данном случае не суть.
                                • 0
                                  Хорошо, я понял вашу позицию. Если коротко — вам не приятна не компетенция в IT. Что же, понимаю. Мне она так же не приятна.

                                  Далее, про hibernate и другие ORM. Странно, но я не понимаю что сложного в моделе ORM, да и зачем вообще нужна ORM. Это лишняя абстракция, хотя она не скрывает, особо сильно, кишки СУБД, зато создает проблемы.
                          • 0
                            Да я вас и не называл и не собираюсь. Просто заметил, что выше мнение не совпадает с моим.
          • –1
            Я за элегантный код и строгие собеседования.

            А вот стремление показать, что вы тот еще перец, когда этого совершенно не требует предмет обсуждения, меня раздражает.
            • –2
              Тогда я не понимаю, о чем мы с вами спорим! Я тоже за элегантный код и строгие собеседования, а те еще перцы мне совершенно не нужны.
    • –1
      А собственно, зачем вы постите какой-то код на питон (похоже на поиск), в обсуждение оптимизации join-ов?
      • 0
        Я тоже иногда забываю ставить смайлики. Не минусуйте человека.
    • 0
      10 минут python
      pastie.org/928420
  • +1
    Писал много раз. Очень сильно его его невзлюбил, когда на первом курсе моя курсовая программулина работала не совсем корректно, долго грешил на поиск, оказалась банальность с поиском не связанная отделяла меня от счастья… Потом снова повторения мать учения на третьем курсе, и вот тут совсем недавно на питоне и то с первого раза не заработал. Кнут прав :)
  • –1
    Action script 3
    Писал давно гдето минут 15-20.
    Насчет «без тестирования», то не получилось так как написал юнит тест.

    package com.kavalok.utils.sorting {
    import com.kavalok.collections.ArrayList;
    import com.kavalok.interfaces.IComparer;
    import com.kavalok.interfaces.ISorter;
    import com.kavalok.utils.comparing.ComparingResult;
    public class QuickSorter implements ISorter {
    public function sort(list: ArrayList, comparer: IComparer): void {
    _list = list;
    _comparer = comparer;
    executeSort(0, list.length);
    }
    private function executeSort(begin: uint, length: uint): void {
    var i: Number = begin;
    var j: Number = begin + length — 1;
    var currentElement: Object;
    var temp: Object;
    var centerIndex: uint = uint(begin + length/2);
    currentElement = _list.getItemAt(centerIndex);
    do {
    while (_comparer.compare(_list.getItemAt(i), currentElement) == ComparingResult.SMALLER) i++;
    while (_comparer.compare(_list.getItemAt(j), currentElement) == ComparingResult.GREATER) j--;
    if (i <= j) {
    temp = _list.getItemAt(i);
    _list.setItemAt(_list.getItemAt(j), i);
    _list.setItemAt(temp, j);
    i++; j--;
    }
    } while ( i<=j );
    if ( j > begin ) executeSort(begin, j — begin + 1);
    if ( begin + length > i ) executeSort(i, begin + length — i);
    }
    private var _list: ArrayList;
    private var _comparer: IComparer;
    }
    }
    • +26
      … и мой код на питоне перестал казаться мне таким уж жутким.
      • +4
        Любой код без форматирования выглядит жутковато)
        ну и половину текста — импорты и всякая хна.
        + немного портит впечатление интерфейс IComparer — в АС3 нет перегрузки операторов, к сожалению.
        • +4
          Можно вставлять код
            <pre>вот так</prе>
          Тогда отступы сохранятся.
          
    • +1
      у меня такое ощущение, что здесь быстрая сортировка, а не бинарный поиск
      • 0
        ууупс. затупил. читал статью по диагонали. прошу простить или заминусовать.
  • –1
    public int BinarySearch(int[] data, int asked)
    {
    if(data!=null && data.Length>0)
    {
    int leftEdge = 0;
    int rightEdge = data.Length-1;
    int index = 0;
    bool work = true;
    do
    {
    index = rightEdge — leftEdge;
    if(index/2 > 0)
    {
    if(data[index]>asked)
    {
    rightEdge = index;
    }
    else if(data[index]<asked)
    {
    leftEdge = index;
    }
    else if(data[index] == asked)
    {
    return index;
    }
    }
    else return null;
    }while(work);
    }
    }

    //С#
    • +1
      • 0
        Ваш код зацикливается вот на таких данных:
        массив: [2, 4, 6, 8, 10]
        поиск числа 2
        • 0
          Да, уже понял… все же сходу сложно оказалось.
    • 0
      если можно, немного не по по теме топика вопрос: а в C# допустим return null, если тип функции int? Просто интересно, т.к. с С# практически не знаком :)
      • +1
        Нет, не допустим. null только для ссылочных типов.
        • 0
          спасибо! я так и думал :)
          тогда, правильно ли я понимаю, что код работать не будет для случая массива из 1-го элемента?
        • 0
          можно поиграться с nullable ;)
          int? x;
          • 0
            да, действительно, но я бы все же вернул число, например, -1 в качестве индекса несуществующего элемента.
  • +1
    pastie.org/927590
    похапе, 10 минут. не уверен, что без ошибок :) тяжело писать и не тестировать :)
    • 0
      нда, действительно :) вместо ceil нужно floor и вместо 1 — 0. а так всё работает :)

      зы: посмотрел на википедии, там развёрнуто в цикл. рекурсивное решение считается правильным? ;)
      • 0
        Разве для (1,2,3,4,5) и искомого числа 4 или 5 вернется правильное значение?
      • +1
        >> рекурсивное решение считается правильным?

        А пхп умеет оптимизировать хвостовую рекурсию?
        Если нет — то я бы не засчитал.
  • 0
    Двоичный поиск и без ошибок писал совсем давно. Еще в эпоху паскаля. Но смысл в нем не вижу, есть более оптимальные алгоритмы поиска.
    • +1
      примеры плз…
  • 0
    Мой код код
  • 0
    7 минут, javascript
    pastie.org/927596
    не тестил, но по идее должно работать.
    • –1
      Возможно первое правильное решение здесь.
    • +1
      • 0
        кстати, думал что управлюсь за минуту — две. включая вторую версию — минут 10 точно уже прошло :)
  • +4
    Автор, «Почти все реализации двоичного поиска и сортировки слиянием сломаны» — это не по-русски, это ужасная калька с английского! По-русски будет «Почти все реализации двоичного поиска и сортировки слиянием корявые».
    • +1
      Содержат ошибки — хорошо?
      • +1
        Это вполне по-русски
  • 0
    В универе писал на ассемблере около часа, не сразу но заработало.
  • 0
    C#
    pastie.org/927603
    5 минут, алгоритм не реализовывал лет 7.

    P.S. массив arr — объявлен переменной класса.
    • 0
      умирает, когда 0 элементов.
  • 0
    Часто использую разные вариации (под определенный тип исходных данных) бинарного поиска.

    Вот вариант на Objective-C — расширение класса NSArray
    pastie.org/927604

    Минут 10 ушло по памяти написать. Обычно копи-пастом удобнее :).
  • +5
    Процент программистов спосбных написать тернарный поиск еще меньше.
    • 0
      кстати, тоже базовый алгоритм.
      • 0
        учитывая, что с двоичным возникли проблемы, про тернарный и не стоит заикаться. :)
  • +1
    а я смотрю, Дональд Кнут — оптимист…

    «Только 10% программистов способны написать.» — правильнее?
  • +2
    int binsearch(int* a, int n, int key)
    {
        int lo = 0;
        int hi = n - 1;
    
        while (lo < hi)
        {
            int mid = lo + (hi - lo) / 2;
            if (key > a[mid])
                lo = mid + 1;
            else
                hi = mid;
        }
    
        return a[hi] == key ? hi : -1;
    }
    
    • 0
      Черт, не работает при n = 0. Ну ладно, остальное вроде бы выглядит правильно.
  • +30
    BinarySearch proc ;params: array (of integers), length, target
    push ebp
    mov ebp, esp

    mov ebx, [ebp + 8]
    mov ecx, [ebp + 12]
    xor edx, edx
    dec ecx
    jmp LoopCond
    LoopStart:
    mov eax, edx
    add eax, ecx
    shr eax, 1
    push ecx
    mov ecx, [ebp + 16]
    cmp [eax * 4 + ebx], ecx
    pop ecx
    je Exit
    jl UpperHalf
    mov ecx, eax
    dec ecx
    jmp LoopCond
    UpperHalf:
    mov edx, eax
    inc edx
    LoopCond:
    cmp ecx, edx
    jge LoopStart
    mov eax, -1

    Exit:
    pop ebp
    ret
    BinarySearch endp
    • 0
      вы невероятно круты :)
    • +4
      Тоже вроде бы при n = 0 не работает:
      если [ebp + 12] = 0, тогда после dec ecx получается ecx = -1, edx = 0. После shr eax, 1 получается eax = 0x7fffffff, ну и потом eax*4 + ebx указывает на непонятное место в памяти.
      • +1
        Школоте не понять (:
        • 0
          Я не понял, сделал выводы :(
    • 0
      Черт, залип. Уже ничего не помню на асме (
      грустно
    • +4
      и вам привет от спектрумистов (Z80 assembler): pastie.org/927781

      ; Input:
      ; HL = pointer to sorted array
      ; BC = array length (must be less than 32767, not tested, but just for case)
      ; A = search value
      ;
      ; Output:
      ; HL = pointer to value or 0 if not found
      ; BC = undefined
      ; DE = undefined

      binary_sort:
      push hl
      add hl,bc
      ld b,h: ld c,l
      dec bc
      pop hl

      binary_sort_1:
      ld d,h: ld e,l
      and a: sbc hl,bc
      jp nc,binary_sort_2

      ld hl,0
      ret

      binary_sort_2:
      ld h,d: ld l,e
      add hl,bc
      and a: rr h: rr l

      cp (hl)
      ret z

      jp c,binary_sort_3

      ld b,h: ld c,l
      dec bc
      ex de,hl
      jp binary_sort_1

      binary_sort_3:
      inc hl
      jp binary_sort_1

      (если убрать двоеточия после меток и поставить убранные парсером табы перед коммандами, то должно компилироваться в ALASM (на самом спеке) либо в sjasmplus (кросскомпилер). естественно, не проверял :))
    • 0
      А еще вот это подозрительное место:
      add eax, ecx
      shr eax, 1

      Наверно, лучше бы было сделать вот так:
      shr eax, 1
      shr ecx, 1
      add eax, ecx

      дабы избежать переполнения при больших массивах.
  • –11
    //А че-то лень писать…

    0 минут. Не тестировал.
  • –1
    • 0
      не компилируется вот эта строчка

      return A[first] == val? first: null;

      val типа int, а Вы используете вместе с ним null
      • 0
        Ну, val тут не причем))
        А так?
        int? getIndexOf(int[] A, int val)
        {
             int first = 0;
             int count = A.Length;
        
             while(count>1)
             {
                 count=count/2;
                 int i = first+count-1;
                 if (A[i]== val) return i;
                 if (A[i]<val) first+=count;
             }
        
            if (count==1)
                return A[first]==val? (int?)first : null;
        
            return null;
        }
        
        • 0
          ну это так… мелочь.

          также не работает поиск последнего числа в массиве
  • 0
    pastie.org/927623
    7 минут на реализацию и еще 7 на тесты
    • 0
      забыл написать, язык С#
  • –9
    > есть упорядоченный массив, берем число из середины массива, сравниваем с искомым. Если оно оказалось больше, значит искомое число в первой половине массива, если меньше — во второй

    Т.е. массив был заранее отсортирован и на это было потрачено время?

    И зачем оно такое надо вообще?
    • 0
      в большинстве случаев массив сортируется 1 раз для многократных поисков по нему…
      • 0
        Вообще то бинарный поиск работает только в упорядоченном массиве. Вот незнание этого факта, да, настораживает.
  • 0
    function array_search($needle, $haystack) {
        if (!is_numeric($needle)) {
            trigger_error('Invalid argument needle. Numeric expected.');
            return false;
        }
        if (!is_array($haystack)) {
            trigger_error('Invalid argument haystack. Array expected.');
            return false;
        }

        sort($haystack, SORT_NUMERIC); // это тестировал

        $length = count($haystack);

        $from = 0;
        $to = $length - 1;

        $result = false;
        while ($result === false) {
            if ($to > $length - 1 || $from < 0) {
                $result = null;
            } else {
                $index = floor(($from + $to) / 2);
                if (!is_numeric($haystack[$index])) {
                    trigger_error('Invalid value of argument haystack. Only numeric values allowed.');
                    return false;
                }
                if ($haystack[$index] > $needle) {
                    $to = $index - 1;
                } elseif ($haystack[$index] < $needle) {
                    $from = $index + 1;
                } else {
                    $result = $index;
                }
            }
        }

        return $result;
    }

    echo array_search(5, array(3, 76, 8, 4, 2, 2, 1, 5, 2, 3, 1, 2, 5, 7, 2, 3)) . "\n";


    Пыхапе. Пол часа. И что-то мне подсказывает что с первого раза не взлетит…
    • –1
      перепутал
      if ($from > $length — 1 || $to < 0) {

      надо
      if ($to > $length — 1 || $from < 0) {

      и возвращает индекс отсортированного массива а не исходного, хотя в задаче массив изначально отсортирован.
      А, и ещё — Fatal error: Cannot redeclare array_search()
  • 0
    pastie.org/927632
    C#, 15 минут, 1 тест. Упал с оверфлоу — ошибку пофиксил и остальные две проверки прошли нормально.
    • 0
      Блин, пока писал тут коментов то понабралось. Сразу вопрос — а почему у всех массив сортированный? Я что не правильно помню алгоритм? Мне казалось, что сортированные данные — это частный случай…
      • 0
        А как вы будете искать в случайном несортированном массиве кроме как полным перебором?
        • –1
          Полным перебором с постоянный разбиением на подсэты — грубо говоря проход по бинарному дереву. Вообщем то это и реализованно в сорсе на пасте.
          • 0
            Интересно на это посмотреть, ведь формирование бинарного дерева из произвольного массива само по себе требует операций больше, чем O(n).
            • 0
              Сорс приложен и перед комментированием могли бы и посмотреть. Ваше замечание про формирование дерева и O(n) не имеют никаких оснований.
              • 0
                По эффективности ваш метод ничем не отличается от простого перебора.
                На рекурсию только ресурсы тратятся и все.
                • 0
                  Как и любой другой поиск в не сортированном массиве
      • +1
        Просто привычки вчитываться в постановку задачи:
        С массивами так: есть упорядоченный массив, берем число из середины массива, сравниваем с искомым.
        • 0
          Да, точно — мой промах.
    • 0
      Мне нравится Ваш подход с рекурсией. Красиво и наглядно. :)
      • 0
        Только медленно)
        • 0
          с современными компьютерами производительность часто оказывается менее важной, чем легкость восприятия кода.
          • +1
            А потом мы удивляемся, почему сиране браузер, в котором открыт пяток страниц, отъедает аж 350!!! Mb оперативной памяти.
            • 0
              Я согласен с Вами, что производительность важна.
              Просто в некоторых ситуациях производительность — не самая важная характеристика программы.