company_banner

Почему не растет частота?

    Clocking PCМногие, наверное, помнят, какими темпами увеличивалась тактовая частота микропроцессора в 90-х и начале 2000-х годов. Десятки мегагерц стремительно переросли в сотни, сотни мегагерц почти мгновенно сменились цельным гигагерцем, затем гигагерцем с долями, двумя гигагерцами и т.д.
    Но последние несколько лет частота уже не растет так быстро. От десятка гигагерц мы сейчас почти так же далеки, как и 5 лет назад. Так куда же исчез прежний темп? Что препятствует, как и раньше, «задирать» частоту вверх?

    Текст ниже ориентирован на людей, не знакомых или слабо знакомых с архитектурой микропроцессора. Для подкованных читателей рекомендуются соответствующие посты yurav


    «Горячие» гигагерцы


    Бытует мнение, что дальнейший рост тактовой частоты непременно связан с увеличением тепловыделения. То есть, вроде как, ничего не мешает просто повернуть в нужную сторону некоторый «рубильник», отвечающий за увеличение частоты, – и частота пойдет вверх. Но процессор при этом нагреется настолько, что расплавится.

    Это мнение поддерживается множеством людей, имеющих какое-то отношение к компьютерной технике. К тому же подтверждается успехами оверклокеров, разгоняющих процессоры в два и более раз. Главное – поставить систему охлаждения помощнее.

    Хотя упомянутый «рубильник» и связанная с ним проблема тепловыделения действительно существуют, — это только часть битвы за гигагерцы…

    Главный тормоз


    У различных микропроцессорных архитектур могут быть различные сложности с «разгоном». Для определенности, мы здесь будем говорить о суперскалярных архитектурах. К таковым относится, например, архитектура x86 – самая популярная среди разработок компании Интел.

    Чтобы понять проблемы, связанные с подъемом тактовой частоты, необходимо сначала определить, во что упирается ее рост. На разных уровнях рассмотрения архитектуры можно выделить различные наборы параметров, ограничивающих частоту. Однако оказывается, что существует такой уровень, на котором есть только один такой параметр. То есть можно выделить всего один тормоз, который надо дополнительно приотпускать каждый раз, когда охота разогнаться.

    Конвейер


    Главный тормоз лежит на уровне конвейера. Конвейер – это сердце суперскалярной архитектуры. Его суть состоит в том, что исполнение каждой инструкции микропроцессора разбивается на стадии (см. рисунок).
    Stages
    Стадии следуют друг за другом во времени, причем каждая из них исполняется на отдельном вычислительном устройстве.

    Как только исполнение некоторой стадии завершается, освободившееся вычислительное устройство может быть задействовано для исполнения аналогичной стадии, но уже другой инструкции.

    image

    На рисунке показано, как в период времени t1 на первом вычислительном устройстве исполняется первая стадия первой инструкции. К началу периода t2 первая стадия уже выполнена, и поэтому можно переходить к исполнению второй стадии на втором устройстве. Первое устройство при этом освобождается, и его можно отдать под первую стадию уже другой инструкции. И так далее. В период времени t4 на конвейере одновременно будут исполняться различные стадии четырех инструкций.

    Но какое отношение все это имеет к частоте? Оказывается, что самое непосредственное. В действительности различные стадии могут отличаться по длительности исполнения. При этом разные стадии одной и той же инструкции исполняются в отдельных тактах. Продолжительность такта (а с ней и частота) микропроцессора должна быть такой, чтобы в него уместилась самая длинная стадия. На рисунке, приведенном ниже, самой длинной изображена стадия 3.

    image

    Делать такт короче самой долгой стадии не имеет смысла. Технически это возможно, однако не приведет к реальному ускорению работы микропроцессора.

    Предположим, что самая длинная стадия требует для исполнения 500пс (пикосекунд) времени. Это длительность такта в машине с частотой 2ГГц. Допустим теперь, что мы хотим сделать такт в два раза короче – 250пс. Просто так… Ничего, кроме частоты, менять не собираемся. Такой ход приведет только к тому, что проблемная стадия будет исполняться два такта, но по времени это будут все те же 500пс. К тому же значительно возрастут сложности проектирования и увеличится тепловыделение процессора.

    Можно было бы возразить, что благодаря более короткому такту, быстрее начнут «пролетать» короткие стадии, и значит, возрастет средняя скорость вычислений. Однако это не так (см. рисунок).

    image

    Поначалу вычисления действительно пойдут быстрее. Но уже с четвертого такта третья стадия и любые следующие за ней (в нашем примере – только четвертая) начнут задерживаться. Это произойдет из-за того, что третье вычислительное устройство будет освобождаться не каждый такт, а каждые два такта. Пока оно занято третьей стадией одной инструкции, аналогичная стадия другой инструкции не может быть исполнена. Таким образом, наш гипотетичский процессор с длиной такта в 250пс эффективно будет работать как процессор с тактом в 500пс, хотя формально его частота будет в два раза выше.

    Чем мельче, тем лучше


    Итак, с точки зрения конвейера, тактовая частота может быть повышена только одним способом – за счет уменьшения длительности самой долгой стадии. Если удается сократить самую долгую стадию, появляется возможность уменьшить такт до размера той стадии, которая станет самой длинной после проведенного сокращения. А чем короче такт, тем выше частота.

    В рамках современных технологий, существует не так много способов, которыми можно воздействовать на размер стадии.

    Один из таких способов – переход к более совершенному технологическому процессу. Грубо говоря, очередное уменьшение количества нанометров. Чем мельче составные части процессора, тем быстрее он работает. Происходит это за счет того, что сокращаются расстояния, которые необходимо преодолевать электрическим импульсам, сокращается время переключения транзисторов и пр. Упрощенно можно считать, что всё равномерно ускоряется. Примерно равномерно сокращаются длительности всех стадий, в том числе и самой долгой. Частоту после этого можно поднять.

    Звучит довольно просто, однако продвижение вниз по шкале нанометров – процесс очень непростой. Он очень сильно зависит от современного уровня технологий, и дальше, чем позволяет этот уровень, шагнуть нельзя. Тем не менее, производители микропроцессоров постоянно совершенствуют технологический процесс, и частота за счет этого постепенно ползет вверх.

    Порезать пациента


    Другой способ поднять частоту – это «порезать» самую проблемную стадию на более мелкие. Ведь когда-то инструкции уже удавалось мельчить на стадии. И удавалось многократно. Почему бы не продолжить нарезку? Процессор после этого будет работать только быстрее!

    Будет. Однако резать очень сложно.

    Приведем аналогию со строительством домов. Дома строятся этаж за этажом. Пусть этаж будет аналогией инструкции. Мы хотим разбить строительство этажа на стадии. Для начала, пусть это будут две стадии: собственно строительство и отделка. Пока происходит отделка на последнем построенном этаже, ничто не мешает приступить к строительству нового этажа. Главное, чтобы строительством и отделкой занимались две разные бригады. Вроде, все хорошо.

    Теперь мы хотим пойти дальше и помельчить уже имеющиеся две стадии. Отделку, допустим, можно разбить на поклейку обоев и покраску потолков. С таким разделением нет никаких проблем. После того, как маляры покрасили один этаж, они могут идти на следующий, даже если на предыдущем все еще идет поклейка обоев.

    А что со строительством? Допустим, мы хотим разбить строительство на возведение стен и укладывание перекрытий. Такое разделение можно сделать, но толку от него не будет. После того, как на одном этаже возведены стены, вы не можете отправить бригаду возводить их на следующем этаже, пока не будет перекрытий. Несмотря на то, что формально нам удалось разбить строительство на две стадии, нам не удалось полностью занять отдельные бригады, специализирующиеся на стенах и потолках. В любой момент времени будет работать только одна из них!

    Та же самая проблема имеется и в микропроцессорах. Существуют стадии, которые цепляют инструкции друг за друга. Дробить такие стадии на более мелкие очень тяжело. Для этого нужны очень серьезные изменения в архитектуре процессора. Точно так же, как серьезные изменения нужны в строительстве для того, чтобы одновременно строить несколько этажей одного дома.

    Повернуть рубильник


    Вот мы и добрались до того, чем занимаются оверклокеры. Они поднимают напряжение, под которым работает процессор. За счет этого быстрее начинают переключаться транзисторы (основные элементы, из которых состоит процессор), и длины всех стадий более-менее равномерно сокращаются. Появляется возможность поднять частоту.

    Очень просто! Но есть большие проблемы с тепловыделением. Упрощенно, выделяемая процессором мощность описывается следующим образом:
    P ~ Cdyn*V2*f
    Здесь Cdyn – динамическая емкость, V – напряжение, f – частота процессора.

    Неважно, если вы не знаете, что такое динамическая емкость. Главное здесь – напряжение. Оно в квадрате! Выглядит ужасно…

    На самом деле, все еще хуже. Как я уже сказал, напряжение нужно, чтобы заставить быстрее работать транзисторы. Транзистор – это своеобразный переключатель. Для того, чтобы переключиться, ему необходимо накопить достаточный заряд. Время такого накопления пропорционально току: чем он больше, тем быстрее на транзистор приходит заряд. Ток, в свою очередь, пропорционален напряжению. Таким образом, скорость срабатывания транзистора пропорциональна напряжению. Теперь обратим внимание на то, что частоту процессора мы можем увеличить лишь пропорционально увеличению скорости срабатывания транзисторов. Суммируя сказанное, имеем:
    f ~ V и P ~ Cdyn*V3
    С линейным ростом частоты тепловыделение будет увеличиваться по кубическому закону! При увеличении частоты в 2 раза, необходимо будет отвести от процессора в 8 раз больше тепла. Иначе он расплавится.

    Очевидно, такой способ увеличения частоты не очень подходит для производителей процессоров из-за низкой энергоэффективности, хотя и используется разгонщиками-экстремалами.

    И это все?


    И это все. Ну или почти все. Кто-то мог бы вспомнить, что ему удавалось слегка увеличить тактовую частоту микропроцессора даже без поднятия напряжения.

    Такое тоже возможно, однако в очень ограниченных пределах. Процессоры рассчитаны производителем на то, чтобы эксплуатироваться в широком диапазоне внешних условий (которые влияют на длину стадии), поэтому производятся с некоторым запасом по частоте. Например, самая длинная стадия может занимать не целый такт работы процессора, а скажем, 95% такта. Отсюда и возможность незначительно повысить частоту.

    Кстати, я ни в коем случае не призываю никого заниматься самостоятельным разгоном процессоров. Все, кто им занимается, делают это на свой страх и риск. Неправильно проводимый разгон опасен не только для ваших процессоров, но и для вас лично!

    Отмечу также, что помимо описанных, существуют и другие способы воздействовать на длину стадии. Но они гораздо менее существенны, чем представленные здесь. Например, изменение температуры влияет на работу электроники в целом. Однако серьезные эффекты достигаются только при очень низких температурах.

    В общем и целом, получается, что за повышение частоты бороться очень тяжело… Тем не менее, эта битва постепенно ведется, и частота потихонечку ползет вверх. При этом грустить из-за того, что процесс замедлился, не приходится. Ведь появилась такая штука как многоядерность. И какая, в сущности, нам разница, стал наш компьютер работать быстрее из-за того, что поднялась его частота, или потому, что задачи стали исполняться в параллель? Тем более что во втором случае мы получаем дополнительные возможности и бОльшую гибкость…
    Intel 122,00
    Компания
    Поделиться публикацией
    Похожие публикации
    Комментарии 204
    • +6
      Все то же самое применимо к многоядерности. Да и софт в основном не готов использовать множество ядер, поэтому «быстрее» становится, к сожалению, для весьма малого класса задач
      • +10
        ага. программистам приходится заниматься «прыжками в ширину»
        • –6
          Современные ОС по определению исполняют все программы в параллели, им разнести софт по разным ядрам не проблема. Каждой программе по ядру! Почему бы и нет… :)
          • +12
            Это милое мнение с хабра. «Им разнести софт по разным ядрам не проблема».

            А вот в linux'е так не думают, и процесс переноса процесса с ядра на ядро вызывает массу возражений из-за засирания кешей и снижения производительности.

            А так да, никаких проблем нет. Welcome multicore.
            • +5
              да тут вопрос более фундаментальный, чем технические сложности — в том, что не все алгоритмы можно распараллелелить — опять же аналогия со строителями — нельзя построить следующий этаж, не построив предыдущий — чтобы вычислить следующий член последовательности Фибоначчи — надо знать предыдущий, вот матрицы например перемножить в параллель — это запросто — поэтому видеокарты имеют дофигища ядер — перемножение матриц — одна из основных операций в видеообработке
              • –10
                Немного позанудствую, но для вычисления чисел Фибоначчи существует рекурсивный алгоритм, а он в принципе распараллеливается: даже для малого значения n рекурсивными вызовами порождается очень большое число параллельных процессов.
                • +5
                  чего — рекурсивный алгоритм распараллеливается? то есть я правильно понимаю, что
                  int fib(int n)
                  {
                  if (n <= 2) return 1;
                  else
                  {
                  return fib(n — 1) + fib(n — 2);
                  }
                  }
                  по вашему быстро отработает? это по сути дерево — то есть каждая функция должна ждать пока вычислятся вызванные ей функции — где тут параллельность? — сложность алгоритма ЭКСПОНЕНЦИАЛЬНАЯ. вот матрицы перемножить — взяли строку, умножили на столбец и сложили — никто никого ждать не должен
                  • –8
                    Про скорость никто не говорил, я говорил, что существует возможность распараллелить. Ведь этот алгоритм так и называется: параллельная рекурсия. Отправляете fib(n — 1) на одно ядро, fib(n — 2) на другое — вот и все. И на каждом шаге так. Да, ядра заканчиваются, но на теоретическую возможность распараллеливания это никак не влияет (use-case — тестирование возможностей систем параллельных вычислений). А если вы хотите скорости, то если использовать формулу Бине, то вообще не нужно знать ничего, кроме номера числа в последовательности.
                    • +3
                      так все равно — ядра то простаивают, пока ждут числа от других ядер
                      • –3
                        Если не нравится рекурсивный пример, а нравятся матрицы, то тогда вычисление чисел Фибоначчи можно распараллелить, воспользовавшись следующим тождеством:

                        image
                        • +3
                          хорошо конечно, что посмотрели таки википедию, но также посмотрите, что на основе этого свойства — операция сводится все равно к последовательному вычислению то есть каждое новое число получается на основе числа, вычисленного в предыдущем шаге:
                          //возвращает n-е число Фибоначчи
                          int fib(int n)
                          {
                          int a = 1, ta,
                          b = 1, tb,
                          c = 1, rc = 0, tc,
                          d = 0, rd = 1;

                          while (n)
                          {
                          if (n & 1) // Если степень нечетная
                          {
                          // Умножаем вектор R на матрицу A
                          tc = rc;
                          rc = rc*a + rd*c;
                          rd = tc*b + rd*d;
                          }

                          // Умножаем матрицу A на саму себя
                          ta = a; tb = b; tc = c;
                          a = a*a + b*c;
                          b = ta*b + b*d;
                          c = c*ta + d*c;
                          d = tc*tb+ d*d;

                          n >>= 1; // Уменьшаем степень вдвое

                          }
                          return rc;
                          }
                          • 0
                            Хочу заметить, что мы можем сложить другую матрицу, с количеством строк и ячеек порядка N, которая за одно умножение себя будет давать переход из fib(a) -> fib(a+N). А после юзать какое-нибудь распараллеленное умножение матрицы на матрицу. Т.е. по сути нам нужно будет умножить не logN матриц, а log(N/c), но при этом потеряем на умножении матриц, что чисто теоретически мы можем покрыть большим количеством воркеров. Это вообще даже не примерные прикидки, там нужно считать, выгороит ли это или нет. Но это и вправду чисто гипотетические прикидки. Закон Амдала он суров, да.
                            • 0
                              Если мы будем использовать матрицу размера K, то вычисление N-го числа Фибоначчи будет требовать O(logN/logK * K^3) операций. При этом максимальная степень параллелизма составит K^2, что даст время O(log N / log K * K). Как видно, асимптотика не улучшилась, а ровным счетом наоборот.

                              Но попытка интересная.
                    • 0
                      не нашел) удалил комментарий)
                    • 0
                      Рекурсивные алгоритмы тоже параллелятся, другое дело что менее эффективно и более сложно, чем итеративные. В шахматных движках например при поиске в глубину (а это даже сложнее, чем числа Фибоначчи, поскольку там дерево вызовов может быть сильно не симметричным) существуют алгоритмы для работы в несколько потоков.
                      • +1
                        В том-то и фокус, что шахматные движки параллелятся, а числа Фибоначчи — нет.
                      • –2
                        Сложность приведенного вами алгоритма экспоненциальная на одном ядре, а если бы у вас было бесконечное число ядер, то отправляя каждый вызов в новое ядро, вы бы получили выполнение задачи за линейное время. Про это я и говорил. Распараллелить можно, но смысла в этом мало, потому что именно для этой задачи существуют обходные пути. Но вот тот же самый quicksort имеет похожий вид и для него такое распараллеливание работает хорошо и быстро, хотя тоже ведь рекурсия.
                        • –2
                          Еще раз: я написал, что позанудствую и подчеркнул разницу между «нельзя распараллелить» и «можно, но выигрыша не принесет по сравнению с другими реализациями». Вот 1+1 нельзя распараллелить, а некоторые реализации вычисления чисел фибоначчи можно, но ускорения это не приносит.
                          • +1
                            Если занудствовать, то и i+1 можно распараллелить.
                          • 0
                            quicksort паралелится, т.к. там дерево и обработка обеих веток друг от друга не зависит. При вычислении чисел Фибоначи как F(n) = F(n-1)+F(n-2) обе ветки явно зависят друг от друга.

                            Кстати, справедливости ради стоит упомянуть что n-ное число Фибоначи можно итеративно вычислить за время O(log n). Описание мне попадалось в mitpress.mit.edu/sicp/full-text/book/book-Z-H-11.html, Exercise 1.19
                            • –1
                              Справедливости ради, для чисел Фиббоначи есть формула Бине (в Википедии есть) — никаких рекурсий, никаких матриц, никаких O(log n), все делается за O(1).
                              • +2
                                Делается-то за O(1), но 16-элемент ряда, например, получается равным 986.99999999999999995928

                                А сложность вычисление показательного выражения символьными методами, как мне кажется, совсем не O(1).
                                • +1
                                  Справедливости ради, числа фибоначчи нельзя даже вывести ни за O(1), ни за O(logn). N-е число фибоначчи — это экспонента от N. Количество в цифре любого числа — это примерно логарифм этого числа. Т.е. N-е число фибоначчи имеет примерно N цифр домноженное на какую-то константу.
                          • +3
                            Я тоже немного позанудствую, но рекурсивное вычисление чисел Фибоначчи медленнее циклического при любом числе потоков.
                            • –7
                              Медленнее, да, но из-за того, что для параллельной рекурсии не хватает физических ядер, а потоки медленные сами по себе.
                              • –2
                                В языках поддерживающих хвостовую рекурсию, сложность цикла и рекурсивного вызова примерно одинаковы, более того чаще всего циклы реализируются через рекурсивный вызов функции.
                                • 0
                                  Что?

                                  Во-первых, хвостовую рекурсию может поддерживать компилятор, но не язык.
                                  Во-вторых, формула f(x+2) = f(x+1) + f(x) не дает хвостовой рекурсии ни при каких условиях.
                                  • 0
                                    Но ведь можно вот так сделать?
                                    tratt.net/laurie/blog/entries/tail_call_optimization
                                    def fib(i, current = 0, next = 1): if i == 0: return current else: return fib(i - 1, next, current + next)

                                    • 0
                                      Ваша правда, мне почему-то в голову приходили лишь более сложные решения.

                                      Придется переформулировать фразу: «Я тоже немного позанудствую, но рекурсивное вычисление чисел Фибоначчи по приведенной формуле медленнее циклического при любом числе потоков.»
                                      • 0
                                        Насчёт этого спорить не буду.
                            • –1
                              В контексте процессора всё просто — делать симметричную многопроцессорность не дорого, а очень дорого. Каждый write lock стопит все все ядра на всех операциях с памятью. Чем больше процессоров, тем больше ожидания синхронизации.

                              multicore до сих пор не выкатили не только по причине жадности интела, но и по объективным причинам.
                              • 0
                                Простите, но что вы понимаете под терминами «multicore» и «не выкатили»? Такое ощущение, что мы обсуждаем разные проблемы на разных языках…
                                • 0
                                  Ага, я их опять попутал. Разумеется, речь про many-cores. Сейчас по мнению интела эпоха multicores, а потом будет many-cores, и там текущие подходы к ПО и процессорам перестанут работать из-за того, что ядер будет так много, что оверхед на SMP будет недопустимо высокий.

                                  www.altera.com/technology/system-design/articles/2012/multicore-many-core.html
                            • +6
                              и процесс переноса процесса с ядра на ядро

                              Кто говорит о переносе процесса с ядра на ядро? Речь идет о том, что одна программа выполняется на первом ядре, другая — на втором и т. д. Результат получается в любом случае быстрее (ну, не медленнее) и отзывчивее, нежели одноядерный вариант.
                              • –2
                                от этого игрушка меньше лагать не станет — прирост от того, что ресурсы ядра теперь только одной программой заняты — минимален — программа все равно выполняется на одном ядре, если хочется, чтоб реально работала в параллель — нужно специальным образом реализовывать алгоритмы, при том — не все пока поддаются распараллеливанию
                                • +2
                                  Игрушка будет лагать меньше хотя бы от того, что есть возможность выделить ей гарантировано целое ядро в индивидуальное пользование. Видео для вашей игрушки спокойно обрабатывается тысячами ядер вашей видеокарты. Звук и сеть обрабатываются через DirectX и тоже выносятся на свободные ядра, без участия разработчика.
                                • 0
                                  В контексте «одноядерный» — да. Но вот что быстрее — 60 процессов по штуке на 60 ядер или 60 процессов на 30 ядрах, выполняющиеся по очереди — это вопрос открытый. На соответствующих кривых производительность начинает падать из-за оверхеда процессорной шины, общей памяти и т.д.
                                  • –1
                                    И в какой доле современных серверных систем runnable-процессов больше, чем количество ядер/потоков? Про домашние и так понятно, что 0.
                                    • +1
                                      Ну, я бы про 0 не говорил — на домашних компьютерах порой второе ядро бывает очень даже к месту.
                                • 0
                                  Жаль, что только в пределах ядра программа тоже бы хотела исполняться параллельно на таких вот процессорах (не беру в расчёт GPU), но к сожалению не все задачи можно распараллелить :(
                                  • +12
                                    На одном ядре у меня любимая игрушечка (95% нагрузки), на втором фоновые процессы (20% нагрузки), третьим и четвертым ядром мы с пацанами меряемся по пятницам :)
                                    • 0
                                      На третьем и четвертом ядре — виртуальные машины с еще двумя копиями этой игрушечки. Хожу втроем в группе сам с собою… То есть ходил, пока игрушку не прикрыли.
                                    • НЛО прилетело и опубликовало эту надпись здесь
                                      • +1
                                        вопрос: ускорит ли работу бухгалтера 3 или 4 или 6 ядерный процессор.

                                        Ответ: нет, но руль и педали могли бы.
                                    • +4
                                      Софт со временем созреет. Сейчас многое для этого делается: синтаксические расширения языков программирования, библиотеки хорошие, обучение студентов в ключе «параллельного мышления».

                                      Основная проблема как раз в этом и есть: нынешние поколения программистов не привыкли мыслить параллельно. Как говорит один мой знакомый, параллельно умеют мыслить только домохозяйки. У них в одном углу ребенок растет, в другом кастрюля кипит, а в третьем белье гладится. И ведь все синхронизовано! :)

                                      Кстати, над автоматическим распараллеливанием программ работы тоже ведутся. Но здесь все как-то запредельно сложно получается пока что…
                                      • +2
                                        Это уже десятки лет говорят. А параллелят код до сих пор в подавляющем большинстве случаев руками. И значительных подвижек на горизонте до сих пор как-то не видно.
                                    • 0
                                      еще бы стоило отметить, что львиную долю энергозатрат занимает поддержка устаревших архитектур, в архитектуру вносятся дополнительные элементы, что так же ограничивает максимальную скорость работы системы
                                      • +2
                                        какие дополнительные тормозящие элементы вы имеете в виду?
                                        • +1
                                          которые отвечают за совместимость с более старой архитектурой — абстрактный пример — допустим (ДОПУСТИМ) сперва сделали 8 битные регистры и на этом построили архитектуру, то есть передача данных по 8 разрядным шинам идет, потом сделали 32 битную архитектуру и данные передаются по 32 разрядным шинам — соответственно для каждой архитектуры свой набор инструкций — одни инструкции могут работать с 32 битной шиной, другие-более старые — нет, соответственно — поскольку процессор должен поддерживать ВСЕ инструкции, которые были когда либо заложены в архитектуру — нужен какой то дешифратор, который определяет — с какой шиной и регистрами будет работать процессор — если надо — переключает — на это все доп время и энергия тратится
                                          • +1
                                            Intel когда-нибудь собирается отказаться от поддержки старых архитектур для увеличения производительности?
                                            • 0
                                              спросить у интела надо), но вряд ли — вы представляете — сколько софта написано за годы существования процессоров? как от этого всего отказаться
                                              • +2
                                                Была такая попытка чуть более 10-ти лет назад, и звали ее Itanium. Но боссы в AMD поняли, что если Itanium взлетит, то они обанкротятся, потому выпустили костыль под названием AMD64. А дальше как всегда.
                                                • 0
                                                  Itanium — принципиально другая архитектура. Тут речь скорее про отказ от 8-ми битных и 16-ти битных регистров и пары команд, нужных только в DOS.
                                                  • +2
                                                    В том и дело, что она принципиаолно другая, а не порсто выкинуты пару старых команд.
                                                  • +2
                                                    Intel менее всего выгодно банкротство AMD. Их же антимонопольщики съедят. Посмотрите структуру владельцев, сильно удивитесь. Как только AMD испытывает серьёзные трудности – сразу же получает заметные инвестиции.
                                                    • +1
                                                      Дело не в том, что Интелу выгодно делать с AMD, а то, что AMD пошла по легкому пути и нагородила костылей, зарубив на носу идею Интела выкинуть всю костыляндию и сделать современную архитектуру с нуля. Но это дороже — софт переписывать, совместимость там всякая… Или у AMD оказалась кишка тонка, или они специально каку сделали чтобы по быстрому бабла срубить и обломать главного конкурента.
                                                      • +4
                                                        Если бы эта «современная архитектура» действительно работала-бы быстрее, но ничего с этим сделать бы AMD не смогла. Но она не работала быстрее: в большинстве задач она просто-напросто работала медленнее, а там, где она могла разогнаться (всякого рода математика) она оказалась гораздо медленнее видеокарт. И тогда зачем весь этот огород?
                                                        • +1
                                                          Это вы про итаниум которые потреблял так, что AMD устали снимать смешную рекламу про них? У итаниума не было будущего за пределами серверов.
                                                          • 0
                                                            Извините, вы работали с Itanium.
                                                            я пробывал сравнить сервер с 8 itanium на hpux 11.24, сервер на parisc тоже hpux на тот момент ему было около 10 лет, sun fire 240 sunos 5.8, и помоему 585 пролиант на 4 оптеронах RHEL.
                                                            Простым gzip видео > /dev/null
                                                            gzip не распаралеливается, то есть сравнивал производительность 1 ядра.
                                                            Отстающими оказались parisc и itanium.
                                                      • +3
                                                        arm же шагает по планете и ничего, достаточно уверенно набирает обороты. большую часть этого старого софта можно было и 10 лет назад выкинуть.
                                                        • 0
                                                          ARM-ы только немного выигрывают по энергопотреблению по сравнению с x86 процессорами но по производительности пока еще не конкуренты совершенно, да и в будущем тоже врядли ситуация изменится. Архитектура другая, заточенная под более узкие задачи — низкое потребление, воспроизведение HD-видео и т.д. а как процессоры общего назначения они не привлекательны в основном из-за низкой производительности.
                                                          • 0
                                                            А я совсем не про это, к арм хейтерам не отношусь. просто архитектура достаточно недавно и сильно шагнула вперёд по части софта. так что проблема не в нём. переписывание софта даже привнесёт некоторое оздоровление на рынок.
                                                            • –1
                                                              Нет, проблема именно в нем. На АРМ-ах удобно делать узкоспециализированные устройства, десктоп они заменить смогут разве что в тонких клиентах. Если сделать АРМ по вычислительной мощности равный x86 процессору то возникнет закономерный вопрос — а нафига нам еще одна сущность?
                                                • +2
                                                  Какая еще львиная доля? Если вы видите какие-то существенные изъяны в x86, то это как бы не «поддержка», а и есть сама архитектура. От всяких старых команд вред разве что в том. что они занимают короткие коды. Но это мелочь.
                                                • +7
                                                  Замечу, что за один такт 3ГГц процессора электромагнитная волна преодолевает 10 см, что сопоставимо с размером процессора.
                                                  • +1
                                                    Ну это все-таки еще довольно много, так как в процессоре существует кэш.
                                                    В будущем наверное вся ОЗУ будет размещаться прямо в процессоре.

                                                    Интересно, какая максимальная теоретическая частота возможна (или хотя бы ее предел), если предположить, что вся память находится на процессоре, если исходить из ограничений по скорости света?
                                                    • +7
                                                      это далеко не единственный фактор — есть еще емкости, индуктивности, согласование нагрузок, отражения, перекрестные помехи, туннельный эффект…
                                                    • +3
                                                      Это сопоставимо (хотя и в несколько раз больше) с размером корпуса процессора, который в свою очередь в несколько раз больше кремниевого ядра, а все процессы, происходящие с трёхгигагерцевой частотой, происходят именно в нём.
                                                    • +2
                                                      Волна преодолевает, но основной ограничитель — время заряда паразитных емкостей.
                                                    • 0
                                                      Что-то я не совсем понял аналогию со строительством стен и перекрытий, а что мешает рабочим, которые строят стены перейти в другой дом и начать строить стены там(после завершения постройки стен в первом доме)?
                                                      • +6
                                                        ничто не мешает, но этаж в итоге быстрее не построится, то есть время исполнения одной инструкции от этого не уменьшится — следующий этап невозможно начать, пока не получен результат предыдущего
                                                        • +9
                                                          Ничего не мешает. Вы изобрели/описали hyper threading
                                                          • +2
                                                            Пока будешь идти от дома к дому у тебя как раз этаж построят.
                                                          • +2
                                                            Неправильно проводимый разгон опасен не только для ваших процессоров, но и для вас лично!

                                                            Общество жаждет историй :D
                                                            • 0
                                                              Недавно была история про хаккера, который нашёл метод разогнать свой кардиостимулятор.
                                                              • +10
                                                                Даже фильм сняли, бегает мужик в себя током бьет и только здоровее становится.

                                                            • +2
                                                              Ещё один вопрос, который напрашивался после прочтения статьи: получается, из-за почти полной обратной совместимости в x86-процессорах, невозможно сильно укоротить самые длинные стадии в инструкциях? И именно в это всё и упирается?
                                                              И именно из-за этого любители ARM так хотят «похоронить» x86?
                                                              Но похоронить его не получится, т.к. слишком много хорошего софта уже написано и переписывать его никто не будет?
                                                              • –4
                                                                Много проприетарного хорошего софта уже написано. С появлением ARM на серверах, а там везде Open Source, когда можно будет скомпилировать софт под любую архитектуру, а приложения уйдут в Web, Intel придется что-то делать со всем тем багажом костылей ее архитектуры. Кроме того, там все здорово параллелится и количество ядер добавляет производительность практически пропорционально.
                                                                • +2
                                                                  А компилятор с хорошей оптимизацией под ARM64 сам материализуется? gcc и clang до сих не поддерживают интринзики под ARMv6, хотя архитектуре уже больше пяти лет. Пока их допилят генерировать качественный код под ARM64, может и мода на облака уйти.
                                                                  • 0
                                                                    ARM64 появился две недели назад в конечных устройствах все-лишь. Кроме того, несмотря на отсутствие интринзиков, как-то ведь появляются игры на iPhone/Android. Что же касается серверного софта, там на FPU/SIMD нагрузки вообще очень мало.
                                                                    • +1
                                                                      Разработчики серверного софта (тем более опен сорсного) не готовы на такие жертвы ради производительности, на которые идут разработчики игр. Дело не в FPU/SIMD (ARMv6 интринзики это вообще про целочисленную арифметику), а про то, что компиляторы под ARM64 генерируют говнокод, и их ещё предстоит много лет вылизывать, прежде чем они сравняются по качеству кодогенерации с x86.
                                                                      • –4
                                                                        Вы хотите сказать Apple выпустила iPhone5S с совсем сырым компилятором? И кто такие эти разработчики серверного софта? Разработчики серверного софта это разработчики Java, Ruby, Python, PHP, а там все уже давно заточено и отшлифовано весьма. Вот в новом JBoss AS 8, который будет называться Wildfly и выйдет в этом году специально было проведено много работы с учетом особенностей других архитектур.
                                                                        Представьте себе серверную стойку, и ещё представьте себе юнит. Обчный такой юнит, но размером с iPhone 4 и как в рекламе Эльрадо, 4 ядра 4 гига. $200-$300; цена(и это поначалу, потом подтянутся китайцы и спустят до сотки). Производительность на Ватт/Цену/Объем такая, что Интел впору бы было посыпать голову пеплом и скупать какой-нибудь Broadcom или TI уже сейчас. Кроме того там нечего администрировать, потому что устройства поставляются с чем-то типа готоваой прошивки => больше производительность труда админов => ещё меньше совокупная стоимость владения.
                                                                        Такие дела. Будущее здесь.
                                                                        • +2
                                                                          Кроме того там нечего администрировать,
                                                                          На сервере-то? рофл
                                                                          • –3
                                                                            Будет совсем другой workflow, написал же. Кто-то и Android любит поадминистрировать.
                                                                          • +3
                                                                            Любители разбрасываться производительностью на Ватт, покажите мне хоть один пруф в пользу любого Arm. Пока я вижу только маркетинговый обман, и все бенчмарки говорят обратное.
                                                                            По бенчмаркам даже Intel Atom (Z2760) энергоэффективнее Tegra 3 либо на уровне Cortex A15 — www.anandtech.com/show/6536/arm-vs-x86-the-real-showdown/8. И при этом Intel в этом сравнении быстрее.
                                                                            Ну чтобы по скорости догнать Haswell i7, ARM должен быть раз в 5-10 быстрее.

                                                                            Ну и хотелось бы посмотреть на сервер с хотя бы минимально необходимым SSD 256Gb за $300, и главное зачем он нужен на ARM, если есть тот же hetzner на Haswell с SSD за 48 евро (без VAT), которые быстрее любого арма раз в 10.
                                                                            • +2
                                                                              Ок, хватит этого буллшита, где сравнивают Chrome на Android на ретине и WinRT на Эксплорере. Сейчас готовлю серию бенчей на серверных задачах. Внезапно. Cortex-A9 против Sandy Bridge. По первым данным по Ruby and Rails, там даже при таком раскладе у Intel есть серьезные затруднения в плане производительности/ватт и производительности на доллар. Но подождите, будет классная статья, обещаю. Если народу понравится, то потом будет Java, по которой я данные примерно представляю, может Python, обязательно NoSQL.
                                                                              • 0
                                                                                Но подождите, будет классная статья, обещаю.

                                                                                Когда статья? :)
                                                                    • +2
                                                                      Мечты, но такого не будет. Хотя бы потому что вы замучаетесь делать из под Web что то похожее на тяжелые редакторы (Photoshop, CorelDraw) или игрушки онлайн. Плюс не у каждого жителя планеты есть доступ хотя-бы к 512\64 КБит интернету. Поэтому в вебе будет очень ограниченное число приложений ближайшие лет 5.
                                                                      • –6
                                                                        Apple и Google с вами не согласны. iCloud и Google Docs тому пример. Я уже кстати полностью отказался от десктопных офисов. А интернет он быстрый, поверьте, у многих.
                                                                        • +2
                                                                          «у многих» != «у всех»
                                                                          У нас в стране даже ADSL не во все деревни провели.
                                                                          • –5
                                                                            Это вопросы к премьеру и президенту, что там по программе преодоления цифрового неравенства, возможно она там же где и доступное и комфортное жилье. А интернет, он быстрый period
                                                                    • +1
                                                                      Не стоит напрямую связывать обратную совместимость и возможность работать над длиной стадии. Однако действительно: отказ от совместимости позволяет работать над проблемой более эффективно.

                                                                      Идеальная машина — это та, в которой единственные связи между инструкциями — это связи по данным (т.е. одни инструкции используют результаты работы других). Задача разработчиков архитектуры — постоянно приближаться к этому идеалу, устраняя все другие (кажущиеся искусственными) зависимости. Не думаю, что ARM сейчас ближе к этому идеалу, чем x86.

                                                                      Зачем любители ARM хотят «похоронить» x86 (а они действительно хотят?), я не знаю. Я за разнообразие архитектур. Без конкуренции ничего хорошего не получается :)

                                                                      И еще я бы не сказал, что единственная причина, по которой x86 жива, — это большое количество написанных программ. Все-таки, на сегодняшний день, это самая эффективная архитектура, которая все еще продолжает развиваться.
                                                                      • +2
                                                                        Все эти ложные связи и прочее — это бантики. Разница между тем, что можно выжать из x86 когда и какого-нибудь «идельного кода» — где-то в 1.5-2 раза, не больше, дальше уже начинаются реальные зависимости между данными, которые никуда не спрятать.
                                                                      • +9
                                                                        Какое имеет отношение x86 инструкции к «самым длинным стадиям»? Современные x86 процессоры (за редким исключением типа Quark) не исполняют x86 код, они исполняют μopsы. Вся совместимость влияет только на декодер, который не является узким местом ни разу.
                                                                        • +4
                                                                          Большое спасибо за комментарий. Примерно ради такого ответа и писал вопрос.
                                                                        • +1
                                                                          нет не поэтому. старые инструкции не причем, в основном ограничителем является АЛУ — а именно время прохождения сигнала от его входа к выходу. Элементарная операция сложения двух чисел — сигнал логических состояний операндов на входе проходит несколько уровней логических вентилей прежде чем попадет на выход, из этого складывается минимальное время стадии. Впрочем, есть наверняка команды и потяжелее. Сами вентили из которых стоят логические блоки вполне способны работать на частотах до 20-30ГГц, но сложность самих логических блоков сильно увеличивает время прохождения сигнала от входа к выходу.
                                                                          Единственный способ сократить это время — упрощение структуры логических блоков в ущерб универсальности — что-то подобное и делают в ARM-ах.
                                                                          Проблема ARM-ов в том что они более узкоспециализированные вычислители чем процессоры широкого применения x86 за счет чего ARM-ы в планшетах и телефонах потребляют меньше энергии, но соотношение количества работы к затраченной энергии по сравнению с x86 или даже x64 на общих задачах отличается ненамного.
                                                                        • +2
                                                                          Жаль Itanuim угробили…
                                                                          • –1
                                                                            Итаник не может утонуть. Итаник не может утонуть. Итаник не тонет. Итаник не тонет. Итаник не утонул. Итаник не утонул.

                                                                            Представитель intel может это подтвердить.
                                                                            • +4
                                                                              Тоже немного по нему ностальгирую. Технически он еще жив, т.к. все еще есть клиенты, которые его покупают. Но уже не развивается.

                                                                              Itanium отлично показал себя на некоторых классах задач, но на некоторых оказался средненьким. В общем, не потянул на general purpose архитектуру.

                                                                              Однако на нем были обкатаны некоторые интересные фишки (двоичная трансляция, например). Многие из этих фишек, подозреваю, получат новые воплощения, но уже с учетом полученных уроков.
                                                                              • +3
                                                                                Не жаль. На HP-UX-ia64 11i-v3 образца 2009 года (уже вполне развитый и матёрый релиз) самая популярная машинная инструкция в /bin:/usr/bin всё ещё была nop. Itanium не угробили, он сам не взлетел.
                                                                              • –3
                                                                                Странно слышать про микроархитектурные проблемы роста частоты. Особенно с учетом оверклокерских достижений.

                                                                                Самая большая проблема — TDP и токи утечек. Чем меньше транзистор, тем тоньше прослойка диэлектрика, соответственно повышается шанс паразитных утечек, которые и повышают нагрев кристалла.

                                                                                Длина конвейера у последних P4 была равна 31 стадиям, и максимальные частоты были в районе 3.8 GHz. Новая архитектура Haswell имеет 14-19 стадий конвейера, а тактовые частоты находятся все в том же районе, и легко подымаются выше. Длина конвейера архитектуры Piledriver составляет те же 14-17 стадий и тот же уровень частот, может чуть выше.
                                                                                  • –1
                                                                                    Вы о чем?
                                                                                    • +2
                                                                                      Он хотел сказать, что вы даже не прочитали статью, или прочитали ее невнимательно, но уже написали критический комментарий, полагая, что знаете эту проблему лучше, чем специалисты Intel.

                                                                                      В статье довольно понятно написано, почему оверклокерские достижения не могут стать массовыми. На всякий случай повторю: среднестатистический пользователь не может использовать те системы охлаждения, которые используются оверклокерами.
                                                                                      • +6
                                                                                        Как человек, который наблюдает за развитием микропроцессоров и их архитектур на протяжении последних 15 лет, я повидал достаточно маркетинговых заманух (Pentium ускоряет интернет) и различных решений как на уровне архитектур, так и на уровне физических реализаций.

                                                                                        Так вот, я скептически отношусь к заявлениям, которые маркетинговые по сути.

                                                                                        Давайте разберем главный тезис, что основной тормоз — конвейер. Да, выполнение некоторых инструкций требует занятости ФУ на разное количество тактов. Однако P4 имел 2ALU, которые работали на удвоенной частоте и могли обрабатывать инструкции за половину такта. Мало того, P4 имел избыточное количество ALU для его трехМОПного планировщика, т.е. 4, что позволяло освобождать дополнительный ресурс уже на следующий такт. О чем это говорит? О том, что вполне можно ускорять отдельные блоки по частоте, если вы хотите добиться какой-то цели.

                                                                                        Идем дальше. HyperThreading появился потому, что половина ресурсов ЦП не может быть эффективно утилизирована из-за проблем с доставкой данных из памяти, потому что латентность этих операций идет более 70 тактов (если данные не осели в кэше). Да, HT дает до 40% прироста производительности на двух параллельно выполняемых потоках, что снова же подтверждает факт простоя ФУ.

                                                                                        Смотрим на подход AMD с их модульной архитектурой, где модуль состоит из двух половинок с 2 ALU на борту (напомним, что в том же Core три ALU), утилизация ресурсов на оптимизированных алгоритмах весьма впечатляющая, и как минимум не уступает архитектуре Core второго поколения.

                                                                                        Суммируя хотя бы эти три факта мы получаем простой вывод, что рост частоты бесполезен ровно до тех пор, пока ФУ не будут загружаться постоянно и своевременно. Конвейер всегда можно расширить или применять тактику удвоения частоты работы ФУ, только бы патроны подавались вовремя.

                                                                                        Но, за увеличением количества ФУ стоит его величество ТДП. В спецификации по управлению питанием мы можем увидеть многофакторную систему удержания теплопакета в рамках допустимых значений. Там участвует и температура, и вольтаж, и частота отдельного ядра, и уровень загруженности…

                                                                                        Опять же, возьмем рендеринг 3D. Там применяются весьма впечатляющие оптимизации алгоритмов, поэтому они позволяют выжимать максимум из процессора и его архитектуры. Банально, не будем ходить далеко, сравним прирост частоты и прирост производительности i7-2600K при разгоне. Так вот, разгон с 3.4 до 4.45 (+30%) дает прирост производительности в районе 20%. Да, рост не линейный, но он есть. Погодите, в статье рассказывается, что конвейер не дает повышать частоту, но мы видим обратное, частота растет, и растет производительность. Да, не линейно, но рост есть. Упираемся в синхронизацию выполнения МОПов? А может все больше простаиваем по причине увеличения латентности доступа к памяти?

                                                                                        Но хабр такой хабр… Лучше ведь уличить кого-то в некомпетентности…
                                                                                        • 0
                                                                                          Так вот, разгон с 3.4 до 4.45 (+30%) дает прирост производительности в районе 20%. Да, рост не линейный, но он есть.
                                                                                          Вот этот факт уже интереснее, над ним можно думать (если он подтвердится, конечно же). Надо было написать его сразу, вместо абстрактных «оверклокерских достижений».
                                                                                          • 0
                                                                                            В смысле если подтвердится?
                                                                                            Исследование производительности на реальном софте реальными людьми. Изучайте сколько влезет.

                                                                                            Идем дальше.
                                                                                            Смотрим на латентность инструкции MOVNTI
                                                                                            Nehalem: ~270 тактов
                                                                                            Sandy Bridge: ~350
                                                                                            Ivy Bridge: ~340
                                                                                            Haswell: ~400

                                                                                            Ха, латентность растет, частота находится на одном и том же уровне для всех этих архитектур. Это говорит про то, что латентность этой команды всем пофиг, она незначительна и не вносит серьезного влияния в общую производительность. Но нам усердно рассказывают, что проблема в этих самых «дорогих» операциях…

                                                                                            Давайте посмотрим на ту же фичу, которая появилась в архитектуре Core, такая как Macro Fusion. Она нам говорит, что некоторые операции могут соединяться в одну, чтобы выполняться в ФУ за 1 такт. Это значит, что есть операции, которые выполняются за доли такта. Так есть еще порох в пороховницах…

                                                                                            И, напоследок, почти все современные процессоры имеют блоки изменения очередности выполнения команд, которые позволяют равномерно распределять нагрузку по ФУ, достигая их более высокого уровня загруженности. Это снова же говорит в пользу простоя блоков и снижения влияния «толстых» комманд на общую производительность.

                                                                                            Еще раз повторю, можно просто увеличить количество ALU или FPU, или разрезать ALU на несколько частей, чтобы отделить одни операции от других. Но этим никто не будет заниматься, потому что бюджет транзисторов не бесконечный.
                                                                                            • +1
                                                                                              Нее, такое исследование я читать не буду. Это же надо было придумать верстку, чтобы основной контент занимал только 25% ширины монитора, вытянувшись в длинную «сосиску» по вертикали…
                                                                                        • 0
                                                                                          Почему вы считаете, что специалисты(мы же про маркетологов говорим?) Интел имеют цель продать вам самый быстрый процессор?

                                                                                          Им достаточно продать вам процессор быстрее процессора конкурента.

                                                                                          > На всякий случай повторю: среднестатистический пользователь не может использовать те системы охлаждения, которые используются оверклокерами.

                                                                                          Это софистика, и внедрить её в массы и есть цель написания статьи. Да, средний пользователь 7 ГГц не получит, а 4.5 — вполне.
                                                                                          • 0
                                                                                            Два года назад я помог десяти людям понизить тактовую частоту процессора, благодаря чему их компьютеры перестали перезагружаться на «веселой ферме» при +37 на улице и +35 в комнате.

                                                                                            Сам я сейчас имею планы по понижению тактовой частоты моей видеокарты, надеясь хоть после этого суметь пройти Скайрим.

                                                                                            Я честно искал более мощные системы охлаждения, пригодные для эксплуатации неспециалистами. Я менял термопасту. Но не помогало ничего, кроме понижения частоты. А теперь вы мне рассказываете, что эту частоту можно, видите ли, поднять. В северных широтах — может и можно. Но не в моем городе.
                                                                                            • +1
                                                                                              То есть вы утверждаете, что «специалисты» Intel не способны подобрать частоту и гонят брак в промышленных масштабах?

                                                                                              У меня средний аптайм месяц на всех компах, перезагружаюсь только если софт требует или электричество выключают. Попробуйте нормальный блок питания купить, например. И память.
                                                                                              • 0
                                                                                                В таком случае я завидую климату дефолт-сити.
                                                                                                • 0
                                                                                                  Эффект Даннинга — Крюгера?

                                                                                                  > Процессоры рассчитаны производителем на то, чтобы эксплуатироваться в широком диапазоне внешних условий (которые влияют на длину стадии), поэтому производятся с некоторым запасом по частоте.
                                                                                                  • +2
                                                                                                    Специально для вас посмотрел, что пишут специалисты: www.intel.ru/content/dam/www/public/us/en/documents/design-guides/4th-gen-core-family-desktop-tmsdg.pdf

                                                                                                    3.1 Boundary Condition Definition

                                                                                                    TEXTERNAL = 35 °C. This is typical of a maximum system operating environment or room temperature

                                                                                                    То есть в описанной мною ситуации процессоры работали на пределе заложенных температурных возможностей. Добавим сюда любую мелкую помеху системе охлаждения — вот и перегрев. Напомню, компьютер эксплуатируется неспециалистами, которые всегда найдут способ чем-нибудь перекрыть поток воздуха. А не найдут люди — так кот поможет.
                                                                                                    • 0
                                                                                                      Специально для вас посмотрел, что пишут специалисты

                                                                                                      The results may be excessive noise from fans having to operate at a speed higher than intended. In the worst case this can lead to performance loss with excessive activation of the Thermal Control Circuit (TCC).

                                                                                                      Перезагрузка — это брак.

                                                                                                      > А не найдут люди — так кот поможет.

                                                                                                      вы до скольки занижаете частоту, чтоб от кота защититься? От пролитого чая?
                                                                                                      • 0
                                                                                                        Перезагрузка — это брак.
                                                                                                        Это — распространенная «фича» безымянных материнок. При стандартных настройках пороговая температура для аварийной перезагрузки зачастую ниже температуры активации TCC процессора.
                                                                                                        • 0
                                                                                                          Т.е. вы мне ссылку на дизайн-гайд интела даёте, чтобы доказать, что безымянные материнки покупать не стоит?
                                                                                                          • 0
                                                                                                            Нет, чтобы объяснить, почему средний пользователь не сможет разогнать процессор до 4.5 ГГц.
                                                                                                            • –1
                                                                                                              Тогда вам надо показать в каком месте материнка отличает проц на 3.5 от 4.5
                                                                                              • +2
                                                                                                Вы ищете системы охлаждения. А возможно, проблема кроется в плохом корпусе. Вот мой (картинка устарела — с тех пор добавилась вторая видеокарта, да и плашек памяти стало четыре). На процессоре заводская водянка, никаких сложностей, ставится даже проще суперкулеров. Напротив видеокарт 200мм вертушка поставляет свежий воздух, еще одна спереди, и несколько 120мм пропеллеров сверху и сзади. Паутина проводов не мешает воздушному потоку (типичная ошибка).

                                                                                                Видеокарты и процессор слегка (где-то на треть) разогнаны. Процессор, 3770к, до тех самых 4,5ггц (у меня неудачный чип, он для этого требует целых 1,3в).
                                                                                                В самую лютую жару никаких проблем с перегревом не испытываю. Я даже не про полный ахтунг вида «троттлинг, ребут в веселой ферме», а про «не более 80 градусов на процессоре под линпаком и 90 градусов на видеокартах под бубликом».

                                                                                                Мораль — не надо экономить на охлаждении, тогда не придется заниматься даунклокингом.
                                                                                                • 0
                                                                                                  А что за «заводская» водянка?
                                                                                                  • 0
                                                                                                    H100. Выхлоп сразу наружу корпуса (но крепится радиатор внутри корпуса, лишнего места не занимая, на фотографии как раз под ним вплотную 2х120мм привинчены). Конечно, по эффективности это не Silver Arrow, но уступает мало, и есть масса своих преимуществ.
                                                                                                  • 0
                                                                                                    я на своем компе дело поправил, сделав притяжно-вытяжную систему внутри корпуса — что толку ставить суперкуллер, если горячий воздух никуда из корпуса не выходит — лучше поставить 2 куллера на маленьких оборотах — один вдувает, другой выдувает воздух из корпуса
                                                                                                    • 0
                                                                                                      По поводу предмета спора: средний пользователь не будет ставить себе систему водяного охлаждения.

                                                                                                      По поводу моих проблем и вашего корпуса: я рад, что в дефолт-сити достать нормальный корпус с заводской системой водяного охлаждения — не проблема, но в Челябинске систем водяного охлаждения нет вообще. По крайней мере, ни мои знакомые специалисты, ни папины знакомые специалисты, ни дедушкины знакомые специалисты, ни даже бабушкины знакомые специалисты не смогли подсказать мне нужного магазина.
                                                                                                      • 0
                                                                                                        достать нормальный корпус с заводской системой водяного охлаждения

                                                                                                        Корпус отдельно, вода отдельно.
                                                                                                        средний пользователь не будет ставить себе систему водяного охлаждения.

                                                                                                        А почему бы и нет?
                                                                                                        Есть и воздушные кулеры с хорошей эффективностью. Что угодно лучше боксового кулера.
                                                                                                        в Челябинске систем водяного охлаждения нет вообще

                                                                                                        Сходу, за 10 секунд поиска:
                                                                                                        chel.utinet.ru/hardware/liquid_cooling/zalman/cnps20lq/
                                                                                                        Внизу ссылки на множество заводских водянок других брендов.

                                                                                                        Да и почему именно Челябинск, когда есть Ebay и Amazon? Я половину железа там беру.
                                                                                                        • 0
                                                                                                          Обратите внимание: все, что находится сходу — интернет-магазины. То есть мне предстоит увлекательная игра «оплати заказ — подожди месяц — получи товар — убедись, что он не помог, ибо слабый — отправь обратно с заявлением почтой России — подожди 3 месяца возврата денег — перейди к пункту 1». Плюс ненулевая вероятность на очередной итерации потерять деньги из-за особенностей работы почты россии.

                                                                                                          Конкретно по той ссылке, которую вы нашли — я так и не нашел, где указана хотя бы одна количественная характеристика эффективности охлаждения. Как вообще сравнивать эту систему охлаждения с аналогами?

                                                                                                          • –2
                                                                                                            все, что находится сходу — интернет-магазины. То есть мне предстоит увлекательная игра

                                                                                                            Доставка до пункта выдачи — бесплатно и без предоплаты. Домой — 443 рубля. Прямо по моей ссылке, найденной сходу.
                                                                                                            Как вообще сравнивать эту систему охлаждения с аналогами?

                                                                                                            Очевидно, что надо смотреть независимые обзоры. Любые количественные характеристики по отдельности или вместе не говорят вообще ни о чем. Первый попавшийся пример.

                                                                                                            Будто вы в XX-м веке застряли, причем в совковые времена :)
                                                                                                            • 0
                                                                                                              Я вот когда что-то беру в интернет-магазине сначала гуглю предлагаемую модель и смотрю характеристики на сайте производителя, если таковой есть а если нет — то уже на свой страх и риск, естественно в итоге побеждает самый подходящий товар который максимально описан производителем. Там же, на сайте производителя можно посмотреть соседние модели, сравнить выбрать и найти в другом магазине. Это значительно снижает риски «кота в мешке» и пока ни разу подход не подвёл.
                                                                                                              • 0
                                                                                                                Я тоже так делаю, но это имеет смысл только когда имеешь хотя бы минимальные представления о предметной области.
                                                                                                                • 0
                                                                                                                  Выше вы писали и про даунклокинг, и про:
                                                                                                                  Я честно искал более мощные системы охлаждения, пригодные для эксплуатации неспециалистами. Я менял термопасту. Но не помогало ничего, кроме понижения частоты.

                                                                                                                  Следовательно — вы имеете хотя бы минимальные представления о предметной области, и должны понимать, что описания площади радиаторов, силы воздушного потока, напряжений и оборотов вертушек, количества теплотрубок, массы, количестве хладагента, скорости его прокачки и так далее не позволяют судить об эффективности СО. Есть только одна цифра, которая важна: температура процессора с данной СО под нагрузкой, в сравнении с другими СО того же класса. Т.е. обзоры, которых полно.
                                                                                          • –4
                                                                                            возможность незначительно повысить частоту
                                                                                            Частоту можно повышать очень значительно, пока некоторые компании на «и» не начинают блокировать всеми силами эту возможность.
                                                                                            Core 2 и первое поколение i5/i7 — живой тому пример.
                                                                                            • +8
                                                                                              Странно, чего же некоторые компании на букву «А» не пользуются ситуацией и не захватывают рынок.
                                                                                              • 0
                                                                                                Некоторые компании на букву «А» не могут захватить рынок потому, что лет 5 не могут, к сожалению, достойный конкурента процессор выпустить и конкурируют только ценой.

                                                                                                Это внутренние проблемы «А», чем и пользуется компания на «И».
                                                                                                • 0
                                                                                                  Есть как минимум три компании на «A», которые могут захватить рынок — AMD, ARM и Apple.
                                                                                                  • +1
                                                                                                    Вы сейчас про рынок чего?

                                                                                                    Из них только одна имеет процессор сравнимый хотя бы Core i5, да и то при TDP зашкаливающим в 150 Вт. А что они могут противопоставить i7 4770?
                                                                                                    • 0
                                                                                                      Собственно не все из них делают x86 процессоры, поэтому определенные доли рынка захватить не выйдет чисто технически.
                                                                                                • –1
                                                                                                  Минусуют воинствующие фанаты интела?
                                                                                                • +2
                                                                                                  Какая-то спорная статья. Первое, что бросилось в глаза — x86 называют суперскалярной архитектурой. i486 был суперскалярным? Или не был x86?..

                                                                                                  Второе — как-то совершенно незаслуженно обойден вниманием тот факт, что раньше мы видели рост частоты процессоров при уменьшении техпроцессов. 3.8GHz когда появились? В 2004-2005 году, Pentium 4 Prescott, 65 нм. Сегодня, спустя 8 лет, техпроцесс уменьшен в 3 раза, а частоты возрасли… ой, а частоты не возрасли. Хотя автор пишет, цитирую:
                                                                                                  Тем не менее, производители микропроцессоров постоянно совершенствуют технологический процесс, и частота за счет этого постепенно ползет вверх.


                                                                                                  Автор, вы действительно являетесь экспертом в теме, о которой пишете?..
                                                                                                  • +2
                                                                                                    Автор действительно является экспертов теме, о которой пишет, а вы демонстрируете яркий пример эффекта Даннинга — Крюгера. То есть да, с суперскалярностью вы человека подловили — скорее всего этот момент изначально в статье был, но потом выпал (суперскалярность, как бы, имеет прямое отношение к производительности и весьма косвенное — к частоте работы процессора) и остался обычный конвеер известный где-то с 70х (а может и раньше). Prescott же — идельный процессор для демонстрации тезисов, описанных в статье: в нём была сделана попытка «задрать частоту до небес», в конвеере создали аж 32 стадии (из-за чего многие вещи пришлось исполнять спекулятивно), в результате получили офигительную частоту и «прекрасное» тепловыделение при посредственной производительноти. Для справки: Nehalem имеет ровно вдвое меньше стадий и на той же частоте, что и Prescott исполняет программы чуть не вдвое быстрее (это без учёта многоядерности и прочего).
                                                                                                    • +1
                                                                                                      Признайтесь, про эффект Даннинга-Крюгера вы подсмотрели чуть выше, в комментарии forgotten? :)

                                                                                                      И я не совсем понял, к чему вы вдались в разъяснения о низкой производительности Prescott-а (и о его производительности вообще). Я его упомянул только из-за того, что на нем была достигнута частота 3.8GHz. 8 лет назад. При техпроцессе 65 нм. И вот наступил 2014 год, техпроцесс уменьшен втрое, частоты не увеличились. И статья с названием «Почему не растет частота» не объясняет, почему. Хотя это один из самых интересных вопросов в данной предметной области, поверьте. Я однажды полез гуглить и залип часа на три. :)
                                                                                                      • 0
                                                                                                        Название эффекта я действительно взял из комментария выше, но про этот феномен все знают и так.

                                                                                                        Статья «Почему не растет частота» прекрасно объясняет почем частоты не увеличились. Вернее так: она даёт всё необходимое для того, чтобы понять почему частоты не увеличились (они, кстати, чуток таки увеличились — Turbo Bust, не забываем, да). Но для этого нужно, о ужас, сопоставить несколько фактов. Похоже хабражители это делать разучились.
                                                                                                        • +1
                                                                                                          Факты? Где факты? Что-то я не увидел в статье таблицы латентности операций и средней частоты их использования в софте (а такие факты однозначно есть в недрах компании Intel).
                                                                                                          • 0
                                                                                                            Таблицы (а они довольно большие для статьи) латентности операций есть в документации по архитектуре. Среднюю частоту использования тех или иных опкодов, вы, извините, и сами посчитать можете, причем даже специфичную для вашего софта, тем более, что «средняя температура по больнице» вряд ли будет представлять практический интерес.