войти зарегистрироваться

nVidia CUDANvidia открыла исходный код компилятора CUDA

Nvidia открыла исходный код нового компилятора CUDA на базе LLVM. Сорцы не раздаются направо и налево, а доступны только для «квалифицированных исследователей и разработчиков». Для их получения нужно зарегистрироваться, заполнить форму и указать, для каких проектов вы намерены применять компилятор. Так что пока непонятно, под какой лицензией опубликован компилятор и вообще — свободная ли это лицензия. В пресс-релизе компания намекает на более открытый доступ к исходникам в будущем.



С помощью компилятора и нового CUDA Toolkit 4.1 можно будет приспособить платформу GPGPU для других архитектур и процессоров, в том числе AMD GPU и x86 CPU, а также создавать гетерогенные суперкомпьютерные системы.

Высокая производительностьОпыт использования GPU для финансового моделирования

В этой статье я вкратце описываю свой опыт оптимизации одной задачи перебора, начиная от однопроцессорного алгоритма к многопроцессорному и к версии на OpenCL.



nVidia CUDAОбзор CUDA отладчика «NVIDIA Parallel Nsight 2.0» из песочницы

imageОтладка параллельного кода – процесс утомительный и умозатратный. Ошибки распараллеливания проблематично отловить из-за недетерминированности поведения параллельных приложений. Более того, если ошибка обнаружена, ее часто сложно воспроизвести снова. Бывает, что после изменения кода, сложно удостовериться, что ошибка устранена, а не замаскирована. Чаще всего, ошибки в параллельной программе являются гейзенбагами. Порой испытываешь острую потребность в максимально удобных и функциональных инструментах отладки параллельных программ.

АлгоритмыСкрипт для установки CUDA на Ubuntu 10.10 x86-64

Встретился с необходимостью настройки CUDA на UBUNTU 10.10, 64 разрядная система.
Для того, чтобы сэкономить некоторое время себе и тем, кому это тоже может понадобиться, выкладываю скрипт, который, скачивает и делает необходимые вещи для того, чтобы CUDA работала.

Скрипт:

Высокая производительностьV-Ray и Iray. Сравнение и обзор

Скорость рендеринга или качество результата? – вот в чем вопрос. Рано или поздно приходится выбирать второе, и длительность рендеринга начинает составлять часы, сутки, недели. Денег на рендер-ферму нет, поэтому приходится обходиться одним 6-ядерным процессором.
Но вдруг, компания Mental Images, являющаяся дочерней компанией NVIDIA Corporation, выпускает новую систему рендеринга Iray, которая позволит выполнять рендеринг на графической карте. Это поселило надежду на то, что с помощью многоядерных GPU можно будет существенно сократить время рендеринга.
Я решил сравнить качество и производительность V-ray, который использует только CPU, и Iray, который считает и на CPU и на GPU. Проверять стал на картах NVIDIA с поддержкой CUDA и процессоре Intel Core i7-980.

Работа с видеоCUDA в Adobe Premiere CS5: оправдано ли использование бюджетной видеокарты?

Adobe Premiere CS5 и CS5.5 позволяет использовать технологию nVidia CUDA для аппаратного ускорения просчета видеоэффектов. Однако официальный список совместимых видеокарт, обеспечивающих поддержку данной функциональности, довольно короток и ограничивается моделями верхнего ценового диапазона.

Наряду с этим, широко известен хак, позволяющий включить поддержку аппаратного ускорения на гораздо более дешевых решениях. Впрочем, «хаком» назвать этот финт можно с большой натяжкой — «взлом» Premiere сводится к вписыванию названия вашей видеокарты в текстовый файл, лежащий в корне программы. «Дырка» сделана настолько дружелюбной для пользователя, что вызывает непроизвольный вопрос, не специально ли она оставлена?

Под катом мои впечатления от работы в Adobe Premiere CS5 с видеокартой среднего ценового диапазона и некоторые эмпирические выводы.

Высокая производительностьOpenCL: универсальность и высокая производительность или не так все просто? из песочницы

На Хабре уже были статьи об OpenCL, CUDA и GPGPU со сравнениями производительности, базовыми понятиями и примерами, поэтому рассказывать об основах и принципах работы я тут не буду, даже код не покажу. Но я хочу описать в чем заключаются реальные трудности при использовании GPU (про ограничения и их последствия), почему нельзя сравнивать производительность CPU и GPU, а также про то насколько “универсален” OpenCL на самом деле.

Высокая производительностьИспользование GPGPU для сжатия данных (Часть I) из песочницы

Здравствуй, уважаемое хабра-сообщество.

Многие, наверное, уже слышали о вычислениях на GPGPU(видеокартах), на текущий момент существует много реализаций этой техники программирования. Мы остановимся на двух из них — это небезызвестная CUDA от компании Nvidia, и я думаю чуть менее популярный, но также известный фреймворк OpenCL. На хабре уже есть достаточное количество статей, в которых описан основной принцип работы этих технологий, поэтому мы не будем заострять на этом внимание. В статье я хочу поделиться результатами, полученными при использовании GPGPU в сравнении с CPU для сжатия данных.

АлгоритмыСверхбыстрая разметка изображений

В статье расскажу как можно очень быстро перечислить связные объекты на бинарном растре, значительно быстрее, чем я рассказывал в предыдущей статье. Казалось бы, куда такие скорости; теперь мы будем «расправляться» с картинками 4096 на 4096 за десятки миллисекунд. И хоть задача интересна и сама по себе, но в основе ее решения лежит довольно простой и оригинальный метод с достаточно широкой применимостью, основным тезисом которого является «сделаем как проще и посмотрим, что из этого выйдет». В данном случае в качестве основного вычислителя будет использоваться CUDA, но без особой специфики, потому что мы хотим сделать «очень просто».

Высокая производительностьПоддержка GPU в математическом пакете MATLAB

За последние год-полтора создание кластеров и суперкомпьютеров на GPU стало новым трендом для высокопроизводительных систем. Это вполне имеет смысл, потому что графические процессоры прекрасно поддерживают параллельную работу и на некоторых задачах обладают производительностью гораздо выше, чем у бюджетных CPU.

В этом смысле вполне логичной выглядит новость, что в пакете программ математического моделирования MATLAB версии 2010b появилась нативная поддержка Nvidia CUDA (версия Compute Capability 1.3 или выше). Она включена в набор инструментов Parallel Computing Toolbox. Теперь распараллеливание команд осуществляется прямо из MATLAB и не нужно переписывать код на C++ или Fortran специально для CUDA.