<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
<channel>
	<title>Хабрахабр:  Метки / cuda</title>
	<link>http://habrahabr.ru/rss/tag/cuda/</link>
	<description><![CDATA[]]></description>
	<language>ru</language>
	<managingEditor>editor@habrahabr.ru</managingEditor>
	<generator>habrahabr.ru</generator>
	<pubDate>Sat, 11 Feb 2012 00:37:38 GMT</pubDate>
	<lastBuildDate></lastBuildDate>
	<image>
		<link>http://habrahabr.ru/</link>
		<url>http://habrahabr.ru/i/logo.gif</url>
		<title>Хабрахабр</title>
	</image>
	
			
		<item>		
			<title><![CDATA[nVidia CUDA / Nvidia открыла исходный код компилятора CUDA]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/CUDA/134624/</guid>
			<link>http://habrahabr.ru/blogs/CUDA/134624/</link>			
			<description><![CDATA[Nvidia открыла исходный код нового компилятора CUDA на базе LLVM. Сорцы не раздаются направо и налево, а доступны только для «квалифицированных исследователей и разработчиков». Для их получения нужно зарегистрироваться, заполнить <a href="http://developer.nvidia.com/content/cuda-platform-source-release">форму</a> и указать, для каких проектов вы намерены применять компилятор. Так что пока непонятно, под какой лицензией опубликован компилятор и вообще — свободная ли это лицензия. В <a href="http://pressroom.nvidia.com/easyir/customrel.do?easyirid=A0D622CE9F579F09&amp;version=live&amp;releasejsp=release_157&amp;xhtml=true&amp;prid=831864">пресс-релизе</a> компания намекает на более открытый доступ к исходникам в будущем.<br/>
<br/>
<img src="http://habrastorage.org/storage1/2530dfda/3796a258/4731d3ae/ce0d3863.jpg"/><br/>
<br/>
С помощью компилятора и нового CUDA Toolkit 4.1 можно будет приспособить платформу GPGPU для других архитектур и процессоров, в том числе AMD GPU и x86 CPU, а также создавать гетерогенные суперкомпьютерные системы.]]></description>
			
			<pubDate>Wed, 14 Dec 2011 18:31:12 GMT</pubDate>
			<author>alizar</author>
			<category>Nvidia</category><category>CUDA</category><category>компилятор CUDA</category><category>GPGPU</category><category>LLVM</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Высокая производительность / Опыт использования GPU для финансового моделирования]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/hi/131983/</guid>
			<link>http://habrahabr.ru/blogs/hi/131983/</link>			
			<description><![CDATA[В этой статье я вкратце описываю свой опыт оптимизации одной задачи перебора, начиная от однопроцессорного алгоритма к многопроцессорному и к версии на OpenCL.<br/>
<br/>
<img src="http://habrastorage.org/storage1/44d5be54/295c3eb9/8a05fe22/75c77169.jpg"/><br/>
<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/hi/131983/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Mon, 07 Nov 2011 03:24:49 GMT</pubDate>
			<author>Malenkov</author>
			<category>gpgpu</category><category>cuda</category><category>opencl</category><category>csharp</category><category>оптимизация</category>
		</item>
		
		
		
		
		
		
		
		
	
		
			
		<item>		
			<title><![CDATA[nVidia CUDA / [Из песочницы] Обзор CUDA отладчика «NVIDIA Parallel Nsight 2.0»]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/CUDA/131882/</guid>
			<link>http://habrahabr.ru/blogs/CUDA/131882/</link>			
			<description><![CDATA[<img src="http://developer.nvidia.com/sites/default/files/imagecache/Blog_image/akamai/tools/images/NSight_lowres_logo_horz_primary.jpg" alt="image" hspace="10" vspace="10" align="left"/>Отладка параллельного кода – процесс утомительный и умозатратный. Ошибки распараллеливания проблематично отловить из-за недетерминированности поведения параллельных приложений. Более того, если ошибка обнаружена, ее часто сложно воспроизвести снова. Бывает, что после изменения кода, сложно удостовериться, что ошибка устранена, а не замаскирована. Чаще всего, ошибки в параллельной программе являются <a href="http://ru.wikipedia.org/wiki/%D0%93%D0%B5%D0%B9%D0%B7%D0%B5%D0%BD%D0%B1%D0%B0%D0%B3">гейзенбагами</a>. Порой испытываешь острую потребность в максимально удобных и функциональных инструментах отладки параллельных программ.<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/CUDA/131882/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Fri, 04 Nov 2011 00:09:27 GMT</pubDate>
			<author>snk</author>
			<category>cuda</category><category>parallel programming</category><category>nvida</category><category>nvidia parallel nsight</category><category>отладка</category><category>debug</category>
		</item>
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Алгоритмы / Скрипт для установки CUDA на Ubuntu 10.10 x86-64]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/algorithm/130849/</guid>
			<link>http://habrahabr.ru/blogs/algorithm/130849/</link>			
			<description><![CDATA[Встретился с необходимостью настройки CUDA на UBUNTU 10.10, 64 разрядная система.<br/>
Для того, чтобы сэкономить некоторое время себе и тем, кому это тоже может понадобиться, выкладываю скрипт, который, скачивает и делает необходимые вещи для того, чтобы CUDA работала.<br/>
<br/>
Скрипт:<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/algorithm/130849/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Thu, 20 Oct 2011 13:38:32 GMT</pubDate>
			<author>skobeltsyn</author>
			<category>CUDA</category><category>Ubuntu 10.10</category><category>скрипт</category><category>настройка</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Высокая производительность / V-Ray и Iray. Сравнение и обзор]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/hi/130378/</guid>
			<link>http://habrahabr.ru/blogs/hi/130378/</link>			
			<description><![CDATA[Скорость рендеринга или качество результата? – вот в чем вопрос. Рано или поздно приходится выбирать второе, и длительность рендеринга начинает составлять часы, сутки, недели. Денег на рендер-ферму нет, поэтому приходится обходиться одним 6-ядерным процессором.<br/>
Но вдруг, компания Mental Images, являющаяся дочерней компанией NVIDIA Corporation, выпускает новую систему рендеринга Iray, которая позволит выполнять рендеринг на графической карте. Это поселило надежду на то, что с помощью многоядерных GPU можно будет существенно сократить время рендеринга.<br/>
Я решил сравнить качество и производительность V-ray, который использует только CPU, и Iray, который считает и на CPU и на GPU. Проверять стал на картах NVIDIA с поддержкой CUDA и процессоре Intel Core i7-980.<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/hi/130378/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Fri, 14 Oct 2011 08:45:27 GMT</pubDate>
			<author>Usikoff</author>
			<category>iray</category><category>mental ray</category><category>v-ray</category><category>рендеринг</category><category>CUDA</category><category>GPGPU</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Работа с видео / CUDA в Adobe Premiere CS5: оправдано ли использование бюджетной видеокарты?]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/video/128751/</guid>
			<link>http://habrahabr.ru/blogs/video/128751/</link>			
			<description><![CDATA[Adobe Premiere CS5 и CS5.5 <img src="http://habrastorage.org/storage1/b1f8ff1c/6047aa6d/516d74df/b9f78ecf.jpg" align="right" title="штаб студии Lookaround, рабочее место автора, август 2011 :)"/> позволяет использовать технологию nVidia CUDA для аппаратного ускорения просчета видеоэффектов. Однако <a href="http://www.adobe.com/products/premiere/tech-specs.html">официальный список</a> совместимых видеокарт, обеспечивающих поддержку данной функциональности, довольно короток и ограничивается моделями верхнего ценового диапазона. <br/>
<br/>
Наряду с этим, широко известен хак, позволяющий <a href="http://nvworld.ru/faq/premiere-hardware-cuda-acceleration/">включить поддержку аппаратного ускорения</a> на гораздо более дешевых решениях. Впрочем, «хаком» назвать этот финт можно с большой натяжкой — «взлом» Premiere сводится к вписыванию названия вашей видеокарты в текстовый файл, лежащий в корне программы. «Дырка» сделана настолько дружелюбной для пользователя, что вызывает непроизвольный вопрос, не специально ли она оставлена? <br/>
<br/>
Под катом мои впечатления от работы в Adobe Premiere CS5 с видеокартой среднего ценового диапазона и некоторые эмпирические выводы.<br/>
<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/video/128751/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Mon, 19 Sep 2011 17:12:15 GMT</pubDate>
			<author>andrushkaaaa</author>
			<category>cuda</category><category>adobe premiere</category><category>видеокарта</category>
		</item>
		
		
		
		
		
		
		
		
	
		
			
		<item>		
			<title><![CDATA[Высокая производительность / [Из песочницы] OpenCL: универсальность и высокая производительность или не так все просто?]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/hi/125398/</guid>
			<link>http://habrahabr.ru/blogs/hi/125398/</link>			
			<description><![CDATA[На Хабре уже были статьи об OpenCL, CUDA и GPGPU со сравнениями производительности, базовыми понятиями и примерами, поэтому рассказывать об основах и принципах работы я тут не буду, даже код не покажу. Но я хочу описать в чем заключаются реальные трудности при использовании GPU (про ограничения и их последствия), почему нельзя сравнивать производительность CPU и GPU, а также про то насколько “универсален” OpenCL на самом деле. <br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/hi/125398/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Mon, 01 Aug 2011 16:48:49 GMT</pubDate>
			<author>Akson87</author>
			<category>opencl</category><category>gpu</category><category>gpgpu</category><category>high performance</category><category>cuda</category><category>gpu architecture</category><category>optimization</category>
		</item>
		
		
		
		
		
		
		
	
		
			
		<item>		
			<title><![CDATA[Высокая производительность / [Из песочницы] Использование GPGPU для сжатия данных (Часть I)]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/hi/124210/</guid>
			<link>http://habrahabr.ru/blogs/hi/124210/</link>			
			<description><![CDATA[Здравствуй, уважаемое хабра-сообщество.<br/>
<br/>
Многие, наверное, уже слышали о вычислениях на <a href="http://ru.wikipedia.org/wiki/GPGPU">GPGPU</a>(видеокартах), на текущий момент существует много реализаций этой техники программирования. Мы остановимся на двух из них — это небезызвестная <a href="http://habrahabr.ru/blogs/CUDA/54707/">CUDA</a> от компании Nvidia, и я думаю чуть менее популярный, но также известный фреймворк <a href="http://habrahabr.ru/blogs/hi/72650/">OpenCL</a>. На хабре уже есть достаточное количество статей, в которых описан основной принцип работы этих технологий, поэтому мы не будем заострять на этом внимание. В статье я хочу поделиться результатами, полученными при использовании GPGPU в сравнении с CPU для сжатия данных.<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/hi/124210/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Fri, 15 Jul 2011 11:50:39 GMT</pubDate>
			<author>VVS0205</author>
			<category>opencl</category><category>cuda</category><category>gpgpu</category><category>сжатие данных</category>
		</item>
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Алгоритмы / Сверхбыстрая разметка изображений]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/algorithm/120330/</guid>
			<link>http://habrahabr.ru/blogs/algorithm/120330/</link>			
			<description><![CDATA[<img align="right" src="http://habrastorage.org/storage/a3ee55a3/47372285/3ecb760a/e9b63a6d.png"/>В статье расскажу как можно очень быстро перечислить связные объекты на бинарном растре, значительно быстрее, чем я рассказывал в <a href="http://habrahabr.ru/blogs/image_processing/119461/">предыдущей статье</a>. Казалось бы, куда такие скорости; теперь мы будем «расправляться» с картинками 4096 на 4096 за десятки миллисекунд. И хоть задача интересна и сама по себе, но в основе ее решения лежит довольно простой и оригинальный метод с достаточно широкой применимостью, основным тезисом которого является «сделаем как проще и посмотрим, что из этого выйдет». В данном случае в качестве основного вычислителя будет использоваться CUDA, но без особой специфики, потому что мы хотим сделать «очень просто». <br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/algorithm/120330/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Tue, 31 May 2011 16:01:31 GMT</pubDate>
			<author>sic</author>
			<category>бинарные изображения</category><category>маркировка изображений</category><category>CUDA</category><category>разделение задачи</category><category>упрощение подхода</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Высокая производительность / Поддержка GPU в математическом пакете MATLAB]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/hi/119892/</guid>
			<link>http://habrahabr.ru/blogs/hi/119892/</link>			
			<description><![CDATA[За последние год-полтора создание кластеров и суперкомпьютеров на GPU стало новым трендом для высокопроизводительных систем. Это вполне имеет смысл, потому что графические процессоры прекрасно поддерживают параллельную работу и на некоторых задачах обладают производительностью гораздо выше, чем у бюджетных CPU.<br/>
<br/>
В этом смысле вполне логичной выглядит новость, что в пакете программ математического моделирования MATLAB версии 2010b появилась <a href="http://www.mathworks.com/discovery/matlab-gpu.html">нативная поддержка Nvidia CUDA</a> (версия Compute Capability 1.3 или выше). Она включена в набор инструментов <a href="http://www.mathworks.com/products/parallel-computing/">Parallel Computing Toolbox</a>. Теперь распараллеливание команд осуществляется прямо из MATLAB и не нужно переписывать код на C++ или Fortran специально для CUDA.<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/hi/119892/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Tue, 24 May 2011 14:23:15 GMT</pubDate>
			<author>alizar</author>
			<category>CUDA</category><category>Matlab</category><category>GPU</category><category>параллельные вычисления</category><category>параллелизм</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Высокая производительность / CUDA: аспекты производительности при решении типичных задач]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/hi/119435/</guid>
			<link>http://habrahabr.ru/blogs/hi/119435/</link>			
			<description><![CDATA[<img align="right" src="http://dl.dropbox.com/u/243445/cuda/nv_cuda.jpg"/>Перед тем как начать переносить реализацию вычислительного алгоритма на видеокарту стоит задуматься — получим ли мы желаемый прирост производительности или только потеряем время. И несмотря на обещания производителей о сотнях GFLOPS, у современного поколения карт есть свои проблемы, о которых лучше знать заранее. Я не буду глубоко уходить в теорию и рассмотрю несколько существенных практических моментов и сформулирую некоторые полезные выводы.<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/hi/119435/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Tue, 17 May 2011 11:38:42 GMT</pubDate>
			<author>sic</author>
			<category>высокопроизводительные вычисления</category><category>видеокарты</category><category>CUDA</category><category>оптимизация</category><category>benchmark</category>
		</item>
		
		
		
		
		
		
		
		
	
		
		
		
			
		<item>		
			<title><![CDATA[Linux для всех / [Перевод] Ускорение ядра Linux с помощью графического процессора GPU]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/linux/118926/</guid>
			<link>http://habrahabr.ru/blogs/linux/118926/</link>
			<description><![CDATA[Исследования Университета штата Юта, спонсированные частично компанией NVIDIA, направлены на изучение ускорения ядра Linux с использованием ускорения графического процессора GPU. Вместо того чтобы просто позволить приложениям пользователя использовать огромную силу предлагаемых современных графических процессоров, исследователи надеются ускорить части ядра Linux запустив его прямо на GPU.<br/>
<br/>
Из страниц исследования: «Идея проекта KGPU состоит в том, чтобы графический процессор GPU рассматривался в качестве вычислительного сопроцессора для операционной системы, позволяющего производить параллельные вычисления внутри ядра Linux. Это даст возможность использовать SIMD (или SIMT в CUDA) для ускорения функциональности ядра Linux и внести новые функциональные возможности, которые ранее считались слишком интенсивными вычислениями для ядра. Проще говоря, проект KGPU делает возможными векторные вычисления внутри ядра».<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/linux/118926/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Sun, 08 May 2011 17:13:11 GMT</pubDate>
			<author>iManiacDev</author>
			<category>Gallium3D</category><category>Linux</category><category>OpenCL</category><category>параллельные вычисления</category><category>ядро linux</category><category>nvidia</category><category>cuda</category>
		</item>
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Высокая производительность / Суперкомпьютеры: третья мировая гонка]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/hi/116733/</guid>
			<link>http://habrahabr.ru/blogs/hi/116733/</link>			
			<description><![CDATA[Только что вернулся с конференции <a href="http://agora.guru.ru/display.php?conf=pavt2011">ПАВТ 2011</a> и хотел бы познакомить уважаемое хабрасообщество с современным состоянием дел в области высокопроизводительных вычислений. <br/>
Постараюсь по возможности ссылаться на первоисточники — а именно, на статьи из журнала &quot;<a href="http://www.supercomputers.ru">Суперкомпьютеры</a>&quot; и <a href="http://omega.sp.susu.ac.ru/books/conference/PaVT2011/">материалы конференции</a>.<br/>
<br/>
<h4>Зачем это все нужно</h4><br/>
Суперкомпьютеры традиционно использовались в военных и научных целях, но в последние годы в их применении произошли революционные изменения, связанные с тем, что их мощность «доросла» до моделирования реальных процессов и предметов при доступной для бизнеса стоимости.<br/>
Все, наверное, знают, что в автомобилестроении расчеты на суперкомпьютерах используются для повышения безопасности, например так получил свои <a href="http://www.autoreview.ru/archive/2005/03/fordfocus/">5 звезд Ford Focus</a>. В авиапромышленности выпуск нового реактивного двигателя по традиционной технологии — дорогостоящее удовольствие, например создание АЛ-31 для СУ-27 заняло 15 лет, потребовало создать и разрушить 50 опытных экземпляров и стоило 3,5 млрд. долларов. <a href="http://www.supercomputers.ru/index.php?option=com_k2&amp;view=item&amp;id=19:%D0%B3%D1%83%D0%BB-%D1%86%D0%B8%D1%84%D1%80%D0%BE%D0%B2%D0%BE%D0%B9-%D1%82%D1%83%D1%80%D0%B1%D0%B8%D0%BD%D1%8B&amp;Itemid=50">Двигатель для Сухой Супержет</a>, спроектированный уже с участием суперкомпьютеров, сделали за 6 лет, 600 млн евро и было построено 8 опытных экземпляров. <br/>
Нельзя не отметить и фармацевтику — большая часть современных лекарств проектируется с помощью <a href="http://www.supercomputers.ru/index.php?option=com_k2&amp;view=item&amp;id=104:%D0%B8%D1%81%D0%BF%D0%BE%D0%BB%D1%8C%D0%B7%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5-%D1%81%D1%83%D0%BF%D0%B5%D1%80%D0%BA%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BE%D0%B2-%D0%BF%D1%80%D0%B8-%D1%80%D0%B0%D0%B7%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B5-%D0%BD%D0%BE%D0%B2%D1%8B%D1%85-%D0%BB%D0%B5%D0%BA%D0%B0%D1%80%D1%81%D1%82%D0%B2&amp;tmpl=component&amp;print=1">виртуального скрининга </a>, который позволяет радикально снизить затраты и повысить безопасность лекарств.<br/>
 <a href="http://www.supercomputers.ru/index.php?option=com_k2&amp;view=item&amp;id=55:%D1%80%D0%B0%D1%88%D0%B8%D1%82-%D1%88%D0%B0%D0%B3%D0%B0%D0%BB%D0%B8%D0%B5%D0%B2-hpc-%D1%87%D1%82%D0%BE-%D0%BD%D1%83%D0%B6%D0%BD%D0%BE-%D1%81%D0%B4%D0%B5%D0%BB%D0%B0%D1%82%D1%8C?&amp;Itemid=50">Дальше — больше</a>. <br/>
Сегодня в развитых европейских странах:<br/>
47,3% высокотехнологической продукции производится с использованием имитационного моделирования фрагментов проектируемых сложных систем или изделий;<br/>
32,3% продукции производится с использованием имитационного моделирования мелкомасштабных аналогов проектируемых систем и изделий;<br/>
15% продукции производится с использованием полномасштабного имитационного моделирования проектируемых систем и изделий;<br/>
и лишь 5,4% проектируемых сложных систем и изделий производится без имитационного моделирования.<br/>
<br/>
<b>Суперкомпьютерные технологии в современном мире стали стратегической областью, без которой невозможно дальнейшее развитие. Мощность национальных суперкомпьютеров сейчас так же важна, как мощность электростанций или количество боеголовок.</b><br/>
И сейчас в мире началась <br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/hi/116733/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Mon, 04 Apr 2011 03:36:59 GMT</pubDate>
			<author>keleg</author>
			<category>суперкомпьютеры</category><category>параллельное программирование</category><category>OpenMP</category><category>OpenCL</category><category>CUDA</category><category>MPI</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Высокая производительность / Быстрое восстановление пароля по MD5-хешу методом брутфорса]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/hi/110809/</guid>
			<link>http://habrahabr.ru/blogs/hi/110809/</link>			
			<description><![CDATA[Наверное каждый из нас хоть раз забывал пароль от какого-нибудь важного сайта, а потом пытался расшифровать его по сохранившимся кукам в браузере. Возможно это были даже не Ваши куки, но это не важно — если Вам интересна тема скоростного брутфорса, то добро пожаловать под кат!<br/>
<br/>
Сразу скажу, что описанные в статье техники ускорения подходят для любого алгоритма хеширования, но из-за широкой распространённости я выбрал именно md5.<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/hi/110809/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Sun, 03 Apr 2011 11:13:16 GMT</pubDate>
			<author>VladX</author>
			<category>C</category><category>cuda</category><category>md5</category><category>брутфорс</category><category>хеш</category><category>оптимизация</category><category>ускорение</category>
		</item>
		
		
		
		
		
		
		
		
	
		
			
		<item>		
			<title><![CDATA[Высокая производительность / [Из песочницы] OpenCL: Как заставить эту штуку работать]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/hi/116579/</guid>
			<link>http://habrahabr.ru/blogs/hi/116579/</link>			
			<description><![CDATA[<img src="http://www.nvidia.com/docs/IO/67515/OpenCL_Logo_RGB.png" alt="image"/><br/>
<br/>
Очень многие, пробовавшие «на вкус» технологию использования графических ускорителей CUDA/OpenCL получили не слишком хорошие результаты. Да, тесты идут и простые примеры показывают впечатляющее ускорение, но вот когда дело доходит до реальных алгоритмов, хороший результат получить очень непросто.<br/>
Как же заставить эту технологию работать?<br/>
В данной статье я постарался обобщить свой полугодовой опыт бодания с технологией OpenCL под Mandriva linux и MacOS X 10.6 на задачах сложного поиска строковых данных для биоинформатики. OpenCL был выбран т. к. для Мака он является «родной» технологией (часть маков комплектуется видеокартами AMD и CUDA под ними недоступна даже теоретически), но предлагаемые рекомендации достаточно универсальны и подходят в том числе и для NVIDIA CUDA.<br/>
<br/>
Итак, что необходимо, чтобы графический ускоритель заработал?<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/hi/116579/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Fri, 01 Apr 2011 03:31:01 GMT</pubDate>
			<author>keleg</author>
			<category>OpenCL</category><category>CUDA</category>
		</item>
		
		
		
		
		
		
		
	
		
			
		<item>		
			<title><![CDATA[Алгоритмы / [Из песочницы] Сортировка массива за O(N) на CUDA]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/algorithm/110177/</guid>
			<link>http://habrahabr.ru/blogs/algorithm/110177/</link>			
			<description><![CDATA[<b>Введение</b><br/>
Как-то стояла задача отсортировать уникальный массив строк с использованием GPU с минимум кода и максимально возможной скоростью…<br/>
В данном посте опишу основную идею ее решения. В качестве элементов массива сортировки в данном посте выступают числа.<br/>
<b>Случай с уникальными элементами небольшого массива</b><br/>
В качестве платформы была выбрана CUDA по причинам, которые можно считать брэндовыми или индвидуальными. По факту, <a href="http://gpgpu.ru">здесь</a> много примеров именно на CUDA, и она на данный момент получила большее развитие в GPU-вычислениях, чем аналогичные платформы от ATI и OpenCL. <br/>
Поиск в сети по алгоритмам сортировки на CUDA дал разные результаты. Вот наиболее <a href="http://www.cse.chalmers.se/research/group/dcs/gpuqsortdcs.html">интересный</a>. Там есть рисунок<br/>
<img src="http://www.cse.chalmers.se/research/group/dcs/images/projects/gpuqsortsmallbench.png" alt="image"/><br/>
, из которого видно, что наилучший результат дал алгоритм <a href="http://en.wikipedia.org/wiki/Quicksort">QSORT</a>, который дает сложность порядка от O(NlogN) до O(N^2). И хотя распараллеливание на GPU дало лучший в статье результат, закралось сомнение, что QSORT — не лучший способ использовать ресурсы видеокарты для данной задачи (особенно испугал размер приведенного кода). Далее описывается решение задачи, по сути «в одну строчку» с <s>сложностью</s> <i>временной сложностью</i> O(N) в худшем случае.<br/>
<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/algorithm/110177/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Thu, 16 Dec 2010 22:39:37 GMT</pubDate>
			<author>edeldm</author>
			<category>алгоритмы</category><category>программирование</category><category>сложность алгоритма</category><category>c plus plus</category><category>cuda</category><category>gpu</category><category>gpu programming</category><category>gpgpu</category><category>сортировка</category>
		</item>
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[Блог компании HP / CUDA и другая новая начинка для сверхмасштабируемых серверных комплексов]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/company/hp/blog/105998/</guid>
			<link>http://habrahabr.ru/company/hp/blog/105998/</link>			
			<description><![CDATA[<img src="http://habrastorage.org/storage/4c1a8415/a599a1c2/0827c9be/0de43206.jpg" alt="Шасси HP ProLiant SL6500" align="left" hspace="5"/>Прошлой осенью HP представила новое семейство своих серверов стандартной архитектуры <a href="http://habrahabr.ru/company/hp/blog/76609/">ProLiant SL6000</a>. Оно было разработано специально для построения сверхмасштабируемых вычислительных комплексов и обеспечивает максимально плотную упаковку процессорной мощности. Это прежде всего достигается за счет использования шасси, в котором размещены общие для всех серверных модулей блоки питания и вентиляторы.<br/>
<br/>
В начале октября вышло уже второе поколение — <b>ProLiant SL6500</b>, имеющее на борту новейшие процессоры Intel Xeon и, опционально, GPU на базе архитектуры <a href="http://habrahabr.ru/blogs/CUDA/54707/">nVidia CUDA</a>. На основе опыта использования SL6000 в нем было внедрено несколько изменений. Высота шасси теперь составляет 4U вместо прежних 2U, шасси поддерживает горячую замену серверных модулей (и как опция — блоков питания), а сами серверные модули оборудуются заменяемыми в горячем режиме жесткими дисками. Кроме того, в зависимости от начинки шасси для него можно выбрать блоки питания на 460, 750 и 1200 Вт, что позволяет оптимизировать энергопотребление больших серверных комплексов.<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/company/hp/blog/105998/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Tue, 12 Oct 2010 09:33:18 GMT</pubDate>
			<author>Tigger</author>
			<category>HP</category><category>HP ProLiant SL6000</category><category>HP ProLiant SL6500</category><category>CUDA</category><category>nVidia</category><category>параллельные вычисления</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[nVidia CUDA / Понимание конфликтов банков разделяемой (shared) памяти в NVIDIA CUDA]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/CUDA/100363/</guid>
			<link>http://habrahabr.ru/blogs/CUDA/100363/</link>			
			<description><![CDATA[Разделяемая (shared) память является очень эффективным средством оптимизации за счет очень быстрого доступа (в 100 раз быстрее чем глобальная память). Однако, при неправильном использовании ее возможны конфликты банков, которые существенно замедляют быстродействие. В данной статье пойдет речь о том, как эти конфликты возникают, и как их избежать.<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/CUDA/100363/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Fri, 13 Aug 2010 02:30:59 GMT</pubDate>
			<author>denglide</author>
			<category>shared memory</category><category>cuda</category><category>nvidia</category><category>gpu</category><category>bank conflict</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[nVidia CUDA / Обзор генераторов псевдослучайных чисел для CUDA]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/CUDA/99876/</guid>
			<link>http://habrahabr.ru/blogs/CUDA/99876/</link>			
			<description><![CDATA[По специфике работы часто приходится заниматься симуляциями на GPU с использованием генераторов псевдослучайных чисел. В результате накопился опыт, которым решил и поделиться с сообществом.<br/>
<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/CUDA/99876/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Thu, 22 Jul 2010 19:34:12 GMT</pubDate>
			<author>denglide</author>
			<category>cuda</category><category>rng</category><category>lcg</category><category>mersenne twister</category><category>nvidia</category><category>gpu</category>
		</item>
		
		
		
		
		
		
		
		
	
			
		<item>		
			<title><![CDATA[nVidia CUDA / NVIDIA выпускает новый продукт для работы с параллельными вычислениями CPU и GPU]]></title>
			<guid isPermaLink="true">http://habrahabr.ru/blogs/CUDA/99739/</guid>
			<link>http://habrahabr.ru/blogs/CUDA/99739/</link>			
			<description><![CDATA[<img title="image" alt="image" src="http://habrastorage.org/storage/habraeffect/5a/ac/5aac64eca644d4731077399befacd78c.png"/><br/>
<br/>
Компания <strong>NVIDIA</strong> <a href="http://www.nvidia.com/object/parallel-nsight.html">выпускает новый коммерческий продукт</a> — <strong>NVIDIA Parallel Nsight</strong>, который представляет собой пакет инструментов интегрирующихся в <strong>Visual Studio 2008 SP1</strong>. NVIDIA Parallel Nsight предлагает инструменты для разработки параллельных приложений использующих на полную мощность возможности многоядерных процессоров и современных ускорителей <strong>GPU</strong>.<br/>
<br/>
<img title="image" alt="image" src="http://habrastorage.org/storage/habraeffect/b1/11/b1114c0d54316f306342541252271c60.png"/> <img title="image" alt="image" src="http://habrastorage.org/storage/habraeffect/52/65/5265036ace05a4615f77cc454021f0d2.png"/> <br/>
<br/>
<div class="habracut"> <a class="habracut" href="http://habrahabr.ru/blogs/CUDA/99739/#habracut">Читать дальше &rarr;</a> </div>]]></description>
			
			<pubDate>Wed, 21 Jul 2010 16:09:20 GMT</pubDate>
			<author>XaocCPS</author>
			<category>nvidia</category><category>cuda</category><category>паралельные вычисления</category><category>cpugpu</category><category>visual studio</category><category>NVIDIA Parallel Nsight</category>
		</item>
		
		
		
		
		
		
		
		
	
	
	
	
	
	
	
	

	
</channel>
</rss>

