О мощностях серверов и энергопотреблении...

alafondo · 30 Мая 2007

Тема отделена вот от этой:

http://www.aqualogo.ru/phpbb2/index.php?s=...ost&p=77941

Sleepy.

Энергопотребление не зависит от количества ядер.

Хоть 100.

Они определяется в первую очередь техпроцессом кристалла процессора и памяти и загруженностью кристаллов.

Например ядро процессора Pentium 4 сделанное по процессу 65нм потребляет

118 Вт на частоте 2.8ГГЦ и 140Вт на 3.6ГГц при полной загрузке по тесту SuperPi.

При этом в режиме простоя ядро потребляет 35.2 и 35.6 Вт соответственно.

Таким образом 8 ядер Пня 4 должны потреблять 280Вт даже в режиме простоя.

Я даже не могу представить себе потребление 190Вт у всего сервера.

Только если он на 386 процессорах.

Я бы не был так критичен, тем более если не втеме. На серверах никто не юзает Пентиумы (разве что только компании с копеечным бюджетом). Если Вы не знаете, это не значит что их нет. У меня они потребляют столько, сколько написано и не больше - все зависит от комплектации (память, диски) и нагрузки, т.к. система сама отключает часть своих бездействующих ядер. покажите мне любой другой 32-х потоковых сервер с такими характеристиками..., почему 32-х потоковых, да потому что операционки видят там 32 процессора.

А еще скоро выходит процессор Niagara II - параметры энергопотребления такие же (максимум + 30%), только ядер и потоков на одно ядро в два раза больше.

BorisKramer · 30 Мая 2007

Я бы не был так критичен, тем более если не втеме. На серверах никто не юзает Пентиумы (разве что только компании с копеечным бюджетом). Если Вы не знаете, это не значит что их нет. У меня они потребляют столько, сколько написано и не больше - все зависит от комплектации (память, диски) и нагрузки, т.к. система сама отключает часть своих бездействующих ядер. покажите мне любой другой 32-х потоковых сервер с такими характеристиками..., почему 32-х потоковых, да потому что операционки видят там 32 процессора.

А еще скоро выходит процессор Niagara II - параметры энергопотребления такие же (максимум + 30%), только ядер и потоков на одно ядро в два раза больше.

То что Пентиумы используются только в компаниях с копеечным бюджетом это весьма спорное утверждение. Все зависит от задач компании.

Процессор ниагара это вообще полный хлам. 90 нм процесс. На все 8 ядер один блок вычислений с плавающей точкой. Частота всего около 1 ГГц. И т.д. Обыкновенный потоковый процессор для задач разделения времени. Даже обсуждать не хочется так же как и всю устаревшую архитектуру UltraSparc. Не просто так акции Sun на forex котируются ниже плинтуса.

Они мало потребляют потому что просто медленно работают и не умеют считать.

Законы физики обмануть невозможно.

Надо просто запустить тест SuperPi и количество потребляемой энергии будет достаточно строго коррелировать с техпроцессом кристалла и временем, необходимым для выполнения теста.

Разница может быть только на транспьютерных процессорах за счет их матричной архитектуры. Но это уже совсем другая сказка.

На сегодняшний день разработки на базе IBM POWER, AMD Opteron и Intel Xeon намного перспективнее.

Вряд-ли у ультраспарка откроется "второе дыхание" даже с выпуском ниагары 2. Она будет по 65 нм процессу а все приличные фирмы уже строят линии на 45нм.

alafondo · 30 Мая 2007

То что Пентиумы используются только в компаниях с копеечным бюджетом это весьма спорное утверждение. Все зависит от задач компании.

Процессор ниагара это вообще полный хлам. 90 нм процесс. На все 8 ядер один блок вычислений с плавающей точкой. Частота всего около 1 ГГц. И т.д. Обыкновенный потоковый процессор для задач разделения времени. Даже обсуждать не хочется так же как и всю устаревшую архитектуру UltraSparc. Не просто так акции Sun на forex котируются ниже плинтуса.

Они мало потребляют потому что просто медленно работают и не умеют считать.

Законы физики обмануть невозможно.

Надо просто запустить тест SuperPi и количество потребляемой энергии будет достаточно строго коррелировать с техпроцессом кристалла и временем, необходимым для выполнения теста.

Разница может быть только на транспьютерных процессорах за счет их матричной архитектуры. Но это уже совсем другая сказка.

На сегодняшний день разработки на базе IBM POWER, AMD Opteron и Intel Xeon намного перспективнее.

Вряд-ли у ультраспарка откроется "второе дыхание" даже с выпуском ниагары 2. Она будет по 65 нм процессу а все приличные фирмы уже строят линии на 45нм.

Я бы не стал называть полным хламом, то что решает необходимые моей компании задачи на несколько порядков лучше тех же Power5, а Xeon-ы и Itanium-ы - это вообще полный отстой. Единственная более-менне интересная архитектура - это Opteron. И мне все равно какой там технологический процесс 90 или 65 или 45нм - я решаю свои задачи исходя из тех серверов, которые доступны на текущий момент времени.

Для ясности - у меня крайне многопоточная система!

:!: Еще ра зхочу подчеркнуть - устаревшая ли архитектура, суперсовременная ли - мне абсолютно все равно, если она решает мои задачи лучше других!!! Конечно можно было бы приобрести IBM р5 в количестве три раза (это посчитано по-минимуму, по некоторым подзадачам в 20 раз T1000 производительнее р5 505Q) превышающем мой нынешний парк T1000, только вот мне оно на ... надо - посчитайте, если Вам интересно, стоимость и потребление электроэнергии парка из около 950 p5 505Q? Вы конечно же купили бы IBM p5, потому что там суперсовременный (кстати уже устаревший техпроцесс) Power5 и плевать на все остальное...

Вы правильно сказали, что все пляшут от задачи, только вот, ИМХО, только убогие доверяют выполнение важных задач своих компаний серверу на базе Pentium - там нету никакой защиты данных (типа ЕСС и т.п.) и шина убогая и вообще - это сугобо PC-шная архитектура, которой до серверной очень далеко и назвать это сервером нельзя, разве что только незнающему человеку...

Все конторы уже давно используют технологии виртуализации, кто на Power5, кто на UltraSparc, а кто на Itanium и Xeon.

Сразу видно, что Вы не знакомы с вычислением бизнес процессов, кроме ERP-систем и то спорно, мало где превалируют более-менее серьезное количество вычислений с плавающей точкой, единственная знакомая мне ситуация с подавляюбщим количеством вычислений с плавающей точкой - это научные вычисления, но там бал правят SGI Altix и Cray вместе с NEC...

Кстати, у ожидаемой Niagara II - на каждое ядро по-одному FPU-блоку...

Dar · 30 Мая 2007

Вы правильно сказали, что все пляшут от задачи, только вот, ИМХО, только убогие доверяют выполнение важных задач своих компаний серверу на базе Pentium -

Попрошу не употреблять выражения типа убогие, так как это прямое оскорбление. И кроме того не забывайте, что этот форум посвящен морской аквариумистике, а не тонкостям софта и прочим темам, посвященным компьютерам. Выношу, Вам alafondo, предупреждение. Будьте корректнее в ваших высказываниях. Dar

BorisKramer · 30 Мая 2007

Сразу видно, что Вы не знакомы с вычислением бизнес процессов, кроме ERP-систем и то спорно, мало где превалируют более-менее серьезное количество вычислений с плавающей точкой, единственная знакомая мне ситуация с подавляюбщим количеством вычислений с плавающей точкой - это научные вычисления, но там бал правят SGI Altix и Cray вместе с NEC...

Кстати, у ожидаемой Niagara II - на каждое ядро по-одному FPU-блоку...

С бизнес процессами я неплохо знаком.

Когда был бедным 2 года отработал в штатах на майнфрейме в CISC.

Зарабатывал так сказать начальный капитал.

Под петниумом поразумеваю всегда хеон.

Если вы считаете что в научных вычислениях бал правит SGI и Cray то вы скорее всего вообще не в теме. :497762: В научных вычислениях бал правит IBM.

SGI, Cray и NEC делят почетное предпоследнее место.

А Sun вообще лидер. Целых 7 систем из 500.

Даже NEC обогнала.

Взгляните на список TOP500.

Распределение систем Top 500 по поставщикам

Поставщики Количество систем

IBM 239

Hewlett-Packard 157

Dell 22

Cray 16

SGI 12

Linux Networx 8

Sun Microsystems 7

Hitachi 6

Собственная сборка 6

Fujitsu 4

NEC 4

Вычисления с плавающей точкой гораздо чаше чем в науке используются на серверах приложений где идет обработка графики (особенно векторной) и видео. Таких серверов сейчас огромное количество.

Также сейчас очень многие системы принятия решений основаны на технологии нейронных сетей. Там тоже активно используются расчеты.

И речь не об этом и не о том для какой задачи какой процессор лучше. Об этом вы можете поспорить с моими программистами. Они каждый день друг с другом по полрабочего дня об этом спорят .

Речь шла об энергопореблениию.

Оно тратится на переключение транзисторов. И зависит только от размера

этих транзисторов и скорости их переключения.

Только и всего. Если процессор мало потребляет значит там либо очень маленькое транзисторы либо они медленно переключаюся. Конкретно у ниагары присутствует второе.

Странно что вы этого не понимаете.

Да и чтобы не отдаляться от темы морской аквариумистики - в американском океанографическом центры моделирования экосистем все научные компьютеры IBM.

alafondo · 30 Мая 2007

С бизнес процессами я неплохо знаком.

Когда был бедным 2 года отработал в штатах на майнфрейме в CISC.

Зарабатывал так сказать начальный капитал.

Под петниумом поразумеваю всегда хеон.

Если вы считаете что в научных вычислениях бал правит SGI и Cray то вы скорее всего вообще не в теме. :497762: В научных вычислениях бал правит IBM.

SGI, Cray и NEC делят почетное предпоследнее место.

А Sun вообще лидер. Целых 7 систем из 500.

Даже NEC обогнала.

Взгляните на список TOP500.

Распределение систем Top 500 по поставщикам

Поставщики Количество систем

IBM 239

Hewlett-Packard 157

Dell 22

Cray 16

SGI 12

Linux Networx 8

Sun Microsystems 7

Hitachi 6

Собственная сборка 6

Fujitsu 4

NEC 4

Вычисления с плавающей точкой гораздо чаше чем в науке используются на серверах приложений где идет обработка графики (особенно векторной) и видео. Таких серверов сейчас огромное количество.

Также сейчас очень многие системы принятия решений основаны на технологии нейронных сетей. Там тоже активно используются расчеты.

И речь не об этом и не о том для какой задачи какой процессор лучше. Об этом вы можете поспорить с моими программистами. Они каждый день друг с другом по полрабочего дня об этом спорят .

Речь шла об энергопореблениию.

Оно тратится на переключение транзисторов. И зависит только от размера

этих транзисторов и скорости их переключения.

Только и всего. Если процессор мало потребляет значит там либо очень маленькое транзисторы либо они медленно переключаюся. Конкретно у ниагары присутствует второе.

Странно что вы этого не понимаете.

Да и чтобы не отдаляться от темы морской аквариумистики - в американском океанографическом центры моделирования экосистем все научные компьютеры IBM.

Я не совсем соглашусь с Вами, насчет IBM, т.к. TOP500 - это всего лишь демонстрация своих возможностей и это скорее штучный товар. Кто быстрее выще сильнее, а вот кто массовее - это вопрос. Если посмотрите повнимательнее, то почти все системы по прогнозированию климата - это cray (работает на AMD) или altix (Itanium), моделирования биохимических процессов (скажем сворачивания белков), тоже SGI и IBM.

И мне очень странно слышать от человека имевшего дело с мейнфреймом и говорящем о том, что все решает процессор. Процессор это конечно хорошо, но не менее важная составляющая - это инфраструктура. Зачем 5Ггц процессор, если память работает не быстрее 1Ггц, тут даже громадный кэш не спасет.

Системы обработки видео трудно отнести к бизнес процессам, но тут тоже SGI впереди планеты всей, почти 90% виртуальных студий - это их железо. Что касается рендеринга видеоряда (компьютерная нрафика и спецэффекты), то тут просто нужно брать брутфорсом и дешевизной (ну и чтобы софт позволял работать на этой платформе), и думать нечего, почти всегда это Opterоn-ы.

Ну и не услышал ответа от Вас, насчет того, что в моем случае чем именно IBM p5 намного лучше Sun T1000...

А каков процент Sun-овских из всех Web-серверов мира, Вы знаете?

И еще вопрос, на который тоже не помешало бы услышать ответ: "В чем порочность Интеловской серверной архитектуры, что AMD их теснит очень сильно и давно и почему Itanium не прижился?" Не верите, спросите любого реселлера насчет того какие платформы у них больше продаются.

Если Power и Xeon так хороши, то почему их уложили на лопатки T2000 и T1000? Посмотрите тесты на родном для IBM-овского оборудования LotusNotes, даже там "отсталые" по Вашим меркам системы впереди...

Все написал... Теперь можете спокойно банить :497762: .

ЗЫ

Да и у меня хватает своих программеров, а до споров и мнения Ваших мне нет никаких дел .

В каждом конкретном случае имеет место следующее - если софт у кого-то написан (или оптимизирован) под конкретную платформу, то они и не будут отказываться от своей платформы, т.к. иногда издержки портирования выше получаемого эффекта.

Да и мало кто перейдет от Оракла к ДБ2 или наоборот...

BorisKramer · 30 Мая 2007

Я не совсем соглашусь с Вами, насчет IBM, т.к. TOP500 - это всего лишь демонстрация своих возможностей и это скорее штучный товар. Кто быстрее выще сильнее, а вот кто массовее - это вопрос. Если посмотрите повнимательнее, то почти все системы по прогнозированию климата - это cray (работает на AMD) или altix (Itanium), моделирования биохимических процессов (скажем сворачивания белков), тоже SGI и IBM.

Тоз500 это хороший показатель.

Но и без него массовая ситуация ясна.

Информация Gartner Group по обороту от продажи новых серверных аппаратных платформ с разбивкой по типу процессоров, млрд. долл.

MIPS-процессоры от компании SGI вообще почти умерли.

Да и собственно я Вам про ивана а вы про болвана.

Речь шла о электропотреблении а вы опять переключились на платформы.

Эта тема в которой можно спорить бесконечно.

Предложение прекратить дальше развивать тему платформ так как этот спор абсолютно бесполезен.

alafondo · 30 Мая 2007

Согласен разговаривать можно до бесконечности.

Ну и Вы так не ответили на вопрос, чем же лучше для меня (читай решаемой моей компании задачи) Power5+, если мы тестировали наше приложение и Т1000 обгонял по производительности p5 505Q минимум в три раза, а максимум в 20раз. Причем настраивали машины под тестирование поочередно как инженеры IBM, так и мои сисадмины - результаты мало изменялись...

Наверное потому что и так все ясно .

- меньше потребляют электроэнергии

- меньше нагревают воздух - экономия на кондиционерах (какие-то спец версии для серверных)

- меньше денег ушло на УПС-ы

- могу еще продолжить про бинарную совместимость Spark-ов, но действительно пора закрывать обсуждение, да и смыла нету..., видимо каждый остался при своих... и технологический поцесс CPU тут как-то ни при чем оказался (потому что мне как конечному потребителю все равно какой технологический процесс использовался)...

ЗЫ

Кстати приведенный график тоже не имеет никакого отношения к потреблению электроэнергии.

Из приведенного графика видно, что Spark обгоняет Power. Про MIPS знаю, и используются сейчас они в сарверах HP серии non-Stop. Правда HP хотел их на что-то заменить, т.к. SGI продала МIPS (кому не помню) и там сворачивается развитие и производство данной платформы. Кстати Cray тоже принадлежит SGI. И более 50% Web-серверов - это Спарки (или Sun-овские х86) вобщем там стоит Солярис на них, чем не показатель?

Платформа IA-32 (или х86 по-нашему) вообще самая распространенная.

После того как HP провалился с HP-PaRisc, он стал разрабатывать Itanium с Интелом, и со скрипом ползут вперед, правда пока успешнее HP итаниум продвигает SGI. Интел сам давно плюнул на Итаниумы и выпустил 64-битный Пентиум (в смысле Xeon), а недолжен был, т.к. с НР была договоренность что будущая серверная платформа у Интела будет именно Итаниум...

ALPHA - вообще давно похоронена... умерла именно из-за того что под них небыло софта! - а ведь были самые быстрые (судя по тестам) машины своего времени...

BorisKramer · 30 Мая 2007

Из приведенного графика в первую очередь видно что архитектура UltraSparc сильно уступает по применяемости X86. А кто там кому принадлежит это не сильно важно.

Что касается вашей задачи, то я ее не знаю. На вашем приложении возможно T1000 кого-то и обогнал.

А на моих приложениях - компьютерные томографы T1000 мгновенно отстанет от обычного пня.

Поэтому я опять свожу тему именно к энергопотреблению.

Чтобы построить томограмму например мозга энергии уйдет примерно одинаково что у спарка что у пня. И воздух они нагреют одинаково. Только спарк потребляя в 3 раза меньше энергии будет решать задачу в три раза дольше. Только и всего.

А бизнес-приложения это вообще особая тема. Они вообще требуют не мощности процессора а мощности перефирии.

alafondo · 30 Мая 2007

Из приведенного графика в первую очередь видно что архитектура UltraSparc сильно уступает по применяемости X86. А кто там кому принадлежит это не сильно важно.

Что касается вашей задачи, то я ее не знаю. На вашем приложении возможно T1000 кого-то и обогнал.

А на моих приложениях - компьютерные томографы T1000 мгновенно отстанет от обычного пня.

Поэтому я опять свожу тему именно к энергопотреблению.

Чтобы построить томограмму например мозга энергии уйдет примерно одинаково что у спарка что у пня. И воздух они нагреют одинаково. Только спарк потребляя в 3 раза меньше энергии будет решать задачу в три раза дольше. Только и всего.

Т1000 изначально многопоточная (читай нишевая машина: Web-сервер, почтовый сервер, СУБД. Гугл вообще замучался петь диферамбы Т1000). При обычном однопоточном приложении (а судя по всему у Вас именно такая программа) он будет не быстрее 1Гц процессора, т.к. у него и будет работать одно ядро!

Да и точ то не подошло Вам, вовсе не означает что не подойдет другим...

А бизнес-приложения это вообще особая тема. Они вообще требуют не мощности процессора а мощности перефирии.

Я бы сказал сбалансированной системы, где процессор не самая главная вещь в системе.

Из приведенного графика в первую очередь видно что архитектура UltraSparc сильно уступает по применяемости X86. А кто там кому принадлежит это не сильно важно.

Значит по-Вашему х86 самая лучшая серверная платформа?

Ну и не надо притягивать факты за уши. х86 никакого отношения к текущему вопросу не имеет, ибо на этом графике вообще не указано сколько произведено: Pentium-ов (самых разных), Атлонов и Семпронов, Оптеронов - там все в одной куче. Хотя и так ясно, что процессоров для PC выпусказается в несколько раз больше, чем всех серверных вместе взятых... Да и стоимостное выражение ни о чем не говорит, гораздо интереснее посмотреть количество проданных систем (ну или установленных процессоров, как говорят в мире Unix) - графики искать не буду смысла нет...

BorisKramer · 30 Мая 2007

Т1000 изначально многопоточная (читай нишевая машина: Web-сервер, почтовый сервер, СУБД. Гугл вообще замучался петь диферамбы Т1000). При обычном однопоточном приложении (а судя по всему у Вас именно такая программа) он будет не быстрее 1Гц процессора, т.к. у него и будет работать одно ядро!

Задача у меня как раз многопоточная. Каждое ядро восстанавливает свое сечение.

И делать надо это очень быстро, так как человек под рентгеном долго находиться не может.

Значит по-Вашему х86 самая лучшая серверная платформа?

Ну и не надо притягивать факты за уши. х86 никакого отношения к текущему вопросу не имеет, ибо на этом графике вообще не указано сколько произведено: Pentium-ов (самых разных), Атлонов и Семпронов, Оптеронов - там все в одной куче. Хотя и так ясно, что процессоров для PC выпусказается в несколько раз больше, чем всех серверных вместе взятых... Да и стоимостное выражение ни о чем не говорит, гораздо интереснее посмотреть количество проданных систем (ну или установленных процессоров, как говорят в мире Unix) - графики искать не буду смысла нет...

Если не считать web/java серверов под которые и разрабатывался T1 то архитектура X86 самая предпочтительная, особенно для серверов приложений предприятий среднего размера 100-500 человек.

Количество проданных систем Х86 намного большее, так как они дешевле. Если их больше продано в долларовом отношении то в количественном эта разница еще больше.

Да и если просто почитать экспертные сравнения процессоров то можно увидеть что современная архитектра Х86 Core по производительности на 1Вт обходит тот же T1.

--------------

Процессоры, использующие микроархитектуру Core (в настоящее время — Xeon серии 5100), стали мировыми лидерами как по производительности (за исключением задач с плавающей точкой, где Power5+ может быть быстрее), так и по производительности в расчете на 1 Вт.

--------------

Интелу осталось только устранить проблемы пропускной способности памяти. Но эта проблема есть у всех. Из за этой проблем нам приходится использовать кластеры компьютеров а не многоядерные процессоры.

Рекомендую первоисточники:

# D. Kanter, Intel’s Next Generation Microarchitecture Unveiled. March 9, 2006

# Ofri Wechsler, Inside Intel Core Microarchitecture: Setting New Standards for Energy-Efficient Performance. Technology@Intel, March 2006.

# B. Valentine, Inside the Intel Core Microarchitecture. IDF, March 2006.

# Competitive comparison. Dual-core Intel Xeon processor-based platforms vs. AMD Opteron. Intel Corp., 2006.

alafondo · 30 Мая 2007

Задача у меня как раз многопоточная. Каждое ядро восстанавливает свое сечение.

И делать надо это очень быстро, так как человек под рентгеном долго находиться не может.

Если не считать web/java серверов под которые и разрабатывался T1 то архитектура X86 самая предпочтительная.

Количество проданных систем Х86 намного большее, так как они дешевле. Если их больше продано в долларовом отношении то в количественном эта разница еще больше.

Да и если просто почитать экспертные сравнения процессоров то можно увидеть что современная архитектра Х86 Core по производительности на 1Вт обходит тот же T1.

Отсюда вывод - все тесты и прочее - это для людей недалеких, т.к. разные приложение оптимизированные под конкретные платформы ведут себя по-разному. От себя добавлю и тесты тоже...

А мое приложение действительно написано на Java (специально писалось так для кроссплатформенности).

И все-таки х86 не подходит под каждые задачи, поэтому и живы пока остальные Юниксы (хотя их стоимость через пару лет сравняется со стоимостью х86 серверов или наоборот...). Да и до построения клаччических верверов с резервированием и с горячей заменой (вплоть до процессоров и блоков памяти) х86 пока еще очень далеко.

У самого все работало бы на Power5+ и Оптеронах, но в последний момент появились Т1000 и мы их протестировали все повернулось вспять... Плюс сэкономили на лицензиях под AIX и виртуализацию (для 505Q Virtualization Engine стоит около $2К).

Сейчас я очень доволен Niagar-ой первой!

И действительно Старые спарки не были конкурентоспособными, но новые вполне (для меня во всяком случае). Сейчас ждем выпуска NiagaraII, мы наверное будем одними из первых, кто купит их в России.

Борис, а вот Вы не пробовали запустить Ваше приложение на четырехпроцессорном пне? Было бы интересно узнать почему так деградировала скорость... может из-за одного FPU? Если бы и на 4*пне был бы провал, то дело в программе.

В Солярисе есть утилита Dtrace, где можно посмотреть какой процесс где тормозиться.

alafondo · 30 Мая 2007

Интелу осталось только устранить проблемы пропускной способности памяти. Но эта проблема есть у всех. Из за этой проблем нам приходится использовать кластеры компьютеров а не многоядерные процессоры.

Рекомендую первоисточники:

# D. Kanter, Intel’s Next Generation Microarchitecture Unveiled. March 9, 2006

# Ofri Wechsler, Inside Intel Core Microarchitecture: Setting New Standards for Energy-Efficient Performance. Technology@Intel, March 2006.

# B. Valentine, Inside the Intel Core Microarchitecture. IDF, March 2006.

# Competitive comparison. Dual-core Intel Xeon processor-based platforms vs. AMD Opteron. Intel Corp., 2006.

Кластеры как раз не надо использовать, для этого есть NUMA-архитектура, которую очень давно и успешно применяют SGI, да и архитектура AMD под это и заточена... и большинство экспертов склоняются к этому варианту развития.

А так все развиваются и всегда сменяют друг-друга на "вершине горы".

Четырехпроцессорный пень - полный отстой.

Сейчас стоит у меня в домашнем компьютере.

!!! А куда делось это Ваше сообщение?

А знаете почему? Если нет, могу помочь с ответом.

BorisKramer · 30 Мая 2007

Борис, а вот Вы не пробовали запустить Ваше приложение на четырехпроцессорном пне? Было бы интересно узнать почему так деградировала скорость... может из-за одного FPU? Если бы и на 4*пне был бы провал, то дело в программе.

В Солярисе есть утилита Dtrace, где можно посмотреть какой процесс где тормозиться.

Все эти системы что четырехпроцессорные что двухпроцессорные - полный отстой для моих задач.

Для клиента каждая секунда под излучением - это минус n лет жизни.

У нас обычно шутят - лечить будем или сразу в томограф. :gygy:

У меня поток данных сравним с пропускной способностью шины PCI-X. Память каждого сечения - 8-12 гигабайт.

И при этом я должен уложиться в лимон баксов за весь прибор.

Перепробовали почсти все.

И не только мы. Практически все производители тоже ставят кластеры независимых компьютеров X86.

Только GeneralElectric как всегда выпендрилась и натолкала Power5. получилось на 20% быстрее на сечение (все-таки с power5 тяжело ьороться на плавающей арифметике). Но у них и томограф в 2 раза дороже. Вот когда вырасту до размеров GE тоже Power20 натолкаю. :gygy:

!!! А куда делось это Ваше сообщение?

А знаете почему? Если нет, могу помочь с ответом.

Случайно нажал не ту кнопку и стер.

Не разбирался, но думаю что дело в его идиотском контроллере памяти.

alafondo · 30 Мая 2007

Все эти системы что четырехпроцессорные что двухпроцессорные - полный отстой для моих задач.

Для клиента каждая секунда под излучением - это минус n лет жизни.

У нас обычно шутят - лечить будем или сразу в томограф. :gygy:

У меня поток данных сравним с пропускной способностью шины PCI-X. Память каждого сечения - 8-12 гигабайт.

И при этом я должен уложиться в лимон баксов за весь прибор.

Значит тут дело вовсе не в Т1000, раз все другие тоже тормозят.

Да Power тоже интересная платформа, но все же главное чтобы софт работал и показывал отличные результаты, а так при лимоне стоимости что такое $5K-$20K на р5 сервер? или их там несколько десятков устанавливается?

Не разбирался, но думаю что дело в его идиотском контроллере памяти.

Делр в том, что у SMP систем резко возрастают накладные расходы. Вот пример:

Возьмем производительность однопроцессорной машины за 100%, тогда

2-х процессорная - 160% (в лучшем случае 180%)

4-х процессорная - около 240-260%

8-ми процессорная - меньше 400%

NUMA архитектура дает резкльтаты намного выше.

И как Вы заметили все дело в контроллере памяти, который в SMP системах всегда был и будет узким местом (кстати Power архитектура тоже придерживается SMP филисофии, поэтому и кэши и них громадные, а Вы думали зачем они там, как раз для этих целей). И пока не найдено достойного решения этой проблемы.

BorisKramer · 30 Мая 2007

Значит тут дело вовсе не в Т1000, раз все другие тоже тормозят.

Да Power тоже интересная платформа, но все же главное чтобы софт работал и показывал отличные результаты, а так при лимоне стоимости что такое $5K-$20K на р5 сервер? или их там несколько десятков устанавливается?

Средняя стоимость одного сервера (скорее вычислителя) получается около 4.5К. Устанавливается их 16. Это очень заметная часть себестоимости. Фактически самая большая часть.

Делр в том, что у SMP систем резко возрастают накладные расходы. Вот пример:

Возьмем производительность однопроцессорной машины за 100%, тогда

2-х процессорная - 160% (в лучшем случае 180%)

4-х процессорная - около 240-260%

8-ми процессорная - меньше 400%

NUMA архитектура дает резкльтаты намного выше.

И как Вы заметили все дело в контроллере памяти, который в SMP системах всегда был и будет узким местом (кстати Power архитектура тоже придерживается SMP филисофии, поэтому и кэши и них громадные, а Вы думали зачем они там, как раз для этих целей). И пока не найдено достойного решения этой проблемы.

Собственно поэтому и используем кластер. Задачи распараллеливаются полностью. 16 серверов считают ее ровно в 16 раз быстрее одного. Никаких накладных расходов. Результат расчетов - экранная картинка передается по сети на главный компьютер визуализации, который намного слабее вычислителей. Только монитор у него очень дорогой.

Сейчас у меня две команды разработчиков. Одна (старая) посматривает на Cell. Другая (новая) проектирует аналоговый вычислитель. Если аналоговый получится то скорость возрастет в десятки раз. Аналоговые процессы намного быстрее так как могут идти на терагерцовых частотах и они намного точнее так как не дискретизируют результат.

alafondo · 30 Мая 2007

Сейчас у меня две команды разработчиков. Одна (старая) посматривает на Cell. Другая (новая) проектирует аналоговый вычислитель. Если аналоговый получится то скорость возрастет в десятки раз. Аналоговые процессы намного быстрее так как могут идти на терагерцовых частотах и они намного точнее так как не дискретизируют результат.

Вообще не всякая программа может работать на кластере. Фактически cc-NUMA это и есть кластер, только, ИМХО, более эффективный. А Вы присматривались к Altix-ам, они недорогие и масштабируемые до неприличия.

Cell тоже интересная вещь, фактически этот чип и будет заложен в основу Power6.

Сейчас трудно найти людей разрабатывающих что-то, политика властей такая что проще продажами заниматься, так что, желаю удачи.

Наш софт в этом плане удачнее получился - распараллеливается до неприличия и масштабируется также . Собственно он таким и должен был быть и работает лучше всего на одно, двухпроцессорных машинах.

ЗЫ

Там у меня ошибка, у SMP проблема не в контроллере памяти, а в том что все процессоры сидят на одной шине, которая связывает их с памятью. Отсюда и все беды... На рисунке хорошо видно преимущество сс-NUMA архитектуры перед SMP.

BorisKramer · 30 Мая 2007

Сейчас трудно найти людей разрабатывающих что-то, политика властей такая что проще продажами заниматься, так что, желаю удачи.

Наш софт в этом плане удачнее получился - распараллеливается до неприличия и масштабируется также . Собственно он таким и должен был быть и работает лучше всего на одно, двухпроцессорных машинах.

А мы это делаем по заказу медицинского подразделения Кодака и политика властей нам до фонаря. Станет плохо - погрузимся на самолет и в любую другую страну. Мозги легче всего экспортировать конрабандой.

Наш софт к сожалению можно распараллелить только до уровня отдельных сечений. Внутри одного вычислителя паралелиться невозможно. Да и фортран на котором написано 90% математических библиотек условно реентерабелен. :497762:

alafondo · 30 Мая 2007

А мы это делаем по заказу медицинского подразделения Кодака и политика властей нам до фонаря. Станет плохо - погрузимся на самолет и в любую другую страну. Мозги легче всего экспортировать конрабандой.

Я тоже подумаю над запасным дата-центром в тихой и стабильной стране, а то у нас как-то беззакония очень много. Благо бизнес интернетный.

BorisKramer · 30 Мая 2007

Там у меня ошибка, у SMP проблема не в контроллере памяти, а в том что все процессоры сидят на одной шине, которая связывает их с памятью. Отсюда и все беды... На рисунке хорошо видно преимущество сс-NUMA архитектуры перед SMP.

Это то понятно. Но оптерон заметно медленнее считает плавающую арифметику.

Я тоже подумаю над запасным дата-центром в тихой и стабильной стране, а то у нас как-то беззакония очень много. Благо бизнес интернетный.

Интернет бизнес этим и хорош. Окопался где-нибудь в Гренландии и качай бабки. :gygy:

alafondo · 30 Мая 2007

Это то понятно. Но оптерон заметно медленнее считает плавающую арифметику.

Интернет бизнес этим и хорош. Окопался где-нибудь в Гренландии и качай бабки. :gygy:

Не-а, скорее всего в аСаША или в тихой Швейцарии :tuplu: .

BorisKramer · 30 Мая 2007

Не-а, скорее всего в аСаША или в тихой Швейцарии :tuplu: .

Не, США не стоит. Я сам ихний . Программеры тупые. Есть конечно умные но очень дорогие.

А вот Швейцария - неплохой вариант.

Мы когда переводили часть производства за кордон выбрали Украину.

Там хорошо понимают русский матерный. легче объяснять поставленные задачи.

alafondo · 30 Мая 2007

Не, США не стоит. Я сам ихний . Программеры тупые. Есть конечно умные но очень дорогие.

А вот Швейцария - неплохой вариант.

Мы когда переводили часть производства за кордон выбрали Украину.

Там хорошо понимают русский матерный. легче объяснять поставленные задачи.

Так у меня все на case-технологиях и умные программеры уже не нужны, т.к. за них уже умные люди подумали..., на крайний случай я со своими программерами туда слиняю... благо не таджиков строителей с собой тяну, думаю в посольстве не откажут. Мне там сисадмины толковые будут нужны, вот эту задачу надо будет решать на месте...

О мощностях серверов и энергопотреблении...

Рекомендуемые сообщения

alafondo 0

Поделиться этим сообщением

Ссылка на сообщение

BorisKramer 134

Поделиться этим сообщением

Ссылка на сообщение

alafondo 0

Поделиться этим сообщением

Ссылка на сообщение

Dar 2

Поделиться этим сообщением

Ссылка на сообщение

BorisKramer 134

Поделиться этим сообщением

Ссылка на сообщение

alafondo 0

Поделиться этим сообщением

Ссылка на сообщение

BorisKramer 134

Поделиться этим сообщением

Ссылка на сообщение

alafondo 0

Поделиться этим сообщением

Ссылка на сообщение

BorisKramer 134

Поделиться этим сообщением

Ссылка на сообщение

alafondo 0

Поделиться этим сообщением

Ссылка на сообщение

BorisKramer 134

Поделиться этим сообщением

Ссылка на сообщение

alafondo 0

Поделиться этим сообщением

Ссылка на сообщение

alafondo 0

Поделиться этим сообщением

Ссылка на сообщение

BorisKramer 134

Поделиться этим сообщением

Ссылка на сообщение

alafondo 0

Поделиться этим сообщением

Ссылка на сообщение

BorisKramer 134

Поделиться этим сообщением

Ссылка на сообщение

alafondo 0

Поделиться этим сообщением

Ссылка на сообщение

BorisKramer 134

Поделиться этим сообщением

Ссылка на сообщение

alafondo 0

Поделиться этим сообщением

Ссылка на сообщение

BorisKramer 134

Поделиться этим сообщением

Ссылка на сообщение

alafondo 0

Поделиться этим сообщением

Ссылка на сообщение

BorisKramer 134

Поделиться этим сообщением

Ссылка на сообщение

alafondo 0

Поделиться этим сообщением

Ссылка на сообщение

Пожалуйста, авторизуйтесь, чтобы оставить комментарий

Главная

Активность