что такое ранговость оперативной памяти
Что такое топология шины памяти материнской платы и почему это важно при разгоне оперативки
Содержание
Содержание
При разгоне памяти имеет значение каждый нюанс, даже тонкости разводки конкретной материнской платы. Что же такое I-топология, T-топология и Daisy Chain? Давайте разберемся, какие бывают, как влияют длина канала и качество согласования волнового сопротивления линии связи. Рассмотрим, какую конфигурацию ОЗУ лучше выбрать в конкретных условиях.
Виды топологий материнских плат
Топологией называют схему соединения между собой функциональных узлов с помощью каналов связи. Применительно к компьютерной технике, существуют два вида соединения центрального процессора с оперативной памятью — в виде буквы «T» и Daisy Chain.
T-топология обеспечивает равноценные условия обмена информацией центрального процессора с каждой парой модулей ОЗУ. Поскольку они соединены параллельно, такая схема лучше оптимизирована для работы с четырьмя планками. С двумя модулями оперативки результат разгона будет хуже.
Большинство пользователей использует именно две планки памяти, поэтому схема не получила большого распространения. Она используется в премиальных материнских платах, где важен большой объем ОЗУ — например, ASRock X570 Extreme4.
Daisy Chain (переводится как «цепочка гирлянд») означает последовательное соединение модулей. Схема лучше подходит для двух планок памяти. При этом они обязательно должны быть установлены в «первые» слоты A2 и B2, то есть в ближайшие к процессору каналы связи. Если подключить все четыре модуля, задействовав неприоритетные слоты А1 и В1, частотные показатели ухудшатся. Топология очень популярна и используется в большинстве материнских плат.
Читать пример разгона процессора AMD Ryzen 9 3900X на материнской плате GIGABYTE X570 AORUS PRO с топологией Daisy Chain
Частный случай Daisy Chain, когда отсутствуют два дополнительных слота (не из-за экономии, а для достижения максимальных частот) называется I-топологией.
Эта схема подразумевает максимально возможный разгон оперативной памяти. Из-за отсутствия «хвостов» в виде неприоритетных слотов, обеспечивается наилучшее согласование канала связи процессора с двумя модулями ОЗУ. Пример такой материнской платы — ASUS ROG Strix X570-I Gaming.
Нужно понимать, что в бюджетных платах наличие всего двух слотов обусловлено экономией при производстве. Эта двухслотовость не имеет ничего общего с геймерскими решениями, предназначенными для экстремального разгона.
Как влияет длина канала связи
Как известно, скорость распространения электрического сигнала в проводнике равна скорости света. Давайте условно примем длину дорожки печатной платы, которая идет от процессора до оперативной памяти и обратно, равной 10 сантиметрам. Таким образом, время преодоления этого участка сигналом составляет 0,33 наносекунды. Это время затрачивается лишь на преодоление длины проводника, без учета времени на внутренние процессы. То есть, оперативная память минимум через 0,16 наносекунд получит сигнал, переданный процессором. И еще через 0,16 наносекунд ЦП получит ответ от ОЗУ.
Задержка накладывает ограничение на максимальное количество тактов в единицу времени при работе связки оперативная память — процессор. Нетрудно пересчитать ее в частоту, которая в данном случае составит 3 ГГц (а эффективная частота памяти, то есть, с удвоенным количеством передаваемых данных за такт — 6 ГГц).
Таким образом, чем длиннее канал связи, тем меньше максимальная частота ОЗУ. При T-топологии расстояние дорожек от ЦП до памяти одинаковое, но общая длина каналов больше, чем у Daisy Chain.
Как влияет согласование канала связи
Частота работы оперативной памяти соответствует радиочастотному диапазону: сигнал обмена процессора и ОЗУ, по сути, является радиосигналом. Поэтому условия переноса этого сигнала в проводнике полностью подчиняются законам распространения радиоволн.
Для надежной передачи радиосигнала, без потерь и переотражений от неоднородностей тракта передачи данных, необходимо, чтобы волновое сопротивление источника сигнала (процессора) и канала связи и нагрузки (оперативной памяти) были равны. В случае несоответствия волновых сопротивлений на каком-либо участке, возникает неоднородность. Радиосигнал частично проходит дальше к потребителю и частично отражается обратно — в сторону источника. Происходит наложение на последующий сигнал, что приводит к искажениям и возникновению ошибок при обработке оперативной памятью.
Очевидно, что при неискаженном сигнале разогнанная оперативная память работает на своих максимальных устойчивых значениях частот. При появлении искажений из-за несогласования волновых сопротивлений, происходит снижение стабильной рабочей частоты. Это случается, если не соблюдать рекомендации производителя — например, использовать только два модуля ОЗУ в материнской плате с Т-топологией.
Что такое ранг оперативной памяти и почему он важен
Рангом называется блок данных, состоящий из микросхем памяти, расположенных на модуле. Ранг не имеет ничего общего с физическим расположением микросхем на одной или обеих сторонах модуля.
Например, один ранг памяти можно набрать восемью микросхемами, имеющими ширину шины 8 бит, или шестнадцатью микросхемами, имеющими ширину 4 бита (см. рисунок). Общий объем памяти одного ранга равен сумме объемов памяти каждой микросхемы, входящей в этот ранг.
Двухранговая память состоит из двух одноранговых комплектов микросхем. На одном физическом модуле размещаются два полноценных логических узла, которые используют один канал связи на двоих. При работе они поочередно подключаются к этому каналу, что накладывает ограничение на разгон — контроллеру памяти труднее работать с двумя модулями, чем с одним.
Читать сравнение сравнение однорангового и двухрангового модулей ОЗУ
Как определить топологию
Большинство производителей предпочитают не указывать, какая топология шины памяти применяется в их материнских платах. Как же узнать схему соединения для конкретной модели? Самый простой вариант — отыскать в руководстве по эксплуатации информацию о том, с каким количеством модулей ОЗУ обеспечивается максимальная частота. Если с четырьмя, то применяется T-топология, а если с двумя — однозначно Daisy Chain. Когда производитель рекомендует устанавливать пару модулей в приоритетные слоты, то это тоже означает, что применена «гирлянда», или последовательное соединение модулей.
Для AMD энтузиасты создали специальную таблицу. Достаточно забить в поиске название материнской платы и посмотреть столбец «Memory Topology».
Рекомендации по конфигурациям ОЗУ
Материнские платы с T-топологией шины памяти оптимизированы для четырех одноранговых модулей памяти и обеспечивают с ними наилучший разгон. Несколько хуже будет с двумя одноранговыми модулями. Еще хуже — при наличии двух двухранговых плашек. И совсем плохой результат достигается с четырьмя двухранговыми модулями.
Топология Daisy Chain лучше всего подходит для двух одноранговых модулей памяти — это самый распространенный вариант при сборке ПК. Чуть хуже будет с двумя двухранговыми модулями. Еще хуже— с четырьмя одноранговыми плашками. И совсем плохая ситуация в случае с четырьмя двухранговыми модулями.
Если говорить о цифрах, то память на Daisy Chain топологии гонится лучше, чем на Т-топологии. Так, инженер компании MSI в лекции «В чем ключ к разгону памяти?» приводит конкретные примеры для контроллера IMC процессоров Intel 9-го поколения. При T-топологии компании удалось добиться максимальной частоты 4400 МГц при работе с четырьмя и 4133 МГц — с двумя модулями. Для Daisy Chain предел достигнут при 4600 МГЦ у двух планок, но за это пришлось заплатить нестабильной работой четырех — всего 4000 МГц.
Современные платы для энтузиастов поддерживают память частотой вплоть до 5400–5600 МГц.
На практике, топология платы имеет значение лишь когда мы говорим о работе памяти на частотах свыше 3600–3800 МГц. При меньших значениях ее влияние ничтожно и обращать на это внимание не стоит.
Про ранги и виртуализацию в RAM
В продолжение рубрики «конспект админа» хотелось бы разобраться в нюансах технологий ОЗУ современного железа: в регистровой памяти, рангах, банках памяти и прочем. Подробнее коснемся надежности хранения данных в памяти и тех технологий, которые несчетное число раз на дню избавляют администраторов от печалей BSOD.
Старые песни про новые типы
Сегодня на рынке представлены, в основном, модули с памятью DDR SDRAM: DDR2, DDR3, DDR4. Разные поколения отличаются между собой рядом характеристик – в целом, каждое следующее поколение «быстрее, выше, сильнее», а для любознательных вот табличка:
Для подбора правильной памяти больший интерес представляют сами модули:
RDIMM — регистровая (буферизованная) память. Удобна для установки большого объема оперативной памяти по сравнению с небуферизованными модулями. Из минусов – более низкая производительность;
UDIMM (unregistered DRAM) — нерегистровая или небуферизованная память — это оперативная память, которая не содержит никаких буферов или регистров;
LRDIMM — эти модули обеспечивают более высокие скорости при большей емкости по сравнению с двухранговыми или четырехранговыми модулями RDIMM, за счёт использования дополнительных микросхем буфера памяти;
HDIMM (HyperCloud DIMM, HCDIMM) — модули с виртуальными рангами, которые имеют большую плотность и обеспечивают более высокую скорость работы. Например, 4 физических ранга в таких модулях могут быть представлены для контроллера как 2 виртуальных;
Попытка одновременно использовать эти типы может вызвать самые разные печальные последствия, вплоть до порчи материнской платы или самой памяти. Но возможно использование одного типа модулей с разными характеристиками, так как они обратно совместимы по тактовой частоте. Правда, итоговая частота работы подсистемы памяти будет ограничена возможностями самого медленного модуля или контроллера памяти.
Для всех типов памяти SDRAM есть общий набор базовых характеристик, влияющий на объем и производительность:
частота и режим работы;
Конечно, отличий на самом деле больше, но для сборки правильно работающей системы можно ограничиться этими.
Частота и режим работы
Понятно, что чем выше частота — тем выше общая производительность памяти. Но память все равно не будет работать быстрее, чем ей позволяет контроллер на материнской плате. Кроме того, все современные модули умеют работать в в многоканальном режиме, который увеличивает общую производительность до четырех раз.
Режимы работы можно условно разделить на четыре группы:
Single Mode — одноканальный или ассиметричный. Включается, когда в системе установлен только один модуль памяти или все модули отличаются друг от друга. Фактически, означает отсутствие многоканального доступа;
Dual Mode — двухканальный или симметричный. Слоты памяти группируются по каналам, в каждом из которых устанавливается одинаковый объем памяти. Это позволяет увеличить скорость работы на 5-10 % в играх, и до 70 % в тяжелых графических приложениях. Модули памяти необходимо устанавливать парами на разные каналы. Производители материнских плат обычно выделяют парные слоты одним цветом;
Triple Mode — трехканальный режим работы. Модули устанавливаются группами по три штуки — на каждый из трех каналов. Аналогично работают и последующие режимы: четырехканальные (quad-channel), восьмиканальные (8-channel memory) и т.п.
Для максимального быстродействия лучше устанавливать одинаковые модули с максимально возможной для системы частотой. При этом используйте установку парами или группами — в зависимости от доступного многоканального режима работы.
Ранги для памяти
Ранг (rank) — область памяти из нескольких чипов памяти в 64 бита (72 бита при наличии ECC, о чем поговорим позже). В зависимости от конструкции модуль может содержать один, два или четыре ранга.
Узнать этот параметр можно из маркировки на модуле памяти. Например уKingston число рангов легко вычислить по одной из трех букв в середине маркировки: S (Single — одногоранговая), D (Dual — двухранговая), Q (Quad — четырехранговая).
Пример полной расшифровки маркировки на модулях Kingston:
Серверные материнские платы ограничены суммарным числом рангов памяти, с которыми могут работать. Например, если максимально может быть установлено восемь рангов при уже установленных четырех двухранговых модулях, то в свободные слоты память добавить не получится.
Перед покупкой модулей есть смысл уточнить, какие типы памяти поддерживает процессор сервера. Например, Xeon E5/E5 v2 поддерживают одно-, двух- и четырехранговые регистровые модули DIMM (RDIMM), LRDIMM и не буферизированные ECC DIMM (ECC UDIMM) DDR3. А процессоры Xeon E5 v3 поддерживают одно- и двухранговые регистровые модули DIMM, а также LRDIMM DDR4.
Немного про скучные аббревиатуры таймингов
Тайминги или латентность памяти (CAS Latency, CL) — величина задержки в тактах от поступления команды до ее исполнения. Числа таймингов указывают параметры следующих операций:
CL (CAS Latency) – время, которое проходит между запросом процессора некоторых данных из памяти и моментом выдачи этих данных памятью;
tRCD (задержка от RAS до CAS) – время, которое должно пройти с момента обращения к строке матрицы (RAS) до обращения к столбцу матрицы (CAS) с нужными данными;
tRP (RAS Precharge) – интервал от закрытия доступа к одной строке матрицы, и до начала доступа к другой;
tRAS – пауза для возврата памяти в состояние ожидания следующего запроса;
Разумеется, чем меньше тайминги – тем лучше для скорости. Но за низкую латентность придется заплатить тактовой частотой: чем ниже тайминги, тем меньше допустимая для памяти тактовая частота. Поэтому правильным выбором будет «золотая середина».
Существуют и специальные более дорогие модули с пометкой «Low Latency», которые могут работать на более высокой частоте при низких таймингах. При расширении памяти желательно подбирать модули с таймингами, аналогичными уже установленным.
RAID для оперативной памяти
Ошибки при хранении данных в оперативной памяти неизбежны. Они классифицируются как аппаратные отказы и нерегулярные ошибки (сбои). Память с контролем четности способна обнаружить ошибку, но не способна ее исправить.
Для коррекции нерегулярных ошибок применяется ECC-память, которая содержит дополнительную микросхему для обнаружения и исправления ошибок в отдельных битах.
Метод коррекции ошибок работает следующим образом:
При записи 64 бит данных в ячейку памяти происходит подсчет контрольной суммы, составляющей 8 бит.
Когда процессор считывает данные, то выполняется расчет контрольной суммы полученных данных и сравнение с исходным значением. Если суммы не совпадают – это ошибка.
Технология Advanced ECC способна исправлять многобитовые ошибки в одной микросхеме, и с ней возможно восстановление данных даже при отказе всего модуля DRAM.
Исправление ошибок нужно отдельно включить в BIOS
Большинство серверных модулей памяти являются регистровыми (буферизованными) – они содержат регистры контроля передачи данных.
Регистры также позволяют устанавливать большие объемы памяти, но из-за них образуются дополнительные задержки в работе. Дело в том, что каждое чтение и запись буферизуются в регистре на один такт, прежде чем попадут с шины памяти в чип DRAM, поэтому регистровая память оказывается медленнее не регистровой на один такт.
Все регистровые модули и память с полной буферизацией также поддерживают ECC, а вот обратное не всегда справедливо. Из соображений надежности для сервера лучше использовать регистровую память.
Многопроцессорные системы и память
Для правильной и быстрой работы нескольких процессоров, нужно каждому из них выделить свой банк памяти для доступа «напрямую». Об организации этих банков в конкретном сервере лучше почитать в документации, но общее правило такое: память распределяем между банками поровну и в каждый ставим модули одного типа.
Если пришлось поставить в сервер модули с меньшей частотой, чем требуется материнской плате – нужно включить в BIOS дополнительные циклы ожидания при работе процессора с памятью.
Для автоматического учета всех правил и рекомендаций по установке модулей можно использовать специальные утилиты от вендора. Например, у HP есть Online DDR4 (DDR3) Memory Configuration Tool.
Итого
Вместо пространственного заключения приведу общие рекомендации по выбору памяти:
Для многопроцессорных серверов HP рекомендуется использовать только регистровую память c функцией коррекции ошибок (ECC RDIMM), а для однопроцессорных — небуферизированную с ECC (UDIMM). Планки UDIMM для серверов HP лучше выбирать от этого же производителя, чтобы избежать самопроизвольных перезагрузок.
В случае с RDIMM лучше выбирать одно- и двухранговые модули (1rx4, 2rx4). Для оптимальной производительности используйте двухранговые модули памяти в конфигурациях 1 или 2 DIMM на канал. Создание конфигурации из 3 DIMM с установкой модулей в третий банк памяти значительно снижает производительность.
Список короткий, но здесь все самое необходимое и наименее очевидное. Конечно же, старый как мир принцип RTFM никто не отменял.
Одноранговая или двухранговая оперативная память?
Если с двухканальной оперативной памятью все более-менее понятно (четное количество модулей работает быстрее нечетного), то термин «двухранговая память» знаком уже куда меньшему числу компьютерных энтузиастов. Более того, даже те немногие, кто знают о двухранговости, не могут однозначно ответить, хорошо это или плохо. И действительно, двухранговая память имеет как преимущества, так и недостатки. Что же из них сильнее перевешивает, давайте вместе разбираться.
Single Rank vs Dual Rank
Ранг памяти — это количество массивов из микросхем памяти разрядностью 64 бита каждый, распаянных на одном модуле памяти. Проще говоря, это два виртуальных модуля на одном физическом. Самыми распространенными являются одноранговые (Single Rank) и двухранговые планки памяти (Dual Rank), но изредка встречаются и четырехранговые (Quad Rank).
Нехотя напрашивается аналогия с физическими и виртуальными ядрами процессора — Intel Hyper-Threading и AMD SMT. Некое сходство действительно есть: одна двухранговая планка памяти быстрее одноранговой (Single Channel), но медленее двух одноранговых, работающих в двухканальном режиме (Dual Channel).
На данный момент преобладающее большинство модулей памяти DDR4 объемом 4 или 8 ГБ являются одноранговыми (распаяно четыре или восемь чипов по 1 ГБ), а объемом 16 ГБ — двухранговыми (шестнадцать чипов, то есть два массива). Впрочем, в продаже все еще можно встретить старые 8-гиговые двухранговые планки (16 чипов малой плотности 512 МБ).
А с появлением первых чипов повышенной плотностью 2 ГБ в продажу начали поступать одноранговые 16-гиговые (один массива из 8 чипов) и двухранговые 32-гиговые модули (16 чипов). Четырехранговые 32-гиговые планки (32 чипа, четыре массива) — совсем уж диковинка.
Проще говоря, если чипов на планке памяти до восьми штук включительно — она одноранговая, а если шестнадцать — двухранговая. С теорией более-менее разобрались, теперь же проведем практическое тестирование на примере парочки двухранговых 16-гиговых модулей Apacer DDR4 суммарным объемом 32 ГБ.
Apacer DDR4 — серия бюджетной оперативной памяти для современных компьютерных платформ Intel LGA1151-v2 и AMD AM4. Текстолит моделей с частотой 2133 и 2400 МГц окрашен в олдскульный зеленый цвет, а 2666-МГц моделей — в уже более современный черный. На выбор доступны модели объемом 4, 8 и 16 ГБ. Первые два варианта — одноранговые, тогда как последний — двухранговый.
Готовых заводских наборов на два или четыре модуля не предусмотрено, только отдельные планки. Поэтому если планируете заняться оверклокингом, советуем покупать в одном магазине и в одно время. Чтобы уж наверняка попались чипы из одной партии с примерно одинаковым коэффициентом утечек тока и разгонным потенциалом.
Пожалуй, самыми интересными являются планки Apacer DDR4 объемом 16 ГБ и частотой 2666 МГц. Построены они на шестнадцати чипах Hynix A-die (по данным приложения Thaiphoon Burner), то есть являются двухранговыми. Парочка таких модулей позволяет собрать ПК на процессоре AMD Ryzen с высокой пропускной способностью подсистемы памяти — двухканальная и одновременно двухранговая.
Правда, большое количество чипов повышает нагрузку на встроенный в процессор контроллер памяти. Из-за этого частота памяти, которую можно выжать из памяти ручным разгоном, будет ниже, а тайминги (задержки) наоборот выше. Даже по умолчанию Apacer DDR4-2666 16 ГБ работает на таймингах CL19 вместо типичных для этой частоты CL17.
Конфигурация тестового стенда
Результаты бенчмарков
Для сравнительного тестирования одноранговых и двухранговых модулей был нарочно выбран наиболее чувствительний к пропускной способности памяти процессор — Ryzen 3 2200G. В его случае шина памяти делится между четырьмя вычислительными ядрами Zen и встроенным графическим ускорителем Vega 8 с 512 микроядрами. Дополнительная дискретная видеокарта не использовалась.
Оверклокерских рекордов с двухранговой Apacer DDR4 установить ожидаемо не получилось — она разогналась с базовых 2666 лишь до 2933 МГц, что впрочем тоже неплохо. Из одноранговых модулей как правило можно выжать на сотню-две мегагерц больше. Впрочем, это ограничение может быть и по вине материнской платы Biostar B450GT3 с пока еще сыроватой прошивкой BIOS.
Тестирование проводилось в приложении AIDA64, а точнее встроенном в него бенчмарке памяти и кеша, а также в старенькой, но как раз хорошо подходящей для интегрированной видеокарты игре — Tomb Raider (2013) при разрешении FullHD и высоких настройках графики. В нее тоже встроен бенчмарк, раз за разом прогоняющий одну и ту же демо-сцену, что минимизирует погрешность замеров частоты кадров.
Так, скорость чтения, записи и копирования двургановой памяти Apacer DDR4 2666 МГц в бенчмарке AIDA64 оказалась примерно на 7 процентов больше, чем у одноранговой памяти с аналогичной частотой. Ручной разгон до 2933 МГц прибавил еще около 5 процентов быстродействия. На эти же 5 процентов у двухранговой памяти ниже латентность, то есть задержки, измеряемые в наносекундах.
Фреймрейт в игре Tomb Raider в случае двухранговой памяти был пусть немного, всего на 2 кадр/с, но стабильно выше одноранговой. Еще парочку кадров в секунду прибавил оверклокинг памяти. Больше бесплатных FPS можно получить, разогнав по ядру интегрированную видеокарту Vega 8. Но для этого желателен хотя бы небольшой башенный кулер, тогда как мы, ради чистоты эксперимента, проводили тестировании на боксовом.
Выводы
Как показало тестирование, двухранговые модули ОЗУ (с двумя виртуальными каналами памяти) однозначно быстрее одноранговых при равной частоте — выигрыш составляет от 5 до 7 процентов. Цифры, вроде, и небольшие, но получить прирост быстродействия памяти всегда труднее, чем любого другого компонента ПК. Если лень заморачиваться с оверклокингом, то покупка двухранговых модулей — самый простой и эффективный способ ускорить подсистему памяти ПК. А в случае процессоров с мощной интегрированной графикой (AMD Vega и Intel Gen11), двухранговая память прямо-таки обязательна к покупке.