что такое тренировка памяти ddr4

Где прогресс в оперативной памяти и зачем её разгонять?

Привет, GT! Все мы любим новое железо — приятно работать за быстрым компьютером, а не смотреть на всякие прогрессбары и прочие песочные часики. Если с процессорами и видеокартами всё более-менее понятно: вот новое поколение, получите ваши 10-20-30-50% производительности, то с оперативкой всё не так просто.

Где прогресс в модулях памяти, почему цена на гигабайт почти не падает и чем порадовать свой компьютер — в нашем железном ликбезе.

Стандарт памяти DDR4 имеет ряд преимуществ перед DDR3: большие максимальные частоты (то есть пропускная способность), меньшее напряжение (и тепловыделение), и, само собой, удвоенная ёмкость на один модуль.

Комитет инженерной стандартизации полупроводниковой продукции при Electronic Industries Alliance (более известный как JEDEC) трудится над тем, чтобы ваша оперативная память Kingston подходила к материнской плате ASUS или Gigabyte, и по этим правилам играют все. По части электрики, физики и разъёмов всё жёстко (оно и понятно, нужно обеспечить физическую совместимость), а вот в отношении рабочих частот, объёмов модулей и задержек в работе правила допускают некоторую волатильность: хотите сделать лучше — делайте, главное, чтобы на стандартных настройках у пользователей не было проблем.

Именно так получились в своё время модули DDR3 с частотой выше, чем 1600 МГц, и DDR4 с частотами выше 3200 МГц: они превышают базовые спецификации, и могут работать как на «стандартных» параметрах, совместимых со всеми материнскими платами, так и с экстремальными профилями (X.M.P.), протестированными на заводе и зашитыми в BIOS памяти.

Прогресс

Основные улучшения в этой сфере ведутся сразу в нескольких направлениях. Во-первых, производители непосредственно микросхем памяти (Hynix, Samsung, Micron и Toshiba) постоянно улучшают внутреннюю архитектуру чипов в пределах одного техпроцесса. От ревизии к ревизии внутреннюю топологию доводят до совершенства, обеспечивая равномерность нагрева и надёжность работы.

Во-вторых, память потихоньку переходит на новый техпроцесс. К сожалению, здесь нельзя проводить улучшения также быстро, как делают (делали последние лет 10) производители видеокарт или центральных процессоров: грубое уменьшение размеров рабочих частей, то есть транзисторов, потребует соответствующего снижения рабочих напряжений, которые ограничены стандартом JEDEC и встроенными в CPU контроллерами памяти.

Поэтому единственное, что остаётся — не только «поджимать» производственные нормы, но ещё и параллельно увеличивать скорость работы каждой микросхемы, что потребует соответствующего повышения напряжения. В итоге и частоты растут, и объёмы одного модуля.

Примеров такого развития много. В 2009-2010 году нормальным был выбор между 2/4 гигабайтами DDR3 1066 МГц и DDR3 1333 МГц на один модуль (обе были выполнены по 90-нм техпроцессу). Сегодня же умирающий стандарт готов предложить вам 1600, 1866, 2000 и даже 2133 МГц рабочих частот на модулях в 4, 8 и 16 ГБ, правда внутри уже 32, 30 и даже 28 нм.

К сожалению, подобный апгрейд стоит немалых денег (в первую очередь на исследования, закупку оборудования и отладку производственного процесса), так что ждать радикального уменьшения цены 1 ГБ оперативки до выхода DDR5 не придётся: ну а там нас ждёт очередное удвоение полезных характеристик при той же цене производства.

Цена улучшений, разгон и поиски баланса

Растущий объём и скорость работы напрямую влияет на ещё один параметр оперативной памяти — задержки (они же тайминги). Работа микросхем на высоких частотах до сих пор не желает нарушать законы физики, и на различные операции (поиск информации на микросхеме, чтение, запись, обновление ячейки) требуются определённые временные интервалы. Уменьшение техпроцесса даёт свои плоды, и тайминги растут медленнее, чем рабочие частоты, но здесь необходимо соблюдать баланс между скоростью линейного чтения и скоростью отклика.

Например, память может работать на профилях 2133 МГц и 2400 МГц с одинаковым набором таймингов (15-15-15-29) — в таком случае разгон оправдан: при большей частоте задержки в несколько тактов только уменьшатся, и вы получите не только увеличение линейной скорости чтения, но и скорости отклика. А вот если следующий порог (2666 МГц) требует увеличения задержек на 1-2, а то и 3 единицы, стоит задуматься. Проведём простые вычисления.

Делим рабочую частоту на первый тайминг (CAS). Чем выше соотношение — тем лучше:

2133 / 15 = 142,2
2400 / 15 = 160
2666 / 16 = 166,625
2666 / 17 = 156,823

Полученное значение — знаменатель в дроби 1 секунда / Х * 1 000 000. То есть чем выше число, тем ниже будет задержка между получением информации от контроллера памяти и отправкой данных назад.

Как видно из расчётов, наибольший прирост — апгрейд с 2133 до 2400 МГц при тех же таймингах. Увеличение задержки на 1 такт, необходимое для стабильной работы на частоте 2666 МГц всё ещё даёт преимущества (но уже не такие серьёзные), а если ваша память работает на повышенной частоте только с увеличением тайминга на 2 единицы — производительность даже немного снизится относительно 2400 МГц.

Верно и обратное: если модули совершенно не хотят увеличивать частоты (то есть вы нащупали предел для конкретно вашего комплекта памяти) — можно попытаться отыграть немного «бесплатной» производительности, снизив задержки.

На самом деле факторов несколько больше, но даже эти простые расчёты помогу не напортачить с разгоном памяти: нет смысла выжимать максимальную скорость из модулей, если результаты станут хуже, чем на средних показателях.

Практическое применение разгона памяти

В плане софта от подобных манипуляций в первую очередь выигрывают задачи, постоянно эксплуатирующие память не в режиме потокового чтения, а дёргающие случайные данные. То есть игры, фотошоп и всякие программистские задачи.

Аппаратно же системы со встроенной в процессор графикой (и лишённые собственной видеопамяти) получают значительный прирост производительности как при снижении задержек, так и при увеличении рабочих частот: простенький контроллер и невысокая пропускная способность очень часто становится бутылочным горлышком интегрированных GPU. Так что если ваши любимые «Цистерны» еле-еле ползают на встроенной графике старенького компа — вы знаете, что можно попробовать предпринять для улучшения ситуации.

Мэйнстрим

Как не странно, больше всего от подобных улучшений выигрывают среднестатистические пользователи. Нет, безусловно, оверклокеры, профессионалы и игроки с полным кошельком получают свои 0.5% производительности, применяя экстремальные модули с запредельными частотами, но их доля на рынке мала.

Что под капотом?

Шаг первый: прогреваем модуль памяти феном или активными нагрузками на чтение-запись (во втором случае вам надо быстренько выключить ПК, обесточить его и снять оперативку, пока она ещё горячая).

Шаг второй: находим сторону без наклейки и аккуратно подцепляем радиатор чем-нибудь в центре и по краям. Использовать печатную плату как основание для рычага можно, но с осторожностью. Внимательно выбираем точку опоры, стараемся избегать давления на на хрупкие элементы. Действовать лучше по принципу «медленно, но верно».

Шаг третий: открываем радиатор и разъединяем замки. Вот они, драгоценные чипы. Распаяны с одной стороны. Производитель — Micron, модель чипов 6XA77 D9SRJ.

8 штук по 1 Гб каждый, заводской профиль — 2400 МГц @ CL16.

Правда, дома снимать теплораспределители не стоит — сорвёте пломбу и плакала ваша пожизненная 1 гарантия. Да и родные радиаторы отлично справляются с возложенными на них функциями.

Попробуем измерить эффект от разгона оперативки на примере комплекта HyperX Fury HX426C16FW2K4/32. Расшифровка названия даёт нам следующую информацию: HX4 — DDR4, 26 — заводская частота 2666 МГц, C16 — задержки CL16. Далее идёт код цвета радиаторов (в нашем случае — белый), и описание комплекта K4/32 — набор из 4 модулей суммарным объёмом 32 ГБ. То есть уже сейчас видно, что оперативка незначительно разогнана ещё при производстве: вместо штатных 2400 прошит профиль 2666 МГц с теми же таймингами.

Помимо эстетического удовольствия от созерцания четырёх «Белоснежек» в корпусе вашего ПК этот набор готов предложить весомых 32 гига памяти и нацелен на пользователей обычных процессоров, не особо балующихся разгоном CPU. Современные Intel’ы без буквы K на конце окончательно лишились всех возможных способов получения бесплатной производительности, и практически не получают никаких бонусов от памяти с частотой выше 2400 МГц.

В качестве тестовых стендов мы взяли два компьютера. Один на базе Intel Core i7-6800K и материнской плате ASUS X99 (он представляет платформу для энтузиастов с четырёхканальным контроллером памяти), второй с Core i5-7600 внутри (этот будет отдуваться за мэйнстримовое железо со встроенной графикой и отсутствующим разгоном). На первом проверим разгонный потенциал памяти, а на втором будем измерять реальную производительность в играх и рабочем софте.

Разгонный потенциал

DDR4-2666 CL15-17-17 @1.2V
DDR4-2400 CL14-16-16 @1.2V
DDR4-2133 CL12-14-14 @1.2V

2133 / 12 = 177.75
2400 / 14 = 171.428
2666 / 15 = 177.7(3)

Попытки завести память на частоте 2900 МГц с повышением задержек до 16-17-18, 17-18-18, 17-19-19 и даже с подъёмом напряжения до 1.3 Вольта ничего не дали. Без серьёзных нагрузок компьютер работает, но фотошоп, архиватор или бенчмарк плюются ошибками или сваливают систему в BSOD. Похоже, что частотный потенциал модулей выбран до конца, и единственное, что нам остаётся — уменьшать задержки.

Лучший результат, который удалось достичь с тестовым комплектом из 4 модулей — 2666 МГц при таймингах CL13-14-13. Это существенно увеличит скорость доступа к случайным данным (2666 / 13 = 205.07) и должно показать неплохое улучшение результатов в игровом бенчмарке. В двухканальном режиме память разгоняется лучше: специалисты из oclab ухитрились довести комплект из двух 16 Гб модулей до частоты 3000 МГц @ CL14-15-15-28 с подъёмом напряжения до 1.4 Вольта — отличный результат.

Натурные испытания

Для нашего i5 со встроенной графикой в качестве бенчмарка мы выбрали GTA V. Игра не молодая, использует API DirectX 11, который давно известен и отлично вылизан в драйверах Intel, любит потреблять оперативную память и нагружает систему сразу по всем фронтам: GPU, CPU, Ram, чтение с диска. Классика. Вместе с этим GTA V использует т.н. «отложенный рендеринг», благодаря которому время расчёта кадра меньше зависит от сложности сцены, то есть методика испытания будет чище, а результаты — нагляднее.

За средний FPS возьмём значения, укладывающиеся в нормальное течение игры: пролёт самолёта, езда в городе, уничтожение супостатов имеют равномерный профиль нагрузки. По таким сценам (отбросив 1% лучших и худших результатов из массива данных) и получим средне-игровой FPS.

Просадки определим по сценам со взрывами и сложными эффектами (водопад под мостом, закатные пейзажи) аналогичным образом.

Подлагивания и неприятные фризы при резкой смене окружения (переключение от одного тестируемого случая к другому) случаются даже на монструозной GTX 1080Ti, постараемся их отметить, но в результаты не возьмём: в игре оно не встречается, и это, скорее, косяк самого бенчмарка.

CPU: Intel Core i5-7500 (4c4t @ 3.8 ГГц)
GPU: Intel HD530
RAM: 32 GB HyperX Fury White (2133 МГц CL12, 2666 МГц CL15 и 2666 МГц CL13)
MB: ASUS B250M
SSD: Kingston A400 240 GB

Для начала выставим стандартные частоты X.M.P.-профиля: 2666 МГц с таймингами 15-17-17. Встроенный бенчмарк GTA V выдаёт идентичный FPS и одинаковые просадки на минимальных и средних настройках в разрешении 720p: в большинстве сцен счётчик колеблется в районе 30–32, а в тяжёлых сценах и при смене одной локации на другую FPS проседает.

Причина очевидна — мощностей GPU достаточно, а вот блоки растеризации просто не успевают собрать и отрисовать большее число кадров в секунду. На «высоких» настройках графики результаты стремительно ухудшаются: игра начинает упираться непосредственно в скромные вычислительные возможности интегрированной графики.

2133 МГц CL12

Собственной памяти у GPU нет, и он вынужден постоянно дёргать системную. Пропускная способность DDR4 в двухканальном режиме на частоте 2133 МГц составит 64 бит (8 байт) × 2 133 000 000 МГц × 2 канала — порядка 34 Гб/с, с небольшими (до 10%) накладными потерями.

Для сравнения, пропускная способность подсистемы памяти у самой скромной дискретной карточки NVIDIA GTX 1030 — 48 Гб/с, а GTX 1050 Ti (которая легко выдаёт в GTA V 60 FPS на максимальных настройках в FullHD) — уже 112 Гб/с.

На заднем плане виден тот самый водопад под мостом, просаживающий FPS во внутриигровом бенчмарке.

Результаты бенчмарка просели до 28 FPS в среднем, а лаги при смене локаций и взрывах их ненапряжных просадок превратились в неприятные микрофризы.

2666 МГц CL13

40 Гб/с, сравнимо с младшей NVIDIA.

Максимальный FPS практически не вырос (0.1 не показатель и находится на грани погрешности измерений) — здесь мы всё ещё упираемся в скромные возможности ROP’ов, а вот все просадки стали менее заметны. В сценах с водопадом из-за высокой вычислительной нагрузки результат не изменился, во всех остальных — то есть на прогрузках, взрывах и прочих радостях, замедлявших работу видеоядра вырос в среднем на 10-15%. Вместо 25–27 кадров в нагруженных событиями эпизодах — уверенные 28–29. В целом игра стала ощущаться значительно комфортнее.

TL;DR и результаты

Нельзя оценивать скорость работы оперативной памяти по одной только частоте. У DDR4 достаточно большие тактовые задержки, и при прочих равных стоит выбирать память не только удовлетворяющую потребности вашего железа по рабочей частоте и объёму, но и уделять внимание этому параметру.

Проведённые тесты показали, что компьютеры на базе Intel Core i-серии со встроенной графикой получают заметный прирост производительности при использовании высокоскоростной памяти с низкими задержками. Видеоядро не имеет собственных ресурсов для хранения и обработки данных и пользуется системными отлично отвечает (до определённого предела) на рост частоты и снижение таймингов, так как от скорости доступа к памяти напрямую зависит время отрисовки кадра со множеством объектов.

Самое важное! Линейка Fury выпускается в нескольких цветах: белом, красном и чёрном — можно подобрать не только быструю память, но и подходящую по стилю к остальным комплектующим, как делают специалисты из HyperPC.

Закон Кирхгоффа и немного магии школьного образования позволяют утверждать, что память с чёрными радиаторами несколько будет холоднее в работе, чем другие варианты. Ну а для неверующих в свяфтую Физику есть замечательный пруф на образовательном канале МИФИ.

Если с мэйнстримовыми решениями всё понятно, то в топовом сегменте, где каждый системник — маленькое произведение искусства применение памяти и накопителей HyperX из обычных продуктовых линеек — как знак качества. При создании каждого кастомного проекта приходится учитывать множество факторов: тепловые нагрузки, пожелания капризного клиента, распределение воздушных потоков, акустические вопросы (мощный компьютер и тихий мощный компьютер — задачи, отличающиеся по сложности на порядок). HyperPC постоянно совершенствуют свои технологические процессы и остаются верны надёжным комплектующим — отсюда и превосходные результаты в их уникальных сборках. Но если вы предпочитаете готовым компьютерам — самобсор, то подобный комплект или одиночные модули HyperX Fury DDR4 можно приобрести в сети Юлмарт.

На этом всё, но мы не прощаемся. Прохладному лету — горячие темы, подписывайтесь на наш блог и все интересности не пройдут мимо.

1 — Из-за особенностей российского законодательства «пожизненная» гарантия будет действовать всего 10 лет со дня приобретения. Впрочем, в масштабах компьютерного железа с текущими темпами развития технологий и 10 лет срок не малый, а там и законодательство может измениться.

Источник

Разгон оперативной памяти DDR4 на AMD Ryzen и Intel Core

На github.com кто-то заморочился и сделал полноценный гайд по разгону оперативной памяти DDR4 на Intel и AMD Ryzen. А в качестве базовой информации в дополнении к нашему видео он будет полезен каждому.

Делимся переводом, приятного прочтения.

Содержание

Подготовка

Ожидания и ограничения

В этом разделе рассматриваются 3 компонента, влияющие на процесс разгона: микросхемы (чипы памяти), материнская плата и встроенный контроллер памяти (IMC).

Материнская плата

Замечено также, что дешёвые материнские платы могут не разогнаться, возможно по причине низкого качества печатной платы и недостаточного количества слоёв (?).

Микросхемы (чипы памяти)

Отчёты Thaiphoon Burner

По общему мнению, свои отбракованные низкосортные чипы Micron реализует под брендом SpecTek. Многие стали называть этот чип “Micron E-die” или даже просто “E-die”. Если в первом случае ещё куда ни шло, то во втором уже возникает путаница, поскольку подобная маркировка («буква-die») используется у микросхем Samsung, например – “4 Гб Samsung E-die”. Под “E-die” обычно подразумевается чип Samsung, поэтому стоит уточнять производителя, говоря о чипах Micron Rev. E как об “E-die”.

Масштабирование напряжения попросту означает, как чип реагирует на изменение напряжения. Во многих микросхемах tCL масштабируется с напряжением, что означает, что увеличение напряжения может позволить вам снизить tCL. В то время как tRCD и tRP на большинстве микросхем, как правило, не масштабируются с напряжением, а это означает, что независимо от того, какое напряжение вы подаёте, эти тайминги не меняются. Насколько я знаю, tCL, tRCD, tRP и, возможно, tRFC могут (либо не могут) видеть масштабирование напряжения. Аналогичным образом, если тайминг масштабируется с напряжением, это означает, что вы можете увеличить напряжение, чтобы соответствующий тайминг работал на более высокой частоте.

Масштабирование напряжения CL11

На графике видно, что tCL у CJR 8 Гб масштабируется с напряжением почти ровно до 2533 МГц. У B-die мы видим идеально-ровное масштабирование tCL с напряжением.

Некоторые старые чипы Micron (до Rev. E) известны своим отрицательным масштабированием с напряжением. То есть при повышении напряжения (как правило, выше 1,35 В) они становятся нестабильными на тех же таймингах и частоте. Ниже приведена таблица некоторых популярных чипов, показывающая, какие тайминги в них масштабируются с напряжением, а какие нет:

Чип	tCL	tRCD	tRP	tRFC
8 Гб AFR	Да	Нет	Нет	?
8 Гб CJR	Да	Нет	Нет	Да
8 Гб Rev. E	Да	Нет	Да	?
8 Гб B-die	Да	Да	Да	Да

Тайминги, которые не масштабируются с напряжением, как правило необходимо увеличивать с частотой. Масштабирование напряжения tRFC у B-die.

Примечание: Шкала tRFC в тактах (тиках), не во времени (нс).

Ожидаемая максимальная частота

Ниже приведена таблица предполагаемых максимальных частот некоторых популярных чипов:

Чип	Ожидаемая максимальная частота (МГц)
8 Гб AFR	3600
8 Гб CJR	4000*
8 Гб Rev. E	4000+
8 Гб B-die	4000+

* – результаты тестирования CJR у меня получились несколько противоречивыми. Я тестировал 3 одинаковых планки RipJaws V 3600 CL19 8 Гб. Одна из них работала на частоте 3600 МГц, другая – на 3800 МГц, а последняя смогла работать на 4000 МГц. Тестирование проводилось на CL16 с 1,45 В.

Не ждите, что одинаковые, но разнородные по качеству, чипы производителя одинаково хорошо разгонятся. Это особенно справедливо для B-die.

Суть биннинга заключается в разделении производителем полученной на выходе продукции «по сортам», качеству. Как правило, сортировка производится по демонстрируемой при тестировании частоте.

Чипы, показывающие одну частоту, производитель отделяет в одну «коробку», другую частоту – в другую «коробку». Отсюда и название процедуры – “binning” (bin – ящик, коробка).

B-die из коробки «2400 15-15-15» намного хуже чем из коробки «3200 14-14-14» или даже из «3000 14-14-14». Так что не ждите, что третьесортный B-die даст образцовые показатели масштабирования напряжения.

Чтобы выяснить, какой из одинаковых чипов обладает лучшими характеристиками на одном и том же напряжении, нужно найти немасштабируемый с напряжением тайминг.

Просто разделите частоту на этот тайминг, и чем выше значение, тем выше качество чипа. Например, Crucial Ballistix 3000 15-16-16 и 3200 16-18-18 оба на чипах Micron Rev. E. Если мы разделим частоту на масштабируемый с напряжением тайминг tCL, мы получим одинаковое значение (200). Значит ли это, что обе планки – одного сорта? Нет.

А вот tRCD не масштабируется с напряжением, значит его необходимо увеличивать по мере увеличения частоты. 3000/16 = 187,5 против 3200/18 = 177,78.

Как видите, 3000 15-16-16 более качественный чип, нежели 3200 16-18-18. Это означает, что чипы 3000 15-16-16 очевидно смогут работать и как 3200 16-18-18, а вот смогут ли 3200 16-18-18 работать как 3000 15-16-16 – не факт. В этом примере разница в частоте и таймингах невелика, так что разгон этих планок будет, скорее всего, очень похожим.

Максимальное рекомендованное повседневное напряжение

Спецификация JEDEC указывает (стр. 174), что абсолютный максимум составляет 1,50 В

Напряжения, превышающие приведенные в разделе «Абсолютные максимальные значения», могут привести к выходу устройства из строя. Это только номинальная нагрузка, и функциональная работа устройства при этих или любых других условиях выше тех, которые указаны в соответствующих разделах данной спецификации, не подразумевается. Воздействие абсолютных максимальных номинальных значений в течение длительного периода может повлиять на надежность.

Я бы советовал использовать 1,5 В только на B-die, поскольку известно, что он выдерживает высокое напряжение. Во всяком случае, у большинства популярных чипов (4/8 Гб AFR, 8 Гб CJR, 8 Гб Rev. E, 4/8 Гб MFR) максимальное рекомендуемое напряжение составляет 1,45 В. Сообщалось, что некоторые из менее известных чипов, таких как 8 Гб C-die, имеют отрицательное масштабирование или даже сгорают при напряжении выше 1,20 В. Впрочем, решать вам.

Ниже показано, как самые распространенные чипы ранжируются с точки зрения частоты и таймингов.

Встроенный контроллер памяти (IMC)

IMC от Intel достаточно устойчивый, поэтому при разгоне он не должен быть узким местом. Ну а чего ещё ждать от 14+++++ нм?

Для разгона RAM необходимо изменить два напряжения: System Agent (VCCSA) и IO (VCCIO). Не оставляйте их в режиме “Auto”, так как они могут подать опасные уровни напряжения на IMC, что может ухудшить его работу или даже спалить его. Большую часть времени можно держать VCCSA и VCCIO одинаковыми, но иногда перенапряжение может нанести ущерб стабильности, что видно из скриншота:

предоставлено: Silent_Scone.

Я не рекомендовал бы подниматься выше 1,25 В на обоих.

Ниже – предлагаемые мной значения VCCSA и VCCIO для двух одноранговых модулей DIMM:

Частота (МГц)	VCCSA/VCCIO (В)
3000-3600	1,10 – 1,15
3600-4000	1,15 – 1,20
4000+	1,20 – 1,25

Если модулей больше, и/или используются двуранговые модули, то может потребоваться более высокое напряжение VCCSA и VCCIO.

tRCD и tRP взаимосвязаны, то есть, если вы установите tRCD на 16, а tRP на 17, то оба будут работать с более высоким таймингом (17). Это ограничение объясняет, почему многие чипы работают не очень хорошо на Intel и почему для Intel лучше подходит B-die.

В UEFI Asrock и EVGA оба тайминга объединены в tRCDtRP. В UEFI ASUS tRP скрыт. В UEFI MSI и Gigabyte tRCD и tRP видны, но попытка установить для них разные значения приведет просто к установке более высокого значения для обоих.

Ожидаемый диапазон латентности памяти: 40-50 нс.

В Ryzen 1000 и 2000 IMC несколько привередлив к разгону и может не дать столь же высоких частот, как Intel. IMC Ryzen 3000 намного лучше и более-менее наравне с Intel.

SoC voltage – это напряжение для IMC, и, как и в случае с Intel, не рекомендуется оставлять его в “Auto” режиме. Тут достаточно 1,0 – 1,1 В, поднимать выше смысла нет.

На Ryzen 2000 (а возможно и на 1000 и 3000), вольтаж выше 1,15 В может отрицательно повлиять на разгон.

«На разных процессорах контроллер памяти ведет себя по-разному. Большинство процессоров будут работать на частоте 3466 МГц и выше при напряжении SoC 1,05 В, однако разница заключается в том, как разные процессоры реагируют на напряжение. Одни выглядят масштабируемыми с повышенным напряжением SoC, в то время как другие просто отказываются масштабироваться или вовсе демонстрируют отрицательное масштабирование. Все протестированные экземпляры демонстрировали отрицательное масштабирование при использовании SoC более 1,15 В. Во всех случаях максимальная частота памяти была достигнута при напряжении SoC = GDM вкл CR 1T > GDM откл CR 2T.

У процессоров Ryzen 3000 с одним CCD (процессоры серий ниже 3900X) пропускная способность записи вдвое меньше.

«В пропускной способности памяти мы видим нечто странное: скорость записи у AMD 3700X – у которого скорость записи благодаря соединению кристаллов CDD и IOD составляет 16 байт/такт – вдвое меньше, чем у 3900X. AMD заявляет, что это позволяет экономить электроэнергию, снизить нагрев процессора (TDP), к чему так стремится AMD. AMD говорит, что приложения редко делают чистые операции записи, но в одном из наших тестов на следующей странице мы увидим, как это ухудшило производительность 3700X.»

Ryzen Латентность (нс)

1000 65-75

2000 60-70

3000 65-75 (1:1 MCLK:FCLK)
75+ (2:1 MCLK:FCLK)

Достаточно высокий FCLK у Ryzen 3000 может компенсировать потери от десинхронизации MCLK и FCLK, при условии, что вы можете назначить MCLK для UCLK.

Разгон

Дисклеймер: потенциал разгона сильно зависит от «кремниевой лотереи» (чип чипу рознь), поэтому могут быть некоторые отклонения от моих предложений.

Процесс разгона достаточно прост и выполняется в 3 шага:

Нахождение максимальной частот

На AMD начинать нужно с 1.10 В SoC. Напряжение SoC может называться по-разному в зависимости от производителя.

Обратите внимание, что это добавочное напряжение. Базовое напряжение изменяется автоматически при увеличении частоты DRAM. Напряжение 0,10 В на частоте 3000 МГц может привести к фактическому напряжению 1,10 В, а 0,10 В на частоте 3400 МГц приводит уже к фактическому напряжению 1,20 В. MSI: CPU NB/SOC.

2. Установите напряжение DRAM 1,4 В. Для планок на чипах Micron/SpecTek (за исключением Rev. E) следует установить 1,35 В.

3. Выставите основные тайминги следующим образом: 16-20-20-40 (tCL-tRCD-tRP-tRAS). Подробнее об этих таймингах читайте тут (на англ.)

4. Постепенно увеличивайте частоту DRAM до тех пор, пока Windows не откажет. Помните об ожидаемых максимальных частотах, упомянутых выше. На Intel, быстрый способ узнать, нестабильны ли вы, это следить за значениями RTL и IOL. Каждая группа RTL и IOL соответствует каналу. В каждой группе есть 2 значения, которые соответствуют каждому DIMM. Используйте Asrock Timing Configurator. Поскольку у меня обе планки стоят во вторых слотах каждого канала, мне нужно посмотреть на D1 в каждой группе RTL и IOL. Значения RTL у планок не должны разниться между собой более чем на 2, а значения IOL более чем на 1.

В моём случае, RTL разнятся ровно на 2 (53 и 55), а значения IOL не разнятся вовсе (7 у обоих планок). Все значения в пределах допустимых диапазонов, однако имейте в виду, что это ещё не значит, что всё действительно стабильно.

На Ryzen 3000 – убедитесь, что частота Infinity Fabric (FCLK) установлена равной половине вашей действующей частоты DRAM.

5. Запустите тест памяти на свой выбор.

6. При зависании/краше/BSOD, верните частоту DRAM на ступень ниже и повторите тестирование.

7. Сохраните ваш профиль разгона в UEFI.

8. Теперь вы можете либо попытаться перейти на ещё более высокую частоту, либо начать подтягивать тайминги. Ее забывайте об ожидаемых максимальных частотах, о которых мы говорили ранее. Если вы достигли пределов возможностей чипа и/или IMC, то самое время заняться оптимизацией таймингов.

Пробуем повысить частоты

2. Увеличьте основные тайминги до 18-22-22-42.
3. Повысьте вольтаж DRAM до 1,45 В.
4. Выполните шаги 4-7 из раздела «Нахождение максимальной частоты».
5. Выполните оптимизацию («подтягивание») таймингов.

Дополнительно: Тайминги и частота — разрушаем мифы

Оптимизация таймингов

Обязательно после каждого изменения запускайте тест памяти и бенчмарк-тест, чтобы убедиться в повышении производительности.

На процессорах Ryzen 3000 с одним CCD пропускная способность записи должна составлять 90-95% от половины теоретической максимальной пропускной способности. Можно достичь половины теоретической максимальной пропускной способности записи. См. здесь (англ.)

2. Я бы рекомендовал для начала подтянуть некоторые второстепенные тайминги в соответствии с таблицей ниже, поскольку они могут ускорить тестирование памяти.

Тайминги Надёжно
(Safe) Оптимально
(Tight) Предельно
(Extreme)

tRRDS
tRRDL
tFAW 6 6 24 4 6 16 4 4 16

tWR 16 12 10

3. Далее идут основные тайминги (tCL, tRCD, tRP).

4. Далее идёт tRFC. По умолчанию для чипов 8 Гб установлено значение 350 нс (обратите внимание на единицу измерения).

Ниже приведена таблица типичных значений tRFC в нс для наиболее распространенных чипов:

Чип tRFC (нс)

8 Гб AFR 260-280

8 Гб CJR 260-280

8 Гб Rev. E 300-350

8 Гб B-die 160-180

5. Оставшиеся второстепенные тайминги я предлагаю выставить следующим образом:

Тайминг Надёжно
(Safe) Оптимально
(Tight) Предельно
(Extreme)

tWTRS
tWTRL 4 12 4 8 —

tRTP 12 10 8

tCWL tCL tCL-1 tCL-2

На Intel значения таймингов tWTRS/L следует сначала оставить в “Auto”, изменяя вместо них значения tWRRD_dg/sg соответственно. Уменьшение tWRRD_dg на 1 приведет к уменьшению tWTRS на 1. Аналогично с tWRRD_sg. Как только они достигнут минимума, вручную установите tWTRS/L.

6. Третьестепенные тайминги:

Пользователям AMD будет полезен этот текст (англ.)

Тайминг Надёжно
(Safe) Оптимально
(Tight) Предельно
(Extreme)

tRDRDSCL
tWRWRSCL 4 4 3 3 2 2

Пользователям Intel следует настраивать третьестепенные тайминги группой за раз, как видно из таблицы предлагаемых мной значений.

А тут тайминги на B-die, к сведению.

tREFI – это тоже тайминг, позволяющий повысит ьпроизводительность. В отличие от всех других таймингов, чем выше его значение – тем лучше.

Не стоит слишком увлекаться им, поскольку перепады температур окружающей среды (например, зима-лето) могут быть достаточными для возникновения нестабильности.

7. Также можно увеличить напряжение DRAM, чтобы ещё больше снизить тайминги. Вспомните про масштабирование напряжения чипов и максимальное рекомендованное повседневное напряжение, о чём мы говорили выше.

Дополнительно: Настройка таймингов DRAM на ASUS ROG MAXIMUS XI APEX

Дополнительные советы

Увеличение CLDO_VDDP похоже влияет положительно на частотах выше 3600 МГц, так как, по-видимому, улучшается гибкость и, следовательно, становится меньше ошибок.

Также будет интересно:

Источник