惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

A
Arctic Wolf
WordPress大学
WordPress大学
月光博客
月光博客
J
Java Code Geeks
罗磊的独立博客
V
Visual Studio Blog
阮一峰的网络日志
阮一峰的网络日志
Y
Y Combinator Blog
GbyAI
GbyAI
The Cloudflare Blog
B
Blog
S
SegmentFault 最新的问题
T
Tenable Blog
P
Privacy International News Feed
爱范儿
爱范儿
V
Vulnerabilities – Threatpost
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Scott Helme
Scott Helme
量子位
博客园 - 三生石上(FineUI控件)
The Hacker News
The Hacker News
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
Security Latest
Security Latest
D
Darknet – Hacking Tools, Hacker News & Cyber Security
C
Cybersecurity and Infrastructure Security Agency CISA
P
Proofpoint News Feed
P
Privacy & Cybersecurity Law Blog
G
GRAHAM CLULEY
C
CXSECURITY Database RSS Feed - CXSecurity.com
U
Unit 42
D
DataBreaches.Net
T
Threatpost
C
Cisco Blogs
Project Zero
Project Zero
K
Kaspersky official blog
MongoDB | Blog
MongoDB | Blog
C
Check Point Blog
A
About on SuperTechFans
The Register - Security
The Register - Security
C
Cyber Attacks, Cyber Crime and Cyber Security
S
Schneier on Security
L
Lohrmann on Cybersecurity
T
Threat Research - Cisco Blogs
I
InfoQ
Simon Willison's Weblog
Simon Willison's Weblog
F
Fortinet All Blogs
Recorded Future
Recorded Future
AWS News Blog
AWS News Blog
The GitHub Blog
The GitHub Blog
C
CERT Recently Published Vulnerability Notes

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Новые серверы в облаке mClouds: обзор Dell R7725 с 64-х ядерными AMD EPYC 9555
mClouds_editor · 2026-06-18 · via Все публикации подряд на Хабре

В нашей облачной платформе уже работают серверы Dell R7625 с процессорами AMD EPYC 9374F 3,85 ГГц и видеокартами NVIDIA L40S и A16. Об этой конфигурации мы уже рассказывали. Конфигурации отлично решают задачи, требующие высокой частоты CPU, например 1С, так и задачи инференса, VDI и прочие, связанные с GPU. При этом мы регулярно обновляем парк и добавляем новые поколения серверов и процессоров.

В начале 2026 года мы добавили к облачной платформе серверы Dell R7725. В основе — новейшие процессоры AMD EPYC 9555, память DDR5-6400 и дисковая подсистема PCIe Gen 5. Также в серверах используются и графические ускорители - NVIDIA L4, A16.

Облачная платформа стала гибридной: она одинаково хороша для инференса нейросетей, трехмерного моделирования и высоконагруженных транзакционных систем вроде 1С. Получаем в одном контуре IaaS решение основных бизнес задач.

Ниже посмотрим как выглядят и что несет в себе новая платформа, в нашей конфигурации. Расскажем, зачем мы перешли на PCIe Gen 5, почему выбрали именно EPYC 9555 и быструю память и как всё это влияет на реальные задачи — от машинок VDI , запуска LLM до работы в 1С Предприятие.

Конфигурация R7725 для работы с L4

Конфигурация R7725 для работы с L4

Серверы и процессоры

Серверы Dell R7725 — это 2U-системы. Внутри установлены два процессора AMD EPYC 9555, каждый по 64 ядра 3,2 ГГЦ базовой частоты, оперативная память DDR5-6400 и графические ускорители. Количество GPU на сервер зависит от их типа. Карты NVIDIA L4 24 ГБ — однослотовые, в нашей конфигурации используем 6 таких карт на хост. А вот A16 или RTX 6000 PRO занимают по два слота, поэтому максимум — две карты на сервер.

Процессор AMD EPYC 9555 оснащен 64 ядрами и имеет базовую частоту — 3,2 ГГц, в режиме Boost все ядра работает на 4,2 ГГц. Заявленный TDP до 360 Вт. В итоге получили 128 ядер на хост, при этом еще и на высокой частоте.

Кроме того, платформа теперь использует память DDR5-6400 , что дает дополнительный прирост общей производительности. Занимаем все 24 слота планками по 96GB.

Заодно плачем от текущих цен на DDR5 RDIMM, но таковы реалиии рынка, что поделать ))

Вот такая кучка памяти уходит на сервер

Вот такая кучка памяти уходит на сервер

Для сетевой связанности каждый сервер подключается к 25-гигабитным коммутаторам четырьмя портами. Каждый узел, кроме работы с локальными дисками NVMe , работает и с несколькими СХД одновременно.

Дисковая подсистема

Локальные NVMe-накопители PCIe Gen 5. Скорость чтения — выше 10 ГБ/с на диск. Форм-фактор — EDSFF E3.S.  Пока еще в РФ диски такого форм-фактора не имеют широкого распространения, но мы уже начали их использование. Получаем возможность лучшего охлаждения всего шасси, по сравнению с дисками формата 2,5 дюйма.

Тест производительности показывает, что последовательное чтение достигает 13 ГБ/с, запись — 3,5 ГБ/с. Тест снят с пары дисков, объединенных в зеркало. Используется Gen5 контроллер H975i. Локальные NVMe в хостах, используются, в основном для работы с GPU.

Графические ускорители

В новых серверных платформах используем разные варианты графических ускорителей , покажем на примере L4 и A16.

NVIDIA L4 24 ГБ — однослотовые карты. В сервере R7725 мы используем конфигурацию с шестью такими ускорителями на один хост — это дает максимальную плотность GPU в 2U.

В одном райзере 2 карты L4.

В одном райзере 2 карты L4.

NVIDIA A16 64 ГБ — как и в платформе на R7625, в новых серверах устанавливается по две карты на сервер, поскольку каждая занимает два слота. Карты используются для VDI и для базовых задач в ИИ.

NVIDIA A16

NVIDIA A16

Энергопотребление и плотность в стойках

В новых платформах R7725 мы используем блоки питания на 3200 Вт. В самый раз для большинства конфигураций. В части хостов с процессорами EPYC 9374F 3.85 ГГц - используем БП на 2400 Вт.

Что в итоге?

Мы расширили облачную платформу новыми хостами, плотность нагрузки теперь может быть больше в рамках одного хоста. Ускорили работу с NVMe дисками, перешли на PCI-e Gen5, плюсом еще и память подросла по частоте до 6400.

Подробные тесты в прикладных сценариях, включая замеры производительности 1С на EPYC 9555, покажем в следующих статьях. Пока можно глянуть, как мы тестировали 1С на процессорах 9374F 3,85 ГГЦ. Забегая вперед, на обновленной платформе с EPYC 9555 результаты - еще лучше!

Для тестов платформы - можно отправить нам запрос с нашего сайта.

Кстати, облачные серверы с видеокартами NVIDIA L4 сейчас со скидками!

Если остались вопросы по железу или сценариям использования — задавайте, с радостью ответим!