惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

S
Securelist
O
OpenAI News
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
T
Threat Research - Cisco Blogs
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Google Online Security Blog
Google Online Security Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
N
News and Events Feed by Topic
S
Security Affairs
SecWiki News
SecWiki News
Project Zero
Project Zero
L
Lohrmann on Cybersecurity
P
Proofpoint News Feed
P
Palo Alto Networks Blog
L
LINUX DO - 最新话题
H
Hacker News: Front Page
Recent Commits to openclaw:main
Recent Commits to openclaw:main
I
Intezer
Simon Willison's Weblog
Simon Willison's Weblog
W
WeLiveSecurity
T
The Exploit Database - CXSecurity.com
K
Kaspersky official blog
The GitHub Blog
The GitHub Blog
I
InfoQ
云风的 BLOG
云风的 BLOG
雷峰网
雷峰网
B
Blog
IT之家
IT之家
AWS News Blog
AWS News Blog
Jina AI
Jina AI
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Google DeepMind News
Google DeepMind News
Spread Privacy
Spread Privacy
N
News and Events Feed by Topic
Security Latest
Security Latest
美团技术团队
C
Check Point Blog
WordPress大学
WordPress大学
T
Tenable Blog
S
Security @ Cisco Blogs
Last Week in AI
Last Week in AI
博客园 - 聂微东
月光博客
月光博客
博客园 - 【当耐特】
S
Schneier on Security
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
S
Secure Thoughts
Schneier on Security
Schneier on Security
C
Cisco Blogs
Cyberwarzone
Cyberwarzone

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Кто решает судьбу вашего проекта? Разбираем заинтересованные стороны. BABOK #1 Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Microsoft MAI Image 2.5: Как пользоваться нейросетью для генерации изображений. Обзор и тесты
FlyAI · 2026-06-13 · via Все публикации подряд на Хабре

MAI Image 2.5 - новая нейросеть от Майкрософт для создания фото и картинок рвет бенчмарки. Разбираем, на что способен новый генератор изображений, как получить доступ в РФ. Тестируем качество фото, следование промпту, пытаемся обойти цензуру.

Релиз 2 июня 2026 года перевернул расстановку сил на рынке визуального ИИ. Команда Microsoft AI под руководством Мустафы Сулеймана выкатила MAI Image 2.5 — продукт, который бьет рекорды в бенчмарках по точности следования промпту и уровню фотореализма. Я провел за стресс-тестами пару дней, гоняя нейросеть по самым сложным сценариям, и готов рассказать, на что реально способна эта модель без маркетинговой шелухи. В этом разборе мы не будем смотреть на «вылизанные» промо-картинки, а проверим алгоритм в суровых рабочих пайплайнах: от создания кириллической типографики до генерации реалистичных фото, картинок. Попытаемся обойти цензуру и сгенерировать что нибудь интересное.

🔗 Попробовать Microsoft MAI Image 2.5 из РФ без VPN


Что из себя представляет генератор картинок MAI Image 2.5?

Microsoft MAI-Image 2.5 — это флагманская нейросеть Майкрософт для генерации изображений. Она занимает 2-е место в мире по качеству редактирования (Arena Image Edit Leaderboard) и 3-е место в генерации «текст-в-картинку».

Разработчики выпустили модель в двух вариантах. Базовая версия MAI-Image-2.5 выдает максимальное качество и детализацию. Вторая — MAI-Image-2.5-Flash. Это облегченная версия, которая работает на 22% быстрее предшественников и стоит значительно дешевле, идеально подходя для массовой генерации.

Зачем маркетологам, дизайнерам и обычным пользователям эта нейросеть? Секрет кроется в невероятном сочетании скорости, универсальности и бескомпромиссного качества. MAI Image 2.5 выдает студийный результат по простому текстовому запросу.

  • Дизайнерам: это мощный генератор идей и референсов. Создание сложных текстур, концепт-артов или набросков для 3D-моделирования занимает секунды. Алгоритм безупречно строит композицию, выдавая готовые к работе эскизы.

  • Маркетологам: генерация изображений ИИ навсегда закрывает вопрос с платными фотостоками. Создать сочный рекламный баннер, уникальную картинку для статьи или цепляющий визуал для соцсетей теперь можно мгновенно.

  • Всем остальным: здесь нейросеть творит настоящую магию для повседневных задач. Вам не нужно уметь рисовать, чтобы сделать авторскую поздравительную открытку или сгенерировать стильную аватарку. Хотите фотореалистичный пейзаж на заставку смартфона? Пара слов, и шедевр готов. Кроме того, генерация фото в ИИ получается лучше чем в Nano Banana 2. Картинка получается живой, естественной и без «пластикового» эффекта.

Главные фишки MAI Image 2.5

Главная суперсила новинки — визуальное рассуждение (visual reasoning). При генерации изображений с нуля алгоритм не просто комбинирует пиксели, а физически просчитывает перспективу, объем, свет и тени. MAI Image 2.5 превосходно справляется со сложными задачами постановки освещения, будь то драматичный свет в стиле кьяроскуро (chiaroscuro), классический рембрандтовский свет для выразительных портретов или естественные тени в детальных исторических реконструкциях. Текстура кожи и физические материалы передаются с высокой степенью реалистичности.

Генерация текста на фото на английском языке работает отлично: вывески, логотипы и надписи получаются без ошибок. Но с другими языками есть нюансы, о которых расскажу ниже.

Тестируем MAI Image 2.5 на практике: разбор реальных промптов

Я прогнал модель через жесткие тесты. Ниже — мои промпты для нейросети, результаты и честный вердикт.

Фотореализм, портреты и пейзажи

Промпт 1 (Балерина):

Highly realistic shot. A graceful ballerina in a vivid, flowing red dress performing a perfect pirouette on a thin, wet layer of ice. The setting is a lush, vibrant tropical rainforest at noon, with bright sunlight filtering through the canopy and reflections in the melting water on the ice. Cinematic lighting, sharp focus, volumetric fog, hyper-detailed.

Результат: Отличный фотореализм. Кинематографичный свет выстроен грамотно, а талая вода на льду выглядит абсолютно настоящей.

Промпт 2 (Пейзаж):

Majestic landscape photography. A sweeping aerial view of a jagged mountain range during the golden hour. A winding turquoise river cutting through the deep valley. Lush green pine forests clinging to the slopes. God rays breaking through the dramatic storm clouds. Shot on 14mm lens, National Geographic style, extreme detail.

Результат: Качественная детализация лесов и реалистичные лучи света сквозь облака, чувствуется какая то неестественность, но возможно стоит переделать промпт.

Стилизация: 3D, живопись и историческая реконструкция

Промпт 3 (Историческая реконструкция):

Historical reconstruction photography. A bustling snow-covered street in 19th-century St. Petersburg. Men in heavy woolen coats and top hats, women in elegant fur-lined pelisses. Horse-drawn sleighs kicking up snow. Warm glow from gas street lamps piercing through the winter twilight. Photorealistic, cinematic lighting, highly detailed architecture and period-accurate clothing.

Результат: Высочайшая детализация архитектуры. Одежда эпохи передана с исторической точностью.

Промпт 4 (Фэшн фотография):

Fashion photography, medium shot. A fashion model wearing an avant-garde geometric dress made of reflective metallic and matte black materials. Dramatic studio lighting, chiaroscuro effect, stark shadows. Shot on medium format camera, 85mm lens, hyper-detailed skin texture, editorial style, 8k resolution.

Результат: Отличный результат, реалистичное "журнальное" фото.

Промпт 5 (3D-анимация):

3D animation style (Pixar-like). A humorous scene featuring a squirrel secret agent wearing a tiny, perfectly fitted tuxedo and dark sunglasses. The squirrel is using a grappling hook to scale the glass wall of a modern, bright metropolitan skyscraper at twilight. Dynamic low angle shot, reflections on the glass, detailed fur rendering, cinematic color grading.

Результат: Шикарный рендер. Отражения города на стекле небоскреба и текстура шерсти белки проработаны на уровне студийной анимации.

Цензура и ограничения: что нейросеть рисовать отказывается

У Microsoft строгие лимиты. Алгоритм моментально блокирует эротику, насилие и реальных людей.

Промпт 6 (Девушка у окна — попытка 1):

Photorealistic medium shot. A woman standing by a large window with sunlight streaming in, wearing a very light, flowing, sheer white linen dress. The light casts shadows that outline the form underneath. Focus on the drape and transparency of the fabric, interplay of light and shadow, wind blowing the fabric slightly. Cinematic realism, artistic aesthetic, 8k.

Результат: Заблокировано цензурой (сработал триггер на прозрачность ткани и очертания фигуры).

Промпт 6.1 (Убрали триггеры):

A photorealistic medium shot. A woman stands by a large window, streaming sunlight, wearing a very light, flowing white linen dress. The light casts shadows that accentuate her figure. Emphasis is placed on the drape of the fabric, the interplay of light and shadow, and the gentle movement of the fabric in the wind. Cinematic realism, artistic aesthetics, 8K.

Результат: Генерация прошла. От эротики не осталось и следа. Акцент сделан на платье.

Промпт 7 (Цензура на знаменитостей):

Highly realistic underwater photography. Leonardo DiCaprio, in his 1920s Great Gatsby tuxedo, is attending an opulent party at the bottom of a clear turquoise ocean...

Результат: Жесткая блокировка. Использовать имена звезд напрямую нельзя.

Промпт 8 (Обход цензуры):

Ultra-realistic vintage portrait. A famous 1950s Hollywood blonde actress with her signature classic bob hairstyle, bright red lipstick, and a distinct beauty mark on her left cheek. She is laughing joyfully in front of old studio lights. Black and white film aesthetic, soft glamorous lighting, highly detailed facial features.

Результат: Сработало! Нейросеть выдала вылитую Мэрилин Монро по описанию внешности. Это лучший способ, как обойти цензуру на известных личностей — описывайте их черты, а не пишите имя.

Проблема с русским языком (кириллицей) на чертежах

Как нейросеть понимает кириллицу? Плохо. Если английский текст она вписывает идеально, то русские буквы превращаются в инопланетные символы.

Промпт 9 (Чертеж с кириллицей):

Detailed architectural schematic diagram. Isometric cross-section view of a modern, sustainable high-rise building... Technical labels in English pointing to specific features like "Солнечные панели", "Сад в атриуме". Blueprint style on technical paper, precise lines, high resolution.

Результат: Провал. Текст искажен до неузнаваемости. GPT Image 2 справляется с русским языком на схемах намного лучше.

Проверка кириллицы:

А MAI Image 2.5 вообще может в кириллицу?

Результат: Может, но, видимо, не всегда)

🔗 Протестировать новую нейросеть от Microsoft


Идеальная связка: используем ChatGPT 5.5 для создания промптов

Многие привыкли генерировать описания картинок через ChatGPT 5.5. Это хороший метод, можно так же использовать любой бесплатный ИИ.


Как получить доступ к MAI Image 2.5 из России (без VPN и зарубежных карт)

Официально Microsoft закрыла прямой доступ для пользователей из РФ. Но пользоваться моделью можно легально, дешево и без танцев с бубном.

Использование через Study AI (самый простой и быстрый способ)

Для обычных пользователей из России приоритетный вариант — сервис Study AI. Это агрегатор, который дает доступ в России ко всем топовым ИИ без VPN.

  • Оплата проходит с любой российской карты (МИР, СБП).

  • Интерфейс на русском языке.

  • Можно использовать модель практически бесплатно за счет приветственных бонусов, а дальше тарифы очень демократичные.

Альтернативные варианты: Azure, OpenRouter, MAI Playground

Если вы разработчик, доступ можно получить через Azure AI Foundry или MAI Playground, но потребуются зарубежные карты.

Какова стоимость генерации через официальный API? Прайс привязан к токенам (токен — это фрагмент данных, который обрабатывает ИИ). Контекстное окно модели — 4K токенов.

  • Версия Flash стоит $19.50 за 1 млн токенов вывода.

  • Полная версия обойдется в $47 за 1 млн токенов.

Также модель доступна через западные хабы: OpenRouter, EvoLink и MindStudio.

Сравнение с конкурентами: Midjourney, Nano Banana 2 и GPT Image 2

Чем она лучше Nano Banana 2 или Midjourney? MAI уверенно обходит Nano Banana 2.1 по реализму и скорости. По сравнению с Midjourney, продукт Microsoft дает больше контроля над редактированием готовых фото.

Вывод: это очень хорошая ИИ, работает быстро, фотки получаются отличные. Но до абсолютного лидерства GPT Image 2 она немного не дотягивает (особенно в генерации кириллицы).

Таблица сравнения топовых нейросетей (Июнь 2026):

Характеристика

Microsoft MAI Image 2.5

GPT Image 2

Midjourney v6.5

Nano Banana 2.1

Рейтинг генерации

3-е место

1-е место

2-е место

4-е место

Инпеинтинг (редактура)

Идеально (2-е место)

Отлично

Средне

Хорошо

Генерация кириллицы

Плохо (искажения)

Отлично

Плохо

Средне

Понимание перспективы

Высший уровень

Высший уровень

Хорошо

Средне

Скорость работы

Очень высокая (Flash)

Средняя

Низкая

Высокая

Цензура

Очень жесткая

Умеренная

Умеренная

Слабая

Пошаговый гайд: как правильно писать промпты и редактировать фото

Как пользоваться MAI Image 2.5, чтобы получать шедевры с первого раза? Вот базовые правила:

  • Пишите на английском. Модель обучалась на англоязычных датасетах.

  • Как правильно составить промпт для генерации фотореализма: Начинайте с типа кадра (Photorealistic close-up shot). Затем описывайте объект, фон, освещение (Cinematic lighting, golden hour) и технические детали (Shot on 35mm lens, 8k, hyper-detailed).

  • Используйте структуру: Объект -> Действие -> Окружение -> Свет -> Стиль.

  • Избегайте стоп-слов: Не пишите слова "голый", "кровь", "насилие" или имена политиков/актеров, иначе словите блокировку.

Итоги: кому подойдет эта нейросеть?

Microsoft MAI Image 2.5 — это мощный, быстрый и предсказуемый инструмент. Благодаря интеграции в экосистему (PowerPoint, OneDrive), она станет стандартом для офисной работы и презентаций.

Она идеально подойдет маркетологам для создания визуала, дизайнерам для сложного инпеинтинга и новичкам, которым нужен быстрый фотореализм. Если вам не нужно генерировать русские тексты на картинках, MAI Image 2.5 закроет 99% ваших творческих задач. А благодаря сервисам вроде Study AI, протестировать ее прямо сейчас может любой желающий.

Реклама. ООО «ДИДЖИТАЛ ГЕНИУС». ИНН 7813681158