惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Recorded Future
Recorded Future
Recent Commits to openclaw:main
Recent Commits to openclaw:main
D
DataBreaches.Net
月光博客
月光博客
I
InfoQ
Microsoft Azure Blog
Microsoft Azure Blog
Security Latest
Security Latest
S
SegmentFault 最新的问题
K
Kaspersky official blog
T
Threat Research - Cisco Blogs
V
V2EX
GbyAI
GbyAI
The Last Watchdog
The Last Watchdog
Cyberwarzone
Cyberwarzone
Project Zero
Project Zero
J
Java Code Geeks
Schneier on Security
Schneier on Security
Attack and Defense Labs
Attack and Defense Labs
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
G
Google Developers Blog
WordPress大学
WordPress大学
B
Blog RSS Feed
Hugging Face - Blog
Hugging Face - Blog
H
Help Net Security
MongoDB | Blog
MongoDB | Blog
B
Blog
www.infosecurity-magazine.com
www.infosecurity-magazine.com
博客园 - Franky
Spread Privacy
Spread Privacy
C
CERT Recently Published Vulnerability Notes
H
Hackread – Cybersecurity News, Data Breaches, AI and More
Know Your Adversary
Know Your Adversary
Recent Announcements
Recent Announcements
The GitHub Blog
The GitHub Blog
C
Check Point Blog
Latest news
Latest news
W
WeLiveSecurity
小众软件
小众软件
H
Hacker News: Front Page
P
Privacy & Cybersecurity Law Blog
H
Heimdal Security Blog
博客园 - 叶小钗
N
News | PayPal Newsroom
IT之家
IT之家
P
Proofpoint News Feed
Apple Machine Learning Research
Apple Machine Learning Research
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
T
Tenable Blog
腾讯CDC
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Кто решает судьбу вашего проекта? Разбираем заинтересованные стороны. BABOK #1 Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Умеет ли Алиса AI выдавать случайное число?
konstantinms · 2026-06-14 · via Все публикации подряд на Хабре

Простой

4 мин

652

Таким вопросом я задался после просмотра розыгрыша от Яндекса. У ведущего был список участников [номер имя] и он просил Алису назвать случайное число от 1 до 6296. Было 15 попыток и среди ответов не было чисел меньше 100, что смутило ведущего, он даже хотел поменять диапазон, но команда поддержки ему не разрешила. Посчитаем, с какой вероятностью могло выпасть число от 1 до 99, получим 0.78%. Немного. Но вопрос о случайности чисел меня заинтересовал.

p_single = (6296 - 99) / 6296
prob_all = p_single ** 15

У меня нет желания генерировать числа по 1, поэтому я попросил Алису написать сразу 1000 чисел в диапазоне от 1 до 1000. Получив ответ, что

Сгенерировать и вывести 1 000 случайных чисел от 1 до 1 000 прямо здесь технически сложно — список получится очень длинным (займёт много места в чате и будет неудобен для восприятия).

Алиса отказалась выдавать 1000 чисел, согласилась на 500 чисел от 1 до 500. Я ожидал, что чисел меньше 10 не будет.

Первый раз (ответ 1) она мне вывела 340 чисел, среди них ни одного от 1 до 9. Интересно, подумал я, отложил это все.

Алиса, ответ 1: 340 чисел вместо 500, есть пропуски, но кажутся некритичными

Алиса, ответ 1: 340 чисел вместо 500, есть пропуски, но кажутся некритичными

Вернувшись через неделю, я начал писать эту заметку и в том же чате с Алисой попросил сгенерировать еще 500 чисел. На этот раз чисел было 811 (ответ 2) и генерация остановилась на запятой, как будто сработал какой-то механизм LLM типа max_new_tokens, не берусь утверждать.

LLM генерируют ответ по токенам, и у них есть лимит (например, 4096 токенов). Когда ответ обрывается на запятой или на незаконченном числе – это почти гарантированно достижение лимита, а не «случайность».

Алиса, ответ 2. Больше 500 чисел и подозрительные пропуски

Алиса, ответ 2. Больше 500 чисел и подозрительные пропуски

Следующий ответ был из 812 (ответ 3) чисел и последним было число 3, то есть меньше 10. Увидев 3, я подумал, что ничего интересного из этого не выйдет и сделал еще 2 генерации. Ответ 4 оказался точно таким же, как ответ 3, только оказалось, что число 3 на самом деле было числом 356, то есть в прошлом ответе снова сработал механизм остановки, который я не заметил и который обрезал число.

Алиса, ответ 4. Такой же как ответ 3, кроме последнего числа

Алиса, ответ 4. Такой же как ответ 3, кроме последнего числа

Ответ 5 был из 812 чисел и снова оборвался на запятой.

Алиса, ответ 5. Примерно тоже самое

Алиса, ответ 5. Примерно тоже самое

Для сравнения привожу псевдослучайную последовательность для randomint в питоне.

random.seed(42) 
python_random = [random.randint(1, 500) for _ in range(500)]
На графике видно равномерное заполнение всего диапазона 1–500, без пропущенных десятков.

На графике видно равномерное заполнение всего диапазона 1–500, без пропущенных десятков.

Судя по 5 запросам, Алиса пропускает не просто первые 10-100 (в случае розыгрыша) чисел, а целые диапазоны.

Здесь и далее пробую новый промт:

выведи ровно 500 случайных чисел с равномерным распределением от 1 до 500 через запятую

Получаю 807 чисел, в конце 7, но явно снова сработал механизм остановки.

Алиса, ответ 6. Лучше не стало. Привожу вместе с равномерным распределением

Алиса, ответ 6. Лучше не стало. Привожу вместе с равномерным распределением

А открыв новый чат и повторив запрос, я получил все числа от 1 до 500 включительно по порядку, т.е. не случайную последовательность.

Пробую другие модели. Гигачат, режим “Гига”. Мы с ним начали торговаться, 500 чисел он не стал делать из-за ограничений ответа

Я не могу вывести ровно 500 случайных чисел в одном сообщении, так как ответ будет обрезан из-за ограничений на длину сообщения.

а на 100 числах он признался, что

Я не могу сгенерировать список из 100 случайных чисел, так как у меня нет доступа к инструменту генерации случайных чисел.

Deepseek. Режим без размышлений и поиска.

DeepSeek. Ровно 500 чисел

DeepSeek. Ровно 500 чисел

Вполне неплохо. Вот только если спросить его про генератор псевдослучайных чисел, то он ответит:

Да, у меня есть доступ к генераторам псевдослучайных чисел (ГПСЧ) через вычислительную среду, в которой я работаю.

Уточняю у Алисы и она отвечает:

Конечно, у меня есть возможность генерировать псевдослучайные последовательности чисел 🎲

Хотя технически я не храню внутреннее состояние генератора (как, например, в криптографических системах у Алисы из примера с подписью Лэмпорта), я могу создавать равномерно распределённые, случайные на вид последовательности по твоему запросу — хоть числа, хоть буквы, хоть комбинации.

Например, вот 10 случайных чисел от 1 до 100:

42, 17, 89, 3, 55, 73, 21, 96, 14, 68

Прошу сгенерировать 100 случайных чисел от 1 до 100, снова получаю все числа от 1 до 100, но уже в случайном порядке

47, 13, 89, 3, 62, 75, 28, 91, 19, 54,
7, 33, 66, 84, 22, 5, 98, 41, 77, 16,
59, 38, 82, 26, 71, 11, 94, 45, 63, 30,
79, 1, 50, 86, 35, 68, 24, 92, 43, 57,
18, 73, 39, 87, 31, 64, 9, 52, 76, 29,
81, 14, 60, 37, 95, 23, 67, 48, 8, 55,
70, 34, 83, 12, 78, 46, 61, 20, 90, 36,
69, 27, 85, 10, 53, 72, 40, 88, 15, 65,
49, 74, 25, 97, 32, 58, 44, 80, 17, 6,
93, 21, 56, 42, 99, 2, 51, 96, 4, 100

GPT и другими я не пользуюсь, если кто хочет поэкспериментировать, тут оставил блокнот, нужно только вставить ответ нейросети.

Я не специалист по LLM, поэтому возможные причины такого поведения Алисы приведу со слов DeepSeek:

Почему нейросеть избегает чисел от 1 до 9?

  • Токенизация: В большинстве LLM числа 1–9 — это отдельные токены, а числа 10–500 часто разбиваются на два токена (например, “47” → [“47”] или [‘4’,‘7’] в зависимости от модели). Модель могла выучить, что «случайные числа» чаще выглядят как двузначные или трёхзначные.

  • Смещение в обучающих данных: В интернете при перечислении «случайных чисел» люди редко пишут однозначные числа (например, в примерах кода или в учебных задачах чаще фигурируют числа от 10 до 100).

  • Иллюзия случайности: Модель могла оптимизировать ответ, чтобы он казался человеку «более случайным» (однозначные числа воспринимаются как менее случайные в контексте большого диапазона).

По полученным результатам, я бы не стал использовать Алису для розыгрышей. И не стал бы просить генерировать набор чисел в одном чате.

Еще раз обращаю внимание, что эксперимент был немного изменен от того, что был в розыгрыше, в том плане, что все числа помещались в 1 ответ. Возможно, если запросы делать по 1, результат будет другим.

Пока алгоритмы те же, я бы старался оказываться не в начале списка.