惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

W
WeLiveSecurity
O
OpenAI News
www.infosecurity-magazine.com
www.infosecurity-magazine.com
H
Hacker News: Front Page
P
Proofpoint News Feed
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
The GitHub Blog
The GitHub Blog
S
Secure Thoughts
The Last Watchdog
The Last Watchdog
Attack and Defense Labs
Attack and Defense Labs
C
Cyber Attacks, Cyber Crime and Cyber Security
C
Cybersecurity and Infrastructure Security Agency CISA
C
Cisco Blogs
T
The Blog of Author Tim Ferriss
N
News and Events Feed by Topic
L
LINUX DO - 最新话题
Y
Y Combinator Blog
Google DeepMind News
Google DeepMind News
The Hacker News
The Hacker News
Apple Machine Learning Research
Apple Machine Learning Research
Jina AI
Jina AI
N
News and Events Feed by Topic
WordPress大学
WordPress大学
S
Securelist
K
Kaspersky official blog
Help Net Security
Help Net Security
Application and Cybersecurity Blog
Application and Cybersecurity Blog
P
Privacy International News Feed
Blog — PlanetScale
Blog — PlanetScale
Vercel News
Vercel News
The Register - Security
The Register - Security
A
About on SuperTechFans
D
Darknet – Hacking Tools, Hacker News & Cyber Security
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
博客园 - 叶小钗
月光博客
月光博客
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
酷 壳 – CoolShell
酷 壳 – CoolShell
Recorded Future
Recorded Future
L
LINUX DO - 热门话题
B
Blog RSS Feed
Recent Commits to openclaw:main
Recent Commits to openclaw:main
MyScale Blog
MyScale Blog
Security Latest
Security Latest
N
News | PayPal Newsroom
爱范儿
爱范儿
GbyAI
GbyAI
C
CXSECURITY Database RSS Feed - CXSecurity.com
T
Threatpost
V
V2EX

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Бритва Оккама против сложности: когда машинное обучение побеждает, а где сбоит в инвестициях
Finam_Broker · 2026-06-17 · via Все публикации подряд на Хабре

Бритва Оккама против сложности: когда машинное обучение побеждает, а где сбоит в инвестициях

Средний

4 мин

293

Принцип «бритвы Оккама» — краеугольный камень социальных наук. Для экономистов-финансистов он почти аксиома. Принцип назван в честь Уильяма Оккама, монаха XIV века. Согласно ему, самое простое объяснение любого явления — лучшее.

Как пишет The Economist, в настоящее время финансовые аналитики боятся «переобучения» — создания модели, которая благодаря своей сложности хорошо соответствует существующим данным, но плохо предсказывает будущее. Однако тут проявляется принцип Оккама. По новым данным, когда дело касается больших моделей машинного обучения, экономия переоценивается, а сложность может стать определяющим фактором. Если это так, методы современного инвестирования значительно изменятся.

Для тех, кто строит торговые стратегии, это не просто академический спор. Это вопрос о том, какую архитектуру выбирать, какие данные собирать и на какие компромиссы идти.

Эксперимент, который всё изменил

Дискуссия началась в 2021 году, когда Брайан Келли и Кангинг Чжоу из Йельского университета, а также Семен Маламуд из Швейцарского федерального технологического института в Лозанне опубликовали книгу «Преимущество сложности в прогнозировании доходности». В одном из экспериментов соавторы проанализировали данные всего за 12 месяцев, используя модель с 12 тыс. отдельных параметров.

Использование такого большого количества параметров, противоречащее принципу Оккама, обычно повышает риск переобучения. Однако сложность, по-видимому, на самом деле помогла модели прогнозировать будущее. Авторы статьи задались вопросом: может ли принцип Оккама быть ошибкой Оккама?

Пока это академическая дискуссия, но её итог будет иметь серьёзные последствия. Келли также является управляющим портфелем в количественном хедж-фонде AQR. Компания когда-то прославилась использованием более традиционных и экономных методов, чем её конкуренты. В настоящее время она использует очевидные преимущества сложности. Келли считает, что исследователи, опасавшиеся переобучения данных, слишком мало беспокоились о недообучении. Более точные прогнозы с использованием небольших наборов данных могут приносить значительную прибыль.

Проблема малых выборок и альтернативных данных

Многие финансовые исследования тормозятся малыми размерами выборок и сложностью проведения экспериментов. Сбор большего количества данных часто требует ожидания, а в некоторых областях их ещё и просто мало.

При изучении экстремальных событий, таких как обвалы рынка, банковские паники и суверенные дефолты, исследователи часто располагают лишь несколькими примерами из современной истории. Хедж-фонды, стремясь получить преимущество, тратят миллиарды долларов на альтернативные данные — от спутниковых снимков китайского железнодорожного движения до настроений инвесторов, собранных из социальных сетей.

Для создателя стратегий это означает, что конкурентное преимущество всё чаще лежит не в области изощрённой математики, а в умении находить, очищать и структурировать нетривиальные данные.

Критика: где сложность терпит поражение

В последнее время споры о сложности достигли апогея. Келли и его соавторы столкнулись со шквалом критики.

Альваро Картеа, Ци Цзинь и Юаньтао Ши из Оксфордского университета считают, что преимущества сложности заканчиваются там, где данные собраны некачественно, содержат ошибки или неточности. Это важное напоминание для инженеров: никакая модель не исправит мусор на входе.

Стефан Нагель из Чикагского университета предполагает, что для малых наборов данных сложные модели фактически имитируют стратегию торговли на основе импульса. По его мнению, их успех — это «счастливое совпадение».

Келли и Маламуд ответили критикам ещё одним подробным документом, настаивая: преждевременно превозносить принцип Оккама. Даже скептики не отвергают полностью идею о том, что большие, сложные модели могут давать лучшие прогнозы, чем более простые. Критики считают, что это не всегда так.

Что изменится в работе инвесторов

Между тем, если преимущество сложных стратегий реально, работа многих инвесторов значительно изменится.

Самым важным шагом станет найм лучших специалистов по машинному обучению. Увеличится роль приобретения и очистки данных. Миллиардные зарплаты, которые технологические компании предлагают топовым программистам, начнут появляться и в инвестиционных фирмах.

Инвестиционные компании также получат больше преимуществ от масштабирования. Вычислительная мощность, необходимая для обучения и запуска моделей, стоит дорого. Она может стать своеобразным «защитным рвом», защищающим крупные хедж-фонды от конкуренции. Более крупные игроки смогут позволить себе больше экспериментировать с более широким спектром классов активов. Мелкие конкуренты едва ли будут поспевать за ними.

Риски «чёрного ящика»

Снижение конкуренции — не единственный риск. Люди всё ещё пытаются понять, как работают самые передовые модели машинного обучения. Инвесторы могут всё больше полагаться на алгоритмы «чёрного ящика», которые очень сложно интерпретировать.

Преимущества небольших моделей заключаются в том, что их не только легко внедрять, но также легко обдумывать и корректировать. Немногие будут жаловаться, пока они зарабатывают деньги. Тем не менее, если с новыми моделями что-то пойдёт не так — от банальной неэффективности до краха целых инвестиционных стратегий — инвесторы будут искать другие инструменты для преодоления сложностей.

Для инженера рынка это означает, что выбор между простотой и сложностью — не абстрактный философский вопрос. Это trade-off между интерпретируемостью и потенциальной доходностью, между контролем и масштабом.

Инфраструктура для сложных стратегий

Дискуссия о сложности имеет и прикладное измерение. Какими бы мощными ни были модели, их ценность обнуляется, если инфраструктура не позволяет исполнять сделки с необходимой скоростью и надёжностью. Для алготрейдеров и создателей стратегий это означает, что нужен не только интеллект, но и «железо», способное за доли секунды превратить сигнал в сделку.

Для тех, кто дочитал до этого места — ниже инфраструктурные и аналитические решения "Финама", которые позволяют не только разрабатывать, но и реализовывать сложные стратегии на российских и мировых рынках.

Финам AI-скринер
Анализ 15 000+ акций, облигаций, ETF на MOEX, NYSE, NASDAQ, HKEX, TSE, SSE, SZSE. 200+ собственных метрик: инвестиционная привлекательность, риски, прогнозы ИИ. Бэктест стратегий, конструктор стратегий, API для выгрузки данных.

Spread Insight — мониторинг арбитража
Скринер статистического и межбиржевого арбитража на MOEX, NYSE, CME, Forex и криптобиржах. Конструктор спредов, ИИ-ассистент для поиска идей, бэктестер, уведомления в Telegram.

Прямой доступ на MOEX (DMA)
Задержки 250–300 мкс — в сотни раз быстрее стандартных терминалов. Для маркет-мейкеров, HFT-трейдеров, арбитражников, проп-трейдеров.

Финам Trade API
Доступ к MOEX, NYSE, NASDAQ через единый API. Скорость от 7 мс. SDK на GitHub, песочница. Подходит для разработки на Python, C++, Go.