惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

L
Lohrmann on Cybersecurity
B
Blog RSS Feed
人人都是产品经理
人人都是产品经理
WordPress大学
WordPress大学
阮一峰的网络日志
阮一峰的网络日志
小众软件
小众软件
K
Kaspersky official blog
Simon Willison's Weblog
Simon Willison's Weblog
Forbes - Security
Forbes - Security
Webroot Blog
Webroot Blog
Application and Cybersecurity Blog
Application and Cybersecurity Blog
L
LINUX DO - 最新话题
N
News | PayPal Newsroom
爱范儿
爱范儿
Stack Overflow Blog
Stack Overflow Blog
W
WeLiveSecurity
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
J
Java Code Geeks
Attack and Defense Labs
Attack and Defense Labs
AI
AI
F
Full Disclosure
H
Heimdal Security Blog
S
Security Affairs
Engineering at Meta
Engineering at Meta
T
Tailwind CSS Blog
T
The Blog of Author Tim Ferriss
Schneier on Security
Schneier on Security
MyScale Blog
MyScale Blog
月光博客
月光博客
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Google Online Security Blog
Google Online Security Blog
Recent Commits to openclaw:main
Recent Commits to openclaw:main
云风的 BLOG
云风的 BLOG
A
About on SuperTechFans
D
Darknet – Hacking Tools, Hacker News & Cyber Security
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
GbyAI
GbyAI
The Register - Security
The Register - Security
博客园 - 司徒正美
Cyberwarzone
Cyberwarzone
V
V2EX
S
Security @ Cisco Blogs
博客园_首页
博客园 - 叶小钗
T
Tor Project blog
T
The Exploit Database - CXSecurity.com
Last Week in AI
Last Week in AI
AWS News Blog
AWS News Blog
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
Hugging Face - Blog
Hugging Face - Blog

Все публикации подряд на Хабре

Ловим музу за клавиатуру: как айтишнику стать автором Что умеет Midjourney в 2026? Мой немного грустный разбор этого шикарного инструмента Никто не любит писать тесты, но ИИ может исправить это IPv8 выглядит как мечта. Поэтому почти наверняка не взлетит Производители вернули в продажу материнки с DDR3. Что происходит? Управление агентом с телефона через Telegram теперь в KodaCode От координации к лидерству: как меняется роль руководителя разработки Я сделала родителям бизнес вместо пенсии: зарабатываем 70 тысяч, мама не даёт продать В три раза быстрее приемка товара и оптимизация трудозатрат на 73%: как «РСТ-Инвент» помог Gulliver Group ИИ-шечный мир победил? О влиянии искусственного интеллекта на игропром Кремль снижает давление на Телеграмм пока Европа строит интернет по паспорту Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением Как (не) потерять домен за выходные Вместо 8 разных VPS: как я организовал практику студентам на одном сервере Почему твой Open Source проект не замечают? R&D: искусство управления неопределенностью в разработке AI-дефляция: вакансий для разработчиков больше, а рост зарплат — худший за 15 лет Мы отдали управление роботами OpenClaw. Что из этого вышло Галактический ID: система идентификации для всех форм разумной жизни Шесть основ бизнес-анализа: начинаем с вопроса «Кто в игре?» Код-ревью, в котором дело не в коде Данные переехали. Команда — нет Системной подход к сдаче OSWE в 2025 Почему комната управления реактором покрашена в цвет морской пены 4 YAML-файла вместо PySpark: как аналитикам строить пайплайны без разработчиков LLM-агент для поиска свободных доменов: автоматизируем подбор Когда, зачем и как правильно начинать новую сессию в Claude Code? Как я заставил нейросеть писать макросы для FreeCAD Анатомия ИИ‑агента для подбора персонала. От тысячи резюме к топ‑10 за минуты Опыт разработчика как экономика внимания Автономность как точка невозврата: кто будет субъектом в цифровом будущем Обучение ИИ в «диких» условиях: как рутинные действия превращаются в датасеты Как измерить LLM для задач кибербеза: обзор открытых бенчмарков Где хранить код? Сравнение GitHub, GitLab и Bitbucket Математика объясняет, почему нормальное распределение встречается повсюду Почему ваш FinOps не работает: 12 тезисов от практиков Как подписать проектную документацию УКЭП с использованием бесплатных лицензий Pilot Адаптивное администрирование Sigla Vision Я грузил уран в бочки, а потом 20 лет строил ИТ в атомной отрасли Чем позвонить с Эвереста? История и обзор спутниковой связи. Часть 2 Как языковая модель помогает контролировать качество инструктажей по охране труда в металлургии Как не передать на desktop свой IP в РКН Анатомия SAP Privileges: как устроено управление правами в macOS MoneyDev: Сказка про три главных слова Обновлённый токенизатор видео K-VAE 2.0 от Сбера Как сделать диспетчеризацию дома на 1284 квартиры почти бесплатно Как мы разогнали железную дорогу Мы дали агентам рутину. Теперь надо решить — что делать с освободившимся временем Токсичный контент, промпт-хакинг и защита ИИ — всё о Guardrails для LLM Умный город начинается с точного взгляда: как «Фалькон Тех» меняет пространство к лучшему Навайбкодил приложение для анализа графов Почему Дюну так интересно читать? Упрощаем работу с рутиной или как стать Гендальфом Белым Деконструкция Go: CPU, RAM и что там происходит. Go Assembler база. Часть 1.1 Какие профессии исчезнут из-за ИИ, а какие появятся? И что с этим делать Как мы построили IT-отдел, где хочется расти: архитектурные встречи, прозрачные метрики и книжные подарки Rufler: Делаем из Claude Code автономный рой через один YAML-конфиг Sing-box и белый список приложений Как построить надёжный обмен сообщениями в микросервисах: лучшие практики для enterprise OpenAI строит MLM-пирамиду, а McKinsey и Accenture помогают ей в этом Дом, который не построил Фишер (Часть 2) «Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки Мультимодальные модели – грубый и дорогой инструмент Разговоры ничего не стоят. Код тоже Проверки физических лиц: с кого начнет ФНС Топ-10 бесплатных нейросетей для создания видео в 2026 году Первые слои кода: как наши решения сегодня определяют архитектуру ИИ на десятилетия Разработка нового статического анализатора: PVS-Studio JavaScript Поиск уязвимостей ПО: базовый минимум или роскошный максимум Почему оценка персонала не работает как инструмент управления Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50% Как я ушел из найма, нажарил косточек и продал на маркетплейсах на 168 млн в год Когда 1С:ERP уже внедрена, а нормального производственного плана всё ещё нет Как я сделал Claude мультимодальным, подключив к нему Qwen Omni Как приглашение на вакансию мечты превращается в атаку Infrastructure as Code: философия и лучшие практики IaC Тестируем Yandex Code Assistant на задаче, в которой нужно хранить секреты nxs-universal-chart v3.0: новое поколение универсального Helm-чарта Callback Injection: Техника, которая отправила Microsoft Defender в глухой нокаут «Все идеи на стол»: митап как способ вывести проект из тупика Сегодня я узнал нечто новое о GPU благодаря багу в своей игре Как заставить LLM ̶ ̶г̶а̶л̶л̶ю̶ ̶ эволюционировать Карта событий как фундамент аналитики: практический кейс для E-commerce Что выбрать для AI: x86, ARM или RISC-V? Дайджест железа за март Роль соматических мутаций в развитии аутоиммунных заболеваний: путь к избирательной терапии Mythos от Anthropic — тревожный сигнал для всех, а не только для банков Guardrails для LLM на Java: как приручить промпт‑инъекции и токсичные ответы Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение Финансовая гонка вооружений: почему умные люди добровольно в ней участвуют Эра ИИ-агентов наступила: выбираем лучшего цифрового сотрудника # Практический опыт внедрения WinCC Redundancy на производственном предприятии Сделал MVP за 3 дня, а потом неделю прикручивал оплату. Оно того стоило? Физика против Маска: почему Starship V3 может оказаться ещё одной катастрофой Нефть Венесуэлы: крупнейшие запасы в мире, но не крупнейшая нефтяная держава JPA 4. Переосмысление Hibernate Почему зеркальная фотокамера Nikon D5 десятилетней давности идеально подошла для миссии «Артемида-2» Проект «Уровень-Спутник» или как мы сделали платформу для гидрологов «Замедлиться, чтобы ускориться»: почему ИИ повышает цену ошибок в требованиях и архитектуре Как с нуля поднять трафик IT-компании на 1657% при бюджете 55 тыс. и выжить Pixel-perfect Downsampling — идеальная отрисовка 50 миллионов точек без потерь
Как написать дипломную работу нейросетью, если даже Даниэль Дефо не проходит ИИ-детектор
ai_scientist · 2026-06-18 · via Все публикации подряд на Хабре

Как написать дипломную работу нейросетью, если даже Даниэль Дефо не проходит ИИ-детектор

5 мин

256

Если плагиат оценивает текст великого классика как сгенерированный, что делать обычному студенту, который использует современные технологии для обучения? Разбираемся.

В конце секретный лайфхак, как вычищать из текста все генеративные признаки.

«Робинзона Крузо» написала нейросеть?

Есть такой тест, который академики и журналисты периодически проводят ради забавы: берут классику мировой литературы и прогоняют через детектор ИИ. Результаты неизменно выходят неловкими.

Отрывки из «Робинзона Крузо» набирают от 20 до 40% вероятности машинной генерации. Хемингуэй с его обрубленными предложениями — ещё больше.

При этом в ВКР нельзя допускать более чем 5% сгенерированного текста.

Дефо писал в 1719 году. Нейросетей не было ещё триста лет. Но его ровный информационный стиль, прямые предложения, предсказуемая структура абзацев — всё это ровно то, за чем охотятся детекторы. Дефо — мастер гипотетического: он выстраивает сослагательные наклонения, условные конструкции, модальные глаголы — методы, которые алгоритмически логичны, но служат целям, которые ИИ не распознаёт. Детектор видит паттерн и ставит галочку. Это не баг, это особенность того, как работает детекция.

Что происходит с детекторами ИИ в вузах прямо сейчас

Студентов не допускают до защиты дипломных работ из-за использования ИИ. Причём «Антиплагиат» массово не принимает курсовые и дипломные работы — система находит в материале сгенерированный нейросетью текст там, где автор всё писал самостоятельно.

История дошла до судов. Студентку отчислили после того, как кафедра не допустила работу к защите. В ходе разбирательства представитель вуза подтвердил, что преподаватель не проверял текст на генерацию должным образом. Суд обязал университет восстановить девушку, допустить её к защите при оригинальности текста от 50%, а также выплатить 40 тысяч рублей компенсации и штраф в размере 20 тысяч рублей.

Система «Антиплагиат» выявила использование ИИ в трети студенческих работ. В марте стало известно, что Совфед готовит законопроект по ограничению использования ИИ в образовании — эксперты указывают, что примерно половина студентов пишет работы при помощи нейросетей.

Парадокс в том, что ужесточение требований ударило по тем, кто нейросети не использовал. Машины, призванные отсеивать «нечестные» дипломы, начали выбраковывать и работы, написанные от первой до последней страницы живым человеком. Студентка факультета журналистики РЭУ им. Плеханова самостоятельно подготовила дипломную по PR-стратегиям — детектор всё равно поднял флаг.

Почему так происходит? AI-детекторы анализируют текст на основе паттернов, синтаксиса и структуры. Нет единого стандарта пороговых значений: Turnitin флагирует текст как ИИ-сгенерированный при значении от 20 до 100%. Исследователи обнаружили, что в диапазоне от 1 до 19% процент ложных срабатываний значительно выше. То есть детектор с высокой вероятностью ошибается именно тогда, когда цифра небольшая — а именно такие цифры сейчас пугают студентов.

По данным Washington Post, в одном из исследований ложноположительный результат выдавался в 50% случаев. Половина человеческих текстов — помечена как ИИ. Дефо бы не прошёл. Хорошо написанный диплом — тоже под угрозой.

Что такое детектор ИИ и почему его нельзя воспринимать как приговор

Детектор работает на двух метриках. Первая — perplexity: насколько «неожиданны» следующие слова в тексте. Нейросеть выбирает статистически вероятные продолжения, поэтому её текст предсказуем. Человек пишет живее, иногда — вопреки логике. Вторая метрика — burstiness: насколько варьируется длина предложений. Люди делают это интуитивно, ИИ — монотоннее.

Разные инструменты используют разные подходы: одни анализируют perplexity и разнообразие предложений, другие применяют нейронные сети, обученные на известных ИИ- и человеческих текстах. Поэтому 60% в одном детекторе не равно 60% в другом — каждый результат нужно рассматривать как один из сигналов, а не как абсолютную истину.

Сам «Антиплагиат» указывает: ИИ-детекторы нужно рассматривать не как доказательство нечестной работы, а как маркер, помогающий экспертам делать более обоснованные выводы при проверке. Это принципиально важно: если вас флагануло, это не приговор. Но это и не повод расслабляться.

Как работать с нейросетью над дипломом так, чтобы детектор не сработал

Запрос понятен: нейросеть помогает, но финальный текст должен читаться как человеческий. Это реально — если понимать, чего детекторы боятся.

Есть один ресурс, про который почти никто из студентов не знает: страница Wikipedia Signs of AI writing (https://en.wikipedia.org/wiki/Wikipedia:Signs_of_AI_writing). Её создал WikiProject AI Cleanup — группа редакторов, которая несколько лет вручную вычищала машинные тексты из энциклопедии и записывала наблюдения. В документе 24 паттерна: от слов-маркеров вроде testament, delve, landscape до структурных привычек — злоупотребления списками, тире и «правилом трёх» (innovation, inspiration, and insights).

Англоязычные маркеры легко прослеживаются в русском: часто всплывает калька «является/представляет собой», «в рамках», «данный», «высокий уровень», «надёжно демонстрирует», тройные перечисления и «красивые» обобщения. Если вы видите в своём тексте «данный феномен представляет собой важный вклад в развитие» — вы знаете, что исправлять.

Вот как это работает на практике.

Заходите на страницу Signs of AI writing, копируете весь текст в PDF. Загружаете этот PDF в нейросеть — Claude, DeepSeek или любую другую через SpeShu.AI — вместе со своим текстом. Задаёте нейросети задачу: отредактировать текст, избегая паттернов из этого документа, и указывать, какие именно конструкции она меняет и почему.

Вот рабочий промпт:

«Ты — редактор академических текстов. В приложенном PDF — список признаков ИИ-генерации, составленный сообществом Википедии. Изучи его. Теперь прочитай мой текст ниже. Найди все места, где он содержит паттерны из этого списка: шаблонные вводные конструкции, слова-маркеры, тройные перечисления, расплывчатые обобщения, безличные формулировки, избыточное форматирование. Для каждого такого места: процитируй оригинал, объясни, какой паттерн нарушен, и предложи переформулировку живым языком. Не переписывай весь текст — работай точечно, по фрагментам».

Загружаете ВКР по частям — по главе или по разделу — и получаете отредактированный вариант с объяснениями. Не просто «исправленный», а именно с разбором: вот здесь было «демонстрирует значимость», вот почему это маркер, вот как звучит то же самое без него.

Создать один диалог и долго вести его без VPN и западной подписки можно в SpeShu.AI. Сервис открывает доступ к лучшим нейросетям для диплома — от ChatGPT-5.5 до Claude Opus 4.8. А ещё приятнее пользоваться сервисов, когда есть бонус. Получите его по промокоду HABRTSNIS15.

После прогона через нейросеть — обязательно читаете вслух. Всё, что спотыкается, что звучит официальным некрологом, что можно вставить в любой другой диплом без потери смысла — правите вручную. Ваш опыт, ваши примеры, ваши интонации детектор не поймает никогда.

Почему это работает

Детектор ловит предсказуемость. Нейросеть без редактуры пишет предсказуемо: выбирает самые вероятные слова, строит ровные абзацы, не меняет темп. Когда вы используете нейросеть как инструмент редактуры — а не как автора — и при этом осознанно убираете её собственные следы по гайду Википедии, предсказуемость уходит.

Остаётся структура, которую вы задали. Аргументы, которые вы выбрали. Примеры из вашей практики или вашего исследования. Источники, которые вы прочитали. Нейросеть помогла сформулировать это чище — но логика и содержание ваши.

Российские университеты активно внедряют проверку: «Антиплагиат» и другие системы добавили модули определения ИИ-текстов. Преподаватели получают процент «вероятности ИИ-генерации» для каждой работы. Высокий процент — это основание для разговора с преподавателем, а не автоматическое обвинение. Но лучше до этого разговора не доводить.

Дефо написал «Робинзона Крузо» так, что через триста лет алгоритм принял его за машину. Это не делает детектор умным. Но это отличный повод понять, как он работает — и писать так, чтобы он видел человека.