Глава 2 — Почему сейчас

Глава 2 · ФЕРРИС — разговорный

Апрель 2025. Тоби Лютке рассылает письмо сотрудникам Shopify, а потом сам же вывешивает его публично. В нём два правила, встроенных прямо в performance review.

Первое: работать с ИИ — это больше не «плюс», не «продвинутый навык». Это базовый стандарт, как умение пользоваться электронной почтой.

Второе жёстче. Прежде чем проситься за новой ставкой в штат, команда обязана обосновать, почему задачу нельзя сделать через ИИ. Не «мы сначала попробуем автоматизировать», а полноценная аргументация: вот почему живой человек здесь незаменим [E].

Представьте, куда это письмо приземляется. Конкретный тимлид, конкретный понедельник, компания размером с Shopify. Назову его просто — руководитель группы поддержки (это условный типаж, не реальное лицо). У него горит найм: две вакансии висят с зимы, очередь тикетов растёт, команда перегружена. До письма план был очевиден: закрыть найм, залить проблему людьми. Теперь между ним и двумя ставками стоит абзац из письма CEO.

Следующие двое суток он не нанимает. Вместо этого садится и разбирает: что именно делали бы те двое, которых он хотел взять? Получается три функции: сортировать обращения, отвечать по шаблону, передавать сложное человеку. Первые два пункта — ровно то, с чем артефакт уже справляется. Третий — нет. В итоге он пишет не заявку на хедкаунт, а заявку на другое: чтобы оставшийся человек надзирал за артефактом вместо того, чтобы разгребать очередь руками.

Письмо никого не уволило. Оно поменяло вопрос, с которого начинается каждый понедельник.

Подумайте, что именно Лютке перевернул. Headcount — это была базовая единица сборки фирмы последние сто лет. Весь организационный ДНК строился вокруг него: найм, бюджеты, грейды, статус, оргструктуры. Он был дефолтным ответом на рост — почти автоматическим. Теперь он стал исключением, которое надо защищать. Базовая единица, из которой собирают компанию, сменилась.

Это ключевое изменение главы, и оно приводит к вопросу: почему именно сейчас? Почему не в 2023-м, когда ChatGPT уже взорвал мозг половине планеты? И почему не в 2028-м, когда «технология дозреет»? Что именно щёлкнуло в 2025–2026, что письмо Лютке перестало звучать визионерством и стало читаться как операционная директива?

Ответ — три кривые, которые сошлись в одной точке. Плюс честный контр-факт, без которого картина была бы неполной.

Три кривые в одной точке

Манифесты — это слова. Лютке, Альтман, Бениофф, Амодеи — они все говорят убедительно, и их хор легко списать на тот же хайп-цикл, что был с блокчейном. Давайте отложим риторику. Вот что было измерено.

Кривая первая: рухнул порог входа. Стоимость инференса на уровне качества GPT-3.5 — цена за миллион токенов — упала примерно в 280 раз: с $20 до $0,07 за Mtok, с конца 2022 по конец 2024 (Stanford HAI AI Index 2025) [E]. Два порядка за два года. То, что три года назад по бюджету требовало небольшого отдела, сегодня стоит как обед. Это не прогноз вендора и не модель из инвестиционного меморандума — это зафиксированный факт из годового отчёта Стэнфорда. Субстрат, на котором работает любой артефакт — скилл, агент, eval, — подешевел настолько, что вопрос «по карману ли нам это» снялся сам собой.

Но дешевизна без надёжности — это игрушка. Потому вторая кривая важнее.

Кривая вторая: растущая надёжность. METR — некоммерческая лаборатория оценки моделей — фиксирует «агентный горизонт»: длину задачи, которую модель доводит до конца с вероятностью успеха 50% (p50). После 2023 года горизонт удваивается примерно каждые 131 день (METR, Time-Horizon, январь 2026) [E]. К началу 2026-го p50 подбирался к двенадцати часам непрерывной работы [E].

Я не строю пророчеств на этой кривой — экстраполяция за пределы данных остаётся гипотезой [H], и кривая может загнуться завтра. Но само направление говорит нечто важное. То, что в 2023-м было умной автодополнялкой на пару минут связного вывода, к 2026-му держит многошаговую цепочку. Это впервые делает инструмент годным не для подсказки, а для исполнения.

Тут честно назову обе границы спектра. Снизу — «плато»: кривая упирается в потолок, удвоения прекращаются, весь мой тезис рассыпается. К фальсификатору я вернусь в конце главы, это честная ставка, а не факт. Сверху — сценарий, о котором редко говорят вслух. Экономист Антон Коринек в январе 2026 года назвал его «сингулярностью типа II»: математически возможный режим, где рост суперэкспоненциальный и расходится к бесконечности за конечное время (Korinek, янв 2026) [I]. Я не закладываю это в выводы — это теоретическая верхняя граница. Но держать её в уме полезно: «плато» не единственная альтернатива росту. Реальность ляжет где-то между крайностями, и мы будем спорить о том, где именно.

Кривая третья: сдвиг стал массовым. Adoption ИИ так или иначе пробуют порядка двух третей фирм (McKinsey, The State of AI 2024) [E]. Не пилот в одной компании из ста — большинство. И вот чем это важно: массовость меняет среду. Когда сосед, конкурент и поставщик уже что-то крутят на ИИ, «подожду, пока устаканится» перестаёт быть нейтральной позицией. Она становится отставанием.

Теперь сложите все три. Дешёвый субстрат, растущая надёжность, массовое внедрение. Два года назад любого из трёх не хватало: модели были дороги, ненадёжны и экзотичны. Сейчас сошлись все три. Окно открылось не по чьей-то воле — его открыла арифметика.

Что именно сублимируется

Ладно, субстрат подешевел, надёжность выросла. Но книга не про стоимость токенов — она про то, что на этом субстрате впервые стало можно сделать.

Вернёмся к группе поддержки из начала главы. Представьте: тот человек, которого тимлид так и не нанял, всё же был в команде — лучший оператор смены, четыре года стажа. Он знает то, чего нет ни в одном регламенте. «Не пришёл заказ» — в трёх случаях из четырёх не пропавшая посылка, а перепутанный адрес. Разъярённого клиента надо сначала спросить про номер заказа, не про эмоции — иначе диалог сразу уходит в крик. Вот этот тип возврата лучше эскалировать немедленно, без двух кругов переписки. Он обходит эти грабли на автомате. Вы никогда это не записывали — зачем, он же здесь.

В пятницу он пишет заявление. В понедельник его место занимает новичок с тем же регламентом в папке — и три месяца наступает на каждые из этих граблей. Регламент остался. Способность ушла за дверь вместе с человеком.

Вот где проходит граница между мёртвым знанием и живой способностью. До недавнего времени компетенция жила в двух местах: в голове как тацитное умение, которое уходит с человеком, и в документации как мёртвый текст, ожидающий исполнителя. Регламент не делает ничего — он ждёт, пока кто-то его прочитает, поймёт и применит руками. Знание лежит пассивно.

Три сошедшиеся кривые сдвинули третье состояние из теории в практику. Компетенцию стало можно сублимировать — вынести из головы в исполняемый артефакт, который не ждёт исполнителя, а исполняется сам. Скилл, агент, MCP-коннектор, eval. Те три правила из головы ушедшего оператора — «три случая из четырёх», «сначала номер заказа», «этот тип сразу эскалировать» — один раз кодируются и дальше вызываются дёшево, надёжно, сколько угодно раз. Компетенция уходит с человеком. Артефакт остаётся.

Раньше «дешёвый инференс» значил «дешевле гонять чат-бота». Теперь он значит другое: операционное знание логиста, маркетолога, диагноста перестаёт испаряться вместе с увольнением. «Почему сейчас» — это не про чат-ботов. Это про момент, когда сублимация компетенции стала по карману и достаточно надёжна, чтобы на неё опереться.

Контр-данные: внедряют все, ценность ловят единицы

Здесь надо притормозить, потому что три восходящие кривые — это ещё не вся правда.

Те же две трети adoption при строгом замере реальной операционной интеграции съёживаются в разы. А до строки в P&L, до измеримого эффекта на прибыль, добирается около 5% компаний: по разбору MIT, 95% генеративных пилотов вообще не дают эффекта на прибыль (MIT Media Lab / NANDA, The GenAI Divide, 2025) [E].

Оговорюсь честно: это не перепись. Это выборка с окном измерения возврата в полгода и удобной выборкой примерно из 300 компаний — методология спорная. Но разрыв слишком велик, чтобы списать его на шум в данных. Назову его разрывом GenAI (the GenAI Divide): почти все внедряют, единицы превращают внедрение в деньги. Между «две трети пробуют» и «5% зарабатывают» — пропасть. Если глава остановится на трёх кривых, она соврёт.

Откуда провал? Есть конкретный механизм, и он про людей, а не про модели.

Вот контролируемый эксперимент: опытные разработчики с ИИ-ассистентом на деле замедлились, хотя были уверены, что ускорились (METR) [E]. Ощущение скорости и фактическая скорость разошлись в разные стороны. Если вы внедряете ИИ по самочувствию команды — «мы стали быстрее, всем нравится» — вы оптимизируете ложный сигнал. Прямая дорога в те 95%, которые не дают эффекта на P&L.

Klarna — та же ловушка, но на уровне целой компании. В начале 2024-го она развернула ИИ-ассистента поддержки, отчиталась о работе, эквивалентной примерно 700 операторам, Себастьян Семятковский стал лицом ИИ-first движения — а к 2025-му компания тихо нанимала людей обратно [E]. Klarna убрала носителей контекста до того, как артефакты прошли валидацию на сложных кейсах. Вместе с людьми ушла компетенция — та самая, из истории оператора поддержки — и когда артефакт начал тихо ошибаться, распознать ошибку стало некому.

Дверь открыта. Но за ней пусто — не потому, что идея плоха, а потому что между «развернул бота» и «устойчивый эффект на прибыль» лежит операционная дисциплина, которую манифесты не описывают. GenAI Divide — не приговор технологии. Это зазор исполнения.

Это уже было: от Infrastructure-as-Code к Organization-as-Code

Соблазнительно отмахнуться: очередная техно-волна, переживём, как переживали остальные. Но у происходящего есть точный исторический аналог — и он не про чат-ботов.

Лет пятнадцать назад IT-инфраструктуру администрировали вручную. Люди настраивали серверы и сети; медленно, ошибки встречались, и вся система держалась на тацитном знании конкретных людей. Ушёл системный администратор — ушло умение поднять инфраструктуру с нуля. Звучит знакомо? Это та же история оператора поддержки, только про железо, а не про клиентские тикеты.

Потом пришёл Infrastructure-as-Code. Инфраструктуру абстрагировали в машиночитаемые конфигурации. Она стала версионируемой, аудируемой, воспроизводимой одной командой. Знание перебралось из головы администратора в репозиторий.

Сублимация компетенции — та же логика, но применённая к человеческому труду. Переход от Infrastructure-as-Code к Organization-as-Code: операционное знание, которое жило в процедурной памяти логиста или маркетолога, извлекается, формализуется и встраивается в архитектуру фирмы. То, что уходило с человеком, остаётся в системе.

Аналогия точна ещё в одном: DevOps не уволил инженеров — он поднял их на уровень выше. От ручной настройки серверов к проектированию и надзору за системами, которые настраиваются сами. Это подсказка к тому, что произойдёт с экспертом в AI-native компании. И предупреждение одновременно: IaC дал не только скорость, но и новый класс отказов — дрейф конфигураций, тихие регрессии, долги автоматизации, которые всплывают через месяцы. Organization-as-Code получит свою версию той же расплаты.

Что уже стоит на месте операционной модели

Под ногами не вакуум. Каркас будущей фирмы уже проступает — просто он пока не собран в инструкцию.

Структурно фирма расслаивается в стек ролей L0–L4. Доменный эксперт (L0) — носитель тацитного знания, тот оператор с четырьмя годами стажа. Оператор (L1) «на петле» — надзирает, а не исполняет руками. Строитель артефактов (L2) кодирует знание в переиспользуемые системы. Экономический владелец (L3) масштабирует пропускную способность. Governance (L4) задаёт границы автономного исполнения. Эти роли наблюдаемы уже сейчас, это не прогноз.

Расслоение подтверждается экономикой, невозможной в labor-centric мире. Midjourney к 2026-му делала около $4,67 млн выручки на сотрудника: $500 млн выручки на 107 человек, без венчурных денег и без классического маркетинга (Epoch AI · companieshistory, 2026) [E]. Это не магия уникального продукта. Это арифметика: горстка людей, помноженная на парк артефактов.

Появилась инфраструктура переноса знания между фирмами. Anthropic выпустила Agent Skills как открытый формат (Anthropic, окт. 2025; открытый стандарт — дек. 2025) [E]. Протокол MCP (Model Context Protocol) дал моделям plug-and-play мост к базам, инструментам и API — без кастомной интеграции под каждое приложение [E]. Но тут же есть нюанс, который и образует окно. Основная масса готовых скиллов — для разработчиков: code review, git-коммиты, devops. Бизнес-скиллы — SEO-аудит, лидген, контент-пайплайн — пока редкость. «App Store для скиллов» существует, но завален инструментами для инженеров и почти пуст со стороны операций малого бизнеса.

У этого изобилия есть и тёмная сторона: по замеру Koi Security и Antiy CERT около 11,9% скиллов в MCP-реестре оказались вредоносными (Koi Security / Antiy CERT, фев. 2026) [E]. Маркетплейс работает и как ускоритель, и как поверхность атаки одновременно.

Всё перечисленное существует фрагментами: расслоение ролей, экономика микро-фирмы, маркетплейсы, протоколы. У McKinsey это оформлено для enterprise, у аналитиков — как тренд, у Midjourney — как разовый результат. Ни у кого нет собранной пошаговой модели для основателя из трёх человек с оборотом в несколько миллионов. Вот где окно: зазор между «всё придумано по частям» и «собрано в operating model».

Линза: апгрейд, а не замена

Здесь проходит линия, которая отделяет эту книгу от логики Klarna.

Амодеи в Давосе в январе 2026 предупредил, что ИИ может ликвидировать половину entry-level ролей (авторский пересказ, не дословная цитата) [I]. Это рамка замены. Она ломается о контр-данные: об иллюзии скорости в эксперименте METR и о развороте Klarna. Заменить человека артефактом, пока артефакт не прошёл валидацию — значит выкинуть носителя компетенции до того, как компетенция сублимирована. Klarna обращалась с агентами как с дешёвой заменой персонала. В этом и была ошибка.

Линза этой книги другая: апгрейд при дисциплине, а не замена. Компетенция уходит с человеком, артефакт остаётся в фирме. Эксперт L0 не сокращается — он становится источником, из которого L2 добывает системы, и в идеале получает премию за то, что строит артефакты, а не только исполняет руками. Артефакты при этом ведут как production-системы — инструментованные, аудируемые, с ограниченными правами, непрерывно проверяемые — а не как смышлёных стажёров с доступами, про которых забыли через месяц.

Практический вывод узкий и без пророчеств. Не начинайте с увольнений. Не доверяйте самочувствию команды. Размечайте процессы и измеряйте реальный исход — стоимость на результат и долю успешных прогонов, не ощущение скорости. Носителей контекста держите до тех пор, пока артефакт не прошёл валидацию на сложных кейсах. Это прямой урок и из эксперимента METR, и из разворота Klarna.

Фальсификатор

Вот что обрушит весь тезис «почему сейчас», если сбудется.

Кривая METR может загнуться. Если к концу 2027 года агентный горизонт перестанет удваиваться и застрянет на нескольких часах, второй из трёх несущих факторов рассыплется: дешёвый и массовый, но ненадёжный на длинных цепочках инференс не годится для сублимации — он годится только для подсказки. Тогда «почему сейчас» откладывается, окно сужается, и правыми окажутся не Лютке с Амодеи, а скептики GenAI Divide. Я ставлю на то, что кривая удержится ещё пару удвоений. Но это ставка, а не факт, и называю её ставкой.

Сумма главы — два одновременно верных факта. Механизм реален: инференс ×280, горизонт ×2 за 131 день, adoption около двух третей [E]. И готовой раскладки для SMB нет: P&L-эффект около 5%, иллюзия скорости в эксперименте METR, разворот Klarna. Окно открыто именно потому, что верно и то, и другое.

В следующей главе спускаемся на уровень механики: что такое артефакт как примитив и как именно тацитное знание проходит путь от головы эксперта до вызываемого скилла.