Революция генеративного ИИ, произошедшая за последние два года, изменила правила игры: теперь даже небольшая команда разработчиков способна создать инструмент, который может выполнять задачи, прежде требовавшие тысячи человеко-часов рутинного труда. Однако массовое внедрение ИИ ставит перед бизнесом и государством новые вызовы. Очевидно одно: компании, которые уже сегодня интегрируют ИИ в свои процессы, получат колоссальное конкурентное преимущество.
Про цифровизацию
— Как вы оцениваете уровень цифровизации в стране на текущий момент? Какие трудности существуют сегодня в этом направлении?
У нас отличный уровень цифровизации, если понимать это слово узко: мы умеем оцифровывать процессы — выделить в чем-то аналоговом измеримую составляющую и сохранить. Для этого у нас есть научно-техническая база, специалисты, лучшие мировые практики.
Основные трудности связаны со второй составляющей цифровой трансформации: с автоматизацией. Долгое время отечественных автоматизаторов душили демпингом транснациональные корпорации. Сейчас возможности есть, но в сравнении с западными вендорами нашим автоматизаторам не хватает наработанного опыта, лояльности клиентов, емкости рынка. Ради его захвата есть смысл вкладывать огромные инвестиции, чтобы выдавать продукт, сопоставимый по качеству с продуктами западных вендоров, которые монетизируются на рынке в 50–100 раз больше. Важно изменить подход потребителей продукта, устоявшийся в годы присутствия вендоров из недружественных стран: они были готовы отдавать решение задаром, лишь бы не дать закрепиться конкуренту, и заказчики привыкли сбивать цену — зачастую ниже себестоимости.
— Как изменились стратегии цифровой трансформации за последние годы? Что они сегодня в себя включают?
Термин «цифровая трансформация» ушел с первых полос, так как процессы, скрывавшиеся за этим громким лозунгом, оказались довольно обыденны, хоть и важны. Рынок свыкся с мыслью, что ИТ не должно торговать данными, и поэтому фактически умер концепт Data Mash. Настоялась и мысль о том, что любое RnD должно соответствовать долгосрочным целям бизнесов компании, и потому маяки цифровой трансформации из ИТ-прожектов стали обычными бизнес-целями.
Стратегии 2025–2030 сейчас пишутся с фокусом на генеративный ИИ, но в основном абстрактно, так как ИТ-директора пока не понимают, смогут ли они выстраивать полноценные агентские среды с помощью больших языковых моделей или генеративный ИИ сойдет на нет, как Data Mash. Те, кто писал стратегии в 2023 и начале 2024 года, еще, бывало, фокусировались на LakeHouse как на серебряной пуле, которая решит все вопросы эффективного распределения ресурсов в платформах данных, но и здесь чуда не случилось.
Сейчас у российского рынка, как и у мирового, появилось понимание, что LakeHouse хорош для активностей с переменной нагрузкой, но для high-load-работы с фиксированными SLA он не годится, поэтому 80% данных по-прежнему будут лежать в классических инструментах.
— Как эти стратегии будут трансформироваться дальше в условиях фокуса на технологический суверенитет?
Трансформация стратегий будет заметна в части базовых прикладных решений в нишах, которые ранее занимали решения SAP, IBM, SAS. Прошедшие 2,5 года были посвящены сокращению отставания в части системного ПО, и сейчас эта потребность в основном закрыта. Лидеры ИТ-рынка в ближайшее время смогут предлагать стабильные вертикальные отраслевые решения, включающие в себя весь необходимый системный и базовый софт, оборудование и уже реализованные прикладные решения, которые нужно будет только интегрировать без значительной адаптации и кастомной разработки. Это даст заказчику возможность прогнозировать ROI внедрений, так как у их стоимости будет минимизирована переменная часть, а эффект от прикладных наработок будет референсным и также прогнозируемым.
В прикладные и базовые решения, разумеется, включается и ИИ: как классический, который позволит оптимизировать различные параметры процессов, так и генеративный, нацеленный на сокращение времени исполнения рутинных задач человеком: co-pilot, поиск информации и подготовка по ней ответов, а также агенты выполнения несложных детерминированных функций, действующие сообща в рамках хорошо описанных процессов.
— Каким вы видите уровень цифровизации в России через 10 лет?
В последний год набрали силу большие языковые модели, и они поменяли буквально все. Раз в месяц в open source выходит какая-то новая модель, которая может выполнять определенные задачи лучше, чем предыдущие генерации. Год назад миграция хранилища данных крупного заказчика с Oracle на наши продукты требовала десятков тысяч человеко-дней. Сейчас мы скромной командой из трех экспертов смогли за две недели из открытого кода собрать на основе ИИ инструмент для автоматической миграции, который успешно преобразовывает до 80% кода мигрируемых запросов.
Большие языковые модели (LLM) уже пишут код, переводят документацию, анализируют юридические риски, адаптируют программу обучающего курса под навыки студента по ходу самого обучения. В кратчайшей перспективе они будут способны полностью заменить весь административный персонал, снизив бюрократию до нуля, а чуть позже заменят и часть программистов — и уже начали. С каждой новой версией такие модели становятся умнее, быстрее, держат все больший объем контекста разговора, меньше ошибаются, и порог мощностей, необходимых для их использования, снижается все сильнее. Прогресс в этой сфере идет пока очень быстро. Поэтому спрогнозировать уровень цифровизации даже через 3 года — весьма сложная задача.
ИИ в анализе данных
— Как с годами меняется искусственный интеллект?
Новые архитектуры ИИ и раньше появлялись постоянно, однако в 2017 году вышел материал Attention is all you need, описавший механизм многоголового внимания, с которого начинается расцвет трансформерной архитектуры ИИ, лежащей в основе большинства прорывных генеративных моделей, меняющих сейчас наш мир. С этого момента ИИ перестал восприниматься как математическая функция, в которую можно подать данные и получить на выходе результат, а стал обретать субъектность.
— Что такого может ИИ, чего не могут традиционные системы анализа данных, в том числе больших? Какую экономическую выгоду он может дать?
ИИ, в частности генеративный ИИ, произвел революцию в подходах к решению сложно декомпозируемых задач. Элементы бизнес-процесса, где мы раньше привлекали людей из-за того, что нельзя было описать все варианты развития событий, теперь поддаются автоматизации с помощью агентов генеративного ИИ. Определить, является ли документ или фотография документа поддельной; уловить настроение и проанализировать содержание идущего разговора между оператором и посетителем отделения; вызвать менеджера для посетителя или, напротив, охрану для помощи оператору — все это задачи, за автоматизацию которых раньше даже не брались, а теперь это реализуется элементарно и почти бесплатно. ИИ в десятки и сотни раз снизил стоимость прототипирования решения, именно поэтому нам сейчас сложно в полной мере осознать его экономический эффект, но очевидно, что он огромен.
Большие языковые модели в середине 2024 года стали способны к строго структурированным ответам (tool usage, function calling, constraint decoding), что позволило сделать их частью бизнес-процессов, заставляя не просто понимать человека и его потребности, но и выполнять действия, подходящие к ситуации. Это открыло дорогу как автономным роботам-помощникам, которые, благодаря этим возможностям, уже начинают появляться в розничной продаже, так и к развитию парадигмы RPA, уже давно активно используемой в автоматизации множества бизнес-процессов во всех отраслях. Во всех сферах, в которых используется человеческий труд, будут появляться решения, позволяющие уходить от рутины и заниматься действительно важными делами.
— «ИИ в десятки и сотни раз снизил стоимость прототипирования решения» — применительно к банковской сфере о прототипах чего именно идет речь?
Речь о прототипах сервисов в рамках произвольных бизнес-процессов. Обычно они декомпозированы на шаги, каждый из которых представляет собой некий сервис: у него есть входные артефакты, некая логика их обработки и выходные артефакты. Одни сервисы работают с данными, другие предполагают перемещение объектов в физическом мире, третьи — участие человека в процессах принятия решений или верификации подлинности. Генеративный ИИ адресует в первую очередь третий тип.
Возьмите любого сотрудника банка не из ИТ. Его рабочий день состоит из участия в различных бизнес-процессах, таких сотрудников тысячи и десятки тысяч. Раньше вы давали поручение подготовить отчет или сформировать нетипичную справку человеку, а сейчас это может сделать средних размеров LLM с подключенным каталогом данных и структурированными ответами. В середине 2024 года произошел качественный прорыв, и модели стали способны вызывать функции. С этого момента началось движение к замене людей в любых бизнес-процессах.
— RPA — речь об использовании ПО для автоматизации рутинных офисных задач, таких как анализ или заполнение форм, передача файлов и др.? Казалось, что все уже максимально автоматизировано, действительно ли резерв для автоматизации еще велик?
RPA — это ведь не только офисные задачи. К этому классу относится любая роботизация бизнес-процесса. Реализуете ли вы концепцию Data Fabric в платформе данных и не хотите писать под каждую СУБД платформы запрос со своим отдельным синтаксисом, пытаетесь ли вы по видео в реальном времени ответить на вопрос, надел ли инкассатор бронежилет или нет, или анализируете настроение диалога между клиентом и оператором — вы будете использовать в этих задачах либо человека, либо описательный (тоже генеративный) ИИ, так как решать их классическими инструментами автоматизации слишком сложно и слишком много возникает исключений на пути реализации.
— Какова реальная окупаемость и эффективность ИИ в аналитике для компаний уровня Enterprise и для СМБ?
Есть случаи, когда команда за 2 недели окупает свой бюджет на 10 лет. Нередки и случаи, когда затраченные средства едва отбиваются. Однако в целом можно сказать, что убытка от профессиональных команд ИИ в компаниях с большим объемом качественных данных не возникает практически никогда. Вероятно, это связано с тем, что при принятии решения о работе в направлении ИИ компании в первую очередь ориентируются на референсное ROI.
— Какие ошибки или неудачи возникают при использовании ИИ в аналитике?
Завышенные ожидания заказчика из-за пика хайпа и перфекционизм исполнителей, привыкших в основном работать в расслабленном RnD-режиме, слабо сочетаются друг с другом. Без профессионального менеджмента проекта сложности гарантированы. При использовании генеративного ИИ и других алгоритмов глубокого обучения недетерминированность ответа модели часто становится проблемой, если дизайном решения не предусмотрена постобработка. Помимо этого, есть еще множество технических сложностей, связанных с переобучением, плохим pretrain-датасетом, излишним прунингом и квантизацией и другими факторами.
ИИ в платформах данных
— Как вы применяете ИИ в своих продуктах — платформах для работы с данными?
Arenadata использует в первую очередь генеративный ИИ, преимущественно LLM- и VLM-модели. На них основаны ассистенты с RAG по базе знаний, классификация требований регуляторов, перевод технических документов с других языков. LLM помогают в продажах и маркетинге, в поиске ошибок в коде. Кроме того, на LLM/VLM сейчас строятся наши ассистенты и агенты, которые помогут пользователям наших продуктов значительно эффективнее работать в платформе данных Arenadata, а часть рутинных процессов автоматизируют полностью.
Для нас знаковым событием в мире ИИ стали появление в 2024 году эффективных структурированных выводов (structured outputs) для больших языковых моделей и стабилизация open source компонентов, за это отвечающих. Начиная с этого момента стало возможным без потери скорости работы получать в качестве ответа модели строго специфицированный JSON, и мы, как и многие в мире, стали реализовывать ассистентов и агентов ИИ, которые помогут нам ускорять собственные бизнес-процессы и бизнес-процессы наших клиентов.
— Какую технологию вы внедрили? Почему именно ее?
После появления возможности получать строго структурированные ответы от больших языковых моделей в середине 2024 года мы попробовали использовать LLM в задачах миграции кода СУБД Oracle на наши продукты. Наши ожидания были довольно скромными, поэтому эффективностью мы были буквально ошеломлены. После этого LLM получили больше внимания, нашли применение в задачах классификации типов тикетов и работают для внутреннего чат-бота по системе знаний, но основной фокус все же направлен в сторону облегчения пользователям работы с данными на нашей платформе.
— Как она работает? Какова ее эффективность?
Большие языковые модели в общем случае не детерминированы, при построении ответа они выбирают наиболее вероятные части будущих слов в зависимости от уже поданных в их контекст, а для корпоративного использования требуется стабильность результатов. С этим могут быть сложности, если не использовать специальные инструменты, ограничивающие простор размышлений. Использование больших и качественных моделей требует значительных ресурсов, которые оправдывают себя только при интенсивном использовании. В качестве альтернативы можно выбирать подписочные схемы и потребление таких моделей через API, однако в этом случае придется идти на компромисс с точки зрения конфиденциальности данных. Поэтому, говоря об эффективности, можно отметить, что она не вполне линейна. Сначала вы получаете очень большой эффект относительно малыми ресурсами, затем, пока инструментом пользуются немногие, а спектр задач растет, экономическая целесообразность может показаться сомнительной, но по мере проникновения в рабочие процессы она возвращается на хороший уровень.
— Каких результатов удалось добиться с помощью внедрения?
Мы начали экономить значительное время на поиск и классификацию информации, но, безусловно, в продуктах для наших клиентов мы достигнем с помощью LLM значительно большего эффекта, чем во внутренних.
Специфика нашего бизнеса — СУБД и управление большими данными. Наши клиенты хранят и обрабатывают большие массивы информации в различных форматах, а LLM и VLM (визуально-текстовые модели) как раз справляются со многими задачами обработки массивов информации значительно лучше людей. Их можно использовать в проектах миграции (90% SQL-запросов и 75% сложных процедур мигрируется автоматически, экономя десятки миллионов рублей в масштабных миграциях), для общения с базой данных на русском языке (модель переформулирует слова в SQL-запрос и сделает выжимку из результата), для автоматического определения эмоционального окраса записей диалогов с операторами колл-центров, для распознавания значимой информации в сканах документов, за счет чего можно автоматизировать и кратно ускорить процессы, ранее бывшие ручными.
Мы также возлагаем большие надежды на агентов — LLM-ассистентов, которым дали память, возможность планировать свои действия, пространство состояний и дискретное «время» (runtime), за счет чего можно будет выполнять составные задачи, предполагающие исследование внешней для LLM среды. Текущие агентные фреймворки от лидеров рынка, к сожалению, не учли опыт, который в области интеграции данных получен уже давно, поэтому мы создаем свое ответвление агентского фреймворка с задействованием pub-/sub-архитектуры для шины данных коммуникации агентов и с возможностью внешней оркестрации работы агентов. Такой подход позволит использовать уже зарекомендовавшие себя безопасные инструменты, одновременно снизив контекстную нагрузку на LLM, что значительно увеличит долю успешно выполненных агентами задач.
ИИ и рынок труда
— В целом можно сделать вывод, что впереди у банков весьма значительные сокращения затрат на персонал, выполняющий рутинные задачи, — так ли это?
Верно. Все профессии, связанные с рутиной и ручным трудом, сейчас под большим риском, так как с ними отчасти справляются ИИ и роботы с ИИ. Потому и появляются новые модели, способные работать с разными модальностями (картинка, видео, аудио, текст — на вход; на выход для задач автоматизации вполне достаточно текста), — LLM начали применять в бизнес-процессах. Компании поняли, что это экономит деньги, и появился запрос на мультимодальность. Даже уже не самый свежий Qwen 2 VL, например, без дообучения умеет определять и расшифровывать русский рукописный текст. Отсутствие этого навыка раньше было преградой для того, чтобы полностью автоматизировать ряд профессий, в которых важна работа с документами. Теперь модель, которая умнее среднестатистического человека, с большим кругозором и опытом, может делать все, что делали 70–80% младших бухгалтеров. Много ли останется в скором времени помощников у главного бухгалтера и долго ли осталось ему самому? Кажется, что немного.
— Какие еще риски для кадрового рынка несет массовое использование ИИ?
ИИ позволит минимизировать задержки во множестве бизнес-процессов, повысит производительность труда, сведя к минимуму рутину. Повышение производительности труда при сохранении кадров будет вести к усилению конкуренции за лучшие кадры на фоне роста доходов компаний. Это позволит специалистам высокой квалификации получать большие зарплаты, компании будут привлекать в том числе иностранных специалистов, престиж работы в России повысится. Страх же по поводу сокращения кадров правильно относить к роботизации, а не к ИИ. Однако роботизация тоже нужна, и даже ее кратный рост с текущих позиций не окажет значительного влияния на российский рынок труда.
— Какие специальности, по вашим прогнозам, будут наиболее востребованными на период до 2030 года?
Это очень долгосрочная перспектива, учитывая, что мы ожидаем появления AGI1 в ближайшие 3–4 года. Можно с уверенностью утверждать, что специалисты в области инженерии и фундаментальных наук (математика, физика, химия, биология, информатика) будут востребованы, поскольку они позволят разобраться в работе программ и механизмов будущего, определить проблемы и найти пути их решения.
Тем, кто хочет быть на передовой науки и технологий и создавать что-то принципиально новое, вероятно, потребуется гораздо больше времени для формирования теоретической базы, включая понимание принципов работы искусственного интеллекта. Это необходимо для создания новых аксиоматических систем и архитектур ИИ, которые позволят делать открытия. Как говорят сейчас, наступает эпоха, когда идея становится самым ценным, а реализация чего угодно с помощью ИИ и роботов становится доступной и недорогой.
— Какие меры государства необходимы для адаптации рынка труда к изменениям?
Вероятно, разумно будет измерять корреляцию использования ИИ со стагнацией и уменьшением спроса на отдельных специалистов. А в относительно недалеком будущем, когда некоторые специальности начнут исчезать, допускаю целесообразность введения временной системы базового безусловного дохода для этих работников. Это даст им время адаптироваться к новым условиям.
На самом деле вопрос непростой. ИИ должен повысить эффективность, а значит, увеличить ВВП и при прочих равных поднять благосостояние государства в целом. Однако распределение этого благосостояния может быть достаточно неравномерным. У государства есть все необходимые механизмы для распределения благосостояния, но важно делать это справедливо, стимулируя прогресс и не поощряя бездействие.
Источник: FutureBanking.ru