Женщина на работе
Женщина на работе
Дмитрий Толстенёв Опубликована 17.04.2025 в 23:57

На российском IT-рынке формируется новый сегмент: бизнес массово осваивает Inference-as-a-Service

На российском IT-рынке формируется новый сегмент: бизнес массово осваивает Inference-as-a-Service

На фоне дефицита GPU и стремительного роста интереса к ИИ-технологиям в России начинает формироваться новый сегмент IT-рынка — Inference-as-a-Service. Это направление связано с применением уже обученных моделей к новым данным для генерации предсказаний и выводов. Как стало известно, подобный сервис выводит на рынок Cloud. ru. Также решения в этом сегменте уже предлагают "Яндекс", МТС и Nebius Group, основанная Аркадием Воложем.

По информации Cloud. ru, их новый продукт Evolution ML Inference позволяет запускать как собственные модели, так и opensource-решения из библиотеки Hugging Face на базе облачных GPU. При этом пользователю не требуется глубокое знание ИИ, достаточно базовых технических навыков. В компании подчеркнули, что клиенты получают доступ к высокопроизводительным графическим процессорам и полностью обслуживаемой инфраструктуре, а также возможность гибко масштабировать мощности.

Дмитрий Юдин, руководитель AI-направления Cloud. ru, объяснил, что рынок инференса, по сути, состоит из трёх компонентов: аппаратного обеспечения, PaaS и SaaS-сегментов. При этом, по его мнению, в ближайшие годы произойдёт сдвиг от железа в сторону управляемых облачных сервисов, так как инференс-модели гораздо чаще используются бизнесом, чем обучаются с нуля. Это связано как с высокой стоимостью обучения, так и с ростом числа готовых решений и инструкций по их применению.

Рост спроса подтверждает и статистика: пользователи генерируют миллиарды токенов в популярных LLM-моделях ежемесячно, а продажи GPU-инфраструктуры в облаке MWS за 2024 год удвоились. На фоне этого, по прогнозам Statista, российский рынок ИИ достигнет $5,36 млрд уже в 2025 году и вырастет до $20 млрд к 2031-му. Аналитики J'son & Partners оценивают рост сегмента облачных GPU-вычислений в России в 2024 году на уровне 55%, до 17,1 млрд рублей.

Несмотря на санкции, дефицит видеокарт и усложнённый ввоз оборудования, крупные игроки продолжают развивать свои облачные сервисы. В Cloud. ru заявили, что дефицит в большей степени затронул малые компании, тогда как крупные организации, включая Сбер и Яндекс, успели создать запасы и наладить оптимизацию ресурсов. МТС также отмечает рост спроса на облачную GPU-инфраструктуру и заявляет, что их платформа MWS GPT обеспечивает масштабируемость "из коробки".

Эксперты считают, что Inference-as-a-Service станет ключевым направлением развития ИИ-инфраструктуры, особенно для тех, кто нуждается в запуске MVP, автоматизации поддержки клиентов, генерации контента или внутренних интеллектуальных систем. Сервис позволяет существенно сократить расходы, так как тарификация начинается с момента обращения к модели. В Cloud. ru утверждают, что аренда собственной инфраструктуры обходится в 10 раз дороже, чем облачный инференс.

Подписывайтесь на Moneytimes.Ru

Читайте также

Россияне с зарплатой 100 тысяч рублей смогут получать пенсию около 32 тысяч 12.06.2025 в 15:19

Зарплата 100 тысяч — пенсия 32 тысячи: в Совфеде раскрыли расчёты

Сенатор Совета Федерации Ольга Епифанова сообщила, что при официальной зарплате в 100 тысяч рублей в месяц будущая страховая пенсия может составить порядка 32,2 тысячи рублей.

Читать полностью »
В Госдуме предложили заморозить взыскания по ипотеке для жертв ИЖС 11.06.2025 в 12:35

Аксененко предложил ввести заморозку взысканий по ипотеке для пострадавших участников ИЖС

Заместитель председателя комитета Госдумы по строительству и ЖКХ Александр Аксененко ("Справедливая Россия — За правду") направил обращение главе Банка России Эльвире Набиуллиной с предложениями по поддержке граждан, пострадавших в рамках программ индивидуального жилищного строительства (ИЖС).

Читать полностью »
В iOS 26 обнаружено упоминание AirPods Pro 3 11.06.2025 в 12:03

AirPods Pro 3 на подходе: в коде iOS 26 нашли упоминание новых наушников Apple

Apple готовит новую итерацию своих топовых беспроводных наушников.

Читать полностью »
FT: Еврокомиссия готовит новый пакет санкций против России 11.06.2025 в 11:28

ЕС готовит новые санкции против России: потолок на нефть могут снизить до $45

Европейская комиссия разрабатывает очередной пакет антироссийских санкций, и меры на этот раз обещают быть более жёсткими.

Читать полностью »
Рынок ритуальных услуг в России вырос на 12,7% с начала года 11.06.2025 в 11:19

Ритуальный бизнес пошёл в рост: доходы отрасли в России превысили 39 млрд рублей

За первые четыре месяца 2025 года российский рынок ритуальных услуг показал рост на 12,7% и достиг оборота в 39,5 миллиарда рублей.

Читать полностью »
Сергиевопосадский священник назвал признаки конца времен 10.06.2025 в 22:56

Конец времен: предупреждения священника из Сергиева Посада

Отец Николай утверждает, что такие бедствия, как наводнения, пожары и землетрясения, не происходят просто так.

Читать полностью »
Число магазинов канцтоваров в России сократилось на фоне роста онлайн-продаж 09.06.2025 в 12:12

Магазины канцтоваров массово закрываются: офлайн не выдерживает натиска маркетплейсов

В России стремительно сокращается число традиционных магазинов, торгующих канцелярскими товарами.

Читать полностью »
Гражданский госзаказ на беспилотники второй год недофинансируют 09.06.2025 в 12:06

Беспилотники простаивают, деньги не доходят: госзаказ на грани срыва второй год подряд

Гражданская программа закупок беспилотных авиасистем (БАС) сталкивается с финансовыми трудностями второй год подряд.

Читать полностью »