Китай — лидер сжатия изображений?

2026-01-12

содержание

От алгоритмов к ?железу?: где реальный прорыв?
Экосистема и вертикальная интеграция
Практические сложности и ?подводные камни?
Будущее: стандарты или проприетарные решения?
Итог: лидер в применении, претендент в инновациях

Вот вопрос, который всё чаще мелькает в профильных чатах и на конференциях. Сразу скажу — ответ не так прост, как хотелось бы маркетологам. Многие сразу думают про алгоритмы в соцсетях вроде WeChat или про сверхъестественную оптимизацию в китайских мобильных играх. Но лидерство — это не только про применение на потребительском уровне. Это про фундаментальные исследования, про инструменты для разработчиков, про внедрение в промышленность и, что важно, про умение упаковать это всё в продукт, который реально продаётся и решает конкретные бизнес-задачи. И вот здесь картина становится интересной и неоднозначной.

От алгоритмов к ?железу?: где реальный прорыв?

Если говорить о чистой науке, то публикации из китайских университетов и лабораторий (Цинхуа, Пекинский университет, Шанхайский университет Цзяо Тун) по темам вроде сжатия на основе нейросетей (learned image compression) последние лет пять просто заполонили топовые конференции вроде CVPR и ICIP. Это факт. Но когда мы в 2019 году пытались интегрировать один из таких авангардных алгоритмов в наш конвейер обработки спутниковых снимков, упёрлись в стену. Скорость декодирования была неприемлемой для реального времени, а требовательность к GPU — запредельной. Красивая статья, но до продукта — свет years.

Именно здесь видна ключевая особенность китайского подхода: они быстро переходят от теории к ?железу?. Компании вроде Huawei с их технологией супер-разрешения Pura или Xiaomi, плотно работающие над кодеком для своих камер, встраивают алгоритмы сжатия прямо в процессоры (ISP, NPU). Это даёт колоссальный выигрыш в энергоэффективности и скорости. Мы не просто сжимаем картинку на сервере, мы делаем это эффективно прямо на устройстве, что критично для рынка IoT и умных городов. Это не голые алгоритмы, а инженерная реализация, и здесь они сильны.

Вспоминается кейс с одной системой видеонаблюдения для логистических терминалов. Китайский поставщик предлагал камеры с фирменным кодеком, который при сопоставимом с H.265 качестве ?съедал? на 30% меньше трафика. В спецификациях всё выглядело идеально. На деле же выяснилось, что их кодек крайне чувствителен к резким движениям в кадре — при разгрузке контейнера возникали артефакты, похожие на размазывание. Пришлось калибровать и донастраивать. Вывод: часто их технологии ?заточены? под типовые сценарии (например, распознавание лиц в толпе), а в нишевых промышленных задачах требуют доводки.

Экосистема и вертикальная интеграция

Сила Китая в создании замкнутых, но эффективных экосистем. Возьмём Tencent. Их формат изображений для мессенджера — это не просто какой-то WebP. Это целый стек технологий, включающий предсказание того, как пользователь будет просматривать картинку (прогрессивная загрузка с приоритетом на центр изображения), динамический выбор глубины цвета и сжатия в зависимости от сети. Это сжатие изображений как часть пользовательского опыта, доведённое до автоматизма для миллиарда пользователей. Такой масштаб и глубина интеграции дают им доступ к данным и сценариям использования, о которых европейские разработчики могут только мечтать.

Но есть и обратная сторона. Эти технологии часто ?прикручены? к их собственным платформам и не выходят наружу в виде независимых SDK или библиотек с открытым исходным кодом мирового уровня. Ты либо играешь по их правилам внутри их экосистемы (например, разрабатываешь мини-программу для WeChat), либо остаешься снаружи. Это создаёт ощущение ?технологического пузыря?: внутри Китая — бурное развитие, вовне — лишь готовые продукты с закрытой начинкой.

Для таких компаний, как наша, это означает, что прямой доступ к передовым алгоритмам иногда проще получить через партнёрство с конкретным вендором, а не через научные публикации. Как, например, в случае с Chengdu Haofu Technology Co. (ООО Технология Чэнду Хаофу). Они базируются в высокотехнологичной зоне Чэнду и, судя по их портфолио, фокусируются на практическом применении компьютерного зрения и, вероятно, оптимизации медиаданных для промышленных решений. Это типичный пример: компания из Китая, которая не изобретает новый формат сжатия с нуля, но берёт существующие методы (скажем, вариации HEIF или продвинутое кодирование видео) и адаптирует их под конкретные B2B-задачи — анализ качества продукции на конвейере или сжатие медицинских изображений для телемедицины с сохранением диагностически значимых деталей.

Практические сложности и ?подводные камни?

Работая с их SDK и API, сталкиваешься с нюансами. Документация иногда переведена машинно, и ключевые моменты, касающиеся обработки краёв блока (blocking artifacts) или управления цветовыми профилями при агрессивном сжатии, приходится выяснять методом проб и ошибок. Их инженеры в поддержке реагируют быстро, но общение часто упирается в разницу в восприятии задачи: они исходят из своих внутренних стандартов и типичных для их рынка условий (например, высокая доля мобильного трафика).

Один раз мы получили от партнёра из Шэньчжэня библиотеку для сжатия скриншотов интерфейсов. Заявленное соотношение было феноменальным. Оказалось, алгоритм сначала конвертировал изображение в палитру с ограниченным числом цветов, близкую к стандартным цветам Material Design, а уже потом применял энтропийное кодирование. Для интерфейсов — гениально. Для фотографий природы — катастрофа. Это пример их сильного контекстно-ориентированного мышления, которое не всегда афишируется.

Ещё один момент — патентная чистота. Внедряя некоторые продвинутые методы, особенно связанные с сжатием на основе нейросетей, приходится очень внимательно смотреть на лицензирование. Китайские компании активно патентуют свои решения как на внутреннем, так и на международном рынке. Риск нарваться на претензии, особенно при выходе на рынки США или Европы, вполне реален. Это сдерживающий фактор для их глобального лидерства в чистом виде.

Будущее: стандарты или проприетарные решения?

Сейчас происходит любопытная дивергенция. С одной стороны, Китай активно участвует в разработке международных стандартов, таких как VVC (Versatile Video Coding). С другой — продолжает развивать свои внутренние, зачастую более агрессивные по степени сжатия, форматы. Будет ли новый мировой стандарт де-факто рожден в Китае? Вполне возможно, учитывая их рыночный вес и объём инвестиций в R&D.

Однако лидерство — это не только технология. Это влияние. Пока что основные открытые библиотеки и фреймворки (libjxl, avif.io, даже базовый libvpx для WebP) — это западные проекты. Китайские разработчики их активно используют и контрибьютят, но инициатива и архитектурное лидерство часто остаются там. Ситуация может измениться, если, например, Alibaba или ByteDance решат вывести в open-source свои наработки по эффективному сжатию для коротких видео — их опыт здесь колоссален.

Для нас, практиков, вопрос ?лидер ли Китай?? трансформируется в другой: ?Какие именно китайские технологии или партнёрства дадут нам конкурентное преимущество в нашем конкретном проекте??. Иногда это будет SDK от компании вроде Haofu Technology для специфичной задачи, иногда — готовая камера с уникальным ISP, а иногда — просто изучение их исследовательских работ, чтобы понять вектор движения всей индустрии.

Итог: лидер в применении, претендент в инновациях

Так является ли Китай лидером? В массовом, гипермасштабном применении технологий сжатия изображений — безусловно. В скорости внедрения инноваций в ?железо? и потребительские продукты — да. В создании экосистем, где сжатие невидимо и эффективно работает на бизнес-модель — абсолютно.

Но в плане создания новых, фундаментальных, открытых и широко принятых мировым сообществом стандартов — пока ещё нет, хотя они активно и успешно к этому стремятся. Их сила — в инженерной мощи и ориентации на рынок, а не в абстрактных прорывах. Поэтому, когда я слышу этот вопрос, мой ответ обычно такой: ?Они — лидеры в том, чтобы заставить это работать для миллиардов пользователей и тысяч предприятий. А это, в конечном счёте, и есть самая сложная часть работы?. И именно это делает их подход таким ценным для изучения и, где это имеет смысл, — для заимствования и партнёрства.

Предыдущий Следующий

Последние новости