SPIRIT подал заявку на патент технологии сжатия данных, которая поможет операторам связи тратить в десятки раз меньше на СХД при исполнении закона Яровой

Российская компания SPIRIT, №1 в мире в области разработки и лицензирования программных движков для передачи голоса и видео по IP-сетям, разработчик ВКС сервера VideoMost, сообщила, что подала заявку на получение патента на технологию супер-сжатия мультимедийной информации (видео и голоса) большого объема для хранения в системах хранения данных (СХД).

Сегодня, в связи с принятием пакета законов Яровой, резко возрос интерес отечественных операторов связи к технологиям эффективного сжатия и хранения данных в компактном виде, которые бы позволили существенно экономить ресурсы СХД. В прессе фигурируют космические цифры стоимости ЦОДов, которые необходимы для реализации Закона. Однако все эти расчеты сделаны для стандартных протоколов связи и кодирования голоса и видео. SPIRIT более 20 лет занимается реализацией различных методов кодирования видео и речи, и в отечественном разработчике решили подойти к решению проблемы креативно и инновационно.

Видео сегодня занимает более 70% пропускной способности мировых телеком сетей.

Запись и последующее декодирование качественного, разборчивого голоса критически важны для исполнения закона Яровой, для последующего анализа и поиска в записанной речи программными средствами или человеком.

Сжатие речи. Популярные международные стандарты ITU-T для операторов связи — голосовые кодеки G.729, G.723.1 — сжимают речь примерно в 8 раз (с потерями), после этого SPIRIT может сжать речь еще в 3 раза. Один из высокоэффективных специализированных кодеков для записи речи SPIRIT VoStoC (Voice Storage Codec) уже прошел обкатку и временем и клиентами.

SPIRIT VoSToC — это специализированный высокоэффективный вокодер, работающий на скорости 2400 бит/с и спроектированный специально для хранения речи. По качеству воспроизведения речи VoSToC в своем классе превосходит мировые аналоги.

«Когда заходит речь о поиске лучшего решения для хранения большого объема мультимедийных данных, необходимо уделять внимание двум основным параметрам: степени сжатия и качеству записанной речи, — поясняет Владимир Свириденко, технический директор SPIRIT. — У нас разработаны и уже используются на мировом рынке технологии сжатия голоса, которые позволяют записать в 1 МБ памяти почти 2 часа вокодированной речи».

Сжатие видео. Популярные международные стандарты ITU-T для операторов связи и ВКС-вендоров — видео кодеки H.263/H.264 — сжимают видео в среднем примерно в 50 раз (с потерями), после этого SPIRIT может сжать видео еще в 100 раз, путем интеллектуального анализа информации на основе ее важности.

«Закон требует записывать и хранить все мультимедийные данные, и если текст не занимает много места в СХД, то для хранения речи, аудио и видео потребуются на порядки большие ресурсы. Нет надобности хранить весь “информационный мусор”, бо́лее компактно можно записать малоинформативную часть данных, а вот все самые важные фрагменты записи должны быть представлены качественно» — комментирует профессор, д.т.н. Владимир Свириденко, технический директор SPIRIT, и автор патентной заявки.

В патентной заявке значится, что изобретение относится к области сжатия, передачи и хранения в компактном виде мультимедийной информации, циркулирующей в системах передачи/записи видео, изображений, речевых/аудио потоков, графических и текстовых файлов, включая системы речевой связи, видеоконференции, видеонаблюдение, системы хранения данных, а также поисковые системы.

Предложенная концепция интеграции интеллектуальной классификации разных фрагментов мультимедийной информации и известных методов кодирования источника с потерями, разработанная SPIRIT, позволяет минимум на порядок повысить эффективность компактного представления мультимедийной информации по сравнению с традиционными методами сжатия изображений, видео, речевых сообщений и аудио сигналов и позволяет конструктивно ответить на вопросы мета-уровня: что хранить, как и в каком формате, как определить ценность хранимой информации для системы принятия решения, как ее закодировать и записать в цифровую память.

Технические детали

Для кодирования видео широко используются кодеки ITU-T Н.26Х, а также проприетарные кодеки VPх. Коэффициент сжатия варьируется от 10 до 500 раз в зависимости от допустимой скорости видеопотока или выделенного объема памяти для хранения изображений/видео, уровня заданного качества, типа кодека и специфики изображений/видео. Широко используемый в таких кодеках принцип сжатия изображений и видео с потерями — это устранение пространственной избыточности на базе перехода из пространственной области в частотную на базе трансформации матрицы изображения, как в JPEG (или опорного кадра, как в MPEG 2 и 4), и использования системы ортогональных функций (преобразование Фурье, Уолша, дискретного косинусного преобразования (DCT), вейвлетов и др.) и тонкого или грубого квантования компонент, что вносит погрешность, и последующее кодирование квантованных компонент на принципах энтропийного кодирования без потерь (в частности, арифметического кодирования); устранение временной избыточности в соседних кадрах видеопотока, в которых, как правило, есть небольшие изменения за счет движения объектов в кадре или видеокамеры, выявляемые оценивателем движения (motion estimator) и определением векторов движения для кодирования только измененных фрагментов нового кадра по отношению к опорному (что детально описано в стандартах MPEG 2 и 4, Н.26х).

Для кодирования речи используются речевые кодеки по стандартам ITU-T серии G.7xx (G.711, G.718, G.719, G.722.2 (AMR WB), G.723.1, G.726, G.729, G.729.1 и др.), кодеки GSM, SILC, iLBC и другие проприетарные кодеки. Коэффициент сжатия варьируется от 5 до 50 раз в зависимости от требуемой скорости речевого потока на выходе кодера, уровня заданного качества, допустимой задержки и специфики речевого сигнала (с учетом пауз в речи). Если же форма оригинального сигнала сохраняется на выходе кодека с контролируемой погрешностью, то такие кодеки называются кодеками речевой волны (waveform codecs).

Для кодирования аудиосигналов используются такие известные и широкоиспользуемые аудиокодеки как МР3, ААС, ААС+, WMA и др. Практически все аудиокодеки построены на основе метода waveform coding, но обработка сигнала производится, как правило, в частотной области. Коэффициент сжатия аудиопотока варьируется от 5 до 30 раз и зависит от полосы частот аудиосигнала и требуемого качества воспроизведения аудио при декодировании.

www.videomost.com

 

Следите за нашими новостями в Телеграм-канале Connect


Поделиться:



Следите за нашими новостями в
Телеграм-канале Connect

Спецпроект

Медицинские задачи для ИИ

Подробнее
Спецпроект

Цифровой Росатом

Подробнее


Подпишитесь
на нашу рассылку