La unidad de árbol de codificación ( CTU ) es la unidad de procesamiento básica del estándar de video de codificación de video de alta eficiencia (HEVC) y conceptualmente corresponde en estructura a las unidades de macrobloque que se usaron en varios estándares de video anteriores. [1] [2] La CTU también se conoce como unidad de codificación más grande ( LCU ). [3]
Una CTU puede tener un tamaño de entre 16×16 píxeles y 64×64 píxeles, y un tamaño mayor suele aumentar la eficiencia de codificación. [4] [2] El primer estándar de video que utiliza CTU es HEVC/H.265, que se convirtió en un estándar ITU-T el 13 de abril de 2013. [5] [6] [7]
Los métodos de codificación de macrobloques se han utilizado en los estándares de codificación de vídeo digital desde H.261 , que se publicó por primera vez en 1988. Sin embargo, para la corrección de errores y la relación señal-ruido, el tamaño estándar de macrobloques de 16x16 no es capaz de obtener el tipo de reducciones de bits que la teoría de la información y la teoría de la codificación sugieren que son teórica y prácticamente posibles. [8]
HEVC reemplaza los macrobloques , que se usaban con estándares de video anteriores, con CTU que pueden usar estructuras de bloques más grandes de hasta 64×64 píxeles y pueden subdividir mejor la imagen en estructuras de tamaño variable. [4] [9]
HEVC divide inicialmente la imagen en CTU que luego se dividen para cada componente luma/croma en bloques de árbol de codificación (CTB). [4] [9]
Un CTB puede ser de 64×64, 32×32 o 16×16, y un tamaño de bloque de píxeles más grande generalmente aumenta la eficiencia de codificación. [4] Luego, los CTB se dividen en una o más unidades de codificación (CU), de modo que el tamaño de la CTU también sea el tamaño de unidad de codificación más grande. [4]
En la reunión de HEVC de julio de 2012 se decidió, con base en la propuesta JCTVC-J0334, que se requeriría que los niveles HEVC 5 y superiores utilicen tamaños de CTB de 32×32 o 64×64. [3] [12] Esto se agregó a HEVC en el Borrador de Norma Internacional como un límite de nivel para la variable Log2MaxCtbSize. [13]
Log2MaxCtbSize pasó a llamarse CtbSizeY en el borrador HEVC de octubre de 2012 y luego a llamarse CtbLog2SizeY en el borrador HEVC de enero de 2013. [10] [14]
El diseño de la mayoría de los estándares de codificación de video está orientado principalmente a lograr la mayor eficiencia de codificación. [2] La eficiencia de codificación es la capacidad de codificar video a la tasa de bits más baja posible mientras se mantiene un cierto nivel de calidad de video. [2] HEVC se beneficia del uso de tamaños de CTB más grandes. [2]
Esto se ha demostrado en pruebas de relación señal-ruido (PSNR) máxima con un codificador HEVC HM-8.0 donde se lo obligó a usar tamaños de CTU progresivamente más pequeños. [2] Para todas las secuencias de prueba en comparación con un tamaño de CTU de 64×64, se demostró que la tasa de bits HEVC aumentó un 2,2 % cuando se lo obligó a usar un tamaño de CTU de 32×32 y aumentó un 11,0 % cuando se lo obligó a usar un tamaño de CTU de 16×16. [2]
En las secuencias de prueba de clase A, donde la resolución del video era 2560×1600, en comparación con un tamaño de CTU de 64×64 se demostró que la tasa de bits HEVC aumentó un 5,7% cuando se obligó a utilizar un tamaño de CTU de 32×32 y aumentó un 28,2% cuando se obligó a utilizar un tamaño de CTU de 16×16. [2]
Las pruebas demostraron que los tamaños grandes de CTU se vuelven aún más importantes para la eficiencia de codificación con video de mayor resolución. [2] Las pruebas también demostraron que tomó un 60% más de tiempo decodificar video HEVC codificado en un tamaño de CTU de 16x16 que en un tamaño de CTU de 64x64. [2] Las pruebas demostraron que los tamaños grandes de CTU aumentan la eficiencia de codificación al mismo tiempo que reducen el tiempo de decodificación. [2] Las pruebas se llevaron a cabo con el perfil principal de HEVC basado en PSNR igual. [2]
Secuencias de prueba de vídeo | Tamaño máximo de CTU utilizado en la codificación de vídeo en comparación con CTU de 64×64 | ||
---|---|---|---|
Unidades de procesamiento de datos (CTU) de 64 × 64 | Unidades de transporte de 32 × 32 | 16×16 unidades de almacenamiento de combustible | |
Clase A (2560×1600 píxeles) | 0% | 5,7% | 28,2% |
Clase B (1920×1080 píxeles) | 0% | 3,7% | 18,4% |
Clase C (832×480 píxeles) | 0% | 1,8% | 8,5% |
Clase D (416×240 píxeles) | 0% | 0,8% | 4,2% |
En general | 0% | 2,2% | 11,0% |
Tiempo de codificación | 100% | 82% | 58% |
Tiempo de decodificación | 100% | 111% | 160% |