【工程师分享】MPSoC VCU Ctrl-SW 2020.2 编码不同Stride的YUV文件

judy 在周一, 05/24/2021 - 15:26 提交

1. 介绍

Xilinx提供超低延时编解码方案，并提供了全套软件。MPSoC Video Codec Unit提供了详细说明。其中的底层应用软件是VCU Control-Software(Ctrl-SW)。

本文主要说明为Ctrl-SW增加功能，支持不同Stride/Pitch（步长）的YUV文件的编码。

1.1. VCU输入和输出格式

Video Codec Unit(VCU) 输入和输出都是是NV12/NV16格式的视频，Y分量存放在一块连续内存区，UV分量交替存放在Y分量后面的连续内存。具体信息，可以参考VCU Product Guide中的“Source Frame Format”和“Memory Format”。

1.2. VCU内存的pitch

视频数据在内存区中存放时，两行之间的数据可以有间隔。对于每个像素的Y分量用8-bit表示的图像，每个像素的Y分量对应内存的一个字节，图像Y分量的每一行对应的内存大小就是其宽度代表的字节数。比如1920x1080,每一行图像的Y分量需要1920字节内存。如果以2048字节来存储一行1920x1080的图像数据，则在前面存放图像数据，后面的数据被VCU忽略。也可以参考PG252的“Figure 7: Frame Buffer Pitch”。

2. 输入文件分辨率

与视频数据在内存区中存放一样，视频数据在文件中存放时也有类似的情况。
Ctrl-SW假设输入文件的分辨率一般和实际图像分辨率一致，也就是pitch和图像宽度一致。但是实际应用时，输入文件的分辨率、实际图像分辨率并不一致。在文件里，有一部分数据是真实图像数据，有一部分是无用数据。比如有YUV NV12文件的文件分辨率是3840x1080，实际图像的分辨率是1920x1080。每一行的数据中，只有前面1920字节是有效图像数据，后面的1920字节是冗余数据。

3. 代码

为了支持这种场景，需要修改代码。Ctrl-SW的读YUV文件的代码，在文件YuvIO.cpp里的函数ReadOneFrameYuv()里。下面是基于Ctrl-SW 2020.2的修改。

首先定义一个全局变量，用于存储输入文件的Stride/Pitch（步长）。

int gi_encoder_input_stride=0;

接下来增加的ctrlsw_encoder的命令行选项。这样命令行选项里可以对图像步长gi_encoder_input_stride赋值。

opt.addInt("--input-stride", &gi_encoder_input_stride, "Stride in input YUV file.");

最后修改函数ReadOneFrameYuv()。原来的代码，直接使用真实图像宽度计算YUV文件里每行的数据的字节数，代码是“uRowSizeLuma = GetIOLumaRowSize(tFourCC, tDim.iWidth)”。修改后的代码，使用真实图像宽度作为YUV文件里图像步长iYuvStride的缺省值。另外增加代码，检查命令行选项里赋值的图像步长gi_encoder_input_stride。如果gi_encoder_input_stride不为0，则将gi_encoder_input_stride赋值给图像步长iYuvStride。接下来使用图像步长iYuvStride计算YUV文件里，每行的数据的字节数。

bool ReadOneFrameYuv(std::ifstream& File, AL_TBuffer* pBuf, bool bLoop)
{
  if(!pBuf || !File.is_open())
    throw std::runtime_error("invalid argument");

  if((File.peek() == EOF) && !bLoop)
    return false;

  TFourCC tFourCC = AL_PixMapBuffer_GetFourCC(pBuf);
  AL_TDimension tDim = AL_PixMapBuffer_GetDimension(pBuf);

  int32_t iYuvStride = tDim.iWidth;  
  if( 0 != gi_encoder_input_stride )
  {
	  iYuvStride = gi_encoder_input_stride;
	  LogVerbose("New YUV width size:%d at %s:%d.\n", iYuvStride, __func__, __LINE__ );
  }

  //uint32_t uRowSizeLuma = GetIOLumaRowSize(tFourCC, tDim.iWidth);
  uint32_t uRowSizeLuma = GetIOLumaRowSize(tFourCC, iYuvStride);
  LogVerbose("YUV Luma row size:%d at %s:%d.\n", uRowSizeLuma, __func__, __LINE__ );

  ReadFile(File, pBuf, uRowSizeLuma, tDim.iHeight);

  if((File.rdstate() & std::ios::failbit) && bLoop)
  {
    File.clear();
    File.seekg(0, std::ios::beg);
    ReadFile(File, pBuf, uRowSizeLuma, tDim.iHeight);
  }

  if(File.rdstate() & std::ios::failbit)
    throw std::runtime_error("not enough data for a complete frame");

  return true;
}

其它的代码，不需要修改。

注意，YUV文件里图像步长（stride/pitch），要不小于内存里的图像步长（stride/pitch）。因此，测试时，同时使用了选项“--stride”和选项“--input-stride”。

4. 测试

测试了输入分辨率是3840x1080的NV12 yuv文件，编码图像分辨率1920x1080，得到了正确的265文件。命令如下：

./ctrlsw_encoder -cfg test-1920x1080-3840x1080.cfg  --stride 3840 --input-stride 3840

有意思的是，结合选项“--stride”、选项“--stride-height”、和选项“--input-stride”，相等于在编码前对图像实现了裁剪（crop）功能。

5. 其它 5.1. 命令行选项“--input-width”，和“--input-height”

Ctrl-SW 2020.2里有两个命令行选项，“--input-width”，和“--input-height”。这两个选用用于指定实际图像分辨率，可以取代配置文件里的图像分辨率。这个选项并不能指定输入文件的分辨率。

opt.addInt("--input-width", &cfg.MainInput.FileInfo.PictWidth, "Specifies YUV input width");
  opt.addInt("--input-height", &cfg.MainInput.FileInfo.PictHeight, "Specifies YUV input height");

6. 未来工作

未来可以继续测试NV16的图像，也可以测试其它分辨率的图像。

7. 参考文档

XilinxPG252 (v2020.2) H.264/H.265 Video Codec Unit v1.2 Solution

MPSoC VCU Ctrl-SW 2020.2 输出NV12的YUV文件

MPSoC

视频编解码

VCU解码

【分享】为MPSoC编译Android 8的主要流程和命令	【工程师分享】测试MPSoC GEM 的1588功能	【工程师分享】Audio工程测试1080p yuv422 10bit编码，软件报告VCU能力不足
MPSoC EV H.265编解码性能	AMD-Xilinx MPSoC的Watchdog在Linux中使用的简明教程	Zynq UltraScale+ MPSoC视频编解码单元 (VCU) ： GStreamer 支持哪些视频格式？

【工程师分享】MPSoC VCU Ctrl-SW 2020.2 编码不同Stride的YUV文件

最新文章

最新文章