图像操作类功能单元

resize

功能描述

对图片进行缩放操作。

设备类型

cpu、cuda、ascend

输入端口

端口名称	数据格式	数据存放设备类型	端口含义
in_image	图片数据类型	与功能单元设备类型一致	源图片信息

输出端口

端口名称	数据格式	数据存放设备类型	端口含义
out_image	图片数据类型	与功能单元设备类型一致	结果图片信息

配置参数

参数名称	参数类型	是否必填	参数含义
image_width	uint32_t	是	缩放后的图片宽
image_height	uint32_t	是	缩放后的图片高
interpolation	uint32_t	否	插值方法，不同硬件取值范围不同。 cpu场景："inter_nearest"、"inter_linear"、"inter_cubic"、"inter_area"、"inter_lanczos4"、"inter_max"、"warp_fill_outliers"、"warp_inverse_map", 默认值为"inter_nearest" cuda场景："inter_nn"、"inter_linear"、"inter_cubic"、"inter_super"、"inter_lanczos"，默认值为"inter_nn" ascend场景："default"、"bilinear_opencv"、"nearest_neighbor_opencv"、"bilinear_tensorflow"、"nearest_neighbor_tensorflow"，默认值为"default"

约束说明
由于底层实现差异，不同硬件支持插值方式不同。
ascend硬件当前只支持输入图片格式为"nv12"
使用样例

无

padding

功能描述

对图片进行缩放操作。

设备类型

cpu、cuda、ascend

输入端口

端口名称	数据格式	数据存放设备类型	端口含义
in_image	图片数据类型	与功能单元设备类型一致	源图片信息

输出端口

端口名称	数据格式	数据存放设备类型	端口含义
out_image	图片数据类型	与功能单元设备类型一致	结果图片信息

配置参数

参数名称	参数类型	是否必填	参数含义
image_width	uint32_t	是	填充后的图片宽
image_height	uint32_t	是	填充后的图片高
vertical_align	string	否	纵向的对齐方式，取值范围："top"、"center"、"bottom",默认为"top"
horizontal_align	string	否	横向的对齐方式，取值范围："left"、"center"、"right",默认为"left"
padding_data	string	否	填充的像素值，格式："255,255,0"，参数顺序和数据维度对应。默认为"0,0,0"
need_scale	bool	否	是否需要改变大小，默认为ture
interpolation	uint32_t	否	插值方法，不同硬件取值范围不同。 cpu场景："inter_nearest"、"inter_linear"、"inter_cubic"、"inter_area"、"inter_lanczos4"、"inter_max"、"warp_fill_outliers"、"warp_inverse_map", 默认值为"inter_nearest" cuda场景："inter_nn"、"inter_linear"、"inter_cubic"、"inter_super"、"inter_lanczos"，默认值为"inter_nn" ascend场景："default"、"bilinear_opencv"、"nearest_neighbor_opencv"、"bilinear_tensorflow"、"nearest_neighbor_tensorflow"，默认值为"default"

约束说明
由于底层实现差异，不同硬件支持插值方式不同。
Ascend硬件当前只支持输入图片格式为"nv12"
使用样例

无

crop

功能描述

对图片进行缩放操作。

设备类型

cpu、cuda、ascend

输入端口

端口名称	数据格式	数据存放设备类型	端口含义
in_image	图片数据类型	与功能单元设备类型一致	源图片信息
in_region	矩形框数据类型	cpu	裁剪区域

输出端口

端口名称	数据格式	数据存放设备类型	端口含义
out_image	图片数据类型	与功能单元设备类型一致	结果图片信息

配置参数

无

约束说明
Ascend硬件当前只支持输入图片格式为"nv12"
使用样例

无

normalize

功能描述

对数据进行归一化。

设备类型

cpu、cuda

输入端口

端口名称	数据格式	数据存放设备类型	端口含义
in_data	Tensor数据类型	与功能单元设备类型一致	源数据

输出端口

端口名称	数据格式	数据存放设备类型	端口含义
out_data	图片数据类型	与功能单元设备类型一致	结果后数据,输出Buffer数据类型为ModelBoxDataType::MODELBOX_FLOAT

配置参数

参数名称	参数类型	是否必填	参数含义
standard_deviation_inverse	string	是	归一化参数, 参数格式："0.003921568627451,0.003921568627451,0.003921568627451" ，0.00392156862745为1/255，参数顺序和数据维度对应

约束说明

无

使用样例

无

mean

功能描述

对数据进行减均值操作。

设备类型

cpu、cuda

输入端口

端口名称	数据格式	数据存放设备类型	端口含义
in_data	Tensor数据类型	与功能单元设备类型一致	源数据

输出端口

端口名称	数据格式	数据存放设备类型	端口含义
out_data	图片数据类型	与功能单元设备类型一致	结果后数据, 输出Buffer数据类型为ModelBoxDataType::MODELBOX_FLOAT

配置参数

参数名称	参数类型	是否必填	参数含义
mean	string	是	减均值参数, 参数格式："124.5, 116.5, 104.5" ，参数顺序和数据维度对应

约束说明

无

使用样例

无

color_convert

功能描述

对图片进行颜色通道转换。

设备类型

cuda

输入端口

端口名称	数据格式	数据存放设备类型	端口含义
in_image	图片数据类型	与功能单元设备类型一致	源图片信息

输出端口

端口名称	数据格式	数据存放设备类型	端口含义
out_image	图片数据类型	与功能单元设备类型一致	结果图片信息

配置参数

参数名称	参数类型	是否必填	参数含义
out_pix_fmt	string	是	转换后的通道格式，取值范围："bgr", "rgb", "gray"

约束说明

支持场景："rgb" 转 "bgr"、"bgr" 转 "rgb"、 "rgb" 转 "gray"、 "bgr" 转 "gray"、 "gray" 转 "bgr"、 "gray" 转 "rgb"

使用样例

无

image_rotate

功能描述

对图片进行旋转。

设备类型

cpu、cuda

输入端口

端口名称	数据格式	数据存放设备类型	端口含义
in_image	图片数据类型	与功能单元设备类型一致	源图片信息

输出端口

端口名称	数据格式	数据存放设备类型	端口含义
out_image	图片数据类型	与功能单元设备类型一致	结果图片信息

配置参数

参数名称	参数类型	是否必填	参数含义
rotate_angle	int_32	否	按顺时针旋转角度，取值范围：90, 180, 270。如果不填该参数时，默认根据输入Buffer Meta携带的"rotate_angle"字段旋转。可用于视频解码携带"rotate"信息的场景

约束说明

无

使用样例

无

image_decoder

功能描述

对图片解码。

设备类型

cpu、cuda

输入端口

端口名称	数据格式	数据存放设备类型	端口含义
in_encoded_image	vector	待解码图片的二进制数据

输出端口

端口名称	数据格式	数据存放设备类型	端口含义
out_image	图片数据类型	与功能单元设备类型一致	结果图片信息

配置参数

参数名称	参数类型	是否必填	参数含义
pix_fmt	string	是	解码后的通道格式，取值范围："bgr", "rgb", "nv12"。cuda场景不支持"nv12"

约束说明
cuda场景图片解码格式只支持"bgr", "rgb"，不支持"nv12"。
使用样例

无

image_preprocess

功能描述

对图片做预处理：包含减均值、归一化、通道转换。

设备类型

cuda

输入端口

端口名称	数据格式	数据存放设备类型	端口含义
in_image	图片数据类型	与功能单元设备类型一致	源图片信息

输出端口

端口名称	数据格式	数据存放设备类型	端口含义
out_data	Tensor数据类型	与功能单元设备类型一致	,输出Buffer数据类型为ModelBoxDataType::MODELBOX_FLOAT

配置参数

参数名称	参数类型	是否必填	参数含义
output_layout	string	是	输出数据的布局类型，取值范围："hwc", "chw"
mean	string	是	减均值参数, 参数格式："124.5, 116.5, 104.5" ，参数顺序和数据维度对应
standard_deviation_inverse	string	是	归一化参数, 参数格式："0.003921568627451,0.003921568627451,0.003921568627451" ，0.00392156862745为1/255，参数顺序和数据维度对应

约束说明
输入图片布局仅支持hwc
使用样例

无

draw_bbox

功能描述

在图片上画框, 一般用于YOLO物体检测结果在原图上的显示。

设备类型

cpu

输入端口

端口名称	数据格式	数据存放设备类型	端口含义
in_image	图片数据类型	与功能单元设备类型一致	源图片信息
in_region	vector<矩形框数据类型>	cpu	待画框区域列表

输出端口

端口名称	数据格式	数据存放设备类型	端口含义
out_image	图片数据类型	与功能单元设备类型一致	结果图片信息

配置参数

无

约束说明

无

使用样例

无

图像类

图像操作类功能单元

resize

padding

crop

normalize

mean

color_convert

image_rotate

image_decoder

image_preprocess

draw_bbox

results matching ""

No results matching ""