PaddleX模型列表(昇腾 NPU)¶
PaddleX 内置了多条产线,每条产线都包含了若干模块,每个模块包含若干模型,具体使用哪些模型,您可以根据下边的 benchmark 数据来选择。如您更考虑模型精度,请选择精度较高的模型,如您更考虑模型存储大小,请选择存储大小较小的模型。
图像分类模块¶
模型名称 | Top1 Acc(%) | 模型存储大小(M) | 模型下载链接 |
---|---|---|---|
CLIP_vit_base_patch16_224 | 85.36 | 306.5 M | 推理模型/训练模型 |
CLIP_vit_large_patch14_224 | 88.1 | 1.04 G | 推理模型/训练模型 |
ConvNeXt_base_224 | 83.84 | 313.9 M | 推理模型/训练模型 |
ConvNeXt_base_384 | 84.90 | 313.9 M | 推理模型/训练模型 |
ConvNeXt_large_224 | 84.26 | 700.7 M | 推理模型/训练模型 |
ConvNeXt_large_384 | 85.27 | 700.7 M | 推理模型/训练模型 |
ConvNeXt_small | 83.13 | 178.0 M | 推理模型/训练模型 |
ConvNeXt_tiny | 82.03 | 101.4 M | 推理模型/训练模型 |
MobileNetV1_x0_5 | 63.5 | 4.8 M | 推理模型/训练模型 |
MobileNetV1_x0_25 | 51.4 | 1.8 M | 推理模型/训练模型 |
MobileNetV1_x0_75 | 68.8 | 9.3 M | 推理模型/训练模型 |
MobileNetV1_x1_0 | 71.0 | 15.2 M | 推理模型/训练模型 |
MobileNetV2_x0_5 | 65.0 | 7.1 M | 推理模型/训练模型 |
MobileNetV2_x0_25 | 53.2 | 5.5 M | 推理模型/训练模型 |
MobileNetV2_x1_0 | 72.2 | 12.6 M | 推理模型/训练模型 |
MobileNetV2_x1_5 | 74.1 | 25.0 M | 推理模型/训练模型 |
MobileNetV2_x2_0 | 75.2 | 41.2 M | 推理模型/训练模型 |
MobileNetV3_large_x0_5 | 69.2 | 9.6 M | 推理模型/训练模型 |
MobileNetV3_large_x0_35 | 64.3 | 7.5 M | 推理模型/训练模型 |
MobileNetV3_large_x0_75 | 73.1 | 14.0 M | 推理模型/训练模型 |
MobileNetV3_large_x1_0 | 75.3 | 19.5 M | 推理模型/训练模型 |
MobileNetV3_large_x1_25 | 76.4 | 26.5 M | 推理模型/训练模型 |
MobileNetV3_small_x0_5 | 59.2 | 6.8 M | 推理模型/训练模型 |
MobileNetV3_small_x0_35 | 53.0 | 6.0 M | 推理模型/训练模型 |
MobileNetV3_small_x0_75 | 66.0 | 8.5 M | 推理模型/训练模型 |
MobileNetV3_small_x1_0 | 68.2 | 10.5 M | 推理模型/训练模型 |
MobileNetV3_small_x1_25 | 70.7 | 13.0 M | 推理模型/训练模型 |
MobileNetV4_conv_large | 83.4 | 125.2 M | 推理模型/训练模型 |
MobileNetV4_conv_medium | 79.9 | 37.6 M | 推理模型/训练模型 |
MobileNetV4_conv_small | 74.6 | 14.7 M | 推理模型/训练模型 |
MobileNetV4_hybrid_large | 83.8 | 145.1 M | 推理模型/训练模型 |
MobileNetV4_hybrid_medium | 80.5 | 42.9 M | 推理模型/训练模型 |
PP-HGNet_base | 85.0 | 249.4 M | 推理模型/训练模型 |
PP-HGNet_small | 81.51 | 86.5 M | 推理模型/训练模型 |
PP-HGNet_tiny | 79.83 | 52.4 M | 推理模型/训练模型 |
PP-HGNetV2-B0 | 77.77 | 21.4 M | 推理模型/训练模型 |
PP-HGNetV2-B1 | 79.18 | 22.6 M | 推理模型/训练模型 |
PP-HGNetV2-B2 | 81.74 | 39.9 M | 推理模型/训练模型 |
PP-HGNetV2-B3 | 82.98 | 57.9 M | 推理模型/训练模型 |
PP-HGNetV2-B4 | 83.57 | 70.4 M | 推理模型/训练模型 |
PP-HGNetV2-B5 | 84.75 | 140.8 M | 推理模型/训练模型 |
PP-HGNetV2-B6 | 86.30 | 268.4 M | 推理模型/训练模型 |
PP-LCNet_x0_5 | 63.14 | 6.7 M | 推理模型/训练模型 |
PP-LCNet_x0_25 | 51.86 | 5.5 M | 推理模型/训练模型 |
PP-LCNet_x0_35 | 58.09 | 5.9 M | 推理模型/训练模型 |
PP-LCNet_x0_75 | 68.18 | 8.4 M | 推理模型/训练模型 |
PP-LCNet_x1_0 | 71.32 | 10.5 M | 推理模型/训练模型 |
PP-LCNet_x1_5 | 73.71 | 16.0 M | 推理模型/训练模型 |
PP-LCNet_x2_0 | 75.18 | 23.2 M | 推理模型/训练模型 |
PP-LCNet_x2_5 | 76.60 | 32.1 M | 推理模型/训练模型 |
PP-LCNetV2_base | 77.05 | 23.7 M | 推理模型/训练模型 |
PP-LCNetV2_large | 78.51 | 37.3 M | 推理模型/训练模型 |
PP-LCNetV2_small | 73.97 | 14.6 M | 推理模型/训练模型 |
ResNet18_vd | 72.3 | 41.5 M | 推理模型/训练模型 |
ResNet18 | 71.0 | 41.5 M | 推理模型/训练模型 |
ResNet34_vd | 76.0 | 77.3 M | 推理模型/训练模型 |
ResNet34 | 74.6 | 77.3 M | 推理模型/训练模型 |
ResNet50_vd | 79.1 | 90.8 M | 推理模型/训练模型 |
ResNet50 | 76.5 | 90.8 M | 推理模型/训练模型 |
ResNet101_vd | 80.2 | 158.4 M | 推理模型/训练模型 |
ResNet101 | 77.6 | 158.7 M | 推理模型/训练模型 |
ResNet152_vd | 80.6 | 214.3 M | 推理模型/训练模型 |
ResNet152 | 78.3 | 214.2 M | 推理模型/训练模型 |
ResNet200_vd | 80.9 | 266.0 M | 推理模型/训练模型 |
SwinTransformer_base_patch4_window7_224 | 83.37 | 310.5 M | 推理模型/训练模型 |
SwinTransformer_base_patch4_window12_384 | 84.17 | 311.4 M | 推理模型/训练模型 |
SwinTransformer_large_patch4_window7_224 | 86.19 | 694.8 M | 推理模型/训练模型 |
SwinTransformer_large_patch4_window12_384 | 87.06 | 696.1 M | 推理模型/训练模型 |
SwinTransformer_small_patch4_window7_224 | 83.21 | 175.6 M | 推理模型/训练模型 |
SwinTransformer_tiny_patch4_window7_224 | 81.10 | 100.1 M | 推理模型/训练模型 |
StarNet-S1 | 73.6 | 11.2 M | 推理模型/训练模型 |
StarNet-S2 | 74.8 | 14.3 M | 推理模型/训练模型 |
StarNet-S3 | 77.0 | 22.2 M | 推理模型/训练模型 |
StarNet-S4 | 79.0 | 28.9 M | 推理模型/训练模型 |
FasterNet-L | 83.5 | 357.1 M | 推理模型/训练模型 |
FasterNet-M | 83.0 | 204.6 M | 推理模型/训练模型 |
FasterNet-S | 81.3 | 119.3 M | 推理模型/训练模型 |
FasterNet-T0 | 71.9 | 15.1 M | 推理模型/训练模型 |
FasterNet-T1 | 75.9 | 29.2 M | 推理模型/训练模型 |
FasterNet-T2 | 79.1 | 57.4 M | 推理模型/训练模型 |
注:以上精度指标为ImageNet-1k验证集 Top1 Acc。
图像多标签分类模块¶
注:以上精度指标为 COCO2017 的多标签分类任务mAP。
行人属性模块¶
注:以上精度指标为 PaddleX 内部自建数据集mA。
车辆属性模块¶
注:以上精度指标为 VeRi 数据集 mA。
目标检测模块¶
模型名称 | mAP(%) | 模型存储大小(M) | 模型下载链接 |
---|---|---|---|
Cascade-FasterRCNN-ResNet50-FPN | 41.1 | 245.4 M | 推理模型/训练模型 |
Cascade-FasterRCNN-ResNet50-vd-SSLDv2-FPN | 45.0 | 246.2 M | 推理模型/训练模型 |
CenterNet-DLA-34 | 37.6 | 75.4 M | 推理模型/训练模型 |
CenterNet-ResNet50 | 38.9 | 319.7 M | 推理模型/训练模型 |
DETR-R50 | 42.3 | 159.3 M | 推理模型/训练模型 |
FasterRCNN-ResNet34-FPN | 37.8 | 137.5 M | 推理模型/训练模型 |
FasterRCNN-ResNet50 | 36.7 | 120.2 M | 推理模型/训练模型 |
FasterRCNN-ResNet50-FPN | 38.4 | 148.1 M | 推理模型/训练模型 |
FasterRCNN-ResNet50-vd-FPN | 39.5 | 148.1 M | 推理模型/训练模型 |
FasterRCNN-ResNet50-vd-SSLDv2-FPN | 41.4 | 148.1 M | 推理模型/训练模型 |
FasterRCNN-ResNet101 | 39.0 | 188.1 M | 推理模型/训练模型 |
FasterRCNN-ResNet101-FPN | 41.4 | 216.3 M | 推理模型/训练模型 |
FasterRCNN-ResNeXt101-vd-FPN | 43.4 | 360.6 M | 推理模型/训练模型 |
FasterRCNN-Swin-Tiny-FPN | 42.6 | 159.8 M | 推理模型/训练模型 |
FCOS-ResNet50 | 39.6 | 124.2 M | 推理模型/训练模型 |
PicoDet-L | 42.6 | 20.9 M | 推理模型/训练模型 |
PicoDet-M | 37.5 | 16.8 M | 推理模型/训练模型 |
PicoDet-S | 29.1 | 4.4 M | 推理模型/训练模型 |
PicoDet-XS | 26.2 | 5.7M | 推理模型/训练模型 |
PP-YOLOE_plus-L | 52.9 | 185.3 M | 推理模型/训练模型 |
PP-YOLOE_plus-M | 49.8 | 83.2 M | 推理模型/训练模型 |
PP-YOLOE_plus-S | 43.7 | 28.3 M | 推理模型/训练模型 |
PP-YOLOE_plus-X | 54.7 | 349.4 M | 推理模型/训练模型 |
RT-DETR-H | 56.3 | 435.8 M | 推理模型/训练模型 |
RT-DETR-L | 53.0 | 113.7 M | 推理模型/训练模型 |
RT-DETR-R18 | 46.5 | 70.7 M | 推理模型/训练模型 |
RT-DETR-R50 | 53.1 | 149.1 M | 推理模型/训练模型 |
RT-DETR-X | 54.8 | 232.9 M | 推理模型/训练模型 |
YOLOv3-DarkNet53 | 39.1 | 219.7 M | 推理模型/训练模型 |
YOLOv3-MobileNetV3 | 31.4 | 83.8 M | 推理模型/训练模型 |
YOLOv3-ResNet50_vd_DCN | 40.6 | 163.0 M | 推理模型/训练模型 |
注:以上精度指标为COCO2017验证集 mAP(0.5:0.95)。
小目标检测模块¶
注:以上精度指标为 VisDrone-DET 验证集 mAP(0.5:0.95)。
行人检测模块¶
注:以上精度指标为 CrowdHuman 验证集 mAP(0.5:0.95)。
语义分割模块¶
模型名称 | mloU(%) | 模型存储大小(M) | 模型下载链接 |
---|---|---|---|
Deeplabv3_Plus-R50 | 80.36 | 94.9 M | 推理模型/训练模型 |
Deeplabv3_Plus-R101 | 81.10 | 162.5 M | 推理模型/训练模型 |
Deeplabv3-R50 | 79.90 | 138.3 M | 推理模型/训练模型 |
Deeplabv3-R101 | 80.85 | 205.9 M | 推理模型/训练模型 |
OCRNet_HRNet-W18 | 80.67 | 43.1 M | 推理模型/训练模型 |
OCRNet_HRNet-W48 | 82.15 | 249.8 M | 推理模型/训练模型 |
PP-LiteSeg-T | 73.10 | 28.5 M | 推理模型/训练模型 |
SegFormer-B0 (slice) | 76.73 | 13.2 M | 推理模型/训练模型 |
SegFormer-B1 (slice) | 78.35 | 48.5 M | 推理模型/训练模型 |
SegFormer-B2 (slice) | 81.60 | 96.9 M | 推理模型/训练模型 |
SegFormer-B3 (slice) | 82.47 | 167.3 M | 推理模型/训练模型 |
SegFormer-B4 (slice) | 82.38 | 226.7 M | 推理模型/训练模型 |
SegFormer-B5 (slice) | 82.58 | 229.7 M | 推理模型/训练模型 |
注:以上精度指标为Cityscapes数据集 mloU。
注:以上精度指标为 ADE20k 数据集, slice 表示对输入图像进行了切图操作。
实例分割模块¶
模型名称 | Mask AP | 模型存储大小(M) | 模型下载链接 |
---|---|---|---|
Mask-RT-DETR-H | 50.6 | 449.9 | 推理模型/训练模型 |
Mask-RT-DETR-L | 45.7 | 113.6 | 推理模型/训练模型 |
Mask-RT-DETR-M | 42.7 | 66.6 M | 推理模型/训练模型 |
Mask-RT-DETR-S | 41.0 | 51.8 M | 推理模型/训练模型 |
Mask-RT-DETR-X | 47.5 | 237.5 M | 推理模型/训练模型 |
Cascade-MaskRCNN-ResNet50-FPN | 36.3 | 254.8 | 推理模型/训练模型 |
Cascade-MaskRCNN-ResNet50-vd-SSLDv2-FPN | 39.1 | 254.7 | 推理模型/训练模型 |
MaskRCNN-ResNet50-FPN | 35.6 | 157.5 M | 推理模型/训练模型 |
MaskRCNN-ResNet50-vd-FPN | 36.4 | 157.5 M | 推理模型/训练模型 |
MaskRCNN-ResNet50 | 32.8 | 127.8 M | 推理模型/训练模型 |
MaskRCNN-ResNet101-FPN | 36.6 | 225.4 M | 推理模型/训练模型 |
MaskRCNN-ResNet101-vd-FPN | 38.1 | 225.1 M | 推理模型/训练模型 |
MaskRCNN-ResNeXt101-vd-FPN | 39.5 | 370.0 M | 推理模型/训练模型 |
PP-YOLOE_seg-S | 32.5 | 31.5 M | 推理模型/训练模型 |
注:以上精度指标为COCO2017验证集 Mask AP(0.5:0.95)。
图像特征模块¶
注:以上精度指标为 AliProducts recall@1。
主体检测模块¶
注:以上精度指标为 PaddleClas主体检测数据集 mAP(0.5:0.95)。
车辆检测模块¶
注:以上精度指标为 PPVehicle 验证集 mAP(0.5:0.95)。
人脸检测模块¶
注:以上精度指标是在WIDER-FACE验证集上,以640 *640作为输入尺寸评估得到的。
异常检测模块¶
注:以上精度指标为 MVTec AD 验证集 平均异常分数。
文本检测模块¶
注:以上精度指标的评估集是 PaddleOCR 自建的中文数据集,覆盖街景、网图、文档、手写多个场景,其中检测包含 500 张图片。
文本识别模块¶
注:以上精度指标的评估集是 PaddleOCR 自建的中文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 1.1w 张图片。
注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务A榜。
注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务B榜。
表格结构识别模块¶
注:以上精度指标测量自PubtabNet英文表格识别数据集。
图像矫正模块¶
注:以上精度指标测量自 PaddleX自建的图像矫正数据集。
印章文本检测模块¶
注:以上精度指标的评估集是 PaddleX 自建的印章数据集,包含500印章图像。
文档方向分类模块¶
注:以上精度指标为 PaddleX 内部自建数据集 Top-1 Acc 。
版面区域检测模块¶
注:以上精度指标的评估集是 PaddleOCR 自建的版面区域分析数据集,包含 1w 张图片。
时序预测模块¶
注:以上精度指标测量自ETTH1数据集 (在测试集test.csv上的评测结果)。
时序异常检测模块¶
注:以上精度指标测量自PSM数据集。
时序分类模块¶
注:以上精度指标测量自UWaveGestureLibrary:训练、评测数据集。