# PP-UIE-0.5B **Repository Path**: zhangtt123/PP-UIE-0.5B ## Basic Information - **Project Name**: PP-UIE-0.5B - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-06-23 - **Last Updated**: 2025-06-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README --- license: Apache License 2.0 --- # 通用信息抽取大模型 PP-UIE **目录** - [1. 模型简介](#模型简介) - [2. 开箱即用](#开箱即用) - [2.1 实体抽取](#实体抽取) - [2.2 关系抽取](#关系抽取) - [2.3 模型选择](#模型选择) - [2.4 更多配置](#更多配置) - [3. 训练定制](#训练定制) - [3.1 代码结构](#代码结构) - [3.2 数据标注](#数据标注) - [3.3 模型微调](#模型微调) - [3.4 定制模型一键预测](#定制模型一键预测) - [3.5 实验指标](#实验指标) ## 1. 模型简介 通用信息抽取大模型(PP-UIE)是 PaddleNLP 团队基于开源模型和高质量数据集构建的通用信息抽取大模型, PaddleNLP 基于百度 UIE 的建模思路,通过大模型的能力来训练并开源了一款面向中、英文通用信息抽取的大模型。 支持统一训练信息抽取任务包括命名实体识别(NER),关系抽取(RE)和事件抽取(EE)。模型共包含0.5B、1.5B、7B 和14B 共4个版本,以适配不同场景下信息抽取任务使用。在多个数据集(包含 Boson、CLUENER、CCIR2021等常见数据)相比其他通用信息抽取大模型在 ACC 和 F1 指标上有大幅度提升。 ## 2. 开箱即用 ```paddlenlp.Taskflow```提供通用信息抽取等能力,可抽取多种类型的信息,包括但不限于命名实体识别(如人名、地名、机构名等)、关系(如电影的导演、歌曲的发行时间等)、事件(如某路口发生车祸、某地发生地震等)等信息。用户可以使用自然语言自定义抽取目标,无需训练即可统一抽取输入文本中的对应信息。**实现开箱即用,并满足各类信息抽取需求** #### 2.1 实体抽取 命名实体识别(Named Entity Recognition,简称 NER),是指识别文本中具有特定意义的实体。在开放域信息抽取中,抽取的类别没有限制,用户可以自己定义。 - 例如抽取的目标实体类型是"时间"、"选手"和"赛事名称", schema 构造如下: ```text ['时间', '选手', '赛事名称'] ``` Git命令下载模型: ```bash git lfs install git clone http://git.aistudio.baidu.com/PaddleNLP/PP-UIE-0.5B.git ``` 调用示例: ```python from pprint import pprint from paddlenlp import Taskflow schema = ['时间', '选手', '赛事名称'] # Define the schema for entity extraction ie = Taskflow('information_extraction', schema= ['时间', '选手', '赛事名称'], schema_lang="zh", batch_size=1, model='paddlenlp/PP-UIE-0.5B', precision='float16') pprint(ie("2月8日上午北京冬奥会自由式滑雪女子大跳台决赛中中国选手谷爱凌以188.25分获得金牌!")) # Better print results using pprint # 输出 [{'时间': [{'text': '2月8日上午'}], '赛事名称': [{'text': '北京冬奥会自由式滑雪女子大跳台决赛'}], '选手': [{'text': '谷爱凌'}]}] ``` #### 2.2 关系抽取 关系抽取(Relation Extraction,简称 RE),是指从文本中识别实体并抽取实体之间的语义关系,进而获取三元组信息,即<主体,谓语,客体>。 - 例如以"竞赛名称"作为抽取主体,抽取关系类型为"主办方"、"承办方"和"时间", schema 构造如下: ```text { '竞赛名称': [ '主办方', '承办方', '时间' ] } ``` 调用示例: ```python schema = {'竞赛名称': ['主办方', '承办方', '时间']} # Define the schema for relation extraction ie.set_schema(schema) # Reset schema pprint(ie('2022年语言与智能技术竞赛由中国中文信息学会和中国计算机学会联合主办,百度公司、中国中文信息学会评测工作委员会和中国计算机学会自然语言处理专委会承办,已连续举办4届,成为全球最热门的中文NLP赛事之一。')) # 输出 [{'竞赛名称': [{'relations': {'主办方': [{'text': '中国中文信息学会,中国计算机学会'}], '时间': [{'text': '2022年'}], '承办方': [{'text': '百度公司,中国中文信息学会评测工作委员会,中国计算机学会自然语言处理专委会'}]}, 'text': '语言与智能技术竞赛'}]}] ``` #### 2.3 模型选择 - 多模型选择,满足精度、速度要求 | 模型 | 结构 | 语言 | | :---: | :--------: | :--------: | | `paddlenlp/PP-UIE-0.5B` | 24-layers, 896-hidden, 14-heads | 中、英文 | | `paddlenlp/PP-UIE-1.5B` | 28-layers, 1536-hidden, 12-heads | 中、英文 | | `paddlenlp/PP-UIE-7B` | 28-layers, 3584-hidden, 28-heads | 中、英文 | | `paddlenlp/PP-UIE-14B` | 48-layers, 5120-hidden, 40-heads | 中、英文 | #### 2.4 更多配置 ```python >>> from paddlenlp import Taskflow >>> ie = Taskflow('information_extraction', schema = {'竞赛名称': ['主办方', '承办方', '时间']}, schema_lang="zh", batch_size=1, model='paddlenlp/PP-UIE-0.5B', precision='float16') ``` * `schema`:定义任务抽取目标,可参考开箱即用中不同任务的调用示例进行配置。 * `schema_lang`:设置 schema 的语言,默认为`zh`, 可选有`zh`和`en`。因为中英 schema 的构造有所不同,因此需要指定 schema 的语言。 * `batch_size`:批处理大小,请结合机器情况进行调整,默认为1。 * `model`:选择任务使用的模型,可选有`paddlenlp/PP-UIE-0.5B`, `paddlenlp/PP-UIE-1.5B`, `paddlenlp/PP-UIE-7B`, `paddlenlp/PP-UIE-14B`。 * `precision`:选择模型精度,默认为`float16`,可选有`float16`、`bfloat16`和`float32`和。如果选择`float16`,在 GPU 硬件环境下,请先确保机器正确安装 NVIDIA 相关驱动和基础软件,**确保 CUDA>=11.2,cuDNN>=8.1.1**,初次使用需按照提示安装相关依赖。其次,需要确保 GPU 设备的 CUDA 计算能力(CUDA Compute Capability)大于7.0,典型的设备包括 V100、T4、A10、A100、GTX 20系列和30系列显卡等。如果选择`bfloat16`,能有效加速处理大模型和批量数据,尤其与混合精度结合使用时性能表现更优。但需确保硬件和软件环境支持该精度。支持 `bfloat16`的硬件包括 NVIDIA A100 和 H800 GPU,同时需要确保使用 CUDA>=11.2、cuDNN>=8.1.1 等软件环境。更多关于 CUDA Compute Capability 和精度支持情况请参考 NVIDIA 文档:[GPU 硬件与支持精度对照表](https://docs.nvidia.com/deeplearning/tensorrt/archives/tensorrt-840-ea/support-matrix/index.html#hardware-precision-matrix)。 除此之外,也可通过以下代码快速调用模型并进行推理 ```python from paddlenlp.transformers import AutoModelForCausalLM from paddlenlp.transformers import AutoTokenizer from paddlenlp.generation import GenerationConfig from paddlenlp.trl import llm_utils model_id = "paddlenlp/PP-UIE-0.5B" model = AutoModelForCausalLM.from_pretrained(model_id, use_flash_attention=False) model.eval() tokenizer = AutoTokenizer.from_pretrained(model_id, padding_side="left") generation_config = GenerationConfig.from_pretrained(model_id) template = """ 你是一个阅读理解专家,请提取所给句子与问题,提取实体。请注意,如果存在实体,则一定在原句中逐字出现,请输出对应实体的原文,不要进行额外修改;如果无法提取,请输出“无相应实体”。 **句子开始** {sentence} **句子结束** **问题开始** {prompt} **问题结束** **回答开始** """ sentences = [ "2月12日,哈尔滨亚冬会花样滑冰女子个人滑短节目比赛中,中国选手朱易第一个登场且表现出色,拿到62.90分,创职业生涯短节目最高分。", "2月12日,在哈尔滨亚冬会越野滑雪男子4×7.5公里接力决赛中,由李明林、次仁占堆、宝林、王强组成的中国队夺得金牌。", "2月13日,在哈尔滨亚冬会冬季两项女子4×6公里接力比赛中,由唐佳琳、文颖、褚源蒙和孟繁棋组成的中国队夺得金牌。", "中国地震台网正式测定:5月16日06时08分在云南临沧市凤庆县(北纬24.34度,东经99.98度)发生3.5级地震,震源深度10千米。", "《告别了》是孙耀威在专辑爱的故事里面的歌曲。", ] prompts = [ "时间, 选手, 赛事名称", "时间, 选手, 赛事名称", "时间, 选手, 赛事名称", "地震强度, 时间, 震中位置, 震源深度", "歌曲名称, 歌手, 所属专辑", ] inputs = [template.format(sentence=sentence, prompt=prompt) for sentence, prompt in zip(sentences, prompts)] inputs = [tokenizer.apply_chat_template(sentence, tokenize=False) for sentence in inputs] input_features = tokenizer( inputs, max_length=512, return_position_ids=False, truncation=True, truncation_side="left", padding=True, return_tensors="pd", add_special_tokens=False, ) outputs = model.generate( **input_features, max_new_tokens=200, bos_token_id=tokenizer.bos_token_id, eos_token_id=llm_utils.get_eos_token_id(tokenizer, generation_config), pad_token_id=tokenizer.pad_token_id, decode_strategy="greedy_search", temperature=1.0, top_k=1, top_p=1.0, repetition_penalty=1.0, ) def get_clean_entity(text): ind1 = text.find("\n **回答结束**\n\n") if ind1 != -1: pred = text[:ind1] else: pred = text return pred results = tokenizer.batch_decode(outputs[0], skip_special_tokens=True, clean_up_tokenization_spaces=False) results = [get_clean_entity(result) for result in results] for sentence, prompt, result in zip(sentences, prompts, results): print("-" * 50) print(f"Sentence: {sentence}") print(f"Prompt: {prompt}") print(f"Result: {result}") ``` ## 3. 训练定制 对于简单的抽取目标可以直接使用 ```paddlenlp.Taskflow```实现零样本(zero-shot)抽取,对于细分场景我们推荐使用轻定制功能(标注少量数据进行模型微调)以进一步提升效果。下面通过`报销工单信息抽取`的例子展示如何通过几十条训练数据进行 PP-UIE 模型微调。 #### 3.1 代码结构 ```shell . ├── utils.py # 数据处理工具 ├── doccano.py # 数据标注脚本 ├── doccano.md # 数据标注文档 └── README.md ``` #### 3.2 数据标注 我们推荐使用数据标注平台[doccano](https://github.com/doccano/doccano) 进行数据标注,本示例也打通了从标注到训练的通道,即 doccano 导出数据后可通过[doccano.py](https://github.com/PaddlePaddle/PaddleNLP/blob/develop/llm/application/information_extraction/doccano.py)脚本轻松将数据转换为输入模型时需要的形式,实现无缝衔接。标注方法的详细介绍请参考[doccano 数据标注指南](doccano.md)。 原始数据示例: ```text 深大到双龙28块钱4月24号交通费 ``` 抽取的目标(schema)为: ```python schema = ['出发地', '目的地', '费用', '时间'] ``` 标注步骤如下: - 在 doccano 平台上,创建一个类型为``序列标注``的标注项目。 - 定义实体标签类别,上例中需要定义的实体标签有``出发地``、``目的地``、``费用``和``时间``。 - 使用以上定义的标签开始标注数据,下面展示了一个 doccano 标注示例:
- 标注完成后,在 doccano 平台上导出文件,并将其重命名为``doccano_ext.json``后,放入``./data``目录下。 - 这里我们提供预先标注好的文件[doccano_ext.json](https://bj.bcebos.com/paddlenlp/datasets/uie/doccano_ext.json),可直接下载并放入`./data`目录。执行以下脚本进行数据转换,执行后会在`./data`目录下生成训练/验证/测试集文件。 ```shell python doccano.py \ --doccano_file ./data/doccano_ext.json \ --save_dir ./data \ --splits 0.8 0.1 0.1 \ --schema_lang ch ``` 可配置参数说明: - ``doccano_file``: 从 doccano 导出的数据标注文件。 - ``save_dir``: 训练数据的保存目录,默认存储在``data``目录下。 - ``negative_ratio``: 最大负例比例,该参数只对抽取类型任务有效,适当构造负例可提升模型效果。负例数量和实际的标签数量有关,最大负例数量 = negative_ratio * 正例数量。 - ``splits``: 划分数据集时训练集、验证集所占的比例。默认为[0.8, 0.1, 0.1]表示按照``8:1:1``的比例将数据划分为训练集、验证集和测试集。 - ``task_type``: 选择任务类型,目前只有信息抽取`ie`这一种任务。 - ``is_shuffle``: 是否对数据集进行随机打散,默认为 False。 - ``seed``: 随机种子,默认为1000. - ``schema_lang``: 选择 schema 的语言,可选有`ch`和`en`。默认为`ch`,英文数据集请选择`en`。 备注: - 默认情况下 doccano.py 脚本会按照比例将数据划分为 train/dev/test 数据集 - 每次执行 doccano.py 脚本,将会覆盖已有的同名数据文件 - 在模型训练阶段我们推荐构造一些负例以提升模型效果,在数据转换阶段我们内置了这一功能。可通过`negative_ratio`控制自动构造的负样本比例;负样本数量 = negative_ratio * 正样本数量。 - 对于从 doccano 导出的文件,默认文件中的每条数据都是经过人工正确标注的。 #### 3.3 模型微调 推荐使用 [大模型精调](../../docs/finetune.md) 对模型进行微调。只需输入模型、数据集等就可以高效快速地进行微调和模型压缩等任务,可以一键启动多卡训练、混合精度训练、梯度累积、断点重启、日志显示等功能,并且针对训练过程的通用训练配置做了封装,比如:优化器、学习率调度等。 使用下面的命令,使用 `paddlenlp/PP-UIE-0.5B` 作为预训练模型进行模型微调,将微调后的模型保存至指定路径中。 如果在 GPU 环境中使用,可以指定 gpus 参数进行多卡训练: ```shell # 返回 PaddleNLP/llm 目录 python -u -m paddle.distributed.launch --gpus "0,1" run_finetune.py ./config/qwen/sft_argument.json ``` `sft_argument.json` 的参考配置如下: ```shell { "model_name_or_path": "paddlenlp/PP-UIE-0.5B", "dataset_name_or_path": "./application/information_extraction/data", "output_dir": "./checkpoints/ie_ckpts", "per_device_train_batch_size": 1, "gradient_accumulation_steps": 1, "per_device_eval_batch_size": 1, "eval_accumulation_steps":8, "num_train_epochs": 3, "learning_rate": 3e-05, "warmup_steps": 30, "logging_steps": 1, "evaluation_strategy": "epoch", "save_strategy": "epoch", "src_length": 1024, "max_length": 2048, "fp16": true, "fp16_opt_level": "O2", "do_train": true, "do_eval": true, "disable_tqdm": true, "load_best_model_at_end": true, "eval_with_do_generation": false, "metric_for_best_model": "accuracy", "recompute": false, "save_total_limit": 1, "tensor_parallel_degree": 1, "pipeline_parallel_degree": 1, "sharding": "stage2", "zero_padding": false, "unified_checkpoint": true, "use_flash_attention": false } ``` 更多 `sft_argument.json` 配置文件说明,请参考[大模型精调](../../docs/finetune.md) #### 3.4 定制模型一键预测 使用 PaddleNLP 的高性能 predictor 进行快速推理 - 内置全环节融合算子策略 - 支持 Weight Only INT8及 INT4推理,支持权重、激活、Cache KV 进行 INT8、FP8量化的推理 - 支持动态图推理和静态图推理两种方式 在推理之前,推荐编译安装 PaddleNLP 大模型高性能自定义推理算子。使用这些高性能算子,可以大幅提升大模型推理速度。详细的安装教程请参考[大模型高性能推理算子安装教程](https://github.com/PaddlePaddle/PaddleNLP/blob/develop/csrc/README.md) 安装完之后,可按照下列指令,进行高性能推理。 ```shell # PaddleNLP/llm目录下 python predict/predictor.py \ --model_name_or_path ./checkpoints/ie_ckpts \ --dtype float16 \ --data_file ./application/information_extraction/data/test.json \ --output_file ./output.json \ --src_length 512 \ --max_length 1024 \ --batch_size 4 \ --inference_model 1 \ --quant_type weight_only_int8 ``` 可配置参数说明: - ``model_name_or_path``: 必需,预训练模型名称或者本地的模型路径,用于热启模型和分词器,默认为 None。 - ``src_length``: 模型输入上下文最大 token 长度,默认为1024。 - ``max_length``: 模型输入(上下文+生成内容)的最大 token 长度, 默认为2048。 - ``inference_model``: 是否使用 Inference Model 推理,默认值为 False。Inference Model 内置动态插入和全环节算子融合策略,开启后性能更优。**如果没有编译安装 PaddleNLP 大模型高性能自定义推理算子,只能设置为False** - ``quant_type``: 是否使用量化推理,默认值为 None。可选的数值有weight_only_int8、weight_only_int4、a8w8和a8w8_fp8。**如果没有编译安装 PaddleNLP 大模型高性能自定义推理算子,只能设置为None** 更多关于 `predictor.py` 的配置参数说明,请参考[大模型推理教程](../../docs/predict/inference.md) #### 3.5 实验指标 我们在通用测试集和医疗、新闻、对话与金融等垂类测试集上进行了实验:
模型名称数据集名称CMeEE-V2BosonCLUENERCCIR2021-NER任务对话2018-NER银行借贷2021-NERSKE2019Avg
数据集领域医疗领域通用领域通用领域新闻领域对话领域金融领域金融领域
PP-UIE-0.5BF1(0-shot)0.4790.6380.5930.7730.7230.3610.7820.621
PP-UIE-1.5BF1(0-shot)0.4850.6880.610.7990.7680.4440.8030.657
F1(5-shot)0.520.6940.6250.8120.8120.4660.8010.676
PP-UIE-7BF1(0-shot)0.5210.6960.6150.8260.8070.4340.8120.673
F1(5-shot)0.5270.7050.6260.8260.8610.4830.8010.69
PP-UIE-14BF1(0-shot)0.5560.7120.6370.8410.8430.4880.8320.701
F1(5-shot)0.5880.7290.670.8370.8650.5760.8320.728
0-shot 表示无训练数据直接通过模型进行预测,5-shot 表示预测时使用五个数据样例作为提示。**实验表明 PP-UIE 在垂类场景可以通过少量数据(few-shot)进一步提升效果**。 同时,我们测试了PP-UI系列模型在不同数据集,分别在纯动态图、开启融合算子(infernce_model = True)和win8(开启Int8量化)在batch size为[1,2,4,8,16,32,64]时的运行速度(Tokens Per Second)和预测精度(F1)。 **PP-UIE-0.5B**
模型名称数据集名称CMeEE-V2BosonCLUENERCCIR2021-NER任务对话2018-NER银行借贷2021-NERSKE2019
batch size数据集领域医疗领域通用领域通用领域新闻领域对话领域金融领域金融领域
PP-UIE-0.5B动态图1F10.5080.6230.5930.7840.7230.3320.787
TPS30.26930.51530.40330.90129.92230.82330.662
2F10.5040.6170.5910.780.7210.3370.785
TPS56.90656.69657.72656.20558.57656.47257.674
4F1  0.4940.6090.5910.7740.7210.3350.784
TPS109.094109.307107.597106.739106.243107.37108.95
8F1  0.4820.6070.5870.7650.7120.3330.784
TPS199.777199.373199.513201.492200.301197.366198.628
16F1  0.4610.5940.5880.750.7180.3320.771
TPS342.747338.052333.88339.824325.661319.512339.599
32F1  0.4250.5840.5870.7250.7140.330.751
TPS500.259495.871478.906508.637483.591480.621504.758
64F1  0.360.5640.5850.6850.7130.3170.738
TPS714.742701.403661.534705.949668.907671.853718.122
fuse_mt1F10.4970.6180.5850.780.720.3260.784
TPS88.02471.53478.17863.19551.8748.63156.048
2F10.4950.6170.5910.7810.7210.3270.78
TPS188.091157.388140.698146.544111.774102.06133.236
4F1  0.4950.6090.5940.7810.7150.3320.784
TPS395.09318.009294.731298.858220.825207.682304.236
8F1  0.4970.6190.5920.780.7190.3210.787
TPS784.377695.807587.066612.309456.107428.209538.053
16F1  0.4930.6250.5850.7750.7240.3190.789
TPS1456.8241260.5931092.2221189.585895.154822.0571134.441
32F1  0.4950.6210.5910.7780.7210.3210.788
TPS2619.0442241.1121957.3072130.9251668.4881533.0732311.613
64F1  0.4960.6130.5870.7810.7190.3220.788
TPS4279.3353571.3272775.0133692.862709.2382724.13918.789
WINT81F1  0.50.6190.5890.7740.710.3330.787
TPS102.62682.01665.70167.22653.32853.32757.867
2F1  0.5020.6130.5850.7790.720.3310.789
TPS199.294169.8142.026147.443111.743102.999121.712
4F1  0.4990.6280.5910.7770.7140.3270.788
TPS390.208340.839299.54299.343256.566268.026258.988
8F1  0.5020.6220.5880.7790.7120.3230.784
TPS821.311713.367597.427656.373439.528466.009532.473
16F1  0.4990.6210.5870.7790.720.3270.784
TPS1547.1891335.0121194.9041289.993875.995936.5251052.361
32F1  0.5010.6190.5930.7810.7210.3180.788
TPS2981.0432176.5712193.8282260.4121517.5171516.6531937.827
64F1  0.4990.623 0.5890.7780.7220.3390.785
TPS5288.7223643.2282646.1073674.8142748.3162478.6763510.926
**PP-UIE-1.5B**
模型名称数据集名称CMeEE-V2BosonCLUENERCCIR2021-NER任务对话2018-NER银行借贷2021-NERSKE2019
batch size数据集领域医疗领域通用领域通用领域新闻领域对话领域金融领域金融领域
PP-UIE-1.5B动态图1F10.520.6950.6260.8180.7660.4560.8
TPS26.4726.14125.44925.61225.3726.08425.999
2F10.5090.690.6260.8140.7640.460.799
TPS48.54548.547.85147.63947.62746.60248.196
4F1  0.4920.6890.6240.810.7650.4560.795
TPS91.65391.68491.3491.4891.15689.75290.967
8F1  0.4680.6760.6260.80.7630.4580.791
TPS169.458169.043165.25170.523169.804164.427171.739
16F1  0.4280.6640.6260.7850.7630.4560.78
TPS296.315292.382290.317295.588281.144281.313295.661
32F1  0.3790.6320.6250.7550.7630.4520.758
TPS481.643476.989458.55477.239464.775451.335487.228
64F1  0.3280.5760.6250.7070.7610.4510.72
TPS689.837682.329606.592663.469645.239636.379660.386
fuse_mt1F10.5090.6810.6210.8130.7650.4540.798
TPS83.86568.81978.82861.90555.43256.59657.138
2F10.5110.6860.6250.8110.7680.4390.799
TPS182.739150.276131.843150.973107.68199.068138.105
4F1  0.5090.6860.6180.8110.7690.4480.799
TPS389.224316.024274.555276.531236.939204.266300.587
8F1  0.5090.6820.6190.8120.7620.450.798
TPS751.196627.038554.42583.324435.373412.652618.796
16F1  0.5040.6830.6180.8150.7630.4430.798
TPS1367.6161139.2041023.1041079.171859.398789.851224.739
32F1  0.510.6870.6150.8120.7630.4480.8
TPS2346.1831862.6371721.6261873.0011446.1561358.7692174.648
64F1  0.5050.6860.6120.8110.7640.450.799
TPS3435.4182807.3752642.1862862.7732201.762086.9643377.49
WINT81F1  0.5160.6850.630.810.7760.4510.795
TPS74.78268.26358.32364.34550.21347.89448.872
2F1  0.5150.6890.6260.8090.7650.440.793
TPS197.449151.655139.386140.525116.93197.83131.507
4F1  0.5150.6920.6220.8090.7690.4430.797
TPS356.658291.106267.558272.57207.656198.878251.976
8F1  0.5150.6840.6230.8120.7620.4420.798
TPS709.983575.773522.708543.154431.868429.064518.811
16F1  0.5150.6820.6180.8140.7720.4530.799
TPS1318.791031.525935.156983.182765.36714.7851065.399
32F1  0.5150.690.6290.8110.7620.4480.798
TPS2366.7511744.83315431757.0311264.1791177.2451816.415
64F1  0.5150.6810.6220.8110.7640.4440.797
TPS3799.3262567.6482265.592650.2711906.5241761.0323083.406
**PP-UIE-7B**
模型名称数据集名称CMeEE-V2BosonCLUENERCCIR2021-NER任务对话2018-NER银行借贷2021-NERSKE2019
batch size数据集领域医疗领域通用领域通用领域新闻领域对话领域金融领域金融领域
PP-UIE-7B动态图1F10.5280.7030.6150.8270.7860.4310.813
TPS24.97124.26324.93524.20124.4324.5924.579
2F10.5240.7020.6150.8270.7860.4330.812
TPS47.83346.96847.38848.06647.847.52148.033
4F1  0.5190.7040.6160.8270.7840.4330.813
TPS88.6987.36487.51688.94189.23190.04590.196
8F1  0.5140.7040.6150.8260.7850.4330.813
TPS169.087161.141162.046164.154164.776153.411161.853
16F1  0.5010.7030.6140.8260.7850.4320.813
TPS288.043268.144264.288270.323260.654252.396270.884
32F1  0.4790.7030.6150.8230.7840.4320.12
TPS439.281400.6385.3381406.698379.117366.518399.546
64F1  0.4410.7020.6140.8160.7830.4320.808
TPS613.321593.829515.7574.011504.845506.382556.177
fuse_mt1F10.5170.7020.6230.8230.7880.4230.811
TPS51.7447.89541.02143.36937.0837.43741.661
2F10.5160.6990.6130.820.7880.4270.812
TPS105.84397.71884.91589.26674.25266.24980.974
4F1  0.5140.6960.6090.8230.7830.4340.808
TPS216.985189.58180.078187.1146.36131.028172.963
8F1  0.5180.7010.6180.8210.7870.4280.809
TPS391.686355.544334.309349.757291.318249.223348.771
16F1  0.5150.6950.6110.8230.7880.4260.809
TPS736.629642.235568.576628.74489.87458.587610.345
32F1  0.5140.7010.6090.8260.7820.4230.812
TPS1230.5911050.501927.8911001.303781.299734.3241055.442
64F1  0.5170.6970.6130.8230.7880.4240.81
TPS1819.1051579.2281336.4261514.9311161.1611121.5591594.559
WINT81F1  0.5350.6990.6230.8240.7820.4440.812
TPS65.29846.81940.87343.8335.28132.28735.705
2F1  0.5220.70.610.8240.780.4180.812
TPS127.68990.92978.17485.99967.12459.17582.49
4F1  0.5250.6950.6140.8260.7790.4250.81
TPS234.016193.467165.158179.821141.483129.085158.411
8F1  0.5220.6960.6180.8240.7810.4310.811
TPS497.447372.414319.802334.657274.958236.714341.587
16F1  0.5220.7030.6130.8240.7760.4290.812
TPS897.135695.732604.092635.239478.883423.663596.289
32F1  0.5220.7030.6150.8270.7840.4270.812
TPS1468.6471049.653890.9381017.609816.842708.418992.633
64F1  0.5260.7020.620.8220.7860.4230.809
TPS2152.0351432.9491237.6721477.6371066.383954.0651503.071
**PP-UIE-14B**
模型名称数据集名称CMeEE-V2BosonCLUENERCCIR2021-NER任务对话2018-NER银行借贷2021-NERSKE2019
batch size数据集领域医疗领域通用领域通用领域新闻领域对话领域金融领域金融领域
PP-UIE-14B动态图1F10.5320.7150.6370.8440.8260.490.828
TPS14.68514.83714.75114.69814.32914.21214.261
2F10.530.7130.6370.8430.8270.4890.828
TPS29.06229.14628.73429.24529.5629.20528.972
4F1  0.5260.7110.6370.8430.8260.4880.829
TPS55.02554.93854.63354.53255.62653.93454.969
8F1  0.520.7080.6360.8420.8270.4890.828
TPS102.47899.56899.376100.461100.83195.6498.418
16F1  0.510.7060.6350.8410.8250.4890.827
TPS185.198171.829170.281174.586164.299152.416178.834
32F1  0.490.7110.6340.8360.8220.4890.827
TPS309.815268.985267.216285.568253.737227.749293.794
64F1  0.4490.7120.6330.8320.8220.4880.826
TPS459.762428.323376.201427.951343.526355.367459.668
fuse_mt1F10.5230.7060.6370.8390.8220.4840.829
TPS34.49431.34729.99630.97728.47825.84629.052
2F10.5190.7080.6310.840.8270.480.826
TPS67.86962.08861.32160.01754.29150.91157.019
4F1  0.5220.7010.6380.840.8230.4760.826
TPS131.164122.297112.31115.559103.08896.69110.686
8F1  0.520.7080.630.8420.8250.4780.827
TPS245.615229.256215.212220.401196.891175.141210.526
16F1  0.5180.7140.6340.8420.820.4770.827
TPS440.587399.806368.995375.22329.55303.739364.359
WINT81F1  0.5240.7120.6340.8420.8250.4770.827
TPS41.23438.76234.77735.23334.72830.87132.129
2F1  0.5250.7060.6330.8420.820.4780.826
TPS80.32373.72263.89364.98887.72858.28967.826
4F1  0.5240.7080.6370.8440.8240.4780.826
TPS162.169141.365127.283130.367120.714112.827132.525
8F1  0.5250.7010.630.8420.8180.4770.826
TPS332.437281.661238.875266.18209.635175.688267.373
16F1  0.5240.7120.6340.8430.8210.4870.828
TPS545.886472.752391.256424.774353.743288.442420.256
32F1  0.5240.7070.6350.8410.8190.4780.823
TPS787.417640.262545.588602.611460.068424.596607.832
64F1  0.5260.7070.6370.8390.8310.4810.827
TPS1261.826941.326794.079894.79658.474639.901924.28
**以上实验均在单卡A100 80G运行**