From ccafdde5709d7570dffb901e72f9e65b3f6e357c Mon Sep 17 00:00:00 2001 From: Xinru_Zhong Date: Thu, 22 May 2025 07:30:38 +0000 Subject: [PATCH] =?UTF-8?q?update=20spec/01=20RISC-V=E4=BA=BA=E6=89=8D?= =?UTF-8?q?=E8=83=BD=E5=8A=9B=E5=9F=B9=E5=85=BB=E8=A7=84=E8=8C=83(RISC-V?= =?UTF-8?q?=20Talent=20Capability=20Training=20Sepcification)=5Fv0.1.adoc.?= =?UTF-8?q?=20=E6=B7=BB=E5=8A=A0=E2=80=9C=E6=99=BA=E8=83=BD=E8=AE=A1?= =?UTF-8?q?=E7=AE=97=E7=B3=BB=E7=BB=9F=E4=BA=BA=E6=89=8D=E6=A0=87=E5=87=86?= =?UTF-8?q?=E2=80=9D=E4=B8=AD=E2=80=9C=E4=B8=93=E5=AE=B6=E2=80=9D=E7=AD=89?= =?UTF-8?q?=E7=BA=A7=E6=A0=87=E5=87=86=E7=BB=86=E5=88=99?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Signed-off-by: Xinru_Zhong --- ...ability Training Sepcification)_v0.1.adoc" | 244 ++++++++++++++---- 1 file changed, 188 insertions(+), 56 deletions(-) diff --git "a/spec/01 RISC-V\344\272\272\346\211\215\350\203\275\345\212\233\345\237\271\345\205\273\350\247\204\350\214\203(RISC-V Talent Capability Training Sepcification)_v0.1.adoc" "b/spec/01 RISC-V\344\272\272\346\211\215\350\203\275\345\212\233\345\237\271\345\205\273\350\247\204\350\214\203(RISC-V Talent Capability Training Sepcification)_v0.1.adoc" index d02a5e1..ff651ee 100644 --- "a/spec/01 RISC-V\344\272\272\346\211\215\350\203\275\345\212\233\345\237\271\345\205\273\350\247\204\350\214\203(RISC-V Talent Capability Training Sepcification)_v0.1.adoc" +++ "b/spec/01 RISC-V\344\272\272\346\211\215\350\203\275\345\212\233\345\237\271\345\205\273\350\247\204\350\214\203(RISC-V Talent Capability Training Sepcification)_v0.1.adoc" @@ -237,15 +237,30 @@ RISC-V产业与社区推广方向岗位: |知识|基础统计学(如均值、方差、概率分布);数据库基础(如SQL语法);Excel及基础可视化工具(如Tableau/Power BI);简单业务场景分析框架 |进阶统计学(如回归分析、假设检验);机器学习基础(如聚类、分类算法);数据仓库(如ETL流程、星型模型);业务领域知识(如用户画像、A/B测试) |精通机器学习与数据挖掘(如深度学习、特征工程);大数据技术栈(如Hadoop/Spark);行业垂直领域知识(如金融风控、供应链优化);数据治理与合规性(如GDPR) -|…… +|大数据、数据中台、前沿算法与AI技术(如强化学习、生成式AI);多行业横向融合能力(如AI+医疗/政务);数据体系顶层设计(如主数据、数据血缘);数据伦理与AI安全框架 |技能|数据清洗与预处理(如缺失值处理);基础SQL查询与简单报表开发;Python/R基础编程(如Pandas/Matplotlib);执行标准化分析任务 |独立完成端到端分析项目(从需求到落地);复杂SQL优化与ETL开发;模型构建与调参(如Scikit-learn/TensorFlow);跨部门需求沟通与方案设计 |制定数据驱动战略(如用户增长体系);高并发数据处理与架构优化;复杂模型解释与业务价值转化;团队管理与技术决策(如选型、成本评估) -|…… +|构建企业级数据生态与平台架构;主导跨国/跨集团数据战略项目;提出并落地创新型算法解决方案;培养人才梯队与组织能力提升 |经验|0-3年岗位经验;参与2-3个完整分析项目(如销售报表优化);6个月以上数据清洗/基础分析经验;支持业务部门临时需求(如数据提取) |3-5年工作经验,具备做过大型项目的全过程经验,能独立给组员分解任务,分配工作,并对项目进度进行有效负责;主导3-5个中型项目(如用户留存分析);2年以上跨部门协作经验;优化过至少1个核心业务指标(如转化率提升10%+) |5-8年工作经验,带团队负责复杂项目完成。具备大项目的领军带队能力;领导5+大型项目(如全链路数据中台建设);5-8年行业深耕经验(如电商/金融);成功推动数据文化转型(如从0到1搭建分析团队) -|…… +|8年以上数据分析/科学领域经验;深度参与企业数字化转型;在大型会议/行业内发表高影响力成果;具备国际视野与战略思维,曾担任首席数据官/数据科学负责人等角色 +|小结|初级:执行导向,依赖标准化流程,需明确指导。 + +中级:问题驱动,能独立拆解复杂问题并提出解决方案。 + +高级:战略视角,结合技术与业务制定长期规划,具备行业影响力(如输出方法论)。 + +专家:引领创新,具备系统性思维与前瞻判断力,推动行业标准、数据文化和组织能力的共同演进。 + +岗位晋升考评准则: + +知识:从工具使用 → 算法原理 → 系统架构与行业认知→ 前沿技术融合与数据治理体系构建 + +技能:从操作执行 → 项目闭环 → 规模化价值创造→ 数据战略落地与组织能力建设 + +经验:从局部支持 → 全流程主导 → 跨领域资源整合→ 行业影响与生态系统构建 |=== ===== 3.2.4.2 数据工程师 |=== @@ -253,31 +268,61 @@ RISC-V产业与社区推广方向岗位: |知识|需要基础编程、数据库、数据预处理工具;编程基础(如Python/SQL);数据库与数据仓库基础(如MySQL/Hive);数据预处理技术(缺失值处理、特征标准化);机器学习基本概念(如监督/无监督学习) |需要分布式系统、机器学习流程、数据建模;分布式计算框架(如Spark/Flink);大数据存储与处理(如Hadoop/Kafka);机器学习工程化流程(如特征工程、模型部署);数据建模(如维度建模、数据湖架构) |需要架构设计、前沿技术、行业深度知识;高并发实时数据架构设计(如Lambda/Kappa架构);深度结合AI的数据流水线(如自动化特征生成、模型迭代支持);云原生技术栈(如AWS/GCP/Azure的AI服务);数据安全与隐私保护(如联邦学习、差分隐私) -|…… +|数据基础设施战略规划与演进(如湖仓一体、数据中台产品化);行业级平台建设经验(如跨组织数据协同、监管合规对接);技术趋势洞察与融合(如Data-Centric AI、MLOps系统化);推动行业标准与开源生态(如参与Apache/HuggingFace等社区) |技能|数据清洗、ETL开发;基础ETL开发与数据清洗(如Pandas/SQL);构建简单数据管道(如Airflow基础);支持AI模型数据需求(如数据集构建);数据质量监控与基础调优 |优化流程、模型部署支持;设计高效数据流水线(如优化Spark作业);实现特征存储系统(如Feature Store);支持模型部署与AB测试数据流;数据治理(如元数据管理、血缘追踪) |设计复杂系统、跨团队协作、技术决策;构建企业级AI数据中台(如统一数据服务);设计实时+离线混合数据架构(如支撑模型在线学习);主导数据与AI的协同优化(如数据闭环系统);技术选型与成本/性能平衡决策 -|…… +|构建具备弹性与可观测性的数据体系(如全链路监控、自动调优);设计支持大模型训练与服务的数据架构(如多模态数据流);打通数据全生命周期链路(采集、建模、治理、服务);推动组织级数据工程文化与能力体系建设 |经验|0-3年经验,能参与项目完成指定工作;参与1-2个AI项目数据支持(如推荐系统数据准备);6个月以上ETL开发经验;处理过TB级以下数据集 |3-5年经验,能主导中型项目小组;主导3+AI项目数据架构(如NLP/OCR数据流水线);3年以上高吞吐数据处理经验(如日均亿级数据);优化过数据链路性能(如查询效率提升50%+) |5-8年经验,领导大型项目并推动技术创新;领导5+大型AI数据工程(如自动驾驶数据平台);5-8年跨AI场景经验(如CV/NLP/风控);成功解决过数据瓶颈问题(如支撑千亿参数模型训练) -|…… +|8年以上经验,引领行业或组织数据工程转型;主导跨国或跨行业数据平台建设;培养多个高级工程师与技术管理者;在业内输出数据工程方法论、架构蓝图或战略模型 +|小结|初级:工具执行者,聚焦单点任务(如数据清洗、管道开发)。 + +中级:系统构建者,能设计完整数据链路并支撑AI模型迭代。 + +高级:架构决策者,深度融合数据工程与AI业务,驱动技术战略。 + +专家:行业引领者,规划企业级数据战略,推动技术标准化与平台化演进,构建具有行业影响力的数据工程体系。 + +岗位晋升考评准则: + +知识:从数据基础 → 分布式系统 → AI驱动的数据架构→ 数据战略与行业标准 + +技能:从管道开发 → 性能优化 → 数据与AI生态整合→ 构建可持续演进的数据基础设施 + +经验:从单场景支持 → 多模态数据工程 → 超大规模AI数据系统→ 引领跨行业/跨平台的数据协同与治理 |=== ===== 3.2.4.3 数据科学家 |=== | |初级|中级|高级|专家 |知识|基础的编程和统计学;统计学基础(如假设检验、概率分布);机器学习经典算法(如线性回归、决策树、SVM);Python数据科学生态(如NumPy/Pandas/Scikit-learn);基础深度学习框架(如TensorFlow/PyTorch入门) |涉及更复杂的算法和分布式计算;高级机器学习(如集成学习、时间序列分析);深度学习核心领域(如CNN/RNN/Transformer);分布式训练技术(如Spark ML/Dask);业务建模方法论(如用户生命周期价值模型) -|深入的专业领域知识和跨学科知识;复杂模型架构设计(如图神经网络、多模态融合);前沿AI技术(如强化学习、AutoML);大规模模型优化(如分布式训练、模型压缩);行业垂直领域知识(如医疗影像诊断模型、金融反欺诈规则融合) -|…… +|深入的专业领域知识和跨学科知识;复杂模型架构设计(如图神经网络、多模态融合);前沿AI技术(如强化学习、生成式AI);大规模模型优化(如分布式训练、模型压缩);行业垂直领域知识(如医疗影像诊断模型、金融反欺诈规则融合) +|战略视角下的全面能力与技术前沿的深度掌握:AI系统架构设计与全栈理解(如数据平台、模型平台、推理系统);自研算法能力(如提出新模型/改进现有算法并在顶会发表);多领域跨模态融合(如图文音视频联合建模);法规与伦理意识(如AI安全、数据隐私合规、算法歧视防范);引领行业发展方向(如制定企业AI发展路线图、指导国家/行业标准) |技能|侧重于数据处理和简单模型;数据清洗与特征工程(如缺失值填补、分箱);基础模型训练与调参(如网格搜索);可视化分析(如Matplotlib/Seaborn);根据文档复现经典算法 |能独立完成项目。端到端建模(如从数据探索到模型部署);设计定制化模型(如融合业务规则);模型解释与可解释性分析(如SHAP/LIME);跨团队协作(如与工程团队对接模型API化) |需要领导复杂项目和战略规划。制定企业级AI解决方案(如智能推荐系统);突破性模型优化(如AUC提升5%+关键指标);技术选型与ROI评估(如平衡模型复杂度与业务收益);主导AI创新课题研究(如小样本学习落地) -|…… +|拥有产品化与商业化落地的闭环能力,并能赋能团队与组织。建立AI能力中台与复用机制(如模型即服务、AutoML平台搭建);多模型协同系统设计(如推荐+搜索+风控融合系统);AI组织建设与人才培养(如制定人才梯队、设计培训体系);跨组织推动AI战略(如联合业务/市场/IT协作推动数据变革);国际视野与技术影响力(如担任技术委员会委员、在行业会议演讲) |经验|0-3年工作经验,需要参与过一些项目;参与2-3个完整AI项目(如用户分群模型);6个月以上数据建模经验;处理过结构化数据建模任务 |3-5年工作经验;主导3-5个中型AI项目(如销量预测系统);3年以上复杂数据场景经验(如非结构化数据/高维稀疏数据);成功将模型准确率提升至业务可用标准(如召回率>85%) -|5-8年工作经验;领导5+大型AI项目(如千人千面广告系统);5-8年跨行业建模经验(如电商/医疗/制造);推动AI模型产生千万级业务收益(如GMV提升、成本降低) -|…… +|5-8年工作经验;领导5+大型AI项目;5-8年跨行业建模经验(如电商/医疗/制造);推动AI模型产生千万级业务收益(如GMV提升、成本降低) +|8年以上工作经验,在AI领域具有广泛影响力;主导10+个跨部门/跨行业重大AI项目(如国家级项目、集团级AI战略);拥有千万到亿级业务影响案例(如营收增长、运营优化);在顶级AI会议/期刊发表论文(如NeurIPS/ICLR/CVPR)或持有发明专利;指导或孵化出多个高级数据科学家/技术团队;能用数据讲好业务故事 +|初级:算法实现者,依赖成熟框架完成既定任务。 + +中级:问题解构者,能将业务问题转化为建模方案并优化。 + +高级:价值创造者,通过AI技术重构业务逻辑,驱动商业模式创新。 + +专家:战略引领者,制定AI技术发展方向,构建组织级智能能力,推动行业变革。 + +岗位晋升考评标准: + +知识:从经典算法 → 深度模型 → 领域定制化技术→ 系统架构与跨模态前沿技术 + +技能:从模型调参 → 全流程掌控 → 技术商业双闭环→ 战略规划与组织赋能能力 + +经验:从单一场景 → 复杂系统 → 跨行业规模化落地→ 主导顶级项目并形成行业影响力 |=== ===== 3.2.4.4 算子开发工程师 |=== @@ -285,13 +330,29 @@ RISC-V产业与社区推广方向岗位: |知识|需要掌握编程语言(如C++/CUDA)、深度学习框架的基本算子结构,并行计算基础。编程语言基础(如C++/Python/CUDA/Trition);深度学习框架基础算子结构(如PyTorch/TensorFlow算子接口);并行计算基础(如多线程/GPU内存模型);基础数值计算(如矩阵运算、张量分解原理) |需要深入硬件架构(如GPU/TPU/NPU)、高级优化技术。硬件加速架构(如:GPU/TPU/NPU 指令集、RISC-V 扩展指令、SIMD优化);算子优化技术(内存复用、计算图融合);编译器原理(LLVM/MLIR/TVM中间表示);低精度计算(FP16/INT8/FP8量化原理) |涉及异构计算、指令集优化和跨平台框架设计。异构计算体系设计(如CPU-GPU-FPGA协同);指令级优化(如汇编级代码改写);跨框架算子兼容性设计(如ONNX/MLIR);AI芯片底层架构(如NVIDIA Tensor Core、华为达芬奇架构、RISC-V架构) -|…… +|分布式异构计算架构、跨层联合优化设计;分布式异构训练与推理框架;AI芯片底层架构(如NVIDIA Tensor Core、华为达芬奇架构、RISC-V架构);卡间互联与通信优化;计算图调度优化 |技能|实现基础算子,调试和性能分析。实现基础算子(如Conv2D/LSTM前向传播);使用Profiling工具分析算子性能(如Nsight Systems);调试框架级报错(如CUDA内存越界);编写单元测试与性能基准 |需要优化高性能算子,解决不同硬件平台兼容性问题。开发高性能算子(如Winograd卷积优化);设计自动融合策略(如Kernel Fusion);解决跨硬件兼容性问题(如不同CUDA版本适配);参与开源框架贡献(如PyTorch算子库扩展) |设计核心算法库,主导跨团队项目。设计芯片级优化算子(如针对Ascend/NPU定制);构建领域专用算子库(如3D点云稀疏卷积);主导编译器后端优化(如TVM/MLIR代码生成);制定算子开发规范与性能评估体系 -|…… +|设计软硬件架构,推动行业进步。根据算子需求设计硬件架构(如指令集、存储结构);结合硬件特性设计并优化分布式训练与推理框架 |经验|0-3年工作经验,掌握具体开发平台的简单算子开发。参与1-2个算子移植项目(如将论文算法转为框架代码);3个月以上CUDA或相关平台开发经验;完成过算子性能提升20%+的优化任务 -|3-5年工作经验,多个项目经验并优化过性能。主导3+核心算子开发(如Transformer多头注意力机制加速);3年以上AI框架底层开发经验;实现过5倍以上性能提升的关键算子(如GEMM优化)|5-8年工作经验,领导过大型项目,解决过复杂技术难题,并推动行业标准。领导AI芯片算子库建设(如寒武纪/地平线芯片支持);5-8年高性能计算领域经验;突破硬件算力瓶颈(如将ResNet50延迟降至1ms以内);参与制定行业标准(如ONNX算子协议扩展)|…… +|3-5年工作经验,多个项目经验并优化过性能。主导3+核心算子开发(如Transformer多头注意力机制加速);3年以上AI框架底层开发经验;实现过5倍以上性能提升的关键算子(如GEMM优化)|5-8年工作经验,领导过大型项目,解决过复杂技术难题,并推动行业标准。领导AI芯片算子库建设(如寒武纪/地平线芯片支持);5-8年高性能计算领域经验;突破硬件算力瓶颈(如将ResNet50延迟降至1ms以内);参与制定行业标准(如ONNX算子协议扩展) +|8年以上工作经验,领导多个过大型实际项目,并推动行业标准。项目成功落地,性能达到业界先进水平;对软硬件架构提出创新设计;参与制定行业标准(如ONNX算子协议扩展) +|小结|初级:代码实现者,依赖框架接口完成算子功能实现。 + +中级:性能攻坚者,能突破硬件算力极限并设计通用优化方案。 + +高级:架构定义者,主导芯片-框架-算法的协同设计,影响行业技术路线。 + +专家:行业推动者,提出软硬件创新设计,推动行业进步。 + +岗位晋升考评准则: + +知识:从框架API使用 → 硬件指令优化 → 芯片-算法协同设计 → 软硬件架构设计 + +技能:从功能实现 → 极致性能优化 → 软件平台建设→ 跨栈技术生态构建 + +经验:从单算子开发 → 关键路径优化 → 突破性能瓶颈 →定义下一代计算范式 |=== ===== 3.2.4.5 芯片设计工程师 |=== @@ -313,11 +374,11 @@ RISC-V产业与社区推广方向岗位: |知识|具备基础模型结构知识:了解Transformer架构核心原理(自注意力机制、位置编码);预训练任务设计(MLM/NSP);基础分布式训练概念(数据并行); HuggingFace等开源库使用基础 |具备分布式训练和高级优化技术,包括大模型训练优化技术(混合精度训练、梯度累积), 参数高效微调方法(LoRA/P-Tuning),多模态对齐基础(图文跨模态表示);显存优化策略(ZeRO/激活检查点) |需要深入硬件协同设计和行业应用经验: 千亿参数级模型架构设计(MoE/稀疏激活),训练稳定性控制(梯度裁剪、损失面平滑),大模型与业务系统融合(RAG/Agent框架),硬件-算法协同设计(集群网络拓扑优化) -|…… +|具备跨领域深度融合能力与前沿技术研究能力。大模型原理演化与趋势洞察(如Mixture of Experts、Self-RAG);多模态大模型融合(文本、图像、音频、视频、代码等);模型压缩与蒸馏体系化设计(如知识蒸馏、量化感知训练QAT);大模型可信性与可控性(如可解释性、鲁棒性、偏差控制);大模型生态体系理解(如模型评测标准、开源路线图、开源社区建设) |技能|需要掌握基础知识和工具使用,比如了解Transformer架构、会用PyTorch或TensorFlow框架,能够参与模型微调和基础的数据处理;完成模型微调任务(下游任务适配);基础Prompt工程与Few-shot学习实现;使用分布式训练框架(DeepSpeed基础配置);分析训练日志(Loss曲线监控) |需要更深入的技术,如模型并行训练、参数高效微调方法(如LoRA),以及解决实际业务问题的能力。设计多阶段预训练方案(领域增量预训练);实现混合并行训练(数据+模型+流水线并行);开发高效推理方案(动态批处理、KV Cache优化);模型安全防护(Prompt注入防御) |负责整个大模型的架构设计,优化训练效率,处理千亿级参数的模型,并且有跨团队协作和战略规划的能力。主导百亿级模型从0到1训练(数据配比、课程学习);突破显存墙限制(3D并行+卸载技术);构建大模型中间件(分布式推理服务框架);定义企业级大模型技术路线(闭源/开源选型权衡) -|…… +|拥有从算法设计、工程落地到战略推进的全链路能力。构建统一训练-推理一体化框架(如自研模型引擎);主导大模型跨模态/多语言扩展与部署(如代码-自然语言统一训练);引入可持续训练机制(如节能感知训练、智能调度策略);具备引导领域知识注入能力(如政务、医疗、工业大模型定制);设计自动评测与迭代优化体系(如大模型Bench设计与多维评估指标) |经验|0-3年工作经验,初级可能参与过小规模项目。 参与1-2个10B以下模型微调项目(如领域文本生成); 3个月以上单机多卡训练经验; @@ -330,7 +391,22 @@ RISC-V产业与社区推广方向岗位: 领导千亿参数级模型全流程开发(如类GPT模型训练); 5-8年超大规模训练实战经验; 实现训练成本突破(如单卡吞吐量提升300%) -|…… +|8年以上相关经验,具备产业落地闭环与组织战略制定能力。主导国家级或行业标杆级大模型项目(如千亿参数大模型国产化替代);构建并管理跨100人+研发团队,涵盖算法、平台、数据、DevOps全链条;布局前沿研究方向并推动产业转化(如多模态RAG、Agent智能体自治);参与制定行业技术标准或开源框架(如参与BigScience、OpenRAIL协议等);实现大模型体系级落地成效(如SaaS产品转型、大模型应用落地数百客户) +|小结|初级:任务执行者,依赖开源生态完成既定训练/微调任务。 + +中级:效能提升者,能优化训练/推理效率并解决规模化难题。 + +高级:系统架构师,定义大模型技术栈并实现商业-技术双闭环。 + +专家:生态塑造者,定义大模型研发范式和演进路径,推动产业级落地与生态共建,在模型、平台、组织层面实现系统性突破。 + +岗位晋升考核标准: + +知识:从模型使用 → 训练优化 → 架构创新→ 范式定义与跨模态融合 + +技能:从单卡微调 → 千卡集群 → 软硬协同设计→ 训练-部署一体化平台构建 + +经验:从下游适配 → 增量预训练 → 原生大模型创造→ 行业级落地与生态引领 |=== ===== 3.2.4.8 大模型应用工程师 |=== @@ -346,7 +422,7 @@ RISC-V产业与社区推广方向岗位: 复杂推理优化(RAG增强、Tool Calling设计); 模型服务化(API封装、流式响应) |需要深入模型优化策略和行业解决方案,包括企业级应用架构(大模型中间件、Agent框架),超长上下文处理优化(窗口扩展、KV Cache压缩),成本-效果平衡策略(混合模型路由),行业垂直知识(如医疗问诊逻辑、金融合规边界) -|…… +|精通模型前沿技术与跨模态系统集成:大模型前沿算法与演进趋势(如MoE架构、多Agent协同机制);多模态融合深度优化技术(如图文语义对齐、视频理解模型);自研模型训练与压缩方案(如LoRA深度定制、蒸馏+剪枝组合策略);企业级Agent自治系统设计(如任务规划、多Agent) |技能|涉及基础部署和Prompt工程: 完成基础场景适配(基于Prompt模板的问答系统); 使用LangChain/LLamaIndex搭建简单应用流; @@ -362,7 +438,7 @@ RISC-V产业与社区推广方向岗位: 突破模型能力边界(小样本场景蒸馏); 构建跨系统集成方案(与CRM/ERP系统打通); 制定应用安全规范(内容过滤、审计追踪) -|…… +|精通系统级应用与平台建设:牵头构建企业级大模型平台(如私有大模型研发平台/运营平台);构建可规模迁移的Agent模板体系(如通用流程机器人+领域插件);主导跨模态产品集成(如视频生成、语音智能助理);系统级安全合规设计(如模型输出可信评估、风控联动机制) |经验|0-3年工作经验,参与过小型项目。 参与2-3个场景化PoC验证(如智能客服demo); 3个月以上Prompt调优经验; @@ -376,7 +452,22 @@ RISC-V产业与社区推广方向岗位: 5-8年跨行业应用经验(教育/政务/电商); 通过大模型应用实现显著降本增效(如人工替代率超60%); 沉淀可复用的行业解决方案库 -|…… +|8年以上大模型相关工作经验,具有行业影响力。主导20+项目或平台型产品,服务百万级用户或千人级企业;在企业内构建标准化平台体系(如Prompt库/Agent模板仓);拥有论文发表/专利申请/技术布道经验,在行业会议或社区有活跃贡献;推动大模型在关键业务流程中的重构,如智能质检/自动投标/风险识别等 +|小结|初级:场景实现者,依赖现有框架完成业务需求验证。 + +中级:价值挖掘者,能通过技术组合突破模型原生能力限制。 + +高级:生态构建者,主导大模型与企业数字基座的深度融合,定义应用标准。 + +专家:行业引领者,驱动大模型技术创新与跨域生态协同,塑造行业智能未来。 + +岗位晋升考核标准: + +知识:从模型调用 → 场景增强 → 系统级整合→ 前沿创新与跨模态融合 + +技能:从单点实验 → 链路优化 → 商业闭环设计→ 企业级平台与生态构建 + +经验:从Demo验证 → 中型落地 → 行业级规模化复制→ 影响行业、技术布道 |=== ===== 3.2.4.9 大模型服务部署工程师 |=== @@ -396,7 +487,7 @@ RISC-V产业与社区推广方向岗位: 熟悉底层硬件加速; 理解服务架构高可用、弹性扩展、故障恢复设计; 了解主流大模型(如GPT 1/2/3、LLaMA、Qwen等)性能特性 -|…… +|精通大模型生命周期全流程(训练、微调、部署、监控、回收);精通推理引擎原理及自研优化能力(如自定义OP、调度优化、KV Cache复用);掌握模型压缩与硬件协同优化(量化-aware训练、Low-bit部署策略);熟悉多种硬件平台(GPU、TPU、NPU)性能与部署差异;掌握云原生技术栈(Service Mesh、Serverless、GPU共享调度);深入理解大规模分布式系统架构(弹性调度、异构计算调度、服务网格);了解国内外主流LLM产品的架构设计与部署最佳实践(如OpenAI、DeepSeek、Qwen) |技能|能使用已有推理引擎部署基础模型(如Bert/GLM/Qwen模型); 能独立完成小型模型的本地部署与API封装; 能通过docker部署简单服务; @@ -411,7 +502,7 @@ RISC-V产业与社区推广方向岗位: 能针对业务场景进行模型压缩、量化、裁剪等部署优化; 能评估不同部署方案的性价比(如QPS/延迟/GPU利用率); 可实现多版本模型管理与灰度发布 -|…… +|能主导异构多集群大模型服务系统的架构设计与落地;实现大模型服务的极致优化(包括推理延迟低于50ms、成本降低50%等);构建统一的大模型服务平台(支持多租户、多模型、多版本、多后端);能开发或定制推理框架或调度器(如自研Scheduler、自适应批处理算法);实现自定义压缩/量化策略并动态调整以适应不同业务QPS波动;推动安全性、合规性(如审计、模型行为监控)在部署体系中的落地 |经验|具备0-3年相关工作经验或具备开源项目部署经验,有独立部署或测试大模型API服务的项目经历优先。 熟悉小模型(<1B)或微调模型推理流程 |具备3-5年相关部署经验; @@ -421,7 +512,22 @@ RISC-V产业与社区推广方向岗位: 具备10B~70B以上模型生产级部署经验; 曾主导过大模型系统(服务化、推理调度、负载均衡等)搭建与上线; 有跨部门协作和团队指导经验优先 -|…… +|8年以上AI系统或模型部署相关经验,其中至少3年专注大模型方向;主导过超大规模大模型(70B以上)在企业或云平台中的生产部署;有构建平台级大模型服务系统的完整经验(如MaaS平台);在开源社区有技术影响力(如贡献vLLM、Triton优化,主导开源部署框架);有跨团队、跨部门协作经验,具备领导研发团队和技术方向的能力 +|小结|初级:部署执行者,具备基础Transformer推理原理理解能力,能够基于开源框架完成模型推理、API封装等任务。 + +中级:优化推动者,掌握推理引擎选型、多卡部署与服务稳定性优化等技术,具备支持大模型落地业务系统的能力。 + +高级:系统架构师,主导大模型部署的整体设计,具备跨团队协作、部署体系规划和系统性能突破能力。 + +专家:平台构建者,具备从系统架构到平台化服务的全面能力,能够设计并主导企业级大模型推理平台,推动异构部署、服务治理、安全合规等体系化建设,实现多模型、多业务场景的高效支撑。 + +岗位晋升考核标准: + +知识:从小模型部署 →大模型部署 → 异构部署→ 云原生与分布式体系设计 + +技能:从单卡部署 → 多卡并行 → 生产级部署→ 多租户平台构建与推理调度优化 + +经验:从部署执行 → 架构落地 → 系统设计及搭建→ 大规模平台主导与团队领导 |=== ===== 3.2.4.10 知识图谱研发工程师 |=== @@ -438,7 +544,7 @@ RISC-V产业与社区推广方向岗位: 深度学习与图神经网络; 企业级数据处理架构; 处理敏感数据的知识 -|…… +|掌握图谱与大模型、Agent系统的协同机制;精通图谱与异构数据融合、动态演化机制、可解释性建模;深入理解图谱在垂直行业(如金融、医疗、政务)的落地策略 |技能|使用现有工具(如Neo4j)进行简单的图谱构建; 进行基本的数据清洗与格式转换; 支持数据提取与结构化 @@ -447,14 +553,29 @@ RISC-V产业与社区推广方向岗位: |能够设计和实现大规模、高效的知识图谱架构; 支持实时数据更新和推理,推动业务智能化决策; 实现跨部门的技术协同,推动知识图谱在业务中的应用与创新 -|…… +|构建多源异构知识体系,支持图谱演化、自监督更新与知识验证机制;架构图谱与语言模型、推理系统的协同平台;引导团队建设知识中台,具备知识服务能力输出 |经验|参与过小规模的知识图谱项目,主要负责数据清洗、知识抽取; 能根据现有模板进行简单图谱构建。 |独立负责中等规模的知识图谱构建项目; 设计并优化知识图谱架构,支持跨部门协作和复杂推理场景 |主导超大规模的知识图谱项目; 具有跨部门合作经验 -|…… +|拥有8年以上知识图谱或NLP相关经验;主导多个行业级、国家级知识图谱工程项目;拥有技术战略制定能力和行业影响力,具备推动图谱国家标准或行业标准制定的能力 +|小结|初级:图谱实施执行者,依赖现有工具完成知识结构化与图谱初建 + +中级:领域建模设计者,能独立设计并优化领域知识体系,支持复杂推理应用 + +高级:智能决策驱动者,以知识图谱为核心,驱动业务系统智能升级与创新 + +专家:认知系统引领者,构建图谱与大模型协同的认知推理系统,推动行业级知识平台与标准体系建设 + +岗位晋升考评标准: + +知识:从数据转译 → 语义建模 → 认知推理系统→ 认知系统与行业知识标准融合 + +技能:从图谱构建 → 数据融合及性能优化 → 智能决策支持→ 跨模态知识融合与平台架构设计 + +经验:从单一场景 → 跨域融合 → 超大规模知识系统落地→ 主导行业/国家级图谱工程与知识服务平台建设 |=== ===== 3.2.4.11 知识图谱工程师 |=== @@ -474,7 +595,7 @@ RISC-V产业与社区推广方向岗位: 超大规模图谱存储优化(分布式图分区策略); 动态知识更新机制(流式知识注入); 行业深度知识体系(如法律条款关联网络、供应链知识建模) -|…… +|精通跨模态知识图谱(图+语音+视频);深度掌握知识图谱与大模型结合(如LLM增强推理);掌握知识生命周期管理(构建、演化、淘汰);能从系统视角规划行业知识生态 |技能|注重基础知识和工具的使用。能进行数据清洗和构建简单图谱,使用基本工具如Protege。 构建基础知识图谱(结构化数据转换); 使用图谱构建工具(Protege); 执行SPARQL/Cypher查询; @@ -489,7 +610,7 @@ RISC-V产业与社区推广方向岗位: 设计动态图谱推理引擎(实时事件关联分析); 突破知识稀疏性问题(小样本关系补全); 主导知识驱动的AI系统架构(如智能客服知识中枢) -|…… +|主导行业级知识中台顶层设计(政府、央企级别);研发图谱增强大模型产品(如 RAG结合图谱增强LLM);构建知识与决策系统联动机制(如知识驱动BI);推动跨组织知识协同(如政务/产业联盟图谱共享标准) |经验|0-3年工作经验.参与过具体项目,处理过百万级实体。 参与1-2个行业知识图谱项目(如企业人物关系图谱); 3个月以上数据清洗与三元组构建经验; @@ -502,7 +623,22 @@ RISC-V产业与社区推广方向岗位: 领导5+亿级实体知识图谱系统(如全域城市知识图谱); 5-8年跨行业知识工程经验(如金融+医疗跨域推理); 推动知识图谱产生业务价值(如通过关联分析发现风险事件准确率提升40%) -|…… +|8 年以上经验;引领图谱核心技术方向演进;推动知识图谱在国家/行业级工程中应用(如“双碳”、“城市大脑”);在顶会/顶刊发表图谱与AI融合研究成果,或主导国家项目 +|小结|初级:知识搬运工,依赖已有工具完成结构化知识沉淀。 + +中级:语义架构师,能构建领域知识体系并支持复杂推理场景。 + +高级:认知赋能者,通过知识图谱重构业务决策链路,实现认知智能突破。 + +专家:智能生态引领者,打造跨组织、跨模态、跨场景的知识基础设施,推动知识图谱成为智能系统核心能力底座,支撑大模型、决策系统与行业生态协同演化。 + +岗位晋升考评标准: + +知识:从数据转译 → 语义建模 → 认知推理系统→知识生态系统设计 + +技能:从图谱构建 → 服务集成 → 知识驱动业务闭环→知识中台 + 智能决策协同 + 跨行业标准制定与共建 + +经验:从单一领域 → 跨域融合 → 超大规模认知网络→行业级知识工程引领 |=== ===== 3.2.4.12 人工智能安全工程师 |=== @@ -516,44 +652,40 @@ AI基础理论:机器学习、深度学习的原理,常见的算法,如线 联邦学习的实际应用和差分隐私的实现; 模型水印和模型窃取防御等; 加密算法(AES、RSA等)在模型传输中的应用。 +|大模型安全;AI生成内容的检测。加密算法(AES、RSA等)在模型传输中的应用;国产信创AI硬件架构(RISC-V等) |深入掌握复杂系统安全设计、前沿攻防技术、跨领域风险治理以及更广泛的工程实践能力。 AI伦理原则:公平性、透明性、可解释性等; 新的对抗攻击方法、隐私保护技术,以及AI安全的新兴领域如自动驾驶、医疗AI的安全问题; 大模型安全、AI生成内容的检测。 -|…… |技能|掌握python编程基础,机器学习基础,加密算法以及安全入门; 具备基础人工智能安全工具链的使用,包括漏洞扫描工具,数据保护工具,监控系统工具等; 理解基本的人工智能生命周期各阶段面临的威胁,包括数据收集到模型部署全阶段; -|掌握一些高级防御技术,如对抗训练实施,模型水印技术,联邦学习中的安全聚合协议,容器化部署安全(Docker镜像漏洞扫描),API网关防护,微服务架构下的零信任策略实施;风险评估框架等; -掌握人工智能安全相关工具,包括:模型可解释性工具(SHAP值用于监管报告)、渗透测试、安全多方计算平台等。 -具备前沿人工智能攻防高级工具链自研能力。 -|掌握前沿人工智能攻防研究,包括基于人工智能的新型对抗防御,后门攻击检测,量子机器学习安全(抗量子密码算法集)等; -具备系统级安全设计能力,包括人工智能可信执行环境设计,人工智能供应链安全,基于强化学习的动态防御策论等; -具备组建人工智能安全团队(红队/蓝队分工设计); -具备跨学科AI融合能力; -|…… -|经验|0-3年工作经验; -参与1-2个AI安全实验项目(如使用FGSM生成对抗样本、复现数据投毒攻击等); -使用过基础安全工具; -参与模型基础部署; -参与数据清洗与脱敏(如处理PII信息、标注敏感数据)。 +|掌握一些高级防御技术如:对抗训练实施,模型水印技术,联邦学习中的安全聚合协议,容器化部署安全(Docker镜像漏洞扫描),API网关防护,微服务架构下的零信任策略实施;风险评估框架等;理解基于国产GPU硬件(RISC-V等)的AI部署面临的威胁;具备前沿人工智能攻防高级工具链自研能力。 +|掌握人工智能安全相关工具,包括:模型可解释性工具(SHAP值用于监管报告)、渗透测试、安全多方计算平台等;具备基于国产GPU硬件(RISC-V等)的AI模型部署能力。具备组建人工智能安全团队(红队/蓝队分工设计);具备跨学科AI融合能力。 +|掌握前沿人工智能攻防研究,包括基于人工智能的新型对抗防御,后门攻击检测,量子机器学习安全(抗量子密码算法集)等;掌握国产AI芯片(RISC-V等)的硬件架构,具备从硬件到AI模型软件部署全流程阶段安全设计的能力;具备系统级安全设计能力,包括人工智能可信执行环境设计,人工智能供应链安全,基于强化学习的动态防御策论等。 +|经验|0-3年工作经验;参与1-2个AI安全实验项目(如使用FGSM生成对抗样本、复现数据投毒攻击等);使用过基础安全工具;参与模型基础部署;参与数据清洗与脱敏(如处理PII信息、标注敏感数据)。 |3-5年工作经验; 参与至少3-5个AI安全攻防项目(如对抗样本生成与防御、模型逆向工程); 参与AI系统的全生命周期安全设计(从数据采集到模型部署); 定制化开发过安全工具; -掌握至少一个垂直领域的安全规范,掌握模型压缩中的安全取舍(量化过程的信息泄露防范等)。 -|5-8年工作经验。 -具有制定企业级AI安全路线(平衡业务需求与安全投入)的项目经验; -具备人工智能新兴技术风险(如扩散模型滥用检测等)评估能力; -参与人工智能相关的国家或者行业标准的制定等; -具备AI伦理与系统性风险治理经验。 -|…… -|小结|初级: AI安全研究员,数据脱敏,模型基础部署; -中级:AI安全架构师,主导联邦学习安全方案、设计模型防火墙; -高级:AI安全总监,制定行业安全标准、应对国家级APT攻击; -能力跃迁关键: -初级→中级:需完成从漏洞修补到主动防御的思维转变,掌握威胁建模方法,AI安全架构师转变为隐私计算专家; -中级→高级:需突破技术执行层,建立安全与业务价值的量化关联,制定企业级AI安全路线图(平衡业务需求与安全投入),AI安全团队构建(红队/蓝队分工设计),制定行业安全标准等,可在"深度防御"与"业务赋能"之间找到动态平衡点。 +熟练1-2个国产AI芯片及其工具的使用。 +|5-8年工作经验;具备人工智能新兴技术风险(如扩散模型滥用检测等)评估能力;掌握至少一个垂直领域的安全规范,掌握模型压缩中的安全取舍(量化过程的信息泄露防范等)。 +|8年以上工作经验;有制定过企业级AI安全路线(平衡业务需求与安全投入)项目经验;参与人工智能相关的国家或者行业标准的制定等;具备AI伦理与系统性风险治理经验;具备3个以上国产国产AI芯片架构及其工具的开发和使用经验。 +|小结|初级: AI安全研究员,数据脱敏,模型基础部署; + +中级:AI安全架构师,主导联邦学习安全方案、设计模型防火墙; + +高级:AI安全总监,国产AI硬件可信到AI软件模型部署; + +专家级:AI安全专家,制定行业安全标准、应对国家级APT攻击; + +能力跃迁关键: + +初级→中级:需完成从漏洞修补到主动防御的思维转变,掌握威胁建模方法,AI安全架构师转变为隐私计算专家; + +中级→高级:需突破技术执行层,建立安全与业务价值的量化关联,制定企业级AI安全路线图(平衡业务需求与安全投入),AI安全团队构建(红队/蓝队分工设计); + +高级→专家级:制定行业安全标准等,可在"深度防御"与"业务赋能"之间找到动态平衡点。 |=== ==== 3.2.5 RISC-V 软件及工具链方向岗位及能力要求 -- Gitee