AIGC早期发展的重点之一是基于自然语言处理技术的文字单模态原子能力,其包含文本回复、文章生成、内容续写等细分功能。文字单模态原子能力能够在各职能中落地,主要应用有经营决策,管理协作,产品研发,市场营销,涵盖会议记录、需求分析等。
管理协作产品研发
交互性文本生成
强调实时性
文本回复:用于自动回复和解决用户的问题,应用于智能问答系统、聊天客服机器人和智能推荐系统。
经营决策
市场情报分析:分析市场趋势和消费者需求,帮助决策者制定战略舆情监测:分析新闻等渠道中的文字信息,评估对企业声誉的影响。
文本交互:为用户提供心理疏导和情感咨询与支持,如虚拟伴侣/朋友开发实时文字类交互游戏,如AI dungeon。
会议记录与汇总:分析会议纪要,生成会议摘要或行动项清单文档自动生成:根据输入信息生成文档的摘要、概述或推荐内容。
非交互性文本生成
强调内容推理性
文章生成:结构性写作,有较强的生成规律,包括文本风格迁移、对话式/结构式文本生成等,为目前落地最广泛的场景。
用户需求分析:分析用户反馈、市场调研等文本数据竞争对手分析:帮助识别和分析竞争对手的产品特点。
·辅助写作:基于已获得的素材进行辅助创作,包括文本素材预处理、自动智能去重、根据要求提供对应文本素材等。
市场营销
智能创意营销:通过分析用户评论、等文本信息,帮助优化广告创。
文本续写:根据已有内容进行续写,使内容符合逻辑而又有文学价值。
意智能销售流程:自动分析和处理销售相关的文本信息。
·营销文案:非结构性写作,需要一定创意和个性化,包括广告文案、产品描述、社群营销、社交媒体发布等。
短期内GPU不可撼动,但随着AI任务比例变化,FPGA及ASIC有望远期成为主力AI芯片。
短期看,GPU占据AIGC训练及推理的绝对地位,英伟达基于CUDA强大的并行计算能力及自身产品力构建了护城河;远期看,FPGA及ASIC芯片时延低、特需设计等特点将成为主力芯片,国内厂商凭借两者的多年积累有望加速AI芯片的自主化进程。
训练
推理
芯片
云端
云端边缘端GPU在AI模型构建中具有高适配性与高并行性的特点,可以更好支持AI模型训练中大量矩阵和向量的计算,同时,其强大的通用能力在推理任务中表现良好(GPU目前在训练和推理中占据绝对主力,不过推理的市占地位整体不及训练任务)FPGA在训练任务所需要的浮点运算能力中较弱;可通过编程灵活配置芯片架构适应算法迭代平均性能较高,拥有可编程性、可重构性和定点运算功能,在推理端使用较多应特定用户要求和应用程序的需要而设计、制造的集成电路,有稳定的性能和优秀的功耗控制推理云端雾/边缘端远期来看,大模型进入出清阶段,AI芯片主要负责日常运行的推理任务,训练任务则下渡到雾/边缘侧以满足具身智能应用需求。
GPU FPGA 开发时间长,研发成本高,进入门槛高大模型架构未统一,导致训练端未普及训练云端GPU 根据GPU强大的通用能力依旧在A芯片占据一席之地FPGA。
种类
云端主要部署高算力的AI训练芯片和推理芯片进行训练和推理任务,边缘端基本只部署推理芯片进行应用。
短期内
ASIC
远期变化
在面对推断环节的小批量数据处理时,可以凭借流水线并行,达到高并行+低延迟的效果。
受延迟、隐私和带宽限制的驱动,逐渐被布署于IoT设备当中,以满足低功耗+灵活推理+快速响应的需求。
ASC
随着技术、算法的普及和趋向统一,专业性更强的ASIC将更具备竞争优势,ASIC在研发制作方面一次性成本较高,但量产后平均成本低,具有批量生产的成本优势。