科技先锋
摘要
国内外大型科技公司都纷纷利用自身在数据、算法、算力等方面的优势,构建自己的NLP、CV、多模态系列大模型平台,并已有较多成功的商业落地应用。
从大模型功能测试方面来看,各家大厂在自身“老本行”的领域发挥最为出色。国产大模型对中文语料的处理较海外模型更加完善和准确,但国产大模型起步较晚,当前语言模型训练尚不充分,在语义理解、逻辑思维、连续对话以及代码能力上不及海外模型成熟。
从大模型参数量看,相比于国外知名大模型,国内科技大厂的参数规模也存在优势。在性能方面,GPT综合表现最优,文心更擅长中文文本识别与生成。
从大模型生态布局方面看,各家企业在大模型领域探索路径各有特色。互联网大厂依托自身领域优势,逐步将模型并入自身已有的产品矩阵中。我们预期,那些已经有较为成熟的可应用场景的企业,更容易在模型落地后迅速铺开占领市场。百度以“昆仑芯+飞桨平台+文心大模型+行业应用”在算力层、平台层、模型层、应用层具备完整布局;阿里以“含光800芯片+M6-OFA底座+通义大模型+行业应用”成为大模型全部环节的重要参与者;华为打造了“昇腾芯片+MindSpore框架+盘古大模型+行业应用”四位一体的完整体系,主要面向企业市场提供全栈式服务;腾讯构建了“太极机器学习平台+混元大模型”,同时腾讯启动了“混元助手”知识增强大语言模型项目。
在应用方向上,国内外AI大模型均在推动在B端与C端应用落地。AI大模型应用场景广阔,在优化办公场景、赋能各行业提升效率方面蕴含巨大想象力。模型在不同行业应用中的适配度大小需要把握更有针对性和场景化的训练数据。
投资建议:
相关标的
通信:
云计算&大数据:优刻得等;
工业互联网:工业富联、东方国信、三旺通信、东土科技、赛意信息、中控技术、宝信软件;
物/车联网:美格智能、鼎通科技、瑞可达、电连技术、移远通信、广和通;
PCB/载板:沪电股份、深南电路、兴森科技、世运电路、崇达技术。
计算机:
3.行业龙头:大华股份、同花顺、石基信息、上海钢联、常山北明、金山办公、广联达、拓维信息、久远银海;
5. 国资云及数据要素:深桑达A、易华录等;
传媒:分众传媒、三七互娱、完美世界、吉比特、蓝色光标、中国科传、中文在线、皖新传媒、中手游、游族网络、万达电影、中国电影、华策影视、智度股份等。
风险提示:算力建设投入不及预期风险;宏观经济风险;研发进度不及预期风险;下游需求不确定性风险。
1. 模型汇总
随着一系列生成式大模型的爆发,大模型如今已演变为了人工智能的一个重大发展趋势,将成为人工智能技术最基础的“生产工具”。大模型是“大数据+大算力+强算法”结合的产物,凝练了大数据内在精华的“隐式知识库”,是实现人工智能应用的载体。可分为单一预训练模型和多模态模型,前者主要为自然语言处理(NLP)和计算机视觉(CV),当前业界大模型研究主要集中在这三个领域。
近两年,国外如OpenAI、谷歌、微软,国内如百度、华为、阿里等科技公司都纷纷利用自身在数据、算法、算力等方面的优势,提前布局以实现自身生态更好的发展,构建自己的NLP、CV、多模态系列大模型平台,并已有较多成功的商业落地应用。
2.模型功能测试
据每经网不完全统计,今年3月~4月,已经约有10家企业及机构发布大模型或启动大模型测试邀请。模型基本能力测试包括模型稳定性和反应速度、语义理解与逻辑思考,实际应用层面的测试包括文学创作、新闻写作、投资计划、广告创意、法律咨询、计算能力等“更容易被替代的工作岗位”,以及价值观测试。
总结来看,各家大厂在自身“老本行”的领域发挥最为出色。由于OpenAI背靠GitHub,gpt在理解和生成代码方面有显著优势,同时文案写作方面也不逊色;New Bing在信息搜寻、新闻摘要和处理实时信息方面表现突出。Brad在论文写作、处理学术任务方面表现优秀。国内模型也各有优势,整体国产大模型对中文语料的处理较海外模型更加完善和准确。文心一言在计算上较其他国产大模型更强,通义千问在内容创作上尤其是文学创作上有较大潜力,星火大模型在语音与文字之间转换更为流畅。当然,国产大模型起步较晚,当前语言模型训练尚不充分,在语义理解、逻辑思维、连续对话以及代码能力上都有待加强。
3.模型参数规模及性能特点
从大模型参数量看,相比于国外知名大模型,国内科技大厂的参数规模也存在优势。阿里推出的通义千问大模型参数在10万亿级以上,腾讯混元大模型参数量在万亿级以上,百度文心一言大模型参数量在2千亿级以上。京东言犀大模型、华为盘古大模型的参数量则为千亿级。垂直行业科技企业已经上线的参数量普遍在千亿级以上。而科研院校大模型的参数量在千亿级及以下。GPT和Bard参数量在千亿级以上。
在性能方面,各大模型各有优势。GPT综合表现优异;Bard在文本生成方面表现较好;文心擅长中文文本识别与生成,具有高开放性和可扩展性;通义在文字创作领域,尤其在语言翻译方面表现较为出色;盘古具备领先的语言理解和模型生成能力,和极佳的泛化能力;混元训练成本较低;星火拥有跨领域的知识和语言理解能力。
4.生态布局
各家企业在大模型领域探索路径各有特色。互联网大厂依托自身领域优势,逐步将模型并入自身已有的产品矩阵中。我们预期,那些已经有较为成熟的可应用场景的企业,更容易在模型落地后迅速铺开占领市场。
2023年3月,百度相继发布了知识增强大语言模型产品 “文心一言” 和企业级产品“文心千帆”,可以为多个行业提供API接口及相应的开发工具链。文心千帆为一站式企业级大模型平台,平台作为文心大模型服务的唯一入口,为B端企业用户提供数据管理、自动化模型定制微调以及推理服务云端部署等一站式大模型的定制服务,并提供文心一言企业级推理云服务。百度以“昆仑芯+飞桨平台+文心大模型+行业应用”在算力层、平台层、模型层、应用层具备完整布局。
阿里打造了国内首个AI统一底座,以“含光800芯片+M6-OFA底座+通义大模型+行业应用”成为大模型全部环节的重要参与者。阿里推出全栈智能计算解决方案“飞天智算平台”,并启动两座超大规模智算中心,以公共云和专有云两种模式,为科研、公共服务和企业机构提供强大的智能计算服务,可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。
华为盘古大模型由 NLP 大模型、CV 大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统 AI 作坊式开发模式下不能解决的 AI 规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等等。华为打造了“昇腾芯片+MindSpore框架+盘古大模型+行业应用”四位一体的完整体系,主要面向企业市场提供全栈式服务。
腾讯构建了“太极机器学习平台+混元大模型”,同时腾讯启动了“混元助手”知识增强大语言模型项目。混元系列大模型在多领域展开布局,为类ChatGPT产品打造强大支撑,腾讯在AIGC领域布局方面有数据、人才以及硬件储备等优势。
5.应用方向
国外科技企业基于大模型技术推出的相关产品相继面世。如2023年3月21日,谷歌正式宣布开放Bard的访问权限,其采用了先进的深度学习算法,具有包括翻译、摘要等在内的一系列能力,并由大量文本提供支持。5月10日又宣布Bard未来将适时同音乐流媒体Spotify、零售巨头沃尔玛、房产平台Redfin、送餐服务Uber Eats、旅游网站Tripadvisor和招聘网站ZipRecruiter融合。如2023年3月16日微软发布了AI服务Microsoft 365 Copilot。微软将其内置于Word、PowerPoint、Excel、Outlook、Teams等Microsoft 365应用中,以聊天机器人的形式呈现在办公软件的侧边栏上,标志着人工智能已经来到人与办公软件交互的新阶段。
国内各科技大厂不仅竞相发布类GPT产品,也纷纷展开对大模型应用场景的探索,进入到大模型应用开发阶段。百度文心大模型积极拓展内外部应用,目前面向公众和企业用户同时进行开放测试。内部应用层面,文心大模型已经率先应用于百度搜索、信息流、智能驾驶、百度地图、小度智能屏等内部重要产品上;外部应用层面,文心大模型在金融、能源、制造、城市、传媒、互联网等行业有标杆应用案例,实现真实场景应用的同时获取大量行业数据反哺大模型的优化。百度披露,目前已经有400多家企业宣布接入百度“文心一言”生态,涉及互联网、媒体、金融、汽车、企业软件等行业。
内部应用层面,阿里巴巴宣布未来旗下所有产品将接入“通义千问”大模型,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等,进行全面改造。外部应用层面,阿里通义大模型目前正探索与OPPO、太平洋保险、吉利汽车电子等企业,在电子、金融、汽车等领域开展合作。阿里云也将面向企业提供更普惠的AI基础设施和大模型能力。根据阿里云开发者社区的信息,目前,通过部署超大模型的轻量化及专业模型版本,通义大模型已在超过 200 个场景中提供服务,已经深入到电商、医疗、娱乐、设计、金融等行业,实现了 2%~10% 的应用效果提升。
盘古大模型在能源、零售、金融、工业、医疗、环境、物流等 100 多个行业完成场景验证。根据盘古大模型发布会的信息,例如,华为矿山大模型异物监控的识别精度达到了98%,还可以通过视觉技术对井下安全作业规范进行检测并实时预警。华为云气象大模型的预测精度首次超过了欧洲气象中心的数字分析的方法,并且预测速度提升了1万倍以上。用在自然灾害里面,比如说像台风轨迹预测上,盘古的精度相对于欧洲气象中心的方法提升了20%以上。盘古大模型还提供模型预训练、微调、部署和迭代的功能,形成了AI开发完整闭环,极大地提升了AI开发效率。缩短了传统行业走向智能化的距离。
混元大模型目前主要服务于腾讯内部业务。内部应用层面,混元大模型已成功应用于腾讯广告,将全面接入微信端、QQ端和王者荣耀、英雄联盟游戏端,提供智能聊天、内容推荐、情感分析、故事生成、角色塑造等功能;外部应用层面,业界推测腾讯混元大模型将在游戏、社交、金融、教育、医疗等领域发展生态,但腾讯尚未公开其明确的行业应用方向。此外,腾讯多模态AI大模型已经开始在广告投放领域发挥出降本增效的价值。
总结来说,国内外AI大模型均在推动在B端与C端应用落地。AI大模型应用场景广阔,在优化办公场景、赋能各行业提升效率方面蕴含巨大想象力。模型在不同行业应用中的适配度大小需要把握更有针对性和场景化的训练数据。
投资建议:
相关标的
通信:
云计算&大数据:优刻得等;
工业互联网:工业富联、东方国信、三旺通信、东土科技、赛意信息、中控技术、宝信软件;
物/车联网:美格智能、鼎通科技、瑞可达、电连技术、移远通信、广和通;
PCB/载板:沪电股份、深南电路、兴森科技、世运电路、崇达技术。
计算机:
3.行业龙头:大华股份、同花顺、石基信息、上海钢联、常山北明、金山办公、广联达、拓维信息、久远银海;
5. 国资云及数据要素:深桑达A、易华录等;
传媒:分众传媒、三七互娱、完美世界、吉比特、蓝色光标、中国科传、中文在线、皖新传媒、中手游、游族网络、万达电影、中国电影、华策影视、智度股份等。
证券研究报告
《AI大模型商业模式对比》
对外发布时间:
2023年7月13日
报告发布机构:
长城证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)
来源:长城研究--宏观策略
展开阅读全文
文章观点仅代表作者观点,或基于大数据智能生产,不构成投资建议。投资者依据此做出的投资决策需自担风险,与通联数据无关。