大V说
字节跳动2024年的资本开支达到800亿人民币,远超传统互联网巨头,而BAT三家公司的总开支才约1000亿人民币。更令人瞩目的是,到2025年这一数字将翻倍至1500-1600亿人民币,其中900亿用于AI算力卡采购,700亿投向数据中心基础设施建设及配套硬件。
今日,字节产业链表现活跃,主要受字节火山引擎FORCE大会催化。大会上字节正式发布豆包视觉理解模型,该模型每千tokens输入价格为0.003元,一元钱可处理284张720P图片,较行业平均价格便宜85%,且具备精准的视觉内容识别能力、卓越的理解与推理能力、细腻的视觉描述与创作能力,实现模型性能提升和成本优化的同步推进,加速AI应用落地。
字节已成为国内最广泛布局AI产业的公司之一,大模型、应用和硬件均有产品落地,全方位进展很超预期。可以说是“中国版的open AI 角色”,不仅自己会持续加大投入迭代AI能力和应对推理/应用需求的激增,同时还会倒逼BAT等大厂在25年奋起直追(不入局,则出局),要持续重视未来字节&国内AI产业链的主线机会。
在模型侧,公司已覆盖文字、音频、视频、3D等全模态的模型矩阵,模型能力均排名国内前列;在应用侧,公司已上线超20款AI产品,覆盖视频生成、虚拟陪伴、图片生成等几乎所有热门细分赛道,近一半为出海产品,其中超5个产品进入AI产品榜单前10;在硬件侧,公司已发布AI智能体耳机Ola Friend,我们预计更多AI设备将陆续发布。
模型:完成11款模型自研,多模态技术加速迭代。
24年5月的春季火山引擎FORCE原动力大会上,字节正式发布自研大模型“豆包大模型”,该大模型矩阵包含豆包通用模型、语音合成模型、文生图模型等一共9个模型,包含文字生成、语音生成和图像生成等多种模态,且已在字节跳动内部50多个业务和场景进行过应用。
24年9月字节进一步拓展豆包大模型矩阵,全新发布视频模型、音乐模型和同声传译模型。从能力上看,豆包系列模型已覆盖文字、图像、音乐、视频等几乎所有模态;从落地情况看,豆包模型同时向字节旗下AI应用和第三方应用开放,近期调用量迅速增加。根据火山引擎公众号,截至24年9月,豆包大模型的日均Tokens调用量已超过1.3万亿,环比7月翻倍;在多模态方面,豆包文生图模型日均生成图片超5000万张,语音模型日均处理语音85万小时。
豆包视频大模型在全球视频模型中排名前列,动态表现亮眼。豆包视频模型今年在9月发布,提供影视级视觉效果,镜头切换、运镜控制能力、动作连贯度好,目前已在即梦AI、豆包等C端应用开放使用或测试。模型亮点在于:a)人物可以完成连续动作。例如完成“摘下墨镜、站起身、走向雕像”的连贯动作,自然流畅、稳定性较高。b)多镜头展现同一场景。一张图+Prompt,即可生成风格、场景、人物一致的多镜头视频,不同镜头切换自然。c)运镜控制能力强。现有产品主要通过运动笔刷等功能控制物体的运动。豆包可以实现360度围绕主体环绕、前后景变焦、目标跟随、升降镜头等,灵活控制视角。
应用:已上线超20款AI应用,驱动字节将“APP工厂”方法论输出到AI应用。在移动互联网时代,字节围绕抖音、今日头条两款亿级DAU的产品布局移动APP矩阵。
据晚点LatePost统计,2018年以来字节自研或收购了大量项目,在App Store上线约140个应用。在生成式AI时代,字节将“APP工厂”方法论输出到AI应用,有望挖掘AI时代的抖音和今日头条。根据Z Finance、七麦数据统计,字节已在全球上线超过20款AI应用,覆盖视频生成、虚拟陪伴、图片生成等几乎所有热门细分赛道。
1)AI助手:字节分别面向国内、海外推出豆包和Cici,两者的功能相近,均包括AI聊天机器人和大量智能体。豆包是字节旗下用户量最多的原生AI应用,也是国内第一大、全球第二大AI应用App。根据AI产品榜统计的AI应用App月活数据,从绝对规模看,豆包App在11月月活5998万,环比增加17%,高基数下8-11月复合增速14%;从相对规模看,11月豆包App月活约为国内第二大AI应用(文小言App)的5倍。Cici在11月月活1267万,与谷歌Gemini App的月活相近。
2)AI视频:即梦(海外版叫Dreamina)包括一系列AI创作工具和作品社区。用户可以使用AI视频、AI图像和AI音乐工具进行创作,并将作品分享至即梦社区。据36氪,即梦是前抖音集团CEO张楠到剪映后推出的AI应用,获得超1亿月活的视频剪辑工具剪映的导流,很多AI设计师也会在即梦平台发布自己的AI作品。24年11月即梦成为第一个集成豆包视频模型的产品,也体现了字节对这款产品的重视程度。我们看好AI视频创作和分享带来用户时长和黏性的增加,从而推动广告变现的落地,并逐步成长为AI时代的视频社区。此外,面向抖音推出的视频剪辑产品剪映(海外版叫CapCut,面向Tiktok推出)也集成了视频生成、图像编辑等一系列AI功能,提高创作者的内容生产效率。
3)AI教育:Gauth是字节跳动在2020年底推出的“拍照搜题”类应用,早在23年5月就集成AI功能,陆续接入GPT-4和Bard,主要用于提高答案的准确度;24年初升级AI功能,答案准确度进一步提高,且详细罗列解题步骤和原因。根据AI产品榜,Gauth受学生假期等因素影响略有波动,11月App月活862万,环比下降47%,出海应用中排名第5,但10月活环比增加69%至1626万。豆包爱学是字节面向国内推出的AI教育App,前身是字节旗下大力教育的AI教育App河马爱学,9月正式更名为豆包爱学,提供答疑解惑、作业批改、知识问答、作文辅导和口算练习等功能。
4)AI社交:猫箱(海外版叫Anydoor)是一款AI虚拟陪伴应用。与星野、冒泡鸭等国内同类产品相比,猫箱会在对话后面描述虚拟对象的心理活动和神态,营造更好的聊天氛围感,且记忆能力更强。根据AI产品榜,11月猫箱App月活458万,环比增加23%。
5)AI图像:字节共推出两大类AI图像产品。一类是星绘(海外版叫PicPic),主要提供AI写真功能,使用体验类似妙鸭相机,根据AI产品榜,11月App月活124万,环比持平。另一类是AI修图应用星绘(海外版叫Hypic),功能类似于美图秀秀。
硬件:AI耳机率先落地,AI眼镜在研。字节豆包首款AI智能体耳机Ola Friend已于24年10月发布,售价1199元。该产品接入豆包大模型,是字节旗下首款AI硬件设备。用户戴上耳机后,无需打开手机,就可以直接通过语音唤起豆包进行对话,成为豆包的人机交互新渠道。耳机的语音识别能力较强,我们预计在日常信息查询、旅游出行、英语学习等场景用途较大。据豆包官网、钛媒体、新浪财经,Ola Friend的AI功能在发售后仍会持续进行更新,且字节还有一款AI眼镜在研。随着豆包视频模型全面开放,我们预计AI硬件有望为豆包的AI技术提供新的落地方式。
对于字节产业链,市场低估了什么?
近期字节算力链标的市场表现积极,超预期的点在于字节对【算力的需求总量】,据不完全统计,2H24字节累计智算中心招标规模超1.2GW,真实情况或许比这个更乐观:
市场低估了通用大模型能力突破后推理需求的增长速度
继11月豆包MOU增长超预期后,火山引擎原动力大会开幕式上,公司公布其模型的日均token调用量在7个月的时间内增长了33倍,目前日均token调用量超过4万亿。
市场低估了字节追赶海外大模型能力的速度
此前认为国内大模型与海外差距较大,但字节近期多模态大模型能力快速突破,已可与海外大模型同台竞技。继文生图、文生音乐、文生视频后,豆包昨日全新发布视觉理解模型及3D输出模型,各类多模态模型的突破使得字节对于训练、推理算力的需求步入一个新的数量级。
市场低估了字节大模型向终端推广的深度及广度
除豆包外,提示重点关注扣子的发展,扣子为面向To B及专业开发者设计的AI应用平台,能够将字节的大模型能力快速接入金融、营销、智能家居、消费电子等涵盖千行百业的AI应用场景中,在更广阔的市场实现价值创造和生产力的提升。在原动力大会上欣喜的看到汽车、音响、眼镜、耳机、机器人、玩偶、家用电器等终端陆续接入大模型,变得“更加聪明”,为终端消费者创造更大价值。
扣子:字节跳动的AI智能体平台
AI智能体已经成为科技巨头和初创企业的必争之地,被视为大模型时代的“APP”,预示着新一代人机交互和协作的新模式。AI智能体通过改变工作范式,提高生产效率和生产关系,实现技术革命,具有巨大的商业潜力。
扣子作为字节跳动的AI智能体平台,被寄予厚望,由火山引擎提供支持,可以无代码快速生成AI Bot,并集成了豆包,kimi等多种大模型接入,覆盖多个领域,以其易用性、对话式服务、多渠道发布能力、强大的产品服务和商业化模式展现出明显优势和广阔市场前景。
当前扣子商店已有多款不同应用,包括工具、娱乐、咨询等,如值得买的导购推荐,且在B端也有实际应用案例,如孩子王员工培训等
字节&国产AI产业先有望迎来估值重塑机会(先涨估值端):1)字节训练的底层AI基础设施在海外东南亚和欧洲有集群布局,拥有顶尖的算力和全球的语料,同时国内快速推进商业落地,为了应对后续用户量&访问量的激增,对AI基础设施扩容上架的速度要求极高,近期已出现字节产业链的一些订单外溢;2)字节效应将进一步推动国内大厂积极入局AI,未来资本开支有望共振,同时国内B端/C端应用让国人可以切身感受到AI带来的变化和机会,将极大提振AI产业信心和估值。
基于此,字节的算力资本开支预算高速增长,后续对于服务器、交换机、光模块、温控设备等设备的招标也将陆续开启。
免责声明:本文内容仅供学习交流,不构成任何投资建议!
来源:赛道掘金
展开阅读全文
文章观点仅代表作者观点,或基于大数据智能生产,不构成投资建议。投资者依据此做出的投资决策需自担风险,与通联数据无关。