来源 | 盐财经
大模型赛道的参与者一度处于比以往更深的焦虑中 。这一领域内,基础技术研究动辄融资上亿,而可行的商业模式 ,却还在空中摸索。
但三月的“长文本”概念破圈,重新搅动了一池心意。
自 3 月 18 日,刚满一岁的中国初创 AGI 公司月之暗面宣布旗下大模型 Kimi 智能助手开启 200 万字无损上下文内测后 ,国内各家大厂先后下场,秀肌肉一般宣布起各自在长文本领域的升级 。
3 月中旬 ,阿里旗下大模型工具通义千问宣布,向用户开放免费长文档解析处理功能,支持约 1000 万字的超长文档处理;
百度向《科创板日报》透露 ,4 月将在版本升级后开放长文本能力,文本处理范围在 200 万 -500 万,是当下更高 2.8 万字文档处理能力的上百倍;
360 智脑宣布内测 500 万字长文本处理功能 ,并表示早在 2 月底,360AI 浏览器已向用户开放 100 万字长文本阅读和拓展功能。
被浓烈的 FOMO(Fear of Missing Out)情绪裹挟,这场大模型文本处理能力比拼 ,掀起二级市场一股猛烈的跟投风。三月下旬,与 Kimi 有关联的上市公司被打包进“Kimi 概念股 ”板块,强势拉涨 AI 应用板块 。与 Kimi 存在关联的华策影视 、掌阅科技、中广天择等多股 ,在 18 日后股价相继迎来涨停。
高烧两周后,如今“Kimi 概念”逐渐降温,但其背后这个闪烁着“小天才”光环,由 90 后创始人建立的、估值达 25 亿美元的国内初创公司 ,无疑让更多人看见低门槛投身大模型领域淘金的抓手。
对资本市场而言,2023 年的初始基建时期已经过去,这一领域的商业落地故事 ,才刚刚起势。
01
长文本,关用户什么事?
在技术圈内,风头正劲的长文本并不是一个稀奇物 。
简单来说 ,大模型支持的上下文窗口容量,可类比计算机的运行内存,也可理解为大模型的理解力与记忆力。在与大模型进行内容交互(如问答对话)的过程中 ,大模型有一个可容纳的文本容量上限。这一上限不仅关系到大模型单次处理文本的能力,也关系到大模型记忆连续对话的容量 。
当大模型的长文本容量增加,该大模型在对话时可以考虑的上下文信息就越多 ,越有助于产生有针对性的连贯对话,也能确保在这一容量内的文本信息丢失情况减小。用户可以喂给大模型更多信息,而大模型根据这一用户与机器的历史互动,回以个性化解释。
月之暗面 CEO 杨植麟曾诗意地表示 ,长文本(long context),是做成通用世界模型的之一步,“登月之一步 ” 。
这一步 ,在技术圈内被认可为重要但并非独特的一步。
正如曾经计算机内存在过去几十年内涨了好几个数量级一样,越来越大的长文本容量同样出现在大模型领域。各家均会发力做内存升级,但受限于长文本对算力消耗大 、成本高 ,真正入局卷基础技术的公司有限,长文本也不是各家大模型的宣传重心 。
月之暗面则另辟蹊径,看见了长文本技术在用户端可以产生的影响 ,并实行了 Kimi 与长文本强绑定的宣传策略。
早在 2023 年 10 月 ,推出 Kimi 应用的之一天,月之暗面便在官方———文章内容里广告“联系方式等等”请谨慎甄别,请勿模仿或用于违法行为!如后果自负!“本站不承担任何相关责任”上宣传,“欢迎与 Moonshot AI 共同开启 Loooooooooong LLM 时代 ”。
它高调宣称 ,Kimi Chat 是首个支持输入 20 万汉字的智能助手产品,其文本容量 2.5 倍于 Cloude 的 100K,8 倍于 GPT- 4 的 32k 。
容量升级 ,导向的是更好的用户体验。月之暗面表示,当前大模型使用过程中的遗漏重要信息、不支持长文本 prompt 输入导致的场景设定不清晰、无法基于大量给定材料给出专业回应等问题,均会在大模型拥有足够长的上下文输入容量后迎刃而解。
这相当于一个记忆容量更大 、理解能力更好的大脑。
“它很本质 。”杨植麟如是说。
如此强调 ,是为了抢夺产品在用户心中的定位。成立之初,月之暗面便定下了独特的商业模式,不做目前看来商业模式更清晰的 B 端 ,而是在做基础大模型研究的同时,面向 C 端发力,意图通过技术提升 ,攻克 C 端用户个性化服务的需求 。
杨植麟曾表示,在大模型领域,基础技术突破和提供个性化服务走的是同一条路。通过不断升级这一“大脑”的“脑容量”,每个 C 端用户都会获得一个更能记忆与自己的互动历史的模型 ,从而得到更独特的、无法被复刻的反馈。
这是一招烧钱获客的险棋 。由于当前各家大模型 C 端应用同质化程度高,普遍为对话助手形式,在资金充裕的阿里、百度等大厂仍提供免费应用的情况下 ,各家公司不敢贸然进行收费。当公司将商业模式定在用户端,暂时看来,其只能仰赖投资人的源源不断的资金流入 ,以保证研发及运营的现金流。
根据《新浪科技》报道,月之暗面当前投放广告获客成本约为 10 元,加上拉新后用户问答产生的算力成本 ,每个用户的获客成本约为 12-13 元 。
按照第三方数据平台七麦数据的用户下载量预估,近一个月 IOS 端 Kimi 累计下载量超 82 万,仅 iPhone 端日均获客成本已超 32 万 ,近一个月 iPhone 端获客成本近一千万。若加上安卓端、网页端的运营成本,获客成本更要上一级台阶。
尽管费用不低 ,但这一数据某种程度上验证了月之暗面发展策略的有效性 。
在文心一言 、通义千问这类大厂产品已形成一定的用户口碑的当下,Kimi 凭借其对长文本技术和使用场景的强调,在用户心中营造出“精确 + 个性化 ”的观感 ,为许多用户找到了试用 Kimi 的理由。
此外,在发布 Kimi 的半年内,月之暗面进一步宣布升级 Kimi 长文本容量为 200 万汉字 ,比今年 2 月谷歌 Gemini1.5 支持的 100 万 token 还高。这一技术升级在用户端完成了口碑积累与破圈。
根据 AI 产品榜(aicpb.com),2023 年 2 月,Kimi 在 2 月访问量骤增一倍 ,增速在国内访问量前十的 AI 产品中位居之一 。
也正因这一脱胎于初创公司的软件在用户端获得如此大的反响 ,各家大厂才按耐不住,参与进自家大模型长文本能力的展示中。
在许多投资人看来,技术已不是当前大模型下一步发展的难点,更困难的在于找到适应市场的产品模式。
多名 AI 行业分析师向盐财经表示 ,大模型技术领域的突破依赖人才、资金和数据,技术升级背后的逻辑往往能归因于规模定律 。在资本投资意愿仍然旺盛、商业模式尚不清晰的当下,初创企业和大厂各有优势。
正如峰瑞资本投资合伙人陈石在 Sora 发布后所言 ,“这轮 AI 行情有一个突出的特点,就是‘天底下没有秘密’。”对摆出更大数据来“围剿”Kimi 的大厂而言,这不仅是秀实力 ,更是争夺用户市场的先声 。
02
抢滩入局,机会与恐惧
尽管 Kimi 激起了一阵水花,但在两周内迅速降温的概念股指数 ,展现了当下大模型领域尴尬的商业现状:不想错过,害怕做错。
早在“Kimi 概念 ”兴起之前,大模型领域已经历了数轮类似的技术比拼。如在更为吸睛的多模态大模型领域 ,国内大厂在 2023 年年底,已在文生视频 、图生视频领域暗暗角力 。
2023 年 11 月 18 日,字节跳动推出了视频生成模型 PixelDance,紧随其后 ,阿里上线 Animate Anyone 模型,并先后宣布开源图生视频模型 I2VGen-XL 和文生视频模型 ModelScopeT2V。
今年 1 月,大厂在文生视频、图生视频领域角逐更甚 ,字节跳动、腾讯 、百度相继推出视频生成模型 MagicVideo-V2、VideoCrafter2 和 UnivG,均支持文图生成视频。
站在未来的风口面前,各家均不想错过抢占先机的可能 。但这也导致了在技术门槛不高、规模定律起主导作用的当下,企业堆叠大量资金与精力于其中 ,做出来的模型却面临“重复造轮子”的窘况。
更残酷的是,当 Sora 这类支持生成 60 秒视频,达成技术突破的大模型出现后 ,此前辛苦做出的“轮子”,也面临被迭代风险。
对月之暗面这类技术信仰派的公司而言,大模型领域的种种厮杀故事,确实是在一次次验证其创始人杨植麟的“之一性原理 ” ,即未来属于一个超级应用 AGI(人工通用智能),而当前唯一要做的事是做到最强的技术能力,走向这一超级应用。
当前 ,外部整体投资意愿收缩,这也导致大模型领域的投资人虽身处热门赛道,也不得不在开始时便为自己多想退路 。
根据投中研究院数据 ,2024 年 2 月,中国 VC/PE 市场投资总规模同比下降 33.17%,环比下降 40.31%。
尽管 AI 领域展开的投资画卷仍有吸引力 ,让人工智能成为当期细分领域下获投规模更高的细分赛道,但冷静的资本市场,也让投资人更愿意分散下注 ,期待在大模型应用领域跑出黑马。
资本对重复造轮的厌倦与犹豫,正如市场派的投资者 ,金沙江创投主管合伙人朱啸虎所言:“整出 200 多个大模型有啥意义呢?没啥意义 。但在应用层有很多创新。中国在数据和应用场景上是远远超过美国的。”
对技术派而言,大模型的终极意义或许在实现 AGI,但在更实际的市场派看来 ,更终极的问题在于,“大模型的商业模式到底怎样才有效”?
多位产业分析师向盐财经表示,当前 ,大模型商业化尚处于萌发期,2024 年可被看作大模型应用元年,资本与技术都已积累到一定程度 ,在迫切地寻找可行的商业模式 。比起模糊不定的 C 端市场,当前发展垂域大模型,与行业相结合 ,是一个较为可行的方向。
创道硬科技创始人步日欣表示,当前的基础大模型由于数据来源庞杂,是一个难以实现专业化应用的泛化大模型。因此,将大模型与垂直领域数据结合 ,培育出专业小模型,是一条能走出差异化的路径 。这类模型在预处理后可以面向 B 端客户,而其内部数据的稀缺性 ,便是产品的护城河。
“这类似于上一个互联网时代,利用大模型技术,在各个细分领域与行业耦合。 ”
这同样需要尽早入局 。步日欣指出 ,谁在行业内有足够的数据积累,谁便更能在这场应用变革中占据优势。
至于基础大模型的赢家将在出现在哪边,人们观感并不一致。步日欣表示 ,AI 领域需要的资金投入远大于此前 SaaS 发展时期,资本雄厚的传统互联网大厂,更有发展大模型的优势。
艾媒创始人张毅则认为 ,在互联网大厂抬高入局门槛的情况下,新锐企业有更强的融资能力 、引才能力 。这就像互联网发展的早期阶段,大厂尚未成型,新锐企业更愿意试错 ,而新的道路往往诞生于这无畏的尝试中。
这场围绕 Kimi 而起的长文本大战,背后涌动的是两种发展观念的交锋。站在技术果实成熟的前夜,原本渐趋固化的竞争格局 ,重新展现出许多可能 。
还木有评论哦,快来抢沙发吧~