梁文锋“反对”张一鸣 小力出奇迹挑战大力神话

字节跳动自2023年进军AI大模型以来,投入大量资金和资源,快速扩充AI业务矩阵,发布十几款大模型及十几个AI应用。尽管如此,“小力出奇迹”的DeepSeek让字节看似无可置疑的“大力”打法遭遇挑战。DeepSeek不仅在AI技术和产品上打破了旧思维,也在不经意间点破了“大力出奇迹”并非放诸四海皆准的商业真理。

Janus-Pro的成本相对较低,使用轻量级分布式训练框架,1.5B参数模型大约需要128张英伟达A100芯片训练7天,7B参数模型则需要256张A100芯片和14天训练时间。这样计算下来,模型训练成本可低至数万美元。性能方面,Janus-Pro通过将多模态理解和生成统一起来,提升了视觉编码解耦的能力。在实际应用中,无论是文生图还是图生文,Janus-Pro都表现良好。

Janus-Pro继承了DeepSeek的开源传统,使用MIT协议,个人和中小企业可以省去不少费用。此外,由于模型体量小,Janus-Pro可以在PC端安装并本地运行,进一步降低了使用成本。

相比之下,国外秉持“大力出奇迹”的OpenAI近期遇到一些问题。例如,其文生视频大模型Sora虽然震撼亮相,但随后效果不尽如人意,被谷歌等竞争对手抓住机会嘲讽。尽管如此,OpenAI仍坚持堆芯片、堆算力的路线,计划未来四年投资5000亿美元用于AI基础设施。

字节跳动的核心产品豆包大模型在知识、代码、推理等多项公开测评基准上得分优于GPT-4o和DeepSeek-V3,但其投入同样惊人。据传今年将投入超过120亿美元用于AI基础设施,不过字节对此回应称相关消息并不准确。

DeepSeek通过“小力出奇迹”的方式展示了新的技术路线和商业哲学,打破了传统的大厂主导逻辑。这表明中小厂商完全可以用更少的资源做出更好的产品,从而得到市场和投资者的认可。

———END———
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需168元,整站资源免费下载 点击查看详情
站 长 微 信: Jmbaoku

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。