眼下最受关注的AI新星、DeepSeek创始人梁文锋正与张一鸣背道而驰。1月28日,DeepSeek发布了新一代多模态大模型Janus-Pro,分为70亿和15亿参数量两个版本,并且均为开源。发布后不久,该模型便登上了知名AI开源社区Hugging Face的热门榜前列。

梁文锋“反对”张一鸣

相比去年11月发布的JanusFlow,Janus-Pro优化了训练策略、扩展了训练数据,模型更大,在多模态理解和文本到图像的指令跟踪功能方面取得重大进步,同时增强了文本到图像生成的稳定性。根据DeepSeek的测试结果,这款文生图大模型在多项基准测试中表现出色,甚至强于OpenAI旗下的DALL-E 3以及Stable Diffusion。尽管用户指出Janus-Pro并不全面超越DALL-E 3,但其以较小的参数量展现了不俗潜力。

梁文锋“反对”张一鸣 小力出奇迹挑战大力神话

本月早些时候,DeepSeek还发布了R1大模型。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能号称可以比肩OpenAI当前最强的o1模型正式版。更重要的是,DeepSeek仅花费了相当于OpenAI零头的资金和资源,就拿出了堪与o1比肩的产品。这表明“小力出奇迹”的策略在DeepSeek身上屡试不爽。

梁文锋“反对”张一鸣 小力出奇迹挑战大力神话

这种低成本高效率的做法对行业产生了冲击。例如,1月27日美股交易中,英伟达股价暴跌17%,市值蒸发约4.3万亿人民币。然而,长期来看,芯片依然是AI大模型发展的基石,英伟达作为这一领域技术壁垒最坚固的公司,其“卖铲者”的长期价值依然坚挺。

———END———
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需168元,整站资源免费下载 点击查看详情
站 长 微 信: Jmbaoku

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。