大陸國產人工智慧(AI)大模型DeepSeek才在美國造成轟動,餘波盪漾。29日大陸科技巨頭阿里巴巴在新年期間也宣布,推出自己的AI大模型通義千問Qwen 2.5-Max,號稱優於Deepseek V3。消息一出,立刻帶動阿里巴巴在美股價的上揚。
路透29日報導, 阿里巴巴旗下阿里雲宣布推出通義千問Qwen 2.5-Max超大規模MoE模型,號稱優於Deepseek V3。Qwen 2.5-Max 的發佈時機非同尋常,因為正值中國新年大年初一,大多數中國人都還在休假與家人團聚中,這表示中國人工智能新創公司DeepSeek在過去三周的迅速崛起給阿里巴巴帶來了壓力。
阿里巴巴雲端部門在其官方微信帳號上發布的公告中表示,Qwen 2.5-Max 的性能幾乎全面優於GPT-4o、DeepSeek-V3 和Llama-3.1-405B,也就是自信超越OpenAI 和Meta 等幾家公司最先進的開開源人工智慧模型。
阿里雲指,在Arena-Hard、LiveBench、LiveCodeBench 和GPQA-Diamond 等測試平台上,Qwen2.5-Max 的表現超越了DeepSeek V3,相信之後訓練技術的不斷進步,下一個版本的Qwen2.5-Max會有更好的表現。
1 月 10 日發布的 DeepSeek-V3 以及 1 月 20 日發布的 R1 模型震驚了矽谷,並導致科技股暴跌,因為這家中國初創公司的低開發成本,引起投資人對於美國AI公司的巨額支出產生疑慮。
DeepSeek的成功也引發了大陸國內競爭對手爭先恐後地升級自己的AI模型。DeepSeek-R1 發布兩天後,TikTok 所有者字節跳動發布了其旗艦 AI 模型的更新,聲稱該模型在AIME 中的表現優於微軟支持的OpenAI 的o1。
繼DeepSeek之後,Qwen2.5-Max的發佈再次證明中國AI技術在高性能、低成本的技術路徑上的又有重大突破。
原始新聞來源 不讓DeepSeek專美於前 阿里巴巴接續推出AI大模型 臺灣郵報.