DeepSeek文生图大模型优于OpenAI

报料热线 416-818-8522 » . 新闻投稿 editor@365nettv.com » . 广告联络 ads@365nettv.com » .

365Video-248X140

新闻频道 - 国际传真

作者：世界日报

2025-01-28 11:54

中国新创企业DeepSeek(深度求索)公布低成本大模型后，除夕（1月28日）再发布开源文字生成图像（文生图）大模型Janus-Pro 7B，该模型在基准测试中超越美国巨头OpenAI。

综合路透报导和GitHub消息，这款开源多模态模型被设计为高效且多功能的模型，擅长生成逼真图像、执行复杂视觉推理等多种视觉任务。

DeepSeek自称，Janus-Pro在使用文本提示生成图像的基准测试中，表现优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion。

DeepSeek公众号说，这款大模型是2024年11月13日发布的JanusFlow大模型的进阶版本。新模型通过改进训练流程、数据质量和模型规模，提升图像生成的稳定性和细节表现。

DeepSeek解释道，Janus-Pro通过增加7200万张高质量的合成图像，并与真实数据进行平衡，进一步提高视觉效果的吸引力和图像输出的稳定性；新款模型版本拥有高达70亿个参数，在文本生成图像的速度和准确性及任务理解能力方面取得显著提升。

Janus系列多模态模型的生成结果。

DeepSeek1月20日发布开源大语言模型DeepSeek-R1，凭借低训练成本，却能比拟OpenAI的o1模型的高效能引发全球科技圈关注，更促使投资者抛售全球科技股。此举冲击美股，辉达市值蒸发近6000亿美元。

美国科技博客网站VentureBeat报导指出，与一些规模最大、资源最密集的模型不同，拥有70亿参数的Janus-Pro无需庞大的计算资源即可提供高水平的性能，这可能大大降低企业采用先进视觉AI的门槛，对初创公司或跨国企业来说具有极大吸引力。

此外，在Janus-Pro模型的开源性质下，企业无需受限于供应商绑定或支付高额费用，就能使用前沿AI技术。这对AI巨头构成直接威胁：他们的专有高价模型能否在免费、高质量的替代品面前生存？市场的抛售表明投资者对此表示怀疑。

VentureBeat认为，DeepSeek选择在美国科技股暴跌之际发布Janus-Pro，这一时机显然经过精心设计，意在突显这家初创企业对硅谷的挑战，且具备颠覆AI领域既有秩序的能力。