编程开源技术交流,分享技术与知识

网站首页 > 开源技术 正文

2025年2月21日,开源5个代码库,DeepSeek在社交平台发布重磅消息

wxchong 2025-02-28 17:43:54 开源技术 22 ℃ 0 评论

2025年2月21日,DeepSeek在社交平台X上发布了一则重磅消息,宣布将从下周开始开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展。这一计划被定义为“Open Source Week”。

主要内容

开源计划:DeepSeek将开源5个代码库,这些代码库是他们在线服务中的基础组件,已经过详细记录、部署和实战测试。

技术进展:DeepSeek的V3和R1模型均为大语言模型,不具备识图能力。但在腾讯元宝中,DeepSeek与混元的多模态能力进行了融合,使其具备了理解图片的能力。

市场反应:DeepSeek的宣布引发了市场的积极反应,相关概念股出现涨停潮,腾讯股价也有所上涨。

行业合作:DeepSeek已经与多家企业和机构建立了合作关系,包括腾讯、微博、百度等,推动其技术的广泛应用。

技术特点

原生稀疏注意力机制:DeepSeek在2月18日发布的技术论文中介绍了NSA(Natively Sparse Attention),这是一种专为长文本训练与推理设计的技术,能够显著优化传统AI模型在训练和推理过程中的表现。

社会影响

DeepSeek的开源计划和技术进展将对人工智能行业产生深远影响,推动行业加速发展,并促进全球开发者社区的协作与创新。


本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表