火爆全网的DeepSeek,什么来头?
是一家专注于开发先进大语言模型(LLM)和相关技术的创新型科技公司
其由知名量化资管巨头幻方量化创立,创始团队包括梁文锋等几位年轻科学家。
01
技术突破与产品发布
首个模型:2024年1月5日发布DeepSeek LLM,这是深度求索的第一个大模型。
V3模型发布:2024年12月26日晚,DeepSeek正式上线全新系列模型DeepSeek-V3首个版本并同步开源。该模型拥有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练。
R1模型发布:在2025年世界经济论坛年会开幕当天,深度求索公司发布了最新开源模型R1,该模型用纯深度学习的方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩美国开放人工智能研究中心(OpenAI)的o1模型正式版。
02
产品优势与影响
性能卓越:DeepSeek的大模型在多项评测中表现出色,性能接近甚至超越了如GPT-4o和Claude-3.5-Sonnet等国际顶尖的闭源模型。
成本优势:DeepSeek通过独有的技术架构与算法优化,大幅削减了模型研发与运维成本。
例如,DeepSeek-V3模型的训练成本仅为557.6万美元,而GPT-4o的模型训练成本约为1亿美元。R1模型的训练成本也仅为560万美元,远低于美国科技巨头在人工智能技术上投入的数亿美元乃至数十亿美元。
开源与普惠:DeepSeek坚持开源和免费商用,支持衍生开发,这吸引了全球用户的关注和使用。
市场反响热烈:DeepSeek的应用程序已取代竞争对手OpenAI的ChatGPT,成为美国苹果应用商店下载量最大的免费应用程序。同时,它也登顶了苹果手机应用商店中国和美国地区免费App下载排行榜。
03
Deepseek和华为昇腾强强联手!
内容:双方针对昇腾芯片的特性,对DeepSeek模型架构进行了深度优化,重构了AI模型的计算流程。这一优化使得算法与硬件实现了高度适配,从而提升了AI模型的性能。
成果:经过优化后的昇腾云服务器在自然语言处理、图像识别等关键场景下的训练效率和响应速度,都达到了能与顶级GPU相媲美的水平。
此外,双方还联合发布了基于昇腾算力的DeepSeek系列推理API及云镜像服务,为开发者提供了高效、灵活、稳定的AI推理服务。
DeepSeek与华为昇腾的合作,实现了算法与硬件的高度适配,不仅提升了AI模型的训练效率和响应速度,还为中国AI产业提供了一个性价比更高、更安全可靠的国产替代方案。
相关概念股梳理:
中科曙光
国内服务器行业的领头羊,专注于人工智能的计算,承建了DeepSeek杭州训练中心的液冷系统。
浪潮信息
全球AI服务器头部厂商,为DeepSeek北京亦庄智算中心提供AI服务器集群,并配套英伟达H800芯片及自研AIStation管理平台。
科大讯飞
星火大模型厂商,深耕教育、医疗AI应用,同时在教育场景接入DeepSeek-Math模型,联合推出AI数学辅导应用“星火助学”。
拓尔思
金融、政务领域NLP技术领先,自研大模型,并与DeepSeek联合开发金融舆情大模型。
并行科技
为DeepSeek提供了多种并行计算技术手段,显著提升了DeepSeek的计算能力。
最后一家,也是作者为大家挖掘的一家“Deepseek”超级黑马,十倍行情不是梦!
1、公司旗下推理服务器全面搭载deepseek大模型,国内AI及DeepSeek用的是公司和华为合作生产的310芯片。
2、华为云生态最大经销商,还深度绑定华为昇腾、海思、鸿蒙,也是阿里云全国总经销商。
3、年营收1200亿,市值才200多亿,市盈率仅20倍出头,最低估的云计算股没有之一。
4、社保基金常年重仓,近期底部十倍堆量,股价再创新高,全面打开上升通道,十倍行情不是梦!
为了避免打扰主力布局,具体就不在这里讲了。想知晓的彭友莱,供钟蚝:天降吾财。
特别声明:内容仅代表个人观点,不构成任何投资指导,据此买卖,盈亏自负,股市有风险,投资需谨慎。