两年前,当Baidu和Alibaba等大名中国技术公司通过散发公告和新聊天机器人追逐硅谷在人工智能方面的进步时,DeepSeek采取了另一种方法。它在研究中归零。

策略获得了回报。

这家中国的初创企业震惊了科技界,声称它创建了一个强大的AI模型,该模型比其资金享有的美国竞争对手的产品便宜得多。

在中国与美国在人工智能统治上的竞争中,DeepSeek似乎无处不在。实际上,近年来,它在中国的科技界中飙升了,这是一条途中的道路。

其追求研究的使命反映了诸如Openai之类的公司,Openai是硅谷公司,该公司在2022年秋天在AI上标记了美国签名。

DeepSeek的起源是财务,而不是为了技术的缘故。它的母公司是一家名为High-Flyer的中国对冲基金,并不是一家专门用于保护人类从AI等实验室,例如开放AI,而是使用AI在中国股票市场下注赌注的企业。

高飞行器通过利用以中国零售投资者为主导的市场来兴旺,他们以冲动进出库存而闻名。在2021年,高飞行员发现自己受到中国的监管镇压压力,而北京当局认为这与他们保持市场镇定的企图相反。

如此高的飞行者追求了一个新的机会,它说与中国政府优先事项更好:高级AI

“我们想做更多的价值和超越投资行业的事情,但它被误解为AI股票猜测,” High-Flyer的首席执行官Lu Zhengzhe在2023年对中国州媒体说:“我们已经设立了。一个独立于投资的新团队,相当于第二家初创企业。”

DeepSeek出生了。与许多其他中国初创企业一样,DeepSeek以不同的业务方法进入了一个既定的市场。

DeepSeek最新的人工智能模式被认为与美国竞争对手一样强大,但效率更高。它的成功表明,硅谷的AI领先优势已经缩小。尽管华盛顿努力限制了中国对AI所需的先进芯片的访问,但DeepSeek的突破仍提出了有关这些控件如何长期有效的疑问 – 尽管DeepSeek的创始人承认芯片限制是一个限制。

DeepSeek并不依赖于将面向消费者的AI产品用于收入,只有本月才发布 第一个聊天机器人,这允许任何人用简单命令生成文本和照片。取而代之的是,该公司使用了高飞行者从股票交易中赚钱的钱进行了雄心勃勃的研究。该方法使它与美国竞争对手区分开来,所有这些最终都是消费技术公司。

这种非常规的方法还允许DeepSeek避开中国政府对公众使用AI的严格法规。因为其重点是研究并向使用其模型的企业出售,并且在本月发布聊天机器人而不是消费者应用程序之前,其早期工作并没有触发相同的政府限制。

DeepSeek由其首席执行官Liang Wenfeng经营,他是位于东部城市杭州大学的Zhejiang University学习的瘦弱的工程师。他在对中国媒体的几次采访中反复说,要赶上美国的创新,中国公司必须将研究提前利润。 DeepSeek和高级飞行者没有回应置评请求。

他在一家 广泛流传的访谈 与中国科技媒体36kr。

根据访谈和公共帐户,与Liang先生合作的人将他描述为具有深厚技术背景的能力经理。

“他绝对是INTP,”计算机工程师Zihan Wang说,他从事较早的DeepSeek模型工作,他指的是Myers-Briggs Test的内省性格类型,Myers-Briggs测试是中国年轻人的流行人格测试。王先生说:“ INTP确实是很好的研究人员,他们愿意探索。” “他不是想要控制一切的人之一。”

王先生说,梁先生并不为诸如项目时间表之类的细节所困扰,偶尔会向整个研究人员发送了发人深省的研究问题。但大多数情况下,梁先生似乎被迫推进这项技术,而不是专注于利润。

与许多倾向于专注于雇用程序员的中国公司不同,梁先生因雇用计算机外员工而赢得了声誉。 DeepSeek的员工中国顶级大学的诗人和人文专业的训练训练模型,以撰写古典中国诗歌和ACE的问题,从该国艰难的大学入学考试中提出了问题。

“大多数团队都毕业于中国的顶尖大学,”旧金山BASETEN的主要软件工程师Zhang说,他在Sglang上工作,这不是DeepSeek的一个项目,该项目帮助人们以DeepSeek系统的顶部为基础。 “他们很聪明,很年轻。”

多年来,中国科技公司开创了计算机视觉中使用的人工智能应用,例如面部识别。但是Openai发布的Chatgpt促使人们进行了估算。当没有中国公司立即发布任何可比的东西时,许多人得出结论,美国公司在Advanced AI中领先

在中国,计算机科学家决心证明他们可以竞争。 2023年,中国许多公司发布了自己的大型语言模型,这是基于Chatgpt等聊天机器人的技术。

但是,制作高级型号将需要使用大量筹码,这将花费数亿美元。

高飞行器也在花费。到2021年,这只是其中一家中国公司,他们能够储存超过10,000个高级NVIDIA A100芯片。

然而,DeepSeek的研究给它带来了惊人的优势。去年,它急剧降低了它向开发人员收取的价格,这些开发商使用其模型建立应用程序,从而引发了与较大竞争对手的价格战。

王先生先生先生曾在DeepSeek工作过,他说,关于他们正在建造的技术的商业申请很少讨论。他说,取而代之的是,该公司专注于制造一个可以被许多人用于许多目的的AI系统。

王先生说:“在我那期间,我们没有谈论如何赚钱。” “他们只是专注于建立出色的基础模型。”

DeepSeek受欢迎程度的关键部分是它使开发人员的工作公开了。这种信息共享称为开源,一直是计算机软件,互联网和现在人工智能的开发的基石。

在美国,AI研究人员和企业家长期以来一直遵循DeepSeek技术的进步。去年,该公司发布旨在生成自己的计算机程序的系统时,该公司转向了头。

该公司的新挑战可能会带来新的知名度。上周,它发布了R1的同一天,其新聊天机器人背后的模型是Liang先生在与中国总理Li Qiang进行的圆桌讨论中。

DeepSeek的突然受欢迎程度将其引向了中国共产党为刺激创新所做的努力的中心,这可能很难管理。 “这是DeepSeek的巨大困境。他说,我敢肯定,他们不在政府的五年计划中。

“当党和世界都在观看时,他们能否维持这种无忧无虑的视野?”

Zixu Wang 贡献了香港的研究。

1738080041
2025-01-28 15:07:00

Leave a Reply

Your email address will not be published. Required fields are marked *