DeepSeek为“产品和设计”打开角色,因为初创企业使妈妈保持了新的AI模型

DeepSeek为“产品和设计”打开角色,因为初创企业使妈妈保持了新的AI模型

根据其官方微信帐户,求职者周二发布的求职通知书说,候选人有望帮助基于大语言模型(LLM)技术建立“下一代智能产品体验”。 LLM是基础的技术 生成的AI 服务 chatgpt 和DeepSeek的 同名聊天机器人应用。 这标志着技术企业家建立的DeepSeek首次 Liang Wenfeng 2023年,为产品经理,产品设计和视觉设计发布了工作空缺。这家位于杭州的公司主要集中在基本的AI模型研究上。 招聘活动似乎表明DeepSeek正在发展成为适当的公司实体。 根据招聘网站,该公司还在聘请首席财务官和首席运营官,以及研究和工程领域的四种工作。 尽管对该公司及其创始人非常感兴趣,但DeepSeek除了发布一些产品更新外,还没有与公众互动 出版研究论文。该公司的最后一次LLM升级是在一个月前发布的,当时它发布了其提高的功能 开源V3模型。 1745518989 #DeepSeek为产品和设计打开角色因为初创企业使妈妈保持了新的AI模型 2025-04-24 13:30:00

全国政府在中国拥抱DeepSeek

全国政府在中国拥抱DeepSeek

自从中国人工智能初创公司DeepSeek的创始人与中国顶级领导人Xi Jinping握手以来,上个月,全国各地的官员一直在竞争,以展示他们如何使用公司的技术。 法院官员正在使用DeepSeek在几分钟之内起草法律判断。中国东部富州一家医院的医生正在使用它提出治疗计划。在中国南部的一个城市米兹豪(Meizhou),索特索克(Deepseek)回答了政府帮助线。 在香港附近的一个城市深圳市,官员们正在寻找据报道失踪或丢失的人说,他们使用DeepSeek分析监视视频,并至少在300个实例中追踪它们。 中国官僚机构对这项技术的热情拥抱在某种程度上反映了当中国数十年来最主要的领导人习近平的批准时,经常发生的事情。 (XI先生已经发狂了 足球,,,, 冬季运动 和 高端制造, 例如。) 但这也表明了习近平先生在他制作了像AI和超级计算机之类的先进技术以来的几年中创造的势头,这是他对中国有一天作为技术超级大国在美国之前的愿景的核心。 DeepSeek的出现表明,一家中国公司有可能建立一个先进的AI系统,从而减少了美国在战略技术中的感知铅。 在中国经济上不稳定的时期,DeepSeek的崛起是一个罕见的好消息。 DeepSeek的创始人Liang Wenfeng包括 习近平与商业领袖的罕见会议 在北京,是中国领导层最高水平的批准的标志。 南京东南大学的人工智能专家黄广宾说:“这是中国政府做事的风格。” “他们不会拒绝新技术。 最近几周,当地的共产党委员会和警察部门举行了会议,以培训工人使用DeepSeek。物流公司和酒店集团鼓励员工提出用于图形设计和客户服务的DeepSeek的用途。 东部城市的警察 南昌 要求DeepSeek聊天机器人解决一对夫妇离婚后谁应该保留房屋的争议。 (据报道,丈夫应该将他的前妻偿还她所资助的房屋的翻新工程。) DeepSeek 寄给美国科技股 一月份,它发布了一个人工智能系统的详细信息,该系统以及美国公司生产的顶级产品。 DeepSeek声称已经使用过 更少昂贵的电脑芯片,挑战这样的想法,即只有最大的科技公司才能负担得起最先进的AI系统。该公司也推出了 聊天机器人应用程序 这已在世界各地下载。 在中国,DeepSeek在社交媒体上欢呼 预示着英雄 技术行业。创始人Liang先生被誉为技术工程师,他对政府对DeepSeek的隐性认可的基本问题优先考虑,这进一步引起了人们的兴趣。 在世界第二大经济体中,有超过十亿人使用互联网的焦点是大多数初创企业唯一梦想的事情。所有用途仅使DeepSeek的技术更多的材料可以学习。 但是很难从炒作中解析物质。尽管数十名官员承诺在其工作中使用DeepSeek,但很少有人描述了该技术使该技术更有效或有效的特定示例。 需求激增提出了有关DeepSeek是否具有人员和技术资源来迅速提高其能力的问题。 DeepSeek的服务一再崩溃,因为数以百万计的人开始使用它们。据中国媒体报道,在初创企业中只有160人工作。 DeepSeek没有回应置评请求。 而且,一些专家已经警告用户,尤其是对公众责任责任的官员,鉴于技术的新鲜事物,他们可能对其风险了解不足,因此有一些专家警告。 官员们在使用之前应审查所有AI生成的内容,上海若昂大学的副研究人员郑阳对官方新闻媒体进行了报道,因为即使是最先进的AI系统也可以很容易地吐出虚假信息 – 广泛的生成AI的折磨。他说,过多地依靠AI的官员可能会失去“实际情况”。 中国政府已经迅速回应了人工智能的进步,发布了公众使用的生成AI系统的法规,要求他们像中国的严格审查规则一样符合网站和应用程序。互联网监管机构还担心该技术可以鼓励虚假信息传播;本月,他们发布了规则,这些规则将需要互联网平台清楚地识别任何AI生成的内容。 即便如此,中国政府愿意尝试使用AI的意愿与世界其他地方的官员相反,这些官员在不确定他们可以保护其公民免受可能的危害的情况下保持了广泛使用该技术的态度。 一月份,OpenAI发布了旨在由美国政府机构使用的Chatgpt版本。但是,关于官员如何使用AI的规则因州而言差异很大。据报道,在允许一些员工使用Chatgpt的宾夕法尼亚州,该州表示,该州禁止Openai使用其查询来改进技术。加利福尼亚州圣何塞市的城市员工每次使用任何生成AI技术时都必须填写表格。 (《纽约时报》 起诉 Openai及其合作伙伴Microsoft指责他们侵犯了与AI系统有关的新闻内容。 Openai和Microsoft否认了这些主张。) 对于DeepSeek来说,北京的官方关注可能会削减两种方式。中国的互联网公司才刚刚开始 长达多年的镇压 这使该部门更加紧密地受到了党的控制。更大或更具影响力的Deepseek得到了,它可能会从国内外的当局受到审查。 在中国以外,DeepSeek的崛起使监管机构担心审查制度,安全和数据处理。澳大利亚,韩国和台湾的政府部门 […]

DeepSeek显示了V3,R1模型的功率,具有545%的利润率

DeepSeek显示了V3,R1模型的功率,具有545%的利润率

中国科技创业公司DeepSeek在“开源周”中结束了其每日技术项目,其大胆的主张:其在线推理服务在24小时的运行中产生了545%的利润率,这要归功于高级技术优化。 DeepSeek报告说,从2月27日中午北京的V3和R1推理模型中,平均节点的占用率为226.75。每个节点,包括八个NVIDIA H800 GPU(图形处理单元),每小时每小时2美元的成本租赁,导致总运营成本为87,072美元。 在同一时间,这些模型合并了6080亿个输入令牌和1680亿个输出令牌,包括通过Web,移动应用程序和应用程序编程接口(API)的用户请求。如果使用DeepSeek R1的定价模型收取的费用,那将等于562,027美元的收入,理论上的收益为545%。 节点代表单个计算单元处理任务,而节点占用率表示推理请求期间的使用效率。人工智能(AI)的令牌是指该算法处理的基本数据单位。 DeepSeek根据其模型处理的总输入和输出令牌来收取用户。 DeepSeek总部位于千江省东部的杭州,今年在揭幕了其上级AI模型的一小部分,这是其更大的美国竞争对手所产生的成本。它的启示有助于消除数十亿美元的美国科技股(包括NVIDIA)的市场价值,并引起了香港中国科技股的牛市。 01:20 中国的阿里巴巴发布了新的AI模型,据说胜过竞争对手DeepSeek和Openai的GPT-4O 中国的阿里巴巴发布了新的AI模型,据说胜过竞争对手DeepSeek和Openai的GPT-4O DeepSeek在周六的Github和Zhihu中国问答平台上的帖子中澄清说,成本和收入“纯粹是理论上的”。实际收入可能会降低,因为其V3型号的价格较低,两种型号的非高峰折扣以及免费使用的聊天机器人服务。 1740940418 #DeepSeek显示了V3R1模型的功率具有545的利润率 2025-03-02 10:15:00

DeepSeek的创始人在中文新闻和Mudik期间像英雄一样受到欢迎

DeepSeek的创始人在中文新闻和Mudik期间像英雄一样受到欢迎

雅加达 – 创始人 DeepSeek Liang Wenfeng 不久前,回到中国南部的一个小村庄,与家人一起庆祝农历新年。在那里,宽面被村民像英雄一样迎接。 自亿万富翁建立高级对冲基金后,梁实际上就一直在闻名。现在,在DeepSeek成功打扰了西方国家的AI公司之后,这位40岁的人越来越受到当地居民的喜爱。 根据《金融时报》的报告,梁回到了中国广东省的一个小社区米利林村。他没有一个人回家,因为他陪同几位保镖。 广告 滚动以继续内容 梁的返回受到欢迎,甚至当地居民都可以驾驶许多横幅。 “ Liang Wenfeng回到他的家乡,以传播良好的成果,并增加了农村振兴的热情,”这一横幅写道,这是《金融时报》(Fininancle Times)周一(3/2/2025)所引用的。 许多居民突然拜访了梁的家人的房子,他们有兴趣看到技术老板养育的地方。尽管许多邻居称赞,但几乎没有人知道今天梁的生活。 梁的邻居说,这个戴着舌尖人的男人来自一个教育家家庭,他的父母和祖父是老师。他的一位初中老师说,伯罗斯(Burrows)是在班上有50名学生的班级学生,因为他们的举止很好。 老师说:“他是一名杰出的学生,尤其是在数学领域。他喜欢阅读漫画。” 梁年轻的时候也经常踢足球。莱昂·梁说:“我们都在这个村庄长大。我们为他感到骄傲。” 尽管它的受欢迎程度在上升,但伯罗斯在公开场合并没有太多话题并避免公众关注。鉴于杰克·马(Jack Ma)和小马·马(Pony Ma)的成功首席执行官的命运经常受到政府监视的行动,如果梁(Liang)选择不说话太多,则不会感到惊讶。 (vmp/fay) 1738580763 2025-02-03 09:03:00 #DeepSeek的创始人在中文新闻和Mudik期间像英雄一样受到欢迎

DeepSeek AI是中国的胜利,但对政党控制有危险

DeepSeek AI是中国的胜利,但对政党控制有危险

2017年,中国对谷歌支持的人工智能计划Alphago敬畏和震惊,在复杂的棋盘游戏中击败了中国神童Alphago。对于中国来说,对外国计算机计划的决定性损失是同样击败韩国球员的韩国球员。 那一年,中国官员制定了一项大胆的计划,到2030年在AI中领导世界,向专注于该技术的公司和研究人员保证了数十亿美元。从这种热情出现了DeepSeek,这是一家鲜为人知的中国初创企业,通过创建一个强大的AI模型,其资金远低于专家所认为的,从而颠覆了技术格局。 DeepSeek是私人的,没有明显的国家支持,但其成功体现了中国顶级领导人习近平的野心,后者敦促他的国家“占据技术高度”。习近平希望中国经济不受诸如债务燃料的房地产和廉价出口等旧增长引擎的动力,而是由AI,SuperComputing和Green Energy等最先进的技术提供的。 对于习近平来说,这一刻有助于抑制美国在AI中所拥有的优势的光环,AI是一场激烈的超级大国竞争中的关键领域。中国已经成为发展中国家的仁慈的全球伙伴,愿意与 XI先生说 AI不应该是“富有国家和富人的游戏”。 现在,DeepSeek表明,中国有可能使每个人更便宜,更容易获得。不过,问题是执政的共产党如何管理可能有一天如此破坏的技术的兴起,以至于它可能威胁其利益,并掌握权力。 多年来,中国对AI的调节强度有所不同,具体取决于该国评估其优势和劣势的位置。当中国政府担心在Openai的Chatgpt推出后,当它在2022年落后于美国时,它采取了一种更加开发的方法,最终使DeepSeek和其他人这样的冒险蓬勃发展。 马特·希恩(Matt Sheehan)说,既然摆动已经挥舞着,那么对这个行业的信心就可以被证明是“双刃剑”,他在卡内基国际和平的卡内基捐赠基金会研究了中国人工智会。 希恩先生说,该党的“核心本能是朝着控制的。” “随着他们重新获得对中国AI能力的信心,他们可能很难抵抗对这些公司采取更加动手做法的冲动。” 仿佛强调了这种可能性,DeepSeek的创始人Liang Wenfeng被邀请与1月20日该公司发布最新和最强大的AI模型的同一天与Premier Li Qiang进行讨论。 考虑到DeepSeek尚未被认为是中国所谓的AI Tigers之一,Liang先生的出席率更为显着。这种区别保留给像Zhipu AI这样的备受瞩目的公司,Zhipu AI是一家基于北京的初创企业,已获得了大量的州投资。 DeepSeek对党的干预渴望并不陌生。这可能在最终的成功中无意中发挥了作用。 DeepSeek最初训练了其AI模型,以在中国股市上投注。但是,当监管机构以这种行为为目标时,它在2023年枢纽促进了AI,以符合中国的工业政策。 然后,它通过与美国竞争对手的表现相媲美,尽管使用了中国很难获得的高级计算机芯片,但它还是通过竞争美国竞争对手的表现而震惊了世界。在家里,中国评论员坚持了DeepSeek的成就,证明美国对AI芯片出口到中国的限制最终是徒劳的(即使该公司的创始人表示这种限制是一个主要问题)。 即使是Openai最近的指控,DeepSeek不当收集了其数据以建立模型,并没有阻止其在中国的粉丝,后者指责旧金山公司传播谣言。 “美国对中国的技术制裁使中国别无选择,只能发展。”北京的Tsinghua大学外交关系专家Sun Chenghao表示,与中国的流行情绪相呼应。 “我们只能依靠自己。” AI在XI先生对中国崛起的愿景中占有一席之地,其潜力有可能帮助该国克服其许多最大的挑战,例如其缩小的劳动力。中国使用面部识别和算法来增强其监视人民并消除异议的能力。该技术还通过自动武器系统甚至 战场策略。 DeepSeek的发展也可以推进中国的地缘政治目标。 DeepSeek使用开源模型,这意味着任何人都可以在其引擎盖下凝视并使用其技术,这与使用更昂贵的专有软件的美国公司不同。 Sheehan先生说:“ DeepSeek模型的低成本和开源性质增强了中国政府的叙述,即中国是发展中国家可以寻求AI解决方案的地方。” 中国在人工智能全球舞台上成为一个球员的大小最终取决于政府的决定如何 平衡法规 凭借公司和研究人员需要从事尖端工作的自由,使他们能够与美国竞争。 一些分析师像战略和国际研究中心的研究人员,前美国国防官员格雷戈里·艾伦(Gregory C. 艾伦先生说:“唯一退缩的是表现。” 在私营部门中规范AI并不适用。那里的景观是由中国监管机构的竞争优先事项决定的,每个人都围绕着世界上许多人仍然无法完全理解的技术。 很明显,一项技术越广泛使用,政党希望遏制它。在2023年,在Chatgpt引发了对人工智能的投资疯狂的几个月后,中国发布了旨在控制中国聊天机器人所说的话的规则。用户,要求他们反映“社会主义核心价值观”,并避免破坏“国家权力”的信息。 就DeepSeek的聊天机器人而言,这导致对看似良性的问题的尴尬回答,例如“谁是XI Jinping?”研究人员测试其功能已经发现,该机器人提供了传播中国宣传甚至鹦鹉虚假信息的答案。 在本质上,一些担忧更为存在。越来越多的学者合唱在声音上引起了人们对失去人类控制的潜在灾难性后果的警报 在这些声音中,首席是安德鲁·杨(Andrew Yao),他是Tsinghua大学AI的巨人,也是Turing Award的获得者,这相当于诺贝尔计算机奖。他的影响力有助于确立中国所说的全球AI治理倡议,该计划是XI先生在2023年提出的,并呼吁始终保持AI在人类控制之下。去年,政府还呼吁“基于人类决策和监督”来增强AI治理。 华盛顿智囊团战略和国际研究中心的AI政策专家Barath Harithas说,最终,中国的AI可能只能就政府决定减轻这些风险的发展。 Harithas说:“过度监管以及遵守’核心社会主义价值观’的需求可能会冒险绝育AI的潜力。”

Liang Weng:黑天鹅的崛起

Liang Weng:黑天鹅的崛起

统计数学家纳西姆·塔利布(Nassim Taleb)在他的开创性作品《黑天鹅》中将“黑天鹅时刻”定义为极不可能的事件,具有重大影响,通常会通过事后看来是合理的。 2008年,全球金融崩溃是在美国开始的一项黑天鹅事件,消灭了数万亿美元,导致交易者争先恐后地履行保证金呼叫请求。算法交易,尤其是高频交易,被认为是危机期间市场波动的一个因素。 随着金融危机的影响袭击了全球市场,遍布太平洋,23岁的Liang Wenfeng以及他的同学正在收集有关金融市场和宏观经济指标的数据,目的是探索算法的全部潜力贸易。 金融不是第一个引起梁先生对测试新兴技术和算法框架兴趣的兴趣的行业,但这是他当时的领域。尽管面临挑战和挫折,但梁先生仍然坚信机器学习(ML)和人工智能(AI)有潜力从根本上彻底改变世界。当他的创业公司DeepSeek推出的AI语言模型破坏了全球AI景观并引发了上周全球芯片股票的崩溃时,他被证明是正确的。 Liang先生搬到了西南中国城市成都,在智格大学攻读了他的信息和传播工程硕士学位。他没有像他的同龄人这样的著名科技公司确保工作,而是冒险进入一个未知领域,决心在快速发展的金融景观中利用ML和AI。 Liang先生在他身边的一些Zhejiang University校友的情况下,于2015年创立了定量对冲基金高级基金会。 高飞行器很快获得了认可,在几年内积累了200亿元人民币(28亿美元)的资产(AUM)。该基金的成功可以归因于采用复杂算法来增强交易策略。通过利用大型数据集并优化决策过程,高飞行器获得了惊人的回报。 技术仍然是公司运营的核心。在梁先生的领导下,高飞行者投资于高性能计算资源,并组建了一个专门的工程师和数据科学家团队。这种对技术的战略重点,再加上公司的本地专业知识,在理解本地动态至关重要的市场中证明了关键。尽管外国对冲基金也具有出色的技术,但高级飞行的本地化知识使其能够在中国市场上胜过其竞争对手。 根据数据提供商上海Suntime信息技术的数据,到2019年,High-Flyer取得了巨大的成功,并将其排名第一。 此外,该基金迅速适应市场波动的能力使其能够利用中国市场内的低效率。当时对中国市场进行密切监视的行业专家观察到,中国金融体系中高流动性和效率低下的结合为系统交易策略创造了理想的环境。 非正统的招聘 Liang先生的成功不仅归因于其公司的复杂算法和对当地市场的深刻了解。他还将自己与其他当地资金区分开来,以获取人才的方式。 他通过优先考虑创造力,热情和基本技能而不是工作经验来挑战技术和金融行业的传统招聘实践。他积极招募年轻的工人,认为经验较低的员工更有可能创新并在解决问题上进行批判性思考。 Liang先生认为经验丰富的专业人员在其方法上是僵化的,很快就建议了既定的方法,而经验不足的工人更愿意探索多种解决方案并适应当前的挑战。这种理念扩展到了他的招聘策略,即将各种背景(尤其是文学领域的背景)带入工程团队。 与大多数在欧洲或美国具有背景的中国量化投资基金的创始团队不同,Liang先生在高级飞行中的团队完全由当地人才驱动。他的资金是由独立成长的当地专业人士团队创立的。 在成立的六年内,高级飞行获得了杰出的成功,成为中国前四大量化量子投资基金之一,AUM为1000亿元人民币(139亿美元)。考虑到Liang先生在对冲基金世界中的局外人地位,这一成就尤其值得注意。 成功可以归因于他在具有挑战性的环境中蓬勃发展的能力。从2008年的金融危机开始,他表现出韧性,并继续发展自己的业务。 2015年8月24日,上海综合指数在高潮推出期间的显着下降了8.5%,标志着其八年来最差的一日跌幅。这项活动被中国吹口的共产党《人民日报》称为“黑色星期一”。 在唐纳德·特朗普(Donald Trump)(2017-21)和乔·拜登(Joe Biden)的期限期间,包括高飞行器在内的中国公司都面临着由于出口控制而对出口的限制。这些政策减少了中国公司的关键半导体,特别是NVIDIA GPU的访问权限。 尽管面临这些挑战,但梁先生在量化投资方面的专业知识,他的复杂技术使他能够建立一个十亿美元的帝国。但是,在2023年,耗资2000亿美元的对冲基金行业来自中国金融监管机构的十字准则。随着北京试图恢复散户投资者的信心,并减轻了大量4万亿美元的股票抛售,快速增长的量子基金(例如高飞行者)成为监管关注的目标。 这些事态发展促使Liang先生将重点放在AI上。同年,他推出了DeepSeek,该实验室致力于建立大型语言和推理模型。该公司的DeepSeek-R1模型已成为美国OpenAI高级推理模型O1的竞争对手。 漫长的旅程 尽管DeepSeek于2023年正式成立,但Liang先生为这次旅程的准备工作始于很久以前。从变形金刚启发Openai建立了他们的生成预培训(GPT)模型的时间,他已经进行了AI投资已有七年多了。 早在2017年,DeepSeek创始人就开始扩大AI算法和软件的研究范围。他的团队通过大规模的计算能力解决方案解决了单机训练失败问题,并于次年在马来西亚获得了金牛奖。随后,在2021年,他的基金花费了10亿元人民币(1.39亿美元)来建造AI超级计算机Fire-Flyer 2,以处理复杂的AI任务。该系统是使用超快速加速器卡和网络连接构建的,该网络连接可以以每秒200千兆位传输数据。 在Liang先生的领导下,Quant基金已经积累了令人印象深刻的计算资源集合,其中包括10,000个Nvidya A100 GPU,将其定位为AI领域的主要力量。根据一些报道,高传单是五个中国公司中唯一的对冲基金,其中超过10,000 GPU。其他四个都是互联网巨头。 Liang先生对AI研究的影响是深刻而多方面的。 DeepSeek将新鲜的能量和观点注入了该领域,挑战了盛行的范式,并为通过AI理解人类认知的突破开辟了新的途径。 塔莱布先生在他的书中指出:“我们倾向于’隧道’,同时探索未来,像往常一样,无黑天鹅,而实际上对未来没有平常的态度。” Liang先生是那些通过隧道观察未来的人,是通过逆境形成的黑天鹅,恰好打开了AI研究中意外的新章节的大门,甚至可能是对量化进行投资。 出版 – 2025年2月2日02:02 AM IST 2025-02-01 20:32:00 1738452323

谁是AI初创公司DeepSeek的创始人?

谁是AI初创公司DeepSeek的创始人?

在技​​术上,许多企业家只获得了一个决定性行为。 Liang Wenfeng的创始人 DeepSeek,已经在他的第二个。 这位工程师被同事描述为内省的工程师,首先在2010年代后期在中国的投资界取得了印记,共同创立了一家对冲基金,该基金基金使用人工智能模型提供了良好的回报,并吸引了数十亿美元的资本。 Liang先生受到了利润和警惕的投机性交易的谨慎,他于2023年枢纽。 AI芯片 并组建一个团队来建造 中国的答案 到硅谷领先者Openai。 现在,仅仅两年后, DeepSeek 已经颠覆了全球科技领域。他是如何做到的,您需要了解的关于Liang Wenfeng的知识? 他是一位深厚的技术工程师。这使他陷入了其他成功的中国科技高管。 当中国技术人员辩论为什么该国最大的投资者和科技公司未能预期生成AI的兴起时,许多人指出了一个罪魁祸首:中国的公司在激烈竞争的市场中痴迷于迅速的回报。 梁先生在上面掌握了这些课程,并得到了自己的贸易意外收获的支持,他明确表示,他的野心远远超出了商业申请。 他说,他的重点是他认为赶上美国的唯一真正机会。这意味着要在基本的AI挑战中大胆,理想主义的波动。他的主要野心是创造人工通用情报或AGI,这是建造可以像人类一样思考和学习的机器的难以捉摸的目标。 去年,DeepSeek通过以便宜的价格提供模型来削弱其中国竞争,迫使更大的竞争对手降价时,Liang先生驳回了这一重要性。 “说实话,我们并不真正在乎 – 这只是我们一路上所做的事情。” 广泛分享的采访 与中国科技媒体36KR。 “提供云服务不是我们的主要目标。我们的目标仍然是实现AGI”(DeepSeek本周仍保持沉默,并且没有回应置评请求。) 在他认为超人人工智能在拐角处的信念中,梁先生听起来很像Openai的首席执行官Sam Altman。但是相似之处结束了。 Liang先生是一位低调的高管高管,具有AI工程技术的深厚技术背景,比中国腾讯的联合创始人Pony Ma的模具比硅谷的富有魅力的有远见的人。 他最初是对冲基金交易员。然后他转向纯AI研究。 梁先生的职业生涯在许多方面都追溯了中国技术格局的重大转变。 他2010年在郑明大学的论文解决了不久之后的中国人工智能中最热门的话题之一:改善了监视摄像机的智能跟踪算法。 后来,他共同创立的对冲基金受到监管压力的助制,最终迫使关闭其主要投资产品之一。 亚历山大说:“在2019年至2023年之间,他们想进行这个附带项目,以便他们的博士学位感觉自己有事要做,而深层则起源于此。” 他说:“但是,当他们的主要投资产品在2024年2月不得不关闭时,这确实发生了过度驱动。” 从某种意义上说,正是中国对私营部门的镇压使人们对长期AI研究进行了淡化。 他愿意尝试其他企业家不会的事情。他甚至雇用了点燃的专业。 如果您对中国的AI专家进行了调查,谁会实现该国的第一个主要生物AI突破,那么很少有人会选择Liang先生。其中包括中国政府。 DeepSeek是一家私人公司,没有明显的国家支持,没有大牌联盟,也没有像搜索巨头Baidu这样的球员的机构重量。在一个偏爱内部人员的系统中,梁先生不是一个。 然而,有先例。中国一些最具破坏性的科技公司 – 华为,阿里巴巴,绑定 – 始于聚光灯,只是为了重新定义其行业。 梁先生的方法与公司的崛起一样非常规。他强调了智力探索,而不是纯粹的锻炼。他的招聘理念同样是非正统的 – DeepSeek的工程团队Haver与文学爱好者一起加入,以帮助完善公司的AI模型。 他在36KR采访中说:“每个人都有自己独特的旅程,并带来了自己的想法,因此无需推动他们。” 在艰苦的时间和等级制度所定义的技术文化中,这是波西米亚风格的展望。然而,梁先生坚持认为,如果中国想领导AI创新,就必须改变。 他说:“当Chatgpt出来时,中国的整个行业都缺乏追求边境创新的信心。” “创新始于自信 – 我们经常从年轻人那里看到更多。” 亚历山德拉·史蒂文森 从香港贡献了报道。 […]

DeepSeek从股票交易者变成了AI明星

DeepSeek从股票交易者变成了AI明星

两年前,当Baidu和Alibaba等大名中国技术公司通过散发公告和新聊天机器人追逐硅谷在人工智能方面的进步时,DeepSeek采取了另一种方法。它在研究中归零。 策略获得了回报。 这家中国的初创企业震惊了科技界,声称它创建了一个强大的AI模型,该模型比其资金享有的美国竞争对手的产品便宜得多。 在中国与美国在人工智能统治上的竞争中,DeepSeek似乎无处不在。实际上,近年来,它在中国的科技界中飙升了,这是一条途中的道路。 其追求研究的使命反映了诸如Openai之类的公司,Openai是硅谷公司,该公司在2022年秋天在AI上标记了美国签名。 DeepSeek的起源是财务,而不是为了技术的缘故。它的母公司是一家名为High-Flyer的中国对冲基金,并不是一家专门用于保护人类从AI等实验室,例如开放AI,而是使用AI在中国股票市场下注赌注的企业。 高飞行器通过利用以中国零售投资者为主导的市场来兴旺,他们以冲动进出库存而闻名。在2021年,高飞行员发现自己受到中国的监管镇压压力,而北京当局认为这与他们保持市场镇定的企图相反。 如此高的飞行者追求了一个新的机会,它说与中国政府优先事项更好:高级AI “我们想做更多的价值和超越投资行业的事情,但它被误解为AI股票猜测,” High-Flyer的首席执行官Lu Zhengzhe在2023年对中国州媒体说:“我们已经设立了。一个独立于投资的新团队,相当于第二家初创企业。” DeepSeek出生了。与许多其他中国初创企业一样,DeepSeek以不同的业务方法进入了一个既定的市场。 DeepSeek最新的人工智能模式被认为与美国竞争对手一样强大,但效率更高。它的成功表明,硅谷的AI领先优势已经缩小。尽管华盛顿努力限制了中国对AI所需的先进芯片的访问,但DeepSeek的突破仍提出了有关这些控件如何长期有效的疑问 – 尽管DeepSeek的创始人承认芯片限制是一个限制。 DeepSeek并不依赖于将面向消费者的AI产品用于收入,只有本月才发布 第一个聊天机器人,这允许任何人用简单命令生成文本和照片。取而代之的是,该公司使用了高飞行者从股票交易中赚钱的钱进行了雄心勃勃的研究。该方法使它与美国竞争对手区分开来,所有这些最终都是消费技术公司。 这种非常规的方法还允许DeepSeek避开中国政府对公众使用AI的严格法规。因为其重点是研究并向使用其模型的企业出售,并且在本月发布聊天机器人而不是消费者应用程序之前,其早期工作并没有触发相同的政府限制。 DeepSeek由其首席执行官Liang Wenfeng经营,他是位于东部城市杭州大学的Zhejiang University学习的瘦弱的工程师。他在对中国媒体的几次采访中反复说,要赶上美国的创新,中国公司必须将研究提前利润。 DeepSeek和高级飞行者没有回应置评请求。 他在一家 广泛流传的访谈 与中国科技媒体36kr。 根据访谈和公共帐户,与Liang先生合作的人将他描述为具有深厚技术背景的能力经理。 “他绝对是INTP,”计算机工程师Zihan Wang说,他从事较早的DeepSeek模型工作,他指的是Myers-Briggs Test的内省性格类型,Myers-Briggs测试是中国年轻人的流行人格测试。王先生说:“ INTP确实是很好的研究人员,他们愿意探索。” “他不是想要控制一切的人之一。” 王先生说,梁先生并不为诸如项目时间表之类的细节所困扰,偶尔会向整个研究人员发送了发人深省的研究问题。但大多数情况下,梁先生似乎被迫推进这项技术,而不是专注于利润。 与许多倾向于专注于雇用程序员的中国公司不同,梁先生因雇用计算机外员工而赢得了声誉。 DeepSeek的员工中国顶级大学的诗人和人文专业的训练训练模型,以撰写古典中国诗歌和ACE的问题,从该国艰难的大学入学考试中提出了问题。 “大多数团队都毕业于中国的顶尖大学,”旧金山BASETEN的主要软件工程师Zhang说,他在Sglang上工作,这不是DeepSeek的一个项目,该项目帮助人们以DeepSeek系统的顶部为基础。 “他们很聪明,很年轻。” 多年来,中国科技公司开创了计算机视觉中使用的人工智能应用,例如面部识别。但是Openai发布的Chatgpt促使人们进行了估算。当没有中国公司立即发布任何可比的东西时,许多人得出结论,美国公司在Advanced AI中领先 在中国,计算机科学家决心证明他们可以竞争。 2023年,中国许多公司发布了自己的大型语言模型,这是基于Chatgpt等聊天机器人的技术。 但是,制作高级型号将需要使用大量筹码,这将花费数亿美元。 高飞行器也在花费。到2021年,这只是其中一家中国公司,他们能够储存超过10,000个高级NVIDIA A100芯片。 然而,DeepSeek的研究给它带来了惊人的优势。去年,它急剧降低了它向开发人员收取的价格,这些开发商使用其模型建立应用程序,从而引发了与较大竞争对手的价格战。 王先生先生先生曾在DeepSeek工作过,他说,关于他们正在建造的技术的商业申请很少讨论。他说,取而代之的是,该公司专注于制造一个可以被许多人用于许多目的的AI系统。 王先生说:“在我那期间,我们没有谈论如何赚钱。” “他们只是专注于建立出色的基础模型。” DeepSeek受欢迎程度的关键部分是它使开发人员的工作公开了。这种信息共享称为开源,一直是计算机软件,互联网和现在人工智能的开发的基石。 在美国,AI研究人员和企业家长期以来一直遵循DeepSeek技术的进步。去年,该公司发布旨在生成自己的计算机程序的系统时,该公司转向了头。 该公司的新挑战可能会带来新的知名度。上周,它发布了R1的同一天,其新聊天机器人背后的模型是Liang先生在与中国总理Li Qiang进行的圆桌讨论中。 DeepSeek的突然受欢迎程度将其引向了中国共产党为刺激创新所做的努力的中心,这可能很难管理。 “这是DeepSeek的巨大困境。他说,我敢肯定,他们不在政府的五年计划中。 “当党和世界都在观看时,他们能否维持这种无忧无虑的视野?” Zixu […]

北京会议聚焦中国人工智能新面貌——DeepSeek创始人梁文峰

北京会议聚焦中国人工智能新面貌——DeepSeek创始人梁文峰

Liang Wenfeng据官方通讯社报道,40岁的李克强参加了会议,会议由技术、教育、科学、文化、卫生和体育领域的行业专家组成,他们向李克强提出了政府工作报告草案的意见和建议。新华社. 杭州-基于 启动 DeepSeek 去年 12 月在全球人工智能行业掀起波澜,基准测试显示其 DeepSeek V3 法学硕士是在预算有限的情况下建立的,其性能优于使用更多资源开发的竞争对手模型,例如 元平台 和 聊天GPT 创造者 开放人工智能。 LLM指的是技术基础 生成式人工智能 ChatGPT 等服务。开源允许公众访问软件程序的源代码,允许第三方开发人员修改或共享其设计、修复损坏的链接或扩展其功能。 据新华社报道,李克强在周一的会议上呼吁通过科技创新打造经济“新的增长动力”,以帮助“保障和改善民生”。 周一在北京举行的研讨会上,中国国务院总理李强(左二)坐在 DeepSeek 创始人梁文峰对面,听取技术、教育、科学、文化、健康和体育领域行业专家的意见和建议,以制定草案政府工作报告。图片来源:新华社 梁参加周一与李的会面反映了 DeepSeek 在人工智能行业日益突出的地位。 1737460356 #北京会议聚焦中国人工智能新面貌DeepSeek创始人梁文峰 2025-01-21 10:30:00

DeepSeek:这家中国初创公司正在改变人工智能模型的训练方式

DeepSeek:这家中国初创公司正在改变人工智能模型的训练方式

中国人 启动 就在该公司在全球引起轰动的几天后,DeepSeek 已成为 2025 年开源大语言模型 (LLM) 领域的“最大黑马” 人工智能 (AI) 社区及其最新版本。 这一评估来自吉姆·范(Jim Fan),他是该公司的高级研究科学家。 英伟达 及其人工智能代理计划的领导者,在元旦的帖子中 社交媒体 平台 X,遵循 杭州总部位于纽约的初创公司上周发布了其同名法学硕士 DeepSeek V3。 “[The new AI model] 表明资源限制迫使你以惊人的方式重塑自己,”范写道,指的是 DeepSeek 如何以其他科技公司投资建设法学硕士的一小部分资本支出开发该产品。 DeepSeek V3 拥有 6710 亿个参数,训练时间约为两个月,成本为 558 万美元,使用的计算资源比大型科技公司(例如 Facebook 家长 元平台 和 聊天GPT 创造者 开放人工智能。 LLM指的是技术基础 生成式人工智能 ChatGPT 等服务。在人工智能中,大量参数对于使法学硕士能够适应更复杂的数据模式并做出精确的预测至关重要。开源允许公众访问软件程序的源代码,允许第三方开发人员修改或共享其设计、修复损坏的链接或扩展其功能。 半导体设计巨头 Nvidia 的高级研究科学家 Jim Fan 表示,他一直在密切关注人工智能初创公司 DeepSeek 的进展。照片:南华早报 DeepSeek […]