大型国内模型DeepSeek在世界各地都广受欢迎,并创建了自1995年以来1995年出生的“天才女孩” AI。
最近,中国Huanfang定量定量私募股权公司的子公司DeepSeek(DeepSeek)重点介绍了AI Big Models的研究和开发,宣布,Model DeepSeek – V3的第一个版本同时开放。
DeepSeek – V3是一种自我开发的MOE模型(混合专家Big Model)。它不仅与世界顶级开放和封闭的源模型相比,而且表现出色,而且培训成本也很低。 它被称为“ AI行业的Pinduoduo”。它因其前所未有的成本效益而受到国内外许多知名人士的称赞,并引起了广泛关注。
进入DeepSeek的每个人的愿景的人是Luo Fuli,这是AI后95的“天才女孩”。 她参与了DeepSeek的DeepSeek – V2的开发,并且是该模型的主要开发商之一。 在DeepSeek – V3发行前几天,媒体报道说,小米创始人Lei Jun提供了数千万年的年薪,以招募Luo Fuli,他致力于领导小米AI实验室的大型模型团队。
公共信息表明,Lu Fuli通过其学士学位学习了北京师范大学的计算机科学,并获得了北京大学的计算语言学硕士学位。 2019年,她仍在研究北京大学的硕士学位,并在人工智能领域的国际顶级会议上发表了八篇论文(其中两篇作品),这使她对齐胡(Ghihu)进行了热门搜索。 罗·富里(Lufuli)在她的Zhihu帐户上回答。 “这次,我认为过去一年为ACL贡献了ACL时,我付出了巨大的努力。当然,我也可能很幸运。”
从硕士学位毕业后,罗·富里(Luo Fuli)首次进入阿里·达莫学院(Ali Damo Academy),进行了人工智能研究,从事与培训前语言模型相关的培训前语言模型,并负责Alicemind的Alicemind开放源代码开源项目,领导了多系统预训练模型VECO VECO的多系统发展。 2022年,卢·富里(Lufuli)加入了Huanfang,研究了与学习相关的战略建模和算法,后来参与了Moe Big Model Seek – V2的开发,从而改用了DeepSeek,作为深度学习研究人员。
今年5月,在DeepSeek – V2发行后,Lu Fuli撰写了一篇有关Zhihu的文章,并发表了他对DeepSeek – V2的看法。 她说:“从中国级别的DeepSeek – V2模型的角度来看,它确实在于国内和国际封闭源模型的第一个梯队。” “更重要的是,1元/百万个投入令牌的价格仅是GPT4的价格的1/100。这是成本效益之王。”
实际上,小米(Luo Fuli)被小米雇用了大量资金。这是小米创建AI模型的全力努力之一。
2023年4月,小米表示,它正式组建了AI实验室大型模型团队,探索与AI相关的用户场景,充分发挥自己的技术优势,并继续与具有公开态度的合作伙伴一起探索更多机会。 今年11月,小米建立了一个特别的AI平台部门。它成立于Zhang Duo,这是一家来自小米的资深技术巨头。 Zhang Duo毕业于Tsinghua大学计算机系,并被Lei Jun公开称赞为“小米的伟大神”,并获得了“二人组神”的标题。
食物和草首先是在军队搬迁之前。 媒体报道还说,除了招募人才外,小米已经开始建立自己的GPU One-CA群集,并且在过去几个月中继续增加其计算功率储备,以提供足够的计算能力来研究和开发大型模型。 雷·詹(Ray Jun)在公开演讲中说,小米创建大型模型的想法与许多公司不同。主要突破是轻量级,本地部署。 像小米这样的公司都要关注手机和汽车上的“成本绩效比率”,因此如何平衡大型模型企业,毫无疑问,借钱是Lei Jun考虑的核心问题。 这可能就是为什么Luo Fuli在DeepSeek – V2开发中具有背景的原因,他被吸引到Lei Jun。
评论前必须登录!
注册