Company
design-reuse.com
dr-embedded.com
D&R Events
登录
www.design-reuse-china.com
搜索,选择,比较,与提供商进行安全高效的联系
Design & Reuse We Chat
D&R中国官方微信公众号,
关注获取最新IP SOC业界资讯

看芯璐科技如何与Deep Seek携手 深化AI对世界的理解

自Deep Seek V3发布以来,AI领域再度掀起波澜。在这场技术盛宴中,芯璐科技凭借其在硬件技术上的深厚积累,与Deep Seek形成了紧密的合作关系,共同探索AI理解世界的新境界。

mp.weixin.qq.com, Mar. 11, 2025 – 

在2月份的Grok3发布会上,马斯克豪言壮志地表示:"Grok的目标是理解宇宙本质,而不仅仅是模仿人类语言。"从Chat-GPT到Deep Seek,再到Grok,AI的对话能力日益精进,与人类的界限愈发模糊,图灵测试已不再是衡量AI智能水平的唯一标准。然而,这种"理解"是否等同于心理学意义上的"理解",仍值得我们深思。从AI的工作原理来分析很明显还不是同一个内涵。与其说AI在"理解"世界,不如说AI在"建模"或者"拟合"世界会更加贴切。回到AI的本质上,其工作原理并不算复杂。用浅显易懂的话来说就是暴力"调参数"加上暴力计算。最简单的一个例子就是数据分析中用大量的离散点来"拟合"一条直线得到一个表达式y=ax+b。在这个例子中a和b相当于AI模型中的权重参数,而那些离散点就是训练数据。只不过这个例子只有两个参数,而AI大模型都是千亿,万亿级别的参数,并且AI模型中的计算过程更多的是采用卷积和矩阵乘。

如果做过股票分析,经常会看股票的日平均线,月平均线。这些平均线就是简化版本的一维卷积。说是简化,是因为计算平均时每个数据点的权重都是相同的。一维卷积的物理意义相当于"滤波",可以把频繁变动的噪声或者不关注的细节去掉,股票的均线也是同样的意义。如果把卷积计算推广到二维图像处理上,就变成了"特征"抽取,本质上仍然是"滤波",只不过说是特征抽取更形象而已。在图像识别的AI模型中,大量使用的就是卷积计算。

而在大语言模型中用得最多的是矩阵乘,在统计学上矩阵乘的意义相当于计算两组数据的关联强度。很多大模型都是基于谷歌提出的"transformer",其本质就是通过对词句进行特定的编码(前文已经提过),并通过一系列的矩阵变换寻找词句之间的内在关联性。自然语言本身就是用来描述我们的世界,基于自然语言的AI可以通过语言的编码来重新"建模"这个世界。

当模型足够大的时候,就会出现量变到质变的飞跃,AI模型就可以表征("建模")通过语言所描述的世界。数据量够大时AI就可以"完美地模仿"人类的所有行为,甚至包括情感等。但是,模型并不是越大越好,恐龙之所以灭亡很重要的原因就是体型太大。从生物优胜劣汰的角度而言,如何平衡能耗才是可持续发展的关键。Deep seek的成功之一就是改进了模型,用更低的算力更低的能耗达到了其他大模型同等的准确度。Deep seek的改进方法是采用混合专家(MoE)架构,满血版模型包含256个专家,每次推理时只使用匹配度最高的8个专家模块。这种处理方法也很符合常识,没必要什么领域都面面俱到,在有限的时间和资源面前专精才更合理。就像大部分人写字都只练一只手,没必要两只手都会写,毕竟两只手写字的练习成本太高而收益很低。

鉴于多专家系统的优点,可以预见其在未来的AI大模型中会被广泛采用。芯璐科技凭借坚实的FPGA"硬互联"技术,在多专家系统的硬件推理中展现出了独特优势。通过"软定义硬路由"可重构的专家路由系统,芯璐科技能够提升能效并降低推理延迟,为AI芯片的国产化进程持续赋能。这种这种可编程硬互联技术的应用,使得Deep Seek的模型能够更高效地在硬件上运行,进一步提升了AI的性能。

随着AI性能越来越强,AI是否会自我进化并觉醒,如何防范AI越界?

请持续关注后续文章,我们将深入探讨芯璐科技与Deep Seek如何携手应对这些挑战。

点击阅读更多

 Back

业务合作

广告发布

访问我们的广告选项

添加产品

供应商免费录入产品信息

© 2023 Design And Reuse

版权所有

本网站的任何部分未经Design&Reuse许可,
不得复制,重发, 转载或以其他方式使用。