华人澳洲中文论坛

热图推荐

    英伟达用AI设计GPU:最新H100曾经用上,比传统EDA增加25%芯全面积

    [复制链接]

    2022-7-17 07:01:10 19 0

    原标题:英伟达用AI设计GPU:最新H100曾经用上,比传统EDA增加25%芯全面积  
    白交 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    英伟达终于揭晓:  
    H100 竟有近13000条电路,是AI设计的?!   


    在最新论文中,他们引见了如何用深度强化学习agent设计电路的办法。  
    据钻研人员称,这类办法还属业内初次。  


    值得一提的是,这篇文章包孕参考文献在内,仅有短短6页。  
    不少网友表现,太酷了!  


    靠玩游戏来学习构建电路架   
    跟着摩尔定律变慢,开发其余技术来进步芯片机能变得愈发首要。  
    设计更小、更快、功耗更低的算术电路,就是其中的形式之一。  
    基于这样的配景,钻研人员提出了 PrefixRL——用深度强化学习优化并行前缀电路。   
    据钻研人员引见,他们不只证实了AI能够从头开始设计电路,并且比EDA工具设计得更小、更快。  


    最新英伟达Hopper架构就具有13000个AI设计电路的实例。  
    来详细看看这项钻研。  
    本文次要钻研了一种盛行的并行前缀电路,侧重探讨了电路的两大特性:电路面积和提早。  
    已有的优化根本思绪,是使用电路产生器将前缀图形转换为带有导线和逻辑门的电路,再用物理综合工具进一步优化。  
    他们将算术电路设计看做是一个强化学习工作,训练一个agent来优化两大特性。  
    关于前缀电路,还设计了一个环境。  


    在这个环境中agent玩构建电路架构 (前缀图形) 的游戏,能够从中添加or删除节点,会由于电路面积最小化和低提早而获取嘉奖。   
    钻研人员使用Q-Learning算法来训练agent。  
    首先将前缀图表现成网格,网格中的每个元素都映照到电路中的节点。  
    输出和输入均为网格,只不外输出网格中的每个元素表现节点是不是存在,输入每个元素则表现用于添加或删除节点的Q值。  


    在实际训练中,PrefixRL是一项计算要求很高的工作:物理摹拟每个GPU需求256个CPU,训练64b用例破费超32000个GPU小时。  
    为此,钻研人员还开发了个散布式强化学习训练平台 Raptor。   


    后果显示,在相反提早、效能下PrefixRL加法器面积比EDA工具加法器面积增加了25%。  


    钻研团队   
    本次钻研来自英伟达运用深度学习钻研小组。  
    他们但愿这个办法有但愿让AI运用到实际电路设计问题傍边去。  
    近些年来,AI设计芯片这件事儿得多科技公司都曾经在展开。  
    最典型如谷歌,去年6月在Nature上颁发了一篇文章:A graph placement methodology for fast chip design。  
    文中表现,AI能在6个小时内生成芯片设计图,并且比人类设计得更好。  


    还有像三星、新思、cadence等企业也都有相应的解决计划。  
    前阵子在英伟达GTC大会上,首席迷信家、计算机架构巨匠Bill Dally就分享了AI在芯片设计上的几种运用。  
    包罗预测电压降、预测寄生参数、规划布线、自动化规范单元迁徙。  
    不外,即使停顿频频,也有不少质疑的声响泛起,好比,设计才能跟人类比还差点。  
    关于AI设计芯片这事儿,你怎么看?  
    —   
    「人工智能」、「智能汽车」微信社群邀你参加!  
    欢送关注人工智能、智能汽车的小火伴们参加咱们,与AI从业者交流、切磋,不错过最新行业开展&技术停顿。  
    ps.加好友请务必备注您的姓名-公司-职位哦~   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题31

    帖子41

    积分181

    图文推荐