在线咨询 切换到宽版
eetop公众号 创芯大讲堂 创芯人才网

 找回密码
 注册

手机号码,快捷登录

手机号码,快捷登录

搜全文
查看: 135|回复: 1

10X提速!华大九天全球首发Liberal GT,重塑K库格局

[复制链接]
发表于 12 小时前 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
本帖最后由 PyAether玩家 于 2025-11-18 10:52 编辑

华大九天Liberal GT可将单元库特征化提取效率提高10X,同时为行业在功耗控制与空间节省上提供更优解决方案。

一套先进工艺的工艺库,采用传统CPU的方式进行单元库特征化提取,如果一个月完成,需要20,000个CPU,连续不间断的每天工作24小时,30天消耗的CPU总小时数(CPU时)高达:2万*30天*24小时=1440万CPU时,对,你没有看错,0.14亿 CPU时;因此甚至企业需要建立大型数据中心。借助加速计算,现在仅需要使用192个GPU即可完成,即192个GPU可以取代原先2万个CPU的工作。而且耗电降低5X,空间降低5X。Liberal GT,既加快了研发速度,同时又降低了成本、空间要求和功耗。

这正是全球首款 GPU K库工具,华大九天Empyrean Liberal® GT产品。它通过集成基于 CPU-GPU 异构计算框架的 SPICE 仿真器 ALPS GT,将GPU的强大算力引入特征化提取领域,重新定义了K库的能效,为先进工艺高性能芯片赢得先机

半导体领先企业推进Liberal GT的发展


先进工艺下,晶体管规模呈指数级递增,设计复杂程度也与日俱增。标准单元库发挥着不可替代的基石作用,是组成数字集成电路的基本构件。对最终芯片的PPA(性能、功耗、面积)表现有重要影响。

然而,这块“基石”的构建过程——单元库特征化提取(Library Characterization,在不同PVT组合的条件下,对标准单元进行SPICE仿真,生成业界标准的.lib时序模型文件的过程),正逐渐成为制约先进工艺节点芯片设计效率的重大瓶颈。伴随PVT的组合数量爆发式增长,芯片设计中的单元类型与数量大幅增加,相关模型的复杂程度也随之急剧攀升。

这一切致使特征化提取所需的计算量呈几何级数增长。在传统设计流程里,完成一套完整的标准单元库特征化提取,耗时数周甚至数月已成为常态。这不仅延缓了芯片设计的整体进度,消耗着宝贵的研发窗口期,还增加了项目的迭代成本与风险。EDA行业迫切需要一场技术革新,以打破这一“时间困局”。

破局而出:Empyrean Liberal 单元库特征化解决方案

华大九天副总经理、EDA工程中心总经理董森华表示:“面对先进工艺单元库特征化挑战,华大九天推出了业界领先的单元库特征化提取和验证解决方案——Empyrean Liberal®。它并非单一的工具节点,而是一个覆盖’高精度提取 - AI 加速 - 质量验证’全流程的综合性平台,旨在为用户提供快速、精准且可靠的标准单元库时序和功耗模型生成能力。Liberal GT 是 Liberal 家族的核心成员,它通过集成基于 CPU-GPU 异构计算框架,以10X的提速能力,开启了 K 库效率的新纪元。 ”

核心引擎升级:Liberal GT 引爆K库速度革命

单元库特征化提取过程中的海量SPICE仿真,需要对单个cell调用数百万次计算任务,这与GPU的并行计算模型高度契合。Liberal GT敏锐地察觉到了这一点,通过与 CPU-GPU 异构计算的SPICE仿真器Empyrean ALPS® GT深度集成,将这一具有革命性的计算模式引入到了单元库特征化提取流程中。 这正是Liberal GT实现性能飞跃的底层逻辑。

Liberal GT 的技术革新主要体现在:
  • CPU-GPU 异构计算框架:Liberal GT不再单纯依赖CPU,而是将计算负载进行智能化分配,交由CPU和GPU共同承担。其中,CPU负责任务调度、逻辑控制以及部分不适宜并行处理的计算工作;而GPU则专注于执行海量的、可并行的SPICE仿真任务。二者分工明确、配合默契,将混合计算硬件的综合性能发挥到了极致。
  • 小任务并行化海量求解算法:鉴于单元库特征化提取中每个仿真任务计算量较小,但总任务量极为庞大的特性,Liberal GT研发出了创新的海量求解算法。该算法能够对成千上万个独立的仿真任务进行高效批处理与打包,一次性将其“输送”至GPU的数千个核心同时进行计算,从而最大程度地挖掘了GPU的并行计算潜力。
  • 高效的任务调度与资源管理机制:在异构计算环境下,高效调度任务、管理数据流转是决定最终效率的关键所在。Liberal GT具备智能的任务调度机制,能够实时监测CPU与GPU的负载状况,动态调整任务分配策略,减少数据传输延迟和计算等待时间,确保整个硬件系统以最高效率稳定运行。


性能飞跃:实测数据见证压倒性优势

在多个客户案例的测试中,Liberal GT呈现出了惊人的平均10X量级的性能提升:


640 (2).png


从图中可以发现,无论是对于CCS模型,还是更为复杂的LVF模型,Liberal GT均实现了近乎一个数量级的性能提升,最高加速比可达15.3倍!过去完成复杂的LVF K 库任务需要耗费近三天(69小时),如今仅需7个小时。在先进工艺里,面对上千个 cell,原本需通宵运行的任务,现在能在极短时间内完成为芯片设计企业带来了颠覆性的战略价值:

  • 支持更多PVT Corner:在相同的时间范围内,能够完成更多、更全面的PVT组合特征化提取,从而构建更为鲁棒、覆盖范围更广的单元库,有效降低流片风险。
  • 降低硬件成本:一台配备GPU的服务器所提供的K库“产能”,远远超过多台纯CPU服务器,显著提升了计算资源的投资回报率。
  • 促进设计优化与创新:设计人员可以更快地完成单元库特征化,从而支持更快速的设计迭代和PPA优化。
  • 加速产品上市TTM(Time To Market):设计团队能够更迅速地获取所需的标准单元库,进而缩短从前端到后端的整体设计周期。


全面与精准:速度之外,Liberal对质量的坚守

Liberal GT在追求极致速度的同时,始终未对精度和质量做出任何妥协,确保了所生成单元库具备签核级品质:

  • 全面的单元类型支持:无论是基础单元(如Inverter/Buffer/MUX/DFF等)、复杂单元(如多位触发器Multi-bit Flip-Flops、低功耗单元Low-power Cells),还是用户自定义的特殊单元,都能给予全面支持。
  • 先进的时序模型生成:完美支持NLDM/NLPM/CCS/CCSP/CCSN/LVF等全系列时序模型,尤其是对先进工艺节点签核极为关键的LVF模型,保障了时序分析精度。
  • 内置的质量验证流程:能够便捷地比较两个库之间的数据、属性和结构差异,对比CCS和NLDM数据精度,开展电压/温度敏感性分析,校验内插值精度等。


结语:拥抱算力新范式,筑牢坚实“芯”基石

Liberal GT创新性地采用CPU-GPU异构计算技术,成功突破了标准单元库特征化提取的瓶颈,将K库处理时间从以“月”为单位大幅压缩至以“天”为单位这并非仅仅是工具性能的简单线性提升,而是由算力革命所推动的设计方法学范式的重大转变。这种方法学的革新,为全球芯片设计者提供了稳固且敏捷的“基石”构建能力,助力他们在激烈的市场竞争中始终保持领先地位,为万物智联的数字世界注入核心动力。

发表于 8 小时前 | 显示全部楼层
国产K库这么牛了吗?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐 上一条 /2 下一条

手机版| 小黑屋| 关于我们| 联系我们| 隐私声明| EETOP 创芯网
( 京ICP备:10050787号 京公网安备:11010502037710 ) |网站地图

GMT+8, 2025-11-18 23:27 , Processed in 0.016159 second(s), 4 queries , Gzip On, Redis On.

eetop公众号 创芯大讲堂 创芯人才网
快速回复 返回顶部 返回列表