在线咨询
eetop公众号 创芯大讲堂 创芯人才网
切换到宽版

EETOP 创芯网论坛 (原名:电子顶级开发网)

手机号码,快捷登录

手机号码,快捷登录

找回密码

  登录   注册  

快捷导航
搜帖子
查看: 2685|回复: 4

[求助] 多精度乘法器

[复制链接]
发表于 2020-12-3 19:47:43 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

x
GPU 可以支持多种精度的整数乘法,比如 32bit 的数,可以是一个 32bit 乘法,也可以是 2 个 16bit 乘法,或者是 4 个 8bit 乘法,求问有大佬知道这种多精度的乘法器有什么算法可以实现吗?搜了很久没找到相关的资料,我自己用低位宽移位拼接的方式发现消耗的总资源比直接例化多个乘法器还多。。。比如
2 个 8bit 乘法器 + 移位 + 加法器 > 2 个 8bit 乘法器 + 1 个 16bit 乘法器

难道 GPU 中是单纯的堆硬件,用了 7 个不同位宽的乘法器?谢谢~


发表于 2020-12-21 12:48:16 | 显示全部楼层
小的可以拼接为大的,你分解一下就知道了。
发表于 2020-12-21 13:05:04 | 显示全部楼层
牛逼,还做了DC综合,比较面积。可能的做法:
1):two 8bits multi == 1 8bit multi + 1 16bit multi。
2):designer深度优化multi内部的电路结构(自己实现booth encoding, wallace tree等),也许可以整合的更好。
 楼主| 发表于 2021-1-25 22:06:41 | 显示全部楼层


asic_service 发表于 2020-12-21 13:05
牛逼,还做了DC综合,比较面积。可能的做法:
1):two 8bits multi == 1 8bit multi + 1 16bit multi。
2 ...


方法一思路不错,还可以省一个 8bit 乘法器
我自己写的 booth radix-4 + wallace tree + CLA,单精度基本可以和 DC 的面积相同;本来想增加一些控制信号来兼容实现多精度,但是实际最终结果还是不如直接用 DesignWare : (
 楼主| 发表于 2021-1-25 22:08:39 | 显示全部楼层


asic_service 发表于 2020-12-21 13:05
牛逼,还做了DC综合,比较面积。可能的做法:
1):two 8bits multi == 1 8bit multi + 1 16bit multi。
2 ...


之前已经做过实验了,用小的拼接大的方式,花费在拼接上的资源很多,实际面积要差很多
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐 上一条 /2 下一条


小黑屋| 手机版| 关于我们| 联系我们| 在线咨询| 隐私声明| EETOP 创芯网
( 京ICP备:10050787号 京公网安备:11010502037710 )

GMT+8, 2024-11-23 02:34 , Processed in 0.016764 second(s), 8 queries , Gzip On, Redis On.

eetop公众号 创芯大讲堂 创芯人才网
快速回复 返回顶部 返回列表