在线咨询
eetop公众号 创芯大讲堂 创芯人才网
切换到宽版

EETOP 创芯网论坛 (原名:电子顶级开发网)

手机号码,快捷登录

手机号码,快捷登录

找回密码

  登录   注册  

快捷导航
搜帖子
查看: 1452|回复: 0

[求助] 【已解决】各位大佬,在使用Calibre的时候都是怎么通过LSF提交任务的?

[复制链接]
发表于 2023-7-26 10:40:41 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

x
本帖最后由 kerwin.yin 于 2023-7-27 13:15 编辑

目前大家在使用的过程中都是通过Calibre -remotefile这种形式自己指定计算节点的,现在我想把calibre的任务全部转到LSF集群上去,通过LSF来调度,但是有个问题,我问Mentor的FAE,他回复说不管用什么HPC平台都必须使用remotefile,他们其他的客户是让LSF给写了一个专门把LSF调度之后的计算几点+core数量信息转换成remotefile的脚本。


我问我们LSF的FAE,他竟然说不会,没用过Calibre,我就自己用python写了一个,但是用脚本提交的任务一直在pend和run中无限循环。
不知道各位是怎么使用Calibre和LSF的
-----------------------------------------------------------分割线---------------------------------------------------------------------------------------------------

已解决。
分享一下,我脚本的功能。
通过命令提交calibre任务:命令如下:
bsub -q -normal -n 1000 -E "python calibre.py" calibre -drc -hier -turbo -remotefile remotefile test.drc

1、提交任务后, -E选项会,将python calibre.py设置为calibre -drc.......任务的前置任务,需要先完成-E内的任务才会执行calibre任务
2、calibre.py的功能是,当任务提交之后,LSF会根据你指定的core数量来分配资源,分配情况如下:举例1000 core
       100*hosta
       200*hostb
       300*hostc
       100*hostd
       300*hoste
3、脚本将以上信息获取后,生成remotefile,内容如下:
LAUNCH AUTOMATIC
REMOTE HOST hosta 100 MGC_HOME xxxxxxxx
REMOTE HOST hostb 200 MGC_HOME xxxxxxxx
REMOTE HOST hostc 300 MGC_HOME xxxxxxxx
REMOTE HOST hostd 100 MGC_HOME xxxxxxxx
REMOTE HOST hoste 300 MGC_HOME xxxxxxxx
4、-E的前置任务结束后,就可以在LSF分配的计算节点执行calibre任务了。

总结:脚本的功能就是根据LSF调度信息自动生成remotefile文件。

目前还是一个比较low的雏形,还有很多亟待改进。好在,任务已经能跑起来了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐 上一条 /1 下一条


小黑屋| 手机版| 关于我们| 联系我们| 在线咨询| 隐私声明| EETOP 创芯网
( 京ICP备:10050787号 京公网安备:11010502037710 )

GMT+8, 2024-11-15 09:52 , Processed in 0.012174 second(s), 6 queries , Gzip On, Redis On.

eetop公众号 创芯大讲堂 创芯人才网
快速回复 返回顶部 返回列表