登 录
註 冊
论坛
微波仿真网
注册
登录论坛可查看更多信息
微波仿真论坛
>
CST 专区
>
CST
>
CST2013 GPU加速
发帖
回复
2109
阅读
3
回复
[运算]
CST2013 GPU加速
离线
控制初学者
UID :103844
注册:
2013-01-14
登录:
2014-08-20
发帖:
23
等级:
仿真新人
0楼
发表于: 2014-08-20 13:33:00
电脑显卡为 navida quadro Fx1800,想用一下GPU加速,仿真时报警说没有GPU derive,请问该驱动是CST的专用驱动还是navida官网上的一般驱动就可以,另外,navida上有一些驱动是certificated的, ..
U;WwEta ]
q`/J2r+O
未注册仅能浏览
部分内容
,查看
全部内容及附件
请先
登录
或
注册
共
条评分
离线
aeoliclee
UID :81603
注册:
2011-08-17
登录:
2018-08-26
发帖:
93
等级:
仿真二级
1楼
发表于: 2014-08-20 16:14:39
这个你要首先确定你的显卡是不是被CST支持硬件加速,
(^ EuF]
|} b+$J
据我所知,目前除了Tesla系列的显卡支持CST的GPU加速,其他的。。。好像不行吧。。。
`R8&(kQ
IB[$~sGe
除此之外,据我对特斯拉的GPU加速使用感觉,效果真的很一般。而且限制诸多,例如当你要计算的模型占用显存超过25%时,就会拒绝工作,告诉你只能用CPU算。
tj@(0}pi4
6EyPZ{
真实的使用体检就是当正常使用GPU加速时,CPU可以闲下来干点其他的事情,仅此而已。
e9KD mX_
Z)W8Of_
所以,能体验一下的话,就体验一下,别当真。。。
共
条评分
离线
hefang
本账号已冷冻,请勿发站内信或回帖,概不回复!
UID :24731
注册:
2009-01-19
登录:
2025-05-09
发帖:
9469
等级:
荣誉管理员
2楼
发表于: 2014-08-20 17:18:05
你的显卡不支持high performance computing。
njy2pDC@
)Fv.eIBY
请学会搜索旧帖或者官方信息。CST文档《GPU Computing Guide 2014》。
XA2Ld
Z;.-UXat
CST 2013支持Tesla K20和K10,CST 2013 SP5以上支持Tesla K40和Quadro K6000。向下兼容Tesla M2090 / M2075 / M2070 / M2050 / M1060 / C2075 / C2070 / C2050 / C1060,Quadro 6000 / FX5800 / Plex 2200D2。Tesla 8系列2014开始已经被淘汰。
~ 1h#
:G1ddb&0+
不知道1楼是怎么体验的,没听说过只工作在25%显存效率以下。1楼你确定你机器的内存够大?
p,fV .5q
^}=)jLS
在其它硬件配置相同的条件下(前提是硬件配置达到GPU加速的要求),1个GPU加速的效果应该至少是4-5倍。
/88s~=
K.)!qkW-%S
老板上周终于咬牙决定用GPU加速,除了从CST买9000欧的acceleration token,工作站也下单换新:E5-2650v2、32 GB 1866 MHz内存、Tesla K20加一块Quadro K600,再加上其它SSD、1000 W电源什么的总共£4595。CST用同样配置的机器benchmark了一下,比我现在用的HP ProLiant M350 G6 server (CPU: E5520)快了12倍!
共
条评分
版主周末都不回答问题?
版主要回答问题,你做到了吗?
hefang你是CST公司的吧,说点儿有用的!
你是做天线的吗?不懂不要说外行的话!
你要是不懂就shut up!
相信我,没有你论坛会更好。
离线
aeoliclee
UID :81603
注册:
2011-08-17
登录:
2018-08-26
发帖:
93
等级:
仿真二级
3楼
发表于: 2014-08-28 20:45:20
是啊,可能时间比较早,之前的CST版本对HPC的支持不够完善吧,我当时用的2010的版本,也大概是11年初的时候发现的这个问题,后来一年多也没改善。再往后的情况就不清楚
了。 内存够大,128GB,2070的显卡印象中。
-$d?e%}#
~MG6evm &
当时我们认为,当模型过大的情况下,一旦显存占满,内存占用超过25%的门限,GPU是拒绝使用更多的内存作为交换的。原因就是内存速度慢于显存。占用过多的内存作为交换空间会拖慢整体处理进度,反而不如使用CPU处理效率更高。现在的内存控制器都是集成在CPU内,如果不能在显存里直接调用数据,反而要通过总线到CPU到内存,再通过总线返回,这样的来回倒腾数据,本身就是一件费时费力的事情,还不如直接用CPU。
voa)V1A/]
b;i*}4h!
现在CST2013的版本和GPU驱动应该优化改进了不少吧,毕竟当我们也觉得通过GPU加速是个非常好的办法,只不过当时不成熟。
共
条评分
发帖
回复