工具&环境:Windows + Visual Studio Community 2019 + 显卡Nvidia GTX1050ti(cuda_10.1) 通过算法、多进程、分布式计算加速简单运算、排序等操作。
包括普通算法
, openmp
, SSE
, 手写多线程
, 归并排序算法
,cuda显卡加速求和、求最值
等方式运算速度耗时对比, 于pdf文件中。
客户端,通过TCP/IP协议将数据发送给主机端进行协作计算。
主机端,通过TCP/IP协议接受Client端发来的数据,进行加速计算。
显卡加速求和、求最大值(并未融合入主从机端进行计算,因为将数据copy入显卡耗时太久,使得运算速度不升反降)