Skip to content

SysuMatrixDL/worker

Repository files navigation

SysuMatrixDL 的工作节点

在 root 权限下运行启动脚本

sudo bash start.sh

注意 controler 节点需要能够 ssh 公钥连接所有的 worker 节点

bind_port.py 需要放在 Worker 节点的 /root/.matrixdl 文件夹下,将由 Control 节点调用

caddy 服务

grafana 服务

该服务需要在 worker 节点上运行,包含 open-gauss 和 grafana 两个容器

开发中,请运行 pip install -r requirements.txt

数据库

open-gauss 数据库基于 https://github.com/xy3xy3/openeuler-openGauss-docker-forstudy 构建

获取数据库初始数据卷

sudo docker run -d --name temp-opengauss xy3666/opengauss:6.0.0-openEuler
sudo docker cp temp-opengauss:/opt/openGauss/data ./dbdata
sudo docker stop temp-opengauss
sudo docker rm temp-opengauss
sudo chmod -R 700 ./dbdata
sudo chown -R 1000:1000 ./dbdata

打包保存数据卷配置

tar -zcvf dbdata.tar.gz ./dbdata

数据库初始化建表语句

CREATE Table gauge (
    t DATE,
    cpu float(30),
    mem float(30),
    gpu_load float(30),
    gpu_mem float(30)
);

CREATE TABLE memory (
    t DATE,
    total float(30),
    used float(30)
);

CREATE TABLE gpumem (
    t DATE,
    total float(30),
    used float(30)
);

CREATE TABLE diskio (
    t DATE,
    read_rate float(30),
    write_rate float(30)
);

CREATE TABLE netio (
    t DATE,
    send_rate float(30),
    recv_rate float(30)
);

About

Worker机器上需要运行的服务

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published