mob next [ci-skip] [ci skip] [skip ci]
lastFile:vars/per-machine/vega/yggdrasil/privateKey/secret
This commit is contained in:
@@ -39,6 +39,8 @@
|
||||
"hadar"
|
||||
"procyon"
|
||||
"alasia"
|
||||
"rigel"
|
||||
"vega"
|
||||
];
|
||||
};
|
||||
|
||||
@@ -311,6 +313,71 @@
|
||||
'';
|
||||
};
|
||||
};
|
||||
|
||||
prometheus-monitoring = {
|
||||
module = {
|
||||
name = "prometheus";
|
||||
input = "self";
|
||||
};
|
||||
roles.server.machines."rigel".settings = {
|
||||
};
|
||||
roles.server.extraModules = [
|
||||
{
|
||||
services.prometheus = {
|
||||
rules = [
|
||||
(builtins.toJSON {
|
||||
groups = [
|
||||
{
|
||||
name = "default";
|
||||
rules = [
|
||||
{
|
||||
alert = "test";
|
||||
expr = ''up{instance!~"(nerr-.*|theatnerr-.*)",job!~"lab-.*|snmp-.*"} == 1'';
|
||||
for = "1m";
|
||||
annotations.summary = "{{ $labels.instance }} of job {{ $labels.job }} has been down for more than 5 minutes.";
|
||||
}
|
||||
];
|
||||
}
|
||||
];
|
||||
})
|
||||
];
|
||||
alertmanager = {
|
||||
enable = true;
|
||||
configuration = {
|
||||
global = {
|
||||
resolve_timeout = "5m";
|
||||
};
|
||||
route.receiver = "uptime-kuma";
|
||||
receivers = [
|
||||
{
|
||||
name = "uptime-kuma";
|
||||
webhook_configs = [
|
||||
{
|
||||
url = "https://uptime.b4l.co.th/api/push/$${KUMA_TOKEN}?status=up&msg=OK&ping=";
|
||||
send_resolved = true;
|
||||
}
|
||||
];
|
||||
}
|
||||
];
|
||||
};
|
||||
};
|
||||
alertmanagers = [
|
||||
{
|
||||
scheme = "http";
|
||||
path_prefix = "/";
|
||||
static_configs = [ { targets = [ "localhost:9093" ]; } ];
|
||||
}
|
||||
];
|
||||
};
|
||||
}
|
||||
];
|
||||
|
||||
roles.nodes.machines = {
|
||||
vega.settings = {
|
||||
exporters.smartctl = { };
|
||||
};
|
||||
};
|
||||
};
|
||||
};
|
||||
};
|
||||
};
|
||||
|
||||
Reference in New Issue
Block a user