您的基础设施X射线愿景!
每个指标,每一秒钟。没有BS。
访问我们的主页
菜单:我们是谁|关键功能|入门|它如何工作|常见问题解答|文档|社区|贡献|执照
警告
人们沉迷于netdata 。一旦您在系统上使用它,就不会返回。
我们是谁
netdata是一个开源的实时基础架构监控平台。在您的整个基础架构上监视,检测和行动。
核心优势:
- 即时见解– 使用netdata ,您可以访问人均指标和可视化。
- 零配置– 您可以在没有复杂设置的情况下立即部署。
- ML驱动– 您可以检测异常,预测问题并自动分析。
- 高效– 您可以使用最少的资源使用率和最大可扩展性进行监视。
- 安全和分布式– 您可以在不需要中央集合的情况下保持数据本地。
使用netdata ,您将获得实时的每秒更新。清晰的见解一目了然,没有复杂性。
所有英雄的起源故事都很棒。单击以发现我们的。
2013年,在Costa Tsaousis成为COO的公司,其基于云的交易中很大一部分失败了,严重影响了业务绩效。
Costa和他的团队尝试了当时可用的所有故障排除工具。没有人可以识别根本原因。正如科斯塔后来写道的那样:
“我简直不敢相信监视系统提供的指标很少,并且分辨率如此之低,扩展如此糟糕,并且运行的成本如此之多。 ”
沮丧,他决定从头开始构建自己的监视工具。
这个决定导致无数深夜和周末。这也引发了基础架构监控和故障排除的根本转变,无论是在方法还是成本上。
最节能的监控工具
根据阿姆斯特丹大学的研究, netdata是监测基于Docker的系统的最节能的工具。该研究还表明,与其他监视解决方案相比, netdata在CPU使用,RAM使用和执行时间方面表现出色。
关键功能
| 特征 | 描述 | 是什么使它独一无二 |
|---|---|---|
| 即时的 | 每秒数据收集和处理 | 节拍工作 – 单击并立即查看结果 |
| 零配置 | 自动检测和发现 | 自动发现它运行的节点上的所有内容 |
| ML驱动 | 无监督的异常检测 | 在边缘训练每个指标的多个ML型号 |
| 长期保留 | 高性能存储 | 每个样品的〜0.5字节,带有分层存储用于存档 |
| 高级可视化 | 丰富的互动仪表板 | 切片和骰子数据没有查询语言 |
| 极端可扩展性 | 天然水平缩放 | 亲子的集中化数百万样品/s |
| 完全可见性 | 从基础架构到应用程序 | 简化操作并消除筒仓 |
| 基于边缘 | 在您的场所进行处理 | 分发代码而不是集中数据 |
笔记
是否想对netdata进行针对Prometheus的测试?探索完整的比较。
netdata生态系统
这个三部分的体系结构使您可以从单节节扩展到复杂的多云环境:
| 成分 | 描述 | 执照 |
|---|---|---|
| netdata代理 | •核心监控引擎 •处理集合,存储,ML,警报,出口 •在服务器,云,K8,IoT上运行 •零生产影响 |
GPL V3+ |
| netdata云 | •企业功能 •用户管理,RBAC,水平缩放 •集中警报 •自由社区层 •没有公制存储集中化 |
|
| netdata UI | •仪表板和可视化 •免费使用 •包括在标准软件包中 •CDN的最新版本 |
NCUL1 |
您可以监视什么
使用netdata您可以在平台上监视所有这些组件:
| 成分 | Linux | freebsd | macos | 视窗 |
|---|---|---|---|---|
|
系统资源 CPU,内存和系统共享资源 |
满的 | 是的 | 是的 | 是的 |
|
贮存 磁盘,安装点,文件系统,RAID数组 |
满的 | 是的 | 是的 | 是的 |
|
网络 网络接口,协议,防火墙等 |
满的 | 是的 | 是的 | 是的 |
|
硬件和传感器 风扇,温度,控制器,GPU等 |
满的 | 一些 | 一些 | 一些 |
|
O/S服务 资源,绩效和状态 |
是的 Systemd |
– | – | – |
|
过程 资源,性能,OOM等 |
是的 | 是的 | 是的 | 是的 |
| 系统和应用程序日志 | 是的 Systemd-Journal |
– | – | 是的 Windows事件日志,ETW |
|
网络连接 每个PID实时TCP和UDP插座 |
是的 | – | – | – |
|
容器 Docker/Contarterd,LXC/LXD,Kubernetes等 |
是的 | – | – | – |
|
VM (来自主机) KVM,Qemu,libvirt,Proxmox等 |
是的 cgroups |
– | – | 是的 Hyper-V |
|
合成检查 测试API,TCP端口,PING,证书等 |
是的 | 是的 | 是的 | 是的 |
|
包装应用 nginx,apache,Postgres,redis,mongodb, 还有数百个 |
是的 | 是的 | 是的 | 是的 |
|
云提供商基础架构 AWS,GCP,Azure等 |
是的 | 是的 | 是的 | 是的 |
|
自定义应用程序 OpenMetrics,StatsD和opentelemetry很快 |
是的 | 是的 | 是的 | 是的 |
在Linux上,您可以连续监视所有内核功能和硬件传感器的错误,包括Intel/AMD/NVIDIA GPU,PCI AER,RAM EDAC,IPMI,SMART,SMART,INTEL RAPL,NVME,NVME,粉丝,电源,电源和伏特读数。
入门
您可以在所有主要操作系统上安装netdata 。开始:
1。安装netdata
选择您的平台并遵循安装指南:
- Linux安装
- macos
- freebsd
- 视窗
- Docker指南
- Kubernetes设置
笔记
您可以通过http:// localhost:19999(或http:// node:19999如果远程)访问netdata UI。
2。配置收集器
netdata自动发现大多数指标,但是您可以手动配置某些收集器:
- 所有收藏家
- SNMP监视
3。配置警报
您可以使用数百个内置警报并与以下方式集成:
电子邮件,松弛,电报,Pagerduty,Discord,Microsoft团队等。
笔记
电子邮件警报默认情况下工作是否有配置的MTA。
4。配置父母
您可以将仪表板,警报和存储与netdata父母集中到集中:
- 流参考
笔记
您可以将netdata父母用于中央仪表板,更长的保留和警报配置。
5。连接到netdata云
登录到netdata Cloud,并将您的节点连接到以下方式:
- 从任何地方访问
- 水平可扩展性和多节点仪表板
- UI配置用于警报和数据收集
- 基于角色的访问控制
- 免费层
笔记
netdata Cloud是可选的。您的数据停留在基础架构中。
现场演示网站
请参阅netdata的行动
法兰克福|纽约|亚特兰大| Sanfrancisco |多伦多|新加坡|班加罗尔
这些演示簇以默认配置运行并显示真实的监视数据。
选择最接近您的实例以获得最佳性能。
它如何工作
使用netdata您可以运行模块化管道,以收集指标,处理和可视化。
流程图结核
[ netdata Agent] ::: mainnode
a1(collect)::: green-> a
A2(商店)::: green-> a
A3(Learn)::: green-> a
A4(检测)::: green-> a
a5(check)::: green-> a
a6(stream)::: green-> a
A7(存档)::: green-> a
A8(查询)::: green-> a
a9(得分)::: green-> a
classDef绿色填充:#BBF3BB,中风:#333,卒中宽度:1PX,颜色:#000
ClassDef主题填充:#F0F0F0,冲程:#333,卒中宽度:1PX,颜色:#333
加载中
对于每个代理商,您可以:
- 收集– 从系统,容器,应用程序,日志,API和合成检查中收集指标。
- 商店– 将指标保存到高效的分层时间序列数据库中。
- 学习– 使用最近的行为训练每个度量的ML模型。
- 检测– 使用训练有素的ML模型识别异常。
- 检查– 根据预设或自定义警报规则评估指标。
- 流– 实时将指标发送给netdata父母。
- 档案– 向普罗米修斯,infuxdb,opentsDB,石墨等出口指标。
- 查询– 通过API访问仪表板或第三方工具的指标。
- 得分– 使用评分引擎来查找跨指标的模式和相关性。
笔记
了解更多: netdata的体系结构
代理功能
使用netdata代理,您可以使用这些核心功能开箱即用:
| 能力 | 描述 |
|---|---|
| 综合收藏 | •800多个集成 •系统,容器,VM,硬件传感器 •OpenMetrics,StatsD和日志 •opentelemetry支持即将推出 |
| 性能和精度 | •每秒收藏 •使用1秒延迟的实时可视化 •高分辨率指标 |
| 基于边缘的ML | •在边缘训练的ML模型 •每个度量的自动异常检测 •基于历史行为的模式识别 |
| 高级日志管理 | •Direct Systemd-Journald和Windows事件日志集成 •边缘的过程日志 •丰富的日志可视化 |
| 可观察性管道 | •亲子关系 •灵活的集中化 •多层复制和保留 |
| 自动可视化 | •NIDL数据模型 •自动生成的仪表板 •无需查询语言 |
| 智能警报 | •预配置警报 •多个通知方法 •主动检测 |
| 维护低 | •自动检测 •零接触ML •简单的可伸缩性 •CI/CD友好 |
| 开放且可扩展 | •模块化体系结构 •易于自定义 •与现有工具集成 |
CNCF会员资格
netdata积极支持,并且是云本机计算基础(CNCF)的成员。
它是CNCF景观中最明星的项目之一。
常问问题
netdata安全吗?
是的。 netdata遵循OpenSSF的最佳实践,具有安全优先的设计,并经常受社区审核。
- 安全设计
- 安全政策和咨询
netdata是否使用大量资源?
否。即使使用ML和每秒指标, netdata也使用最少的资源。
- 在生产系统上默认情况下,〜5%CPU和150MIB RAM
- <1%CPU和〜100MIB RAM当禁用ML和警报并使用短暂存储
- 父母通过适当的硬件扩展到每秒数百万的指标
您可以使用仪表板中的netdata监视部分来检查其资源使用情况。
可以保留多少数据?
磁盘允许的尽可能多。
使用netdata ,您可以使用分层保留率:
- 第0层:每秒分辨率
- 第1级:每分钟分辨率
- 第2层:每小时分辨率
这些是根据变焦级别自动查询的。
netdata可以扩展到许多服务器吗?
是的。对于netdata ,您可以:
- 与许多代理商水平扩展
- 与强大的父母垂直扩展
- 通过netdata Cloud无限地扩展
您可以使用netdata Cloud将许多独立的基础架构合并为一个逻辑视图。
磁盘i/o是一个问题吗?
否netdata最小化磁盘的用法:
- 指标每17分钟被冲洗到磁盘,均匀分布
- 使用直接I/O和压缩(ZSTD)
- 可以完全在RAM中运行或向父母流
您可以使用Alloc或RAM模式进行无磁盘写入。
netdata与Prometheus + Grafana有何不同?
使用netdata您将获得完整的监视解决方案,而不仅仅是工具。
- 无需手动设置或仪表板
- 内置的ML,警报,仪表板和相关性
- 更有效,更易于部署
性能比较
netdata与商业SaaS工具有何不同?
使用netdata您可以将所有指标存储在基础架构上 – 无需采样,没有聚合,没有损失。
- 默认情况下高分辨率指标
- ML按指标,不是共享模型
- 无限的可伸缩性而无需飙升的成本
netdata可以与Nagios,Zabbix等一起运行吗?
是的。您可以将netdata与传统工具一起使用。
有了netdata您得到了:
- 实时高分辨率监控
- 零配置和自动生成的仪表板
- 异常检测和高级可视化
如果我感到不知所措怎么办?
您可以从小开始:
- 使用仪表板的目录和搜索
- 探索异常评分(“ AR”切换)
- 在netdata Cloud中创建自定义仪表板
文档和指南
我必须使用netdata Cloud吗?
否netdata是可选的。
netdata可以使用它,但是有了云,您可以:
- 与SSO远程访问
- 保存仪表板自定义
- 集中配置警报
- 与基于角色的访问合作
netdata收集了什么遥测?
匿名遥测有助于改善产品。您可以将其禁用:
- 在安装程序中添加 – 可限制的tememetry,或
- 创建 /etc / netdata /.opt-out-from-Anonymous statistics并重新启动netdata
遥测有助于我们了解使用情况,而不是跟踪用户。没有收集私人数据。
谁使用netdata ?
您将加入用户,包括:
- 主要公司(亚马逊,ABN AMRO银行,Facebook,Google,IBM,Intel,Netflix,Samsung)
- 大学(纽约大学,哥伦比亚,首尔国家,UCL)
- 全球政府组织
- 基础设施密集型组织
- 技术运营商
- 初创企业和自由职业者
- Sysadmins和DevOps专业人员
文档
请访问netdata学习完整的文档和指南。
笔记
包括部署,配置,警报,导出,故障排除等等。
?社区
加入netdata社区:
- 不和谐
- 论坛
- Github讨论
笔记
行为守则
关注我们:Twitter | reddit | YouTube | LinkedIn
贡献
我们欢迎您的贡献。
您帮助我们保持敏锐的方式:
- 分享最佳实践和监视见解
- 报告问题或缺失功能
- 改善文档
- 开发新的集成或收藏家
- 帮助用户在论坛和聊天中
笔记
贡献指南
执照
netdata生态系统包括:
- netdata代理– 开源核心(GPLV3+)。包括数据收集,存储,ML,警报,API和重新分配其他几种开源工具和库。
- netdata代理许可证
- netdata代理重新分配
-
netdata UI – 封闭消息,但可以免费与netdata代理和云一起使用。通过CDN交付。它集成了第三方开源组件。
- netdata Cloud UI许可证
- netdata UI第三方许可证
- netdata Cloud – 封闭消息,具有免费和付费层。添加远程访问,SSO,可扩展性。
