阅读量:0
目录
HDFS (Hadoop Distributed File System) 高可用性
2. YARN (Yet Another Resource Negotiator) 高可用性
6.海豚调度器(DolphinScheduler)分布式部署和高可用
背景
在一些安全要求高的行业,例如公安行业、电力、军事,要求大数据平台、离线数仓和实时数仓都在内网环境运行,不能通过网络远程运维。
一、影响因素
(一)硬件方面
服务器硬件故障
- 磁盘损坏:可能导致数据丢失、读写错误,影响任务的正常执行。
- 内存故障:会造成数据处理过程中的内存溢出,导致任务失败。
资源不足
- CPU 性能瓶颈:当处理复杂的计算任务时,CPU 计算能力不足会导致任务处理速度缓慢。
- 内存不足:无法容纳大量的数据进行处理,可能导致数据交换频繁,降低系统性能。
- 磁盘空间不足:无法存储新增的数据,影响数据的写入和读取。