CPU内部结构窥探·「7」--ARMv8架构中的缓存机制

avatar
作者
筋斗云
阅读量:0

浅析ARMv8架构中的缓存机制

在现代计算机体系结构中,缓存(Cache)是提高系统性能的关键组件之一。对于ARMv8架构来说,缓存的设计和管理至关重要。本文将详细介绍ARMv8架构中的缓存机制,包括其结构、工作原理、缓存一致性和缓存管理策略等内容,力求通俗易懂。

一、缓存的基本概念

1.1 什么是缓存

缓存是位于CPU与主存(DRAM)之间的小而快速的存储器,CPU处理器运行速度非常快,而主存(RAM)的速度相对较慢,因为缓存的访问速度远高于主存,为了让CPU不会因等待数据而停顿,缓存充当了一个快速的临时存储器,存储CPU最常用的数据,可以显著降低CPU访问数据的延迟,提高系统的整体性能。
如下图,是arm core访问数据的过程,arm core发起数据访问指令,经过mmu,会现在cache中查找是否存在,如果存在则为cache hit,如果不存在再继续再main memory中查找,并将其加载进cache。
在这里插入图片描述

1.2 缓存的层次结构

缓存通常分为多个层次,包括一级缓存(L1 Cache)、二级缓存(L2 Cache)和三级缓存(L3 Cache)。每一层缓存都有不同的大小和速度,以平衡成本和性能:

  • 如下图,一般cpu内部会存在多个cluster,每个core一般都有独立的L1 Cache,且会分Dcache和Icache
  • cluster内部的多个core之间,可以通过L2 Cache共享资源。
  • cpu内部的多个cluster之间,可以通过L3 Cache共享资源。
    在这里插入图片描述

二、Cache结构

Cache是由Cache控制器和Cache存储器组成:

  • Cache控制器:通过使用处理器提供的地址,选择Cache存储器中的内容。
  • Cache存储器:专用的存储器阵列,其访问单元为cache line。
  • 写缓冲器:容量非常小的高速FIFO存储缓冲器,用来临时存放处理器将要写入内存中的数据。

三、缓存工作原理

3.1 缓存如何工作

缓存的基本工作原理可以概括为以下几点:

  1. 缓存命中:如果CPU需要的数据已经在缓存中,称为缓存命中,数据直接从缓存读取。
  2. 缓存未命中:如果CPU需要的数据不在缓存中,称为缓存未命中,数据需要从主存读取并加载到缓存中。

3.2 缓存一致性

在多处理器系统中,多个CPU可能同时访问和修改相同的内存数据,这时需要确保所有处理器看到的数据是一致的。ARMv8使用缓存一致性协议(如MESI协议)来解决这个问题。

  • M(修改):缓存行已被修改,与主存中的内容不一致,且仅存在于当前缓存。
  • E(独占):缓存行与主存内容一致,且仅存在于当前缓存。
  • S(共享):缓存行与主存内容一致,且可能存在于多个缓存中。
  • I(无效):缓存行无效。

3.3 缓存协同

ARMv8架构支持多种缓存协同操作,如:

  • Cache Line Fill:当缓存未命中时,从主存加载数据到缓存中。
  • Write-Through:写操作同时更新缓存和主存,保证一致性。
  • Write-Back:写操作只更新缓存,当缓存行被替换时,再写回主存。

四、缓存管理策略

4.1 替换策略

当缓存已满,需要将旧的数据替换掉以存储新数据。常见的替换策略包括:

  • LRU(Least Recently Used):替换最近最少使用的缓存行。
  • Random:随机选择缓存行进行替换。
  • FIFO(First In First Out):替换最早进入缓存的缓存行。

4.2 写策略

缓存的写策略决定了数据写入缓存和主存的时机。主要有两种:

  • Write-Through:每次写操作都同时更新缓存和主存,保证数据一致性,但性能较低。
  • Write-Back:写操作只更新缓存,减少主存写操作的频率,提高性能,只有当缓存行被替换时才写回主存。

4.3 缓存预取

缓存预取是指在数据实际需要之前,将其加载到缓存中。ARMv8支持多种预取机制:

  • 静态预取:编译器在编译时插入预取指令。
  • 动态预取:硬件动态检测访问模式并自动预取数据。

    广告一刻

    为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!