伪共享¶

可能的缓解措施¶

伪共享并不总是需要缓解。伪共享缓解措施应平衡性能提升与复杂性和空间消耗。有时，较低的性能是可以接受的，没有必要过度优化每个很少使用的数据结构或冷数据路径。

随着核心数量的增加，越来越多地看到伪共享损害性能的情况。由于这些不利影响，已经提出了各种子系统（如网络和内存管理）的许多补丁并已合并。一些常见的缓解措施（带有示例）是

将热全局数据分离到其自身的专用缓存行中，即使它只是一个 ‘short’ 类型。缺点是会消耗更多的内存、缓存行和 TLB 条目。
- 提交 91b6d3256356 (“net: cache align tcp_memory_allocated, tcp_sockets_allocated”)
重新组织数据结构，将相互干扰的成员分离到不同的缓存行中。一个缺点是它可能会引入其他成员的新伪共享。
- 提交 802f1d522d5f (“mm: page_counter: re-layout structure to reduce false sharing”)
尽可能用 ‘read’ 替换 ‘write’，尤其是在循环中。例如，对于一些全局变量，使用 compare(read)-then-write 代替无条件写入。例如，使用
```
if (!test_bit(XXX))
        set_bit(XXX);
```
代替直接 “set_bit(XXX);”，对于 atomic_t 数据也是如此
```
if (atomic_read(XXX) == AAA)
        atomic_set(XXX, BBB);
```
- 提交 7b1002f7cfe5 (“bcache: fixup bcache_dev_sectors_dirty_add() multithreaded CPU false sharing”)
- 提交 292648ac5cf1 (“mm: gup: allow FOLL_PIN to scale in SMP”)
尽可能将热全局数据转换为 ‘per-cpu data + global data’，或合理地增加将 per-cpu 数据同步到全局数据的阈值，以减少或推迟对该全局数据的 ‘write’。
- 提交 520f897a3554 (“ext4: use percpu_counters for extent_status cache hits/misses”)
- 提交 56f3547bfa4d (“mm: adjust vm_committed_as_batch according to vm overcommit policy”)

当然，应仔细验证所有缓解措施，以避免产生副作用。为了在编码时避免引入伪共享，最好

最好添加注释说明伪共享的考虑。

需要注意的是，有时即使在检测到并解决了严重的伪共享之后，性能也可能没有明显的改善，因为热点会转移到新的位置。

一个悬而未决的问题是，内核有一个可选的数据结构随机化机制，该机制也会随机化数据成员之间缓存行共享的情况。