基数估计的黑魔法:HyperLogLog 原理与实现

本文深入浅出地解析了 HyperLogLog算法的核心原理。从“抛硬币”的直觉出发,揭示了如何利用哈希比特流中的极端观测值推断海量数据的基数。并提供了一套基于 C 语言的实现方案。展示了如何通过严谨的数学模型,在极低内存下实现十亿级数据的高精度估算。

如何使用Scala的ClassTag

本文通过一个经典的 Map[String, Any] 类型转换场景,深入探讨 Scala 中 ClassTag 的必要性。文章通过三个迭代方案,演示了如何从脆弱的 asInstanceOf 逐步进化到利用 ClassTag 绕过 JVM 类型擦除,实现运行时的类型安全检查。