高效的推理框架:bitnet.cpp

微软开源了一个高效的推理框架:bitnet.cpp,可直接在 CPU 上运行 1-bit 模型推理(如 BitNet b1.58)。

提供多种优化内核,支持在 CPU 上实现快速无损推理,使模型速度提升 1.37-6.17 倍,同时能耗降低高达 82.2%,可在单 CPU 上运行 100B 规模模型。

GitHub:http://github.com/microsoft/BitNet

官方提供了 2B 参数模型可直接使用,支持多种 Hugging Face 上的 1-bit 模型。
Image description![Image description](https://s.rmimg.com/2025-04-22/1745283084-934578-image.png)

能不能做下llama.cpp的横向对比呀,单纯来说数值没啥概念

Image description</s>Image description<e>

有这样的一个说明