DeepSeek V3

DeepSeek V3 模型文件在 MLX LM 中约为 450 行代码。包括管道并行等所有内容。

了解其工作原理的好方法。Image description![Image description](https://s.rmimg.com/2025-01-29/1738106644-640269-giwtjlhbiaadoxt.jpg)
https://github.com/ml-explore/mlx-examples/blob/main/llms/mlx_lm/models/deepseek_v3.py

网路上的 被打了