DeepSeek开源第一弹!发布了开源代码库FlashMLA,这是专为英伟达Hopper架构GPU打造的高效MLA(Multi-head Latent Attention)解码内核,开源1小时,斩获2.1k Star。 华夏中医人 来源 :智东西
请登录之后再进行评论
请登录之后再进行评论