腾讯(00700.HK) -16.500 (-2.957%) 沽空 $19.17亿; 比率 7.842% 旗下大语言模型腾讯混元AI Infra团队宣布,推出开源生产级高性能LLM推理核心算子库HPC-Ops,基於生产环境痛点,采用CUDA和CuTe从零构建,通过抽象化工程架构、微架构深度适配及指令级极致优化等,降低底层算子开发门槛,将核心算子性能逼近硬件高峰,实现性能突破。
在真实场景下,基於HPC-Ops,混元模型推理QPM提升30%,DeepSeek模型QPM提升17%。同时,在单算子性能方面,HPC-Ops实现Attention相比FlashInfer / FlashAttention最高提升2.22 倍;GroupGEMM相比 DeepGEMM最高提升1.88倍;FusedMoE相比TensorRT-LLM最高提升1.49倍。(jl/w)(港股报价延迟最少十五分钟。沽空资料截至 2026-02-05 12:25。)
相关内容《大行》花旗:中国网络游戏股遭抛售并不合理 重申对腾讯(00700.HK)等「买入」评级
AASTOCKS新闻