AI基础设施服务旨在提供高性能的计算资源,为各种人工智能应用提供了必要的基础设施,同时注重数据和计算过程的安全性以及整体的成本效益,让用户能够以合理的价格获得所需的计算能力。并且提供对国产化算力资源的测试、适配、纳管,以及昇腾迁移调优、算子开发等工作,促进国产化AI技术应用落地。
根据客户实际情况做迁移评估,设计完整的昇腾云迁移适配部署方案,基于昇腾NPU搭建模型/应用能够直接运行的环境。
将GPU/CPU上的模型迁移至昇腾NPU,使其能够使用昇腾硬件进行加速训练及推理部署。
基于小模型的昇腾迁移,将模型在训练、推理运行过程中遇到的精度、性能等问题进行优化。
基于昇腾NPU实现自定义算子开发、张量分解融合、算子融合等优化,使其能够满足整网性能及精度要求。