(图片来源:金桂财经编辑拍摄)
国内 AI Infra(大模型基础设施) 层算力公司最大的单笔融资记录诞生。
金桂财经获悉,9 月 2 日,AI Infra 算力公司无问芯穹 (Infinigence AI) 今天宣布完成近 5 亿元 A 轮融资,本轮融资联合领投方为社保基金中关村自主创新专项基金 (君联资本担任管理人)、启明创投和洪泰基金,跟投方包括联想创投、小米、软通高科等战略投资方,国开科创、上海人工智能产业投资基金 (临港科创投担任管理人)、徐汇科创投等国资基金,以及顺为资本、达晨财智、德同资本、尚势资本、森若玉坤、申万宏源、正景资本等财务机构,共计超过 16 家机构。
至此,在成立短短 16 个月内,无问芯穹累计已完成近 10 亿元融资。无问芯穹的过往投资方还包括百度、智谱、同歌创投等战略股东,以及红杉中国、砺思资本、徐汇资本、北极光创投、真格基金、惠隆创投、经纬创投、无限基金 SEE Fund、金沙江创投、星连资本、绿洲资本、南山资本、光源资本、七熹投资等众多知名投资机构。
无问芯穹表示,本轮募集的资金将用于加强技术人才吸纳与技术研发,保持软硬协同、多元异构的技术领先优势;深入推动产品商业化发展,保持 Infini-AI 异构云平台产品与市场间的紧密嵌合;强化生态合作,激活异构集群算力资源,构建支撑 「M 种模型」 和 「N 种芯片」 的 AI 算力底座,做 AI 模型算力的 「超级放大器」,致力于成为大模型时代首选的 「算力运营商」。
据悉,无问芯穹成立于 2023 年 5 月,创始团队来自清华大学电子工程系,致力于成为大模型落地过程中的"M×N"中间层,以打造大模型软硬件一体化方案,链接上下游,建立 AGI(通用人工智能) 时代大模型基础设施。
所谓 AI Infra,是指构建 AI 所需的基础设施,涵盖连接算力和应用的 AI 中间层基础设施,包括数据准备、模型训练、模型部署和应用整合等环节。它不仅与算力相关,还包括大数据层面的优化。AI Infra 包括 AI 基础框架技术,涉及大模型训练、部署领域的各种底层设施,以及基础软件栈等核心组成部分,主要目标是优化算力算法、促进应用落地。而 AI Infra 在 AI 行业中扮演着连接硬件、软件和应用的关键角色,促进了 AI 技术的发展和应用。
无问芯穹发起人是清华大学电子工程系教授、系主任,国家自然科学基金杰出青年基金获得者汪玉教授。
无问芯穹联合创始人、CEO 夏立雪博士,于 2018 年在清华大学电子工程系获得工学博士学位,于 2013 年在清华大学电子工程系获得工学学士学位。此外,他还于 2017 年 1 月至 6 月赴杜克大学进行为期半年的访问学者。夏立雪的研究内容为深度学习算法的硬件设计优化,关注层次主要包括算法层的模型压缩、软件层的算法编译优化、以及面向新兴存储计算元件 RRAM 的深度学习计算平台体系结构和容错方法研究等。
夏立雪曾表示,算力不足仍然是制约通用人工智能发展的重要因素。GPU Utils 的一份数据显示,全球目前 H100 等效算力的供给缺口达到 43 万张。在解决算力不足的问题上,除了抢购和囤积英伟达,更多的方案正在浮出水面。
无问芯穹依托软硬协同、多元异构技术优势,已基于多元芯片算力底座打造出 Infini-AI 异构云平台。该平台向下兼容多元异构算力芯片,可有效激活全国各地异构算力,现已运营的算力覆盖全国 15 座城市。此外,Infini-AI 异构云平台还包含一站式 AI 平台 (AIStudio) 和大模型服务平台 (GenStudio)。
其中,AIStudio 一站式 AI 平台为机器学习开发者提供高性价比的开发调试、分布式训练与高性能推理工具,覆盖从数据托管、代码开发、模型训练、模型部署的全生命周期。GenStudio 大模型服务平台则为大模型应用开发者提供高性能、易上手、安全可靠的多场景大模型服务,全面覆盖了从大模型开发到服务化部署的全流程,有效降低了开发成本和门槛。
据去年 7 月公开信息,利用无问芯穹平台设施,推理成本、微调成本、人力成本均有望降低 10 倍以上,同时文本长度也会增加 10 倍以上。
今年 7 月,无问芯穹在多元异构算力适配方面发布大规模异构分布式混合训练系统 HETHUB,也是业内首次在六种芯片、「4+2」 组合间 (天数智芯、沐曦、摩尔线程、AMD、NVIDIA 等),实现了千卡规模的异构算力混合训练,集群算力利用率最高达到 97.6%,平均高出基准方案约 30%。
自平台上线以来,已有 Kimi、LiblibAI、猎聘、生数科技、智谱 AI 等多个大模型行业头部客户在 Infini-AI 异构云平台上稳定使用异构算力。
截至目前,无问芯穹旗下平台已支持了 Baichuan2、ChatGLM3、Llama2、Qwen 系列等超过 20 个模型,以及 AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、NVIDIA 等 10 余种计算卡,支持多模型与多芯片之间的软硬件联合优化和统一部署。
此外,目前,无问芯穹已研发出全球首个基于 FPGA(现场可编程逻辑门阵列) 的大模型处理器,称其为无穹 LPU,通过大模型高效压缩的软硬件协同优化技术,使得 LLaMA2-7B 模型的 FPGA 部署成本从 4 块卡减少至 1 块卡,并且性价比与能效比均高于同等工艺 GPU,即展示 「一张卡跑大模型」。预计无穹 LPU 将于 2025 年发布。
无问芯穹背后的投资方非常强大,红杉中国、启明创投、联想创投、小米、百度、智谱、真格基金,以及张颖的经纬创投、朱啸虎的金沙江创投等知名基金机构都有参与其中。
对此,无问芯穹联合创始人、CEO 夏立雪表示:「感谢多方资本对无问芯穹的青睐,让我们在 『天时、地利、人和』 的创业征途上多了一份不负厚望的笃定。AI 2.0 浪潮带来的新 『二八定律』,Transformer 架构统一了新的技术范式,意味着只需解决 20% 的关键技术问题即可支撑 80% 的垂直场景泛化,给软硬件联合优化技术的标准化和规模化提供了难得的机遇;中国算力生态正面临的供需矛盾以及资源分布不均的现状,为我们拉动上下游协力实现多元异构算力的高效整合创造了时代机遇;而我们源于清华电子系的深厚底蕴、十余年的技术积累和丰富的产业经验所形成的产研结合的 『复合型』 团队,更成为 AI 领域的人才 『引力井』,构成了无问芯穹独特的人才竞争力。」
无问芯穹强调,通过激活多元异构算力和软硬件联合优化,无问芯穹目标让大模型的落地成本降低 10000 倍,如同 「水电煤」 一般,成为行业触手可及、广泛受益的新质生产力,加速 AGI 的普惠进程。
针对本轮融资,君联资本总裁李家庆表示:「君联资本秉承 『事为先,人为重』 的投资哲学支持科技企业,推动科技进步和产业发展。AI 基础设施是国家人工智能战略的关键组成部分,君联资本始终对该领域密切关注。君联认为,无问芯穹拥有一支行业稀缺且具有深厚学术积淀和丰富产业经验的 『复合型』 队伍,以行业独有的大规模异构算力软硬联合优化技术,极大地推动了国产异构算力生态发展,构建中国本土化 AI 基础设施竞争力。此次通过社保基金中关村自主创新专项基金 (君联资本担任管理人) 投资无问芯穹,是君联资本在人工智能领域的重要布局,我们深感荣幸能够参与无问的成长过程,与无问芯穹团队紧密合作,助力一家具有核心技术、深度服务市场需求的企业一路成长。」
启明创投主管合伙人周志峰表示:「启明创投在科技领域始终坚持 『快半步』 的投资理念,即预判趋势、提前布局。无问芯穹是行业少有对 AI 基础设施的发展脉络和行业格局拥有先见性和敏锐性的企业,在 AI 2.0 时代基于 『推理加速、多元异构』 的核心能力,快速实现了核心技术的价值转化,为芯片硬件、智算中心、大模型和 AI 应用等产业上下游的每一个环节都提供了多快好省的解决方案,为大模型的降本增效带来更好的效果,在技术、产品和商业模式上都具有独到优势。启明创投坚信,无问芯穹是一家能够创造行业拐点的企业,将在 AI 2.0 的时代浪潮中驭浪而行。」
洪泰基金执行董事虞扬表示:「无问芯穹是我们在生成式 AI 领域的战略布局。自 Transformer 架构统一了模型结构以来,全球算力需求剧增,而硬件性能的提升速度却难以匹配计算需求的增长速度,使开发者受限于高昂的推理成本。在中国,算力异构问题以及不同硬件结构和软件的差异性给用户带来了更多挑战。无问芯穹打造了 AI 2.0 时代的异构云平台,统一了异构芯片与算法框架之间的接口,并在云端构建了一系列经过软硬件优化的中间件,实现了行业 SOTA 的性能表现。团队自创立以来一直专注于计算效率提升,并具备全栈技术能力,未来我们坚信无问芯穹能够构建最出色的 AI Native 基础设施。」
(金桂财经,作者|林志佳,编辑|胡润峰)