在每次的模型扩容期间,Aegaeon 使用自定义包装器类针对相关的 Python 类进行猴子补丁 MonkeyPatch,这些包装器类由自管理缓冲区进行分配和支持,这样一来让 Aegaeon 能够绕过张量…...
研究提出最新GPU池化系统Aegaeon,用token级别的自动扩缩容技术,硬是把GPU使用量从1192个“瘦身”到213个。 之前要同时运行这些模型时,要么给每个模型单独分配GP,很多冷门模型的GPU经常…...