技术手段助大模型成本“瘦身”

作者： admin来源：本站时间：2024-05-17

↓↓↓点击下方联系咨询↓↓↓

点我联系WhatsApp：+852 60719134

Duan-Sms是用于2-3-4-5G网络的伪基站设备，我司拥有22年专业定制生产全球短信基站的生产厂家，可按需定制，满足各行各业的活动营销需求，目前已合作马来西亚、泰国、越南、菲律宾、柬埔寨、美国、英国、加拿大、日本、阿联酋、巴西、非洲等30余国家，一次购买，即可享短信终身免费服务。本产品不出售中国大陆地区！！！

原标题：技术手段助大模型成本“瘦身”

“降价的基本逻辑是，我们有信心用技术手段降低成本，市场也需要更低价的大模型。”5月15日，字节跳动豆包大模型在火山引擎原动力大会上发布，火山引擎总裁谭待在公布豆包大模型定价时如是说。

豆包大模型的超低价格引起业内关注。据悉，豆包主力模型的推理输入价格只有0.0008元/千Tokens（数据中的基本单元），比行业价格便宜99.3%。对此，谭待坦言：“降价是用技术优化成本来实现的。如果只是补贴，用亏损换收入是不可持续的，我们不会走这条路。”

对大模型推理成本的优化，可通过很多技术手段实现。首先是模型本身，模型结构、训练方法都可以持续改进，包括业界很关注的MoE（混合专家模型），就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大，优化推理成本的空间也越大。以前的模型都是单机推理，大模型用的是分布式推理。所以如果能把各种各样的底层算力用得更好，推理成本就会大大降低。

谭待表示，豆包大模型平均每天处理1200亿Tokens文本、生成3000万张图片，不同任务有不同的负载，可以把它们混合在一起，通过智能调度提高它们的利用率，就能极大地提升资源利用率，实现整体成本的优化。

“大的使用量，才能打磨出好模型，大幅降低模型推理的单位成本。”谭待拿字节跳动内部业务举例，飞书的主要流量高峰在工作时间，抖音在下班后休闲时间的流量更高，这些不同业务的大模型推理，也能根据业务特点错峰使用，降低成本。

豆包大模型原名“云雀”，是国内首批通过算法备案的大模型之一。字节跳动基于豆包大模型打造了AI对话助手“豆包”、AI应用开发平台“扣子”、互动娱乐应用“猫箱”，以及星绘、即梦等AI创作工具，并把大模型接入抖音、番茄小说、飞书、巨量引擎等50余个业务，用以提升效率和优化产品体验。

大模型从以分计价到以厘计价，将助力企业以更低成本加速业务创新。“比如一个人现在要创业，如果要花1万元钱调用大模型，可能会觉得有点贵。我们把价格降到1%都不到，相当于花100元钱，就能把大模型用起来，相关想法也就更容易得到尝试。”谭待表示，企业的AI转型充满不确定性，试错成本要尽量低，才能更快更多地实现大模型的应用落地，从而让整个行业受益。

4G伪基站购买

联系我们

新闻资讯

技术手段助大模型成本“瘦身”

最新资讯