字节跳动发布豆包·图生图模型 豆包大模型日均tokens使用量超5000亿

来源:互联网 更新时间2024-07-26 09:39:40 点击数:

7月25日,火山引擎在成都举办了2024AI 创新巡展。火山引擎宣布其豆包大模型日均tokens使用量已超过5000亿,平均每家企业客户日均tokens使用量自5月15日模型发布以来增长了22倍。火山引擎副总裁张鑫表示,火山引擎正在向更智能化、行业化和区域化方向发展,并通过行业方案、产品和优化服务,助力企业实现业务创新。

2024060309311804730.jpg

在会上,火山引擎发布了豆包大模型的最新能力,包括视觉图像、语音合成、声音复刻等方面的升级。豆包·图生图模型和豆包·文生图模型在保留原图特征和提升画面质感方面表现突出。豆包·语音合成模型和豆包·声音复刻模型则在表达情绪和还原说话人声音特征方面有所提升。

  1. 豆包·图生图模型:不仅能高度保留原图的人物轮廓、表情、空间结构等多维特征,还支持50余种不同风格,支持图片扩展、局部重绘和涂抹玩法,让图片进行创意延展。现已应用于抖音、剪映、豆包、星绘等应用,并已服务于三星、努比亚等企业,涵盖了手机相册、工具助手、电商营销、广告投放等多个领域。

  2. 豆包·文生图模型:深度理解多数量主体、主客体关系、人物构造、空间构造等信息,图文匹配更精准;更善于从光影明暗、氛围色彩和人物美感三个方向提升画面质感;优化中国特色内容,能够对中国人物、物品、朝代、地理、美食、节日等进行细分理解。

  3. 豆包·语音合成模型:能深度理解故事情节和人物角色,正确表达情绪;保留吞音、口音等发音习惯,媲美真人音色,让发声更自然;26个精品超自然音色,满足多种场景需要。

  4. 豆包·声音复刻模型:仅需5秒即可复制一个高保真音色,高度还原说话人声音特征和口音,支持跨6大语种迁移,发音更接近于当地人表达。

同时,火山方舟提供核心插件和智能体能力,以及全周期数据安全可信方案,帮助企业便捷落地大模型。头条抖音同款三大插件升级,并新增网页解析插件和计算器插件,支持企业多样的应用需求。火山引擎提供扣子专业版,支持低代码构建契合企业业务场景的专家型“AI Bot”。

火山引擎还打造了HiAgent企业专属AI应用创新平台,帮助企业打通拥抱大模型的最后一公里。HiAgent从速度、密度、厚度三个维度全方位赋能企业AI应用的快速落地与持续优化。火山引擎AI全栈云依托字节跳动的海量资源共池,支持多芯、多云架构,提供超大规模算力,支持万卡集群组网、万亿参数MoE大模型。


Tag: 大模型
首页 AI对话 资讯 我的