在昨日的火山引擎 Force 大会上,字节跳动宣布推出了豆包视觉理解模型,标志着该公司在人工智能领域的一个重要突破。这一全新的大模型系统不仅为企业提供了强大的多模态能力,还以令人惊讶的低价格吸引了广泛的关注。据悉,豆包模型的千tokens输入价格仅为3厘,相比行业普遍定价便宜了85%,一元钱就能处理284张720P的图片,极大地降低了AI技术的使用成本。
对于这一定价策略,抖音集团副总裁李亮在社交平台上做出了解释。他强调,这并不是单纯的“价格战”,而是字节跳动通过技术创新实现了成本的大幅降低。通过在算法、软件工程和硬件方案上的持续优化,豆包大模型能够在确保性能的同时,以更低的成本提供服务。李亮表示,豆包模型的定价透明,采用的是“一步到位”的定价模式,而非传统的“刊例价+折扣”方式。字节跳动希望通过这一价格策略,让更多企业能够用得起AI技术,推动整个行业的普惠发展。
除视觉理解模型外,字节跳动在此次活动中还推出了豆包3D生成模型,并与火山引擎的数字孪生平台veOmniverse进行了深度结合。通过这一结合,企业和开发者可以进行智能训练、数据合成以及数字资产制作。官方称之为“一套支持AIGC创作的物理世界仿真模拟器”,为数字创作者提供了更多创作自由与技术支持。此举无疑为AI创作提供了更加广阔的空间,推动了数字内容创作的发展。
此外,豆包大模型的其他产品也得到了显著更新。豆包通用模型Pro已全面对齐GPT-4o,并且其使用价格仅为后者的1/8,极具竞争力。豆包音乐模型能够生成完整的三分钟音乐作品,为创作者提供了更多元化的创作工具。而文生图模型2.1版本则在精准生成汉字和P图方面做出了进一步的提升,已接入即梦AI和豆包App,扩展了应用场景和用户群体。