腾讯推出了其大型语言模型(LLM)的升级版本,具有文本到图像生成功能,该模型对企业和个人开源。
据腾讯官方微信账号周二发布的声明称,腾讯开发的混元大语言基础模型在今年早些时候进行了重大升级,与之前的版本相比,整体性能提升了20%。腾讯云,该公司的云计算服务部门。
腾讯表示,最新的文本转图像功能采用了DiT模型架构,OpenAI的文本转视频工具Sora也采用了该架构。该公司补充说,其主要数据库是中文的,使该工具能够有效、准确地理解中文命令。
其文本到图像LLM的完整源代码已在美国开源平台Hugging Face和Github上发布,“以造福整个行业,并为下一代视觉生成构建开源生态系统”。
这意味着个人和企业都可以访问该程序的代码并修改或共享其设计、修复损坏的链接或扩展其功能。
自去年9月推出混元以来,腾讯已将其LLM整合到公司的各个业务部门,包括腾讯云、腾讯游戏和超级应用微信。该公司表示,该人工智能工具已提供给 20 多家媒体和广告公司,以方便他们的工作。
升级版本的发布是在微软支持的 OpenAI 推出其最新 GPT 模型 GPT-4o 的第二天,该模型能够跨文本、图像、视频和音频进行自然的人机交互。
开源技术在促进中国提升法学硕士水平、追赶OpenAI创新生成式人工智能工具的能力方面发挥了重要作用。
云计算部门阿里云已在 ModelScope 和 Hugging Face 上提供了对 76 个 Qwen 文本生成模型的访问。
它包括法学硕士的 720 亿参数和 18 亿参数版本。它还免费提供了另一种能够理解音频的模型。