大模型晚报｜阿里云开源通义千问多模态大模型Qwen-VL-- 迪族网

大模型晚报｜阿里云开源通义千问多模态大模型Qwen-VL

来源：品玩　2023-08-26 05:44:24

大模型资讯：

阿里云开源通义千问多模态大模型Qwen-VL

(资料图片)

阿里云今天宣布推出开源大规模视觉语言模型Qwen-VL。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发，支持图文输入，具备多模态信息理解能力。

Qwen-VL是支持中英文等多种语言的视觉语言（Vision Language，VL）模型，相较于此前的VL模型，Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等能力。

在主流的多模态任务评测和多模态聊天能力评测中，Qwen-VL取得了远超同等规模通用模型的表现。

IBM将参与Hugging 亿美元D轮融资

IBM和开源人工智能平台Hugging Face周四联合宣布，前者参与了后者的亿美元的D轮融资。

这笔额外的资金将进一步加强Hugging Face作为领先的开源和开放科学人工智能平台的地位。IBM和Hugging Face最近宣布在IBM的生成式人工智能平台watsonx上展开合作，帮助企业构建、部署和定制跨多个领域的基础模型。

在watsonx中，人工智能构建者可以利用IBM和Hugging Face社区的模型，这些模型经过预先训练，可以支持一系列自然语言处理(NLP)任务，包括问题回答、内容生成和摘要、文本分类和提取。

AMD 收购 AI软件公司 Mipsology，将加强 AMD AI 软件开发能力

据 AMD 官网显示，AMD 宣布收购AI软件公司 Mipsology。

AMD 表示， Mipsology 的软件团队将加入 AMD AI Group，帮助进一步加快 AMD 的客户参与度并扩展 AMD的 AI 软件开发能力。该团队将帮助开发AMD完整的人工智能软件堆栈，扩展AMD的软件工具、库和模型的开放生态系统，为在 AMD 硬件上运行的人工智能模型的简化部署铺平道路。

Mipsology 成立于 2015 年，总部位于法国帕莱索。该公司主要开发针对 AMD 硬件量身定制的领先 AI 推理、优化解决方案和工具。

微软 Teams 引入 Typeface AI 工具，加强品牌营销内容

微软近日宣布，将为微软 Teams 加入 AI 工具 Typeface 。

据悉， Typeface 整合了Azure 机器学习、Azure OpenAI 服务和 Typeface 品牌个性化AI 的强大能力，可以用于创建创意简报、电子邮件营销活动以及多媒体在线广告等内容。用户可以在无须切换应用程序的情况下增强品牌内容。企业可以使用 Affinity AI 模式来训练 Typeface AI 应用程序，创建自己的专属内容。

Meta AI 公布开源基础模型 Code Llama，专攻代码生成

Meta AI近日发布论文，公布了一款针对代码生成功能的基础大语言模型 Code Llama。

据悉，Code Llama基于Llama 2开发，具有开放式模型中领先的性能、填充能力、对大型输入上下文的支持以及用于编程任务的零指令跟随能力。它提供包括基础模型、Python专用版本以及指令跟随模型等多个模型，每个模型的参数分别为7B、13B和34B。所有模型都是基于16k标记序列进行训练，并在最多100k标记输入上显示出改进。

Code Llama以宽松许可证方式开源，允许研究和商业使用。

奇安信发布Q-GPT安全机器人和大模型卫士

奇安信集团在京发布了Q-GPT（奇安信大模型）安全机器人和大模型卫士。

据介绍，Q-GPT安全机器人是基于奇安信大模型的“虚拟安全专家”，可以全天候工作。大模型卫士集安全风险发现、大模型访问控制、数据泄露管控、违法违规行为溯源等功能为一体。

会上，京东方集团和吉利集团等客户现场签约，成为国内首批Q-GPT安全机器人和安全大模型用户。

重点论文：

中国科学技术大学联手新加坡管理大学，推出图像生成模型CgT-GAN

据 Arxiv 页面显示，中国科学技术大学近日联手新加坡管理大学发布一款图像生成模型 CgT-Gan。

CgT-GAN通过将图像纳入训练过程，使模型能够“看到”真实的视觉模态。具体来说，研究团队采用对抗训练来教导CgT-GAN模型模仿外部文本语料库的短语，同时利用基于CLIP的奖励机制提供语义指导。

实验结果显示，CgT-GAN在所有指标上明显优于现有的方法。

论文地址：点此前往

关键词：