OpenAI将发布开源大模型(open-weight)
OpenAI将发布开源大模型(open-weight),新模型的两大特点:开源和强化推理能力,这是自2019年GPT-2之后,OpenAI首次开源语言模型。Sam Altman直言“要让它变得非常、非常优秀”。
OpenAI将发布开源大模型(open-weight),新模型的两大特点:开源和强化推理能力,这是自2019年GPT-2之后,OpenAI首次开源语言模型。Sam Altman直言“要让它变得非常、非常优秀”。
当地时间3月25日,谷歌宣布推出“最智能的AI模型”Gemini 2.5系列,实验版Gemini 2.5 Pro是该系列上线的首款推理模型。据介绍,实验版Gemini 2.5 Pro是谷歌旗下最先进的复杂任务模型,展示了强大的推理和代码能力,并拥有Gemini系列此前各模型所具有的全部功能。目前,该模型已在Google AI Studio和Gemini应用程序中向Gemini Advanced的订阅用户开放,将很快登陆谷歌模型商店Vertex AI,并在未来几周内宣布公开定价,允许用户进行大规模商用。(澎湃新闻)
3月25日晚间消息,DeepSeek宣布V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。DeepSeek-V3-0324 API 接口和使用方式保持不变。如非复杂推理任务,建议使用新版本 V3 模型,即刻享受速度更加流畅、效果全面提升的对话体验。新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。
阿里巴巴开源了最新大模型QwQ-32B,并且支持Apache 2.0 开源协议可以商业化。根据阿里公布的测试数据显示,QwQ-32B在AIME24、LiveCodeBench、LiveBench、IFEval等主流测试基准中,可以媲美DeepSeek开源的R1-671B和OpenAI的o1-mini。但QwQ-32B只有320亿参数,而R1拥有6710亿参数,体量大降了20倍以上。在部署、推理效率、成本方面非常出色。
据The Information:微软已开始测试来自XAI、Meta和DeepSeek的模型,作为Copilot中潜在的OpenAI替代品。同时,微软也在开发内部人工智能推理模型,以与OpenAI竞争,并可能将其出售给开发者。
6月10日消息,根据微软必应官方发布的博文,经过过去一周的努力,必应聊天在桌面端的体验得到了一系列改进。本次改进主要集中在语音聊天方面,为用户提供更便捷的沟通方式。
据微软表示,许多用户喜欢在移动设备上使用语音输入来进行聊天。为了满足用户需求,微软将必应聊天的语音输入功能扩展到桌面端。现在,用户只需点击对话框中的麦克风按钮,即可在桌面端使用语音输入功能,轻松实现语音聊天。
6月9日,中国电科旗下电科太极在京正式发布生成式人工智能大模型产品“小可”,突出“行业化、专业化、国产化、私有化”特点,目前已推出拟文助手、编码助手、智能标绘等一系列智能应用。据介绍,“小可”适用于多个领域。在智慧政务方面,借助其专业化、私有化部署的特点,不仅能够解决政务外网需求,满足百姓政策查询、辅助办事等政府信息门户服务民生场景,还能够在保障信息安全的前提下,基于内网知识,加强对政务人员办公、办文、办事、办会的智能支撑能力;在智能制造方面,能够构建工厂一体化流转平台,打破工业控制、运行维护各个系统间数据和工序流转壁垒,实现岗位工人、产线设备、信息系统之间基于自然语言的交互,优化工厂自动化、数字化、智能化运作流程;在特种行业方面,借助其智能标绘、搜索整编等独有功能,可为特种场景任务实施人员提供助查、助记、助算等辅助决策支撑能力。
据钛媒体报道,华为公司将发布一款直接对标ChatGPT的多模态千亿级大模型产品,名为“盘古Chat”。据预计,华为盘古Chat将在下个月华为云开发者大会上对外发布以及内测,产品主要面向ToB/G政企端客户。7月7日,华为开发者大会2023(Cloud)将在中国东莞正式拉开帷幕,并将在国内30多个城市、海外10多个国家开设分会场。