2月28日消息,OpenAI今日宣布推出其最新旗舰产品GPT-4.5语言模型。
这款被称为“迄今为止知识储备最丰富”的AI系统将率先面向Pro用户和开发者开放研究预览(research preview)。官方特别说明,该模型并非前沿架构版本,在部分场景下的表现可能不及o1或o3-mini等尖端模型。
从即日起,ChatGPT Pro用户可以在网页端、移动端和桌面端的模型选择器中选择GPT-4.5。该模型将于下周开始向Plus和Team用户推出,随后的一周向企业和教育用户推出。
GPT-4.5可以访问最新的信息,支持搜索、文件和图像上传,并能通过画布进行写作和代码编辑,目前不支持ChatGPT中的多模态功能,如语音模式、视频和屏幕共享。
GPT-4.5在预训练和后期训练方面取得了重大突破,通过扩大无监督学习的规模,GPT-4.5提高了识别模式、建立联系以及生成创造性见解的能力,且这一过程无需直接推理。
早期的测试显示,用户与GPT-4.5互动时感觉更加自然。其更广泛的知识库、对用户意图的改进理解以及更高的“情商”(EQ)使其在提高写作、编程和解决实际问题等任务中表现出色。同时,OpenAI预期GPT-4.5的虚构信息将更少,甚至略低于其o1模型。
在SimpleQA(简单问答)测试中,GPT-4.5在准确性和虚构信息率方面均表现优异
按照山姆·奥特曼披露的信息,OpenAI计划在2月结束前推出GPT-4.5,并在5月底前推出GPT-5。
OpenAI首席执行官山姆·奥特曼(Sam Altman)曾把GPT-5称为“整合了我们众多技术的系统”,它将包含OpenAI在去年12月的“圣诞十二日”活动中展示的新o3推理模型。
此前,OpenAI发布了o3-mini,但完整的o3模型仅会作为即将推出的GPT-5系统的一部分推出。这与OpenAI的目标一致,即整合其大型语言模型,最终打造一个有望被视为通用人工智能(AGI)的更强大模型。
无监督学习提高模型的准确性和直觉
GPT-4.5通过扩展计算和数据规模,以及架构和优化创新,实现了无监督学习的扩展。结果是,该模型拥有更广泛的知识和对世界的更深刻理解,从而减少了虚构信息,并在广泛的主题上提高了可靠性。
随着OpenAI的研究人员扩大模型规模并解决更复杂的问题,教会它们更好地理解人类需求和意图变得越来越重要。
对于GPT-4.5,研究人员开发了新的可扩展技术,这些技术使得能够利用较小模型的数据来训练更大、更强大的模型。这些技术提高了GPT-4.5的可操控性、对细微差别的理解以及自然对话的能力。
在与人类测试者的比较中,GPT-4.5在创意智力、专业查询和日常查询方面均表现出较高的胜率
OpenAI展示了GPT-4.5和GPT-4o处理三个相同问题的结果:
问题一:困难时期的帮助
用户称,“我考试不及格,现在很难过。” GPT-4.5的回答拥有更好的情感代入,相比4o机械式给解决方案,“AI味”少了很多。
问题二:太空探索
GPT-4.5在响应时不进行预先推理,这使得它的优势与OpenAI的o1等推理模型截然不同。与OpenAI的o1和o3-mini相比,GPT-4.5是一个更通用、更智能的模型。
OpenAI相信,推理能力将是未来模型的核心能力,而预训练和推理这两种扩展方法将相互补充。
模型能力的每一次提升,也是使其更安全的契机。GPT-4.5采用了新的监督训练技术,结合了传统的监督微调(SFT)和人类反馈强化学习(RLHF)方法,与GPT-4o所使用的方法类似。OpenAI希望这些工作能为未来更强大的模型对齐提供基础。
为了测试OpenAI的改进,研究人员在部署前根据他们的准备框架进行了一系列安全测试。结果发现,扩展GPT范式有助于提升GPT-4.5在各项评估中的能力。(腾讯科技特约编译无忌)