OpenAI 12天发布会完整的流程

以下是OpenAI连续12天发布会的内容:

第一天:发布完整版o1

  • 性能提升:o1完整版在推理方面具有更快的速度和更优的性能,在数学、编程、博士阶段科学问题等领域的性能远超GPT4o,较o1-preview重大错误率降低了34%,速度提升50%.
  • 多模态输入:支持图像、文本两种输入方式,未来还会添加网页浏览、文件上传等功能.

第二天:发布强化微调技术

用户可使用较小的数据集在特定场景创建专家模型,帮助企业根据自身需求定制模型,以适应如医疗、金融和法律等特殊任务场景,该技术为企业构建定制化的AI模型提供了更灵活的路径,可有效提升用户体验.

第三天:发布视频大模型Sora

Sora能够生成分辨率最高达1080p、时长最长达20秒的视频,还加入了多种编辑工具,适用于广告、娱乐及教育等领域,极大降低了内容创作的成本和时间.

第四天:发布协作平台Canvas

Canvas是一个集智能写作、代码协作于一身的AI工作台,支持实时编辑和代码执行,可帮助用户高效创作和修改,提升了人机协作在写作与编程场景的效率与流畅度.

第五天:发布ChatGPT×Apple Intelligence

ChatGPT与苹果智能集成,涵盖Siri支持、写作工具升级、视觉智能能力等,拓宽了ChatGPT的应用场景与交互方式,不过中国大陆的Apple设备无法使用该项功能.

第六天:发布高级语音模式

ChatGPT移动端app上线高级语音模式的视频和共享屏幕功能,由OpenAI的多模态模型GPT-4o支持,具备视觉感知能力,进一步优化了移动端的语音交互体验,使其更加自然和智能,还新增“限时”圣诞老人声音作为“节日特供”.

第七天:发布Projects in ChatGPT

用户可在ChatGPT内创建项目并进行文件和信息管理,支持接入互联网资源,为用户提供了项目管理与资源整合的新途径,提升工作效率,初期仅面向plus/pro用户开放,明年初向企业和教育用户提供.

第八天:发布ChatGPT搜索

新增地图体验、实时搜索等功能,支持高级语音模式搜索,可获取最新网络信息,优化了搜索功能,使其更全面、便捷且与时俱进,全球免费开放,2024年10月首次向付费订阅用户推出.

第九天:发布o1 API等多项开发者工具更新

  • 功能丰富:o1模型API新增函数调用、结构化输出、视觉输入等功能,引入WebRTC实现实时语音应用开发.
  • 成本降低:4o音频价格降低60%,还推出偏好微调功能,并发布Go和Java SDK,为开发者提供了更丰富的工具与更低的成本,便于开发各类应用.

第十天:发布通话访问模式

美国用户可拨打1-800-CHATGPT每月与ChatGPT免费通话15分钟,国际用户可通过WhatsApp向同一号码互动,降低了ChatGPT的使用门槛,增加了使用的便捷性与普及性.

第十一天:发布全新桌面应用

支持原生应用程序自动化协作,桌面版集成苹果Notes、Notion等办公应用,高级语音模式也可协同工作,已在mac版ChatGPT应用中推出,计划明年开放给windows版本和免费用户.

第十二天:发布新一代推理模型o3及o3-mini

  • 性能卓越:o3模型在编程领域的预期评分超过2700分,在科学推理方面也展现出了前所未有的能力,某些方面接近通用人工智能标准 。在Codeforces编程测试中,o3取得了2727分的Elo评分,在OpenAI推出的SWE-Bench Verified代码生成评估基准中,其准确率达到了71.7% 。在FrontierMath测试中,o3解决了25.2%的问题,在美国数学邀请赛AIME 2024数学基准测试中,o3的准确率达到96.7%.
  • 测试与开源计划:o3-mini的三种推理强度选项为用户提供了更多的灵活性,OpenAI计划在2025年推动o3的开源复现,并已开放测试申请,邀请全球首批o3体验用户参与.
1 个赞