在AI发展的道路上,需要有勇于攀登的人。
在旧金山刚刚结束的开发者大会上,来自全球各地的数百名开发人员和OpenAI团队齐聚一堂,预览了新工具并进行了交流。AI人工智能市场将采取更加开放的方式,欢迎更多有志之士加入其中。短短不到一小时的线上直播发布了许多重要消息,就像OpenAI的发展速度一样,越来越快。
本次开发者大会的目的是鼓励企业使用OpenAI的技术来构建基于人工智能的聊天机器人和自主智能体,这些自主智能体可以在没有人类干预的情况下执行任务。OpenAI团队也希望能吸引更多开发者付费访问OpenAI模型,并利用其模型构建新的AI生态系统。
在大会之前,Sam Altman在X平台上表示:“会发布一些非常棒的新东西。”
GPT4 Turbo发布,更强版本GPT4
Turbo版的GPT4数据已经赶上现在时代了,因为它是利用截至今年4月的网上数据构建。
因此,相比只能访问截至2021年9月数据的原版GPT-4,Turbo版更与时俱进了,它不仅已经知道了全球刚经历过的几年疫情或者经济动荡,也了解截至今年4月的绝大部分世界事件。
不仅如此GPT4 Turbo版还提供128k的上下文窗口,也就是说,它可以一次容纳相当于300多页文本内容的提示词(很难想象一下子有这么多提示词还能做到不崩溃)。
相比原版GPT-4,Turbo版的收费做了大幅下降,其输入token的收费价0.01美元,便宜三倍,输出token的价格为0.03美元,便宜两倍。
Turbo版可供所有付费开发人员通过API 中的gpt-4-1106-preview进行尝试,OpenAI计划未来几周内发布稳定的生产就绪模型。
OpenAI同时更新了GPT-3.5,推出Turbo版的默认支持16k上下文窗口GPT-3.5,新版支持改进的指令跟踪、JSON模式和并行函数调用。新版的输入token和输出token收费也分别比原版便宜三倍和两倍,价格分别为0.001 美元和0.002美元。
新版本增加了新的多模态功能,包括视觉、图像创建 (DALL·E 3) 和文本转语音 (TTS)。Turbo版GPT-4 可以接受图像作为Chat Completions API中的输入,从而实现生成标题、详细分析现实世界图像、以及阅读带有图形的文档等用例。
OpenAI计划为主要的Turbo版GPT-4模型提供视觉支持。视觉输入的定价取决于输入图像的大小。例如,将1080×1080像素的图像发送给Turbo版收费0.00765美元。图像创建方面,OpenAI提供不同的格式和质量选项,每生成一张图像起售价为0.04美元。
针对付费用户开放的新版本GPT,主要功能更新包括:
支持多格式文件上传
旧版本中,用户需要使用“Advanced Data Analysis”等功能完成PDF文档上传和信息提取;新版本中,用户可以直接上传PDF、数据文件等多种格式文件,未来或将支持更多文件类型;
OpenAI的GPT-4模型在最新版本中实现了工具的一站式整合,为用户省去了在不同模式之间切换的繁琐步骤。此前,GPT-4有四个独立的特性模式:图像上传、插件、代码运行器和文件上传+GPT-4。然而,在新版本中,这些功能被统一起来,使得用户能够通过一个对话窗口完成各种任务。
值得一提的是,GPT-4不仅增强了原有的文本生成能力,还新增了多模态能力。这意味着GPT-4不仅能理解和回应文本输入,还能处理图像输入。当接收到图像输入时,GPT-4可以生成对图像内容的理解性回答。例如,在一次演示中,当给定一个包含异常现象的图像时,GPT-4准确识别出了图中的问题,显示出其强大的视觉理解能力。但这一功能目前仍处于研究阶段,并未对外公开。
此外,OpenAI还与苹果前首席设计师乔纳森合作研发了一款支持GPT-4或更高版本的智能眼镜。这种硬件产品将进一步加强AI的应用能力,但其对终端芯片的要求也随之提高。
总的来说,OpenAI通过GPT-4的升级和整合,为用户提供了更为强大和便捷的工具体验,同时也在推动AI技术向更高的目标迈进。
OpenAI开发者大会的举办不仅是当前发展阶段的必然,也是推动大模型逐渐演变为AI智能体并构建以ChatGPT大模型为基础的新生态体系的载体。
尽管线上开发者大会只持续了短短45分钟,但其内容在AI行业引起了轰动。我们可以看到,OpenAI的目标非常高,决定将自己打造成一个独立于现有应用商店和分发方式的平台并非一蹴而就。商业化的下一步将直接面对苹果等行业巨头甚至其长期赞助人微软的挑战。