ChatGPT “上网封印”已解除!解读 Plugin 功能

ChatGPT “上网封印”已解除!解读 Plugin 功能

🖍 GPT 上网“封印”解除了

于 2022 年年底推出的 ChatGPT (以下简称 GPT)注定是属于是通用型人工智能(AGI, Artificial General Intelligence)行业的 iPhone 时刻。人们迫切地希望能用它解决现实生活中的所有问题,而 GPT 用它富有耐心、彬彬有礼和无所不知的回答让普通人感受到了仿佛来自电影桥段中的强大科技。只需要输入寥寥数段提示词(Promo code),就可以让 GPT 为你写一篇文章、诗歌,为你提供产品建议,回答历史问题等。

但 GPT 本身并不具备联网服务,它的本质上是一种基于自然语言处理(NLP)和深度学习技术的自然语言处理模型,在大量文本数据上进行预训练而练就了问题回答能力。受限于截止于 2021 年的训练数据,许多回答所给出的信息并不能够保证准确,免不了会开始胡编乱造 😓。

GPT 就像被人类施加了一层联网封印,未经许可不得联网。并且 GPT 目前能够提供的反馈也仅限于文本或图片内容,人们只能够拿着它给出的回答,最终再使用“人类”这个肉身中介才能够使得信息与现实世界完成交互。因为 GPT 自身并不具备与各项应用程序的 API (Application Programming Interface,应用程序接口)进行联网交互的能力。即使 GPT 是如此强大算力背后的集合体,但甚至却在你的手机上设置一个简单的日程提醒都做不到。

但随着 ChatGPT Plugin 官方插件服务的推出,预示着这道“联网”封印即将被彻底打破。

内容扩展:《GPT 会上网了,ChatGPT 插件的原理揭秘

ChatGPT Plugin 意味着什么?

人们都喜欢用一个贴切的比喻形容 ChatGPT Plugin 功能,那就是与 iPhone 时代一起诞生出品的 App Store(应用商店)。是的,没有各项设计新颖的软件服务,当时 iPhone 强大编写的智能与创新也无法得以彰显。ChatGPT 虽然已经强大到能够回答各式各样的问题,并能够给出专业意见,但碰到如法律或移民咨询等细分场景同样需要参数微调(Fine-tuning)或施加提示词(Promot Code)等操作才能得出比较好的回答。如此繁琐的前置操作并不能够被称之为是一个开箱即用的服务,这对于大多数普通用户而言并不友好,而推出的 Plugin 服务正是解决细分领域场景下的极佳能手。

首批推出的插件服务包含在线购物、法律知识、酒店航班预订、外卖服务、专业问答、文字转语音,以及能够使用市面上大部分互联网应用程序的集合体 Zapier 等。

图片翻译自微软,并不代表 APP 的真实命名。

快速安装后仅需通过一个 / 按钮字符就能使用插件服务,有谁不爱呢?

在 Plugin 出现之前,GPT 早期模型早已支持开源并提供 API 调用方式。但很显然 ChatGPT 的母公司 OPENAI 并不满足于作为仅提供 API 标准服务的幕后角色,充满野心的 Plugin 服务就是要成为 AI 行业的应用商店与接入标准。

还记得 App Store 诞生之前的移动互联网软件生态吗?开发者需要在各个论坛中发帖宣传自己的应用,用户看到帖子后产生兴趣后才进行下载。这一野蛮生长的过程中充斥着盗版和病毒文件。目前的 GPT 生态也不遑多让,目前市面上不乏各式各样的打着 GPT 旗号的应用程序,不乏许多挂羊头卖狗肉的应用在中间浑水摸鱼,它们无一不是号称为地表最强 AI,但实际上糟糕的体验只会让不明就里的用户直呼上当,变相损耗 GPT 的商誉。

如此种种,造成了潜在用户需要翻阅大量的搜索页面和网站推荐才能找到想要的服务,找到后是否能够长期使用又是一个问题。对于有才能的开发者而言,要在这一野蛮生长的过程中靠软件持续产生盈利十分困难。毕竟,光是推广宣传,做到让用户看到自己的应用这一过程所产生的费用已经让产品成本急剧上升。

App Store 这一超级应用分发与搜索平台的出现成功降低了开发者与海量用户之间的鸿沟,在平台上用户可以在同一个地方发现各式新奇好玩的服务,轻松便捷就能够完成下载并进行体验,完成打分评选。目前 ChatGPT 坐拥数以亿计的用户,能够在插件市场上探索的平台商业机会还有很多。

有理由相信,随着 Plugin 的不断丰富,未来的 ChatGPT 极有可能成为“终结一切应用”的超级平台型应用。也许往后的人类不再需要学习使用各项复杂的 App,也无所谓什么产品交互体验,动动嘴动动手就能够开发出精美绝伦的网页、获得及时专业的法律咨询、选中最符合需求的度假目的地等等……

⚠️ 产品经理,危!

如何参与 ChatGPT Plugin 生态建设?

OPEANAI (GPT 母公司)官方已给出了接入 Plugin 生态的开发指引:

一句话总结:开发者仅需提供后端服务,并对 OPENAI 提供特定的 API 接口、API 描述文件、插件描述文件(ai-plugin.json)就能够完成接入,接着需要由官方进行审核后正式上架。

什么是 API 接口?

API 接口(Application Programming Interface)是一种让不同的应用程序之间相互通信的方法,通过这种接口,应用程序可以获取数据和服务而不需要共享底层代码或功能,也就是说 GPT 需要通过 API 接口完成与应用插件之间的通讯与功能调用。

什么是 API 描述文件?

API 描述文件又称为 API 文档,它通常为服务对接方提供服务,主要用于向开发者说明清楚当前的 API 是如何使用的。在 ChatGPT Plugin 的开发文档中非常明确的提出了一点:

如果想要做到让 AI 模型通过插件作为你 API 的智能调用方,则你必须将你的 API 以 OpenAPI 规范格式的文档放在清单文件中。”

那么 OpenAPI 规范又是什么呢?

OpenAPI 规范是由 Tony Tam 在 2009 年创立的,当时他是 Wordnik 公司的一名工程师,他想要描述 Wordnik 的在线词典 JSON API,于是创建了一个规范,叫做 Swagger。Swagger 在接下来的几年里经过了多次迭代和改进。从 2016 年开始,Swagger 规范正式更名为 OpenAPI 规范,并迁移到了一个新的 GitHub 仓库。从那时起,OpenAPI 规范就不断地更新和完善。

知识扩展:《API First 再先一步,OpenAPI 定义被 openAI 定为 ChatGPT 插件标准

❓ api-plugin.json 文件是什么?

api-plugin.json 文件包含有关插件的元数据(名称、徽标等),身份验证信息(身份验证类型、OAuth URL 等),以及 OpenAPI 规范格式的 API 文档文件,主要面向 GPT 服务端。开发者需要将该文件托管在 yourdomain.com/.well-known/ai-plugin.json 路径下。

总体而言,你可以将该文件视作 AI 行业内的应用程序安装包,类似 Windows 生态下的 .exe 文件,macOS 下的 .dmg文件。

如何快速生成符合 OpenAPI 规范的 JSON 文件?

API 注定是 AI 时代下的软件开发关键与核心。也许在未来,一条简单的 API 配合强大的 AI 能力就可以打造出下一个爆款应用。 Apifox 是一款便捷的 API 一体化协作平台,仅需输入一条快捷请求指令,Apifox 将自动为您补全并生成完整的 API 接口文档。

录入各项常用请求后,通过 Apifox 内置的导出功能就能够快速得到一份完全符合 OpenAPI 格式的 JSON 文件了!

Apifox 的能力不仅限于此,它还能够帮助企业、开发者等用户轻松创建、发布、管理和监控 API,提供全方位的 API 开发和管理解决方案。它支持多种协议和格式,包括 REST、SOAP 和 WebSocket(BETA) 等,并提供多种开发语言的 SDK 和开发工具,以便开发者快速部署 API。

快来使用 Apifox,畅享愉悦的 API 开发与管理体验!

订阅
qrcode

订阅

随时随地获取 Apifox 最新动态