目前gpt4模型API暂且只对通过了GPT4候补白名单申请的账号开放,plus会员账户可直接在网页端使用GPT4模型(目前也推出了插件功能,需要申请通过后才能使用插件)。另外,申请API白名单时,plus会员优先级更高。 plus会员信息:
- 价格:20美元/月 = 140元/月 = 1680元/年/账号;
- 目前国内visa双币卡付费会被拒,如果没有国外卡,可走淘宝代充或虚拟信用卡Deplay渠道。
- plus会员网页端访问gpt4模型免费,目前gpt4模型限额
25条提问/3小时
; - plus会员网页端限额走势:
100条/4小时 =》50条/3小时 =》 25条/3小时
- 代币 :用于openai api计费的tokens,使用tikoken进行标记,参与计费的单位为 1K tokens;
- 1K :1000(程序界默认1K=1024,而openai这里的1K=1000);
- 上下文:为了让chatgpt保持会话语境一致而需要携带的数据,可以理解为每次会话都将历史聊天记录传给chatgpt(通过messages列表携带历史会话数据), 上下文越多(文本越大),越消耗服务资源,价格也就越贵。如果超过最大上下文,返回的结果会被截断。
- 1美元=6.8,存在浮动,这里按7元计算;
- 1中文 ~= 1.3代币
- 50w中文 = 65w代币
- 参与计费的数值:65 * 10000 / 1000 = 650
- 按均值0.06计算:
650 * 0.06 * 7 = 273元(50万字)
- 按高值0.12计算:
650 * 0.12 * 7 = 546元(50万字)
模型 | 最大上下文 | 提示(提问内容) | 完成(返回结果) |
---|---|---|---|
GPT-4 | 8K | $0.03 / 1K 代币 | $0.06 / 1K 代币 |
GPT-4 | 32K | $0.06 / 1K 代币 | $0.12 / 1K 代币 |
- 1中文 ~= 1.3代币
- 50w中文 = 65w代币
- 参与计费的数值:65 * 10000 / 1000 = 650
- 按均值0.002计算:
650 * 0.002 * 7 = 9.1元(50万字)
模型 | 最大上下文 | 提示(提问内容) | 完成(返回结果) |
---|---|---|---|
GPT-3.5 | 4K | $0.002 / 1K 代币 | $0.002 / 1K 代币 |
- gpt2模型已久远,没找到具体的单价,这里暂且按gpt3的价格0.002价格计算
- 1中文 ~= 2代币
- 50w中文 = 100w代币
- 参与计费的数值:100 * 10000 / 1000 = 1000
- 按均值0.002计算:
1000 * 0.002 * 7 = 14元(50万字)
模型 | 最大上下文 | 提示(提问内容) | 完成(返回结果) |
---|---|---|---|
GPT-2 | 4K | $0.002 / 1K 代币 | $0.002 / 1K 代币 |
官方代币计算模拟(这里的的计算默认用的GPT-2,中文消耗的tokens更多):https://platform.openai.com/tokenizer 官方代币说明:https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them 官方计费介绍:https://openai.com/pricing
经过验证,中文/中文字符根据结构不一样,分别可能会被openai标记为三种规格:
- 1个代币(例如:的、【、】、。);
- 2个代币(例如:你、好、《、》);
- 3个代币(例如::,;:);
通过几批数据计算,平均值约
1中文=2.3代币
,这里统一按:1中文=2代币
计算;
openai语言模型以"称为标记的块"的形式读取文本。在英语中,标记可以短至一个字符或长至一个单词,在某些语言中,标记甚至可以短于一个字符,甚至长于一个单词。
以下标记的代币数计算基于官方代币计算模拟,官网上的计算方式是基于gpt2模型的,中文会被标记未更多的代币。而后续的gpt3、gpt4模型,计算中文代币数会更少,相对而言更优惠。
目前基本都是用gpt3、gpt4模型,这里只是对代币标记规则做简易说明。
例如:
- "a apple":
- 被标记为:["a", "apple"],
- 实际标记块为:[64, 17180],
- 记为 2代币;
- "ChatGPT is great!":
- 被标记为:["Chat", "G", "PT", " is", " great", "!"]
- 实际标记块为:[30820, 38, 11571, 318, 1049, 0]
- 记为 6代币
- "的":
- 实际标记块为:[21410],
- 记为 1代币;
- "你":
- 实际标记块为:[19526, 254],
- 记为 2代币;
- ";":
- 实际标记块为:[171, 120, 249],
- 记为 3代币;
- 可使用
tiktoken
进行计算; - github地址:https://github.com/openai/tiktoken/blob/main/README.md
- 点击这里进行动态计费>>
要查看 API 调用使用了多少代币,请检查 API 响应中的字段,例如: - response['usage']['total_tokens']
- API所使用的模型类型;
- Tokenization算法:
- GPT-3、GPT-4使用的是一种名为Byte Pair Encoding (BPE)的算法,
1中文 ~= 1.3代币
; - 而GPT-2则使用的是一种基于WordPiece的算法。BPE算法可以更好地处理不常见的单词和短语,而WordPiece算法则更适合处理英语等常见语言;
1中文 ~= 2代币
; - 中文环境,使用
GPT-3、GPT-4
模型,消耗的代币(tokens)
更少;
- GPT-3、GPT-4使用的是一种名为Byte Pair Encoding (BPE)的算法,
- API所发送与返回结果的总代币数;
-
微软Azure国际版Azure OpenAI Service也有GPT-4服务
-
价格跟openai那边一样按代币数(tokens)计费。目前只对企业开放,申请步骤有些繁琐,填写表单进行审核。申请需要以下条件:
- Azure国际版
- 开通 Azure OpenAI Service: https://aka.ms/oai/access
- 开通 GPT-4: https://aka.ms/oai/get-gpt4
-
openai推出了插件功能
- https://openai.com/blog/chatgpt-plugins
- 已经在 ChatGPT 中实现了对插件的初步支持。插件是专门为以安全为核心原则的语言模型设计的工具,可帮助 ChatGPT 访问互联网中的最新信息、运行计算或使用第三方服务;
- 目前插件开发/使用需要提交申请,优先对plus会员或符合要求的开发者开放。
- 候补名单申请入口:https://openai.com/waitlist/plugins