OpenAI上线Flex处理模式：API费用减半，但牺牲响应速度及稳定性

为在与谷歌等生成式 AI 竞争对手的较量中进一步加大投入，OpenAI 宣布推出“Flex 处理模式”新的 API 服务 —— 用户以接受响应速度变慢和“资源偶尔无法分配”为代价，换取更优惠的模型使用价格。OpenAI 表示，Flex 处理目前已对新近发布的 o3 和 o4-mini 推理模型开放测试，主要面向模型评估、数据扩充、异步处理等优先级较低的“非生产”任务。采用 Flex 处理，API 费用将直接减半。以 o3 为例，Flex 模式下的费用为每百万输入 tokens 收取 5 美元，每百万输出 tokens 收取 20 美元（现汇率约合 146 元人民币）。

转载之前请先阅读转载说明，违规转载法律必究

寻求报道或合作，请点击这里

如果您加入壹览的讨论群，请联系我们的工作人员（微信号：star_3979)