快讯详情
OpenAI上线Flex处理模式:API费用减半,但牺牲响应速度及稳定性
亿恩网| 2025-04-18 10:08:53

为在与谷歌等生成式 AI 竞争对手的较量中进一步加大投入,OpenAI 宣布推出“Flex 处理模式”新的 API 服务 —— 用户以接受响应速度变慢和“资源偶尔无法分配”为代价,换取更优惠的模型使用价格。OpenAI 表示,Flex 处理目前已对新近发布的 o3 和 o4-mini 推理模型开放测试,主要面向模型评估、数据扩充、异步处理等优先级较低的“非生产”任务。采用 Flex 处理,API 费用将直接减半。以 o3 为例,Flex 模式下的费用为每百万输入 tokens 收取 5 美元,每百万输出 tokens 收取 20 美元(现汇率约合 146 元人民币)。

转载之前请先阅读转载说明,违规转载法律必究
寻求报道或合作,请点击这里
如果您加入壹览的讨论群,请联系我们的工作人员(微信号:star_3979)