目前大部分 AI 服务都采用 SSE(Server-Sent Events,服务器推送事件)进行回应,即逐字返回对于问题的响应。SSE 是一种基于 HTTP 协议的实时通信技术,常见于 LLM(大语言模型)接口功能的调试场景。开发人员在调用 AI 应用的 API 时经常有着 SSE 事件的拼接场景,以及拼接后的 Tokens 换算及成本预估等需求。下文将以请求调试某个 AI 应用为例,演示如何在调试接口的过程中,自动将输入和输出的字符数换算为 Token 值,配合实时汇率接口,在单次调试 API 的过程中就能估算出大致成本。前置准备