What would you like to be added?
我用Qwen的测试,的确几个问题花了200多万的token,产生近百块的账单。不过这个Qwen-code相比Gemini-cli最大的优势是可以自己定义模型,那就可以接kimi家新出的编程模型k2了。测试用k2完全从零写了一个小项目,代码量虽然不是很大,但因我测试时自己一句代码和文档没写,全让AI自己来,从开发到修BUG等消耗token是绝对不少的,账单不到20,可以接受,从我用Qwencode测试就修了一点小问题产生上百元的账单强多了。
项目示例:https://github.com/oiuv/MoonPalaceDB 我不知道直接用QwenCode会花多少钱,不敢测试。
而且我用这个还不只是测试开发了这一个项目,还测试分析其它项目,用了特别久,结果这里账单只有20元。
用kimi模型的优势价格低,官方提供了自动的缓存机制,命中缓存时消费低很多,虽然Qwen-code-plus也有缓存命中优惠,但是只在低token区间有优势,在高token区间也很贵,而要知道api的记忆功能就是每次请求都把你所有对话历史重复发一次,这样token的消耗真的是指数级的增长的,在高token消耗区间是常态的。关于价格对比,后面回贴中有详细内容,可以看看k2的价格优势很明显,除非Qwen-code-plus把价格降下来,否则对比起来太贵了。
用kimi模型的另一个好处是,你可以用moonpalace调试接口,清楚的记录接口到底发了什么东西,消耗的明明白白,不存在隐藏消费,数据自己都有记录可查。
从数据库的记录可以看到每次发的数据都包括很长的system prompt、大量的工具和每一次的历史会话,一直在滚雪球,聊多了真的会爆炸。这也是为什么明明感觉没聊多少,几百万token没了。
Why is this needed?
为了新中国
Additional context
No response
What would you like to be added?
我用Qwen的测试,的确几个问题花了200多万的token,产生近百块的账单。不过这个Qwen-code相比Gemini-cli最大的优势是可以自己定义模型,那就可以接kimi家新出的编程模型k2了。测试用k2完全从零写了一个小项目,代码量虽然不是很大,但因我测试时自己一句代码和文档没写,全让AI自己来,从开发到修BUG等消耗token是绝对不少的,账单不到20,可以接受,从我用Qwencode测试就修了一点小问题产生上百元的账单强多了。
项目示例:https://github.com/oiuv/MoonPalaceDB 我不知道直接用QwenCode会花多少钱,不敢测试。
而且我用这个还不只是测试开发了这一个项目,还测试分析其它项目,用了特别久,结果这里账单只有20元。
用kimi模型的优势价格低,官方提供了自动的缓存机制,命中缓存时消费低很多,虽然Qwen-code-plus也有缓存命中优惠,但是只在低token区间有优势,在高token区间也很贵,而要知道api的记忆功能就是每次请求都把你所有对话历史重复发一次,这样token的消耗真的是指数级的增长的,在高token消耗区间是常态的。关于价格对比,后面回贴中有详细内容,可以看看k2的价格优势很明显,除非Qwen-code-plus把价格降下来,否则对比起来太贵了。
用kimi模型的另一个好处是,你可以用moonpalace调试接口,清楚的记录接口到底发了什么东西,消耗的明明白白,不存在隐藏消费,数据自己都有记录可查。
从数据库的记录可以看到每次发的数据都包括很长的system prompt、大量的工具和每一次的历史会话,一直在滚雪球,聊多了真的会爆炸。这也是为什么明明感觉没聊多少,几百万token没了。
Why is this needed?
为了新中国
Additional context
No response