感觉token消耗量大的，推荐用kimi的k2模型，我测试了，消费还能接受。

### What would you like to be added?

我用Qwen的测试，的确几个问题花了200多万的token，产生近百块的账单。不过这个Qwen-code相比Gemini-cli最大的优势是可以自己定义模型，那就可以接kimi家新出的编程模型k2了。测试用k2完全从零写了一个小项目，代码量虽然不是很大，但因我测试时自己一句代码和文档没写，全让AI自己来，从开发到修BUG等消耗token是绝对不少的，账单不到20，可以接受，从我用Qwencode测试就修了一点小问题产生上百元的账单强多了。

项目示例：https://github.com/oiuv/MoonPalaceDB  我不知道直接用QwenCode会花多少钱，不敢测试。

<img width="1110" height="528" alt="Image" src="https://github.com/user-attachments/assets/e79fbbb7-20a2-4394-a873-0513b47d92e5" />

而且我用这个还不只是测试开发了这一个项目，还测试分析其它项目，用了特别久，结果这里账单只有20元。

用kimi模型的优势价格低，官方提供了自动的缓存机制，命中缓存时消费低很多，虽然Qwen-code-plus也有缓存命中优惠，但是只在低token区间有优势，在高token区间也很贵，而要知道api的记忆功能就是每次请求都把你所有对话历史重复发一次，这样token的消耗真的是指数级的增长的，在高token消耗区间是常态的。关于价格对比，后面回贴中有详细内容，可以看看k2的价格优势很明显，除非Qwen-code-plus把价格降下来，否则对比起来太贵了。

用kimi模型的另一个好处是，你可以用moonpalace调试接口，清楚的记录接口到底发了什么东西，消耗的明明白白，不存在隐藏消费，数据自己都有记录可查。

<img width="957" height="1048" alt="Image" src="https://github.com/user-attachments/assets/1bc4ec51-c1ab-4249-8dbb-a7c7b6acc417" />

从数据库的记录可以看到每次发的数据都包括很长的system prompt、大量的工具和每一次的历史会话，一直在滚雪球，聊多了真的会爆炸。这也是为什么明明感觉没聊多少，几百万token没了。

<img width="1865" height="964" alt="Image" src="https://github.com/user-attachments/assets/942a649d-869e-4bb9-9169-5fcb2d70fa1e" />

### Why is this needed?

为了新中国

### Additional context

_No response_

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

感觉token消耗量大的，推荐用kimi的k2模型，我测试了，消费还能接受。 #137

What would you like to be added?

Why is this needed?

Additional context

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

感觉token消耗量大的，推荐用kimi的k2模型，我测试了，消费还能接受。 #137

Description

What would you like to be added?

Why is this needed?

Additional context

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions