- 使用 faiss 对百亿级二进制向量进行搜索· 分享
近年来随着 AI 技术的发展,向量数据库也原地起飞。有诸如 USearch 这样单机性能强悍的 HNSW 搜索方案,也有 Milvus 这种企业级的分布式向量数据库。
但令人悲伤的是,这些方案的关注点都在浮点向量上,二进制向量没有人权。
更令人悲伤的是,新入局的都是风口上的企业级玩家,资源大把,召回率是首要指标,资源消耗是其次的。像我这种没钱的个人玩家,如果企图进行超大规模二进制向量搜索,还是得用经典的 faiss……
- 从 xargs 到 parallel 再到 zargs· 笔记
一直以来我都很喜欢用 GNU Parallel 代替 xargs 进行并发控制,它独特的 sem 命令提供了信号量功能,使得 shell 中的并发就像高级编程语言一样简单。
直到我遇到了 CentOS7……
- 将博客从 Hugo 迁移到 Astro· 笔记
前段时间看到有人在吹捧 Astro 的群岛架构,虽然我完全不懂这些「现代前端技术」,但还是跑过去看了一下这玩意儿。
结果一看就发现……
——什么,专门为内容驱动网站设计的 Web 框架?那不是很适合写博客?
——什么,官方就提供了博客示例?
——什么,这么简单的示例就能搭建一个博客?刚好最近闲着没事做,这可不得赶紧迁移一下试试。
- Clash 中 GeoSite 分流的正确使用方式· 分享
因为觉得写 ruleset 太麻烦,研究了一下 GeoSite,发现其实在「正确的配置」下,只靠 GeoSite 就能满足绝大部分的分流需求。这方面的文章好像很少,写一篇分享一下折腾经验。
- 在 Cloudflare Workers 中调用 wasm 模块· 笔记
年末闲着没事折腾 Cloudflare Workers,发现这玩意儿的运行时对 wasm 模块进行了一些限制,导致用起来很蛋疼,没刻意适配过的库基本上是没办法直接使用的。
- Kagi 搜索引擎使用体验· 杂记
一年前,在机缘巧合之下,我决定抛弃谷歌搜索。在对各种替代品进行了一番调查试用之后,我最终开始使用 Kagi —— 一个付费搜索引擎。
- 低版本 ubuntu 镜像在 docker 中 apt install 过慢的问题· 笔记
只有两个月了,今年还有 6 篇博客没有完成!