Aloxaf's Blog

首页 归档 标签 友链
Go to Aloxaf's GitHub Atom Feed
  • 使用 faiss 对百亿级二进制向量进行搜索
    2025-08-06 · 分享

    近年来随着 AI 技术的发展,向量数据库也原地起飞。有诸如 USearch 这样单机性能强悍的 HNSW 搜索方案,也有 Milvus 这种企业级的分布式向量数据库。

    但令人悲伤的是,这些方案的关注点都在浮点向量上,二进制向量没有人权。
    更令人悲伤的是,新入局的都是风口上的企业级玩家,资源大把,召回率是首要指标,资源消耗是其次的。

    像我这种没钱的个人玩家,如果企图进行超大规模二进制向量搜索,还是得用经典的 faiss……


  • 从 xargs 到 parallel 再到 zargs
    2025-07-22 · 笔记

    一直以来我都很喜欢用 GNU Parallel 代替 xargs 进行并发控制,它独特的 sem 命令提供了信号量功能,使得 shell 中的并发就像高级编程语言一样简单。

    直到我遇到了 CentOS7……


  • 将博客从 Hugo 迁移到 Astro
    2025-07-18 · 笔记

    前段时间看到有人在吹捧 Astro 的群岛架构,虽然我完全不懂这些「现代前端技术」,但还是跑过去看了一下这玩意儿。

    结果一看就发现……
    ——什么,专门为内容驱动网站设计的 Web 框架?那不是很适合写博客?
    ——什么,官方就提供了博客示例?
    ——什么,这么简单的示例就能搭建一个博客?

    刚好最近闲着没事做,这可不得赶紧迁移一下试试。


  • Clash 中 GeoSite 分流的正确使用方式
    2025-04-15 · 分享

    因为觉得写 ruleset 太麻烦,研究了一下 GeoSite,发现其实在「正确的配置」下,只靠 GeoSite 就能满足绝大部分的分流需求。这方面的文章好像很少,写一篇分享一下折腾经验。


  • 在 Cloudflare Workers 中调用 wasm 模块
    2025-01-03 · 笔记

    年末闲着没事折腾 Cloudflare Workers,发现这玩意儿的运行时对 wasm 模块进行了一些限制,导致用起来很蛋疼,没刻意适配过的库基本上是没办法直接使用的。


  • Kagi 搜索引擎使用体验
    2024-12-20 · 杂记

    一年前,在机缘巧合之下,我决定抛弃谷歌搜索。在对各种替代品进行了一番调查试用之后,我最终开始使用 Kagi —— 一个付费搜索引擎。


  • 低版本 ubuntu 镜像在 docker 中 apt install 过慢的问题
    2024-11-05 · 笔记

    只有两个月了,今年还有 6 篇博客没有完成!


查看更多文章 →
Copyright © 2017-2026 Aloxaf
Powered by Astro
Go to Aloxaf's GitHub Atom Feed