如何可视化大型图片档案库
自从去年开启了可视化档案的收集,自然而然对图片的整理,归类和搜索产生了兴趣,但一直没找到成熟的大型图片库可视化工具,于是打算自己手搓一个。
经过一些调研,发现学术界尤其是数字人文领域已经有不少相关研究了,主要是针对GLAM机构 (galleries, libraries, archives, and museums) 的馆藏可视化,常见的方法是分析图像的视觉特征 (颜色、纹理、形状等) 以计算它们的相似度,然后在可视化中将相似的图像紧密排列在一起,使得人们可以轻松识别图像的分布。另一种方法是利用与图像相关的语义信息(例如标签、注释等元数据)组织排列,图像根据语义相似性进行聚类,可视化语义之间的关联。
随着embedding 和 vector database 技术的日趋成熟, 我们可以获取和保存图片和文本的高维特征,搭建自己的图片搜索引擎。如果需要可视化数千张图像的大型集合,则需要先将高维向量降维,再使用WebGL等技术在网页端渲染,使用PIXI.js 和Three.js 都可以实现对海量图片的浏览和交互:例如通过缩放、平移、筛选视觉属性或文本查询来探索图像集合,在2D或3D空间中高效地查找感兴趣的目标或对未标记的数据进行进一步标注。
如果你有感兴趣的图片档案库,想制作一个自己的图片可视化工具,可以使用来自德国Urban Complexity Lab 的开源工具 Virkus Viewer,或者加入最近发布的 SOOT 的waiting list,如果你也有这方面的相关经验,期待交流!





