Skip to content

[Feature]: add_resource 函数支持在处理目录时原样保留嵌套结构 #490

@JuLian1130

Description

@JuLian1130

Problem Statement

#484
从这里看,如果我输入的文档有严格分类的目录结构(例如很多工程文档已经存在这样的结构,但需要 LLM 对每一级目录做摘要),想在处理目录时原样保留嵌套结构,以避免召回时召回到错误的类别。现有的实现似乎是做不到的,因为嵌套结构会被展平到同一级别。

Proposed Solution

这样展平的设计似乎有利于检索的速度,但不同业务场景有不同的取舍。应该可以加一个最大嵌套深度的设置,小于此深度可以保留嵌套结构而不展平。

Alternatives Considered

No response

Feature Area

Storage/VectorDB

Use Case

add_resource指定的目录如果内部有 a/b/c/d 这样的层级,应该允许原样保存这样的层级。

Example API (Optional)

Additional Context

No response

Contribution

  • I am willing to contribute to implementing this feature

Metadata

Metadata

Assignees

No one assigned

    Labels

    enhancementNew feature or request

    Type

    No type

    Projects

    Status

    Done

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions