Skip to content

[Feature]: 获取文件原始内容和块顺序信息 #1869

@cyatom01

Description

@cyatom01

Problem Statement

  1. 我本地文件路径为“docs/kubernetes/调度与驱逐/[api-eviction.md](http://api-eviction.md”,上传viking 后存储的是分块后以文件名称为目录组织内容的。search 时召回相关文档链接,我想获取原始文件内容,现在没有结构支撑。
  2. 换一种实现思路:先search 召回viking-uri,然后根据uri 读取读取内容,如果是目录就通过ls 读取字内容然后合并内容得到整个文件内容信息。但是问文件块质检缺乏排序数据,这样会导致合入的文本块和原始文件比顺序错误。
Image

Proposed Solution

1、索引上支持存储文件原始内容和现在索引信息。
2、如果不支持获取原始内容则需要保存原始块顺序相关信息。

Alternatives Considered

No response

Feature Area

Filesystem Operations

Use Case

先search 召回viking-uri,然后根据uri 读取读取内容,如果是目录就通过ls 读取字内容然后合并内容得到整个文件内容信息。

Example API (Optional)

ls 
[
  {
   viking_uri:"",
   content:"",
   metadata:{
     order:1,
   }


}
]

Additional Context

No response

Contribution

  • I am willing to contribute to implementing this feature

Metadata

Metadata

Assignees

No one assigned

    Labels

    enhancementNew feature or request

    Type

    No type

    Projects

    Status

    Backlog

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions