智信-agent
  1. 文件分析
智信-agent
  • 文件分析
    • 文件解析接口
      POST
    • 文本分段测试接口
      POST
    • 二进制文件
      POST
  • 知识库管理
    • 知识库初始化
      POST
    • 知识库召回测试
      POST
    • 知识库查询
      POST
    • 知识库文件添加
      POST
  • 工作流
    • AI生成prompt
      POST
    • 工作流运行
      POST
    • 单节点运行
      POST
    • 工作流保存接口
      POST
  • MCP管理
    • 建立MCP服务器
      POST
    • MCP服务器工具的添加
      POST
    • MCP服务器工具的删除
      POST
    • MCP服务器工具的修改
      POST
    • 修改服务器名称和描述
      POST
    • 关闭MCP服务器
      POST
    • 查看所有的工具
      POST
    • 查询当前活跃的mcp服务器信息
      GET
    • 使用指定工具
      POST
  • 数据库开发
    • 数据库内部接口
      • 接口整合
      • 自然语言及SQL执行
      • schma查询
      • 单表的字段描述查询
      • all
    • 数据库工作流运行
      • 数据库工作流保存
      • 数据库单节点运行
  • mineru
    POST
  1. 文件分析

文本分段测试接口

开发环境
http://172.29.50.10:2333
开发环境
http://172.29.50.10:2333
POST
/zhixin_agent/knowledge_database/indexing_estimate
针对单文件,切分知识库里的文章,把大段文字拆成小段,做知识库配置部分的分段预览功能使用

请求参数

Body 参数application/json
info_list
object 
必需
data_source_type
string 
必需
file_info_list
object 
必需
process_rule
object 
必需
rules
object 
必需
mode
string 
必需
indexing_technique
string 
必需
doc_form
string 
必需
doc_language
string 
必需
示例
{
    "info_list": {
        "data_source_type": "upload_file",
        "file_info_list": {
            "file_ids": [
                "c969a6f5-89e5-41b6-8dbc-cff937ec52b2"
            ]
        }
    },
    "process_rule": {
        "rules": {
            "pre_processing_rules": [
                {
                    "id": "remove_extra_spaces",
                    "enabled": true
                },
                {
                    "id": "remove_urls_emails",
                    "enabled": false
                }
            ],
            "segmentation": {
                "separator": "\n\n, \n, 。, !, ?, ",
                "max_tokens": 500,
                "chunk_overlap": 50
            }
        },
        "mode": "custom"
    },
    "indexing_technique": "economy",
    "doc_form": "text_model",
    "doc_language": "Chinese"
}

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'http://172.29.50.10:2333/zhixin_agent/knowledge_database/indexing_estimate' \
--header 'Content-Type: application/json' \
--data-raw '{
    "info_list": {
        "data_source_type": "upload_file",
        "file_info_list": {
            "file_ids": [
                "c969a6f5-89e5-41b6-8dbc-cff937ec52b2"
            ]
        }
    },
    "process_rule": {
        "rules": {
            "pre_processing_rules": [
                {
                    "id": "remove_extra_spaces",
                    "enabled": true
                },
                {
                    "id": "remove_urls_emails",
                    "enabled": false
                }
            ],
            "segmentation": {
                "separator": "\n\n, \n, 。, !, ?, ",
                "max_tokens": 500,
                "chunk_overlap": 50
            }
        },
        "mode": "custom"
    },
    "indexing_technique": "economy",
    "doc_form": "text_model",
    "doc_language": "Chinese"
}'

返回响应

🟢200成功
application/json
Body
total_segments
integer 
必需
preview
array [object {2}] 
必需
content
string 
必需
child_chunks
null 
必需
qa_preview
null 
必需
示例
{
    "total_segments": 4,
    "preview": [
        {
            "content": "皖政秘〔2020〕181 号 \n \n \n安徽省人民政府关于 2019 年度 \n全省开发区综合考核评价结果的通报 \n \n各市人民政府,省政府各部门、各直属机构: \n近年来,在党中央、国务院及省委、省政府的坚强领导下,\n各地、各部门坚持以习近平新时代中国特色社会主义思想为指\n导,全面贯彻党的十九大和十九届二中、三中、四中全会精神,\n真抓实干、锐意创新,开发区创新升级步伐明显加快,为全省经\n济高质量发展提供了持续强劲动能",
            "child_chunks": null
        },
        {
            "content": "根据《安徽省人民政府关于\n促进全省开发区改革和创新发展的实施意见》 (皖政〔2017〕98\n号)等文件精神,省有关部门组织开展了全省开发区 2019 年度\n综合考核,合肥高新技术产业开发区、合肥经济技术开发区、安\n徽滁州高新技术产业开发区、郑蒲港新区现代产业园区、芜湖高\n新技术产业开发区、安徽全椒经济开发区、安徽阜阳界首高新技\n术产业开发区、安徽肥西经济开发区、安徽来安经济开发区、中\n新苏滁高新技术产业开发区、芜湖经济技术开发区、安徽黄山高\n新技术产业开发区、安徽舒城经济开发区、马鞍山经济技术开发— 2 — \n区、宣城经济技术开发区、安徽长丰(双凤)经济开发区、安徽\n亳州高新技术产业开发区、安徽蚌埠淮上经济开发区、安徽广德\n经济开发区、滁州经济技术开发区、淮南高新技术产业开发区、\n安徽新芜经济开发区、安徽亳州谯城经济开发区、安徽当涂经济\n开发区、安徽芜湖鸠江经济开发区、安徽太和经济开发区、桐城\n经济技术开发区、安徽濉溪经济开发区、马鞍山慈湖高新技术产\n业开发区等排名居前列,现予通报",
            "child_chunks": null
        },
        {
            "content": "各地、各部门要深入学习贯彻习近平总书记考察安徽重要讲\n话指示精神,坚定不移贯彻新发展理念,坚持稳中求进工作总基\n调,坚持改革开放,坚持高质量发展,深化供给侧结构性改革,\n扎实做好“六稳”工作,全面落实“六保”任务,咬定目标、持\n续发力,全力推进开发区开放创新、科技创新、体制创新,奋力\n在构建新发展格局中实现更大作为,在加快建设美好安徽上取得\n新的更大进展",
            "child_chunks": null
        },
        {
            "content": "安徽省人民政府 \n2020 年10 月 11 日 \n \n抄送:省委各部门,省人大常委会办公厅,省政协办公厅,省监委, \n省高院,省检察院,省军区 \n各民主党派省委,省工商联,各人民团体,中央驻皖各单位",
            "child_chunks": null
        }
    ],
    "qa_preview": null
}
修改于 2025-06-11 03:22:57
上一页
文件解析接口
下一页
二进制文件
Built with