发布 0.9.1 – UI 和应用程序中的 RAG 支持 + 流式传输修复 · helixml/helix · GitHub

  • 补丁修复 – 0.9.1 修复了 UI 中普通推理会话的流式传输。

0.9 版本说明

我们现在在 Helix 中支持 RAG。您可以从主页上传文档并对其执行 RAG:

我们还将“推理”和“微调”切换为更通用、更用户友好的“聊天”和“学习”:

图像

现在默认的学习模式是 RAG,因为它比微调快得多。RAG 更擅长检索具体事实,而微调更擅长回答有关上传文档的一般问题。

您仍然可以进行微调,可以从应用程序主页选择微调,也可以使用设置按钮:

图像

您现在还可以在 Helix Apps 中指定 RAG 并微调数据源 helix.yaml 使用 RAG 数据源或微调 LLM 自定义助手。为此,运行 RAG 或微调会话,现在将创建“数据源 ID”。检索 rag_source_data_entity_id 从 RAG 会话中的信息按钮,如下所示:

        "rag_source_data_entity_id": "c6cc22d3-23a6-4b2d-acdd-6f561158e0c0",

并将其放入 helix.yaml 像这样在 GitHub 仓库中创建文件:

name: My Test Helix RAG App
description: This is a test Helix RAG app
assistants:
- name: My Example RAG Assistant
  description: This is an example assistant with a rag source
  rag_source_id: 8b4ff837-b42e-41d2-a5cd-fc7f6c26e08f

然后按照文档说明使用 Helix Apps 这里

rag_source_id 在进行 API 调用时也可以作为 API 参数被覆盖。

您可以对名为 finetune_data_entity_id 在信息面板中指定 helix.yaml 作为 lora_id

完整更新日志0.8.7...0.9.1

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​