- 补丁修复 – 0.9.1 修复了 UI 中普通推理会话的流式传输。
0.9 版本说明
我们现在在 Helix 中支持 RAG。您可以从主页上传文档并对其执行 RAG:
我们还将“推理”和“微调”切换为更通用、更用户友好的“聊天”和“学习”:
现在默认的学习模式是 RAG,因为它比微调快得多。RAG 更擅长检索具体事实,而微调更擅长回答有关上传文档的一般问题。
您仍然可以进行微调,可以从应用程序主页选择微调,也可以使用设置按钮:
您现在还可以在 Helix Apps 中指定 RAG 并微调数据源 helix.yaml
使用 RAG 数据源或微调 LLM 自定义助手。为此,运行 RAG 或微调会话,现在将创建“数据源 ID”。检索 rag_source_data_entity_id
从 RAG 会话中的信息按钮,如下所示:
"rag_source_data_entity_id": "c6cc22d3-23a6-4b2d-acdd-6f561158e0c0",
并将其放入 helix.yaml
像这样在 GitHub 仓库中创建文件:
name: My Test Helix RAG App
description: This is a test Helix RAG app
assistants:
- name: My Example RAG Assistant
description: This is an example assistant with a rag source
rag_source_id: 8b4ff837-b42e-41d2-a5cd-fc7f6c26e08f
然后按照文档说明使用 Helix Apps 这里
这 rag_source_id
在进行 API 调用时也可以作为 API 参数被覆盖。
您可以对名为 finetune_data_entity_id
在信息面板中指定 helix.yaml
作为 lora_id
。
完整更新日志: 0.8.7...0.9.1