
LightRAG是一款创新的知识图谱增强检索框架,它将传统向量检索与知识图谱的结构化信息相结合,大幅提升了检索准确性和可解释性。与传统的RAG(Retrieval-Augmented Generation)系统相比,LightRAG通过引入轻量级知识图谱,解决了单纯向量检索中遇到的关系缺失、语义模糊等问题。
# 安装核心库
pip install lightrag-core
# 可选:安装GPU加速支持
pip install lightrag-gpu
# 或者从源码安装
git clone https://github.com/lightrag/lightrag.git
cd lightrag
pip install -e .from lightrag import LightRAG
from lightrag.knowledge_graph import KnowledgeGraph
# 初始化知识图谱
kg = KnowledgeGraph()
# 添加实体和关系
kg.add_entity("人工智能", "概念", description="模拟人类智能的系统")
kg.add_entity("机器学习", "技术", description="人工智能的子领域")
kg.add_relation("人工智能", "包含", "机器学习")
# 初始化LightRAG
rag = LightRAG(kg_path="./knowledge_graph.json")
# 或者从文本构建知识图谱
rag.build_from_texts(["人工智能是模拟人类智能的系统。机器学习是人工智能的重要子领域。"])# 检索相关实体
results = rag.search("人工智能的相关技术")
print("检索结果:", results)
# 获取知识子图
subgraph = rag.get_subgraph("人工智能", depth=2)
print("相关知识子图:", subgraph)from lightrag import LightRAGAgent
# 创建RAG代理
agent = LightRAGAgent(rag_model=rag, llm_model="gpt-4")
# 进行增强生成
response = agent.query("请解释人工智能和机器学习的关系")
print("模型回答:", response)from lightrag import RelationExtractor
# 自定义关系提取器
extractor = RelationExtractor(
pattern_rules={
"包含关系": [(["包括", "包含"], "包含")]
}
)
rag.set_extractor(extractor)# 配置索引参数
rag.configure(
index_type="hnsw",
distance_metric="cosine",
graph_traversal_width=50
)
# 启用缓存
rag.enable_cache(max_size=1000)# 从多个数据源构建知识图谱
sources = [
"专业文档1.pdf",
"技术手册.docx",
"研究论文.pdf"
]
for source in sources:
rag.add_document(source)
# 保存知识图谱
rag.save_knowledge_graph("my_domain_kg")from lightrag.evaluation import Evaluator
evaluator = Evaluator(rag)
metrics = evaluator.evaluate(
query_set=["查询1", "查询2"],
ground_truths=[["答案1"], ["答案2"]]
)
print("检索评估指标:", metrics)
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。