当前位置: 首页 > news >正文

网站后台登陆不进去一键下载安装微信

网站后台登陆不进去,一键下载安装微信,手机制作网站软件下载,做一个软件需要哪些技术每个文档存储多个向量通常是有益的。在许多用例中#xff0c;这是有益的。 LangChain 有一个基础 MultiVectorRetriever #xff0c;这使得查询此类设置变得容易。很多复杂性在于如何为每个文档创建多个向量。本笔记本涵盖了创建这些向量和使用 MultiVectorRetriever 的一些常…每个文档存储多个向量通常是有益的。在许多用例中这是有益的。 LangChain 有一个基础 MultiVectorRetriever 这使得查询此类设置变得容易。很多复杂性在于如何为每个文档创建多个向量。本笔记本涵盖了创建这些向量和使用 MultiVectorRetriever 的一些常见方法。 为每个文档创建多个向量的方法包括 较小的块将文档分割成较小的块然后嵌入这些块这是 ParentDocumentRetriever。摘要为每个文档创建摘要将其与文档一起嵌入或代替文档假设性问题创建每个文档都适合回答的假设性问题将这些问题与文档一起嵌入或代替文档。 请注意这还启用了另一种添加嵌入的方法 - 手动。这很棒因为您可以显式添加导致文档恢复的问题或查询从而为您提供更多控制权。 from langchain.retrievers.multi_vector import MultiVectorRetriever from langchain.storage import InMemoryByteStore from langchain_community.document_loaders import TextLoader from langchain_community.vectorstores import Chroma from langchain_text_splitters import RecursiveCharacterTextSplitter# 导入文件 loaders [TextLoader(./txt/faq-4359.txt,encodingutf-8),TextLoader(./txt/faq-7923.txt,encodingutf-8), ] docs [] # 将内容合并 for loader in loaders:docs.extend(loader.load())# 连接模型 from langchain_community.embeddings.huggingface import HuggingFaceEmbeddings embeddings_path D:\\ai\\download\\bge-large-zh-v1.5 embeddings HuggingFaceEmbeddings(model_nameembeddings_path)# 用于索引子块的向量存储 vectorstore Chroma(collection_namefull_documents, embedding_functionembeddings )# 父文档的存储层 store InMemoryByteStore() id_key doc_id# 检索器空启动 retriever MultiVectorRetriever(vectorstorevectorstore,byte_storestore,id_keyid_key, )import uuid # 生成唯一编码 doc_ids [str(uuid.uuid4()) for _ in docs]from langchain_text_splitters import CharacterTextSplitter # 用于创建较小块的分割器 child_text_splitter CharacterTextSplitter(separator\n\n,chunk_size100,chunk_overlap10,length_functionlen,is_separator_regexFalse, )sub_docs [] # 循环分割 for i, doc in enumerate(docs):_id doc_ids[i]_sub_docs child_text_splitter.split_documents([doc])for _doc in _sub_docs:_doc.metadata[id_key] _idsub_docs.extend(_sub_docs)#使用一个名为retriever的对象来向一个向量存储vectorstore中添加文档 #并且使用一个文档存储docstore来设置文档ID与文档内容之间的映射。 #这两个属性分别用于存储文档的向量化表示和文档的内容。 retriever.vectorstore.add_documents(sub_docs) retriever.docstore.mset(list(zip(doc_ids, docs))) # Vectorstore 单独检索小块 retriever.vectorstore.similarity_search(众测商品多久发货呢)[0]#输出结果Document(page_content4、众测商品买下后多久发货\n\n 您好请以商品页显示为准。\n\n5、提交活动订单后多久内支付\n\n 您好提交订单后最长付款时效为24小时逾期订单自动取消, metadata{doc_id: 8f80d02b-6a27-46ae-ad6a-23cc6e1ec5c8, source: ./txt/faq-7923.txt}) 摘要总结 通常摘要可能能够更准确地提炼出某个块的内容从而实现更好的检索。在这里我们展示如何创建摘要然后嵌入它们。 import uuidfrom langchain_core.documents import Document from langchain_core.output_parsers import StrOutputParser from langchain_core.prompts import ChatPromptTemplate from langchain_openai import ChatOpenAI, OpenAI openai_api_key EMPTY openai_api_base http://127.0.0.1:1234/v1 model ChatOpenAI(openai_api_keyopenai_api_key,openai_api_baseopenai_api_base,temperature0.3, ) # 创建链 chain ({doc: lambda x: x.page_content}| ChatPromptTemplate.from_template(总结下面的文档:\n\n{doc})| model| StrOutputParser() ) docs [] for loader in loaders:docs.extend(loader.load())# max_concurrency最大的并行量 summaries chain.batch(docs, {max_concurrency: 5})# The vectorstore to use to index the child chunks vectorstore Chroma(collection_namesummaries, embedding_functionembeddings) # The storage layer for the parent documents store InMemoryByteStore() id_key doc_id # The retriever (empty to start) retriever MultiVectorRetriever(vectorstorevectorstore,byte_storestore,id_keyid_key, ) doc_ids [str(uuid.uuid4()) for _ in docs]summary_docs [Document(page_contents, metadata{id_key: doc_ids[i]})for i, s in enumerate(summaries) ]# 添加文件到检索器 retriever.vectorstore.add_documents(summary_docs) # id和文档的映射 retriever.docstore.mset(list(zip(doc_ids, docs)))sub_docs retriever.vectorstore.similarity_search(众测活动是否有参与限制) 假设性查询 LLM 还可用于生成针对特定文档可能提出的假设问题列表。然后可以嵌入这些问题 from langchain_core.output_parsers import JsonOutputParser promptStr ··· {doc} ···根据上面的文档生成3个相关问题和回答。响应以json列表的结构返回。返回的结构参考如下 ··· [ {{question:问题1,answer:回答1}}, {{question:问题2,answer:回答2}}, {{question:问题3,answer:回答3}} ] ··· prompt ChatPromptTemplate.from_template(promptStr) # 生成链 chain ({doc: lambda x: x.page_content}| prompt| model| JsonOutputParser() ) # 用于设置处理批量数据 hypothetical_questions chain.batch(sub_docs, {max_concurrency: 5})# 生成对应的文档 ocuments [] for item in hypothetical_questions:for obj in item:content 问{}\n答{}.format(obj[question],obj[answer])documents.append(Document(page_contentcontent))# The vectorstore to use to index the child chunks vectorstore Chroma(collection_nameQuestion, embedding_functionembeddings,persist_directory./vector_store) # The storage layer for the parent documents store InMemoryByteStore() id_key doc_id # The retriever (empty to start) retriever MultiVectorRetriever(vectorstorevectorstore,byte_storestore,id_keyid_key, ) doc_ids [str(uuid.uuid4()) for _ in docs]retriever.vectorstore.add_documents(documents)retriever.vectorstore.similarity_search(众测商品多久发货呢)[0]# 输出结果 #Document(page_content问众测商品买下后多久发货\n答您好请以商品页显示为准。)
http://www.lakalapos1.cn/news/39421/

相关文章:

  • 手机网站制作软件做编程网站有哪些方面
  • html5风格网站特色贵州网站制作品牌公司
  • 免费网站制作软件免费的推广平台有哪些
  • 中商华兴建设有限公司网站wordpress安装dplayer
  • 企业网站seo参考文献娄底地seo
  • 网站后缀co互联网公司如何赚钱
  • 简单手机网站开发软件有哪些网站内部链接的策略
  • j2ee博客网站开发月子会所网站源码
  • 网站开发配置表格办公室装修图
  • seo网站建设培训东光网站建设
  • seo sem 外贸建站 网站建设 文化墙设计wordpress导航二级菜单
  • 专业的咨询行业网站制作抖音代运营公司加盟
  • 怎么做企业网站原型人才招聘网站大全
  • 广东住房和建设局网站官网南京企业网站建设
  • 网站建设与维护的国家定价标准北京成立公司
  • 基于jsp的购物网站开发顺德网站优化公司
  • 彩票网站开发有连带江苏省建设工程协会网站
  • 什么软件可以做网站51外链代发网
  • 网站建设报价模板百度智能小程序是什么
  • 网站配色的方案wordpress网页设计教程
  • 易趣网网站建设与维护网站建设与维护考题
  • 做3d图的网站有哪些企业网站用什么技术做
  • 使用unity做网站广西建设工程信息网官网
  • 国外界面设计网站站长号
  • 微网站菜单做pc端网站讯息
  • 宁波做百度网站推广漫画网站源码
  • 天津百度建网站沈阳妇科医生哪个好
  • 惠州自适应网站建设佛山企业网站建站
  • 献县网站建设个人网站建设方案书模板
  • 电商网站在线支付怎么做麻将网站怎么做的