网站备案后改域名,长安建网站公司,wordpress 4.5 漏洞,郑州网站优化紧接着第一篇#xff0c;什么是大模型#xff0c;这篇文章讨论一下大模型的应用场景和应用方式有哪些#xff1f; 基础使用
随着 GPT 的出现#xff0c;AI 大模型已经越来越多得出现在日常生活和学术研究#xff0c;工作中。
按照使用方向有以下几种#xff1a;
自然语… 紧接着第一篇什么是大模型这篇文章讨论一下大模型的应用场景和应用方式有哪些 基础使用
随着 GPT 的出现AI 大模型已经越来越多得出现在日常生活和学术研究工作中。
按照使用方向有以下几种
自然语言处理翻译、文字理解、聊天机器人、情感分析、文本生成和语义分析等。多模态图像识别、图像生成、图像增强、人脸识别文本和语音之间的转换。代码模型生成单元测试添加注释解释代码。例如 IDEA 的各种插件比较出名的有 Github Copilot通义千问插件等。文档处理将大量文档数据输入给大模型让大模型充当客服助手生成文案等其本质也算是自然语言处理。
上述内容是大模型在实际应用的最终表现形式。那么这些最终产品是怎么构建出来的在那里使用到了大模型
进阶使用
RAG
RAG 全称为Retrieval-Augmented Generation检索增强生成。
随着大模型的发展其已经被用于到业务场景中。但是目前也存在一些较为突出的问题。
领域知识缺乏大模型的知识来源于训练数据这些数据主要来自公开的互联网和开源数据集无法覆盖特定领域或高度专业化的内部知识。模型难以处理实时信息因为训练过程耗时严重且成本较高。模型一旦训练完成就难以获取和处理新信息。数据安全在企业内部数据安全至关重要没有企业愿意把自身数据上传到第三方平台训练大模型。偏见问题和第一篇文章类似模型的回答基于大模型其底层是一系列复杂的数值计算。有时候也会正儿八经的胡说八道。
RAG 技术通过引入外部知识库利用检索模块从大量文档中提取相关信息并将这些信息传递给生成模块从而生成更准确且有用的回答。也是当今大模型最火的应用方案。
RAG 原理图如下 通过检索技术获取相关的知识然后融入 Prompt 中让大模型能够参考相应的知识从而给出合理回答。因此可以将 RAG 的核心理解为 “检索生成”。前者主要是利用向量数据库的高效存储和检索能力召回目标知识后者则是利用大模型和Prompt工程将召回的知识合理利用生成目标答案。
流程大致为
数据准备阶段数据提取——文本分割——向量化embedding——数据入库应用阶段用户提问——数据检索召回——注入 Prompt——LLM 生成答案
应用场景为
私域知识库客服助手等。
Agent
如果你看过钢铁侠你肯定对钢铁侠的助手——贾维斯 不陌生。其便是最经典的 Agent 例子。
Agent 的定义如下是一种构建于大型语言模型LLM之上的智能体它具备环境感知能力、自主理解、决策制定及执行行动的能力。 智能体能够模拟思维过程灵活调用各种预定义的 Tools 工具逐步达成想要实现的目标。 其大致可以分为如下步骤
感知Perception输入Prompt和外部环境Env信息处理Agent 大脑 Brains 信息存储Store memory大模型对信息进行处理基于感知指定计划Planning做出具体性的响应计划执行Action调用 Tools 或者 Function Calling 调用外部 API输出Output输出 Agent 执行的结果
一个使用场景
感知我今天有点发烧昨晚没有盖好被子并且天气很冷信息存储基于 memory 发现有没有类型记录或者基础疾病等信息大模型基于感知推断感冒了指定计划需要请假打车去看病写好假条叫好车等执行调用请假和打车APITools 和 app 交互完成一系列动作输出已经帮您写好了假条打好了车。
AGI
AGI通用人工智能是 AI 发展的终极目标是让智能系统具备像人类一样理解和处理各种复杂情况与任务的能力。在实现过程中**AI 大模型、Prompt Engineering、Agent 智能体、知识库、向量数据库、RAG **和其他关键技术扮演着至关重要的角色。这些技术元素在多样化的形态中相互协作推动 AI 技术持续向前发展。
参考
https://gitcode.csdn.net/65ed7b8d1a836825ed79ae58.htmlhttps://53ai.com/news/LargeLanguageModel/2024081492481.html