LLM-Navigation

LLM-Navigation

大模型学习导航

Stars: 110

Visit
 screenshot

LLM-Navigation is a repository dedicated to documenting learning records related to large models, including basic knowledge, prompt engineering, building effective agents, model expansion capabilities, security measures against prompt injection, and applications in various fields such as AI agent control, browser automation, financial analysis, 3D modeling, and tool navigation using MCP servers. The repository aims to organize and collect information for personal learning and self-improvement through AI exploration.

README:

LLM-Navigation

0. 写在前面

最近学了不少关于大模型的东西,但是随着学得越来越多也越来越杂,有时候想用到之前的一些东西的时候又忘了在哪里,意识到还是需要系统整理与收集一些资料,因此本仓库主要是记录平时的一些学习记录,同时也想通过AI找到另一个自我。

2025年3月16日

碎碎念:框架也是慢慢搭建

1. 基础篇

先补近期学的东西过于基础的后面慢慢补上

  • 大模型基础知识

  • RAG(选看)

    • 为什么RAG系统"一看就会,一做就废"?
      • 探讨了检索增强生成(RAG)系统在工程实践中的12个常见问题及其优化策略,涵盖数据清洗、分块处理、嵌入模型选择、元数据使用、多级索引、查询转换、检索参数设置、高级检索策略、重排模型、提示词设计和大语言模型选择等环节。
    • 高阶RAG技巧:探索提升RAG系统性能的不同技巧
      • 和上一篇类似,详细介绍了通过索引优化、预检索优化、检索优化和后检索优化等高级技术来提升RAG系统性能的方法,从而提高检索准确性和生成响应的质量。
    • 为什么RAG一定需要Rerank?
      • 本文探讨了在检索增强生成(RAG)系统中,当单纯依赖向量搜索和大语言模型(LLM)无法达到理想效果时,如何通过引入重排序(Rerank)技术来提升性能,解决召回率与上下文窗口限制之间的矛盾,并详细解释了Rerank的原理、优势及其在两阶段检索系统中的应用。不过没有实际例子,当科普文学习即可.
    • 大模型 RAG 终极指南:信息检索 + 文本向量化 + BGE-M3 实践全解析!
      • 系统梳理了RAG技术中的关键知识点,重点解析了信息检索的三大发展阶段、三种embedding类型的工作原理及对比,以及BGE-M3模型的结构、精调方法和reranker重排序机制,为读者掌握文本向量化和信息检索技术提供了全面的理论与实践指导。
    • 实操系列-RAG101
  • Agent & Agentic & ..

    • Agent
      • 一步步教你如何构建一个通用的大模型智能体(LLM Agent)
        • 个人学完感觉非常不错的关于如何设计一个Agent的小白文,文章中详细介绍了构建通用LLM Agent的七个关键步骤:选择合适的LLM、定义控制逻辑与通信结构、制定核心指令、设计并优化工具、制定记忆管理策略、解析Agent输出以及编排下一步操作,同时指出从单Agent原型入手可以为更复杂的多Agent系统奠定基础。
      • Building effective agents
        • 个人看过的关于Agent最好的讲解文章(虽然不是手把手教你如何实现agent,自行百度操作),本篇中分别介绍了传统工作流式的Agent原理并引入了端到端的Agent理念,深度好文.
      • AI Agent 技术栈全景图
        • 全面解析了AI智能体的技术栈和行业格局,详细阐述了从模型服务、存储、工具调用到框架设计和托管部署的各个环节.
      • 理解这10个核心概念,你就学完了OpenAI最新的开源Agents SDK
        • 这篇文章详细解析了OpenAI推出的全新开源Agents SDK的十大关键概念和特性,包括Models、Agents、Runner、Tools、Context、StructuredOutput、Handoffs、Guardrails、Tracing和Orchestrating,并通过一个贯穿始终的案例帮助我们快速掌握这个强大的Agent开发工具。
      • Why Do Multi-Agent LLM Systems Fail?
        • 通过系统分析多智能体大型语言模型系统的执行轨迹,识别出14种失败模式,并将其归类为三大类,提出了第一个结构化的多智能体系统失败分类法(MASFT),并探讨了通过改进规范、角色和对话管理以及验证策略来缓解这些失败模式的可能性和局限性。偷懒的话也可以看这篇微信公众号总结
    • Agentic
      • TODO
    • MOE
    • 其他
      • 全面对比AI Agent 与 Agentic AI
        • 对Agent与Agentic做了概念层的对比:AI Agent是专注于特定任务的智能体,而Agentic AI则是具备高度自主性和适应性的智能系统.
  • 大模型拓展能力

    • MCP
      • MCP官方文档
        • MCP是一个让不同的应用程序和AI模型可以更容易完成行为交互的标准,支持多种传输模式STDIO(本地)和SSE(远程)。(MCP的官方介绍SDK文档,先用起来再具体深入了解他)
      • MCP:昙花一现还是未来标准?
        • 备注:目前来看MCP的核心价值在于允许用户为不可控的AI代理添加自定义工具,无需修改底层代理逻辑,未来期待能成为和Zapier一样实现真正的低代码。在实际生产中,工具需与系统提示词(未来模型能力提升能弥补)、架构高度定制化,MCP的“即插即用”难以实现。
  • 其他

x. 安全篇

X.应用篇

Ps: 无意间看到过的比较有趣的项目都会放进来

  • Agent

    • MobileAgent
      • 阿里巴巴通义实验室出品,简单来讲就是通过指令控制手机完成操作,目前最新版也支持了电脑端操作
    • browser-use
      • 让AI控制浏览器,没记错之前manus也是用的这款.同时提供了webui
    • Browserbase
      • 一个用于运行无头浏览器的平台,原生兼容Stagehand、Playwright、Puppeteer、Selenium等框架,并有丰富的SDK方便开发.
  • 金融

  • 建模

    • blender-mcp
      • 基于MCP实现的通过大模型3D建模 ,炫酷!
  • 生活

    • 浏览器 AI 阅读助手
      • 一款高度灵活的AI浏览器助手,支持多模型配置、完全自定义提示词、Mermaid图表渲染和对话式总结(因为用户高度自定义,新手还能从中顺手学习提示词的写法)。
    • AI 9天完成一本书,客单价1万的全流程分享
      • 这篇文章中我们主要学习的是复杂文本生成任务的AI通用解决思路,可以概括为:明确目标→任务拆解→指令设计→流程化操作→动态调整→结果验证→服务分级

x. 工具/资源篇

  • Function Calling与MCP

    • MCP
      • MCP Server导航站-懒狗必备不想要自己手搓服务可以直接用现成的,但也需要注意安全问题
        • Smithery.ai
          • 华裔青年Henry Mao打造的产品,目前发现交互体验最好的MCP导航网站,每个MCP Server都搭配或生成使用代码.
        • MCP.so
          • 独立开发者idoubi开发的 MCP.so 导航,收录了2k多个Server,数量庞大
        • MCPs.live
          • 没啥好说的,mcp搜索站
        • Composio MCP
          • 每个MCP都可以生成一个SSE URL,开发者技能在自己应用中集成这个MCP的能力,无需从0开发,但可能需要🪜
        • Pulse MCP
          • 已收录了1500+个Server,比较特别的是,网站提供了很多Use Case,让人更直观了解怎么用
  • Prompt

    • PromptUP

      • 一个可以存储并分享Prompt的简单应用.
    • prompt-optimizer

      • AI应用能力的关键就是能否写出优秀的提示词,我们应该学习一个优秀合格的提示词应该是什么样的,在这个项目我们重点关注源码中提示词优化的Prompt部分即可(点我直达)
  • Model

    • Awesome-Chinese-LLM
      • 整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。

NAN

  • AI防洗稿思路(简单粗暴)
  • AI工具集
    • 该收录了数百个国内外不同类型的AI工具,涵盖写作、绘画、图像、视频、办公、对话、编程、设计、音频、搜索、开发平台、法律助手、内容检测、学习网站等多个领域。

For Tasks:

Click tags to check more tools for each tasks

For Jobs:

Alternative AI tools for LLM-Navigation

Similar Open Source Tools

For similar tasks

For similar jobs