Awesome-AI

Awesome-AI

收集分享 AI 大型语言模型 (LLM)、AI 辅助编程、AI 绘画等领域的常用资料,探索生成式人工智能的应用与开发。

Stars: 157

Visit
 screenshot

Awesome AI is a repository that collects and shares resources in the fields of large language models (LLM), AI-assisted programming, AI drawing, and more. It explores the application and development of generative artificial intelligence. The repository provides information on various AI tools, models, and platforms, along with tutorials and web products related to AI technologies.

README:

Awesome AI

收集分享 AI 大型语言模型 (LLM)、AI 辅助编程、AI 绘画等领域的常用资料,探索生成式人工智能的应用与开发。

目录

🔍 提醒:善用搜索,按 Ctrl+F 或 ⌘F 定位到你想找的关键词。
💡 持续更新中,建议添加到浏览器收藏夹,平常一定会用到。

Book

大型语言模型  

OpenAI GPT / o1 / ChatGPT  

Claude

  • 简介:Anthropic 公司发布的多模态 AI 模型。Claude 的模型规模从小到大分别有 Haiku、Sonnet、Opus 三个版本。
  • 官网:https://www.anthropic.com/claude
  • Web 产品(Claude):
    • 入口:https://claude.ai/ (需要验证海外手机号)
    • 定价:有免费版。专业版套餐 $20 / 月。
  • 相关资料:

Google Gemini  

百度文心大模型 / 文心一言  

智谱 GLM / ChatGLM(智谱清言)  

Moonshot AI / Kimi

更多

AI 编程  

GitHub Copilot  

Cursor

  • 简介:AI 辅助编程领域的后起之秀。Cursor 是一款编辑器,基于 VS Code 内核。除了基础的代码补全功能以外,它还提供了批量补全、预测下一步操作、智能对话、多文件编辑等高级功能。
  • 官网:https://cursor.com/
  • 定价:https://cursor.com/pricing
    • 免费版(两周的专业版试用期 + 2000 次补全 + 有限次对话请求):免费
    • 专业版(无限次补全 + 每月 500 次快速对话请求 + 无限次慢速对话请求):$20 / 月

其他

  • AI 编辑器 / 编辑器插件:
    • Windsurf:Codeium 出品的一款代码编辑器,基于 VS Code 内核,集成了 Agent 能力,支持各种高级的 AI 辅助编程功能。新用户可获得 2 周的专业版套餐试用期。
    • Cline(原名 Claude Dev):VS Code 插件,融合了 Agent 思维,通过对话生成(或修改)项目代码。需自备 LLM API。已开源
    • CodeGeeX:智谱旗下的智能编程助手。支持 20 多种编程语言,适配 VS Code 和 JetBrains IDE 等主流开发工具。个人用户免费。企业用户可选择私有化部署服务。
    • MarsCode:字节跳动豆包大模型旗下的智能编程助手。提供智能补全、智能预测、智能问答等能力,适配 VS Code 和 JetBrains IDE 等主流开发工具。个人用户免费。
    • 通义灵码:阿里云出品的编辑器插件,支持 VS Code 和 JetBrains IDE 等。个人用户免费。
    • 腾讯云 AI 代码助手:腾讯云出品的编辑器插件。个人用户免费。
    • 文心快码:百度出品的编辑器插件。个人用户免费。
    • CodeFuse:蚂蚁集团出品的编辑器插件。个人用户免费。
    • Codeium:编辑器插件,支持 VS Code 和 JetBrains IDE 等。
      • 定价:个人版(代码建议 + 对话):免费
    • Tabnine:编辑器插件,支持 VS Code 和 JetBrains IDE 等。
      • 定价:基础版(基础的代码补全功能):免费
    • Amazon CodeWhisperer:编辑器插件,支持 VS Code 和 JetBrains IDE 等。
      • 定价:个人版(代码建议 + 参考跟踪 + 安全扫描):免费
  • 网页设计与生成工具:
    • Bolt.new:StackBlitz 出品的 AI 编程工具,可在线生成、编辑、运行、部署全栈网站,一站式解决网站开发需求。支持多种基于 JS 的前后端技术栈。
    • v0.dev:Vercel 出品的 AI 网页设计开发工具。通过对话生成网页,可一键发布。主力支持 shadcn/ui (React) + Tailwind 技术栈,后续会支持更多前端技术栈。有免费配额。
    • Wegic:AI 驱动的网页 UI 设计和开发工具。通过自然对话快速生成网站,可通过对话持续修改,可一键发布。
    • OpenUI:开源项目,AI 自动生成前端代码。可根据描述生成 UI 界面,且可以持续输入描述进行修改,可输出 HTML、React、Vue 组件等格式。支持输入中文描述。在线演示
  • 其他工具:
    • CopyCoder:把网页设计稿、原型图转换成适合 AI 编程工具处理的提示词,适合与 Cursor、Windsurf、Bolt.new、v0.dev 等工具配合使用。
    • Devin:Cognition Labs 推出的 AI 编程机器人,有很强的自主学习和工作能力。内测申请排队中,还未正式开放。
    • Gru.ai:一款在线的编程助手 AI Agent,根据用户的任务生成代码,支持 Python 和 TS 语言。
  • 推荐书籍:

AI 绘画 / 音频视频创作  

AI 绘画

  • Midjourney :是一款热门的 AI 绘画工具,早期依托 Discord 平台提供服务,现已推出独立网页版应用。它易于入门,作品风格华丽,适合初学者探索 AI 艺术创作,创造独特的视觉作品。

    • 定价:
      • 基础版套餐(3.3h Fast Time):$10 / 月
      • 标准版套餐(15h Fast Time + Unlimited Relax Time):$30 / 月
      • 专业版套餐(30h Fast Time + Unlimited Relax Time):$60 / 月
      • 至尊版套餐(60h Fast Time + Unlimited Relax Time):$120 / 月
  • OpenAI DALL·E :OpenAI 出品的图片生成工具。对提示词的理解能力极强,与 ChatGPT 的整合也令它极为易用。

  • Stable Diffusion :是一款先进的人工智能图像生成模型,由 Stability AI 开发。可本地部署。因其开源特性,发展迅速,已经成长为一个庞大的生态,广泛应用于艺术创作、设计和多媒体制作等领域。

  • FLUX.1:是一个全新的开源图像生成模型。它由 Black Forest Labs 开发,该团队也是 Stable Diffusion 的幕后团队。

AI 视频生成

  • Runway Gen-2:视频生成领域的热门产品。它提供了多种 AI 视频生成模型,包括文生视频、图文生成视频、图生视频、风格化渲染、局部叠加渲染、3D 模型渲染等功能。有免费额度。官网
  • Pika:视频生成领域的热门产品,典型功能为图生视频。新版本主打趣味视频生成功能。有免费额度。
  • PixVerse:视频生成工具,支持文生视频、图生视频、人物生成视频等。有免费额度。
  • Stable Video Diffusion:Stability AI 发布的开源的视频生成模型。可本地部署。
  • OpenAI Sora:OpenAI 发布的视频生成模型。可实现文生视频、图生视频、视频延长和衔接。生成视频长达一分钟。目前仅面向安全领域和创作领域的专家开放内测,还没有正式开放。
  • 可灵大模型 / 可灵AI:快手出品的视频生成大模型,支持文生视频、图生视频、视频续写等能力。支持最长 3 分钟高清视频生成,堪称 “中国版 Sora”。
  • 智谱清影:智谱 AI 推出的视频生成工具,支持文生视频、图生视频等功能,比如 “老照片动起来” 等应用。可生成 10 秒、4K 分辨率、60 帧高清视频。目前免费开放,支持 API 调用。
  • Vidu:Vidu 是由清华大学朱军教授团队研发的 AI 视频生成器。支持生成高逼真度的 4 秒或 8 秒 1080p 高清视频。亮点包括生成速度快、角色一致性、支持写实和动漫风格、生成效果连续流畅等,可应用于游戏、影视、教育等领域。
  • Luma Dream Machine:Luma AI 出品的视频生成模型。支持文生视频、图生视频,可生成 5 秒长度的视频。有免费额度。
  • 剪映专业版(国内版) / CapCut(海外版):字节跳动出品的视频编辑工具,支持 Windows/Mac。它集成了大量基于 AI 技术的音视频处理功能,比如生成字幕、生成配音、降噪、变声、数字人、文生视频等等。

3D 建模

  • Zero-1-to-3 (zero123): Zero-shot 单张图片生成 3D 物体。哥伦比亚大学的开源项目。
  • One-2-3-45:“Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization”。开源项目。
  • Wonder3D:“Wonder3D produces consistent multi-view normal maps and corresponding color images, and thus reconstructs high-fidelity textured mesh from a single image in only 2~3 minutes”。开源项目。
  • Stable Zero123:单张图片生成高质量 3D 物体。Stability AI 开源模型,可整合到 ComfyUI 工作流。
  • DreamGaussian:Generative Gaussian Splatting for Efficient 3D Content Creation。开源项目。
  • Tripo AI:通过文本或图片生成高质量 3D 模型,可下载。有免费配额。
  • Genie:Luma AI 出品的一款通过文本生成 3D 模型的 AI 工具。目前依托 Discord 提供服务。
  • Luma AI:通过视频来重建 3D 场景。你只需要有一台手持拍摄设备,按要求对物体进行 360°旋转拍摄。有网页版和 iOS App。

数字人 / 语音驱动视频 / TTS

TTS:Text to Speech,文本生成语音。

  • Fish Audio:多功能 AI 音频工具,支持中英等语言,提供文本转语音(TTS)和 语音转文本(ASR)等功能。
  • 万兴播爆:输入文案,一键生成数字人播报视频。
  • 剪映:可生成数字人播报视频。
  • HeyGen:生成数字人播报视频,视频翻译,语音克隆。
  • Eleven Labs:文本转语音(TTS),通过文字描述生成音效,语音克隆,视频翻译配音。有 API。
  • EMO:阿里发布的(图片 + 音频 → 视频)大模型,生成的人物嘴形和表情相当自然。
  • ChatTTS:开源的文本转语音(TTS)模型,支持中文和英文。可以控制停顿和笑声等人性化特征,生成结果自然流畅。
  • ChatTTS webUI:一个简单的本地网页界面,使用 ChatTTS 将文字合成为语音,同时支持对外提供 API 接口。已开源。
  • Seed-TTS:字节跳动发布的高质量、多功能语音生成模型,未开源,似乎也没有发布可用的产品。支持音色微调、带情绪的 TTS、音色转换、情绪转换、基于原语音生成新语音、语音内容编辑、调速等能力。可应用于有声读物、翻译视频等场景。
  • 剪映:已上线 AI 克隆音色的功能,只能克隆自己的音色。
  • 微软 Azure AI 语音:微软的云服务,支持语音转文本、文本转语音、语音翻译和说话人辨识等功能。
  • LivePortrait:快手开源的人物肖像控制模型,可通过五官视频驱动图片生成视频,或修改其他视频。在线体验
  • ReSyncer:一个研究项目,通过语音和视频模板素材,生成更自然的唇形视频。可应用于数字人场景。目前只有研究论文,还没有公开可用的产品。
  • MaskGCT:香港中文大学(深圳)与趣丸科技合力打造的最新一代语音克隆模型,已开源,具备零样本 TTS 能力(只需 1 秒声音样本即可克隆)。在线试用
  • Ultralight-Digital-Human:一个超轻量级、可以在移动端实时运行的数字人模型,已开源。
  • clone-voice:一个带 web 界面的声音克隆工具,使用你的音色或任意声音来录制音频。支持 Windows、Mac 和 Linux。已开源。

在线 SD 绘画

  • Leonardo.Ai:易用且强大的 AI 绘图平台,底层基于 SD,深度集成 SD 各种插件,提供训练好的模型,可训练模型。有免费配额。
  • eSheep 电子羊:体验在线的 WebUI 和 ComfyUI。新用户获得 100 积分。每 100 积分相当于 ¥1。
  • 网易 AI 设计工坊:在线 WebUI,可训练模型。有免费配额,每天 10 次。
  • LibLib AI:在线 WebUI,可训练模型。有免费配额,每天 300 积分。
  • Cephalon Cloud 端脑云:云端一键部署自己的 WebUI 和 ComfyUI。新用户获得 2000 积分。每 1000 积分相当于 ¥1。
  • 即梦 AI:字节跳动出品的在线绘画平台,主打易用和免费。原名 “Dreamina”。

音乐歌曲创作

  • Suno:AI 根据你的要求生成歌曲(作词、作曲、演唱)。
  • 天工 AI 音乐:根据歌名、歌词、参考音频创作音乐,可由 AI 帮写歌词。

音频视频处理

  • vocal-separate:一个极简的人声和背景音乐分离工具,本地化网页操作,无需连接外网。已开源。
  • pyVideoTrans:开源视频翻译软件,一键字幕生成 + 字幕翻译 + 创建配音 + 合成 = 带字幕和配音的新视频。
  • GVS 硬字幕提取:智能识别视频硬字幕,快速提取,支持中英文。

其他创作工具

  • 神采 / PromeAI:图片生成和编辑工具,包括草图渲染、照片转线稿、局部重绘、抠图去背景、换背景、扩图、重打光、高清放大、文字融合、AI 写真、图生视频等。有免费配额。
  • DomoAI:视频风格转绘,比如把一段现有视频转换为二次元日漫、像素风、油画、3D 皮克斯动画等风格。此外还有文生图、图生图、图生视频等功能。有免费配额。
  • Comic AI:AI 漫画制作工具。有免费配额。
  • Logo Diffusion:AI 设计 Logo 工具,主要功能有:提示词生成 Logo、图片转 Logo、用提示词修改 Logo、手绘草稿美化、2D 转 3D。有免费配额。
  • AutoPod:Premiere Pro 插件,自动完成多机位剪辑、停顿切除。
  • Canva 可画:老牌的在线设计工具,提供了大量模板和设计元素,支持 AI 设计。
  • FaceSwap:多功能的在线换脸工具。支持图片换脸、多人换脸、视频换脸等功能。有免费配额。
  • Remaker - Face Swap Online Free:免费的在线换脸工具,支持图片换脸。
  • 绘蛙:面向电商领域的 AI 模特换装生图工具。阿里出品。
  • OOTDiffusion:一个开源的 “试衣” 模型。在线演示
  • TryOffDiff:一个开源的 “脱衣” 模型,从图片中提取服装标准图。在线演示

(持续更新中……)

常用 AI 网站 / 工具  

综合平台

  • POE:各种知名模型的聚合平台。用户可根据自己的需求通过 Prompt 定制对话机器人,相当于 GPTs 平替。付费用户可无限量使用 GPT-4、Claude 2 等高端模型。
  • FlowGPT:一个 Prompt 分享平台。提供了角色聊天、游戏、创意、生产力等各种类型的对话机器人,是一个学习提示词的好地方。也可以把它当作 GPTs 平替。
  • Character.AI:与各种类型的 AI 虚拟角色对话,包括世界名人、动漫人物、游戏角色等。
  • Coze:字节跳动推出的 AI 聊天机器人及 AI 应用开发平台。无论是否具备编程基础,用户都可以快速构建特定功能的聊天机器人,并发布到各大社交平台。
  • GPTsCopilot:第三方 GPTs 商店,提供 GPTs 中转访问服务。在 GPTs 的网址中,把 openai.com 改成 openai-now.com 就可以切换到 GPTsCopilot 提供的中转访问服务,无需成为 ChatGPT Plus 会员即可使用 GPTs。
    • 定价:https://gptscopilot.ai/pricing
      • 基础版(每天 5 积分):免费
      • 专业版(每月 1500 积分):$9.99 / 月
      • 按需付费方案:$5.99 / 500 积分 或 $9.99 / 1000 积分
  • Toolify.ai:AI 工具分类导航目录。
  • There's An AI For That (TAAFT):提问我的需求可以用哪些 AI 工具来实现。
  • 通往 AGI 之路 / WayToAGI:AI 工具(包含网站和 GPTs)分类导航目录,也可搜索。
  • ChandlerAi:国内可用的 AI 助手,可调用 GPT-4、Claude 3 Opus、Gemini、DALL·E 等先进模型。需要付费。

图像处理 / 图形设计 / UI 设计

写作 / PPT 幻灯片

  • Notion AI:Notion 中的 AI 写作助手。增值服务,每月 $10。
  • 蛙蛙写作:国产写作模型,写长篇小说、视频脚本、论文等。免费试用 3000 字。
  • 讯飞智文:Word、PPT 一键生成、AI 撰写助手、多语种互译、AI 自动配图、PPT 转演讲稿等。
  • 腾讯文档:AI 助手提供生成 PPT、生成文档、生成表格、生成思维导图、生成收集表等功能。
  • Gamma:AI 设计助手,生成 PPT、文档和网页,优化现有 PPT 和文档。
  • AiPPT.cn:AI 一键生成 PPT。支持自动生成 PPT 大纲文案,文档秒变 PPT,支持多种模板,兼容 pptx 格式。
  • ProcessOn:老牌在线图表绘制工具,支持流程图、泳道图、思维导图、架构图、建筑平面图等等形式。支持 AI 自动生成图表。

内容分析、识别、提炼

  • 通义听悟:语音文件识别为文本,拆分章节,提炼关键信息,识别多人发言,适合处理录音采访、播客、会议记录等内容。
  • MinerU:一站式、开源、高质量的数据提取工具,包含 PDF 文档、网页与电子书的内容提取并转换等 Markdown 等功能。在线体验
  • Elicit:以超人速度分析论文。自动化耗时的研究任务,如总结论文、提取数据和汇总结论。
  • Monica:多功能 AI 工具箱,有浏览器插件、桌面应用和移动 App。最为人熟知的功能是基于网页内容的总结和问答。
  • 剪映:可识别语音生成字幕。

定制知识库 / RAG

RAG:Retrieval-Augmented Generation,检索增强生成。是目前基于 LLM 实现 “外挂知识库” 的主流技术方案。

  • SiteGPT:基于你的官网内容和上传文档创建客服机器人,解答客户的咨询。
  • Dify:LLM 应用开发平台,支持各种大模型,提供 Prompt 编排、RAG、Agent 框架、工作流编排等功能。
  • RAGFlow:一款基于深度文档理解构建的开源 RAG 引擎。
  • MaxKB:基于 LLM 大语言模型的知识库问答系统。开箱即用,支持快速嵌入到第三方业务系统。

广告 / 营销

  • AdIntelli:面向 GPTs 生态的广告联盟(可靠性待验证)。
  • GPT Wallets:为 GPTs 提供支付和数据分析解决方案。

API 聚合平台

  • GitHub Models:GitHub 提供的免费 LLM API,包含 GPT-4o、Meta Llama 3、Cohere 等模型,调用频率有限制。相关攻略
  • API2D:提供 GPT 系列、Claude、嵌入、绘图等 API,高速稳定,支付便捷。
  • OpenRouter:提供 GPT、Claude、Gemini、Llama、Qwen 等系列 API 服务。

其他工具 / 开源项目

  • Perplexity:AI 搜索。
  • 秘塔 AI 搜索:更友好的搜索引擎,帮你整理信息后更有条理地呈现。有 “全网” 和 “学术” 两种搜索模式,搜索深度可选简洁、深入、研究。
  • 天工 AI:AI 搜索、对话助手等。
  • Devv.AI:一款面向程序员的 AI 搜索引擎,为编程问题提供快速准确的答案。
  • PromptPerfect:帮你优化提示词(Prompt)。比如把你的笼统需求拆解为多步骤的任务,以提高模型输出的准确性;又比如根据给定的文章主题生成大纲并撰写长文。
  • AppAgent:腾讯研究团队的开源项目,基于大语言模型的手机端多模态智能代理,帮用户自动执行复杂任务。适用于 Android 手机和模拟器。可粗略类比为手机端的按键精灵。
  • ProctorAI:AI 监工,号称 “拖延症终结者”。开源项目,本地应用程序,通过定时截图来检查你是否在摸鱼,并发出警告,支持语音提醒。可以设置详细的监督规则。底层调用了 GPT-4o 等多模态模型。
  • llm_aided_ocr:LLM 辅助 OCR,通过大模型来提升 OCR 的准确性。

教程

法规 / 公告

(持续更新中……)


常见问题  

有什么简便的方式可以使用 GPT-4 和 GPTs?  

建议先通过 ChatGPT Plus 拼车账号开始体验,即买即用。解锁 GPT-4 + DALL·E 绘图 + GPTs 等高端功能。需自备海外线路。

这里推荐一个老牌的拼车平台,稳定可靠。点此开始拼车(还可用九五折优惠码 ai2024)。

AI 生成内容的版权(著作权)属于谁?

简单说一下结论:

  • 如果 AI 服务商的用户协议中主张了 AI 生成内容的著作权,则属于 AI 服务商。
  • 否则属于使用 AI 服务生成内容的用户。

详细解释:你用 AI 生成的作品,版权归你吗?

微信群  

加入群,快人一步获取 AI 资讯、与数百名同好交流:

qun-qr


License

  • Text and graphics: © Creative Commons BY-NC-ND 4.0
  • Code: GPLv3

For Tasks:

Click tags to check more tools for each tasks

For Jobs:

Alternative AI tools for Awesome-AI

Similar Open Source Tools

For similar tasks

For similar jobs