Awesome-AI

Awesome-AI

收集分享 AI 大型语言模型 (LLM)、AI 辅助编程、AI 绘画等领域的常用资料,探索生成式人工智能的应用与开发。

Stars: 113

Visit
 screenshot

Awesome AI is a repository that collects and shares resources in the fields of large language models (LLM), AI-assisted programming, AI drawing, and more. It explores the application and development of generative artificial intelligence. The repository provides information on various AI tools, models, and platforms, along with tutorials and web products related to AI technologies.

README:

Awesome AI

收集分享 AI 大型语言模型 (LLM)、AI 辅助编程、AI 绘画等领域的常用资料,探索生成式人工智能的应用与开发。

目录

🔍 提醒:善用搜索,按 Ctrl+F 或 ⌘F 定位到你想找的关键词。
💡 持续更新中,建议添加到浏览器收藏夹,平常一定会用到。

大型语言模型  

OpenAI GPT / ChatGPT  

Claude

  • 简介:Anthropic 公司发布的多模态 AI 模型。最新版 Claude 3 在某些指标上已经超越 GPT-4。Claude 3 的模型规模从小到大分别有 Haiku、Sonnet、Opus 三个版本。
  • 官网:https://www.anthropic.com/claude
  • Web 产品(Claude):
    • 入口:https://claude.ai/ (需要验证海外手机号)
    • 定价:有免费版。专业版套餐 $20 / 月。

Google Gemini  

百度文心大模型 / 文心一言  

智谱 GLM / ChatGLM(智谱清言)  

Moonshot AI / Kimi

更多

AI 辅助编程  

GitHub Copilot  

  • 简介:AI 辅助编程领域的标杆。由 GitHub 和 OpenAI 共同开发,作为编辑器插件集成到开发环境中,支持 VS Code 和 JetBrains IDE 等主流开发工具。通过提供代码建议和自动补全功能,Copilot 能够提高编程效率。此外,它还集成了生成单测、生成注释、转译代码、回答问题等功能。
  • 官网:https://github.com/features/copilot
  • 定价:个人版:$10 / 月(第一个月免费试用)

Cursor

  • 简介:AI 辅助编程领域的后起之秀。Cursor 是一款编辑器,基于 VS Code 内核,集成了 AI 辅助编程和基于当前代码仓库的 AI 问答功能。除了基础的代码补全功能以外,Cursor 还提供了批量补全、预测下一步操作、通过对话修改代码、修改多个文件、生成整个工程等高级功能。
  • 官网:https://cursor.sh/
  • 定价:https://cursor.sh/pricing
    • 免费版(两周的专业版试用期 + 2000 次补全 + 有限次模型请求):免费
    • 专业版(无限次补全 + 每月 500 次快速高级模型请求 + 无限次慢速模型请求):$20 / 月
    • ...

其他

  • Claude Dev:VS Code 插件,融合了 Agent 思维,通过对话生成或修改项目代码。已开源
  • CodeGeeX:智谱旗下的智能编程助手。支持 20 多种编程语言,适配 VS Code 和 JetBrains IDE 等主流开发工具。个人用户免费。企业用户可选择私有化部署服务。
  • 通义灵码:编辑器插件,支持 VS Code 和 JetBrains IDE 等。个人用户免费。
  • Codeium:编辑器插件,支持 VS Code 和 JetBrains IDE 等。
    • 定价:个人版(代码建议 + 对话):免费
  • Tabnine:编辑器插件,支持 VS Code 和 JetBrains IDE 等。
    • 定价:基础版(基础的代码补全功能):免费
  • Amazon CodeWhisperer:编辑器插件,支持 VS Code 和 JetBrains IDE 等。
    • 定价:个人版(代码建议 + 参考跟踪 + 安全扫描):免费
  • JetBrains AI Assistant:全球知名 IDE 厂商推出的第一方 AI 编程助手。提供代码补全建议、重构建议、AI 问答、生成文档、生成提交信息等功能。
    • 定价:专业版:$10 / 月(免费试用 7 天)
  • Devin:Cognition Labs 推出的 AI 编程机器人,有很强的自主学习和工作能力。内测申请排队中,还未正式开放。
  • Gru.ai:一款在线的编程助手 AI Agent,根据用户的任务生成代码,支持 Python 和 TS 语言。
  • 网页设计与生成工具:
    • Bolt.new:StackBlitz 出品的 AI 编程工具,可在线生成、编辑、运行、部署全栈网站,一站式解决网站开发需求。支持多种基于 JS 的前后端技术栈。
    • v0:Vercel 出品的 AI 网页设计开发工具。通过对话生成网页,可一键发布。主力支持 shadcn/ui (React) + Tailwind 技术栈,后续会支持更多前端技术栈。有免费配额。
    • Wegic:AI 驱动的网页 UI 设计和开发工具。通过自然对话快速生成网站,可通过对话持续修改,可一键发布。
    • OpenUI:开源项目,AI 自动生成前端代码。可根据描述生成 UI 界面,且可以持续输入描述进行修改,可输出 HTML、React、Vue 组件等格式。支持输入中文描述。在线演示
  • 书籍推荐:

AI 绘画 / 音频视频创作  

Midjourney  

  • 简介:Midjourney 是一款热门的 AI 绘画工具,依托 Discord 平台提供服务。它易于入门,作品风格华丽,适合初学者探索 AI 艺术创作,创造独特的视觉作品。
  • 官网:https://www.midjourney.com/home
  • 定价:
    • 基础版套餐(3.3h Fast Time):$10 / 月
    • 标准版套餐(15h Fast Time + Unlimited Relax Time):$30 / 月
    • 专业版套餐(30h Fast Time + Unlimited Relax Time):$60 / 月
    • 至尊版套餐(60h Fast Time + Unlimited Relax Time):$120 / 月

OpenAI DALL·E  

Stable Diffusion  

FLUX.1

  • 简介:FLUX.1 是一个全新的开源图像生成模型。它由 Black Forest Labs 开发,该团队也是 Stable Diffusion 的幕后团队。
  • 官网:https://www.basedlabs.ai/tools/flux1

Google Imagen 2

Runway Gen-2

  • 简介:视频生成领域的热门产品。它提供了多种 AI 视频生成模型,包括文生视频、图文生成视频、图生视频、风格化渲染、局部叠加渲染、3D 模型渲染等功能。
  • 官网:https://research.runwayml.com/gen2
  • Web 产品:https://app.runwayml.com/
  • 定价:
    • 免费版(125 积分):免费
    • 标准版(625 积分 / 月):$15 / 月
    • ...

Pika

  • 简介:视频生成领域的热门产品。典型功能为图生视频。
  • 官网:https://pika.art/
  • 定价:
    • 免费版(30 积分):免费
    • 标准版(700 积分 / 月):$10 / 月
    • ...

PixVerse

  • 简介:视频生成工具,支持文生视频、图生视频、人物生成视频等。有免费额度。
  • 官网:https://pixverse.ai/

Stable Video Diffusion

OpenAI Sora

可灵大模型

  • 简介:快手出品的视频生成大模型,支持文生视频、图生视频、视频续写等能力。支持最长 3 分钟高清视频生成,堪称 “中国版 Sora”。
  • 官网:https://kling.kuaishou.com/
  • Web 产品:可灵AI

Vidu

  • 简介:Vidu 是由清华大学朱军教授团队研发的 AI 视频生成器。支持生成高逼真度的 4 秒或 8 秒 1080p 高清视频。亮点包括生成速度快、角色一致性、支持写实和动漫风格、生成效果连续流畅等,可应用于游戏、影视、教育等领域。
  • 官网:https://www.vidu.studio/

Luma Dream Machine

  • 简介:Luma AI 出品的视频生成模型。支持文生视频、图生视频,可生成 5 秒长度的视频。有免费额度。
  • 官网:https://lumalabs.ai/dream-machine

剪映专业版 / CapCut

  • 简介:字节跳动出品的视频编辑工具,支持 Windows/Mac。它集成了大量基于 AI 技术的音视频处理功能,比如生成字幕、生成配音、降噪、变声、数字人、文生视频等等。
  • 官网(国内版):https://www.capcut.cn/
  • 官网(海外版):https://www.capcut.com/ (免充值享高级功能)

3D 建模

  • Zero-1-to-3 (zero123): Zero-shot 单张图片生成 3D 物体。哥伦比亚大学的开源项目。
  • One-2-3-45:“Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization”。开源项目。
  • Wonder3D:“Wonder3D produces consistent multi-view normal maps and corresponding color images, and thus reconstructs high-fidelity textured mesh from a single image in only 2~3 minutes”。开源项目。
  • Stable Zero123:单张图片生成高质量 3D 物体。Stability AI 开源模型,可整合到 ComfyUI 工作流。
  • DreamGaussian:Generative Gaussian Splatting for Efficient 3D Content Creation。开源项目。
  • Tripo AI:通过文本或图片生成高质量 3D 模型,可下载。有免费配额。
  • Genie:Luma AI 出品的一款通过文本生成 3D 模型的 AI 工具。目前依托 Discord 提供服务。
  • Luma AI:通过视频来重建 3D 场景。你只需要有一台手持拍摄设备,按要求对物体进行 360°旋转拍摄。有网页版和 iOS App。

数字人 / 语音驱动视频 / TTS

TTS:Text to Speech,文本生成语音。

  • 万兴播爆:输入文案,一键生成数字人播报视频。
  • 剪映:可生成数字人播报视频。
  • HeyGen:生成数字人播报视频,视频翻译,语音克隆。
  • Eleven Labs:文本转语音(TTS),通过文字描述生成音效,语音克隆,视频翻译配音。有 API。
  • EMO:阿里发布的(图片 + 音频 → 视频)大模型,生成的人物嘴形和表情相当自然。
  • ChatTTS:开源的文本转语音(TTS)模型,支持中文和英文。可以控制停顿和笑声等人性化特征,生成结果自然流畅。
  • Seed-TTS:字节跳动发布的高质量、多功能语音生成模型,未开源,似乎也没有发布可用的产品。支持音色微调、带情绪的 TTS、音色转换、情绪转换、基于原语音生成新语音、语音内容编辑、调速等能力。可应用于有声读物、翻译视频等场景。
  • 剪映:已上线 AI 克隆音色的功能,只能克隆自己的音色。
  • 微软 Azure AI 语音:微软的云服务,支持语音转文本、文本转语音、语音翻译和说话人辨识等功能。
  • LivePortrait:快手开源的人物肖像控制模型,可通过五官视频驱动图片生成视频,或修改其他视频。在线体验
  • ReSyncer:一个研究项目,通过语音和视频模板素材,生成更自然的唇形视频。可应用于数字人场景。目前只有研究论文,还没有公开可用的产品。

在线 SD 绘画

  • Leonardo.Ai:易用且强大的 AI 绘图平台,底层基于 SD,深度集成 SD 各种插件,提供训练好的模型,可训练模型。有免费配额。
  • eSheep 电子羊:体验在线的 WebUI 和 ComfyUI。新用户获得 100 积分。每 100 积分相当于 ¥1。
  • 网易 AI 设计工坊:在线 WebUI,可训练模型。有免费配额,每天 10 次。
  • LibLib AI:在线 WebUI,可训练模型。有免费配额,每天 300 积分。
  • Cephalon Cloud 端脑云:云端一键部署自己的 WebUI 和 ComfyUI。新用户获得 2000 积分。每 1000 积分相当于 ¥1。
  • 即梦 AI:字节跳动出品的在线绘画平台,主打易用和免费。原名 “Dreamina”。

音乐创作

  • Suno:AI 根据你的要求生成歌曲(作词、作曲、演唱)。

其他创作工具

  • 神采 / PromeAI:图片生成和编辑工具,包括草图渲染、照片转线稿、局部重绘、抠图去背景、换背景、扩图、重打光、高清放大、文字融合、AI 写真、图生视频等。有免费配额。
  • DomoAI:视频风格转绘,比如把一段现有视频转换为二次元日漫、像素风、油画、3D 皮克斯动画等风格。此外还有文生图、图生图、图生视频等功能。有免费配额。
  • Comic AI:AI 漫画制作工具。有免费配额。
  • Logo Diffusion:AI 设计 Logo 工具,主要功能有:提示词生成 Logo、图片转 Logo、用提示词修改 Logo、手绘草稿美化、2D 转 3D。有免费配额。
  • AutoPod:Premiere Pro 插件,自动完成多机位剪辑、停顿切除。
  • Canva 可画:老牌的在线设计工具,提供了大量模板和设计元素,支持 AI 设计。
  • FaceSwap:多功能的在线换脸工具。支持图片换脸、多人换脸、视频换脸等功能。有免费配额。
  • Remaker - Face Swap Online Free:免费的在线换脸工具,支持图片换脸。

(持续更新中……)

常用 AI 网站 / 工具  

综合平台

  • POE:各种知名模型的聚合平台。用户可根据自己的需求通过 Prompt 定制对话机器人,相当于 GPTs 平替。付费用户可无限量使用 GPT-4、Claude 2 等高端模型。
  • FlowGPT:一个 Prompt 分享平台。提供了角色聊天、游戏、创意、生产力等各种类型的对话机器人,是一个学习提示词的好地方。也可以把它当作 GPTs 平替。
  • Character.AI:与各种类型的 AI 虚拟角色对话,包括世界名人、动漫人物、游戏角色等。
  • Coze:字节跳动推出的 AI 聊天机器人及 AI 应用开发平台。无论是否具备编程基础,用户都可以快速构建特定功能的聊天机器人,并发布到各大社交平台。
  • GPTsCopilot:第三方 GPTs 商店,提供 GPTs 中转访问服务。在 GPTs 的网址中,把 openai.com 改成 openai-now.com 就可以切换到 GPTsCopilot 提供的中转访问服务,无需成为 ChatGPT Plus 会员即可使用 GPTs。
    • 定价:https://gptscopilot.ai/pricing
      • 基础版(每天 5 积分):免费
      • 专业版(每月 1500 积分):$9.99 / 月
      • 按需付费方案:$5.99 / 500 积分 或 $9.99 / 1000 积分
  • Toolify.ai:AI 工具分类导航目录。
  • There's An AI For That (TAAFT):提问我的需求可以用哪些 AI 工具来实现。
  • 通往 AGI 之路 / WayToAGI:AI 工具(包含网站和 GPTs)分类导航目录,也可搜索。
  • ChandlerAi:国内可用的 AI 助手,可调用 GPT-4、Claude 3 Opus、Gemini、DALL·E 等先进模型。需要付费。

图像处理 / 图形设计 / UI 设计

  • Vectorizer.AI:基于 AI 的位图转矢量图的在线工具,比如 PNG → SVG。已经不可免费使用,需要订阅($10 / 月)。
  • Galileo:通过提示词生成 UI 设计稿,可导出到 Figma。
    • 定价:https://www.usegalileo.ai/pricing
      • 免费版(注册后获得 200 积分 + 3 次导出):免费
      • 标准版(每月 1200 积分 + 无限导出):$19 / 月
      • 专业版(每月 3000 积分 + 无限导出 + 私密模式):$39 / 月
  • Magnific AI:图片放大,增强细节。
  • Photoroom:在线 AI 图片处理工具。免费用户可使用抠图、擦除、照片优化功能。
  • 抠图:

写作 / PPT 幻灯片

  • Notion AI:Notion 中的 AI 写作助手。增值服务,每月 $10。
  • 蛙蛙写作:国产写作模型,写长篇小说、视频脚本、论文等。免费试用 3000 字。
  • 讯飞智文:Word、PPT 一键生成、AI 撰写助手、多语种互译、AI 自动配图、PPT 转演讲稿等。
  • 腾讯文档:AI 助手提供生成 PPT、生成文档、生成表格、生成思维导图、生成收集表等功能。
  • Gamma:AI 设计助手,生成 PPT、文档和网页,优化现有 PPT 和文档。
  • AiPPT.cn:AI 一键生成 PPT。支持自动生成 PPT 大纲文案,文档秒变 PPT,支持多种模板,兼容 pptx 格式。

内容分析、识别、提炼

  • 通义听悟:语音文件识别为文本,拆分章节,提炼关键信息,识别多人发言,适合处理录音采访、播客、会议记录等内容。
  • MinerU:一站式、开源、高质量的数据提取工具,包含 PDF 文档、网页与电子书的内容提取并转换等 Markdown 等功能。在线体验
  • Elicit:以超人速度分析论文。自动化耗时的研究任务,如总结论文、提取数据和汇总结论。
  • Monica:多功能 AI 工具箱,有浏览器插件、桌面应用和移动 App。最为人熟知的功能是基于网页内容的总结和问答。
  • 剪映:可识别语音生成字幕。

定制知识库 / RAG

RAG:Retrieval-Augmented Generation,检索增强生成。是目前基于 LLM 实现 “外挂知识库” 的主流技术方案。

  • SiteGPT:基于你的官网内容和上传文档创建客服机器人,解答客户的咨询。
  • Dify:LLM 应用开发平台,支持各种大模型,提供 Prompt 编排、RAG、Agent 框架、工作流编排等功能。
  • RAGFlow:一款基于深度文档理解构建的开源 RAG 引擎。
  • MaxKB:基于 LLM 大语言模型的知识库问答系统。开箱即用,支持快速嵌入到第三方业务系统。

广告 / 营销

  • AdIntelli:面向 GPTs 生态的广告联盟(可靠性待验证)。
  • GPT Wallets:为 GPTs 提供支付和数据分析解决方案。

其他工具 / 开源项目

  • Perplexity:AI 搜索。
  • 秘塔 AI 搜索:更友好的搜索引擎,帮你整理信息后更有条理地呈现。有 “全网” 和 “学术” 两种搜索模式,搜索深度可选简洁、深入、研究。
  • 天工 AI:AI 搜索、对话助手等。
  • PromptPerfect:帮你优化提示词(Prompt)。比如把你的笼统需求拆解为多步骤的任务,以提高模型输出的准确性;又比如根据给定的文章主题生成大纲并撰写长文。
  • AppAgent:腾讯研究团队的开源项目,基于大语言模型的手机端多模态智能代理,帮用户自动执行复杂任务。适用于 Android 手机和模拟器。可粗略类比为手机端的按键精灵。
  • ProctorAI:AI 监工,号称 “拖延症终结者”。开源项目,本地应用程序,通过定时截图来检查你是否在摸鱼,并发出警告,支持语音提醒。可以设置详细的监督规则。底层调用了 GPT-4o 等多模态模型。
  • llm_aided_ocr:LLM 辅助 OCR,通过大模型来提升 OCR 的准确性。

教程

法规 / 公告

(持续更新中……)


常见问题  

有什么简便的方式可以使用 GPT-4 和 GPTs?  

建议先通过 ChatGPT Plus 拼车账号开始体验,即买即用。解锁 GPT-4 + DALL·E 绘图 + GPTs 等高端功能。需自备海外线路。

这里推荐一个老牌的拼车平台,稳定可靠。点此开始拼车(还可用九五折优惠码 ai2024)。

AI 生成内容的版权(著作权)属于谁?

简单说一下结论:

  • 如果 AI 服务商的用户协议中主张了 AI 生成内容的著作权,则属于 AI 服务商。
  • 否则属于使用 AI 服务生成内容的用户。

详细解释:你用 AI 生成的作品,版权归你吗?

微信群  

加入群,快人一步获取 AI 资讯、与数百名同好交流:

qun-qr


License

  • Text and graphics: © Creative Commons BY-NC-ND 4.0
  • Code: GPLv3

For Tasks:

Click tags to check more tools for each tasks

For Jobs:

Alternative AI tools for Awesome-AI

Similar Open Source Tools

For similar tasks

For similar jobs