首页 › 业界区 › 业界 ›LLM应用剖析: 小红书AI图文生成器-红墨

LLM应用剖析: 小红书AI图文生成器-红墨

晾棋砷 昨天 21:00

程序园永久vip申请，500美金$，无限下载程序园所有程序/软件/数据/等

1. 背景

花了近一周时间，深入研究了Github近几天比较有意思的一个项目，小红书AI图文生成器RedInk。仅需输入一个主题以及可选的参考图片，系统则会自动生成大纲，然后针对每个章节生成对应的图片。
项目前端采用Vue+TypeScript，后端采用Flask。
支持docker部署及编译部署，文本模型及图像模型支持系统编辑。
Ps: 国内有哪些平台可以访问nano banana 2 pro? 本人使用的是七牛，免费试用额度还不少哦。

2. 系统效果

模型选择: Qwen3-14B大语言模型，Nano Banana2生图模型。
输入: 3岁宝宝冬季保暖攻略
输出效果:

3. 整体流程

(1) 用户通过系统输入关注的主题，也可同时上传参考的多个图片
(2) 系统会调用LLM生成大纲，包含封面、多个内容片段以及总结，如果针对生成效果不满意，可以直接在线编辑。
(3) 编辑好每个段落后，即可开始一键生图，可根据服务商模型特性，采用串行及并行两种方式。
(4) 生成好的图片后，如果针对其中某些不满意，可以执行重新生成，最终可以一键生成。

4. 代码浅析

(1) 前后端代码的可读性很强，建议可以本地进行调试。如果想要在vscode中同时联调前端和后端，可以采用如下vscode的调试配置文件launch.json

复制代码

(2) 模型配置信息如下：

# 大语言模型
active_provider: qwen
providers:
qwen:
api_key: test
base_url: http://172.16.0.32:20080
endpoint_type: /v1/chat/completions
model: Qwen3-14B
type: openai_compatible
# 生图模型
active_provider: 七牛
providers:
七牛:
api_key: sk-34xxxxx0
base_url: https://api.qnaigc.com
endpoint_type: /v1/images/edits
high_concurrency: false
model: gemini-3.0-pro-image-preview
short_prompt: false
type: image_api

复制代码

5. 总结与思考

本文介绍了小红书的一键图文生成平台，并提供了系统的基本执行流程及原理。同时分享了本人基于本地部署后，生成的图文效果，眼过千遍不如手过一遍，实践方能出真知。

6. 参考

(1) 项目地址: https://github.com/HisMax/RedInk
(2) 七牛云平台生图模型文档:https://developer.qiniu.com/aitokenapi/13166/text-to-image-api

来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

LLM 应用剖析小红 AI

回复

使用道具举报

业界

Solon AI 开发学习13 - chat - Tool的输入输出架构及生成类

0942

劳怡月
2025-12-05
科技

六顶思考帽深度解析AI赋能代码生成技术

017

虹姥
2025-12-05
业界

为什么AI陪伴玩具都爱用ESP32-S3？这就科普

0692

荪俗
2025-12-05
安全

AI-ITSM的时代正在到来：深度解读Gartner最新报告

1849

匣卒
2025-12-05
业界

Solon AI 开发学习16 - generate - 生成模型（图、音、视）

0268

皇甫佳文
2025-12-06
业界

C#AI系列(5): 从零开始 C# 轻松语音识别

084

梦霉
2025-12-07
安全

揭秘！6款AI论文神器半天生成5000字问卷论文，真实参考文献内幕公开！

020

存叭
2025-12-08
业界

使用ai的方法给epub文件中的汉字加拼音

0226

叶芷雁
2025-12-08
安全

Electron.js 详解、应用场景及完整案例

1688

甘子萱
2025-12-08
业界

JuiceFS + MinIO：Ariste AI 量化投资高性能存储实践

01001

司马黛
2025-12-08

0

粉丝关注

15

主题发布

板块介绍填写区域，请于后台编辑

财富榜{圆}