找回密码
 立即注册
首页 业界区 业界 LLM应用剖析: 小红书AI图文生成器-红墨

LLM应用剖析: 小红书AI图文生成器-红墨

晾棋砷 昨天 21:00
1. 背景


  • 花了近一周时间,深入研究了Github近几天比较有意思的一个项目,小红书AI图文生成器RedInk。仅需输入一个主题以及可选的参考图片,系统则会自动生成大纲,然后针对每个章节生成对应的图片。
  • 项目前端采用Vue+TypeScript,后端采用Flask。
  • 支持docker部署及编译部署,文本模型及图像模型支持系统编辑。
  • Ps: 国内有哪些平台可以访问nano banana 2 pro? 本人使用的是七牛,免费试用额度还不少哦。
2. 系统效果


  • 模型选择: Qwen3-14B大语言模型,Nano Banana2生图模型。
  • 输入: 3岁宝宝冬季保暖攻略
  • 输出效果:
1.png

3. 整体流程

2.png


  • (1) 用户通过系统输入关注的主题,也可同时上传参考的多个图片
  • (2) 系统会调用LLM生成大纲,包含封面、多个内容片段以及总结,如果针对生成效果不满意,可以直接在线编辑。
  • (3) 编辑好每个段落后,即可开始一键生图,可根据服务商模型特性,采用串行及并行两种方式。
  • (4) 生成好的图片后,如果针对其中某些不满意,可以执行重新生成,最终可以一键生成。
4. 代码浅析


  • (1) 前后端代码的可读性很强,建议可以本地进行调试。如果想要在vscode中同时联调前端和后端,可以采用如下vscode的调试配置文件launch.json
  1. {
  2.     "version": "0.2.0",
  3.     "configurations": [
  4.         {
  5.             "type": "chrome",
  6.             "request": "launch",
  7.             "name": "调试 Vue 应用",
  8.             "url": "http://localhost:5173", // 你的开发服务器地址
  9.             "webRoot": "${workspaceFolder}/frontend/src",
  10.             "breakOnLoad": true,
  11.             "sourceMapPathOverrides": {
  12.                 "/src/*": "${webRoot}/*",
  13.                 "/@fs/*": "${webRoot}/*",
  14.                 "vite://@fs/*": "${webRoot}/*"
  15.             },
  16.             "runtimeArgs": [
  17.                 "--remote-allow-origins=*"
  18.             ],
  19.             "skipFiles": [
  20.                 "<node_internals>/**",
  21.                 "${workspaceFolder}/frontend/node_modules/**"
  22.             ]
  23.         },
  24.         {
  25.             "type": "node",
  26.             "request": "launch",
  27.             "name": "调试构建脚本",
  28.             "program": "${workspaceFolder}/frontend/node_modules/vite/bin/vite.js",
  29.             "args": ["dev"]
  30.         },
  31.         {
  32.             "name": "Python 调试程序: 当前文件",
  33.             "type": "debugpy",
  34.             "request": "launch",
  35.             "program": "${file}",
  36.             "console": "integratedTerminal",
  37.             "justMyCode": false,
  38.             "purpose": ["debug-in-terminal"],
  39.             "cwd": "${workspaceFolder}",
  40.             "env": {
  41.                 "PYTHONPATH": "${workspaceFolder}"
  42.             },
  43.             "args": [
  44.             ]
  45.         }
  46.     ]
  47. }
复制代码

  • (2) 模型配置信息如下:
  1. # 大语言模型
  2. active_provider: qwen
  3. providers:
  4.   qwen:
  5.     api_key: test
  6.     base_url: http://172.16.0.32:20080
  7.     endpoint_type: /v1/chat/completions
  8.     model: Qwen3-14B
  9.     type: openai_compatible
  10. # 生图模型
  11. active_provider: 七牛
  12. providers:
  13.   七牛:
  14.     api_key: sk-34xxxxx0
  15.     base_url: https://api.qnaigc.com
  16.     endpoint_type: /v1/images/edits
  17.     high_concurrency: false
  18.     model: gemini-3.0-pro-image-preview
  19.     short_prompt: false
  20.     type: image_api
复制代码
5. 总结与思考


  • 本文介绍了小红书的一键图文生成平台,并提供了系统的基本执行流程及原理。同时分享了本人基于本地部署后,生成的图文效果,眼过千遍不如手过一遍,实践方能出真知。
6. 参考


  • (1) 项目地址: https://github.com/HisMax/RedInk
  • (2) 七牛云平台生图模型文档:https://developer.qiniu.com/aitokenapi/13166/text-to-image-api
3.png


来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

相关推荐

您需要登录后才可以回帖 登录 | 立即注册