随着基础模型(如 VLMs,例如 Minimax、Qwen-V)和尖端图像生成技术(如 Flux 1.1)的快速发展,我们正进入一个创造性可能性的新纪元。结合像 T5 这样的模型以增强对潜在空间中文本提示的理解,这些工具使得生产广告级别的关键视觉(KVs)成为可能,且具有显著的真实感。我们测试了这些模型生成高质量 KVs 的潜力,并开发了一个 KV 生成系统,能够复制特定风格,利用针对各个产品的预训练 LoRA 模型,提供视觉上令人惊艳的结果,甚至在适合打印的高分辨率格式中。为了构建原型,我探索了几种 AI 编码工具。本文分享了我最初的经验和学习。
技术栈
- Next.js(前端)
- Tailwind CSS(样式)
- Shadcn UI(UI)
- OpenAI(提示优化)
- Supabase(数据库)
- Python + Flask(后端)
- ComfyUI API(AI 图像生成)
主要功能
主屏幕
- 基于 KV 风格和设计产品的选择,生成关键视觉。
- 用户选择 KV 风格后,相应的提示将加载。
- 所有 KV 风格和提示存储在数据库中,供未来使用。
- 用户可下载生成的图像并分享或保存到服务器。
- 用户可在生成图像前修改提示。
- 生成图像时显示等待动画。
设置页面
- 管理员可添加、删除和更新 KV 风格和提示。
历史页面
- 用户可查看所有生成的图像。
- 用户可下载或删除图像。
数据库结构
- KV_styles:存储 KV 风格、KV 风格图像和提示。
- Products:存储产品信息、描述、图像和 LoRA 模型路径。
- KV_images:存储用户生成的图像。
顶部导航
- Logo
- 搜索栏
- 主页面(右侧)
- 设置页面(右侧)
- 历史页面(右侧)
其他功能
- 仅桌面版本。
- 响应式设计。
- 用户输入错误处理。
V0:前端开发经验
使用 V0,我能够有效地开发单独的页面,但每个页面需要单独处理,这使得它更适合前端任务,而不是完整的应用程序开发。V0 能够生成视觉上吸引人的前端设计,但后端在 V0 界面中无法访问,这限制了其在后端开发中的实用性。
Cursor:有潜力但有限制的 AI 编码 IDE
Cursor 是基于 VSCode 的开源版本构建的 AI 编码 IDE,常被视为 GitHub Copilot 的主要竞争者。它的主要弱点是它在理解和处理现有代码库方面的能力有限。根据我的经验,使用 Cursor 的最佳方式是将其视为一个副驾驶,而不是期望它独立处理复杂任务。
Bolt.new:基于 SaaS 的 AI 编码环境,内置测试功能
Bolt.new 提供了一个基于 SaaS 的 AI 编码平台,让你可以同时开发前端和后端代码,并且可以可视化项目的文件夹结构。虽然编码速度和测试过程可能感觉有些缓慢,但 Bolt.new 的自动化能力使其成为一个强有力的竞争者。
Windsurf:基于代理的 AI 编码平台
Windsurf 是最近推出的 AI 编码平台,发布不到两周。它被描述为一个基于代理的编码环境,旨在实现高自动化,能够在本地设置中无缝运行你的代码。Windsurf 的独特之处在于其卓越的编码准确性和自动化。
费用和订阅选项
这四个工具——Cursor、V0、Bolt.new 和 Windsurf——都提供基本订阅,价格为 每月 $20,但试用选项略有不同。Windsurf 提供了最慷慨的试用期,两周的免费使用。
最终推荐
- 前端原型设计:使用 V0 进行快速、视觉吸引的页面设计,或者选择 Cursor 进行手动控制和指导。
- 全栈原型设计:Bolt.new 是您在自动化和平台集成方面的最佳选择,设置麻烦最少。
- 后端/复杂编码:选择 Windsurf 进行高度准确、现代的编程,具有出色的调试能力。
- 预算友好选项:Windsurf 的两周免费试用使其成为测试时最易于接触的选择,无需立即支付费用。