AI编程初体验 _ 使用Windsurf零代码开发网页对话和图像理解插件

在Cursor爆火之后,一款能与Cursor媲美的AI编程工具——Windsurf,正式登场!Windsurf由估值12.5亿美元的美国初创公司Codeium打造,发布瞬间便成为AI编程领域的顶流。它将具备协作能力的copilots和独立能力的agents相结合,创造出了全新的协作型智能体。

Codeium vs GitHub Copilot

Windsurf是目前最智能的AI代码生成工具,数据为证。

接下来,我们将使用Windsurf开发一个Chrome浏览器插件,该插件将利用智谱AI的两个免费多模态模型API,实现网页对话和图像理解功能。

插件功能展示

本次开发使用的是智谱AI开放的两款免费API:glm-4-flash和glm-4v-flash。

GLM-4-Flash:高效与经济的完美结合

GLM-4-Flash兼具“高速度”和“经济性”特点,适用于完成简单垂直、低成本、需要快速响应的任务。它具备多轮对话、网页浏览、Function Call和长文本推理(支持最大128K上下文)等高级功能,同时支持包括中文、英语、日语、韩语、德语在内的26种语言。

GLM-4-Flash功能展示

应用场景

  • 数据抽取:生物学家使用GLM-4-Flash处理分子数据,破解健康密码;
  • 数据生成:生成可以训练其他大模型的数据内容,成为其他领域大模型的“黄埔军校”;
  • 多轮对话:高校学者制作AI助教,提供学习和校园生活的伙伴;
  • 英语翻译:构建翻译APP,帮助小朋友进行英语互动性学习;
  • 内容生成:广告公司进行文本润色,帮助编辑和文案快速输出各种类型的文案。

GLM-4V-Flash:图像处理的全能选手

GLM-4V-Flash模型拥有图像描述生成、图像分类、视觉推理、视觉问答(VQA)以及图像情感分析等高级图像处理功能,并且支持包括中文、英语、日语、韩语、德语在内的26种语言。

GLM-4V-Flash功能展示

应用场景

  • 社交媒体文案生成:解读图片生成引人入胜的文案;
  • 识图答题:通过高级的图像识别和物理学知识理解,帮助学生构建全面且深入的学习框架;
  • 美容咨询:识别皮肤问题,提供细致的护肤建议;
  • OCR保险单信息提取:高效地从保险单据中提取关键信息;
  • 图像内容提取与总结:根据图像内容进行提取并总结,按照规定的格式进行输出。

开发流程

  1. 下载Windsurf并创建项目:首先下载Windsurf,创建存放代码的文件夹,注意不要使用中文和特殊符号。
  2. 使用Windsurf打开文件夹:通过Windsurf进行需求分析和框架搭建。
  3. 加载插件:在Google浏览器扩展中加载插件。
  4. 功能调试:使用glm-4-flash的对话能力和glm-4v-flash的图片理解能力进行调试。
  5. 编写readme文件:完成功能调试后,编写readme文件并提交至Chrome应用商店。

插件开发流程

以上就是基于Windsurf,全流程完成一款Chrome浏览器插件的开发过程,从需求分析到开发完成,再到提交Chrome应用商店审核的全过程。

AI时代已经来临,即使没有代码基础,你也可以从0到1开发一个最基础的插件,不妨试试吧!

👉 野卡 | 一分钟注册,轻松订阅海外线上服务

上一篇 2025年3月21日
下一篇 2025年3月21日

相关推荐