在Cursor爆火之后,一款能与Cursor媲美的AI编程工具——Windsurf,正式登场!Windsurf由估值12.5亿美元的美国初创公司Codeium打造,发布瞬间便成为AI编程领域的顶流。它将具备协作能力的copilots和独立能力的agents相结合,创造出了全新的协作型智能体。
Windsurf是目前最智能的AI代码生成工具,数据为证。
接下来,我们将使用Windsurf开发一个Chrome浏览器插件,该插件将利用智谱AI的两个免费多模态模型API,实现网页对话和图像理解功能。
本次开发使用的是智谱AI开放的两款免费API:glm-4-flash和glm-4v-flash。
GLM-4-Flash:高效与经济的完美结合
GLM-4-Flash兼具“高速度”和“经济性”特点,适用于完成简单垂直、低成本、需要快速响应的任务。它具备多轮对话、网页浏览、Function Call和长文本推理(支持最大128K上下文)等高级功能,同时支持包括中文、英语、日语、韩语、德语在内的26种语言。
应用场景
- 数据抽取:生物学家使用GLM-4-Flash处理分子数据,破解健康密码;
- 数据生成:生成可以训练其他大模型的数据内容,成为其他领域大模型的“黄埔军校”;
- 多轮对话:高校学者制作AI助教,提供学习和校园生活的伙伴;
- 英语翻译:构建翻译APP,帮助小朋友进行英语互动性学习;
- 内容生成:广告公司进行文本润色,帮助编辑和文案快速输出各种类型的文案。
GLM-4V-Flash:图像处理的全能选手
GLM-4V-Flash模型拥有图像描述生成、图像分类、视觉推理、视觉问答(VQA)以及图像情感分析等高级图像处理功能,并且支持包括中文、英语、日语、韩语、德语在内的26种语言。
应用场景
- 社交媒体文案生成:解读图片生成引人入胜的文案;
- 识图答题:通过高级的图像识别和物理学知识理解,帮助学生构建全面且深入的学习框架;
- 美容咨询:识别皮肤问题,提供细致的护肤建议;
- OCR保险单信息提取:高效地从保险单据中提取关键信息;
- 图像内容提取与总结:根据图像内容进行提取并总结,按照规定的格式进行输出。
开发流程
- 下载Windsurf并创建项目:首先下载Windsurf,创建存放代码的文件夹,注意不要使用中文和特殊符号。
- 使用Windsurf打开文件夹:通过Windsurf进行需求分析和框架搭建。
- 加载插件:在Google浏览器扩展中加载插件。
- 功能调试:使用glm-4-flash的对话能力和glm-4v-flash的图片理解能力进行调试。
- 编写readme文件:完成功能调试后,编写readme文件并提交至Chrome应用商店。
以上就是基于Windsurf,全流程完成一款Chrome浏览器插件的开发过程,从需求分析到开发完成,再到提交Chrome应用商店审核的全过程。
AI时代已经来临,即使没有代码基础,你也可以从0到1开发一个最基础的插件,不妨试试吧!