版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
测报告2025.12.26郎瀚威猫猫头AIwatch.ai10测试6:将简历转化成网站11结尾02关于作者03测试结果一览04测试感受05测试1:总结Youtube视频06测试2:根据邮件内容买东西07测试3:旅行储蓄预算规划08测试4:设计品牌Logo(咖啡店)目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|2目录测试5:旧金山财务报告查找0109测试任务测试任务2025/12/26目录前言时间单位:秒OpenAIAtlasAnthropicClaude插件Manus插件Genspark浏览器Prompt场景时间结果时间结果时间结果时间结果1总结Youtube视频来源:
Genspark官方社媒12失败234失败231成功208成功2根据邮件内容买东西来源:
Gemini官方个人助理152成功1,403成功530成功612成功3旅行储蓄预算规划来源:
Anthropic官方办公54部分成功634部分成功59成功770成功4设计品牌Logo(咖啡店)
来源:
Genspark官方图像167成功成功230成功189成功5旧金山财务报告查找来源:
OpenAI官方办公14成功50成功53成功149成功6将简历转化成网站来源:
Fellou官方编程190部分成功140部分成功331成功700成功平均时间981,172239438成功/失败比例5/15/16/06/0测试prompt执行结果表格目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|44,5702025/12/26Prompt任务解析任务1:总结Youtube视频Prompt来源:Genspark官方SummarizeVideo访问YouTube视频并理解视频内容。需要能够获取视频信息,提取关键内容点,并生成简洁明了的总结。主要测试视频内容理解能力、信息提取和总结能力。任务2:选购杂货Prompt来源:Gemini官方Buytheseingredientsfor
meon
I
usingtheSproutsstore根据邮件内容在Instacart上买东西,而且还指定了要用Sprouts这个店。这涉及到真实的购物操作,需要Agent能够导航购物网站,添加商品到购物车,甚至可能需要处理支付。主要测试邮件读取能力,电商网站操作,商品搜索添加,还有购物流程执行能力。任务3:旅行储蓄预算规划Prompt来源:Anthorpic官方Iwanttosurprise
mywifewithatripto
ltaly!lhave
6
monthsto
save-here's
my
recentfinances.
Help
mecreatea
plananda
budgetin
Excel.Where
canl
save
the
money?!分析用户提供的财务数据,基于6个月的储蓄周期为意大利旅行制定预算计划。需要识
别可节省开支的领域,创建Excel格式的详细储蓄计划和旅行预算表。主要测试财务数据分析能力、预算规划能力、
Excel表格创建能力、个性化建议生成能力任务4:设计品牌LogoPrompt来源:Genspark官方Designa
logofor
my
handcraftedcoffeebrand
Meadow,using
brightorange
coloranda
hand-drawnfontstyle.为手工咖啡品牌“Meadow”设计Logo,使用亮橙色配色和手绘风格字体。需要理解品牌定位(手工咖啡),将品牌名称、行业特征与视觉元素结合,创造指定风格品牌标识。主要测试图像生成/设计能力、品牌定位理解和视觉转化能力。任务5:旧金山财务报告查找Prompt来源:OpenAI官方FindtheSan
FranciscocityAnnualComprehensiveFinancial
Reports(ACFR)
for
2020-2024查找并获取旧金山市2020-2024年度(共5年)的综合财务报告(ACFR)。需要在政府官方网站或公开渠道搜索这些财务文档,识别正确的报告文件格式(通常为PDF),并完整地提供给用户访问或下载。主要测试信息检索能力、信息来源可靠性验证能力任务6:简历转为网站Prompt来源:
Fellou官方I’d
liketo
usethis
resumetocreatea
personalwebsite.Couldyou
please
help
meconvertthe
information
inthis
resume
intoasuitableformatforweb
display
I’d
liketocreateaclean,
professionalpagethat
highlights
my
experienceand
strengths.
Itwould
beeven
betterifyoucouldaddsome
personalizeddesign读取简历文档内容,提取关键信息(工作经历、技能、教育背景等),并将其转换为适合网页展示的HTML格式。需要生成简洁专业的个人网站,突出用户经验和优势。主要测试文档解析能力、网页设计能力、代码生成能力。任务解析表目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|52025/12/26•Claude插件的推出是个重要试水。它代表的不是技术能力的提升,而是交互范式的转变——从"用代码指令搭建工作流"到"模仿人类操
作搭建工作流"。•这让我想起网游外挂时代的按键精灵。当年玩家要实现自动打怪,可以写脚本调用游戏API,也可以用按键精灵录制鼠标点击、读取屏幕像素点判断怪物位置。后者门槛更低,因为它复制的是人的操作逻辑,不需要理解底层代码。•Claude插件在做类似的事:读取屏幕内容,理解用户的自然操作行为,结合大语言模型解读意图,然后执行。比如“帮我把这个表格数据复制到GoogleSheets”,用传统API调用要处理认证、格式转换、数据映射;但用操作模拟,就是“打开网页-找到表格-复制-切换标签页-粘贴”,跟人的思维方式一致。•这个方向的价值在于:跨平台操作用coding语言描述很复杂(每个网站API不同),但用操作描述很简单(都是点击、输入、复制粘贴)。当AI能看懂屏幕、模拟操作,原来需要懂代码才能搭的自动化流程,现在普通人说一句话就能实现。•但这也带来一个问题:当AI学会模仿人的操作,人就更容易被取代了。以前企业要实现自动化,得找工程师写代码、对接API,成本高、周期长,所以很多重复性工作还是人在做。现在AI直接看着你的屏幕学,你怎么点鼠标它就怎么点,你的工作流程越标准化,就越容易被复制。数据录入员、客服专员、初级分析师——这些岗位的护城河不是专业知识,而是"会操作系统",而这恰恰是Claude插件要攻克的。•更关键的是,这次不是某个行业的问题。只要你的工作大部分时间在电脑屏幕前完成,只要操作步骤能被观察和记录,理论上都可以被模仿。这不是技术进步的副作用,而是这条路的终点。•现在这个插件确实很笨拙——操作慢、经常卡住、成功率不高。但2007年第一代iPhone也卡得要死,ChatGPT刚出来时胡说八道。技术早期的笨拙常被低估,因为多数人看不到迭代速度。六个月后再看,可能就不是"能不能用"的问题,而是"哪些工作还需要人"的问题。测试感受
by
will目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|62025/12/26本次测试了全部的6个任务,在4个平台上(
OpenAIAtlas、AnthropicClaude插件、
Manus插件、Genspark浏览器)的表现。一、总体感受Genspark浏览器
>
Manus插件
>OpenAIAltas
>Claude插件二、各平台综合感受1.OpenAIAltas:颇有进步。Atlas刚发布时我认为其只是OpenAI为了赶上AI浏览器这个浪潮的占位品,只是ChatGPT的浏览器套壳,经过这次的测试,发现其进步很大,Agent模式自动化处理任务快准狠,在买菜任务中取得了最好的成绩,之后的发展令人期待。2.AnthropicClaude插件:慢。Claude的能力总结成一个字,就是慢,说干也能干,就是干不好,干的还贼慢,处理任务用最笨的方法,像一个不会学习但学的很认真的笨学生,如生成logo任务中,它打开了可画手搓logo,效果也很差,进步空间很大。3.Manus插件:处理任务果断、准确。它的实力还是很超出预期的,处理任务果断、准确,能处理的任务方面不如Genspark多,没那么全能,但是能干的都会干好。4.Genspark浏览器:全能大师。样样都会,样样都能做的好,对于各种任务都有相应的工具来处理,表格任务有表格工具,视频任务有视频分析工具,购买任务有浏览器自动化工具,而且对待任务很认真,不仅仅只是满足用户的需求,会尽力做好。测试感受
bywill团队成员1
wzy目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|72025/12/26本次测试了全部的6个任务,在AnthropicClaude插件上的表现。核心印象是“像人、慢、但可信”。先规划,再让用户决定后执行,全程让用户监督。1.信息获取方式是依赖浏览器截图,读取文字,无法直接解析视频,导致YouTube摘要任务只能凭周边文字“猜”,最终失败。2.干活之前必出任务清单。需要用户确认才开始。途中遇到新变量,立即制作新清单再确认。可随时把决定权交给Claude。3.交互体验像人。第一次见到打开canvas手搓
logo的AI,操作路径和人类一样。鼠标跟随功能像录制游戏脚本,人工演示一遍,然后Claude理解意图,保存为可复用技能。调用不是机械地按我的顺序跑一遍,Claude会根据自己的理解,问我是不是要做某件事,得到肯定回答后,它才会做。4.能完成GoogleSlide表格的单元格级读写改,和Genspark的表格功能类似,可惜不能直接上传表格。5.
目前使用不方便的地方:1)对话无法保存和分享,关掉浏览器就没了。测试的6个任务,我只留下了截图,无法分享对话。2)上传类型仅限图片与文本,
Excel、Word、
PPT、TXT、视频音频都不支持;3)整体运行速度慢,我猜是截图+识别的流程比较麻烦。测试感受
bywill团队成员2dyr目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|82025/12/26总结Youtube视频(案例Prompt来自Genspark官方,
链接)总结youtube视频目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|92025/12/26任务来源:Genspark官方链接Prompt:
Summarize
Video视频链接任务分析:访问YouTube视频并理解视频内容。需要能够获取视频信息,提取关键内容点,
并生成简洁明了的总结。主要测试Agent的视频内容理解能力、信息识别和提取能力、多模态数据处理能力。总结youtube视频目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|102025/12/26产品耗时(s)执行结果相关链接OpenAIAtlas12失败对话链接AnthropicClaude插件234失败无对话链接Manus插件231成功对话链接Genspark浏览器208成功对话链接总结youtube视频
结果表目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|11Prompt:SummarizeVideo视频链接2025/12/26OpenAI
Atlas执行结果:失败
链接测试感受(人写)•
十份迅速的完成了任务•
观察其执行过程,它并没有对视频进
行分析,可能也是读取了页面内容,•由于此视频介绍处有作者写好的时间段,根据此信息与页面信息给出的总结。总结youtube视频
open
Al
Atlas目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|12图片来自测试结果截图2025/12/26AnthropicClaude插件执行结果:失败
无链接测试感受(人写)•
检视其执行过程,发现它其实是对这
个链接的页面进行了总结•
通过对视频页面的截图来分析截图内
容,并没有实际分析视频内容。总结youtube视频
Gemini
插件目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|13图片来自测试结果截图2025/12/26Manus插件执行结果:成功
链接测试感受(人写)•
观察Manus的执行过程,它成功进
行了对视频的分析。•
通过对视频的分析与对页面信息的提
取,综合完成了对视频的总结•
对于一个6小时长视频而言,完成的
速度不慢总结youtube视频
perplexity
comet目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|14图片来自测试结果截图2025/12/26Genspark浏览器执行结果:成功
链接测试感受(人写)•
检查了它的执行过程,发现Genspark有实际性的分析行为。•Genspark调用了其自带的视频分析
工具,并没有只是单纯的分析页面信
息,给出的总结符合视频内容总结youtube视频
Genspark浏览器目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|15图片来自测试结果截图2025/12/26根据邮件内容买东西(案例Prompt来自Gemini官方,
链接)根据邮件内容买东西目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|162025/12/26任务来源:Gemini官方链接Prompt:
Buythese
ingredientsfor
me
on
I
usingtheSprouts
store任务分析:根据邮件内容在Instacart上买东西,而且还指定了要用Sprouts这个店。这涉及到真实的购物操作,需要Agent能够导航购物网站,添加商品到购物车,甚至可能需要处理支付。主要测试AI的邮件读取能力,电商网站操作,商品搜索添加,还有购物流程执行能力。根据邮件内容买东西目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|172025/12/26产品耗时(s)执行结果相关链接OpenAIAtlas152成功对话链接AnthropicClaude插件1403成功无对话链接Manus插件530成功对话链接Genspark浏览器612成功对话链接根据邮件内容买东西
结果表目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|18Prompt:
Buythese
ingredientsfor
meon
IusingtheSprouts
store2025/12/26OpenAI
Atlas执行结果:成功
链接测试感受(人写)•
识别-搜索-加购物车行云流水,执行
果断,丝毫不拖泥带水,行动迅速。•
购买的物品及数量也没问题,最后检
查购物车阶段检查到了我上次任务遗
漏的物品,给果断删除了,没有询问
用户是否需要删除。根据邮件内容买东西
open
AI
Atlas目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|19图片来自测试结果截图2025/12/26AnthropicClaude插件执行结果:成功
无链接测试感受(人写)•成功将商品加入购物车。•
不会主动读取邮件,在我的指导下读
取了左侧的邮件内容。•中间列举了他要做的步骤,让我确认,在我的确认后进行操作,当页面有变动时,再次列举步骤让我确认。•
虽笨但执着认真,通过一遍一遍的截屏检查页面与搜索、点击,成功的完成了任务,将所需物品加入了购物车,但其执行时间很长,用了23分钟多。根据邮件内容买东西
Anthropic
claude插件目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|20图片来自测试结果截图2025/12/26Manus插件执行结果:
成功
链接测试感受(人写)•
成功读取到了邮件,并成功将要购买
的食品加入到了购物车,只需付款即
可。•由于Manus插件不是侧边栏,无法
像其他插件一样读取页面内容,所以
被迫增加了一下难度,让其打开我的gmail收信箱找到对应邮件购买,
任
务依然取得成功根据邮件内容买东西Manus
插件目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|21图片来自测试结果截图2025/12/26Genspark浏览器执行结果:成功
链接测试感受(人写)•
成功读取到了要购买的食物•
一开始就表明了能力范围,仅可执行
到付款前一步,启用了浏览器自动化
工具来帮我完成任务,速度也还可以,•
有一点小小的瑕疵,让买两份某一物
品,购物车加了三份。根据邮件内容买东西
Genspark浏览器目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|22图片来自测试结果截图2025/12/26旅行储蓄预算规划(案例Prompt来自Anthropic官方,
链接)旅行储蓄预算规划目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|232025/12/26任务来源:Anthropic官方,
链接
Prompt:
Iwanttosurprise
mywife
with
atrip
to
ltaly!lhave
6
months
to
save-here's
my
recentfinances.
Help
mecreate
a
plan
anda
budget
in
Excel.Where
canlsave
themoney?!任务分析:分析用户提供的财务数据,基于6个月的储蓄周期为意大利旅行制定预算计划。需要识别可节省开支的领域,创建Excel格式的详细储蓄计划和旅行预算表。主要测试Agent的财务数据分析能力、预算规划能力、Excel表格创建能力、个性化建议生成能力。旅行储蓄预算规划目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|242025/12/26产品耗时(s)执行结果相关链接OpenAIAtlas54部分成功对话链接AnthropicClaude插件634部分成功无对话链接Manus插件59成功对话链接Genspark浏览器770成功对话链接旅行储蓄预算规划结果表Prompt:
Iwanttosurprise
mywifewithatripto
ltaly!lhave
6
monthsto
save-here's
my
recent
finances.
Help
me
create
a
plan
and
a
budget
in
Excel.Wherecanlsavethe
money?!目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|252025/12/26OpenAI
Atlas执行结果:
部分成功
链接测试感受(人写)•给出的内容十分简单,只有两个sheet,每个sheet只有四五行,
分别是省钱计划与预计花费。•省钱计划从大的方面进行了分析,给出了模棱两可的内容,没有具体到每一项事宜,比较敷衍。旅行储蓄预算规划
open
AI
Atlas目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|26图片来自测试结果截图2025/12/26Anthropic
Claude插件执行结果:部分成功
无链接测试感受(人写)•
给出了财务规划•由于无法上传文档、表格。我使用Google
Sheets打开了<我的财务状
况表>•Claude插件直接在我的表格中编辑旅行储蓄预算规划
Anthropic
claude插件目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|27图片来自测试结果截图2025/12/26Manus插件执行结果:
成功
链接测试感受(人写)•内容方面十份简单,寥寥无几的内容,很不详细。•
简单给出了可能的花费、目前的开销节省、存钱计划,分析到了一些可省钱的点,策略也很敷衍。旅行储蓄预算规划Manus
插件目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|28图片来自测试结果截图2025/12/26Genspark浏览器执行结果:成功
链接测试感受(人写)•
内容十份详细。•
分析了我所上传的消费明细表,根据
消费提出了适合的省钱计划,消费明
细表中留下的省钱线索都有发现。•
列出了旅行的大概计划并给出了所需的大概预算,
并按月给出攒钱计划。
使用了很多的图标,可视化清晰明了。旅行储蓄预算规划
Genspark浏览器目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|29图片来自测试结果截图2025/12/26设计品牌Logo(咖啡店)(案例Prompt来自Genspark官方,
链接)设计品牌Logo(咖啡店)目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|302025/12/26任务来源:Genspark官方链接Prompt:
Design
a
logo
for
myhandcraftedcoffee
brand
Meadow,
usingbrightorangecolorand
a
hand-drawn
font
style.任务分析:为手工咖啡品牌“Meadow”设计
Logo,使用亮橙色配色方案和手绘风格字体。需要理解品牌定位(手工咖啡),将品牌名称、行业特征与视觉元素有机结合,创造符合指定风格要求的品牌标识。主要测试Agent的AI的图像生成/设计能力、品牌定位理解和视觉转化能力。设计品牌Logo(咖啡店)目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|312025/12/26产品耗时(s)执行结果相关链接OpenAIAtlas167成功对话链接AnthropicClaude插件4570成功无对话链接Manus插件230成功对话链接Genspark浏览器189成功对话链接设计品牌Log0(咖啡店)-结果表目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|32Prompt:
Designa
logofor
my
handcraftedcoffee
brand
Meadow,
using
brightorangecolorand
a
hand-drawnfont
style.2025/12/26OpenAI
Atlas执行结果:成功
链接测试感受(人写)•
根据要求生成了要设计的logo,每一步要求都理解到位,符合设计需求,最后一步给出了6个logo供用户选择。logo设计简约大气,有特色。设计品牌Logo(咖啡店)-open
Al
Atlas目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|33图片来自测试结果截图2025/12/26AnthropicClaude插件执行结果:成功
无链接测试感受(人写)•Claude使用的是最笨的方法-打开可
画手搓logo•耗时巨长,
一个多小时,•
绘出的logo也差强人意,仅仅是几
个插画与文字拼接在一起,毫无设计
与美感可言。•
看着它手搓的过程像人一样,只是有
些慢,有些笨拙,如果速度能快一点
一定很有意思。设计品牌Logo(咖啡店)-Anthropic
claude插件目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|34图片来自测试结果截图2025/12/26Manus插件执行结果:成功
链接测试感受(人写)•
生成的logo符合设计需求•
测试任务中logo最简洁的一个,让
其添加元素也没添加太多•
风格现代,好看。设计品牌Logo(咖啡店)-
Manus插件目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|35图片来自测试结果截图2025/12/26Genspark浏览器执行结果:成功
链接测试感受(人写)•
调用了NanoBanana图像模型进行
图像生成,每一步都严格按照需求•最后一步不仅给了几个logo供选择,还给出了设计元素,使得用户还可以根据自己的需求继续设计。设计品牌Logo(咖啡店)-Genspark浏览器目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|36图片来自测试结果截图2025/12/26旧金山财务报告查找(案例Prompt来自OpenAI官方,
链接)旧金山财务报告查找目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|372025/12/26任务来源:OpenAI官方链接Prompt:
Findthe
San
FranciscocityAnnualComprehensive
Financial
Reports
(ACFR)for
2020-2024A任务分析:查找并获取旧金山市2020-2024年度(共5年)的综合财务报告(ACFR)。需要在政府官方网站或公开渠道搜索这些财务文档,识别正确的报告文件格式(通常为PDF),并完整地提供给用户访问或下载。主要测试Agent的信息检索能力、信息来源可靠性验证能力旧金山财务报告查找目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|382025/12/26产品耗时(s)执行结果相关链接OpenAIAtlas14成功对话链接AnthropicClaude插件50成功无对话链接Manus插件53成功对话链接Genspark浏览器149成功对话链接旧金山财务报告查找
结果表目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|39Prompt:
FindtheSan
FranciscocityAnnualComprehensive
Financial
Reports(ACFR)
for
2020-2024A2025/12/26OpenAI
Atlas执行结果:成功
链接测试感受(人写)•
观察其执行过程与所耗时间,其通过网络搜索完成了任务,找到了总文件网址与部分具体文件网址,并给出了超链接,没有找齐每个文件的链接。旧金山财务报告查找
open
AI
Atlas目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|40图片来自测试结果截图2025/12/26测试感受(人写)•
通过控制浏览器搜索、点击模拟人工
的步骤,找到了文件所在的页面•
但只给到了文件所在页面的链接,没
有给出每个文件的链接,还需要用户
自己打开网页手动展开点击。图片来自测试结果截图旧金山财务报告查找
GoogleGemini插件AnthropicClaude插件执行结果:成功
无链接目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|412025/12/26Manus插件执行结果:成功
链接测试感受(人写)•
找到了prompt中要求的时间段的文件,并且给出了每一个文件的具体链接,点击就能打开对应文件。旧金山财务报告查找
perplexity
comet目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|42图片来自测试结果截图2025/12/26Genspark浏览器执行结果:成功
链接测试感受(人写)•
成功找到了文件所在位置,将要求的文件列成了列表,每个报告名字附上了超链接,点击即可直接查看。旧金山财务报告查找
Genspark浏览器目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|43图片来自测试结果截图2025/12/26将简历转网站(案例Prompt来自Fellou官方,
链接)将简历转网站目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|442025/12/26任务来源:
Fellou官方,链接Prompt:
I’d
liketo
usethis
resumetocreate
a
personalwebsite.Couldyou
please
help
me
convertthe
information
inthis
resume
intoa
suitableformatforwebdisplay?
I’d
like
tocreateaclean,
professional
pagethathighlights
myexperienceandstrengths.
Itwould
beeven
better
ifyoucouldadd
some
personalizeddesign任务分析:读取简历文档内容,提取关键信息(工作经历、技能、教育背景等),并将其转换为适合网页展示的HTML格式。需要生成简洁专业的个人网站,突出用户经验和优势。主要测试Agent的文档解析能力、网页设计和代码生成能力。简历转为网站目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|452025/12/26产品耗时(s)执行结果相关链接OpenAIAtlas190部分成功对话链接AnthropicClaude插件140部分成功无对话链接Manus插件331成功对话链接Genspark浏览器700成功对话链接简历转为网站
结果表Prompt:
I’d
liketo
usethis
resumetocreatea
personalwebsite.Couldyou
please
help
me
convert
the
information
in
this
resume
intoasuitableformatforwebdisplay?
I’d
liketo
create
a
clean,
professional
page
that
highlights
my
experience
and
strengths.
It
would
beeven
better
ifyoucouldaddsome
personalizeddesign目录
|作者
|测试结果|测试感受
|总结视频
|根据邮件内容买东西
|储蓄预算规划
|设计Logo
|报告查找
|简历转网站
aiwatch.ai
|462025/12/26简历转为网站
open
AI
AtlasOpenAI
Atlas执行结果:
部分成功测试感受(人写)•
任务部分成功没有给出可供下载的
文件或可预览的按钮,而是给出了文
本,让用户自己粘到文件中打开。•网页很简单,基本上就是大标题+文
字内容,简单的文本,基本没有什么
网页设计。目
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东生态工程职业学院《公共体育1》2024-2025学年第二学期期末试卷
- 天津中医药大学《东北亚国际关系史专题研讨》2024-2025学年第二学期期末试卷
- 南充职业技术学院《内科护理学上》2024-2025学年第二学期期末试卷
- 温州职业技术学院《现当代文学经典阅读与语文教学》2024-2025学年第二学期期末试卷
- 兰州现代职业学院《公共关系与人际交往能力》2024-2025学年第二学期期末试卷
- 郑州财经学院《概率论与数理统计C》2024-2025学年第二学期期末试卷
- 2026年物体沉与浮测试题及答案
- 浙江警官职业学院《化工设计概论》2024-2025学年第二学期期末试卷
- 2026年大学叙事学期中测试题及答案
- 2026年学习态度智力测试题及答案
- 2026年及未来5年市场数据中国养老公寓行业市场全景分析及投资规划建议报告
- 二衬班安全教育培训课件
- 2026年安全员之B证(项目负责人)题库及答案
- 2026年国家电网企业文化知识考试题目含答案
- 企业标准操作程序(SOP)手册
- 电力行业设备管理维护规范
- 国药员工合同范本
- 建筑工地安全巡查检查清单
- 胃轻瘫多学科联合诊疗专家共识(2025版)解读课件
- AGV小车培训课件
- 概率论与数理统计期末考试卷附答案2
评论
0/150
提交评论