全球首款通用性Agent Manus内测体验:强大功能下仍有待优化

近日,一款名为Manus的AI Agent在全球范围内引发了广泛关注。作为据称是全球首款通用性Agent,Manus被宣传为能够执行从旅行攻略制定到股票分析、课件生成、合同审核等一系列复杂任务。由于其强大的功能和稀缺性,内测码甚至被炒到了高达9万元的价格。为了深入了解这款产品的真实表现,我们有幸获得了内测资格,并进行了详细的体验测试。

  一、Manus的基本架构与功能

Manus采用多Agent架构,运行在虚拟机中。它包含规划型Agent负责任务拆解、执行型Agent调用具体工具以及监控验证Agent来跟踪任务进度和进行debug。这种设计使得Manus能够理解复杂任务,并将其规划成可执行的具体步骤,同时保证处理效率。

在功能上,Manus覆盖了多个领域,包括但不限于股价分析、网页设计、研究报告撰写、表格填写以及游戏代打等。这种广泛的适用性让人们对Manus寄予了厚望。

 二、内测体验与亮点

在我们的测试过程中,Manus展现出了令人印象深刻的能力。例如,在“世界时钟.html”任务中,Manus不仅成功设计出了一个功能完备的网页,而且交互体验也十分流畅。此外,在让Manus自主访问游戏网站并选择游戏进行游玩时,它也展现出了一定程度的自主可操作性。

 三、存在的问题与不足

尽管Manus在某些方面表现出色,但在我们的测试中,它也暴露出了一些明显的问题和不足。首先,在高级模式下处理复杂任务时,如撰写文章,Manus的处理时间较长,可能需要30分钟到1小时。其次,在一些特定任务中,如生成符合特定审美要求的网页或按照特定格式交付的研究报告时,Manus的表现往往低于预期。此外,Manus在信息检索和处理方面也存在一些局限,如过度推理、信息来源不够广泛以及无法按照特定要求和格式交付成果等。

特别值得一提的是,在填写表格的任务中,Manus的表现尤为不尽如人意。由于无法理解表格结构和信息真实含义,Manus在处理这类任务时经常出现错误,如覆盖关键信息、删除必要字段或无法找到正确位置填写信息等。此外,在计算资源不足的情况下,这类问题更为突出。

四、个人化与生产力解放的期待

尽管Manus在测试中暴露出了一些问题,但不可否认的是,它作为一款全新的AI Agent产品,仍然赋予了大众很多应用上的想象力。通过其在多个领域的广泛应用和覆盖主流需求的能力,我们可以看到AI Agent在未来解放生产力方面的巨大潜力。

然而,我们也应该看到,AI Agent是一个应该非常个人化的东西。因此,在未来的发展中,我们期待Manus能够在更加个人化的需求上取得突破,如提高信息检索的准确性和广泛性、优化任务处理和交付能力以及增强对特定领域和框架的理解等。只有这样,Manus才能真正实现其在解放生产力方面的承诺和愿景。

 五、结语

总的来说,Manus作为一款全球首款通用性Agent产品,在功能上展现出了强大的实力。然而,在测试和实际应用中,它也暴露出了一些明显的问题和不足。我们期待在未来的发展中,Manus能够不断优化和改进这些问题,以更好地满足用户的需求和期待。同时,我们也期待更多类似的创新产品能够不断涌现,共同推动AI技术的进步和应用的发展。

发表回复