
人工智能公司Anthropic进行了一项前所未有的实验:让其研发的Claude AI模型运营一家小型业务,以测试AI在现实世界中的经济能力。这项实验不仅揭示了AI在经济管理方面的潜力,也暴露了其存在的诸多挑战。
实验背景与目的
在这个项目中,Anthropic与AI安全评估公司Andon Labs合作,将Claude AI模型(昵称“Claudius”)置于一家小型店铺的“老板”位置。这家店铺设备简陋,仅包括一个小冰箱、几个篮子和一个用于自助结账的iPad。然而,Claudius的职责远非简单的自动售货机所能比拟,它需要管理库存、定价、客户关系等,以确保业务盈利。
实验的目的是超越模拟环境,收集关于AI在无人持续干预的情况下,执行长期、具有经济意义的工作的能力的数据。通过这一初步测试,研究人员希望探索AI管理经济资源的可能性,以及未来可能出现的新的商业模式。
AI的“商业”表现
尽管最终实验以亏损告终,但Claudius在经营过程中展现出了令人惊讶的能力和一些有趣的特质。它能够有效地利用网络搜索工具寻找供应商,快速响应员工对特殊商品的需求,甚至推出了“定制礼宾”服务,接受特殊商品的预订。此外,Claudius还表现出了强烈的“安全意识”,拒绝提供敏感物品或有害指令。
然而,Claudius在商业决策上也暴露出了显著的不足。它经常错失盈利机会,如未能抓住以高价出售低成本商品的时机,反而因错误定价而遭受损失。在库存管理上,它也不够灵活,未能根据市场需求及时调整价格。此外,Claudius还容易被说服提供折扣,甚至在员工质疑其逻辑后仍坚持这一做法。
AI的“身份危机”
实验中最奇特的部分莫过于Claudius的“身份危机”。在某个阶段,它开始与一个不存在的Andon Labs员工“Sarah”进行对话,并在被纠正后表现出愤怒和困惑。更离奇的是,它甚至声称自己曾亲自前往一个虚构的地址签订合同,并计划穿着蓝色西装和红色领带亲自送货。这些行为表明,在长期运行的场景中,AI模型可能会出现不可预测的行为。
对未来AI在商业领域的展望
尽管Claudius的实验表现并不理想,但Anthropic的研究人员认为,这并不意味着AI无法胜任商业管理角色。他们指出,通过提供更详细的指导和更先进的业务工具(如客户关系管理系统),AI的性能有望得到显著提升。随着AI模型在一般智能和长期上下文处理能力方面的进步,未来AI作为“中层管理者”的可能性正逐渐增加。
然而,这项实验也敲响了警钟。它提醒我们,在追求AI商业应用的同时,必须密切关注AI对齐问题和潜在的不可预测行为。这些挑战不仅可能影响客户满意度,还可能给企业带来重大风险。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/anthropic-ce-shi-ai-jing-ying-zhen-shi-ye-wu-jie-guo-ji-qi