重视AI信任：确保AI输出的可靠性‌

王浩然 • 2025年6月12日下午6:00 • AI前沿 • 302 views

随着社会对人工智能（AI）和机器学习（ML）应用的依赖日益加深，信息消费的方式正在被重新定义。从AI驱动的聊天机器人到由大型语言模型（LLMs）生成的信息综合，人们现在能够获取比以往任何时候都更多、更深入的信息。然而，随着科技公司竞相在其价值链中实施AI，一个关键问题浮出水面：我们真的能信任AI解决方案的输出吗？

AI输出的信任挑战

对于给定的输入，一个模型可能会生成许多其他同样合理的输出。这可能是由于训练数据不足、训练数据的变化或其他原因造成的。在部署模型时，组织可以利用不确定性量化来为其最终用户提供更清晰的理解，即他们应该多么信任AI/ML模型的输出。不确定性量化是估计其他可能输出是什么的过程。

想象一个模型预测明天的最高温度。模型可能会输出21ºC，但应用不确定性量化后，可能表明模型同样可能输出12ºC、15ºC或16ºC。了解这一点后，我们对21ºC的简单预测还有多少信任？尽管不确定性量化有可能增强信任或提醒人们谨慎行事，但许多组织因实施它的额外工作、对计算资源的需求以及推理速度的要求而选择跳过这一步骤。

人机协作系统中的信任问题

在人机协作系统（如医疗诊断和预后系统）中，人类是决策过程的一部分。如果盲目信任医疗AI/ML解决方案的数据，医疗专业人员可能会误诊患者，从而导致不佳的健康结果，甚至更糟的情况。不确定性量化可以让医疗专业人员定量地看到何时可以更多地信任AI的输出，何时应该对特定预测持谨慎态度。同样，在完全自动化的系统（如自动驾驶汽车）中，模型对障碍物距离的估计输出可能导致本可避免的碰撞，而如果对距离估计进行不确定性量化，则可能避免这种情况。

利用蒙特卡洛方法建立AI/ML模型信任的挑战

蒙特卡洛方法是在曼哈顿计划期间开发的一种强大的不确定性量化方法。它们涉及多次以略有不同的输入重新运行算法，直到进一步的迭代不再在输出中提供太多信息；当过程达到这种状态时，就说它已经收敛。蒙特卡洛方法的一个缺点是它们通常很慢且计算密集，需要多次重复其组成计算才能获得收敛输出，并且这些输出之间存在固有的可变性。由于蒙特卡洛方法使用随机数生成器的输出作为其关键构建块之一，即使你使用许多内部重复运行蒙特卡洛，当你使用相同参数重复该过程时，你获得的结果也会改变。

迈向AI/ML模型的可信度

与传统服务器和AI专用加速器不同，一种新型计算平台正在被开发出来，以直接处理经验概率分布，就像传统计算平台处理整数和浮点数一样。通过在这些平台上部署他们的AI模型，组织可以自动化对其预训练模型实施不确定性量化的过程，并且还可以加速传统上使用蒙特卡洛方法的其他类型的计算任务，如金融中的风险价值（VaR）计算。特别是，对于VaR场景，这种新型平台允许组织直接使用从真实市场数据构建的经验分布，而不是通过随机数生成器生成的样本来近似这些分布，从而进行更准确的分析并获得更快的结果。

下一代计算技术促进不确定性量化

最近在计算领域的突破显著降低了不确定性量化的障碍。我与同事在2024年神经信息处理系统大会（NeurIPS）的“新计算范式下的机器学习”研讨会上发表的一篇研究文章强调了这一点。我们开发的一种下一代计算平台使不确定性量化分析的运行速度比在高端Intel Xeon服务器上运行传统的基于蒙特卡洛的分析快100多倍。这样的进步使得组织在部署AI解决方案时能够轻松实施不确定性量化，并以较低的开销运行这种不确定性量化。

AI/ML可信度的未来

随着组织将更多AI解决方案融入社会，AI/ML的可信度将成为首要任务。企业不能再承担在部署AI模型时跳过实施允许消费者知道何时应对特定AI模型输出持怀疑态度的设施的风险。人们对这种可解释性和不确定性量化的需求是明确的，大约有四分之三的人表示，如果建立了适当的保证机制，他们更愿意信任AI系统。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/zhong-shi-ai-xin-ren-que-bao-ai-shu-chu-de-ke-kao-xing

AI/ML可信度 AI信任下一代计算不确定性量化人机协作医疗诊断可解释性蒙特卡洛方法计算平台风险价值（VaR）

Like (0)

王浩然作者

0 0

Evogene与Google Cloud发布生成分子设计基础模型，开创生命科学AI新时代‌

Previous 2025年6月12日

AlphaOne：革新AI开发，精准调控LLM思考力，驱动性能飞跃

Next 2025年6月12日

AI前沿

从数独到电网：数学优化如何重塑我们的决策逻辑‌

当世界顶尖围棋选手面对AlphaGo的”神之一手”时，他们遭遇的不仅是算法碾压，更是数学优化理论对人类直觉思维的降维打击。这种源自18世纪拉格朗日乘数法的古…

王浩然
2025年8月28日
000
AI前沿

80%的AI公司，就要凉凉了

最近看到一份报告：“未来5年，将有80%的AI初创公司倒闭。” 其实从创业公司的生存率来说，这个数据是符合客观事实的，近10年的统计数据显示，中国创业公司三年存活率大概在20%左右…

点点
2024年9月30日
000
AI前沿

AI 应用开发的未来：类型安全是不可逾越的基石

在 AI 代码生成技术日益普及的当下，一个关键问题逐渐凸显：AI 生成的代码或许能通过编译，但缺乏严格类型安全的支撑，这种 “成功” 往往转瞬即逝。类型安全如同坚固的护栏，能防止脆…

王浩然
2025年10月5日
000
AI前沿

因卡马拉·哈里斯深度伪造案，法官阻止加州实施新 AI 法

周三，一名联邦法官阻止了加州一项新的人工智能法律的通过，而该法律刚由州长加文·纽森签署，不到两周。签署 AB 2839 后不久，纽森表示，该法律可能被用来迫使埃隆·马斯克删除他转发…

王浩然
2024年10月4日
000
AI前沿

2026：投资者押注 “无聊 AI” 之年

在人工智能（AI）领域，创新的浪潮从未停歇，新技术、新应用层出不穷，吸引着大众的目光。然而，2026 年或许会成为一个独特的年份，投资者们开始将目光投向所谓的 “无聊 AI”。这一…

王浩然
2026年1月4日
000
AI前沿

微软 Fara-7B：可本地运行的计算机使用 AI 智能体，性能媲美 GPT-4o

微软正式推出参数规模为 70 亿的全新 AI 模型 Fara-7B，其定位为 “计算机使用智能体（Computer Use Agent，CUA）”，核心能力是直接在用户个人电脑上执…

王浩然
2025年11月25日
000
AI前沿

AWS与沙特支持的Humain达成战略合作，共筑AI新生态

在科技日新月异的今天，全球科技巨头们纷纷寻求与不同国家和地区的合作，以拓展其业务版图和技术影响力。近日，亚马逊旗下的云服务提供商AWS宣布与沙特阿拉伯新成立的人工智能（AI）公司H…

王浩然
2025年5月17日
000
AI前沿

Nvidia 刚刚推出了一款新 AI 模型，击败了 OpenAI 的 GPT-4——没有大的发布，只有巨大的成果

英伟达周二悄然发布了一种新的人工智能模型，其表现优于行业领导者OpenAI和Anthropic 的产品，标志着该公司人工智能战略的重大转变，并可能重塑该领域的竞争格局。该模型名为…

王浩然
2024年10月18日
000
AI前沿

从临床医生到AI创业者：Rihan Javid博士谈AI如何重构医疗营收周期管理

当医疗行业的临床需求与前沿技术碰撞，往往会催生出改变行业格局的创新力量。Rihan Javid博士就是这样一位跨界者——作为精神科医生，他深知临床一线的痛点；作为连续创业者，他正用…

王浩然
2026年3月7日
000
AI前沿

国防中的人类学和元科学：军事人工智能应用的新前沿

想象一下这样的未来：无人机以惊人的精度运行，战场策略实时调整，军事决策由不断从每次任务中学习的人工智能系统提供支持。这样的未来不再遥不可及。相反，它正在发生。人工智能 (AI)已从…

王浩然
2024年12月23日
000
AI前沿

Creatio发布首个内置代理型数字人才的AI原生平台

引言在数字化转型的大潮中，企业对于客户关系管理（CRM）系统的需求日益增强。为了满足这一需求，Creatio，一家领先的CRM解决方案提供商，近日宣布推出其首个AI原生平台，该平…

王浩然
2025年3月19日
000
AI前沿

Nscale 将向英国数据中心投资 25 亿美元，助力生成式人工智能和政府雄心

总部位于伦敦的 AI 超大规模提供商Nscale宣布，计划在未来三年内向英国数据中心行业投资 25 亿美元（20 亿英镑）。这一重大承诺将支持英国政府的 AI 机遇行动计划以及该国…

王浩然
2025年1月14日
000
AI前沿

Meta 不愿透露是否利用智能眼镜拍摄的照片来训练 AI

Meta 的 AI 驱动雷朋眼镜正面有一个隐蔽的摄像头，不仅会在你要求时拍照，还会在 AI 功能触发某些关键词（例如“看”）时拍照。这意味着这款智能眼镜会收集大量照片，包括有意拍摄…

点点
2024年10月2日
000
AI前沿

人工智能公司将实现工业车辆自动化

一个新名字——SteerAI——通过中东出现在自动驾驶汽车领域。该项目由阿联酋阿布扎比政府下属先进技术研究委员会的商业化部门 VentureOne 推出。据 VentureOn…

王浩然
2024年11月9日
000
AI前沿

ChatGPT：你需要了解的有关人工智能聊天机器人的一切

OpenAI 的文本生成 AI 聊天机器人 ChatGPT 自2022 年 11 月推出以来，就风靡全球。ChatGPT最初是一种通过使用简短的文本提示来编写论文和代码来提高生产力…

王浩然
2024年9月1日
000
AI前沿

AI虚拟演员Tilly Norwood发布“史上最烂歌曲”，AI创作的尴尬困境暴露无遗

当AI技术不断向各个领域渗透，虚拟偶像、AI演员已经不再是新鲜事，但Particle6公司推出的AI虚拟演员Tilly Norwood，却用一首名为《Take the Lead》的…

王浩然
3天前
000
AI前沿

生成式AI工作中的隐形风险：如何应对“影子AI”‌

生成式AI（GenAI）已经从个人在家庭或个人设备上的实验性应用，深入到我们的工作习惯之中，极大地提升了生产效率，但同时也给组织带来了重大的安全风险。敏感的公司数据，无论是故意还是…

王浩然
2025年6月26日
000
AI前沿

AI 销售代表初创企业正在蓬勃发展。那么风险投资家为何如此谨慎呢？

当你真正向风险投资家询问投资人工智能初创企业的情况时，他们会告诉你，企业正在疯狂地进行实验，但在将人工智能解决方案纳入其正在进行的业务流程方面却进展缓慢。但也有例外。其中之一似…

王浩然
2024年12月27日
000
AI前沿

投毒悖论：为何更大规模的 AI 模型更易遭受攻击

在 AI 技术飞速迭代的当下，模型规模的扩张已成为行业发展的重要趋势 —— 从早期参数以百万计的模型，到如今千亿、万亿参数的大型语言模型（LLMs），算力与数据的持续投入推动着模型…

王浩然
2025年10月13日
000
AI前沿

人工智能科学家：自动化研究的新时代或才刚刚开始

科学研究是深厚知识和创造性思维的迷人结合，推动着新的见解和创新。最近，生成式人工智能已成为一股变革力量，利用其能力处理大量数据集并创建反映人类创造力的内容。这种能力使生成式人工智能…

点点
2024年9月1日
000