强化学习
-
2026 年企业团队应关注的四大 AI 研究趋势
在人工智能(AI)持续飞速发展的当下,企业若想在激烈的市场竞争中保持领先地位,紧跟 AI 研究的前沿趋势至关重要。2026 年,有四大 AI 研究趋势尤其值得企业团队密切关注,这些…
-
OpenAI 承认人工智能浏览器可能永远无法实现完全安全
OpenAI 在博客中公开承认,针对人工智能浏览器的提示词注入攻击或许永远都无法彻底解决,即便持续对相关防御机制进行升级强化,这类人工智能浏览器也很难达到绝对安全的状态。这一表态打…
-
AI 优先即安全优先
给孩子买一辆崭新的自行车,吸引所有人目光的总会是自行车本身,而非配套的闪亮头盔。但父母们深知头盔的重要性。如今,我们很多人对待人工智能的态度,恐怕和这孩子没什么两样。我们沉迷于它的…
-
AI2 发布 Olmo 3.1:强化学习升级驱动推理能力跃升,全流程开源树立行业新标杆
艾伦人工智能研究所(Ai2)在 Olmo 3 基础上推出迭代版本 Olmo 3.1,通过延长强化学习(RL)训练时长、优化训练策略,显著提升模型在数学推理、指令遵循等核心能力上的表…
-
阿里巴巴 AgentEvolver 框架:通过自动生成合成任务,使模型工具使用性能提升约 30%
阿里巴巴通义实验室(Tongyi Lab)的研究人员成功研发出一款用于自进化智能体的全新框架 ——AgentEvolver。该框架借助大语言模型的知识储备与推理能力,让智能体能够通…
-
Deductive AI 自动化软件调试,为 DoorDash 节省 1000 小时工程工时
新兴初创企业 Deductive AI 正式走出隐匿模式,推出基于强化学习技术的 “AI SRE 智能体” 解决方案,专注于自动化生产环境软件故障诊断与修复辅助。该公司宣布完成 7…
-
Meta 推出 SPICE 框架:让 AI 系统自主习得推理能力,突破传统自博弈局限
Meta 旗下 FAIR 实验室与新加坡国立大学合作研发的新型强化学习框架 ——Self-Play In Corpus Environments(SPICE)正式亮相。该框架通过创…
-
RL 即服务:开启自主化新浪潮的关键力量
强化学习(Reinforcement Learning,简称 RL)长期以来都是人工智能领域中极具潜力却未被充分开发的领域。从击败围棋世界冠军、攻克《星际争霸》的算法,到优化复杂物…
-
编程平台 Cursor 推出首款自研大语言模型 Composer,承诺四倍速度提升
来自初创公司 Anysphere 的 Vibe 编程工具 Cursor,在其 Cursor 2.0 平台更新中,正式推出了首款自研的专有编程大语言模型(LLM)——Composer…
-
代理式AI如何将自动化提升为企业战略核心:下一代商业智能的范式转移
在数字化转型进入深水区的当下,企业自动化正经历从规则驱动到认知驱动的质变。Unite.AI最新发布的深度分析报告揭示,代理式AI(Agentic AI)通过其自主决策、持续学习和战…