利用AI修复与编辑人像图片：新技术CompleteMe引领潮流

王浩然 • 2025年5月11日下午4:00 • AI前沿 • 428 views

在人工智能技术的浪潮中，一项名为CompleteMe的创新技术正引领着人像图片修复与编辑的新潮流。这项由加利福尼亚大学默塞德分校与Adobe公司携手推出的新技术，在人像图片的“去遮挡”或隐藏部分恢复方面取得了显著进展，为虚拟试衣、动画制作和照片编辑等领域带来了前所未有的可能性。

CompleteMe：基于参考的人像图片完成技术

CompleteMe技术的核心在于其独特的基于参考的完成机制。与以往仅能依靠图像先验或文本提示来生成遮挡区域内容的非参考方法不同，CompleteMe能够利用额外的参考图像来指导系统，精确地替换或恢复人像图片中被遮挡或缺失的部分。

这一技术的实现得益于其先进的双U-Net架构和区域聚焦注意力（RFA）模块。双U-Net架构包括一个负责整合辅助材料的参考U-Net和一个处理更广泛过程的连贯U-Net。在RFA模块的作用下，系统能够精准地将注意力集中在参考图像中的相关区域，从而确保生成的内容与原始图像在语义和细节上保持高度一致。

技术细节与优势

CompleteMe技术的创新之处在于其能够处理复杂姿势、精细服装图案和独特配饰等具有挑战性的场景。在测试中，CompleteMe在多项指标上均优于现有的参考和非参考方法，展现出了卓越的视觉保真度和语义连贯性。

此外，CompleteMe还采用了一种增强的输入遮挡过程，该过程结合了基于网格的随机遮挡和人体形状遮挡，增加了模型需要完成的遮挡区域的复杂性。这种方法有助于提升生成内容的现实感和鲁棒性。

与现有技术的对比

在对比测试中，CompleteMe与包括DINOv2、Paint-by-Example、AnyDoor、LeftRefill和MimicBrush在内的多种参考和非参考方法进行了比较。结果显示，CompleteMe在多项感知指标上均取得了最高分数，包括CLIP-I、DINO、DreamSim和LPIPS等，这些指标旨在捕捉输出图像与参考图像之间的语义对齐和外观保真度。

尽管在某些指标上，如SSIM和PSNR，CompleteMe并未取得最高分数，但总体上其表现仍然强劲。作者认为，这些结果证明了CompleteMe在结构和感知维度上的均衡实力。

用户研究与实际应用

为了进一步评估CompleteMe与人类感知的一致性，研究者还进行了一项涉及15名标注者和2895个样本对的用户研究。结果显示，与其他参考方法相比，CompleteMe在视觉质量和从参考中保留身份特征方面均获得了更明确的结果。

CompleteMe技术的潜在应用场景广泛，包括但不限于虚拟试衣、动画制作、照片编辑以及更广泛的图像修复领域。随着技术的不断发展和完善，CompleteMe有望为这些领域带来更加高效和精确的工具和解决方案。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/li-yong-ai-xiu-fu-yu-bian-ji-ren-xiang-tu-pian-xin-ji-shu

AI技术 CompleteMe 人像图片修复区域聚焦注意力模块双U-Net架构复杂场景处理编辑视觉保真度语义连贯性

Like (0)

王浩然作者

0 0

Google AMIE：AI“医生”学会解读医疗影像

Previous 2025年5月11日下午2:00

礼貌并不意味着AI会给出更好的答案

Next 2025年5月11日下午6:00

AI前沿

苹果 AI 负责人约翰・吉安南德雷亚因 Siri 发展受阻卸任，前微软高管接任

苹果公司宣布，负责人工智能业务的负责人约翰・吉安南德雷亚（John Giannandrea）正式卸任该职位。这一人事变动发生在苹果 AI 语音助手 Siri 遭遇发展挫折之后 ——…

王浩然
2025年12月5日
000
美陆军与Anduril签200亿美元十年大单，AI国防科技赛道再掀波澜

当地时间2026年3月14日，美国陆军对外宣布，已与国防科技初创企业Anduril签署一份为期10年的合作合同，合同总价值最高可达200亿美元。这一消息迅速引发科技与国防领域的双重…

王浩然
AI前沿 2026年3月19日
000
AI前沿

Cloudflare 的新市场将允许网站向 AI 机器人收取抓取费用

Cloudflare周一宣布计划在明年推出一个市场，网站所有者可以向 AI 模型提供商出售抓取其网站内容的权限。该市场是 Cloudflare 首席执行官 Matthew Prin…

王浩然
2024年9月24日
000
AI前沿

Salesforce豪掷10亿美元投资新加坡，力推AI技术普及‌

在科技日新月异的今天，人工智能（AI）已经成为推动各行各业发展的重要力量。近日，全球领先的客户关系管理软件提供商Salesforce宣布了一项重大投资决策——将在新加坡投入高达10…

王浩然
2025年3月13日
000
AI前沿

谷歌AI能耗数据揭秘：打破认知的真实数字与行业启示‌

当全球媒体持续渲染”AI耗电量堪比小国”的惊悚标题时，谷歌最新发布的真实生产系统数据犹如一盆冷水，浇灭了这场愈演愈烈的能源恐慌。这份基于数十亿次查询的实测报…

王浩然
2025年9月2日
000
AI前沿

微软研究显示：AI推理并非标记越多越好，更多标记可能带来更多问题

大型语言模型推理中的标记数量问题‌ 大型语言模型（LLMs）正日益展现出复杂推理的能力，这得益于“推理时间缩放”技术，即在推理过程中分配更多的计算资源来生成答案。然而，微软研究的一…

王浩然
2025年4月17日
000
AI前沿

纽约商业地产危机：人工智能能否成为救世主？‌

2025年的纽约商业地产市场正经历着前所未有的结构性挑战。这座向来以黄金地段著称的城市，如今正面临商业地产价值分化、空置率攀升的严峻局面。高端甲级写字楼尚能维持稳定，但中低端商业建…

王浩然
2025年9月23日
000
AI前沿

ElevenLabs推出Conversational AI 2.0：更懂对话节奏的语音助手

在人工智能领域，语音技术的进展日新月异，为各行各业带来了前所未有的变革。近日，ElevenLabs，这家由前Palantir工程师创立的知名语音与AI音效创业公司，正式发布了Con…

王浩然
2025年6月1日
000
AI前沿

黑森林实验室（Black Forest Labs）完成 3 亿美元 B 轮融资，估值达 32.5 亿美元，巩固生成式图像技术领先地位

德国 AI 初创公司黑森林实验室（Black Forest Labs）正式宣布完成 3 亿美元 B 轮融资，投后估值高达 32.5 亿美元。此次融资不仅使其成为欧洲生成式 AI 领…

王浩然
2025年12月5日
000
AI前沿

Tennr 完成 3700 万美元 B 轮融资，利用人工智能革新医疗文档处理方式

医疗 AI 初创公司Tennr在 B 轮融资中获得了3700 万美元，而就在六个月前，该公司刚刚完成了1800 万美元的 A 轮融资。此轮融资由Lightspeed Venture…

点点
2024年10月23日
000
AI前沿

YC孵化AI初创公司Pig.dev放弃Windows自动化项目转向AI缓存系统‌

曾参与Y Combinator 2025冬季批次的初创公司Pig.dev原本致力于开发一项可能具有革命性的技术：控制微软Windows桌面的AI智能体技术。但在今年5月，创始人Er…

王浩然
2025年7月21日
000
AI前沿

驯服能源巨兽：集成电压稳压器（IVR）如何破解 AI 电力危机

2025 年 10 月 10 日，Unite.AI 发布的《Taming the Beast: How Integrated Voltage Regulators Are Solv…

王浩然
2025年10月11日
010
AI前沿

Google全球发布新一代Veo 3视频生成模型

在科技创新的浪潮中，Google再次站在了前沿，为全球用户带来了全新的惊喜。2025年7月，Google正式宣布，其最新研发的Veo 3视频生成模型已在全球范围内面向Gemini用…

王浩然
2025年7月5日
000
AI前沿

Runway获3.15亿美元E轮融资，估值53亿美元押注世界模拟技术

当地时间2月10日，AI创企Runway完成3.15亿美元E轮融资，估值跃升至53亿美元，自2018年成立以来累计融资已达8.6亿美元。这轮融资由General Atlantic连…

王浩然
2026年2月11日
000
AI前沿

OpenAI 达成又一笔循环交易：入股投资方关联企业，深度绑定开启 AI 行业新合作模式

人工智能巨头 OpenAI 正式宣布获得私募股权投资公司 Thrive Holdings 的股权，而颇具戏剧性的是，Thrive Holdings 的母公司正是 OpenAI 的主…

王浩然
2025年12月5日
000
AI前沿

Google宣称Gemini 2.5 Pro预览版在编码性能上超越DeepSeek R1与Grok 3 Beta‌

近日，Google正式发布了其备受瞩目的大型语言模型Gemini 2.5 Pro的最新预览版。此次发布不仅标志着Gemini系列模型的又一次重大升级，更以其卓越的编码性能，向业界展…

王浩然
2025年6月7日
000
AI前沿

2025年全球科技预算：生成式AI超越安全成为首要投入

根据亚马逊网络服务（AWS）最新发布的一项全面研究报告，生成式AI工具已经超越网络安全，成为全球IT领导者在2025年技术预算中的首要优先事项。这一转变标志着企业在利用AI转型潜力…

王浩然
2025年5月9日
000
AI前沿

Claude 的模型上下文协议 (MCP)：开发人员指南

Anthropic 的模型上下文协议 (MCP)是一种开源协议，可实现 AI 助手与数据库、API 和企业工具等数据源之间的安全双向通信。通过采用客户端-服务器架构，MCP 标准化…

王浩然
2024年12月11日
000
AI前沿

奥德赛AI模型：将视频转化为交互世界的创新突破‌

在人工智能（AI）技术飞速发展的今天，我们不断见证着前所未有的创新与应用。近期，一款名为“奥德赛”的AI模型横空出世，以其独特的能力将视频内容转化为交互式的虚拟世界，这一革命性的进…

王浩然
2025年6月1日
000
AI前沿

PTC、微软和大众汽车携手合作开发生成式人工智能

PTC 已确认正在与微软和大众汽车集团合作开发用于实体产品软件开发的生成式 AI产品。 Codebeamer Copilot 基于 PTC 的 Codebeamer 应…

王浩然
2024年12月25日
000