AI 软件
之前小编给大家分享过一篇华人第一作者论文,发布了一款名为 DragGAN 的图像编辑模型,是一个非常直观的图像编辑AI模型,用户只需要控制图像中的像素点和方向,就可以让图像变形。
DragGAN 的代码一经发出,短短几周内在GiHub狂揽 31K star,引发广大网友的「Drag热潮」,DragGAN 通过基于点的操作取得了令人印象深刻的编辑结果。然而,不少研究者观察到 DragGAN 也面临着追踪缺失的问题,即 DragGAN 难以有效追踪所需的手柄点;以及跟踪不明确,即跟踪点位于与手柄点相似的其他区域内。
为了解决上述问题,近日,中国科学技术大学和上海AI Lab的研究者们共同发布了一款开源AI工具 FreeDrag, 一种以特征为导向的基于点的交互式编辑框架。以更准确的图像编辑方法,解决了 DragGAN 的准确性问题。
FreeDrag 结合了自适应模板功能、线搜索和模糊定位技术,可以执行稳定且高效的基于点的图像编辑。
大量实验表明,FreeDrag 的方法优于 DragGAN,并且能够在具有相似结构、精细细节或多点目标的挑战性场景中实现稳定的基于点的编辑。
相比而言, FreeDrag 的模糊定位和线性搜索策略有效地缓解了相似点的干扰,为点移动提供了可靠的监督信号,从而高质量地实现预定的编辑目的。FreeDrag 的研究和开发,对于图像编辑领域的发展,无疑将带来一次重要的推进。
16