返回官网

如何使用 Deep Live Cam 进行实时换脸?

狒狒 2025-6-17 python 5 次

像 Deepfake 和换脸这样的人工智能技术在我们的日常数字生活中越来越常见。我们经常浏览一些我们喜欢的名人或政治领袖的胶片和视频,他们做着各种搞笑的事情。虽然我们知道这些都是假的,而且是由人工智能生成的,但你有没有想过它们是如何制作出来的?Deep Live Cam 就是制作此类内容的工具之一。它是一款开源工具,可以让你实时交换视频中的脸部,并仅使用一张图片即可创建 Deepfake。在本博客中,我们将了解 Deep Live Cam 的工作原理、设置方法,以及负责任地使用实时换脸工具时需要注意的事项。

主要特点

以下是它的一些主要特点:

  • 实时换脸:以最小的延迟快速更改视频中的面孔。
  • Easy Deepfakes:只需一张图片即可轻松生成深度伪造视频。
  • 适用于多种系统:在 CPU、NVIDIA CUDA 和 Apple Silicon 硬件上运行。
  • 更佳画质:使用 GFPGAN 等模型,使换脸效果更逼真。这提升了实时换脸的视觉效果。
  • 模块化软件设计:具有模块化结构,可轻松更新,新模型出现时即可添加。
  • 安全措施:包括防止其用于有害用途的检查。这符合法律和道德标准。

Deep Live Cam 内部如何运作?

Deep Live Cam 结合多种不同的 AI 模型来实现实时换脸功能。这些模型包括: 

  • inswapper: InsightFace 开发的这个模型基于数百万张面部图像进行训练。该模型能够从二维图像推断出三维面部结构,并将身份特征与姿势特征分离。这使得人脸替换能够流畅进行。
  • GFPGAN:换脸后,GFPGAN 会提升图像质量。它会优化细节并纠正图像错误。此过程确保深度伪造视频生成具有逼真的视觉效果。




入门:安装和设置

本部分将指导您安装 Deep Live Cam。请仔细按照以下步骤操作,以确保设置成功。正确安装后,软件将具备实时人脸交换和深度伪造视频生成功能。

安装 Python 3.10

Deep Live Cam 建议使用 Python 3.10 版本。较新的版本(例如 3.12 或 3.13)可能会导致错误。如果您使用的 Python 版本高于 3.10,则可能会看到以下错误:ModuleNotFoundError:没有名为“distutils”的模块。出现此错误的原因是 distutils 不包含在较新的 Python 版本中。使用 Python 3.10 可以避免这种情况。

请访问此处的官方 Python 发布页面

安装 FFmpeg

Deep Live Cam 的视频处理由 FFmpeg 负责。

下载 FFmpeg:我们在 Linux 上运行这个系统,所以 

# Make a directory in your home for FFmpeg m

kdir -p ~/apps/ffmpeg && cd ~/apps/ffmpeg 


# Download a static build of FFmpeg for Linux 

wget https://johnvansickle.com/ffmpeg/releases/ffmpeg-release-amd64-static.tar.xz 


# Extract it 

tar -xf ffmpeg-release-amd64-static.tar.xz 


# Enter the extracted directory 

cd ffmpeg-*-amd64-static 


# Test it 

ffmpeg -version


export PATH="$HOME/apps/ffmpeg/ffmpeg-*-amd64-static:$PATH"

克隆 Deep Live Cam 存储库

接下来,获取 Deep Live Cam 项目文件。

使用 Git 克隆:打开终端或命令提示符。使用 cd your\desired\path 导航到所需目录。然后运行:

git clone https://github.com/hacksider/Deep-Live-Cam.git

终端将显示克隆进度。现在使用以下命令更改目录 

cd Deep-Live-Cam

下载AI模型

Deep Live Cam 需要特定的 AI 模型才能运行。

  1. 下载这两个模型文件:
  2. 将两个下载的文件放入 Deep-Live-Cam 项目目录内的“models”文件夹中:

使用 venv 安装依赖项

建议使用虚拟环境 (venv)。它可以隔离项目依赖关系。venv 是一个 Python 工具,它可以创建隔离的 Python 环境。这可以防止项目之间的软件包冲突。每个项目都可以拥有自己的软件包版本。它还能保持你的主要 Python 安装干净整洁。

创建虚拟环境:在 Deep-Live-Cam 根目录中打开终端。运行:

python -m venv deepcam

如果您有多个 Python 版本,请使用其完整路径指定 Python 3.10:

/path/to/your/python3.10 -m venv deepcam

1.激活虚拟环境:

On macOS/Linux source deepcam/bin/activate

2. 您的命令行提示符现在应该在开头显示 (deepcam):

安装所需的软件包:在虚拟环境处于活动状态时,运行:

pip install -r requirements.txt

此过程可能需要几分钟才能下载应用程序所需的所有库。

运行应用程序(初始 CPU 运行)

安装依赖项后,即可运行程序。

在终端中执行以下命令(确保 venv 处于活动状态):

python run.py

注意:第一次运行时,程序将下载额外的模型文件(约 300MB)。

您的 Deep Live Cam 现在应该已准备好进行基于 CPU 的操作:

测试深度实时摄像头

上传源脸部和目标脸部,然后单击“开始”,它将开始将您的脸部从源图像交换到目标图像。



使用 GPU 加速(可选)

为了获得更快的性能,如果您的硬件支持,您可以使用 GPU 加速。

Nvidia CUDA加速

安装 CUDA Toolkit:确保您已从 NVIDIA 网站安装了 CUDA Toolkit 11.8。

安装依赖项:

pip uninstall onnxruntime onnxruntime-gpu  pip install onnxruntime-gpu==1.16.3

使用 CUDA 运行:

python run.py --execution-provider cuda

如果程序窗口打开时没有错误,则表明 CUDA 加速正在运行。

如何使用 Deep Live Cam?

执行 python run.py 启动应用程序窗口。

  • 视频/图像换脸模式:
    • 选择源人脸图像(您想要使用的人脸)。
    • 选择目标图像或视频(将替换面部的位置)。
    • 选择输出目录。
    • 点击“开始”。
    • 帧将被处理并保存到您选择的输出位置的子目录中。处理后将显示最终视频。
  • 网络摄像头模式:
    • 选择源人脸图像。
    • 点击“直播”。
    • 等待几秒钟(通常为 10 到 30 秒)以显示预览窗口。
    • 面部增强:此选项可提升图像清晰度。如果硬件性能不足,可能会导致视频卡顿。

故障排除

脸部区域显示黑色块?如果您遇到此问题,请在激活的 venv 环境中尝试以下命令:

对于 Nvidia GPU 用户:

pip uninstall onnxruntime onnxruntime-gpu pip install onnxruntime-gpu==1.16.

然后,尝试再次运行该程序:

python run.py

另请阅读:如何在人工智能时代检测和处理深度伪造?

一键 Deepfake

  1. 选择源照片:选择一张清晰的脸部照片。高分辨率图像最适合实时换脸。
  2. 选择目标视频:选择一个视频或使用网络摄像头。换脸操作将在这里进行。
  3. 设置选项:调整设置以匹配您的计算机硬件。这包括帧处理选项和输出路径。
  4. 开始交换:点击“开始”按钮。此操作将启动深度伪造视频生成过程。
  5. 观察并调整:在屏幕上实时查看结果。如有需要,可调整设置以获得理想效果。

我的 Deep Live Cam 测试结果

我使用名人 Sam Altman 和 Elon Musk 的清晰照片测试了 Deep Live Cam,并将实时换脸功能应用到我的直播网络摄像头中。效果相当不错:

  • 逼真:交换后的面部表情自然。灯光与目标视频匹配良好。
  • 运行良好:该程序在中端 NVIDIA GPU 上运行流畅,几乎没有延迟。
  • 一些问题:快速的头部运动会导致一些视觉错误。极端角度也出现了一些小问题。这些方面仍有改进空间。

涉及的风险

Deep Live Cam 提供了令人兴奋的用途,但也带来了巨大的风险。它的实时人脸交换功能需要谨慎考虑。其中一些

  • 身份盗窃:该工具可以有效地冒充个人。这引发了人们对身份盗窃的严重担忧。隐私可能被侵犯。
  • 金融欺诈:这项技术可能助长诈骗行为。例如,伪造高管视频通话来批准不良交易。
  • 信任受损:随着换脸技术的发展,辨别真假变得越来越困难。这可能会损害人们对数字沟通的信任。
  • 法律问题:未经同意使用此类技术可能会引发问题。不同司法管辖区的法律规定各不相同。用户可能会因深度伪造视频生成而面临诉讼或监管行动。

用户必须了解这些风险。他们应该负责任地使用深度直播摄像头。实施安全措施会有所帮助。给深度伪造内容添加水印是其中一步。在使用肖像前征得同意至关重要。这些措施可以减少潜在的滥用。

另请阅读:仅使用一个源视频的 Deepfakes 简介

结论

Deep Live Cam 让实时换脸和 Deepfake 视频的制作变得轻而易举,即使技术水平有限。虽然它对创作者和教育工作者来说是一个强大的工具,但其易用性也引发了严重的担忧。滥用的可能性确实存在,例如身份盗窃、虚假信息或侵犯隐私。因此,负责任地使用这项技术至关重要。务必征得用户同意,添加水印等保护措施,并避免欺诈性使用。Deepfake 工具可以激发创造力,但只有谨慎使用才能实现。

常见问题

Q1. 什么是 Deep Live Cam?

答:Deep Live Cam 是一款 AI 工具。它可以在实时视频中交换人脸,还能根据一张图片制作 Deepfake 视频。

Q2. 我需要什么来运行 Deep Live Cam?

答:你需要 Python 3.8 及以上版本以及特定的库。此外,还需要预先训练好的 AI 模型。最好使用性能强大的计算机(CPU、NVIDIA 或 Apple Silicon)。

Q3. Deep Live Cam 难用吗?

答:它旨在方便用户完成诸如一键深度伪造之类的任务。但是,初始设置可能需要一些技术技能。

Q4. Deep Live Cam 有风险吗?

答:是的,存在重大风险。这些风险包括身份盗窃、金融欺诈和虚假信息。合乎道德的使用至关重要。

Q5. Deep Live Cam 可以提高画质吗?

答:是的。它使用了 GFPGAN 等模型。这些模型增强了交换后的面部效果,旨在呈现更逼真的外观。


发表评论

Copyright © 2016 DEWEBSTUDIO