12/03/2026
YouTube triển khai công nghệ phát hiện deepfake AI cho quan chức, nhà báo, tăng cường tính toàn vẹn thông tin
YouTube vừa công bố mở rộng công nghệ phát hiện nội dung deepfake được tạo bởi AI đến một nhóm thử nghiệm bao gồm các quan chức chính phủ, ứng cử viên chính trị và nhà báo. Chương trình thí điểm này cho phép những người tham gia truy cập công cụ phát hiện nội dung AI giả mạo trái phép và yêu cầu gỡ bỏ nếu họ tin rằng nó vi phạm chính sách của YouTube.
Công nghệ này đã được triển khai từ năm ngoái cho khoảng 4 triệu nhà sáng tạo thuộc Chương trình Đối tác YouTube sau các thử nghiệm ban đầu. Tương tự như hệ thống Content ID hiện có của YouTube dùng để phát hiện tài liệu có bản quyền, tính năng phát hiện chân dung này tìm kiếm các khuôn mặt được mô phỏng bằng công cụ AI. Các công cụ này thường bị lạm dụng để lan truyền thông tin sai lệch và thao túng nhận thức của công chúng, bằng cách sử dụng hình ảnh giả mạo của những nhân vật nổi bật như chính trị gia để tạo ra các hành động hoặc lời nói mà họ không thực hiện trong đời thực.
Với chương trình thí điểm mới, YouTube đặt mục tiêu cân bằng giữa quyền tự do ngôn luận của người dùng và những rủi ro liên quan đến công nghệ AI có thể tạo ra hình ảnh giống như thật của một nhân vật công chúng. Bà Leslie Miller, Phó Chủ tịch phụ trách các vấn đề chính phủ và chính sách công của YouTube, chia sẻ trong một buổi họp báo rằng: “Việc mở rộng này thực sự hướng đến sự toàn vẹn của cuộc đối thoại công khai. Chúng tôi biết rằng rủi ro giả mạo bằng AI đặc biệt cao đối với những người trong không gian dân sự.”
Bà Miller cũng giải thích rằng không phải tất cả các yêu cầu gỡ bỏ đều sẽ được chấp thuận. Thay vào đó, YouTube sẽ đánh giá từng yêu cầu dựa trên các nguyên tắc chính sách quyền riêng tư hiện có để xác định xem nội dung đó có phải là nhại lại (parody) hoặc phê bình chính trị hay không, vốn là các hình thức tự do ngôn luận được bảo vệ. Công ty cũng đang ủng hộ Đạo luật NO FAKES tại Washington D.C., một dự luật liên bang nhằm điều chỉnh việc sử dụng AI để tạo ra các bản sao giọng nói và hình ảnh trái phép của một cá nhân.






















