VLC 开发人员正在开发人工智能实时字幕

VLC(非常流行的开源媒体播放器)正在开发实时人工智能字幕功能。

负责 VLC 开发的非营利组织 VideoLAN 在 CES 2025 期间演示了 VLC 中的自动字幕生成 — 其中不是使用人工智能让你在今年脱颖而出——而且分享了一个剪辑上周在 X 的 CES 展台上展示了​​该功能的实际应用。

VLC 无需云服务或互联网连接即可使用 AI 自动生成字幕。

该功能离线工作,为超过100+语言提供实时翻译支持;能够同时翻译/显示两种语言;并可以将翻译“保存”到 SRT 文件。

“VL​​C 自动字幕生成和翻译基于本地和开源 AI 模型,在您的机器上运行,离线工作,并支持多种语言,”VideoLAN 在其 X 帖子中说道。

后续帖子中分享的照片显示了英国喜剧演员 Ricky Gervais 的视频(标志性/臭名昭著,取决于您的敏感度)2020 年金球奖烘焙以各种不同语言显示实时字幕,包括日语和法语:

VLC 的实时人工智能字幕正在运行(图片:VLC,编辑:我)

我们大多数人都熟悉 YouTube 上自动生成的字幕,社交媒体“创作者”使用 AI 字幕应用程序在短视频上“刻录”字幕,许多领先的视频编辑器也具有插件和/或本机实时转录功能。

在 VLC 中利用类似技术是有意义的。

我喜欢观看带有字幕的本地电影、电视节目和 DVD,但有时文件/光盘上没有字幕。 VLC 有一个内置的字幕下载工具,无需在大量恶意软件兜售的免费字幕下载网站中寻找 SRT 文件。

当然,只有某人在某处以您需要的语言共享/制作了字幕文件,您才能下载字幕文件。如果他们没有,或者你想要自定义视频(或其他类型的内容)上的字幕 - 不是评判,但他们真的有很多话要说吗?1),你就靠你自己了。

我想知道VLC的自动字幕功能是否利用了OpenAI的耳语,因为它是用于语音识别任务的领先开源神经网络。

无论 VLC 使用什么模型,它都可以离线运行,与云分离,无需登录、注册或网络连接,这很好。

一位关注者询问他们是否会考虑使用云服务来代替 VideoLAN回复说“绝对不”是“目标是不依赖昂贵的云运营!”

在撰写本文时,VLC 尚未(据我所知)表明何时/是否会提供具有 AI 生成字幕的播放器的公开演示以供测试,但表明这个功能可能作为 VLC 4.0 的一部分提供。

目前,如果您想观看的 MP4 电影没有字幕,您需要坚持寻找 SRT/VTT 文件。

想象这一功能被用于一般的实时非官方人工智能配音并不是一个飞跃——尽管人工智能无法行动,而且这一举措可能会得到更广泛的行业实施,导致流媒体服务用人工智能取代配音演员。

  1. 显然,我说的是音乐会。↩︎