NarratoAI
扫码查看

自动生成影视解说并剪辑视频的AI工具

NarratoAI

综合介绍

NarratoAI是一个一站式的自动化工具,它的核心功能是利用人工智能大语言模型(LLM)来创作影视解说内容。具体来说,用户只需要提供一个视频文件,NarratoAI就能自动完成后续的所有工作,包括:分析视频内容、撰写解说文案、根据文案剪辑视频片段、为视频配上电脑合成的语音,以及生成相应的字幕文件。整个过程高度自动化,旨在帮助内容创作者,特别是影视解说领域的博主,大幅提升制作效率。该工具整合了多种AI技术,将原本需要耗费大量时间和精力的视频剪辑、文案写作、配音等多个环节,简化为一键式操作,让创作者可以将更多精力投入到创意和选题上。

功能列表

  • 自动化文案撰写: 利用大语言模型(如DeepSeek、Qwen2-VL)分析视频内容,自动生成符合影片情节的解说文案。
  • 自动化视频剪辑: 根据生成的解说文案,智能匹配和剪辑视频画面,确保视听同步。
  • 自动化配音: 内置多种文本转语音(TTS)引擎,可将生成的文案自动转换为语音旁白。
  • 自动化字幕生成: 自动为视频生成与配音时间轴精确匹配的字幕文件。
  • 支持多种AI模型: 支持接入并使用多种主流的大语言模型,用户可以根据成本和效果进行选择。
  • 短剧解说与混剪: 专门针对当前流行的短剧形式进行了优化,支持快速混剪和解说。
  • Web用户界面: 提供一个直观的网页操作界面,用户可以通过浏览器轻松完成所有操作,无需编写代码。
  • 一键更新与清理: 为Windows用户提供了.bat脚本,可以一键更新程序到最新版本或清理缓存文件。

使用帮助

NarratoAI旨在简化视频解说内容的创作流程。以下是详细的使用说明,旨在帮助你从配置环境到最终生成视频的每一步。

1. 环境要求

在开始使用之前,请确保你的电脑满足以下基本配置要求:

  • 操作系统: Windows 10/11 或 macOS 11.0 及以上版本。
  • 处理器 (CPU): 建议最低配置为4核处理器。
  • 内存 (RAM): 建议最低配置为8GB。
  • Python环境: 需要安装Python 3.12或更高版本。
  • 显卡 (GPU): 非必需项,工具主要依赖CPU和AI模型的API进行运算。

2. 安装流程

获取和安装NarratoAI主要通过代码构建的方式进行,具体步骤如下:

第一步:获取项目文件打开你电脑的终端(在Windows上可以是CMD或PowerShell),使用git命令将项目代码克隆到本地。

git clone https://github.com/linyqh/NarratoAI.git

执行此命令后,你会在当前目录下看到一个名为NarratoAI的文件夹。

第二步:安装依赖库进入项目目录,并安装所有必需的Python库。

cd NarratoAI
pip install -r requirements.txt

该命令会自动读取requirements.txt文件,并下载安装所有依赖的第三方库,例如moviepy等。

3. 配置文件设置

工具的许多功能,特别是AI模型,需要通过API密钥来配置。

第一步:创建配置文件在项目根目录下,你会找到一个名为config.example.toml的示例配置文件。请将它复制一份,并重命名为config.toml

第二步:填写API密钥用文本编辑器打开config.toml文件。你会看到不同AI模型服务商的配置区域。以使用DeepSeek模型为例,你需要注册并获取API Key。项目文档中提到了通过硅基流动(SiliconFlow)平台获取,因为该平台提供了免费额度。

[llm]部分,找到对应的模型配置,填入你的API Key。

# config.toml 文件示例
[llm]
provider = "siliconflow" # 或者 "openai", "deepseek" 等
[siliconflow]
api_key = "sk-xxxxxxxxxxxxxxxx" # 在这里填入你从硅基流动获取的API Key
# base_url = "https://api.siliconflow.cn/v1" # 通常不需要修改

同样地,如果你需要使用其他TTS(文本转语音)服务,也需要在配置文件中填写对应的API Key。

4. 操作流程

配置完成后,就可以开始使用了。

第一步:启动程序对于Windows用户,可以直接双击项目目录下的start.bat脚本来启动Web用户界面。对于其他系统的用户,可以在终端中运行以下命令:

python webui.py

程序成功运行后,终端会显示一个本地网址,通常是http://127.0.0.1:7860

第二步:使用Web界面在浏览器中打开上述网址,你将看到NarratoAI的操作界面。整个操作流程非常直观:

  1. 上传视频: 在界面上找到上传区域,选择你要解说的本地视频文件(例如.mp4格式)。
  2. 选择模型和任务:
    • 在模型选择区域,选择你在config.toml中配置好的大语言模型(例如DeepSeek)。
    • 选择任务类型,例如“影视解说”或“短剧混剪”。
  3. 配置解说和剪辑参数:
    • 配音选项: 选择你喜欢的语音音色和语速。
    • 字幕选项: 设置字幕的字体、颜色和大小。
    • 视频选项: 可以设置是否保留原声、背景音乐(BGM)等。
  4. 开始生成: 所有参数设置完毕后,点击“开始生成”或类似的按钮。NarratoAI会开始执行自动化流程:
    • 首先,它会将视频信息发送给AI模型进行分析和文案生成。
    • 接着,根据文案进行视频剪辑和语音合成。
    • 最后,将所有元素(视频、配音、字幕)合成为一个完整的视频文件。
  5. 下载成品: 处理完成后,界面上会提供最终视频的下载链接。你可以直接下载保存到本地。

5. 更新与维护

  • 更新软件: 作者会不定期发布新功能和修复。如果你是Windows用户,可以运行update.bat一键将项目更新到最新版本。其他用户则可以在项目目录中运行git pull命令。
  • 清理缓存: 运行过程中会产生一些临时文件。可以运行一键清理缓存脚本来删除这些文件,释放磁盘空间。

应用场景

  1. 影视解说自媒体创作对于在抖音、Bilibili、YouTube等平台发布“X分钟看电影”类型内容的创作者,NarratoAI可以成为核心生产力工具。创作者只需找到电影资源,将其上传至工具,即可自动生成一部完整的解说短片。这极大地缩短了从构思到发布的周期,让创作者能更快地抓住热点,实现高效率的内容更新。
  2. 短剧内容营销与推广短剧是当前社交媒体上的热门内容形式。营销人员或内容运营者可以利用NarratoAI的“短剧混剪”功能,将一部完整的短剧快速剪辑成数个精彩的预告片或剧情摘要。这些短小精悍的视频可以用于社交媒体投放,吸引用户观看完整剧集,有效提升推广效率。

QA

  1. 这个工具是完全免费的吗?NarratoAI项目本身是开源免费的,你可以自由下载和使用其代码。但是,它在运行过程中需要调用第三方大语言模型(LLM)和文本转语音(TTS)服务的API,这些服务通常会按使用量收费。不过,项目文档中也提供了获取免费API额度的教程(例如通过硅基流动平台),可以让你在初期以极低的成本进行体验。
  2. 我是一个完全不懂代码的小白,可以使用吗?可以。该项目提供了Web用户界面和一键启动脚本(start.bat),主要操作都在浏览器中完成,非常直观。最复杂的部分可能就是前期的环境配置和API Key填写,但只要严格按照使用帮助文档操作,即使没有代码基础也可以完成。
  3. 生成的视频会不会有版权问题?工具本身不提供视频素材,它处理的是用户自己上传的视频。因此,视频素材的版权责任在于使用者自己。在使用电影、电视剧等受版权保护的素材进行二次创作时,你需要遵守相关法律法规,确保你的使用方式属于“合理使用”的范畴,或已获得版权方授权,以避免侵权风险。
微信微博Email复制链接