===============================================
IndexTTS2 Batch Generation GUI - User Manual
用户手册 | ユーザーマニュアル | Manual de Usuario
===============================================

Version: 1.0
Last Updated: 2025-11-22

TABLE OF CONTENTS | 目录 | 目次 | Índice
----------------------------------------
1. English Version
2. 中文版本
3. 日本語版
4. Versión en Español


===============================================
1. ENGLISH VERSION
===============================================

OVERVIEW
--------
IndexTTS2 Batch Generation GUI is a powerful text-to-speech application that allows you to:
- Generate speech from single sentences
- Process multiple text files in batch
- Control emotions with 8 adjustable sliders
- Preserve speaker voice characteristics
- Use multiple GPUs for faster processing
- Switch between 4 languages (CN/EN/JP/ES)


INTERFACE LAYOUT
----------------
The GUI consists of two main tabs:

1. Single Sentence Tab
   - Quick generation for testing
   - Real-time emotion adjustment
   - Immediate preview

2. Batch Mode Tab
   - Process multiple text files
   - Manage task queue
   - Save emotion vectors for consistency


SINGLE SENTENCE MODE
--------------------

Step 1: Select Reference Audio
  - Click "Browse" next to "Reference Audio"
  - Choose a WAV/MP3 file (3-15 seconds recommended)
  - This defines the target voice

Step 2: Enter Text
  - Type or paste text in the input box
  - Maximum recommended: 1-2 sentences

Step 3: Adjust Emotions (Optional)
  - Use 8 emotion sliders:
    * Happy (高兴)
    * Sad (悲伤)
    * Angry (愤怒)
    * Fear (恐惧)
    * Disgust (厌恶)
    * Surprise (惊讶)
    * Calm (平静)
    * Neutral (中性)
  - Values: 0.0 to 1.0
  - Higher value = stronger emotion

Step 4: Set Emotion Level
  - Low: Subtle emotion (0.6)
  - Mid: Balanced emotion (0.8) [Default]
  - High: Strong emotion (1.0)

Step 5: Voice Preservation
  - Enabled: Maintains speaker characteristics
  - Disabled: More expressive emotions

Step 6: Generate
  - Click "Generate Audio"
  - Choose save location
  - Wait for completion


BATCH MODE
----------

Task Configuration:

Step 1: Select Text File
  - Click "Browse" next to "Text File"
  - Choose a TXT file with dialogue lines
  - See TEXT FILE FORMAT section below

Step 2: Select Reference Audio
  - Choose voice reference (WAV/MP3)
  - Same voice will be used for all lines

Step 3: Set Output Directory
  - Click "Browse" next to "Output Directory"
  - Choose where to save generated audio files

Step 4: Configure Settings
  - Emotion Level: Low/Mid/High
  - Voice Preservation: On/Off
  - Emotion Vector: Optional (see below)

Step 5: Add to Task Queue
  - Click "Add to Task List"
  - Task appears in the list below
  - You can add multiple tasks

Managing Tasks:
  - Select task: Click on it in the list
  - Remove task: Select and click "Remove Task"
  - Clear all: Click "Clear Task List"
  - Start one: Click "Start Current Task"
  - Start all: Click "Start All Tasks" (sequential)


TEXT FILE FORMAT
----------------

Your text file can use two formats:

Format 1: Plain Text (Emotion from sliders)
-------------------------------------------
Each line is plain dialogue:

```
Hello, how are you today?
I'm doing great, thank you!
That's wonderful to hear.
```

- Emotions come from GUI sliders
- Same emotion for all lines
- Simple and straightforward


Format 2: Emotion Description + Dialogue
-----------------------------------------
Add emotion description before dialogue:

```
(cheerful and excited) Hello, how are you today?
(happy and warm) I'm doing great, thank you!
(calm and gentle) That's wonderful to hear.
```

IMPORTANT RULES:
1. Emotion description MUST be in ENGLISH
2. Use parentheses: (emotion words)
3. Emotion goes BEFORE the dialogue
4. Can use multiple emotion words
5. Examples of emotion words:
   - happy, sad, angry, fearful
   - excited, calm, surprised, disgusted
   - cheerful, warm, gentle, harsh
   - enthusiastic, tired, energetic
   - confident, shy, proud, ashamed

Examples:

✓ CORRECT:
(happy) Good morning everyone!
(sad and tired) I don't feel well today.
(excited and cheerful) This is amazing news!
(calm) Let's discuss this calmly.

✗ WRONG:
（高兴）早上好！  ← Chinese not allowed
(feliz) Buenos días!  ← Spanish not allowed
Good morning! (happy)  ← Emotion after text
happy Good morning!  ← Missing parentheses


EMOTION CONTROL
---------------

8 Emotion Sliders:

1. Happy (高兴)
   - Joyful, pleased, cheerful
   - Use for: Good news, celebrations

2. Sad (悲伤)
   - Sorrowful, depressed, melancholic
   - Use for: Bad news, farewells

3. Angry (愤怒)
   - Furious, irritated, enraged
   - Use for: Conflicts, frustration

4. Fear (恐惧)
   - Scared, anxious, worried
   - Use for: Danger, uncertainty

5. Disgust (厌恶)
   - Revolted, repelled, disgusted
   - Use for: Unpleasant situations

6. Surprise (惊讶)
   - Astonished, amazed, shocked
   - Use for: Unexpected events

7. Calm (平静)
   - Peaceful, serene, tranquil
   - Use for: Meditation, relaxation

8. Neutral (中性)
   - No strong emotion, balanced
   - Use for: Normal conversations


Emotion Intensity Levels:

Low (0.6):
  - Subtle emotional expression
  - Natural daily conversation
  - Slight mood indication

Mid (0.8): [DEFAULT]
  - Balanced emotion
  - Clear but not exaggerated
  - Suitable for most content

High (1.0):
  - Strong emotional expression
  - Dramatic performance
  - Theatrical or emphasis


Voice Preservation:

When ENABLED (Checked):
  ✓ Keeps speaker's voice characteristics
  ✓ Less extreme emotions
  ✓ More natural sounding
  ✓ Recommended for normal use

When DISABLED (Unchecked):
  ✓ More expressive emotions
  ✓ May alter voice characteristics
  ✓ More dramatic performance
  ✓ Use for artistic expression


EMOTION VECTOR FEATURE
-----------------------

In Single Sentence Mode:

After adjusting emotion sliders, click:
  "Apply to Batch Tasks"

This captures current emotion settings and applies them to future batch tasks.

Status indicator in Batch Mode shows:
  ✓ Using Emotion Vector: happy:0.80, sad:0.20
  ○ Using text-based emotions

To clear:
  Click "Clear Vector" button


GPU/CPU SETTINGS
-----------------

GPU Mode Options:

1. Auto GPU Detection
   - System automatically selects GPU
   - Recommended for single GPU systems

2. Single GPU Selection
   - Choose specific GPU from dropdown
   - Use if you have multiple GPUs
   - Select the most powerful one

3. Multi-GPU Mode
   - Uses all available GPUs
   - Automatically splits batch tasks
   - Significantly faster for large batches
   - Only works in Batch Mode

4. CPU Mode
   - No GPU required
   - Slower processing
   - Use if no compatible GPU
   - Or for testing


LANGUAGE SWITCHING
------------------

Top-right corner dropdown:

Available languages:
- zh - 中文 (Chinese)
- en - English
- ja - 日本語 (Japanese)
- es - Español (Spanish)

Changes immediately:
  ✓ All UI elements
  ✓ Menu labels
  ✓ Button text
  ✓ Status messages
  ✓ Help tooltips


TIPS & BEST PRACTICES
----------------------

1. Reference Audio Selection:
   ✓ Use clear, noise-free audio
   ✓ 3-15 seconds ideal length
   ✓ Single speaker only
   ✓ Good microphone quality

2. Text Formatting:
   ✓ One sentence per line
   ✓ Use proper punctuation
   ✓ Avoid extremely long sentences
   ✓ Keep formatting consistent

3. Emotion Settings:
   ✓ Start with Mid level
   ✓ Adjust sliders gradually
   ✓ Test single sentence first
   ✓ Enable voice preservation for natural sound

4. Batch Processing:
   ✓ Test with small batch first
   ✓ Check output quality
   ✓ Use Multi-GPU for large batches
   ✓ Organize output directories

5. Performance:
   ✓ Use GPU when available
   ✓ Close other applications
   ✓ Process during off-peak hours
   ✓ Monitor GPU temperature


TROUBLESHOOTING
---------------

Problem: Audio quality is poor
Solution: - Use better reference audio
         - Enable voice preservation
         - Reduce emotion intensity
         - Check input text punctuation

Problem: Emotions not working
Solution: - Verify emotion description format
         - Use English for descriptions
         - Check parentheses placement
         - Try adjusting sliders

Problem: Slow processing
Solution: - Use GPU mode
         - Enable Multi-GPU
         - Process smaller batches
         - Close background applications

Problem: GPU not detected
Solution: - Update GPU drivers
         - Install CUDA toolkit
         - Use CPU mode temporarily
         - Check GPU compatibility

Problem: Text not generating
Solution: - Check text file encoding (UTF-8)
         - Verify file format
         - Remove special characters
         - Check reference audio validity


KEYBOARD SHORTCUTS
------------------

General:
  Ctrl+L: Switch language
  Ctrl+Q: Quit application

Single Mode:
  Ctrl+Enter: Generate audio
  Ctrl+O: Open reference audio

Batch Mode:
  Ctrl+T: Add task
  Ctrl+R: Remove selected task
  Ctrl+A: Start all tasks
  Ctrl+S: Stop current task


EXPORT & SAVE
-------------

Log Export:
  - Click "Export Log" in console area
  - Choose save location
  - Saves all console output as TXT
  - Includes errors and warnings

Audio Output:
  - Single mode: Choose location per generation
  - Batch mode: All files in output directory
  - Filenames: Based on input text
  - Format: WAV (44.1kHz, 16-bit)


ADVANCED FEATURES
-----------------

Sequential Task Execution:
  - Click "Start All Tasks"
  - Processes tasks one by one
  - Continues even if one fails
  - Shows progress in console

Multi-GPU Parallel Processing:
  - Enable Multi-GPU mode
  - Automatically splits text
  - Creates temporary files
  - Merges results
  - Cleans up automatically

Emotion Vector Persistence:
  - Set once in Single Mode
  - Applies to all Batch tasks
  - Overrides text descriptions
  - Ensures consistency


SUPPORT & RESOURCES
-------------------

Documentation:
  - SETUP_GUIDE.txt - Installation guide
  - PROJECT_SIZE_ANALYSIS.txt - Disk space info
  - LICENSE_*.txt - License information

Help Buttons:
  - Click "?" buttons in GUI
  - Shows context-specific help
  - Available in current language

Online Resources:
  - Check project repository
  - Read CHANGELOG.md for updates
  - Report issues on GitHub


===============================================
2. 中文版本
===============================================

概述
----
IndexTTS2 批量生成 GUI 是一个强大的文本转语音应用程序，允许您：
- 从单个句子生成语音
- 批量处理多个文本文件
- 使用 8 个可调节滑块控制情绪
- 保留说话人的声音特征
- 使用多个 GPU 加速处理
- 在 4 种语言间切换（中/英/日/西）


界面布局
--------
GUI 包含两个主要标签页：

1. 单句模式标签页
   - 快速生成用于测试
   - 实时情绪调整
   - 即时预览

2. 批量模式标签页
   - 处理多个文本文件
   - 管理任务队列
   - 保存情绪向量以保持一致性


单句模式
--------

步骤 1：选择参考音频
  - 点击"参考音频"旁的"浏览"
  - 选择 WAV/MP3 文件（建议 3-15 秒）
  - 这定义了目标声音

步骤 2：输入文本
  - 在输入框中输入或粘贴文本
  - 建议最多 1-2 句话

步骤 3：调整情绪（可选）
  - 使用 8 个情绪滑块：
    * 高兴 (Happy)
    * 悲伤 (Sad)
    * 愤怒 (Angry)
    * 恐惧 (Fear)
    * 厌恶 (Disgust)
    * 惊讶 (Surprise)
    * 平静 (Calm)
    * 中性 (Neutral)
  - 值：0.0 到 1.0
  - 值越高 = 情绪越强

步骤 4：设置情绪档位
  - 低：细微情绪 (0.6)
  - 中：平衡情绪 (0.8) [默认]
  - 高：强烈情绪 (1.0)

步骤 5：声纹保护
  - 启用：保持说话人特征
  - 禁用：更具表现力的情绪

步骤 6：生成
  - 点击"生成音频"
  - 选择保存位置
  - 等待完成


批量模式
--------

任务配置：

步骤 1：选择文本文件
  - 点击"台词文件"旁的"浏览"
  - 选择包含对话行的 TXT 文件
  - 请参阅下面的文本文件格式部分

步骤 2：选择参考音频
  - 选择声音参考（WAV/MP3）
  - 所有行将使用相同的声音

步骤 3：设置输出目录
  - 点击"输出目录"旁的"浏览"
  - 选择保存生成音频文件的位置

步骤 4：配置设置
  - 情绪档位：低/中/高
  - 声纹保护：开/关
  - 情绪向量：可选（见下文）

步骤 5：添加到任务队列
  - 点击"添加到任务列表"
  - 任务出现在下面的列表中
  - 您可以添加多个任务

管理任务：
  - 选择任务：在列表中点击它
  - 移除任务：选择并点击"移除任务"
  - 清除全部：点击"清空任务列表"
  - 启动单个：点击"开始当前任务"
  - 启动全部：点击"开始所有任务"（顺序执行）


文本文件格式
-----------

您的文本文件可以使用两种格式：

格式 1：纯文本（情绪来自滑块）
-----------------------------
每行是纯对话：

```
你好，今天过得怎么样？
我很好，谢谢！
听到这个真是太好了。
```

- 情绪来自 GUI 滑块
- 所有行使用相同情绪
- 简单直接


格式 2：情绪描述 + 对话
----------------------
在对话前添加情绪描述：

```
(cheerful and excited) 你好，今天过得怎么样？
(happy and warm) 我很好，谢谢！
(calm and gentle) 听到这个真是太好了。
```

重要规则：
1. 情绪描述必须使用英语
2. 使用括号：(情绪词)
3. 情绪在对话之前
4. 可以使用多个情绪词
5. 情绪词示例：
   - happy, sad, angry, fearful
   - excited, calm, surprised, disgusted
   - cheerful, warm, gentle, harsh
   - enthusiastic, tired, energetic
   - confident, shy, proud, ashamed

示例：

✓ 正确：
(happy) 大家早上好！
(sad and tired) 我今天感觉不太好。
(excited and cheerful) 这真是个好消息！
(calm) 让我们冷静地讨论这个问题。

✗ 错误：
（高兴）早上好！  ← 不允许使用中文
(feliz) 早上好！  ← 不允许使用西班牙语
早上好！(happy)  ← 情绪在文本之后
happy 早上好！  ← 缺少括号


情绪控制
--------

8 个情绪滑块：

1. 高兴 (Happy)
   - 快乐、愉悦、欢快
   - 用于：好消息、庆祝

2. 悲伤 (Sad)
   - 悲伤、沮丧、忧郁
   - 用于：坏消息、告别

3. 愤怒 (Angry)
   - 愤怒、生气、暴怒
   - 用于：冲突、挫折

4. 恐惧 (Fear)
   - 害怕、焦虑、担心
   - 用于：危险、不确定

5. 厌恶 (Disgust)
   - 厌恶、反感、恶心
   - 用于：不愉快的情况

6. 惊讶 (Surprise)
   - 惊讶、惊奇、震惊
   - 用于：意外事件

7. 平静 (Calm)
   - 平静、安详、宁静
   - 用于：冥想、放松

8. 中性 (Neutral)
   - 无强烈情绪、平衡
   - 用于：正常对话


情绪强度档位：

低 (0.6)：
  - 细微的情绪表达
  - 自然的日常对话
  - 轻微的情绪指示

中 (0.8)：[默认]
  - 平衡的情绪
  - 清晰但不夸张
  - 适合大多数内容

高 (1.0)：
  - 强烈的情绪表达
  - 戏剧性表演
  - 戏剧或强调


声纹保护：

启用时（勾选）：
  ✓ 保持说话人的声音特征
  ✓ 较少极端情绪
  ✓ 听起来更自然
  ✓ 推荐正常使用

禁用时（不勾选）：
  ✓ 更具表现力的情绪
  ✓ 可能改变声音特征
  ✓ 更戏剧化的表演
  ✓ 用于艺术表达


情绪向量功能
-----------

在单句模式中：

调整情绪滑块后，点击：
  "应用到批量任务"

这会捕获当前情绪设置并应用到未来的批量任务。

批量模式中的状态指示器显示：
  ✓ 使用情绪向量：高兴:0.80，悲伤:0.20
  ○ 使用基于文本的情绪

清除：
  点击"清除向量"按钮


GPU/CPU 设置
-----------

GPU 模式选项：

1. 自动 GPU 检测
   - 系统自动选择 GPU
   - 推荐用于单 GPU 系统

2. 单 GPU 选择
   - 从下拉菜单选择特定 GPU
   - 如果有多个 GPU 请使用
   - 选择最强大的那个

3. 多 GPU 模式
   - 使用所有可用的 GPU
   - 自动分割批量任务
   - 大批量处理显著更快
   - 仅在批量模式下工作

4. CPU 模式
   - 不需要 GPU
   - 处理较慢
   - 如果没有兼容的 GPU 请使用
   - 或用于测试


语言切换
--------

右上角下拉菜单：

可用语言：
- zh - 中文
- en - English（英语）
- ja - 日本語（日语）
- es - Español（西班牙语）

立即更改：
  ✓ 所有 UI 元素
  ✓ 菜单标签
  ✓ 按钮文本
  ✓ 状态消息
  ✓ 帮助提示


提示和最佳实践
-------------

1. 参考音频选择：
   ✓ 使用清晰、无噪音的音频
   ✓ 3-15 秒理想长度
   ✓ 仅单个说话人
   ✓ 良好的麦克风质量

2. 文本格式：
   ✓ 每行一句话
   ✓ 使用正确的标点符号
   ✓ 避免极长的句子
   ✓ 保持格式一致

3. 情绪设置：
   ✓ 从中档开始
   ✓ 逐渐调整滑块
   ✓ 先测试单句
   ✓ 启用声纹保护以获得自然声音

4. 批量处理：
   ✓ 先用小批量测试
   ✓ 检查输出质量
   ✓ 大批量使用多 GPU
   ✓ 组织输出目录

5. 性能：
   ✓ 可用时使用 GPU
   ✓ 关闭其他应用程序
   ✓ 在非高峰时段处理
   ✓ 监控 GPU 温度


故障排除
--------

问题：音频质量差
解决：- 使用更好的参考音频
     - 启用声纹保护
     - 降低情绪强度
     - 检查输入文本标点

问题：情绪不起作用
解决：- 验证情绪描述格式
     - 描述使用英语
     - 检查括号位置
     - 尝试调整滑块

问题：处理缓慢
解决：- 使用 GPU 模式
     - 启用多 GPU
     - 处理较小批量
     - 关闭后台应用程序

问题：未检测到 GPU
解决：- 更新 GPU 驱动程序
     - 安装 CUDA 工具包
     - 暂时使用 CPU 模式
     - 检查 GPU 兼容性

问题：文本无法生成
解决：- 检查文本文件编码（UTF-8）
     - 验证文件格式
     - 删除特殊字符
     - 检查参考音频有效性


键盘快捷键
---------

通用：
  Ctrl+L：切换语言
  Ctrl+Q：退出应用程序

单句模式：
  Ctrl+Enter：生成音频
  Ctrl+O：打开参考音频

批量模式：
  Ctrl+T：添加任务
  Ctrl+R：移除选定任务
  Ctrl+A：开始所有任务
  Ctrl+S：停止当前任务


导出和保存
---------

日志导出：
  - 在控制台区域点击"导出日志"
  - 选择保存位置
  - 将所有控制台输出保存为 TXT
  - 包括错误和警告

音频输出：
  - 单句模式：每次生成选择位置
  - 批量模式：所有文件在输出目录中
  - 文件名：基于输入文本
  - 格式：WAV（44.1kHz，16位）


高级功能
--------

顺序任务执行：
  - 点击"开始所有任务"
  - 逐个处理任务
  - 即使一个失败也继续
  - 在控制台中显示进度

多 GPU 并行处理：
  - 启用多 GPU 模式
  - 自动分割文本
  - 创建临时文件
  - 合并结果
  - 自动清理

情绪向量持久化：
  - 在单句模式中设置一次
  - 应用到所有批量任务
  - 覆盖文本描述
  - 确保一致性


支持和资源
---------

文档：
  - SETUP_GUIDE.txt - 安装指南
  - PROJECT_SIZE_ANALYSIS.txt - 磁盘空间信息
  - LICENSE_*.txt - 许可证信息

帮助按钮：
  - 点击 GUI 中的"？"按钮
  - 显示上下文相关的帮助
  - 以当前语言提供

在线资源：
  - 查看项目仓库
  - 阅读 CHANGELOG.md 了解更新
  - 在 GitHub 上报告问题


===============================================
3. 日本語版
===============================================

概要
----
IndexTTS2 バッチ生成 GUI は、以下を可能にする強力なテキスト読み上げアプリケーションです：
- 単一文からの音声生成
- 複数のテキストファイルのバッチ処理
- 8つの調整可能なスライダーで感情制御
- 話者の声の特徴を保持
- より高速な処理のために複数のGPUを使用
- 4つの言語間で切り替え（中/英/日/西）


インターフェースレイアウト
-------------------------
GUIは2つの主要なタブで構成されています：

1. 単一文モードタブ
   - テスト用の迅速な生成
   - リアルタイム感情調整
   - 即座のプレビュー

2. バッチモードタブ
   - 複数のテキストファイルを処理
   - タスクキューを管理
   - 一貫性のために感情ベクトルを保存


単一文モード
-----------

ステップ 1：参照オーディオを選択
  - 「参照音声」の横にある「参照」をクリック
  - WAV/MP3ファイルを選択（3-15秒を推奨）
  - これがターゲットの声を定義します

ステップ 2：テキストを入力
  - 入力ボックスにテキストを入力または貼り付け
  - 推奨最大：1-2文

ステップ 3：感情を調整（オプション）
  - 8つの感情スライダーを使用：
    * Happy（高兴 - 嬉しい）
    * Sad（悲伤 - 悲しい）
    * Angry（愤怒 - 怒り）
    * Fear（恐惧 - 恐怖）
    * Disgust（厌恶 - 嫌悪）
    * Surprise（惊讶 - 驚き）
    * Calm（平静 - 穏やか）
    * Neutral（中性 - 中立）
  - 値：0.0 から 1.0
  - 値が高いほど = 感情が強い

ステップ 4：感情レベルを設定
  - 低：微妙な感情 (0.6)
  - 中：バランスの取れた感情 (0.8) [デフォルト]
  - 高：強い感情 (1.0)

ステップ 5：声紋保護
  - 有効：話者の特徴を維持
  - 無効：より表現豊かな感情

ステップ 6：生成
  - 「音声生成」をクリック
  - 保存場所を選択
  - 完了を待つ


バッチモード
-----------

タスク設定：

ステップ 1：テキストファイルを選択
  - 「台詞ファイル」の横にある「参照」をクリック
  - 対話行を含むTXTファイルを選択
  - 以下のテキストファイル形式セクションを参照

ステップ 2：参照オーディオを選択
  - 声の参照を選択（WAV/MP3）
  - すべての行に同じ声が使用されます

ステップ 3：出力ディレクトリを設定
  - 「出力ディレクトリ」の横にある「参照」をクリック
  - 生成されたオーディオファイルを保存する場所を選択

ステップ 4：設定を構成
  - 感情レベル：低/中/高
  - 声紋保護：オン/オフ
  - 感情ベクトル：オプション（以下参照）

ステップ 5：タスクキューに追加
  - 「タスクリストに追加」をクリック
  - タスクが下のリストに表示されます
  - 複数のタスクを追加できます

タスク管理：
  - タスクを選択：リスト内でクリック
  - タスクを削除：選択して「タスク削除」をクリック
  - すべてクリア：「タスクリストをクリア」をクリック
  - 1つ開始：「現在のタスクを開始」をクリック
  - すべて開始：「すべてのタスクを開始」をクリック（順次実行）


テキストファイル形式
-------------------

テキストファイルは2つの形式を使用できます：

形式 1：プレーンテキスト（感情はスライダーから）
---------------------------------------------
各行はプレーンな対話：

```
こんにちは、今日はお元気ですか？
元気です、ありがとうございます！
それは素晴らしいですね。
```

- 感情はGUIスライダーから
- すべての行に同じ感情
- シンプルで簡単


形式 2：感情説明 + 対話
----------------------
対話の前に感情説明を追加：

```
(cheerful and excited) こんにちは、今日はお元気ですか？
(happy and warm) 元気です、ありがとうございます！
(calm and gentle) それは素晴らしいですね。
```

重要なルール：
1. 感情説明は英語で書く必要があります
2. 括弧を使用：(感情の言葉)
3. 感情は対話の前
4. 複数の感情の言葉を使用可能
5. 感情の言葉の例：
   - happy, sad, angry, fearful
   - excited, calm, surprised, disgusted
   - cheerful, warm, gentle, harsh
   - enthusiastic, tired, energetic
   - confident, shy, proud, ashamed

例：

✓ 正しい：
(happy) 皆さん、おはようございます！
(sad and tired) 今日は体調が良くありません。
(excited and cheerful) これは素晴らしいニュースです！
(calm) 落ち着いて話し合いましょう。

✗ 間違い：
（嬉しい）おはようございます！  ← 日本語は不可
(feliz) おはようございます！  ← スペイン語は不可
おはようございます！(happy)  ← テキストの後の感情
happy おはようございます！  ← 括弧がない


感情コントロール
---------------

8つの感情スライダー：

1. Happy（高兴 - 嬉しい）
   - 喜び、満足、陽気
   - 使用場面：良いニュース、祝賀

2. Sad（悲伤 - 悲しい）
   - 悲しみ、憂鬱、メランコリック
   - 使用場面：悪いニュース、別れ

3. Angry（愤怒 - 怒り）
   - 激怒、いらいら、憤慨
   - 使用場面：対立、挫折

4. Fear（恐惧 - 恐怖）
   - 怖い、不安、心配
   - 使用場面：危険、不確実性

5. Disgust（厌恶 - 嫌悪）
   - 反発、嫌悪、気持ち悪い
   - 使用場面：不快な状況

6. Surprise（惊讶 - 驚き）
   - 驚き、びっくり、ショック
   - 使用場面：予期しない出来事

7. Calm（平静 - 穏やか）
   - 平和、静か、落ち着いた
   - 使用場面：瞑想、リラックス

8. Neutral（中性 - 中立）
   - 強い感情なし、バランス
   - 使用場面：通常の会話


感情強度レベル：

低 (0.6)：
  - 微妙な感情表現
  - 自然な日常会話
  - わずかな気分の表示

中 (0.8)：[デフォルト]
  - バランスの取れた感情
  - 明確だが誇張されていない
  - ほとんどのコンテンツに適している

高 (1.0)：
  - 強い感情表現
  - ドラマチックなパフォーマンス
  - 演劇的または強調


声紋保護：

有効時（チェック）：
  ✓ 話者の声の特徴を維持
  ✓ 極端な感情が少ない
  ✓ より自然な音
  ✓ 通常の使用に推奨

無効時（チェックなし）：
  ✓ より表現豊かな感情
  ✓ 声の特徴が変わる可能性
  ✓ よりドラマチックなパフォーマンス
  ✓ 芸術的表現に使用


感情ベクトル機能
---------------

単一文モードで：

感情スライダーを調整した後、クリック：
  「バッチタスクに適用」

これにより現在の感情設定がキャプチャされ、将来のバッチタスクに適用されます。

バッチモードのステータスインジケーターに表示：
  ✓ 感情ベクトル使用中：happy:0.80, sad:0.20
  ○ テキストベースの感情を使用

クリア：
  「ベクトルをクリア」ボタンをクリック


GPU/CPU設定
-----------

GPUモードオプション：

1. 自動GPU検出
   - システムが自動的にGPUを選択
   - シングルGPUシステムに推奨

2. シングルGPU選択
   - ドロップダウンから特定のGPUを選択
   - 複数のGPUがある場合に使用
   - 最も強力なものを選択

3. マルチGPUモード
   - すべての利用可能なGPUを使用
   - バッチタスクを自動的に分割
  - 大規模バッチで大幅に高速
   - バッチモードでのみ動作

4. CPUモード
   - GPUは不要
   - 処理が遅い
   - 互換性のあるGPUがない場合に使用
   - またはテスト用


言語切り替え
-----------

右上隅のドロップダウン：

利用可能な言語：
- zh - 中文（中国語）
- en - English（英語）
- ja - 日本語
- es - Español（スペイン語）

即座に変更：
  ✓ すべてのUI要素
  ✓ メニューラベル
  ✓ ボタンテキスト
  ✓ ステータスメッセージ
  ✓ ヘルプツールチップ


ヒントとベストプラクティス
-------------------------

1. 参照オーディオの選択：
   ✓ クリアでノイズのないオーディオを使用
   ✓ 3-15秒が理想的な長さ
   ✓ 単一話者のみ
   ✓ 良いマイク品質

2. テキスト形式：
   ✓ 1行に1文
   ✓ 適切な句読点を使用
   ✓ 非常に長い文を避ける
   ✓ 形式を一貫させる

3. 感情設定：
   ✓ 中レベルから始める
   ✓ スライダーを徐々に調整
   ✓ まず単一文をテスト
   ✓ 自然な音のために声紋保護を有効化

4. バッチ処理：
   ✓ まず小さなバッチでテスト
   ✓ 出力品質を確認
   ✓ 大規模バッチにはマルチGPUを使用
   ✓ 出力ディレクトリを整理

5. パフォーマンス：
   ✓ 利用可能な場合はGPUを使用
   ✓ 他のアプリケーションを閉じる
   ✓ オフピーク時に処理
   ✓ GPU温度を監視


トラブルシューティング
---------------------

問題：オーディオ品質が悪い
解決：- より良い参照オーディオを使用
     - 声紋保護を有効化
     - 感情強度を減らす
     - 入力テキストの句読点を確認

問題：感情が機能しない
解決：- 感情説明形式を確認
     - 説明には英語を使用
     - 括弧の配置を確認
     - スライダーの調整を試す

問題：処理が遅い
解決：- GPUモードを使用
     - マルチGPUを有効化
     - より小さなバッチを処理
     - バックグラウンドアプリケーションを閉じる

問題：GPUが検出されない
解決：- GPUドライバを更新
     - CUDAツールキットをインストール
     - 一時的にCPUモードを使用
     - GPU互換性を確認

問題：テキストが生成されない
解決：- テキストファイルエンコーディングを確認（UTF-8）
     - ファイル形式を確認
     - 特殊文字を削除
     - 参照オーディオの有効性を確認


キーボードショートカット
-----------------------

全般：
  Ctrl+L：言語切り替え
  Ctrl+Q：アプリケーション終了

単一モード：
  Ctrl+Enter：オーディオ生成
  Ctrl+O：参照オーディオを開く

バッチモード：
  Ctrl+T：タスク追加
  Ctrl+R：選択したタスクを削除
  Ctrl+A：すべてのタスクを開始
  Ctrl+S：現在のタスクを停止


エクスポートと保存
-----------------

ログエクスポート：
  - コンソールエリアで「ログをエクスポート」をクリック
  - 保存場所を選択
  - すべてのコンソール出力をTXTとして保存
  - エラーと警告を含む

オーディオ出力：
  - 単一モード：生成ごとに場所を選択
  - バッチモード：すべてのファイルが出力ディレクトリに
  - ファイル名：入力テキストに基づく
  - 形式：WAV（44.1kHz、16ビット）


高度な機能
---------

順次タスク実行：
  - 「すべてのタスクを開始」をクリック
  - タスクを1つずつ処理
  - 1つが失敗しても続行
  - コンソールに進行状況を表示

マルチGPU並列処理：
  - マルチGPUモードを有効化
  - テキストを自動的に分割
  - 一時ファイルを作成
  - 結果をマージ
  - 自動的にクリーンアップ

感情ベクトルの永続化：
  - 単一モードで1回設定
  - すべてのバッチタスクに適用
  - テキスト説明を上書き
  - 一貫性を確保


サポートとリソース
-----------------

ドキュメント：
  - SETUP_GUIDE.txt - インストールガイド
  - PROJECT_SIZE_ANALYSIS.txt - ディスク容量情報
  - LICENSE_*.txt - ライセンス情報

ヘルプボタン：
  - GUIの「？」ボタンをクリック
  - コンテキスト固有のヘルプを表示
  - 現在の言語で利用可能

オンラインリソース：
  - プロジェクトリポジトリを確認
  - 更新情報はCHANGELOG.mdを読む
  - GitHubで問題を報告


===============================================
4. VERSIÓN EN ESPAÑOL
===============================================

DESCRIPCIÓN GENERAL
-------------------
IndexTTS2 Batch Generation GUI es una potente aplicación de texto a voz que le permite:
- Generar voz desde oraciones individuales
- Procesar múltiples archivos de texto por lotes
- Controlar emociones con 8 controles deslizantes ajustables
- Preservar las características de voz del hablante
- Usar múltiples GPUs para un procesamiento más rápido
- Cambiar entre 4 idiomas (CN/EN/JP/ES)


DISEÑO DE INTERFAZ
------------------
La GUI consta de dos pestañas principales:

1. Pestaña de Oración Individual
   - Generación rápida para pruebas
   - Ajuste de emoción en tiempo real
   - Vista previa inmediata

2. Pestaña de Modo por Lotes
   - Procesar múltiples archivos de texto
   - Gestionar cola de tareas
   - Guardar vectores de emoción para consistencia


MODO DE ORACIÓN INDIVIDUAL
---------------------------

Paso 1: Seleccionar Audio de Referencia
  - Haga clic en "Examinar" junto a "Audio de Referencia"
  - Elija un archivo WAV/MP3 (se recomiendan 3-15 segundos)
  - Esto define la voz objetivo

Paso 2: Ingresar Texto
  - Escriba o pegue texto en el cuadro de entrada
  - Máximo recomendado: 1-2 oraciones

Paso 3: Ajustar Emociones (Opcional)
  - Use 8 controles deslizantes de emoción:
    * Happy (高兴 - Feliz)
    * Sad (悲伤 - Triste)
    * Angry (愤怒 - Enojado)
    * Fear (恐惧 - Miedo)
    * Disgust (厌恶 - Disgusto)
    * Surprise (惊讶 - Sorpresa)
    * Calm (平静 - Calma)
    * Neutral (中性 - Neutral)
  - Valores: 0.0 a 1.0
  - Valor más alto = emoción más fuerte

Paso 4: Establecer Nivel de Emoción
  - Bajo: Emoción sutil (0.6)
  - Medio: Emoción equilibrada (0.8) [Predeterminado]
  - Alto: Emoción fuerte (1.0)

Paso 5: Preservación de Voz
  - Habilitado: Mantiene características del hablante
  - Deshabilitado: Emociones más expresivas

Paso 6: Generar
  - Haga clic en "Generar Audio"
  - Elija ubicación de guardado
  - Espere la finalización


MODO POR LOTES
--------------

Configuración de Tarea:

Paso 1: Seleccionar Archivo de Texto
  - Haga clic en "Examinar" junto a "Archivo de Texto"
  - Elija un archivo TXT con líneas de diálogo
  - Consulte la sección FORMATO DE ARCHIVO DE TEXTO a continuación

Paso 2: Seleccionar Audio de Referencia
  - Elija referencia de voz (WAV/MP3)
  - Se usará la misma voz para todas las líneas

Paso 3: Establecer Directorio de Salida
  - Haga clic en "Examinar" junto a "Directorio de Salida"
  - Elija dónde guardar los archivos de audio generados

Paso 4: Configurar Ajustes
  - Nivel de Emoción: Bajo/Medio/Alto
  - Preservación de Voz: Activar/Desactivar
  - Vector de Emoción: Opcional (ver abajo)

Paso 5: Agregar a Cola de Tareas
  - Haga clic en "Agregar a Lista de Tareas"
  - La tarea aparece en la lista a continuación
  - Puede agregar múltiples tareas

Gestión de Tareas:
  - Seleccionar tarea: Haga clic en ella en la lista
  - Eliminar tarea: Seleccione y haga clic en "Eliminar Tarea"
  - Borrar todas: Haga clic en "Limpiar Lista de Tareas"
  - Iniciar una: Haga clic en "Iniciar Tarea Actual"
  - Iniciar todas: Haga clic en "Iniciar Todas las Tareas" (secuencial)


FORMATO DE ARCHIVO DE TEXTO
----------------------------

Su archivo de texto puede usar dos formatos:

Formato 1: Texto Plano (Emoción desde controles deslizantes)
-------------------------------------------------------------
Cada línea es diálogo simple:

```
Hola, ¿cómo estás hoy?
¡Estoy muy bien, gracias!
Eso es maravilloso escuchar.
```

- Las emociones provienen de los controles deslizantes de la GUI
- Misma emoción para todas las líneas
- Simple y directo


Formato 2: Descripción de Emoción + Diálogo
--------------------------------------------
Agregue descripción de emoción antes del diálogo:

```
(cheerful and excited) Hola, ¿cómo estás hoy?
(happy and warm) ¡Estoy muy bien, gracias!
(calm and gentle) Eso es maravilloso escuchar.
```

REGLAS IMPORTANTES:
1. La descripción de emoción DEBE estar en INGLÉS
2. Use paréntesis: (palabras de emoción)
3. La emoción va ANTES del diálogo
4. Puede usar múltiples palabras de emoción
5. Ejemplos de palabras de emoción:
   - happy, sad, angry, fearful
   - excited, calm, surprised, disgusted
   - cheerful, warm, gentle, harsh
   - enthusiastic, tired, energetic
   - confident, shy, proud, ashamed

Ejemplos:

✓ CORRECTO:
(happy) ¡Buenos días a todos!
(sad and tired) No me siento bien hoy.
(excited and cheerful) ¡Esta es una noticia increíble!
(calm) Discutamos esto con calma.

✗ INCORRECTO:
（高兴）¡Buenos días!  ← No se permite chino
(feliz) ¡Buenos días!  ← No se permite español
¡Buenos días! (happy)  ← Emoción después del texto
happy ¡Buenos días!  ← Faltan paréntesis


CONTROL DE EMOCIONES
--------------------

8 Controles Deslizantes de Emoción:

1. Happy (高兴 - Feliz)
   - Alegre, contento, jovial
   - Usar para: Buenas noticias, celebraciones

2. Sad (悲伤 - Triste)
   - Afligido, deprimido, melancólico
   - Usar para: Malas noticias, despedidas

3. Angry (愤怒 - Enojado)
   - Furioso, irritado, enfurecido
   - Usar para: Conflictos, frustración

4. Fear (恐惧 - Miedo)
   - Asustado, ansioso, preocupado
   - Usar para: Peligro, incertidumbre

5. Disgust (厌恶 - Disgusto)
   - Repugnado, repelido, disgustado
   - Usar para: Situaciones desagradables

6. Surprise (惊讶 - Sorpresa)
   - Asombrado, sorprendido, impactado
   - Usar para: Eventos inesperados

7. Calm (平静 - Calma)
   - Pacífico, sereno, tranquilo
   - Usar para: Meditación, relajación

8. Neutral (中性 - Neutral)
   - Sin emoción fuerte, equilibrado
   - Usar para: Conversaciones normales


Niveles de Intensidad de Emoción:

Bajo (0.6):
  - Expresión emocional sutil
  - Conversación diaria natural
  - Ligera indicación de estado de ánimo

Medio (0.8): [PREDETERMINADO]
  - Emoción equilibrada
  - Clara pero no exagerada
  - Adecuada para la mayoría del contenido

Alto (1.0):
  - Expresión emocional fuerte
  - Actuación dramática
  - Teatral o énfasis


Preservación de Voz:

Cuando ESTÁ HABILITADA (Marcada):
  ✓ Mantiene características de voz del hablante
  ✓ Emociones menos extremas
  ✓ Suena más natural
  ✓ Recomendado para uso normal

Cuando ESTÁ DESHABILITADA (No marcada):
  ✓ Emociones más expresivas
  ✓ Puede alterar características de voz
  ✓ Actuación más dramática
  ✓ Usar para expresión artística


FUNCIÓN DE VECTOR DE EMOCIÓN
-----------------------------

En Modo de Oración Individual:

Después de ajustar los controles deslizantes de emoción, haga clic:
  "Aplicar a Tareas por Lotes"

Esto captura la configuración actual de emoción y la aplica a futuras tareas por lotes.

El indicador de estado en Modo por Lotes muestra:
  ✓ Usando Vector de Emoción: happy:0.80, sad:0.20
  ○ Usando emociones basadas en texto

Para borrar:
  Haga clic en el botón "Limpiar Vector"


CONFIGURACIÓN GPU/CPU
---------------------

Opciones de Modo GPU:

1. Detección Automática de GPU
   - El sistema selecciona automáticamente GPU
   - Recomendado para sistemas con una sola GPU

2. Selección de GPU Individual
   - Elija GPU específica del menú desplegable
   - Use si tiene múltiples GPUs
   - Seleccione la más potente

3. Modo Multi-GPU
   - Usa todas las GPUs disponibles
   - Divide automáticamente las tareas por lotes
   - Significativamente más rápido para lotes grandes
   - Solo funciona en Modo por Lotes

4. Modo CPU
   - No se requiere GPU
   - Procesamiento más lento
   - Use si no hay GPU compatible
   - O para pruebas


CAMBIO DE IDIOMA
-----------------

Menú desplegable en la esquina superior derecha:

Idiomas disponibles:
- zh - 中文 (Chino)
- en - English (Inglés)
- ja - 日本語 (Japonés)
- es - Español

Cambia inmediatamente:
  ✓ Todos los elementos de UI
  ✓ Etiquetas de menú
  ✓ Texto de botones
  ✓ Mensajes de estado
  ✓ Información sobre herramientas de ayuda


CONSEJOS Y MEJORES PRÁCTICAS
-----------------------------

1. Selección de Audio de Referencia:
   ✓ Use audio claro y sin ruido
   ✓ Longitud ideal de 3-15 segundos
   ✓ Solo un hablante
   ✓ Buena calidad de micrófono

2. Formato de Texto:
   ✓ Una oración por línea
   ✓ Use puntuación apropiada
   ✓ Evite oraciones extremadamente largas
   ✓ Mantenga el formato consistente

3. Configuración de Emociones:
   ✓ Comience con nivel Medio
   ✓ Ajuste los controles gradualmente
   ✓ Pruebe primero oración individual
   ✓ Habilite preservación de voz para sonido natural

4. Procesamiento por Lotes:
   ✓ Pruebe primero con lote pequeño
   ✓ Verifique la calidad de salida
   ✓ Use Multi-GPU para lotes grandes
   ✓ Organice directorios de salida

5. Rendimiento:
   ✓ Use GPU cuando esté disponible
   ✓ Cierre otras aplicaciones
   ✓ Procese durante horas de menor demanda
   ✓ Monitoree la temperatura de la GPU


SOLUCIÓN DE PROBLEMAS
---------------------

Problema: La calidad del audio es mala
Solución: - Use mejor audio de referencia
         - Habilite preservación de voz
         - Reduzca la intensidad de emoción
         - Verifique la puntuación del texto de entrada

Problema: Las emociones no funcionan
Solución: - Verifique el formato de descripción de emoción
         - Use inglés para descripciones
         - Verifique la colocación de paréntesis
         - Intente ajustar los controles deslizantes

Problema: Procesamiento lento
Solución: - Use modo GPU
         - Habilite Multi-GPU
         - Procese lotes más pequeños
         - Cierre aplicaciones en segundo plano

Problema: GPU no detectada
Solución: - Actualice controladores de GPU
         - Instale kit de herramientas CUDA
         - Use modo CPU temporalmente
         - Verifique compatibilidad de GPU

Problema: El texto no se genera
Solución: - Verifique codificación de archivo de texto (UTF-8)
         - Verifique formato de archivo
         - Elimine caracteres especiales
         - Verifique validez del audio de referencia


ATAJOS DE TECLADO
-----------------

General:
  Ctrl+L: Cambiar idioma
  Ctrl+Q: Salir de la aplicación

Modo Individual:
  Ctrl+Enter: Generar audio
  Ctrl+O: Abrir audio de referencia

Modo por Lotes:
  Ctrl+T: Agregar tarea
  Ctrl+R: Eliminar tarea seleccionada
  Ctrl+A: Iniciar todas las tareas
  Ctrl+S: Detener tarea actual


EXPORTAR Y GUARDAR
------------------

Exportación de Registro:
  - Haga clic en "Exportar Registro" en el área de consola
  - Elija ubicación de guardado
  - Guarda toda la salida de consola como TXT
  - Incluye errores y advertencias

Salida de Audio:
  - Modo individual: Elija ubicación por generación
  - Modo por lotes: Todos los archivos en directorio de salida
  - Nombres de archivo: Basados en texto de entrada
  - Formato: WAV (44.1kHz, 16-bit)


FUNCIONES AVANZADAS
--------------------

Ejecución Secuencial de Tareas:
  - Haga clic en "Iniciar Todas las Tareas"
  - Procesa tareas una por una
  - Continúa incluso si una falla
  - Muestra progreso en consola

Procesamiento Paralelo Multi-GPU:
  - Habilite modo Multi-GPU
  - Divide texto automáticamente
  - Crea archivos temporales
  - Fusiona resultados
  - Limpia automáticamente

Persistencia de Vector de Emoción:
  - Configure una vez en Modo Individual
  - Se aplica a todas las tareas por lotes
  - Anula descripciones de texto
  - Asegura consistencia


SOPORTE Y RECURSOS
-------------------

Documentación:
  - SETUP_GUIDE.txt - Guía de instalación
  - PROJECT_SIZE_ANALYSIS.txt - Información de espacio en disco
  - LICENSE_*.txt - Información de licencia

Botones de Ayuda:
  - Haga clic en los botones "?" en la GUI
  - Muestra ayuda específica del contexto
  - Disponible en el idioma actual

Recursos en Línea:
  - Consulte el repositorio del proyecto
  - Lea CHANGELOG.md para actualizaciones
  - Reporte problemas en GitHub


===============================================
END OF MANUAL | 手册结束 | マニュアル終了 | Fin del Manual
===============================================

For setup and installation, see: SETUP_GUIDE.txt
安装和配置请查看：SETUP_GUIDE.txt
インストールとセットアップについては：SETUP_GUIDE.txt
Para configuración e instalación, consulte: SETUP_GUIDE.txt

For license information, see: LICENSE_README.txt
许可证信息请查看：LICENSE_README.txt
ライセンス情報については：LICENSE_README.txt
Para información de licencia, consulte: LICENSE_README.txt


===============================================
Version: 1.0
Last Updated: 2025-11-22
Document: USER_MANUAL.txt
===============================================

