Replace original model with new weights
Browse files- README.md +0 -67
- model.safetensors +1 -1
- scheduler.pth +0 -3
- train.log +0 -0
README.md
DELETED
|
@@ -1,67 +0,0 @@
|
|
| 1 |
-
---
|
| 2 |
-
license: mit
|
| 3 |
-
datasets:
|
| 4 |
-
- dolly-vn/dolly-audio-1000h-vietnamese
|
| 5 |
-
language:
|
| 6 |
-
- vi
|
| 7 |
-
base_model:
|
| 8 |
-
- openbmb/VoxCPM1.5
|
| 9 |
-
pipeline_tag: text-to-speech
|
| 10 |
-
---
|
| 11 |
-
|
| 12 |
-
# VoxCPM-1.5B-VN
|
| 13 |
-
|
| 14 |
-
Model TTS đã được training với dataset 1000h tiếng Việt [dolly-vn/dolly-audio-1000h-vietnamese](https://huggingface.co/datasets/dolly-vn/dolly-audio-1000h-vietnamese)
|
| 15 |
-
|
| 16 |
-
Checkpoint at itter 50000 - epoch 0.6.
|
| 17 |
-
|
| 18 |
-
Device: NVIDIA RTX5090
|
| 19 |
-
|
| 20 |
-
## How-tos
|
| 21 |
-
|
| 22 |
-
### Finetune a LoRa:
|
| 23 |
-
|
| 24 |
-
Follow the original guide [here](https://github.com/OpenBMB/VoxCPM/blob/main/docs/finetune.md)
|
| 25 |
-
|
| 26 |
-
### Inference:
|
| 27 |
-
|
| 28 |
-
Setup:
|
| 29 |
-
|
| 30 |
-
```bash
|
| 31 |
-
git clone https://github.com/OpenBMB/VoxCPM.git
|
| 32 |
-
cd VoxCPM
|
| 33 |
-
# recommended to use a virtual environment
|
| 34 |
-
pip install voxcpm
|
| 35 |
-
# for voice cloning, I have to install torchcodec.
|
| 36 |
-
pip install torchcodec==0.9
|
| 37 |
-
```
|
| 38 |
-
> [!WARNING]
|
| 39 |
-
> Make sure torchcodec compatible with Pytoch & Python. You can check compatibility [here](https://github.com/meta-pytorch/torchcodec?tab=readme-ov-file#installing-torchcodec)
|
| 40 |
-
|
| 41 |
-
Download my checkpoint, I recommended using some lines of Python code:
|
| 42 |
-
|
| 43 |
-
```python
|
| 44 |
-
from huggingface_hub import snapshot_download
|
| 45 |
-
snapshot_download("JayLL13/VoxCPM-1.5-VN", local_dir="./pretrained/VoxCPM-1.5-VN")
|
| 46 |
-
```
|
| 47 |
-
|
| 48 |
-
Inferences with the checkpoints:
|
| 49 |
-
|
| 50 |
-
```bash
|
| 51 |
-
python scripts/test_voxcpm_ft_infer.py \
|
| 52 |
-
--ckpt_dir ./pretrained/VoxCPM-1.5-VN \
|
| 53 |
-
--text "This is voice cloning with LoRA." \
|
| 54 |
-
--prompt_audio /path/to/reference.wav \
|
| 55 |
-
--prompt_text "Reference audio transcript" \
|
| 56 |
-
--output cloned_output.wav
|
| 57 |
-
```
|
| 58 |
-
|
| 59 |
-
---
|
| 60 |
-
|
| 61 |
-
## ⚠️ Miễn trừ trách nhiệm & Khuyến cáo sử dụng (TTS)
|
| 62 |
-
|
| 63 |
-
Mô hình Text-to-Speech (TTS) này được cung cấp **chỉ cho mục đích nghiên cứu, thử nghiệm và phát triển công nghệ**. Mọi nội dung âm thanh do mô hình tạo ra **không đại diện cho giọng nói, danh tính, quan điểm hoặc sự chấp thuận của bất kỳ cá nhân hay tổ chức có thật nào**. Tác giả và các bên liên quan **không chịu trách nhiệm** đối với bất kỳ hành vi sử dụng sai mục đích, vi phạm pháp luật, xâm phạm quyền riêng tư, quyền nhân thân, quyền sở hữu trí tuệ, hoặc gây thiệt hại trực tiếp hay gián tiếp phát sinh từ việc sử dụng mô hình này.
|
| 64 |
-
|
| 65 |
-
Người dùng **có toàn quyền và toàn bộ trách nhiệm pháp lý** đối với việc triển khai, phân phối và sử dụng mô hình. **Nghiêm cấm** sử dụng mô hình cho các hành vi mạo danh, sao chép giọng nói cá nhân khi chưa có sự đồng ý hợp pháp, tạo nội dung gây hiểu lầm, lừa đảo, thao túng dư luận hoặc bất kỳ mục đích nào trái với quy định pháp luật hiện hành. Khi sử dụng hoặc chia sẻ âm thanh được tạo ra, **khuyến cáo bắt buộc** phải công bố rõ ràng rằng nội dung là **âm thanh do AI tạo sinh** và tuân thủ đầy đủ các quy định pháp lý, chính sách nền tảng và chuẩn mực đạo đức liên quan.
|
| 66 |
-
|
| 67 |
-
---
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
model.safetensors
CHANGED
|
@@ -1,3 +1,3 @@
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:
|
| 3 |
size 3206976160
|
|
|
|
| 1 |
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:1a0636ac0956f7370d6fed1a3514e7e68f71361ca12bf7ddd1406dd3218d8143
|
| 3 |
size 3206976160
|
scheduler.pth
DELETED
|
@@ -1,3 +0,0 @@
|
|
| 1 |
-
version https://git-lfs.github.com/spec/v1
|
| 2 |
-
oid sha256:28cd5edbae4f49db1869e21c3bfb6044c8bf354ec541ff705cb97fa9d73976f5
|
| 3 |
-
size 1465
|
|
|
|
|
|
|
|
|
|
|
|
train.log
ADDED
|
The diff for this file is too large to render.
See raw diff
|
|
|