Tutorial Pembuatan Voicebank

Tutorial ini membahas cara rekaman dan OTO.


Rilis resmi Arpasing ada di situs Kanru Hua.


Meskipun kamu bisa rekaman dengan software apa saja, rekaman menggunakan OREMO jauh lebih mudah. Jika kamu tidak terbiasa, anggap ini sebagai kesempatan untuk belajar. Dan jika kamu berencana mengedit sampel, lakukan setelah rekaman.
Download resmi: OSDN
Wine wrapper unduk Mac OS: UTAForum
Terjemahan Inggris OREMO Mac: UTAForum
(Aku merekomendasikan wine wrapper karena OREMO Mac tidak punya kotak comment.)


Jika kamu benar-benar tidak bisa menggunakan OREMO, rujuklah proposal PDF dalam unduhan Arpasing dari situs Mr. Hua,. Scroll ke bawah untuk melihat reclist, dan beri nama tiap file dengan nomor pasangannya.


Untuk memulai, download reclist default terbaru dari halaman reclist. Kamu bisa memilih versi dengan atau tanpa indeks.

Jika kamu menggunakan reclist dengan indeks:


Jika kamu menggunakan reclist tanpa indeks:


Buat folder untuk voicebankmu dan copy-paste index.csv & OREMO-comment.txt ke sana. Buka reclist di OREMO, atur folder tujuan, dan mulailah merekam.


Kamu bisa merekam dengan/tanpa paduan BGM. Jika kamu menggunakan panduan BGM, aku sarankan untuk menggunakan BGM CVVC yang pendek seperti BGM CVVChinese atau VCCV English BGM.


File OREMO-comment akan memberi gambaran cara pengucapan dalam bentuk kalimat dan Arpabet. Artikel pendek ini menjelaskan cara membaca dan melafalkan arpabet. Aslinya ini lumayan gampang! Jika kamu sudah sudah familiar dengan sistem fonetik lan seperti PaintedCZ atau X-SAMPA, rujuk grafik di halaman ini.
Selain string vokal, masing-masing string cuma punya 1 tipe huruf vokal. ketiga silabel akan berima.


Nyanyikan ketiga silabel dengan nada sama tanpa jeda seperti VCV. Jika ada "q" atau tanda petik, itu berarti jeda singkat/glottal stop (contoh: akhiran 'k' dalam 'tokek').
Kamu bisa download voicebank yang ada di direktori voicebank untuk referensi rekaman.


UNTUK MULTIPITCH: Di folder utama voicebank, pastikan ada pitch tanpa sufiks dalam .OTO. Pastikan pitch lain ada dalam subfoldernya sendiri. Jangan menambahkan sufiks ke nama file karena Moresampler tidak bisa membuat .OTO dari nama file yang tidak tertera dalam index.csv.
UNTUK SAMPEL EKSTRA: Sampel tambahan yang bukan standar Arpasing harus diletakkan dalam subfolder lain supaya mereka dapat memiliki file oto.ini yang terpisah. Hal ini akan memungkinkan Arpasing Assistant untuk hanya membaca file oto.ini utama dengan entri OTO Arpasing standar.




Lanjut ke OTO! Cukup drag & drop folder ke moresampler.exe untuk membuat file OTO dasar.
Ketik 3 lalu enter untuk memilih arpasing. Saat diminta memberi nama duplikat, masukkan y/yes. Kapanpun ada kemiripan lirik dari sampel berbeda, seperti [s t], Moresampler akan memberi akhiran angka untuk membedakannya. (contoh: [s t2], [s t3], .dst) Kamu juga bisa memasukkan suffix/akhiran. Harap diingat bahwa huruf kanji dan panah tidak bisa dimasukkan, jadi kamu harus menggunakan suffix seperti "S" atau "A#3". (Jika kamu ingin menggunakan karakter spesial, gunakan placeholder, buka file oto.ini lalu 'Find + Replace' Placeholder dengan suffix yang ingin kamu pakai.)


Jika kamu menggunakan Mac atau Linux, kamu harus menggunakan wine untuk menjalankan Moresampler. Buka terminal di folder tempat moresampler.exe, dan ketik: "wine moresampler.exe / jalur / ke / voicebank". Jika tidak bisa, jalankan Moresampler di windows atau minta teman yang punya Windows untuk membuatkan OTO dasar untukmu.


Sekarang OTO dasar sudah jadi, saatnya merapikan. Setiap entri OTO adalah difon, dua fonem. Umumnya, fonem pertama menyambung nada sebelumnya, sedangkan fonem kedua adalah fonem utama. Untuk OTO, pertama-tama cari daerah yang sesuai dengan fonem pertama, lalu lanjut ke fonem kedua.


Fonem pertama


Mencakup offset berwarna biru dan overlap.


[-]
Jumlah overlap sama sekali tidak penting untuk bagian ini, karena not ini selalu muncul pada awal kalimat tepat setelah rest. Satu-satunya hal yang penting adalah not ini mencakup area sunyi.



[c]
Plosive tanpa suara (p t k)
Jika ini adalah fonem pertama dalam string, geser offset sehingga overlap berakhir sekitar 15msec sebelum konsonan.
Jika tidak, pindahkan offset ke akhir fonem di depannya. Pastikan fonem didepannya tidak terdengar lalu geser overlap sekitar 15msec sebelum konsonan.



Plosive bersuara dan Affricate (b d g ch jh)
Jika ini adalah fonem pertama dalam string, gerakkan offset sehingga overlap berakhir di tempat konsonan dimulai.
Jika ada fonem lain sebelum ini, pindahkan offset ke akhir fonem sebelumnya. Pastikan fonem sebelumnya tidak terdengar lalu geser overlap ke awal konsonan.



Fricative, nasal, dan liquid (f v th dh s z sh zh hh m n ng l r)
Geser offset ke awal konsonan dimulai. Untuk 'r', lihat bagian 'glides' untuk lebih lanjut.



Glides/ Luncuran (y w)
Konsonan ini sulit dilihat secara normal. Alihkan tampilan audio ke tampilan spectogram dengan mengklik tombol [s]. Konsonan ini hanyalah perubahan frekuensi(kerasnya suara) ke tingkat lebih kuat yang artinya, konsonan tersebut berada di area yang paling terang dalam spectogram.
Pindahkan offset ke tempat konsonan dimulai, lalu letakkan overlap di tempat yang konsisten sebelum perubahan frekuensi. Preutterance akan berakhir setelah perubahan.




[v]
Secara default, overlap sampel ini harus ada pada jumlah tertinggi. Jika jumlahnya ternyata sangat kecil, menggeser overlap sektiar 50ms akan cukup membantu.
Pindahkan offset awal sehingga daerah antaranya dan overlap berada di tingkat yang konsisten.



For diphthongs, the overlap should cover the area before the vowel changes.



Fonem kedua


Harap diingat bahwa preutterance harus ditempatkan di akhir fonem pertama dan awal fonem kedua. Ini juga mencakup area pink, putih, dan biru.


[c]
Stops (p b t d k g ch jh)
Pastikan ada sunyi sesaat sebelum konsonan. Geser garis pink ke awal daerah sunyi dan cutoff ke akhir daerah sunyi. Ya, kita tidak memasukkan konsonannya. Karena dalam .UST not ini akan diikuti not yang MEMILIKI konsonan. Hal ini akan meberikan transisi yang mulus tanpa suara konsonan ganda.



Frikatif (f v th dh s z sh zh hh)
Tutupi seluruh konsonan dengan warna pink sampai tepat di dekat akhir konsonan. Geser cutoff ke area yang sama lalu tinggalkan sedikit celah. Tanpa celah ini, resampler tidak akan bisa merendernya. Namun, kita juga tidak ingin konsonan ini dipanjangkan.



Jika ada area sunyi setelah konsonan, masukkan mereka ke dalam area putih.



Nasal, liquid dan luncuran (m n ng l r y w)
Geser area pink ke tempat konsonan mulai stabil dan konsisten. Gunakan cutoff untuk menghapus konsonan yang memudar. Konsonan ini aman untuk dipanjangkan.



[v]
Geser area pink ke tempat vokal mulai stabil dan konsisten. Gunakan cutoff untuk menghapus vokal yang memudar. Area putih akan menjadi bagian not yang dipanjangkan, untuk memastikan hasil terdengar bagus.



Untuk difon antar huruf vokal, letakkan preutterance di akhir perubahan huruf vokal



Untuk Diftong, letakkan cutoff sebelum perubahan huruf vokal



[-]
Tutupi semua daerahdengan warna pink, sampai hanya ada sunyi di area putih.



Dan itu dia, voicebankmu sudah selesai. Jika kamu belum punya gambar untuk VBmu, Partial akan membuatkanmu secara gratis di thread ini. Kirimkan vb yang sudah dirilis ke direktori. Selamat bersenang-senang, semoga beruntung!

Arpasing

Home

About

Resource


Daftar isi

Kontak