-
Notifications
You must be signed in to change notification settings - Fork 119
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[project-s] ハミング機能・歌機能向けのモデル・API(compatible_engineのみ)を追加 #724
[project-s] ハミング機能・歌機能向けのモデル・API(compatible_engineのみ)を追加 #724
Conversation
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
LGTM!!!
結構ごちゃつきますが、もうほぼこのままリリースになるのではと思ってます。
VVMに合わせてリファクタリングなりなんなりかなと。
ガッツリ1行1行見てないので、もしかしたらどこかミスしてるとかあり得るかもですが、まあ流石に超ミスってたら音声にならないでしょうということで!
名前に関してのコメントです!
(まあmodel系はAPIとして露出しないので後から変えられるのですが)
source filter decode
- 今思うと
source filter
だけ手法の名前なので不揃いかも- 将来入出力が変わらないのに
source filter
ベースの手法じゃなくなったときにややこしくなる
- 将来入出力が変わらないのに
decode
が本質で、prefixとして何付けるかかなと- あとあとtalkにも使うかもだけど、記念に
humming
でも良さそう - phoneme・f0・volumeのdecodeだから
pfv_decode
とかでも sf_decode
でもy_decode
でも。
- あとあとtalkにも使うかもだけど、記念に
- 今思うと
talk model
- 良さそう
sing style moel
style
がスタイルと被るので変えた方が良いかも- 「音響特徴量」から
feature
を借りてsing feature model
? - ちょっとエモくして
sing teacher model
もありかもInstructor
とかTrainer
とかでもGuide
とかでも
source filter model
- これだけ手法の名前なのはやっぱりちょっと気になるかも
とりあえずマージしてOKかなと!
名前変更するのも後のPR(metas.json周り変更とか)にくっつけちゃってもらってもOKです。
@qryxip さんにちょっと共有まで。
現状増えるcompatible engineのAPIは以上の予定です。
あとはたしかmetas.jsonのstyleの中にモデルのtype
が増える予定です。
model・・・というか、VVM版におけるInferenceDomainが3種類に増える見込みです。
1つが今までのtalk、1つが歌い方を生成するもの、1つがハミングです。
どれがどの機能を持ってるのかはmetas.jsonのstyleのtypeで判断する形になるかなと・・・!
設計などで疑問点などあればご指摘いただければ!!!
あ、ちなみにgenerate APIのテストが落ちてるのは |
上記のように変更しました!
|
v0.15ではSphinxはv6に上げることで解決してました。(#626) |
0.15の方で質問なのですが、"sing teacher"と"sf decode"が別VVMに入ることってありそうですか? もしそうであるなら、パブリックAPIの形をちょっと考えなおす必要がありそうです(歌声を触りたい人がどれだけいるかはわかりませんが)。 |
たしかに、0.15(ハミング)で更新されるのはcompatible engineの部分だけで、ドキュメントに現れるAPIは1個も変わらないですね! |
ある想定です! あ、あとモデルの種類が変わるとStyleIdも必ず変えるようにする予定・・・・・だったのですが、今思うと VVMでの制約について考えていなかったのですが、1つのVVM内では1つのInferenceDomainしか持てない、みたいな制約は設けられる・・・かも・・・?
僕も需要は分かりませんが、自分が知る範囲では歌が生成できる動的ライブラリを見たことがないです。 |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
LGTM!!
1箇所ミスありそうでしたが、後続のPRでついでに直しちゃう感じでいいかなと思ったのと、差分がわからなくなってしまいそうなので、一旦マージさせていただきます!!
あと自分で提案しといてなんですが、sing teacher
は意味が変なので、singing teacher
が良いかもとか思いました 😇
(sing volumeとかは別に良さそう感)
singとかsingingとかsongのなんとなくのルールの所感はこうかなと!
- 生成する系のAPIは動詞(sing・talk)
- sing_volume、sing_audio_query
- 物を指すときは名詞(song・talk)
- song_model、song_library、UI上の「ソング」
- 英語圏で一般的におかしいときはその限りではない
- singing_teacher、singing_synthesize
_f0_vector: &[f32], | ||
phoneme: &[i64], | ||
note: &[i64], | ||
_f0: &[f32], |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
_
ミスかも?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
あ、これはlinterに使ってない引数だと怒られたので、_
を入れて回避しています
あとで使うことになるかと思うので、一旦引数として入れていますが、後で変更することになるかと...!
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
後追いですがLGTM
* remove contour and rename to talk xxx * fix speaker id map * rename functions and variables * add models to model file * add sing style and source filter models to model file set * add new models to status * rename get model index and speaker id * add new models session * change i32 to i64 * add new predictor to inference core * add new predictor to core * add new predictor to compatible engine * rename source filter to sf decode * fix rename miss * rename sing style to sing teacher * fix rename miss * remove vector * add TODO comment (add sing tests) Co-authored-by: Hiroshiba <[email protected]> * fix comment out * lint --------- Co-authored-by: Hiroshiba <[email protected]>
内容
題の通りです。
テストは一旦無視しています。
また、ダミーモデルも既存のものを適当に刺しているため、動きません。
関連 Issue
その他
各ネーミングは適当なので、後で書き換えたほうがいいかもしれない...?