Skip to content

Commit

Permalink
Update: Readme.md
Browse files Browse the repository at this point in the history
  • Loading branch information
tsukumijima committed Oct 21, 2024
1 parent 7bf689a commit 8c975b7
Showing 1 changed file with 8 additions and 7 deletions.
15 changes: 8 additions & 7 deletions Readme.md
Original file line number Diff line number Diff line change
Expand Up @@ -23,14 +23,14 @@
- [Installation](#installation)
- [Usage](#usage)
- [License](#license)
- [AIVM Specifications](#aivm-specifications)
- [AIVM Specification](#aivm-specification)
- [Overview](#overview)
- [AIVM File Format Specification](#aivm-file-format-specification)
- [Safetensors 形式との互換性](#safetensors-形式との互換性)
- [参考資料](#参考資料)
- [参考文献](#参考文献)
- [AIVMX File Format Specification](#aivmx-file-format-specification)
- [ONNX 形式との互換性](#onnx-形式との互換性)
- [参考資料](#参考資料-1)
- [参考文献](#参考文献-1)
- [AIVM Manifest Specification (Version 1.0)](#aivm-manifest-specification-version-10)
- [サポートされるモデルアーキテクチャ](#サポートされるモデルアーキテクチャ)
- [AIVM マニフェストのフィールド定義](#aivm-マニフェストのフィールド定義)
Expand Down Expand Up @@ -161,7 +161,7 @@ $ aivmlib create-aivmx --help

<br>

# AIVM Specifications
# AIVM Specification

このセクションでは、「AIVM 仕様」に含まれる、下記の技術仕様を定義する。

Expand All @@ -177,7 +177,8 @@ $ aivmlib create-aivmx --help
**AIVM 仕様は、音声合成モデルのモデルアーキテクチャに依存しない。**
異なるモデルアーキテクチャの音声合成モデルを共通のファイルフォーマットで扱えるよう、拡張性や汎用性を考慮して設計されている。

大元の学習済みモデルが Safetensors または ONNX 形式で保存されているならば、原則どのようなモデルアーキテクチャであっても、メタデータを追加して AIVM / AIVMX ファイルを生成できる。
大元の学習済みモデルが Safetensors または ONNX 形式で保存されているならば、原則どのようなモデルアーキテクチャであっても、メタデータを追加して AIVM / AIVMX ファイルを生成できる。
設計にあたっては、変換処理を挟むことなく通常の Safetensors ファイルや ONNX ファイルとしてロードできるよう、既存エコシステムとの互換性を重視した。

> [!IMPORTANT]
> **AIVM 仕様は、各モデルアーキテクチャごとの推論方法を定義しない。あくまでも「AI 音声合成モデルのメタデータをまとめたファイル」としての仕様のみを定義する。**
Expand Down Expand Up @@ -212,7 +213,7 @@ Safetensors のヘッダー JSON にはテンソルのオフセット等が格
- `Style-Bert-VITS2``Style-Bert-VITS2 (JP-Extra)` モデルアーキテクチャでは NumPy 配列 (.npy) を Base64 エンコードした文字列で格納される
- モデルアーキテクチャ次第では省略されうる

### 参考資料
### 参考文献

- [Safetensors](https://github.com/huggingface/safetensors)
- [Safetensors Metadata Parsing](https://huggingface.co/docs/safetensors/main/en/metadata_parsing)
Expand All @@ -229,7 +230,7 @@ Safetensors のヘッダー JSON にはテンソルのオフセット等が格

執筆中...

### 参考資料
### 参考文献

- [ONNX](https://onnx.ai/)
- [Open Neural Network Exchange Intermediate Representation (ONNX IR) Specification](https://onnx.ai/onnx/repo-docs/IR.html#optional-metadata)
Expand Down

0 comments on commit 8c975b7

Please sign in to comment.