From 8c975b7fd71b96964485e90988b47e8f2a9ea290 Mon Sep 17 00:00:00 2001 From: tsukumi Date: Tue, 22 Oct 2024 04:43:04 +0900 Subject: [PATCH] Update: Readme.md --- Readme.md | 15 ++++++++------- 1 file changed, 8 insertions(+), 7 deletions(-) diff --git a/Readme.md b/Readme.md index 83e663d..6d3f61e 100644 --- a/Readme.md +++ b/Readme.md @@ -23,14 +23,14 @@ - [Installation](#installation) - [Usage](#usage) - [License](#license) -- [AIVM Specifications](#aivm-specifications) +- [AIVM Specification](#aivm-specification) - [Overview](#overview) - [AIVM File Format Specification](#aivm-file-format-specification) - [Safetensors 形式との互換性](#safetensors-形式との互換性) - - [参考資料](#参考資料) + - [参考文献](#参考文献) - [AIVMX File Format Specification](#aivmx-file-format-specification) - [ONNX 形式との互換性](#onnx-形式との互換性) - - [参考資料](#参考資料-1) + - [参考文献](#参考文献-1) - [AIVM Manifest Specification (Version 1.0)](#aivm-manifest-specification-version-10) - [サポートされるモデルアーキテクチャ](#サポートされるモデルアーキテクチャ) - [AIVM マニフェストのフィールド定義](#aivm-マニフェストのフィールド定義) @@ -161,7 +161,7 @@ $ aivmlib create-aivmx --help
-# AIVM Specifications +# AIVM Specification このセクションでは、「AIVM 仕様」に含まれる、下記の技術仕様を定義する。 @@ -177,7 +177,8 @@ $ aivmlib create-aivmx --help **AIVM 仕様は、音声合成モデルのモデルアーキテクチャに依存しない。** 異なるモデルアーキテクチャの音声合成モデルを共通のファイルフォーマットで扱えるよう、拡張性や汎用性を考慮して設計されている。 -大元の学習済みモデルが Safetensors または ONNX 形式で保存されているならば、原則どのようなモデルアーキテクチャであっても、メタデータを追加して AIVM / AIVMX ファイルを生成できる。 +大元の学習済みモデルが Safetensors または ONNX 形式で保存されているならば、原則どのようなモデルアーキテクチャであっても、メタデータを追加して AIVM / AIVMX ファイルを生成できる。 +設計にあたっては、変換処理を挟むことなく通常の Safetensors ファイルや ONNX ファイルとしてロードできるよう、既存エコシステムとの互換性を重視した。 > [!IMPORTANT] > **AIVM 仕様は、各モデルアーキテクチャごとの推論方法を定義しない。あくまでも「AI 音声合成モデルのメタデータをまとめたファイル」としての仕様のみを定義する。** @@ -212,7 +213,7 @@ Safetensors のヘッダー JSON にはテンソルのオフセット等が格 - `Style-Bert-VITS2`・`Style-Bert-VITS2 (JP-Extra)` モデルアーキテクチャでは NumPy 配列 (.npy) を Base64 エンコードした文字列で格納される - モデルアーキテクチャ次第では省略されうる -### 参考資料 +### 参考文献 - [Safetensors](https://github.com/huggingface/safetensors) - [Safetensors Metadata Parsing](https://huggingface.co/docs/safetensors/main/en/metadata_parsing) @@ -229,7 +230,7 @@ Safetensors のヘッダー JSON にはテンソルのオフセット等が格 執筆中... -### 参考資料 +### 参考文献 - [ONNX](https://onnx.ai/) - [Open Neural Network Exchange Intermediate Representation (ONNX IR) Specification](https://onnx.ai/onnx/repo-docs/IR.html#optional-metadata)