Opset17へのエクスポート、tiktokenへの置き換え、timestampルールの更新 #2

kyakuno · 2024-01-05T05:57:47Z

LayerNormを使用するためにopset17に変更
transformersのtokenizerの互換性がなくなっているので公式に合わせてtiktokenに置き換え
timestampルールを最新版に追随
ONNXの推論テスト用にimport_encoderとimport_decoderオプションを追加

kyakuno · 2024-01-06T07:22:02Z

largeをエクスポートするとweightが複数ファイルになってしまう。use_external_data_format指定が必要？

kyakuno · 2024-01-06T11:59:44Z

torch 2.2だと、use_external_data_formatがなくなっている。

def _export(
    model,
    args,
    f,
    export_params=True,
    verbose=False,
    training=_C_onnx.TrainingMode.EVAL,
    input_names=None,
    output_names=None,
    operator_export_type=_C_onnx.OperatorExportTypes.ONNX,
    export_type=None,
    opset_version=None,
    do_constant_folding=True,
    dynamic_axes=None,
    keep_initializers_as_inputs=None,
    fixed_batch_size=False,
    custom_opsets=None,
    add_node_names=True,
    onnx_shape_inference=True,
    export_modules_as_functions=False,
    autograd_inlining=True,
):

kyakuno · 2024-01-06T12:14:51Z

torchとonnxのバージョンごとの比較。

torch	onnx	2GB超えファイルの出力
2.2 (dev)	1.14.0	複数ファイル
2.1.2	1.14.0	複数ファイル
2.0	1.14.0	複数ファイル
2.0	1.13.0	複数ファイル

下記と同じ問題みたい。ただし、下記のIssueは未解決。
pytorch/pytorch#94280

kyakuno · 2024-01-06T12:26:59Z

既存のlargeのモデルはlinuxのGPU環境でエクスポートしているので、macOSの問題な気がする。
macOSの場合、2GB超えのファイルを1ファイルにエクスポートできないのではないか。

kyakuno · 2024-01-06T12:29:17Z

Windowsで2.0.1+cu117 + onnx 1.13.1で試したが、Windowsでも分割されてしまう。

kyakuno · 2024-01-06T13:02:25Z

@ooe1123 largeモデルをエクスポートすると、下記のようにweightが複数に分割されてしまうようでして、既存のdecoder_large_v3_fix_kv_cache_weights.pbのように、1つのpbにまとめる方法をご存知でしょうか？

ooe1123 · 2024-01-07T15:04:32Z

私は、一旦分割して出力した後に、以下のようにして出力し直しています。

import onnx
net = onnx.load("path_to_model/xxx.onnx")
# collate external tensor files into one
onnx.save_model(
    net,
    "xxx.onnx",
    save_as_external_data=True,
    all_tensors_to_one_file=True,
    location="xxx_weights.pb",
    convert_attribute=False,
)

kyakuno · 2024-01-09T01:33:43Z

@ooe1123 情報、ありがとうございます！onnxでマージしているのですね。

kyakuno added 3 commits January 5, 2024 14:56

Change to opset 17, Change to tiktoken

96010d1

Added opset option

92850d3

Added all export script

6827dbd

kyakuno mentioned this pull request Jan 5, 2024

Update whisper decoding algorithm axinc-ai/ailia-models#1355

Closed

Added optimize script

ab99124

kyakuno added 4 commits January 6, 2024 21:41

Update optimize script

f5ed8f0

Change file name

6b6152c

Optimize small model

c60055a

Added test audio

529e654

Added inference mode for verify

1413fed

Improve timestamp rule

d8491ec

kyakuno changed the title ~~Opset17へのエクスポート、tiktokenへの置き換え~~ Opset17へのエクスポート、tiktokenへの置き換え、timestampルールの更新 Jan 9, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Opset17へのエクスポート、tiktokenへの置き換え、timestampルールの更新 #2

Opset17へのエクスポート、tiktokenへの置き換え、timestampルールの更新 #2

kyakuno commented Jan 5, 2024 •

edited

Loading

kyakuno commented Jan 6, 2024

kyakuno commented Jan 6, 2024

kyakuno commented Jan 6, 2024 •

edited

Loading

kyakuno commented Jan 6, 2024 •

edited

Loading

kyakuno commented Jan 6, 2024 •

edited

Loading

kyakuno commented Jan 6, 2024

ooe1123 commented Jan 7, 2024

kyakuno commented Jan 9, 2024

Opset17へのエクスポート、tiktokenへの置き換え、timestampルールの更新 #2

Are you sure you want to change the base?

Opset17へのエクスポート、tiktokenへの置き換え、timestampルールの更新 #2

Conversation

kyakuno commented Jan 5, 2024 • edited Loading

kyakuno commented Jan 6, 2024

kyakuno commented Jan 6, 2024

kyakuno commented Jan 6, 2024 • edited Loading

kyakuno commented Jan 6, 2024 • edited Loading

kyakuno commented Jan 6, 2024 • edited Loading

kyakuno commented Jan 6, 2024

ooe1123 commented Jan 7, 2024

kyakuno commented Jan 9, 2024

kyakuno commented Jan 5, 2024 •

edited

Loading

kyakuno commented Jan 6, 2024 •

edited

Loading

kyakuno commented Jan 6, 2024 •

edited

Loading

kyakuno commented Jan 6, 2024 •

edited

Loading