-
Notifications
You must be signed in to change notification settings - Fork 4
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Opset17へのエクスポート、tiktokenへの置き換え、timestampルールの更新 #2
base: onnx-export
Are you sure you want to change the base?
Conversation
kyakuno
commented
Jan 5, 2024
•
edited
Loading
edited
- LayerNormを使用するためにopset17に変更
- transformersのtokenizerの互換性がなくなっているので公式に合わせてtiktokenに置き換え
- timestampルールを最新版に追随
- ONNXの推論テスト用にimport_encoderとimport_decoderオプションを追加
largeをエクスポートするとweightが複数ファイルになってしまう。use_external_data_format指定が必要? |
torch 2.2だと、use_external_data_formatがなくなっている。
|
torchとonnxのバージョンごとの比較。
下記と同じ問題みたい。ただし、下記のIssueは未解決。 |
既存のlargeのモデルはlinuxのGPU環境でエクスポートしているので、macOSの問題な気がする。 |
Windowsで2.0.1+cu117 + onnx 1.13.1で試したが、Windowsでも分割されてしまう。 |
@ooe1123 largeモデルをエクスポートすると、下記のようにweightが複数に分割されてしまうようでして、既存の |
私は、一旦分割して出力した後に、以下のようにして出力し直しています。
|
@ooe1123 情報、ありがとうございます!onnxでマージしているのですね。 |