Llamachat is spouting gibberish #45

jdblack · 2023-11-16T05:38:10Z

System: Macbook Pro 2019
Installation method: Homebrew
Version: ==> llamachat: 1.2.0 (auto_updates)

I downloaded the 7b via bittorrent and imported it into llamachat. I tried saying hello to my new friend, but all I get in return is gibbrerish. How do I debug this issue?

It appears to convert the model without any complaints:

python3 -u /var/folders/tj/hdvn6t_x1lb_27qt5h9xx530000 Loading model file /Users/jblack/Library/Application Loading vocab file /Users/jblack/Library/Application Writing vocab...
[ 1/291] Writing tensor tok_embeddings.weight [ 2/291] Writing tensor norm.weight [ 3/291] Writing tensor output.weight [ 4/291] Writing tensor layers.0.attention.wq.weight [ 5/291] Writing tensor layers.0.attention.wk.weight [ 6/291] Writing tensor layers.0.attention.wv.weight [ 7/291] Writing tensor layers.0.attention.wo.weight [ 8/291] Writing tensor layers.0.attention_norm.weight [ 9/291] Writing tensor layers.0.feed_forward.w1.weight [ 10/291] Writing tensor layers.0.feed_forward.w2.weight [ 11/291] Writing tensor layers.0.feed_forward.w3.weight [ 12/291] Writing tensor layers.0.ffn_norm.weight [ 13/291] Writing tensor layers.1.attention.wq.weight [ 14/291] Writing tensor layers.1.attention.wk.weight [ 15/291] Writing tensor layers.1.attention.wv.weight [ 16/291] Writing tensor layers.1.attention.wo.weight [ 17/291] Writing tensor layers.1.attention_norm.weight [ 18/291] Writing tensor layers.1.feed_forward.w1.weight [ 19/291] Writing tensor layers.1.feed_forward.w2.weight [ 20/291] Writing tensor layers.1.feed_forward.w3.weight [ 21/291] Writing tensor layers.1.ffn_norm.weight [ 22/291] Writing tensor layers.2.attention.wq.weight [ 23/291] Writing tensor layers.2.attention.wk.weight [ 24/291] Writing tensor layers.2.attention.wv.weight [ 25/291] Writing tensor layers.2.attention.wo.weight [ 26/291] Writing tensor layers.2.attention_norm.weight [ 27/291] Writing tensor layers.2.feed_forward.w1.weight [ 28/291] Writing tensor layers.2.feed_forward.w2.weight [ 29/291] Writing tensor layers.2.feed_forward.w3.weight [ 30/291] Writing tensor layers.2.ffn_norm.weight [ 31/291] Writing tensor layers.3.attention.wq.weight [ 32/291] Writing tensor layers.3.attention.wk.weight [ 33/291] Writing tensor layers.3.attention.wv.weight [ 34/291] Writing tensor layers.3.attention.wo.weight [ 35/291] Writing tensor layers.3.attention_norm.weight [ 36/291] Writing tensor layers.3.feed_forward.w1.weight [ 37/291] Writing tensor layers.3.feed_forward.w2.weight [ 38/291] Writing tensor layers.3.feed_forward.w3.weight [ 39/291] Writing tensor layers.3.ffn_norm.weight [ 40/291] Writing tensor layers.4.attention.wq.weight [ 41/291] Writing tensor layers.4.attention.wk.weight [ 42/291] Writing tensor layers.4.attention.wv.weight [ 43/291] Writing tensor layers.4.attention.wo.weight [ 44/291] Writing tensor layers.4.attention_norm.weight [ 45/291] Writing tensor layers.4.feed_forward.w1.weight [ 46/291] Writing tensor layers.4.feed_forward.w2.weight [ 47/291] Writing tensor layers.4.feed_forward.w3.weight [ 48/291] Writing tensor layers.4.ffn_norm.weight [ 49/291] Writing tensor layers.5.attention.wq.weight [ 50/291] Writing tensor layers.5.attention.wk.weight [ 51/291] Writing tensor layers.5.attention.wv.weight [ 52/291] Writing tensor layers.5.attention.wo.weight [ 53/291] Writing tensor layers.5.attention_norm.weight [ 54/291] Writing tensor layers.5.feed_forward.w1.weight [ 55/291] Writing tensor layers.5.feed_forward.w2.weight [ 56/291] Writing tensor layers.5.feed_forward.w3.weight [ 57/291] Writing tensor layers.5.ffn_norm.weight [ 58/291] Writing tensor layers.6.attention.wq.weight [ 59/291] Writing tensor layers.6.attention.wk.weight [ 60/291] Writing tensor layers.6.attention.wv.weight [ 61/291] Writing tensor layers.6.attention.wo.weight [ 62/291] Writing tensor layers.6.attention_norm.weight [ 63/291] Writing tensor layers.6.feed_forward.w1.weight [ 64/291] Writing tensor layers.6.feed_forward.w2.weight [ 65/291] Writing tensor layers.6.feed_forward.w3.weight [ 66/291] Writing tensor layers.6.ffn_norm.weight [ 67/291] Writing tensor layers.7.attention.wq.weight [ 68/291] Writing tensor layers.7.attention.wk.weight [ 69/291] Writing tensor layers.7.attention.wv.weight [ 70/291] Writing tensor layers.7.attention.wo.weight [ 71/291] Writing tensor layers.7.attention_norm.weight [ 72/291] Writing tensor layers.7.feed_forward.w1.weight [ 73/291] Writing tensor layers.7.feed_forward.w2.weight [ 74/291] Writing tensor layers.7.feed_forward.w3.weight [ 75/291] Writing tensor layers.7.ffn_norm.weight [ 76/291] Writing tensor layers.8.attention.wq.weight [ 77/291] Writing tensor layers.8.attention.wk.weight [ 78/291] Writing tensor layers.8.attention.wv.weight [ 79/291] Writing tensor layers.8.attention.wo.weight [ 80/291] Writing tensor layers.8.attention_norm.weight [ 81/291] Writing tensor layers.8.feed_forward.w1.weight [ 82/291] Writing tensor layers.8.feed_forward.w2.weight [ 83/291] Writing tensor layers.8.feed_forward.w3.weight [ 84/291] Writing tensor layers.8.ffn_norm.weight [ 85/291] Writing tensor layers.9.attention.wq.weight [ 86/291] Writing tensor layers.9.attention.wk.weight [ 87/291] Writing tensor layers.9.attention.wv.weight [ 88/291] Writing tensor layers.9.attention.wo.weight [ 89/291] Writing tensor layers.9.attention_norm.weight [ 90/291] Writing tensor layers.9.feed_forward.w1.weight [ 91/291] Writing tensor layers.9.feed_forward.w2.weight [ 92/291] Writing tensor layers.9.feed_forward.w3.weight [ 93/291] Writing tensor layers.9.ffn_norm.weight [ 94/291] Writing tensor layers.10.attention.wq.weight [ 95/291] Writing tensor layers.10.attention.wk.weight [ 96/291] Writing tensor layers.10.attention.wv.weight [ 97/291] Writing tensor layers.10.attention.wo.weight [ 98/291] Writing tensor layers.10.attention_norm.weight [ 99/291] Writing tensor layers.10.feed_forward.w1.weight [100/291] Writing tensor layers.10.feed_forward.w2.weight [101/291] Writing tensor layers.10.feed_forward.w3.weight [102/291] Writing tensor layers.10.ffn_norm.weight [103/291] Writing tensor layers.11.attention.wq.weight [104/291] Writing tensor layers.11.attention.wk.weight [105/291] Writing tensor layers.11.attention.wv.weight [106/291] Writing tensor layers.11.attention.wo.weight [107/291] Writing tensor layers.11.attention_norm.weight [108/291] Writing tensor layers.11.feed_forward.w1.weight [109/291] Writing tensor layers.11.feed_forward.w2.weight [110/291] Writing tensor layers.11.feed_forward.w3.weight [111/291] Writing tensor layers.11.ffn_norm.weight [112/291] Writing tensor layers.12.attention.wq.weight [113/291] Writing tensor layers.12.attention.wk.weight [114/291] Writing tensor layers.12.attention.wv.weight [115/291] Writing tensor layers.12.attention.wo.weight [116/291] Writing tensor layers.12.attention_norm.weight [117/291] Writing tensor layers.12.feed_forward.w1.weight [118/291] Writing tensor layers.12.feed_forward.w2.weight [119/291] Writing tensor layers.12.feed_forward.w3.weight [120/291] Writing tensor layers.12.ffn_norm.weight [121/291] Writing tensor layers.13.attention.wq.weight [122/291] Writing tensor layers.13.attention.wk.weight [123/291] Writing tensor layers.13.attention.wv.weight [124/291] Writing tensor layers.13.attention.wo.weight [125/291] Writing tensor layers.13.attention_norm.weight [126/291] Writing tensor layers.13.feed_forward.w1.weight [127/291] Writing tensor layers.13.feed_forward.w2.weight [128/291] Writing tensor layers.13.feed_forward.w3.weight [129/291] Writing tensor layers.13.ffn_norm.weight [130/291] Writing tensor layers.14.attention.wq.weight [131/291] Writing tensor layers.14.attention.wk.weight [132/291] Writing tensor layers.14.attention.wv.weight [133/291] Writing tensor layers.14.attention.wo.weight [134/291] Writing tensor layers.14.attention_norm.weight [135/291] Writing tensor layers.14.feed_forward.w1.weight [136/291] Writing tensor layers.14.feed_forward.w2.weight [137/291] Writing tensor layers.14.feed_forward.w3.weight [138/291] Writing tensor layers.14.ffn_norm.weight [139/291] Writing tensor layers.15.attention.wq.weight [140/291] Writing tensor layers.15.attention.wk.weight [141/291] Writing tensor layers.15.attention.wv.weight [142/291] Writing tensor layers.15.attention.wo.weight [143/291] Writing tensor layers.15.attention_norm.weight [144/291] Writing tensor layers.15.feed_forward.w1.weight [145/291] Writing tensor layers.15.feed_forward.w2.weight [146/291] Writing tensor layers.15.feed_forward.w3.weight [147/291] Writing tensor layers.15.ffn_norm.weight [148/291] Writing tensor layers.16.attention.wq.weight [149/291] Writing tensor layers.16.attention.wk.weight [150/291] Writing tensor layers.16.attention.wv.weight [151/291] Writing tensor layers.16.attention.wo.weight [152/291] Writing tensor layers.16.attention_norm.weight [153/291] Writing tensor layers.16.feed_forward.w1.weight [154/291] Writing tensor layers.16.feed_forward.w2.weight [155/291] Writing tensor layers.16.feed_forward.w3.weight [156/291] Writing tensor layers.16.ffn_norm.weight [157/291] Writing tensor layers.17.attention.wq.weight [158/291] Writing tensor layers.17.attention.wk.weight [159/291] Writing tensor layers.17.attention.wv.weight [160/291] Writing tensor layers.17.attention.wo.weight [161/291] Writing tensor layers.17.attention_norm.weight [162/291] Writing tensor layers.17.feed_forward.w1.weight [163/291] Writing tensor layers.17.feed_forward.w2.weight [164/291] Writing tensor layers.17.feed_forward.w3.weight [165/291] Writing tensor layers.17.ffn_norm.weight [166/291] Writing tensor layers.18.attention.wq.weight [167/291] Writing tensor layers.18.attention.wk.weight [168/291] Writing tensor layers.18.attention.wv.weight [169/291] Writing tensor layers.18.attention.wo.weight [170/291] Writing tensor layers.18.attention_norm.weight [171/291] Writing tensor layers.18.feed_forward.w1.weight [172/291] Writing tensor layers.18.feed_forward.w2.weight [173/291] Writing tensor layers.18.feed_forward.w3.weight [174/291] Writing tensor layers.18.ffn_norm.weight [175/291] Writing tensor layers.19.attention.wq.weight [176/291] Writing tensor layers.19.attention.wk.weight [177/291] Writing tensor layers.19.attention.wv.weight [178/291] Writing tensor layers.19.attention.wo.weight [179/291] Writing tensor layers.19.attention_norm.weight [180/291] Writing tensor layers.19.feed_forward.w1.weight [181/291] Writing tensor layers.19.feed_forward.w2.weight [182/291] Writing tensor layers.19.feed_forward.w3.weight [183/291] Writing tensor layers.19.ffn_norm.weight [184/291] Writing tensor layers.20.attention.wq.weight [185/291] Writing tensor layers.20.attention.wk.weight [186/291] Writing tensor layers.20.attention.wv.weight [187/291] Writing tensor layers.20.attention.wo.weight [188/291] Writing tensor layers.20.attention_norm.weight [189/291] Writing tensor layers.20.feed_forward.w1.weight [190/291] Writing tensor layers.20.feed_forward.w2.weight [191/291] Writing tensor layers.20.feed_forward.w3.weight [192/291] Writing tensor layers.20.ffn_norm.weight [193/291] Writing tensor layers.21.attention.wq.weight [194/291] Writing tensor layers.21.attention.wk.weight [195/291] Writing tensor layers.21.attention.wv.weight [196/291] Writing tensor layers.21.attention.wo.weight [197/291] Writing tensor layers.21.attention_norm.weight [198/291] Writing tensor layers.21.feed_forward.w1.weight [199/291] Writing tensor layers.21.feed_forward.w2.weight [200/291] Writing tensor layers.21.feed_forward.w3.weight [201/291] Writing tensor layers.21.ffn_norm.weight [202/291] Writing tensor layers.22.attention.wq.weight [203/291] Writing tensor layers.22.attention.wk.weight [204/291] Writing tensor layers.22.attention.wv.weight [205/291] Writing tensor layers.22.attention.wo.weight [206/291] Writing tensor layers.22.attention_norm.weight [207/291] Writing tensor layers.22.feed_forward.w1.weight [208/291] Writing tensor layers.22.feed_forward.w2.weight [209/291] Writing tensor layers.22.feed_forward.w3.weight [210/291] Writing tensor layers.22.ffn_norm.weight [211/291] Writing tensor layers.23.attention.wq.weight [212/291] Writing tensor layers.23.attention.wk.weight [213/291] Writing tensor layers.23.attention.wv.weight [214/291] Writing tensor layers.23.attention.wo.weight [215/291] Writing tensor layers.23.attention_norm.weight [216/291] Writing tensor layers.23.feed_forward.w1.weight [217/291] Writing tensor layers.23.feed_forward.w2.weight [218/291] Writing tensor layers.23.feed_forward.w3.weight [219/291] Writing tensor layers.23.ffn_norm.weight [220/291] Writing tensor layers.24.attention.wq.weight [221/291] Writing tensor layers.24.attention.wk.weight [222/291] Writing tensor layers.24.attention.wv.weight [223/291] Writing tensor layers.24.attention.wo.weight [224/291] Writing tensor layers.24.attention_norm.weight [225/291] Writing tensor layers.24.feed_forward.w1.weight [226/291] Writing tensor layers.24.feed_forward.w2.weight [227/291] Writing tensor layers.24.feed_forward.w3.weight [228/291] Writing tensor layers.24.ffn_norm.weight [229/291] Writing tensor layers.25.attention.wq.weight [230/291] Writing tensor layers.25.attention.wk.weight [231/291] Writing tensor layers.25.attention.wv.weight [232/291] Writing tensor layers.25.attention.wo.weight [233/291] Writing tensor layers.25.attention_norm.weight [234/291] Writing tensor layers.25.feed_forward.w1.weight [235/291] Writing tensor layers.25.feed_forward.w2.weight [236/291] Writing tensor layers.25.feed_forward.w3.weight [237/291] Writing tensor layers.25.ffn_norm.weight [238/291] Writing tensor layers.26.attention.wq.weight [239/291] Writing tensor layers.26.attention.wk.weight [240/291] Writing tensor layers.26.attention.wv.weight [241/291] Writing tensor layers.26.attention.wo.weight [242/291] Writing tensor layers.26.attention_norm.weight [243/291] Writing tensor layers.26.feed_forward.w1.weight [244/291] Writing tensor layers.26.feed_forward.w2.weight [245/291] Writing tensor layers.26.feed_forward.w3.weight [246/291] Writing tensor layers.26.ffn_norm.weight [247/291] Writing tensor layers.27.attention.wq.weight [248/291] Writing tensor layers.27.attention.wk.weight [249/291] Writing tensor layers.27.attention.wv.weight [250/291] Writing tensor layers.27.attention.wo.weight [251/291] Writing tensor layers.27.attention_norm.weight [252/291] Writing tensor layers.27.feed_forward.w1.weight [253/291] Writing tensor layers.27.feed_forward.w2.weight [254/291] Writing tensor layers.27.feed_forward.w3.weight [255/291] Writing tensor layers.27.ffn_norm.weight [256/291] Writing tensor layers.28.attention.wq.weight [257/291] Writing tensor layers.28.attention.wk.weight [258/291] Writing tensor layers.28.attention.wv.weight [259/291] Writing tensor layers.28.attention.wo.weight [260/291] Writing tensor layers.28.attention_norm.weight [261/291] Writing tensor layers.28.feed_forward.w1.weight [262/291] Writing tensor layers.28.feed_forward.w2.weight [263/291] Writing tensor layers.28.feed_forward.w3.weight [264/291] Writing tensor layers.28.ffn_norm.weight [265/291] Writing tensor layers.29.attention.wq.weight [266/291] Writing tensor layers.29.attention.wk.weight [267/291] Writing tensor layers.29.attention.wv.weight [268/291] Writing tensor layers.29.attention.wo.weight [269/291] Writing tensor layers.29.attention_norm.weight [270/291] Writing tensor layers.29.feed_forward.w1.weight [271/291] Writing tensor layers.29.feed_forward.w2.weight [272/291] Writing tensor layers.29.feed_forward.w3.weight [273/291] Writing tensor layers.29.ffn_norm.weight [274/291] Writing tensor layers.30.attention.wq.weight [275/291] Writing tensor layers.30.attention.wk.weight [276/291] Writing tensor layers.30.attention.wv.weight [277/291] Writing tensor layers.30.attention.wo.weight [278/291] Writing tensor layers.30.attention_norm.weight [279/291] Writing tensor layers.30.feed_forward.w1.weight [280/291] Writing tensor layers.30.feed_forward.w2.weight [281/291] Writing tensor layers.30.feed_forward.w3.weight [282/291] Writing tensor layers.30.ffn_norm.weight [283/291] Writing tensor layers.31.attention.wq.weight [284/291] Writing tensor layers.31.attention.wk.weight [285/291] Writing tensor layers.31.attention.wv.weight [286/291] Writing tensor layers.31.attention.wo.weight [287/291] Writing tensor layers.31.attention_norm.weight [288/291] Writing tensor layers.31.feed_forward.w1.weight [289/291] Writing tensor layers.31.feed_forward.w2.weight [290/291] Writing tensor layers.31.feed_forward.w3.weight [291/291] Writing tensor layers.31.ffn_norm.weight Wrote /Users/jblack/Library/Application Support/com.al 0gn/T/6A1F66D4-970D-4452-9D5A-F8D5231D098F/convert-pth-to-ggml.py /Users/jblack/Library/Application Support/com.alexrozanski.LlamaChat/models/47EECB0E-23AA-4001-A0F3-9548E6C73A71/7B 1
Support/com.alexrozanski.LlamaChat/models/47EECB0E-23AA-4001-A0F3-9548E6C73A71/7B/consolidated.00.pth
Support/com.alexrozanski.LlamaChat/models/47EECB0E-23AA-4001-A0F3-9548E6C73A71/tokenizer.model
| size 32000 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 32000 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 x 11008 | type UnquantizedDataType(name='F16')
| size 11008 x 4096 | type UnquantizedDataType(name='F16')
| size 4096 | type UnquantizedDataType(name='F32')
exrozanski.LlamaChat/models/47EECB0E-23AA-4001-A0F3-9548E6C73A71/7B/ggml-model-f16.bin

test -f /Users/jblack/Library/Application Support/com.alexrozanski.LlamaChat/models/47EECB0E-23AA-4001-A0F3-9548E6C73A71/7B/ggml-model-f16.bin

jdblack · 2023-11-16T22:50:16Z

I suspect this is due to lack of free memory.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Llamachat is spouting gibberish #45

Llamachat is spouting gibberish #45

jdblack commented Nov 16, 2023

jdblack commented Nov 16, 2023

Llamachat is spouting gibberish #45

Llamachat is spouting gibberish #45

Comments

jdblack commented Nov 16, 2023

jdblack commented Nov 16, 2023