-
Notifications
You must be signed in to change notification settings - Fork 3
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
无法输出结果 #2
Comments
您好,Qwen2 和 Qwen2.5 好像使用默认 attention 实现的时候会出问题。 或者在加载时设置 from lmcsc import LMCorrector
import torch
corrector = LMCorrector(
model="Qwen/Qwen2-7B",
config_path="configs/default_config.yaml",
torch_dtype=torch.bfloat16
) |
|
对齐模型 |
奇怪。是否可以把具体环境、显卡之类的发一下呢,我尝试复现一下 |
Package Version accelerate 1.2.1 |
通过 python:3.10.14 构建docker 环境, accelerate 1.2.1 |
换了您说的那两个模型确实可以用了👍,但是Qwen2.5我这确实不可用 |
我这俩天研究研究 |
目前发现是在 3.10 之后的 Python 版本中 simple-csc/lmcsc/generation.py Lines 104 to 115 in 1e269be
这段代码中的 104 行的 @torch.jit.script 会导致构造出来的 distortion_probs 和传进去的不一致。 |
好的,我看下,再请教个事,我这专业词汇比较多,程序纠错很多专业词汇,这个怎么解决呢,是用我的专业数据从头训练吗
Jacob Zhou ***@***.***>于2025年1月7日 周二00:49写道:
… 目前发现是在 3.10 之后的 Python 版本中
https://github.com/Jacob-Zhou/simple-csc/blob/1e269be9b51d17de7d54c270ec895cd05fbeaa10/lmcsc/generation.py#L104-L115
这段代码中的 104 行的 @torch.jit.script 会导致构造出来的 distortion_probs 和传进去的不一致。
注释掉之后我这边的 Qwen2.5 可以恢复正常。您可以试试看在您那边是否有效。
具体原因我还在调查中。
—
Reply to this email directly, view it on GitHub
<#2 (comment)>,
or unsubscribe
<https://github.com/notifications/unsubscribe-auth/BBSGQBICGUMX3IFCRECKXF32JKXZDAVCNFSM6AAAAABUQ5A5A2VHI2DSMVQWIX3LMV43OSLTON2WKQ3PNVWWK3TUHMZDKNZTGUYDEMRUG4>
.
You are receiving this because you authored the thread.Message ID:
***@***.***>
|
可以试试在 contexts 中输入您专业领域的描述、或者当前句子的前文。可能会有些提升。 |
代码如下
from lmcsc import LMCorrector
corrector = LMCorrector(
model="/home/Work/models/Qwen/Qwen2-7B",
config_path="configs/default_config.yaml",
)
print("加载模型成功")
text = input("请输出文本:")
outputs = corrector(text)
print(outputs)
运行结果如下
按照要求配置的环境 pip install -r requirements.txt
但是结果无法输出,卡了很久
The text was updated successfully, but these errors were encountered: