Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

recbole自定义数据集问题 #1368

Open
W-Douglas opened this issue Jul 29, 2022 · 10 comments
Open

recbole自定义数据集问题 #1368

W-Douglas opened this issue Jul 29, 2022 · 10 comments
Assignees
Labels
question Further information is requested

Comments

@W-Douglas
Copy link

[目前的主要问题就是在使用自己制作的数据集时,报错如下
屏幕截图 2022-07-29 175120
同时,在使用官方数据集时发现每列之间的间隔不同,并且在改变间隔之后(如将三个空格删除为一个空格)报错和上图一致,所以想问一下,recbole对于数据集的间隔有没有要求,如果有具体的规定是什么,或者说有没有什么快捷的方法实现原子文件的转换。

@Ethan-TZ
Copy link
Member

@W-Douglas 感谢您的关注!
RecBole对数据集的间隔没有要求,结构化文件即可。用户可以在config文件中使用field_separator指定不同字段间的分隔符。
如对于.csv文件,可以设置field_separator: ",";对于.tsv文件,可以设置field_separator: "\t"。 其中默认设置为.tsv文件。对于原子文件,你只需要按格式加上字段header即可,设置参考atomic files

@W-Douglas
Copy link
Author

感谢您的回复,我在相关的论文中发现,recbole项目同时还发布了一个数据的转换工具,见下图
屏幕截图 2022-07-30 104829
请问在哪里可以找到该工具。

@Ethan-TZ
Copy link
Member

@W-Douglas
Copy link
Author

好的好的,感谢您的帮助。

@W-Douglas
Copy link
Author

数据集中有一列是处理好的rating,但是在使用转换工具的时候会有如下报错,显示并没有rating,想问一下接下来该怎么做才能转换成功
image

@Ethan-TZ
Copy link
Member

Ethan-TZ commented Aug 5, 2022

@W-Douglas 这个问题可能你下载的数据集中没有ratings.dat文件。对于movielens数据集,请参照User Guide进行格式转换。

@xiuxiuxiu6
Copy link

您好,训练好的pth模型。一般推荐模型和上下文推荐模型都可以用run-example里面的例子来得出结果吗,还是不同模型调用pth需要用不同的方法

@yangyangwuwu
Copy link

您好,请问您解决自己制作数据集出现ValueError: too many values to unpack (expected 2)的问题了么

[目前的主要问题就是在使用自己制作的数据集时,报错如下
屏幕截图 2022-07-29 175120
同时,在使用官方数据集时发现每列之间的间隔不同,并且在改变间隔之后(如将三个空格删除为一个空格)报错和上图一致,所以想问一下,recbole对于数据集的间隔有没有要求,如果有具体的规定是什么,或者说有没有什么快捷的方法实现原子文件的转换。

@Sherry-XLL Sherry-XLL added dataset and removed dataset labels Feb 7, 2023
@Sherry-XLL
Copy link
Member

您好 @yangyangwuwu,伯乐标准的原子文件格式的 header 需要使用 : 分开名称和段类型,例如 user_id:tokenrating:float,详情可以参考我们的文档

@Sherry-XLL Sherry-XLL added the question Further information is requested label Feb 9, 2023
@hdsy0430
Copy link

为什么我的item_id列明明存在,却提示我缺少那一列呢

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
question Further information is requested
Projects
None yet
Development

No branches or pull requests

6 participants