Recommender-System-with-TF2.0/FM at master · xaxfan/Recommender-System-with-TF2.0

History

Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
model.py		model.py
train.py		train.py

README.md

FM

1. 论文

Factorization Machines

创新：经典因子分解机模型

2. 模型结构

3. 实验数据集

采用Criteo数据集进行测试。数据集的处理见../data_process文件，主要分为：

考虑到Criteo文件过大，因此可以通过read_part和sample_sum读取部分数据进行测试；
对缺失数据进行填充；
对密集数据I1-I13进行离散化分桶（bins=100），对稀疏数据C1-C26进行重新编码LabelEncoder；
整理得到feature_columns；
切分数据集，最后返回feature_columns, (train_X, train_y), (test_X, test_y)；

4. 模型API

class FM_Layer(Layer):
    def __init__(self, feature_columns, k, w_reg=1e-6, v_reg=1e-6):
        """
        Factorization Machines
        :param feature_columns: A list. sparse column feature information.
        :param k: the latent vector
        :param w_reg: the regularization coefficient of parameter w
        :param v_reg: the regularization coefficient of parameter v
        """

5. 实验超参数

file：Criteo文件；
read_part：是否读取部分数据，True；
sample_num：读取部分时，样本数量，1000000；
test_size：测试集比例，0.2；
k：隐因子，8；
dnn_dropout：Dropout， 0.5；
hidden_unit：DNN的隐藏单元，[256, 128, 64]；
learning_rate：学习率，0.001；
batch_size：4096；
epoch：10；

6. 实验结果

采用Criteo数据集中前500w条数据，最终测试集的结果为：AUC: 0.778358, loss: 0.4765；
采用Criteo数据集全部内容：
- 学习参数：264,501,784；
- 单个Epoch运行时间【GPU：Tesla V100S-PCI】：323s；
- 测试集结果：AUC: 0.787504, loss: 0.4762；

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FM

FM

README.md

FM

1. 论文

2. 模型结构

3. 实验数据集

4. 模型API

5. 实验超参数

6. 实验结果

Files

FM

Directory actions

More options

Directory actions

More options

Latest commit

History

FM

Folders and files

parent directory

README.md

FM

1. 论文

2. 模型结构

3. 实验数据集

4. 模型API

5. 实验超参数

6. 实验结果