On Embeddings for Numerical Features in Tabular Deep Learning
该论文使用表格深度学习的一些新embedding。论文地址
出自NIPS 2022
Hardy Xu利用该方法获得了kaggle Playground Series - Season 3, Episode 26: Multi-Class Prediction of Cirrhosis Outcomes的第二名。
本文提出了两种不同的构建块,适用于构建数字特征的嵌入。第一种是分段线性编码,它为原始标量值产生替代的初始表示,并基于特征装箱。第二种依赖于周期激活函数。
Piecewise linear encoding
bin的选择:
(1)根据百分数
(2)类似于的决策树C4.5中的处理。
Periodic activation functions
On Embeddings for Numerical Features in Tabular Deep Learning
https://lijianxiong.work/2024/20240116/