On Embeddings for Numerical Features in Tabular Deep Learning

该论文使用表格深度学习的一些新embedding。论文地址

出自NIPS 2022

Hardy Xu利用该方法获得了kaggle Playground Series - Season 3, Episode 26: Multi-Class Prediction of Cirrhosis Outcomes的第二名。


本文提出了两种不同的构建块,适用于构建数字特征的嵌入。第一种是分段线性编码,它为原始标量值产生替代的初始表示,并基于特征装箱。第二种依赖于周期激活函数。

Piecewise linear encoding

bin的选择:

(1)根据百分数

(2)类似于的决策树C4.5中的处理。

Periodic activation functions


On Embeddings for Numerical Features in Tabular Deep Learning
https://lijianxiong.work/2024/20240116/
作者
LJX
发布于
2024年1月16日
许可协议