每一次刷卡、转账和支付都编码了人类行为的模式。交易数据是企业拥有的最丰富的信号之一,但大多数生产用例仍然依赖于手工构建的特征和规则集——这些方法脆弱、维护成本高且无法捕捉客户历史中的序列结构。基础模型通过在海量无标签交易序列上进行预训练,生成通用的金融行为表征,可迁移到欺诈检测、信用评分、生命周期价值预测、客户细分等广泛的下游任务。
NVIDIA的交易基础模型构建方案提供了一个端到端的参考实现:利用cuDF在GPU上进行加速数据处理,通过自定义域分词器将每笔交易转换为约12个语义Token(相比通用BPE分词器的39个Token,效率提升3倍以上),使用NeMo AutoModel预训练解码器Transformer模型,并最终通过提取的嵌入向量增强下游分类器。在IBM TabFormer欺诈数据集上的测试表明,将基础模型嵌入与原始特征结合,可将平均精确率(AP)提升近50%。多家领先金融科技公司已采用类似方案——Stripe、Nubank、Visa、Mastercard和Revolut都在构建自己的交易基础模型,这一方法正在成为金融AI的主流范式。
WeChat
Profile