跳转至

SuperModelingFactory

面向信用评分卡开发的端到端 Python 建模工具链

SuperModelingFactory 整合了信贷风控建模全流程所需的三大能力:

子项目 功能定位 核心能力
Modeling_Tool 建模引擎 数据分箱、WOE 编码、特征分析、模型训练与评估、样本管理
ExcelMaster 报告引擎 程序化 Excel 工作簿生成,支持图表、条件格式、光标流式写入
Report 报告模板 模型性能报告、WOE 图批量导出、多模型对比报告

它能帮你做什么

典型场景

  • 从一张行为评分样本出发,5 分钟产出评分卡训练样本
  • WOE / IV / PSI 做特征筛选与稳定性监控
  • 训练 逻辑回归 / LightGBM / XGBoost / CatBoost 模型并自动出 Gains / ROC / KS 报告
  • 支持样本权重训练与评估(weight_col / sample_weight,按余额/过采样校正等场景)
  • 处理拒绝推断分布偏移问题
  • 通过 ExcelMaster 一键导出格式化的中文建模报告
  • UAT 模块做线上线下分数一致性校验

快速一览

from Modeling_Tool import SampleSplitter
splitter = SampleSplitter(test_size=0.3, random_state=42, stratify=True)
train_df, test_df = splitter.split_df(data, target='bad_flag')
from Modeling_Tool import WOE_Master
woe = WOE_Master(train_data=train_df, varlist=features, dep='bad_flag')
woe.fit(nbins=10, equal_freq=True)
train_woe = woe.transform(train_df)
test_woe  = woe.transform(test_df)
from Modeling_Tool import GradientBoostingModel
model = GradientBoostingModel('lgb', {'n_estimators': 200, 'learning_rate': 0.05})
model.fit(train_woe[features], train_woe['bad_flag'],
          test_woe[features],  test_woe['bad_flag'])
from ExcelMaster.ExcelMaster import ExcelMaster
em = ExcelMaster('model_report.xlsx', verbose=False)
ws = em.add_worksheet('Performance')
em.write_dataframe(ws, perf, title='模型性能', titleformat='BLUE_H2')
em.insert_image(ws, 'roc_curve.png', figScale=(600, 400))
em.close_workbook()

文档导航

  • 快速上手

    5 分钟跑通你的第一个评分卡训练流水线。

  • 安装

    核心依赖、可选依赖、MaxCompute 接入。

  • 架构

    模块依赖图、设计原则、命名规范。

  • 端到端流水线

    从样本切分到 Excel 报告的完整建模流程。

  • 用户指南

    按场景分册:样本 / WOE / 特征 / 模型 / 评估 / UAT / 报告。

  • API 参考

    所有公开类、方法、函数的详细说明。


适用对象

  • 信贷风控建模师:开发 A 卡、B 卡、C 卡、反欺诈模型
  • 模型验证 / 审计:UAT 一致性、PSI 监控、变量解释性
  • 数据科学家:复用分箱 / WOE / 后向消元 / 拒绝推断等模块
  • 建模平台开发:把 SuperModelingFactory 作为底层库进行二次封装

版本

  • Version: 0.2.0
  • Author: Jingkai Sun
  • License: Business Source License 1.1(2030-06-24 后转 Apache 2.0,商业使用须联系作者授权)

下一步

👉 快速上手安装架构