J6M
QAT过程中,我想将所有的节点设置成int16精度,来测试量化的上限,但只找到了fp16的,复制后修改int16会有问题 assert dtype in (torch.float16, torch.float32)
要怎么一键设置呢?像PTQ那样 "all_node_type": "int16"/"float16",
all_fp16_qconfig_setter = TemplateQconfigSetter(
QConfig(
FakeCast.with_args(dtype=torch.float16),
FakeCast.with_args(dtype=torch.float16),
FakeCast.with_args(dtype=torch.float16),
),
[],
)

n你参考下这个,OE包里面的
