nm-testing
/

Llama-4-Scout-17B-16E-Instruct-BLOCK-FP8

Text Generation

compressed-tensors

Model card Files Files and versions

Llama-4-Scout-17B-16E-Instruct-BLOCK-FP8

File size: 258 Bytes

bfb2dff

default_stage:
  default_modifiers:
    QuantizationModifier:
      targets: [Linear]
      ignore: ['re:.*lm_head', 're:.*self_attn', 're:.*router', 're:.*vision_model.*', 're:.*multi_modal_projector.*',
        Llama4TextAttention]
      scheme: FP8_BLOCK