Adding _set_gradient_checkpointing for compatibility (#22)

- Adding _set_gradient_checkpointing for compatibility (a30a931294ac0f344a0c1547877c692ceb17123c) Co-authored-by: Vicente Rivera <vriveras@users.noreply.huggingface.co>
2023-10-17 12:11:30 +00:00 · 2023-10-17 12:11:30 +00:00 · 8091327f9e
commit 8091327f9e
parent b6a7e2fe15
1 changed files with 4 additions and 0 deletions
--- a/modeling_mixformer_sequential.py
+++ b/modeling_mixformer_sequential.py
@ -712,6 +712,10 @@ class MixFormerSequentialPreTrainedModel(PreTrainedModel):
            "attention_mask": attention_mask,
        }
    def _set_gradient_checkpointing(self, module, value=False):
            if isinstance(module, MixFormerSequentialPreTrainedModel):
                module.gradient_checkpointing = value
 class MixFormerSequentialForCausalLM(MixFormerSequentialPreTrainedModel):
    """MixFormer (sequential for DeepSpeed) for Causal Language Modeling."""