RLHFlow
/

RewardModel-Mistral-7B-for-DPA-v1

Text Classification

text-embeddings-inference

Model card Files Files and versions

Haoxiang-Wang commited on Apr 21, 2024

Commit

9452cf2

·

verified ·

1 Parent(s): 57271c4

Create modelling_custom.py

Files changed (1) hide show

modelling_custom.py +18 -0

modelling_custom.py ADDED Viewed

	@@ -0,0 +1,18 @@

+import torch
+from torch.nn import functional as F
+from transformers.models.mistral.modeling_mistral import MistralForSequenceClassification
+class NormalizedLinear(torch.nn.Linear):
+    def forward(self, x):
+        x = F.normalize(x, p=2, dim=-1)
+        return super().forward(x)
+class MistralForAttributePrediction(MistralForSequenceClassification):
+    def __init__(self, config):
+        super().__init__(config)
+        del self.score
+        self.score = NormalizedLinear(config.hidden_size, config.num_labels, bias=True)
+        # Initialize weights and apply final processing
+        self.post_init()