hashintel
/

vec2slug-v1-openai-large

slug-generation

embedding-to-text

Model card Files Files and versions

indietyp commited on 23 days ago

Commit

c7d6720

·

verified ·

1 Parent(s): 0991c68

fix pipeline tag

Files changed (2) hide show

README.md +1 -1
inference.py +5 -8

README.md CHANGED Viewed

@@ -9,7 +9,7 @@ tags:
   - url-slug
   - beam-search
 library_name: onnxruntime
-pipeline_tag: text2text-generation
 ---
 # vec2slug-v1-large

   - url-slug
   - beam-search
 library_name: onnxruntime
+pipeline_tag: summarization
 ---
 # vec2slug-v1-large

inference.py CHANGED Viewed

@@ -269,9 +269,7 @@ class SlugPredictor(ABC):
                         candidates.append((new_log_prob, new_tokens))
             # Rank by partial objective for consistent pruning
-            candidates.sort(
-                key=lambda x: self._partial_score(x[0], x[1]), reverse=True
-            )
             active = candidates[:k]
             # Optimal stopping: best completed dominates all active upper bounds
@@ -304,8 +302,7 @@ class SlugPredictor(ABC):
         # Deduplicate and rank
         scored = [
-            (self._score(log_prob, tokens), tokens)
-            for log_prob, tokens in completed
         ]
         scored.sort(key=lambda x: -x[0])
@@ -400,9 +397,9 @@ def _load_pytorch_model(model_dir: Path, model_config: ModelConfig):
             self.token_embedding = nn.Embedding(vocab_size, embed_dim, padding_idx=0)
             self.position_embedding = nn.Embedding(max_length + 1, embed_dim)
             self.dropout = nn.Dropout(dropout)
-            self.blocks = nn.ModuleList(
-                [DecoderBlock(embed_dim, num_heads, dropout) for _ in range(num_layers)]
-            )
             self.ln_final = nn.LayerNorm(embed_dim)
             self.output_projection = nn.Linear(embed_dim, vocab_size)

                         candidates.append((new_log_prob, new_tokens))
             # Rank by partial objective for consistent pruning
+            candidates.sort(key=lambda x: self._partial_score(x[0], x[1]), reverse=True)
             active = candidates[:k]
             # Optimal stopping: best completed dominates all active upper bounds
         # Deduplicate and rank
         scored = [
+            (self._score(log_prob, tokens), tokens) for log_prob, tokens in completed
         ]
         scored.sort(key=lambda x: -x[0])
             self.token_embedding = nn.Embedding(vocab_size, embed_dim, padding_idx=0)
             self.position_embedding = nn.Embedding(max_length + 1, embed_dim)
             self.dropout = nn.Dropout(dropout)
+            self.blocks = nn.ModuleList([
+                DecoderBlock(embed_dim, num_heads, dropout) for _ in range(num_layers)
+            ])
             self.ln_final = nn.LayerNorm(embed_dim)
             self.output_projection = nn.Linear(embed_dim, vocab_size)