CrossEncoder based on BAAI/bge-reranker-v2-m3

This is a Cross Encoder model finetuned from BAAI/bge-reranker-v2-m3 using the sentence-transformers library. It computes scores for pairs of texts, which can be used for text reranking and semantic search.

Model Details

Model Description

  • Model Type: Cross Encoder
  • Base model: BAAI/bge-reranker-v2-m3
  • Maximum Sequence Length: 512 tokens
  • Number of Output Labels: 1 label
  • Supported Modality: Text

Model Sources

Full Model Architecture

CrossEncoder(
  (0): Transformer({'transformer_task': 'sequence-classification', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'logits'}}, 'module_output_name': 'scores', 'architecture': 'XLMRobertaForSequenceClassification'})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import CrossEncoder

# Download from the 🤗 Hub
model = CrossEncoder("cross_encoder_model_id")
# Get scores for pairs of inputs
pairs = [
    ['Berapa tahun sistem wajib sekolah di Indonesia ?', 'Sekolah menengah pertama\nPelajar sekolah menengah pertama umumnya berusia 13-15 tahun. Di Indonesia, setiap warga negara berusia 7-15 tahun tahun wajib mengikuti pendidikan dasar, yakni sekolah dasar (atau sederajat) 6 tahun dan sekolah menengah pertama (atau sederajat) 3 tahun.'],
    ['siapakah ratu yang menjabat paling lama di Imperium Britania?', 'Victoria dari Britania Raya\nPemerintahannya berlangsung 63 tahun, 216 hari, lebih lama dari raja atau ratu Britania Raya manapun sampai 9 September 2015 yang kemudian digantikan oleh anak sulung cicitnya, Ratu Elizabeth II sebagai penguasa Britania Raya terlama. Victoria berhasil mempertahankan keberadaan sistem monarki di Inggris dan menjadikannya sebagai institusi politik seremonial. Pada masa pemerintahan itula, aksi represi terhadap rakyat di kawasan-kawasan koloni Inggris meningkat secara signifikan.'],
    ['apakah lagu pertama yang dirilis GoodBoyBadminton?', 'GoodBoyBadminton\nAlbum Going Out rilis pada tanggal 05 03 2010 dengan single pertama "Kartu Mati" dan menjadi number 1 top chart indie di Ninety Niners pada tanggal 17 04 2010. merilis video klip "Kartu Mati" pada tanggal 22 04 2010.'],
    ['berapakah luas ibukota Mesir ?', "Tangga nada minor\nSebagai contoh, dalam tangga nada A minor melodis naik, melodi tangga nada minor meningkat: A B C D E F# G# A'"],
    ['Berapa jumlah zat kimia dalam tabel periodik ?', 'Unsur kimia\nSifat unsur kimia seringkali dirangkum menggunakan tabel periodik, yang mengatur secara elegan unsur-unsur berdasarkan kenaikan nomor atom menjadi baris ("periode") yang mendasari perulangan sifat kimia dan fisik kolom ("golongan") secara periodik. Tabel standar saat ini berisi 118 unsur yang telah dikonfirmasi per 10 April 2010.'],
]
scores = model.predict(pairs)
print(scores)
# [9.9999e-01 9.9999e-01 9.9999e-01 1.2226e-05 9.9998e-01]

# Or rank different texts based on similarity to a single text
ranks = model.rank(
    'Berapa tahun sistem wajib sekolah di Indonesia ?',
    [
        'Sekolah menengah pertama\nPelajar sekolah menengah pertama umumnya berusia 13-15 tahun. Di Indonesia, setiap warga negara berusia 7-15 tahun tahun wajib mengikuti pendidikan dasar, yakni sekolah dasar (atau sederajat) 6 tahun dan sekolah menengah pertama (atau sederajat) 3 tahun.',
        'Victoria dari Britania Raya\nPemerintahannya berlangsung 63 tahun, 216 hari, lebih lama dari raja atau ratu Britania Raya manapun sampai 9 September 2015 yang kemudian digantikan oleh anak sulung cicitnya, Ratu Elizabeth II sebagai penguasa Britania Raya terlama. Victoria berhasil mempertahankan keberadaan sistem monarki di Inggris dan menjadikannya sebagai institusi politik seremonial. Pada masa pemerintahan itula, aksi represi terhadap rakyat di kawasan-kawasan koloni Inggris meningkat secara signifikan.',
        'GoodBoyBadminton\nAlbum Going Out rilis pada tanggal 05 03 2010 dengan single pertama "Kartu Mati" dan menjadi number 1 top chart indie di Ninety Niners pada tanggal 17 04 2010. merilis video klip "Kartu Mati" pada tanggal 22 04 2010.',
        "Tangga nada minor\nSebagai contoh, dalam tangga nada A minor melodis naik, melodi tangga nada minor meningkat: A B C D E F# G# A'",
        'Unsur kimia\nSifat unsur kimia seringkali dirangkum menggunakan tabel periodik, yang mengatur secara elegan unsur-unsur berdasarkan kenaikan nomor atom menjadi baris ("periode") yang mendasari perulangan sifat kimia dan fisik kolom ("golongan") secara periodik. Tabel standar saat ini berisi 118 unsur yang telah dikonfirmasi per 10 April 2010.',
    ]
)
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]

Evaluation

Metrics

Cross Encoder Binary Classification

Metric Value
accuracy 0.7737
accuracy_threshold 0.0122
f1 0.7831
f1_threshold 0.0004
precision 0.7404
recall 0.831
average_precision 0.865

Training Details

Training Dataset

Unnamed Dataset

  • Size: 3,874 training samples
  • Columns: sentence_0, sentence_1, and label
  • Approximate statistics based on the first 100 samples:
    sentence_0 sentence_1 label
    type string string float
    modality text text
    details
    • min: 7 tokens
    • mean: 10.62 tokens
    • max: 26 tokens
    • min: 15 tokens
    • mean: 136.66 tokens
    • max: 512 tokens
    • min: 0.0
    • mean: 0.59
    • max: 1.0
  • Samples:
    sentence_0 sentence_1 label
    Berapa tahun sistem wajib sekolah di Indonesia ? Sekolah menengah pertama
    Pelajar sekolah menengah pertama umumnya berusia 13-15 tahun. Di Indonesia, setiap warga negara berusia 7-15 tahun tahun wajib mengikuti pendidikan dasar, yakni sekolah dasar (atau sederajat) 6 tahun dan sekolah menengah pertama (atau sederajat) 3 tahun.
    1.0
    siapakah ratu yang menjabat paling lama di Imperium Britania? Victoria dari Britania Raya
    Pemerintahannya berlangsung 63 tahun, 216 hari, lebih lama dari raja atau ratu Britania Raya manapun sampai 9 September 2015 yang kemudian digantikan oleh anak sulung cicitnya, Ratu Elizabeth II sebagai penguasa Britania Raya terlama. Victoria berhasil mempertahankan keberadaan sistem monarki di Inggris dan menjadikannya sebagai institusi politik seremonial. Pada masa pemerintahan itula, aksi represi terhadap rakyat di kawasan-kawasan koloni Inggris meningkat secara signifikan.
    1.0
    apakah lagu pertama yang dirilis GoodBoyBadminton? GoodBoyBadminton
    Album Going Out rilis pada tanggal 05 03 2010 dengan single pertama "Kartu Mati" dan menjadi number 1 top chart indie di Ninety Niners pada tanggal 17 04 2010. merilis video klip "Kartu Mati" pada tanggal 22 04 2010.
    1.0
  • Loss: BinaryCrossEntropyLoss with these parameters:
    {
        "activation_fn": "torch.nn.modules.linear.Identity",
        "pos_weight": null
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16

All Hyperparameters

Click to expand
  • per_device_train_batch_size: 16
  • num_train_epochs: 3
  • max_steps: -1
  • learning_rate: 5e-05
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: None
  • warmup_steps: 0
  • optim: adamw_torch_fused
  • optim_args: None
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • optim_target_modules: None
  • gradient_accumulation_steps: 1
  • average_tokens_across_devices: True
  • max_grad_norm: 1
  • label_smoothing_factor: 0.0
  • bf16: False
  • fp16: False
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • use_liger_kernel: False
  • liger_kernel_config: None
  • use_cache: False
  • neftune_noise_alpha: None
  • torch_empty_cache_steps: None
  • auto_find_batch_size: False
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • include_num_input_tokens_seen: no
  • log_level: passive
  • log_level_replica: warning
  • disable_tqdm: False
  • project: huggingface
  • trackio_space_id: None
  • trackio_bucket_id: None
  • trackio_static_space_id: None
  • per_device_eval_batch_size: 16
  • prediction_loss_only: True
  • eval_on_start: False
  • eval_do_concat_batches: True
  • eval_use_gather_object: False
  • eval_accumulation_steps: None
  • include_for_metrics: []
  • batch_eval_metrics: False
  • save_only_model: False
  • save_on_each_node: False
  • enable_jit_checkpoint: False
  • push_to_hub: False
  • hub_private_repo: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_always_push: False
  • hub_revision: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • restore_callback_states_from_checkpoint: False
  • full_determinism: False
  • seed: 42
  • data_seed: None
  • use_cpu: False
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • dataloader_prefetch_factor: None
  • remove_unused_columns: True
  • label_names: None
  • train_sampling_strategy: random
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • ddp_static_graph: None
  • ddp_backend: None
  • ddp_timeout: 1800
  • fsdp: []
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • deepspeed: None
  • debug: []
  • skip_memory_metrics: True
  • do_predict: False
  • resume_from_checkpoint: None
  • warmup_ratio: None
  • local_rank: -1
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: proportional
  • router_mapping: {}
  • learning_rate_mapping: {}

Training Logs

Epoch Step Training Loss val_average_precision
1.0 243 - 0.8637
2.0 486 - 0.8665
2.0576 500 0.1381 -
3.0 729 - 0.8650

Training Time

  • Training: 21.9 minutes

Framework Versions

  • Python: 3.12.13
  • Sentence Transformers: 5.5.0
  • Transformers: 5.8.1
  • PyTorch: 2.11.0+cu130
  • Accelerate: 1.13.0
  • Datasets: 4.8.5
  • Tokenizers: 0.22.2

Additional Resources

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
Downloads last month
36
Safetensors
Model size
0.6B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for arya-raditya/bge-reranker-gemma2-n100

Finetuned
(83)
this model

Paper for arya-raditya/bge-reranker-gemma2-n100

Evaluation results