Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper • 1908.10084 • Published • 14
How to use arya-raditya/bge-reranker-gemma2-n100 with sentence-transformers:
from sentence_transformers import CrossEncoder
model = CrossEncoder("arya-raditya/bge-reranker-gemma2-n100")
query = "Which planet is known as the Red Planet?"
passages = [
"Venus is often called Earth's twin because of its similar size and proximity.",
"Mars, known for its reddish appearance, is often referred to as the Red Planet.",
"Jupiter, the largest planet in our solar system, has a prominent red spot.",
"Saturn, famous for its rings, is sometimes mistaken for the Red Planet."
]
scores = model.predict([(query, passage) for passage in passages])
print(scores)This is a Cross Encoder model finetuned from BAAI/bge-reranker-v2-m3 using the sentence-transformers library. It computes scores for pairs of texts, which can be used for text reranking and semantic search.
CrossEncoder(
(0): Transformer({'transformer_task': 'sequence-classification', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'logits'}}, 'module_output_name': 'scores', 'architecture': 'XLMRobertaForSequenceClassification'})
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import CrossEncoder
# Download from the 🤗 Hub
model = CrossEncoder("cross_encoder_model_id")
# Get scores for pairs of inputs
pairs = [
['Berapa tahun sistem wajib sekolah di Indonesia ?', 'Sekolah menengah pertama\nPelajar sekolah menengah pertama umumnya berusia 13-15 tahun. Di Indonesia, setiap warga negara berusia 7-15 tahun tahun wajib mengikuti pendidikan dasar, yakni sekolah dasar (atau sederajat) 6 tahun dan sekolah menengah pertama (atau sederajat) 3 tahun.'],
['siapakah ratu yang menjabat paling lama di Imperium Britania?', 'Victoria dari Britania Raya\nPemerintahannya berlangsung 63 tahun, 216 hari, lebih lama dari raja atau ratu Britania Raya manapun sampai 9 September 2015 yang kemudian digantikan oleh anak sulung cicitnya, Ratu Elizabeth II sebagai penguasa Britania Raya terlama. Victoria berhasil mempertahankan keberadaan sistem monarki di Inggris dan menjadikannya sebagai institusi politik seremonial. Pada masa pemerintahan itula, aksi represi terhadap rakyat di kawasan-kawasan koloni Inggris meningkat secara signifikan.'],
['apakah lagu pertama yang dirilis GoodBoyBadminton?', 'GoodBoyBadminton\nAlbum Going Out rilis pada tanggal 05 03 2010 dengan single pertama "Kartu Mati" dan menjadi number 1 top chart indie di Ninety Niners pada tanggal 17 04 2010. merilis video klip "Kartu Mati" pada tanggal 22 04 2010.'],
['berapakah luas ibukota Mesir ?', "Tangga nada minor\nSebagai contoh, dalam tangga nada A minor melodis naik, melodi tangga nada minor meningkat: A B C D E F# G# A'"],
['Berapa jumlah zat kimia dalam tabel periodik ?', 'Unsur kimia\nSifat unsur kimia seringkali dirangkum menggunakan tabel periodik, yang mengatur secara elegan unsur-unsur berdasarkan kenaikan nomor atom menjadi baris ("periode") yang mendasari perulangan sifat kimia dan fisik kolom ("golongan") secara periodik. Tabel standar saat ini berisi 118 unsur yang telah dikonfirmasi per 10 April 2010.'],
]
scores = model.predict(pairs)
print(scores)
# [9.9999e-01 9.9999e-01 9.9999e-01 1.2226e-05 9.9998e-01]
# Or rank different texts based on similarity to a single text
ranks = model.rank(
'Berapa tahun sistem wajib sekolah di Indonesia ?',
[
'Sekolah menengah pertama\nPelajar sekolah menengah pertama umumnya berusia 13-15 tahun. Di Indonesia, setiap warga negara berusia 7-15 tahun tahun wajib mengikuti pendidikan dasar, yakni sekolah dasar (atau sederajat) 6 tahun dan sekolah menengah pertama (atau sederajat) 3 tahun.',
'Victoria dari Britania Raya\nPemerintahannya berlangsung 63 tahun, 216 hari, lebih lama dari raja atau ratu Britania Raya manapun sampai 9 September 2015 yang kemudian digantikan oleh anak sulung cicitnya, Ratu Elizabeth II sebagai penguasa Britania Raya terlama. Victoria berhasil mempertahankan keberadaan sistem monarki di Inggris dan menjadikannya sebagai institusi politik seremonial. Pada masa pemerintahan itula, aksi represi terhadap rakyat di kawasan-kawasan koloni Inggris meningkat secara signifikan.',
'GoodBoyBadminton\nAlbum Going Out rilis pada tanggal 05 03 2010 dengan single pertama "Kartu Mati" dan menjadi number 1 top chart indie di Ninety Niners pada tanggal 17 04 2010. merilis video klip "Kartu Mati" pada tanggal 22 04 2010.',
"Tangga nada minor\nSebagai contoh, dalam tangga nada A minor melodis naik, melodi tangga nada minor meningkat: A B C D E F# G# A'",
'Unsur kimia\nSifat unsur kimia seringkali dirangkum menggunakan tabel periodik, yang mengatur secara elegan unsur-unsur berdasarkan kenaikan nomor atom menjadi baris ("periode") yang mendasari perulangan sifat kimia dan fisik kolom ("golongan") secara periodik. Tabel standar saat ini berisi 118 unsur yang telah dikonfirmasi per 10 April 2010.',
]
)
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
valCEBinaryClassificationEvaluator| Metric | Value |
|---|---|
| accuracy | 0.7737 |
| accuracy_threshold | 0.0122 |
| f1 | 0.7831 |
| f1_threshold | 0.0004 |
| precision | 0.7404 |
| recall | 0.831 |
| average_precision | 0.865 |
sentence_0, sentence_1, and label| sentence_0 | sentence_1 | label | |
|---|---|---|---|
| type | string | string | float |
| modality | text | text | |
| details |
|
|
|
| sentence_0 | sentence_1 | label |
|---|---|---|
Berapa tahun sistem wajib sekolah di Indonesia ? |
Sekolah menengah pertama |
1.0 |
siapakah ratu yang menjabat paling lama di Imperium Britania? |
Victoria dari Britania Raya |
1.0 |
apakah lagu pertama yang dirilis GoodBoyBadminton? |
GoodBoyBadminton |
1.0 |
BinaryCrossEntropyLoss with these parameters:{
"activation_fn": "torch.nn.modules.linear.Identity",
"pos_weight": null
}
per_device_train_batch_size: 16per_device_eval_batch_size: 16per_device_train_batch_size: 16num_train_epochs: 3max_steps: -1learning_rate: 5e-05lr_scheduler_type: linearlr_scheduler_kwargs: Nonewarmup_steps: 0optim: adamw_torch_fusedoptim_args: Noneweight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08optim_target_modules: Nonegradient_accumulation_steps: 1average_tokens_across_devices: Truemax_grad_norm: 1label_smoothing_factor: 0.0bf16: Falsefp16: Falsebf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Nonetorch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneuse_liger_kernel: Falseliger_kernel_config: Noneuse_cache: Falseneftune_noise_alpha: Nonetorch_empty_cache_steps: Noneauto_find_batch_size: Falselog_on_each_node: Truelogging_nan_inf_filter: Trueinclude_num_input_tokens_seen: nolog_level: passivelog_level_replica: warningdisable_tqdm: Falseproject: huggingfacetrackio_space_id: Nonetrackio_bucket_id: Nonetrackio_static_space_id: Noneper_device_eval_batch_size: 16prediction_loss_only: Trueeval_on_start: Falseeval_do_concat_batches: Trueeval_use_gather_object: Falseeval_accumulation_steps: Noneinclude_for_metrics: []batch_eval_metrics: Falsesave_only_model: Falsesave_on_each_node: Falseenable_jit_checkpoint: Falsepush_to_hub: Falsehub_private_repo: Nonehub_model_id: Nonehub_strategy: every_savehub_always_push: Falsehub_revision: Noneload_best_model_at_end: Falseignore_data_skip: Falserestore_callback_states_from_checkpoint: Falsefull_determinism: Falseseed: 42data_seed: Noneuse_cpu: Falseaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedataloader_drop_last: Falsedataloader_num_workers: 0dataloader_pin_memory: Truedataloader_persistent_workers: Falsedataloader_prefetch_factor: Noneremove_unused_columns: Truelabel_names: Nonetrain_sampling_strategy: randomlength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falseddp_static_graph: Noneddp_backend: Noneddp_timeout: 1800fsdp: []fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}deepspeed: Nonedebug: []skip_memory_metrics: Truedo_predict: Falseresume_from_checkpoint: Nonewarmup_ratio: Nonelocal_rank: -1prompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: proportionalrouter_mapping: {}learning_rate_mapping: {}| Epoch | Step | Training Loss | val_average_precision |
|---|---|---|---|
| 1.0 | 243 | - | 0.8637 |
| 2.0 | 486 | - | 0.8665 |
| 2.0576 | 500 | 0.1381 | - |
| 3.0 | 729 | - | 0.8650 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
Base model
BAAI/bge-reranker-v2-m3