Instructions to use SultanGurbuz/qwen3-embedding-8b-finetuned with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use SultanGurbuz/qwen3-embedding-8b-finetuned with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("SultanGurbuz/qwen3-embedding-8b-finetuned") sentences = [ "query: Trafik sigortasının zararları karşılamaması hakkında ORICON kaynağına göre ne söylenebilir?", "passage: Ruhsat başvurusunun reddedilmesi durumunda, bu karara itiraz etmek isteyen kişilerin altmış gün içerisinde dava açmaları gerekmektedir. Ruhsat talebinin reddedilmesi halinde, hukuka aykırılık iddiasında bulunan kişilerin altmış gün zarfında dava açmaları gerekmektedir.", "passage: Trafik sigortasının zararları karşılamaması için kazanın oluşumunda alkolün etkili olması gerekmektedir.", "passage: Lüks giderler bakımından, kanunda iyiniyetli olup olmama bakımından bir ayrım yapılmamıştır; her iki durumda da bu giderlerin ödenmesini isteme hakkı yoktur." ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - llama-cpp-python
How to use SultanGurbuz/qwen3-embedding-8b-finetuned with llama-cpp-python:
# !pip install llama-cpp-python from llama_cpp import Llama llm = Llama.from_pretrained( repo_id="SultanGurbuz/qwen3-embedding-8b-finetuned", filename="qwen3-embedding-8b-finetuned-Q5_K_M.gguf", )
llm.create_chat_completion( messages = "{\n \"source_sentence\": \"That is a happy person\",\n \"sentences\": [\n \"That is a happy dog\",\n \"That is a very happy person\",\n \"Today is a sunny day\"\n ]\n}" ) - Notebooks
- Google Colab
- Kaggle
- Local Apps Settings
- llama.cpp
How to use SultanGurbuz/qwen3-embedding-8b-finetuned with llama.cpp:
Install from brew
brew install llama.cpp # Start a local OpenAI-compatible server with a web UI: llama-server -hf SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M # Run inference directly in the terminal: llama-cli -hf SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M
Install from WinGet (Windows)
winget install llama.cpp # Start a local OpenAI-compatible server with a web UI: llama-server -hf SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M # Run inference directly in the terminal: llama-cli -hf SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M
Use pre-built binary
# Download pre-built binary from: # https://github.com/ggerganov/llama.cpp/releases # Start a local OpenAI-compatible server with a web UI: ./llama-server -hf SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M # Run inference directly in the terminal: ./llama-cli -hf SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M
Build from source code
git clone https://github.com/ggerganov/llama.cpp.git cd llama.cpp cmake -B build cmake --build build -j --target llama-server llama-cli # Start a local OpenAI-compatible server with a web UI: ./build/bin/llama-server -hf SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M # Run inference directly in the terminal: ./build/bin/llama-cli -hf SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M
Use Docker
docker model run hf.co/SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M
- LM Studio
- Jan
- Ollama
How to use SultanGurbuz/qwen3-embedding-8b-finetuned with Ollama:
ollama run hf.co/SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M
- Unsloth Studio
How to use SultanGurbuz/qwen3-embedding-8b-finetuned with Unsloth Studio:
Install Unsloth Studio (macOS, Linux, WSL)
curl -fsSL https://unsloth.ai/install.sh | sh # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for SultanGurbuz/qwen3-embedding-8b-finetuned to start chatting
Install Unsloth Studio (Windows)
irm https://unsloth.ai/install.ps1 | iex # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for SultanGurbuz/qwen3-embedding-8b-finetuned to start chatting
Using HuggingFace Spaces for Unsloth
# No setup required # Open https://huggingface.co/spaces/unsloth/studio in your browser # Search for SultanGurbuz/qwen3-embedding-8b-finetuned to start chatting
- Pi
How to use SultanGurbuz/qwen3-embedding-8b-finetuned with Pi:
Start the llama.cpp server
# Install llama.cpp: brew install llama.cpp # Start a local OpenAI-compatible server: llama-server -hf SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M
Configure the model in Pi
# Install Pi: npm install -g @mariozechner/pi-coding-agent # Add to ~/.pi/agent/models.json: { "providers": { "llama-cpp": { "baseUrl": "http://localhost:8080/v1", "api": "openai-completions", "apiKey": "none", "models": [ { "id": "SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M" } ] } } }Run Pi
# Start Pi in your project directory: pi
- Hermes Agent new
How to use SultanGurbuz/qwen3-embedding-8b-finetuned with Hermes Agent:
Start the llama.cpp server
# Install llama.cpp: brew install llama.cpp # Start a local OpenAI-compatible server: llama-server -hf SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M
Configure Hermes
# Install Hermes: curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash hermes setup # Point Hermes at the local server: hermes config set model.provider custom hermes config set model.base_url http://127.0.0.1:8080/v1 hermes config set model.default SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M
Run Hermes
hermes
- Atomic Chat new
- Docker Model Runner
How to use SultanGurbuz/qwen3-embedding-8b-finetuned with Docker Model Runner:
docker model run hf.co/SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M
- Lemonade
How to use SultanGurbuz/qwen3-embedding-8b-finetuned with Lemonade:
Pull the model
# Download Lemonade from https://lemonade-server.ai/ lemonade pull SultanGurbuz/qwen3-embedding-8b-finetuned:Q5_K_M
Run and chat with the model
lemonade run user.qwen3-embedding-8b-finetuned-Q5_K_M
List all available models
lemonade list
Qwen3-Embedding-8B Fine-tuned for Turkish Legal Retrieval
Fine-tuned Qwen/Qwen3-Embedding-8B on Turkish legal query-document triplets for dense retrieval in a RAG pipeline. Maps text to 4096-dimensional vectors.
Project Repository: GitHub — CENG493
Download
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("SultanGurbuz/qwen3-embedding-8b-finetuned")
hf download SultanGurbuz/qwen3-embedding-8b-finetuned
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: Qwen/Qwen3-Embedding-8B
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 4096 dimensions
- Similarity Function: Cosine Similarity
- Supported Modality: Text
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'transformer_task': 'feature-extraction', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'last_hidden_state'}}, 'module_output_name': 'token_embeddings', 'architecture': 'Qwen3Model'})
(1): Pooling({'embedding_dimension': 4096, 'pooling_mode': 'lasttoken', 'include_prompt': True})
(2): Normalize({})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("SultanGurbuz/qwen3-embedding-8b-finetuned")
# Run inference
queries = [
'query: Ceza Hukuku / Ceza Muhakemesi + İdare Hukuku / İdari Yargı alanında anayasa hakkında kaynak ne söylüyor?',
]
documents = [
'passage: Ceza Hukuku / Ceza Muhakemesi + İdare Hukuku / İdari Yargı. Vergi ödevinin ihlali durumunda, vergi kaçakçılığı, beyanname vermeme veya eksik beyan gibi durumlar yasal yaptırımlara ve cezai sorumluluğa tabi tutulur. bu yaptırımlar, para cezaları, hapis cezası ve diğer idari yaptırımları içerebilir. Kamu malının ihlali durumunda, izinsiz kullanım, tahrip etme veya zimmete geçirme gibi durumlar yasal yaptırımlara ve cezai sorumluluğa tabi tutulur. Rekabet ihlallerine karşı idari para cezaları, faaliyet durdurma, birleşme ve devralmaların iptali gibi yaptırımlar uygulanabilir. Taksilerin yolcuyu kısa mesafeye götürmeme hakları bulunmamaktadır. uymakla mükellef oldukları trafik kurallarından biri yolcuyu talep ettiği noktaya götürmektir. kısa mesafe yolcu almadığı tespit edilen taksilere idari para cezası uygulanır. İdari para cezası, idari makamlar tarafından yasaya aykırı davranışlar için verilen para cezasıdır ve belirli usullere göre uygulanır. İdari para cezası, kamu düzenini korumak amacıyla idari makamlar tarafından verilen para cezalarıdır. Trafik cezası, trafik kurallarına aykırı davranışlarda bulunan sürücülere veya yayalara uygulanan idari yaptırımdır.',
'passage: Ceza Hukuku / Ceza Muhakemesi + İcra ve İflas Hukuku. Çocuk ceza almaz ancak tutuksuz yargılanabilir. ceza alması durumunu takip etmelisiniz. Çocuğun tutuksuz yargılanması ceza almayacağı anlamına gelmez. durumu takip etmeli ve hukuki danışmanlık almalısınız.',
'passage: 2004 sayılı Kanun\'un 20.02.2019 tarihli ve 7165 sayılı Kanun’un 2 nci maddesi ile değişik ek (1) inci maddesinin birinci fıkrasında 364 üncü maddesindeki parasal sınırın 213 sayılı Vergi Usul Kanununun mükerrer 298 inci maddesine göre her yıl tespit ve ilan edilecek yeniden değerleme oranında artırılması öngörülmüş ve 01.01.2024 tarihinden itibaren bu miktar 378.290,00 TL olarak belirlenmiştir. 2004 sayılı Kanun\'un 20.02.2019 tarihli ve 7165 sayılı Kanun\'un 2 nci maddesi ile değişik ek (1) inci maddesinin ikinci fıkrasına göre aynı Kanun\'un 363 ve 364 üncü maddelerdeki parasal sınırların uygulanmasında hükmün verildiği tarihteki miktar esas alınır. Belirtilmelidir ki bir mahkeme kararının temyiz edilip edilemeyeceği belirlenirken, temyiz hakkının doğduğu (kararın verildiği) tarihteki hukuksal durum esas alınmalı, karar tarihinde yürürlükte bulunan kanun hükmü temyiz sınırı yönünden hangi düzenlemeyi içeriyor ise ona bağlı kalınmalıdır. Buradaki “karar” teriminin, Bölge Adliye Mahkemesinin Özel Daire bozmasına karşı verdiği direnme kararını da kapsayacağında duraksama bulunmamaktadır. 2004 sayılı Kanun\'un 5311 sayılı Kanun’un 25 inci maddesi ile değişik 364 üncü maddesinin ikinci fıkrasında ise temyiz yoluna başvurma ve incelemesinin 1086 sayılı Hukuk Usulü Muhakemeleri Kanunu (1086 sayılı Kanun) hükümlerine göre yapılacağı belirtilmiştir. 6100 sayılı Kanun\'un 447 nci maddesinin ikinci fıkrası "Mevzuatta, yürürlükten kaldırılan 18/6/1927 tarihli ve 1086 sayılı Hukuk Usulü Muhakemeleri Kanununa yapılan yollamalar, Hukuk Muhakemeleri Kanununun bu hükümlerin karşılığını oluşturan maddelerine yapılmış sayılır." hükmünü içermektedir. Somut olayda; alacaklı vekili tarafından 2.000.000,00 TL bedelli bonoya dayalı olarak borçlu aleyhine kambiyo senetlerine özgü haciz yoluyla takip başlatılmış, takip talebinde asıl alacak miktarı 151.122,20 TL gösterilmiştir.',
]
query_embeddings = model.encode_query(queries)
document_embeddings = model.encode_document(documents)
print(query_embeddings.shape, document_embeddings.shape)
# [1, 4096] [3, 4096]
# Get the similarity scores for the embeddings
similarities = model.similarity(query_embeddings, document_embeddings)
print(similarities)
# tensor([[0.5610, 0.8062, 0.1256]])
Training Details
Training Dataset
Unnamed Dataset
- Size: 2,059 training samples
- Columns:
anchor,positive, andnegative - Approximate statistics based on the first 1000 samples:
anchor positive negative type string string string details - min: 16 tokens
- mean: 32.92 tokens
- max: 130 tokens
- min: 26 tokens
- mean: 200.09 tokens
- max: 512 tokens
- min: 27 tokens
- mean: 201.27 tokens
- max: 512 tokens
- Samples:
anchor positive negative query: Hukuk Genel Kurulu 2013/2239 E., 2015/1334 K. sayılı Yargıtay HGK kararında Kamulaştırılan Taşınmazın Tescili uyuşmazlığı bakımından temel değerlendirme nedir?passage: Direnme yoluyla Hukuk Genel Kurulu önüne gelen uyuşmazlık; davalı tarafa, dava tarihi itibariyle kamulaştırma evrakının usulünce tebliğ edilip edilmediği, bunun sonucunda kamulaştırma işleminin adli ve idari yönden kesinleşip kesinleşmediği noktasında toplanmaktadır. İşin esasına geçilmeden önce, yasal düzenlenmenin irdelenmesi gerekmektedir. 11.06.2013 tarihinde yürürlüğe giren 6487 sayılı Kanun'un 22.maddesi ile Kamulaştırma Kanunu'na eklenen Geçici 7.maddede "31.08.1956 tarihli ve 6830 sayılı İstimlak Kanununun 16 ve 17.maddeleri ile 2942 sayılı Kanun'un mülga 16 ve 17.maddeleri uyarınca mahkemelerce idare adına tescil kararı verilen kamulaştırmalarda tebligatlar ve diğer kamulaştırma işlemleri tamamlanmış sayılır. Bu kamulaştırma işlemleri sebebiyle hiçbir hak ve alacak talebinde bulunulamaz, kamulaştırmaya ve bedeline karşı itiraz davaları açılamaz, açılmış ve devam eden davalar bu madde hükmü uygulanarak sonuçlandırılır" hükmü yer almaktadır. Somut olaya gelince; dosyada...passage: II. CEVAP 1. Davalı... vekili cevap dilekçesinde; kök 1290 parsel sayılı taşınmazın Çatalca 1. Asliye Hukuk Mahkemesinin 1985/379 Esas, 1988/183 Karar sayılı kararı ile müvekkili belediye adına tescil edildiğini, davacıların kök murislerinin de içinde bulunduğu hissedarların tebligata elverişli adresleri tespit edilemediğinden ilan yoluyla tebligatın yapıldığını ve kamulaştırma bedelinin bankaya depo edildiğini belirterek davanın reddini savunmuştur. 2. Davalı... vekili cevap dilekçesinde; dava konusu taşınmazın... Belediyesi adına tescil edilmesinden sonra ifraz edildiği ve oluşan 4417 parsel sayılı taşınmazın trampa yolu ile, 4635 parsel sayılı taşınmazın ise satış yolu ile Hazineye devredildiğini, davacıların uzlaşma başvurusunun bulunmadığını, imar planları hazırlanırken konut alanları, okul, hastane, cami gibi kamu alanlarının DOP payları düştükten sonra düzenleme yapıldığını ve İlçe Belediye Başkanlığı'nın teklifi ile Büyükşehir Belediye Başkanlığınca tasdik edildiğini, ...query: Hukuk Genel Kurulu 2024/235 E., 2025/211 K. sayılı Yargıtay HGK kararında Usuli Kazanılmış Hak; Yargıtay Bozma Kararına Uyulması uyuşmazlığı bakımından temel değerlendirme nedir?passage: Aynı ilke Yargıtay Hukuk Genel Kurulunun 24.09.2019 tarihli ve 2015/21-3903 Esas, 2019/920 Karar; 09.05.2019 tarihli ve 2019/19-256 Esas, 2019/537 Karar; 08.06.2021 tarihli ve 2021/(21)10-421 Esas, 2021/695 Karar, 13.09.2023 tarihli ve 2023/9-748 Esas, 2023/816 Karar; 11.12.2024 tarihli ve 2024/7-809 Esas, 2024/665 Karar sayılı kararlarında da benimsenmiştir. 9. Yargıtay içtihatları ile kabul edilen usuli kazanılmış hak olgusunun, birçok hukuk kuralında olduğu gibi yine Yargıtay içtihatları ile geliştirilmiş istisnaları bulunmaktadır. Mahkemenin bozmaya uymasından sonra yeni bir İçtihadı Birleştirme Kararı (09.05.1960 tarihli ve 21/9 sayılı YİBK) ya da geçmişe etkili bir yeni kanun çıkması karşısında, Yargıtay bozma kararına uyulmuş olmakla oluşan usuli kazanılmış hak hukukça değer taşımayacaktır. Benzer şekilde uygulanması gereken bir kanun hükmü, hüküm kesinleşmeden önce Anayasa Mahkemesince iptaline karar verilirse, usuli kazanılmış hakka göre değil Anayasa Mahkemesinin ipt...passage: Hukuk Dairesi kararının da yok hükmünde olduğunu, bağlantılı olarak Asliye Hukuk ve Sulh Hukuk Mahkemelerindeki davalara bakan ve istinaf başvurusunu inceleyen hâkimlerin deolmayan site ve tüzel kişilik adına mevcutmuş gibi düzenlenen sahte belgelere göre karar verdiklerini, sahte vekâletname ve belgelere dayanılarak taşınmazının usulsüz icra takibinde yapılan açık arttırma ile gaspedildiğini, hukuk hâkimlerinin sahte evrak tanzim etmesinin dolandırıcılık suçunu oluşturduğunu, ihbar olunanların hukuka aykırı kararları ve haksız fiilleriyle mağdur edildiğini ileri sürerek 5.800.000,00 TL maddi ve 500.000,00 TL manevi tazminatın davalıdan tahsiline karar verilmesini talep etmiştir. Davalı Cevabı 5. Davalı... vekili cevap dilekçesinde; öncelikle dava süresinde açılmamış ise zamanaşımı nedeniyle reddi gerektiğini, öte yandan 6100 sayılı Hukuk Muhakemeleri Kanunu'nun (6100 sayılı Kanun) 46. maddesindeki sorumluluk koşullarının oluşmadığını ve sorumluluk nedenlerine ilişkin delil g... query: KAYIT 0697 kaydında Eğitim hakkı bakımından olayın özü ve karar sonucu nedir?passage: KAYIT 0697Karar sonucu: İhlal - Loss:
TripletLosswith these parameters:{ "distance_metric": "TripletDistanceMetric.EUCLIDEAN", "triplet_margin": 5 }
Training Hyperparameters
Non-Default Hyperparameters
per_device_train_batch_size: 4gradient_accumulation_steps: 8learning_rate: 2e-05warmup_steps: 154bf16: Truedataloader_num_workers: 2
All Hyperparameters
Click to expand
do_predict: Falseprediction_loss_only: Trueper_device_train_batch_size: 4per_device_eval_batch_size: 8gradient_accumulation_steps: 8eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 2e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 3max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: Nonewarmup_ratio: Nonewarmup_steps: 154log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Trueenable_jit_checkpoint: Falsesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseuse_cpu: Falseseed: 42data_seed: Nonebf16: Truefp16: Falsebf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: -1ddp_backend: Nonedebug: []dataloader_drop_last: Falsedataloader_num_workers: 2dataloader_prefetch_factor: Nonedisable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Nonegroup_by_length: Falselength_column_name: lengthproject: huggingfacetrackio_space_id: trackioddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Truepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_for_metrics: []eval_do_concat_batches: Trueauto_find_batch_size: Falsefull_determinism: Falseddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_num_input_tokens_seen: noneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Trueuse_cache: Falseprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: proportionalrouter_mapping: {}learning_rate_mapping: {}
Training Logs
| Epoch | Step | Training Loss |
|---|---|---|
| 0.0777 | 5 | 4.8428 |
| 0.1553 | 10 | 4.8583 |
| 0.2330 | 15 | 4.8371 |
| 0.3107 | 20 | 4.8337 |
| 0.3883 | 25 | 4.8461 |
| 0.4660 | 30 | 4.8520 |
| 0.5437 | 35 | 4.8397 |
| 0.6214 | 40 | 4.8498 |
| 0.6990 | 45 | 4.8290 |
| 0.7767 | 50 | 4.8293 |
| 0.8544 | 55 | 4.8232 |
| 0.9320 | 60 | 4.8232 |
| 1.0 | 65 | 4.7905 |
| 1.0777 | 70 | 4.7950 |
| 1.1553 | 75 | 4.7903 |
| 1.2330 | 80 | 4.7450 |
| 1.3107 | 85 | 4.7696 |
| 1.3883 | 90 | 4.7384 |
| 1.4660 | 95 | 4.7590 |
| 1.5437 | 100 | 4.6902 |
| 1.6214 | 105 | 4.7016 |
| 1.6990 | 110 | 4.6925 |
| 1.7767 | 115 | 4.6494 |
| 1.8544 | 120 | 4.6033 |
| 1.9320 | 125 | 4.6028 |
| 2.0 | 130 | 4.5631 |
| 2.0777 | 135 | 4.5776 |
| 2.1553 | 140 | 4.4901 |
| 2.2330 | 145 | 4.4602 |
| 2.3107 | 150 | 4.5139 |
| 2.3883 | 155 | 4.4308 |
| 2.4660 | 160 | 4.4107 |
| 2.5437 | 165 | 4.5098 |
| 2.6214 | 170 | 4.3792 |
| 2.6990 | 175 | 4.4424 |
| 2.7767 | 180 | 4.3550 |
| 2.8544 | 185 | 4.4014 |
| 2.9320 | 190 | 4.3870 |
| 3.0 | 195 | 4.4554 |
Training Time
- Training: 36.2 minutes
Framework Versions
- Python: 3.12.13
- Sentence Transformers: 5.4.1
- Transformers: 5.0.0
- PyTorch: 2.10.0+cu128
- Accelerate: 1.13.0
- Datasets: 4.0.0
- Tokenizers: 0.22.2
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
TripletLoss
@misc{hermans2017defense,
title={In Defense of the Triplet Loss for Person Re-Identification},
author={Alexander Hermans and Lucas Beyer and Bastian Leibe},
year={2017},
eprint={1703.07737},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
- Downloads last month
- 358