Hugging Face's logo Hugging Face
  • Models
  • Datasets
  • Spaces
  • Buckets new
  • Docs
  • Enterprise
  • Pricing
    • Website
      • Tasks
      • HuggingChat
      • Collections
      • Languages
      • Organizations
    • Community
      • Blog
      • Posts
      • Daily Papers
      • Learn
      • Discord
      • Forum
      • GitHub
    • Solutions
      • Team & Enterprise
      • Hugging Face PRO
      • Enterprise Support
      • Inference Providers
      • Inference Endpoints
      • Storage Buckets

  • Log In
  • Sign Up

anhtk
/
bge-m3-vietnamese-psychology

Sentence Similarity
sentence-transformers
Safetensors
xlm-roberta
feature-extraction
Generated from Trainer
dataset_size:39075
loss:TripletLoss
text-embeddings-inference
Model card Files Files and versions
xet
Community

Instructions to use anhtk/bge-m3-vietnamese-psychology with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

  • Libraries
  • sentence-transformers

    How to use anhtk/bge-m3-vietnamese-psychology with sentence-transformers:

    from sentence_transformers import SentenceTransformer
    
    model = SentenceTransformer("anhtk/bge-m3-vietnamese-psychology")
    
    sentences = [
        "Con trai bực tức khóa trái cửa chơi điện thoại, xảy ra xung đột lớn, sau đó phải làm sao?",
        "Nữ 20 tuổi, gần hai năm nay luôn dùng bạo lực để giải tỏa cảm xúc?. Mỗi khi có xung đột với bố mẹ và em gái, tôi thường trốn vào góc khóc, tự tát vào mặt mình hoặc đập đầu vào tường. Tôi ghét mẹ và sợ mình sẽ trở thành người phụ nữ giống bà. Tôi từng cầm dao định cắt cổ tay nhưng sợ đau nên không dám. Từ khóa liên quan: gia đình, sang chấn gia đình, quan hệ gia đình, giao tiếp với cha mẹ",
        "Tại sao tôi luôn cảm thấy lo lắng khi phải thừa nhận mình 'đang bận' và không thể giúp đỡ đồng nghiệp ngay lập tức?. Tôi sợ mọi người sẽ nghĩ tôi ích kỷ hoặc không có tinh thần đồng đội. Nỗi sợ này khiến tôi luôn gác việc của mình lại để làm hộ người khác và thường xuyên phải tăng ca. Từ khóa liên quan: người luôn làm hài lòng (people pleaser), ranh giới công việc, lo âu, sự nghiệp",
        "Làm thế nào để xử lý mâu thuẫn khi mẹ tôi liên tục can thiệp vào việc nuôi dạy con cái của tôi?. Con trai tôi mười hai tuổi, học lớp năm, gần đây cứ nói không muốn đi học, tôi phải làm sao đây. Từ khóa liên quan: nuôi dạy con cái, mâu thuẫn xung đột xung đột xung đột xung đột thế hệ, ranh giới gia đình, giao tiếp"
    ]
    embeddings = model.encode(sentences)
    
    similarities = model.similarity(embeddings, embeddings)
    print(similarities.shape)
    # [4, 4]
  • Notebooks
  • Google Colab
  • Kaggle
bge-m3-vietnamese-psychology
2.29 GB
Ctrl+K
Ctrl+K
  • 1 contributor
History: 2 commits
anhtk's picture
anhtk
v2: lr=1e-6, 1epoch, triplet loss, anti-forgetting
2171f08 verified about 1 month ago
  • 1_Pooling
    v2: lr=1e-6, 1epoch, triplet loss, anti-forgetting about 1 month ago
  • .gitattributes
    1.57 kB
    v2: lr=1e-6, 1epoch, triplet loss, anti-forgetting about 1 month ago
  • README.md
    26.8 kB
    v2: lr=1e-6, 1epoch, triplet loss, anti-forgetting about 1 month ago
  • config.json
    743 Bytes
    v2: lr=1e-6, 1epoch, triplet loss, anti-forgetting about 1 month ago
  • config_sentence_transformers.json
    283 Bytes
    v2: lr=1e-6, 1epoch, triplet loss, anti-forgetting about 1 month ago
  • model.safetensors
    2.27 GB
    xet
    v2: lr=1e-6, 1epoch, triplet loss, anti-forgetting about 1 month ago
  • modules.json
    429 Bytes
    v2: lr=1e-6, 1epoch, triplet loss, anti-forgetting about 1 month ago
  • sentence_bert_config.json
    241 Bytes
    v2: lr=1e-6, 1epoch, triplet loss, anti-forgetting about 1 month ago
  • tokenizer.json
    16.8 MB
    xet
    v2: lr=1e-6, 1epoch, triplet loss, anti-forgetting about 1 month ago
  • tokenizer_config.json
    380 Bytes
    v2: lr=1e-6, 1epoch, triplet loss, anti-forgetting about 1 month ago