Sentence Similarity
sentence-transformers
Safetensors
roberta
feature-extraction
Generated from Trainer
dataset_size:17552
loss:MultipleNegativesRankingLoss
Eval Results (legacy)
text-embeddings-inference
Instructions to use hyunkookim/klue-roberta-base-klue-sts-mrc with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use hyunkookim/klue-roberta-base-klue-sts-mrc with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("hyunkookim/klue-roberta-base-klue-sts-mrc") sentences = [ "일본 소니가 개발한 전지의 kg당 에너지 밀도는?", "과학적 방법\n \n과학적 방법은 연역과 귀납에 의해 사실을 밝히는 방법론이다. 연역은 사실로 여겨지는 기존의 전제에서 새로운 결론을 논리적으로 유도하고 귀납은 관찰되는 현상에서 일반화된 결론을 이끌어낸다. 이 두 방법은 모두 완전하지 않다. 연역은 전제가 사실이 아니었을 때 필연적으로 결론 역시 잘못되게 되며, 귀납은 새로운 사실이 관찰되었을 때 결론이 붕괴될 수 있다. \"백조는 모두 희다\"는 주장은 검은 백조의 발견으로 붕괴된다. 새로운 사실에 의해 기존의 귀납적 추론이 붕괴되는 것은 흑고니 이론으로 알려져 있으며 과학뿐만아니라 경제, 사회, 철학 등 여러 학문 분야에서 쓰이고 있다.\n\n과학의 역사에서 많은 과학자들은 흑고니와 같이 기존의 설명에 반하는 것을 발견하였을 때 이를 무시하는 경향을 보였다192–94 기존의 과학적 설명은 확증 편향으로서 작용한다. 새로운 발견이 기존의 설명에 들어맞으면 보다 쉽게 수용되지만 그렇지 않은 것은 무시되거나 잘못된 관찰이라는 평가를 받기 쉽다 20세기 초 하버드 대학교의 세실리아 페인은 태양의 스펙트럼을 분석하여 태양을 이루는 물질의 대다수가 수소와 헬륨이라는 사실을 관찰하였다. 그러나 당시 보수적이며 남성중심적이었던 천문학계는 페인의 관찰을 받아드리지 못했다. 페인은 이와 관련한 논문을 발표하면서 지도교수 헨리 노리스 러셀의 강권에 못이겨 논문 말미에 \"이는 사실이 아닐 것\"이라고 써 넣을 수 밖에 없었다. 당시 천문학계는 태양이 대부분 철로 이루어져 있다고 믿고 있었다. 과학자들이 기존의 이론을 고수하려는 확증 편향을 보이기 쉽다고 하더라도 새로운 결과를 지지하는 관찰과 실험이 계속되면 결국 기존의 이론은 폐기되고 새로운 이론이 세워지게 된다 그러나 이러한 변환은 그리 순탄하지 많은 않다. 토머스 쿤은 《과학혁명의 구조》에서 과학 이론의 변화를 대립, 경쟁하는 패러다임의 변환으로 파악한 바 있다. \n\n과학적 발견은 때로 사회가 갖는 확증 편향과 대립하기도 한다. 찰스 다윈의 《종의 기원》은 당시 영국 사회의 일반적 신념인 기독교의 창조론에 반한다는 이유로 큰 논란을 일으켰다. 과학은 종교와 전혀 다른 범주이지만 오늘날에도 일부 근본주의 기독교 신자들은 창조론을 옹호하기 위해 진화 이론을 거부한다.", "리튬이온전지는 1990년 일본 소니가 개발했다. 충전과 재사용이 가능한 2차전지 가운데 에너지 밀도가 높은 편이고 기억 효과가 없어 널리 퍼져나갔다. 지금은 스마트폰과 태블릿을 비롯해 전기자동차에까지 쓰이고 있다. 하지만 다가오는 미래에 대응하기엔 리튬이온전지는 에너지가 턱없이 부족한 편이다. 이런 상황에서 지난달 24일 한국전기연구원은 세계 최고 수준의 에너지 밀도를 가지면서도 리튬전지 대비 10분의 1의 가격에 제조할 수 있는 아연공기전지를 개발해 주목받고 있다. 아연공기전지 개발의 주역인 엄승욱 한국전기연구원 전지연구센터 책임연구원은 지난 7일 “아연공기전지는 폭발 위험이 없으면서 납축전지의 다섯 배, 리튬전지의 두 배에 달하는 에너지를 저장할 수 있어 차세대 전지로 각광받고 있다”고 말했다.○세계 최고 에너지 밀도 아연공기전지는 말 그대로 아연과 공기중의 산소를 재료로 쓰는 전지다. 엄 책임연구원은 “전지의 음극재로 아연 파우더를 쓰고 양극재로 산소를 사용해 전기를 발생시키는 구조”라고 설명했다. 아연이 지구상에서 23번째로 흔한 금속이다 보니 희토류에 속하는 리튬보다 생산 단가가 싸다. 아연은 국내에서 고려아연 영풍 같은 업체들이 아연광석을 들여와 제련하고 있지만 리튬은 전량 수입에 의존하고 있기 때문이다. 또 리튬이온전지는 열을 받으면 폭발할 위험이 크지만 아연을 쓰면 이런 위험이 없어진다. 그는 “이번 연구 자체가 국방과학연구소에서 군에서 안전하게 쓸 수 있는 전지를 만들어 달라는 의뢰를 받아 시작하게 된 것”이라며 “아연공기전지는 전장에서 총알을 맞아도 터지지 않을 정도로 안전하다”고 말했다. 전기연구원에서 개발한 아연공기전지는 ㎏당 395Wh로 세계 최고 수준의 에너지 밀도를 갖고 있기 때문에 전장에서도 오랫동안 쓸 수 있다. 리튬이온전지의 에너지 밀도는 ㎏당 200Wh 정도다. 그는 “통신 장비뿐 아니라 무인항공기, 미래 병사용 입는 장비 등에 쓸 수 있다”고 내다봤다.○2차전지·간이 발전소로 발전아연공기전지의 한 가지 부족한 점은 충전이 안 된다는 것이다. 엄 연구원은 “지금으로선 아연을 다 소모하고 나면 이를 갈아끼우는 방법밖에 없다”고 말했다. 하지만 “근본적으로 충전이 안 되는 것은 아니다”고 덧붙였다. 지금은 기술적인 장벽을 넘지 못해 충전을 못하고 있지만 언젠가는 리튬이온전지처럼 자유자재로 충전하는 2차 전지로 발전할 것이란 얘기다.", "본래 ‘호자주의’는 엔베르 호자 스스로가 자신의 사상에 대해 명명한 명칭이 아니며, 단지 알바니아를 외부자의 시점으로 관찰한 서구(주로 프랑스) 지식인 및 언론인들이 사용했던 용어이다. 엔베르 호자는 스스로의 사상을 단순히 마르크스-레닌주의의 원칙 고수일 뿐이라고 하였다. 이러한 원칙은 수정주의를 받아들인 중국공산당과 대립하기 전에 알바니아 내에서 윤곽이 잡혀져 있었다. 엔베르 호자가 스스로를 마오이스트라고 칭하지는 않은 것과 무관하게 호자주의는 1960년대 중화인민공화국의 문화대혁명에 영향을 받은 것이었으며, 이론적으로는 마오쩌둥 사상과 흡사했다. 1978년 이후 엔베르 호자는 마오쩌둥 사상을 강하게 비판하였고, 그 결과 호자 사상과 마오쩌둥 사상 사이의 차이점을 구분하는 것이 비교적 쉬워졌다. 그러나 그 차이점은 아주 세밀한 부분에서의 차이점이기 때문에 마르크스주의자들이 상당히 다루기 어려운 부분이라고 여겨지고 있다. 호자의 사상은 이러한 특징 외에도 기술주의(技術主義)에 대한 반대·극단적인 무신론·알바니아 민족주의·엄격한 금욕주의(禁慾主義)·지속적인 문화 혁명 강행이라는 요소도 존재하였다.\n\n호자주의는 이오시프 스탈린, 그리고 스탈린 지배 아래 있는 소련이라는 국가 개념을 엄격하게 고수하는 태도를 보이며, 1956년 이후 급격히 수정주의의 길로 접어든 소련과 그 영향권 아래에 있는 공산주의 단체를 모두 \"수정주의적 마르크스주의\"로 강렬히 비판한다." ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
| { | |
| "added_tokens_decoder": { | |
| "0": { | |
| "content": "[CLS]", | |
| "lstrip": false, | |
| "normalized": false, | |
| "rstrip": false, | |
| "single_word": false, | |
| "special": true | |
| }, | |
| "1": { | |
| "content": "[PAD]", | |
| "lstrip": false, | |
| "normalized": false, | |
| "rstrip": false, | |
| "single_word": false, | |
| "special": true | |
| }, | |
| "2": { | |
| "content": "[SEP]", | |
| "lstrip": false, | |
| "normalized": false, | |
| "rstrip": false, | |
| "single_word": false, | |
| "special": true | |
| }, | |
| "3": { | |
| "content": "[UNK]", | |
| "lstrip": false, | |
| "normalized": false, | |
| "rstrip": false, | |
| "single_word": false, | |
| "special": true | |
| }, | |
| "4": { | |
| "content": "[MASK]", | |
| "lstrip": false, | |
| "normalized": false, | |
| "rstrip": false, | |
| "single_word": false, | |
| "special": true | |
| } | |
| }, | |
| "bos_token": "[CLS]", | |
| "clean_up_tokenization_spaces": true, | |
| "cls_token": "[CLS]", | |
| "do_basic_tokenize": true, | |
| "do_lower_case": false, | |
| "eos_token": "[SEP]", | |
| "mask_token": "[MASK]", | |
| "max_length": 512, | |
| "model_max_length": 512, | |
| "never_split": null, | |
| "pad_to_multiple_of": null, | |
| "pad_token": "[PAD]", | |
| "pad_token_type_id": 0, | |
| "padding_side": "right", | |
| "sep_token": "[SEP]", | |
| "stride": 0, | |
| "strip_accents": null, | |
| "tokenize_chinese_chars": true, | |
| "tokenizer_class": "BertTokenizer", | |
| "truncation_side": "right", | |
| "truncation_strategy": "longest_first", | |
| "unk_token": "[UNK]" | |
| } | |