Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper • 1908.10084 • Published • 14
How to use jungmookkim/klue-roberta-base-klue-sts-mrc with sentence-transformers:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("jungmookkim/klue-roberta-base-klue-sts-mrc")
sentences = [
"티몬을 넘어선 회사의 최고경영자는?",
"“모든 개통이 중단된 상태입니다. 현재도 방송통신위원회가 들이닥친다고 해 매장에서 도망나와 문자 드리는 겁니다. 신청하신 분들께 정말 고개 숙여 사죄드립니다.”지난 2일 서울 왕십리의 한 휴대폰 판매점에서 아이폰6 16GB 제품을 산 김선정 씨(가명)는 3일 오전 황당한 휴대폰 문자를 받았다. 전날 구입한 아이폰6 개통이 취소됐다는 판매점의 문자였다. 출고가 78만9800원의 고가 제품을 18만원에 구입했다는 사실에 기뻤던 것은 하루뿐이었다. 추위에 떨며 판매점 앞에서 밤을 새워 줄을 섰던 것이 분통이 터졌다.2일 새벽 벌어진 ‘아이폰6 대란’에 방통위가 강력 제재 의사를 밝히자 보조금 상한(최대 34만5000원)보다 더 싸게 아이폰6를 팔았던 판매점들이 급히 개통 취소·기기 회수에 나섰다. 전날 싼값에 아이폰 신제품을 구했다며 웃었던 소비자들은 분통을 터뜨렸다. 아이폰6 시판 이후 일요일엔 ‘판매 대란’, 월요일엔 ‘회수 대란’이 잇따라 벌어진 것이다. 모두 단말기유통구조개선법(단통법) 탓이다.○새벽까지 줄 서 산 아이폰6 ‘반납’소비자가 합법적으로 살 수 있는 아이폰6 16GB 모델의 최저가는 50만2300원이다. 출고가에 현재 통신사들이 책정한 최대 보조금(대리점 재량 보조금 포함) 28만7500원을 뺀 값이다. 지난 1일 저녁과 2일 새벽, 이 제품을 10만~20만원대에 살 수 있다는 정보가 여러 인터넷 커뮤니티에 올라왔다. 불법 보조금을 추가한 것이다. 소비자들은 싼값에 판다는 ‘좌표(판매점 장소)’를 공유하고 밤 늦게 집을 나섰다.이른 새벽에 판매점 앞에 긴 줄이 생기는 등 소동이 벌어졌다. 방통위는 2일 오후 3시 SK텔레콤 KT LG유플러스 등 통신 3사 임원을 긴급 호출해 강력 경고했다. 현장에는 시장조사관을 급파해 보조금 지급 방식·규모 등을 파악하기로 했다. 상황이 심상찮게 돌아가자 해당 판매점들은 이미 아이폰6 16GB 모델을 구입한 소비자들에게 취소 요청 문자를 보냈다. 예약 신청만 해 아직 휴대폰을 받지 못한 사람에게는 ‘개통 취소’, 현장에서 휴대폰을 직접 구입해 가져간 사람에게는 ‘기기 회수’를 요구하고 있다. 김씨도 이 문자를 받은 소비자 중 한 명이다.○“불법보조금, 이번뿐 아냐”소비자는 억울하게 됐다. 불법을 저지른 주체는 판매점 측이지 소비자가 아니다. 자영업자 법률상담 전문가인 이강진 변호사는 “소송을 걸면 소비자가 유리하지만 판매점 측에 충분한 자금이 없어 소비자가 이겨도 보상받을 수 없다는 게 문제”라고 말했다.한 판매점주는 단통법 이후 불법 보조금 사태가 이번이 처음이 아니라고 했다. 그는 “단통법 시행 이후 똑같은 사건이 있었지만 당시에는 믿을 만한 사람들끼리만 알고 정보를 공유했다”며 “아이폰6 판매 경쟁이 치열해 표면화됐을 뿐”이라고 말했다. 통신 3사의 경쟁 과열과 함께 애플의 ‘끼워팔기’ 정책도 이번 대란을 부추겼다는 지적이다. 비인기 모델을 일정량 이상 팔지 않으면 다른 모델을 공급하지 않는 계약이다. 국내 통신사와 맺은 이 계약 때문에 인기 모델인 64GB 물량을 받기 위해 16GB 기기를 무리하게 팔려다 이번 대란이 빚어졌다는 것이다. 방통위 통신시장조사과에서는 향후 1~2주간 물의를 일으킨 판매점을 조사하고 이후 한 달여간 전수조사에 착수할 계획이다.휴대폰 판매 경쟁은 대리점과 판매점의 생존 본능에서 비롯되는 것이다. 단통법은 이 본질적인 경쟁의 생리를 억눌러 ‘불법’이란 낙인을 찍었다. 시장이 정상적으로 돌아갈 리가 없다. 제값 다 주고 물건을 산 소비자가 하루 만에 ‘호갱(호구 고객)’이 되는가 하면 싼값에 산 소비자가 구매 취소를 당하기도 한다. 시장의 가격경쟁을 정면으로 무시한 단통법 탓에 애먼 소비자만 피해를 입게 됐다. 김보영/김순신 기자 wing@hankyung.com 어제 아이폰 대란으로 왕십리가 이슈화되어 네이버 메인페이지에 몇시간동안 사진이 올라와 있고 뉴스도 나왔다고 합니다 .개통처에서는 상태를 심각하게 생각하여 모든 개통이 중단된 상태입니다. 현재도 방통위가 들이닥친다고 하여 매장에서 도망나와 어제 문자 저장되어 있는 분들께만 우선 문자 드리는것입니다.",
"“이길 수 없어 아예 사들이기로 했습니다.”에릭 레프코프스키 그루폰 대표(CEO·사진)가 밝힌 한국 소셜커머스 업체 티켓몬스터(티몬) 인수 이유다. 레프코프스키 대표는 12일 코엑스 컨퍼런스룸에서 기자회견을 열고 “그루폰이 세계1위이지만 그루폰코리아로는 기존 한국 업체들을 넘어설 수 없었다”고 설명했다. 그는 이번 딜에 ‘적을 이길 수 없다면 동지가 돼라’는 미국 속담을 활용했다고 전했다. 그루폰은 지난 8일 2억6000만달러에 티몬을 인수한다고 발표했다.그루폰의 공동창업자인 레프코프스키 대표는 “인수가 최종 확정되면 투자를 확대해 티몬이 한국 1위의 전자상거래 기업이 될 수 있도록 적극 지원하겠다”며 “티몬은 그루폰의 해외 사업장 중 가장 비중있는 곳이 될 것”이라고 말했다. 현재 그루폰은 미국 본사를 비롯 전 세계 48개국에서 소셜커머스 업체를 운영하고 있다.그루폰은 티몬 인수를 시작으로 아시아 시장을 적극 공략할 방침이다. 레프코프스키 대표는 “한국은 전자상거래 시장 규모가 세계에서 네 번째로 큰 시장”이라며 “한국을 아시아 시장 공략의 전초 기지로 삼겠다”고 말했다. 현재 그루폰은 티몬과 함께 다른 아시아 국가의 소셜커머스 업체를 인수하기 위해 대상을 물색하고 있다.레프코프스키 대표는 소셜커머스 업계의 미래 먹거리로 ‘모바일’을 꼽았다. 누구나 스마트폰을 사용하게 되면서 언제 어디서나 구매할 수 있는 모바일 플랫폼이 중요해졌다는 것. 그는 “지난 3분기에만 900만명의 고객들이 그루폰 모바일 애플리케이션을 내려받았다”며 “현재 그루폰 전체 매출의 54%가량이 모바일에서 나오고 있다”고 설명했다. 이어 “티몬도 50% 이상의 매출이 모바일 시장에서 발생하고 있다”며 “함께 시너지를 내기 좋은 구조”라고 덧붙였다.미국 회사들의 3분기 실적 발표 이후 제기된 ‘소셜커머스 위기론’에 대해서는 동의할 수 없다고 밝혔다. 올 3분기에는 전 세계 1위 업체인 그루폰이 순손실을 기록하고 2위 업체인 미국 리빙소셜이 영업손실을 기록하면서 위기론이 나왔었다.레프코프스키 대표는 “그루폰의 재무상황은 건전하다”며 “현재 그루폰은 부채없이 11억달러의 현금을 보유하고 있고, 에비타지수(EBITDA·상각 전 영업이익 대비 기업가치)는 3억달러에 달한다”고 말했다. 또 그는 “소비자들의 만족도가 매우 높기 때문에 지속적으로 성장할 것으로 전망한다”고 덧붙였다. 미국 시장조사업체 ‘포어시(foresee)’에 따르면 그루폰의 소비자 만족도는 85%로 아마존, 페이스북, 구글보다 높았고, 판매자의 75%도 그루폰에 만족하는 것으로 나타났다. 그는 다만 “둔화되고 있는 성장률은 걱정”이라고 말했다. 사업 초기 매년 100% 가까이 성장하던 그루폰의 매출 성장률은 최근 10% 수준으로 급감했다.",
"소프라노 홍혜경(56)은 한국이 낳은 세계적인 ‘디바’다. 그는 전속 가수 없이 1년마다 모든 가수가 재계약을 해야 하는 미국 뉴욕 메트로폴리탄 오페라극장(메트)에서 31년째 활동 중이다. 메트는 성악가들에게 ‘꿈의 무대’로 불리는 세계 최정상급 오페라극장이다.홍혜경이 10년 만에 국내 오페라 무대에 선다. 다음달 8~10일 서울 서초동 예술의전당 오페라극장 무대에 오르는 모차르트의 오페라 ‘피가로의 결혼’에서 백작부인 로지나 역을 맡는다. 그가 국내 전막 오페라 무대에 출연하는 것은 2005년 푸치니의 오페라 ‘라보엠’에 이어 두 번째다.공연에 앞서 21일 서울 세종로에서 만난 그는 “‘피가로의 결혼’ 무대에 오른다는 것은 굉장히 맛있는 음식을 씹어보는 느낌”이라며 “제가 느낀 감동을 국내 관객에게 전달하고 싶다”고 말했다.홍혜경은 이번 무대를 제작하는 무악오페라단으로부터 출연 요청을 받자마자 주저 없이 이 작품을 골랐다. 그는 “모차르트 오페라 중에서 ‘피가로의 결혼’과 ‘돈 지오반니’는 특별히 사랑하는 작품”이라고 설명했다. 그는 “‘라보엠’ 같은 비극보다 희극이 더 어렵기 마련이지만 모차르트 오페라는 신기하게도 대본의 내용만 완전히 소화하면 쉽게 연기할 수 있다”고 말했다. 모차르트와 대본 작가 로렌초 다 폰테가 환상적 궁합을 이뤘다는 설명이다. 그는 “더 보탤 것도, 뺄 것도 없이 완전히 그 인물이 되면 된다”며 “기가 막히게 완벽한 작품”이라고 덧붙였다.2012~2013 시즌에도 메트에서 같은 작품을 공연했다. 이번과 마찬가지로 로지나 역을 맡았다. 전편에 해당하는 로시니의 ‘세비야의 이발사’에서 로지나는 알마비바 백작과 결혼해 신분이 상승했지만 이 작품에서는 바람둥이 남편에게 실망해 애정이 식은 상태다. 홍혜경은 “젊을 때 사랑에 빠져 신분을 뛰어넘는 결혼을 하고,남편에게 배반당하기도 하는 등 감정선이 굉장히 복잡한 것이 매력”이라며 “여러 가지 모습으로 연기할 수 있는, 재미있고 현실적 인물”이라고 말했다. 이번 공연에서는 젊고 열정적인 느낌을 강조할 계획이다. “사랑하는 이의 아이를 둘 낳은 활력으로 가득 찬 로지나를 연기할 거예요. 살면서 경험한 모든 감정을 끌어낼 겁니다.”홍혜경은 자신에게 맞는 역을 엄격하게 고르는 성악가다. 레퍼토리를 잘못 고르면 목이 망가진다는 것이 그의 지론이다. ‘나비부인’의 초초상 역을 한 번도 맡지 않았던 이유다. 초초상은 고음역대의 고난도 아리아를 자주 불러야 하는 배역이다. 그는 내년 보스턴심포니오케스트라와 함께 이 작품을 공연할 예정이다. 초초상을 해보지 않고 성악가 생활을 마무리하면 후회할 것 같아서다. 그는 “초초상 역에 어울리지 않는다는 것을 알고 있다”며 “내년에 시도해보고, 정말 맞지 않는지 확인해볼 것”이라고 말했다.그는 언젠가 국립오페라단을 맡고 싶다는 소망도 내비쳤다. 홍혜경은 지난해 단장직을 제안받았으나 고사했다. “오페라단을 제대로 하려면 한국에 살아야 하는데 당장은 여기서 살 수가 없거든요. 앞으로 해야 한다는 것은 확실하지만 시기적으로 지금은 아니에요.”"
]
embeddings = model.encode(sentences)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [4, 4]This is a sentence-transformers model finetuned from shangrilar/klue-roberta-base-klue-sts. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False, 'architecture': 'RobertaModel'})
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'아이폰5의 화면 크기는?',
'2011년 10월 애플 창업자 스티브 잡스가 세상을 떠났을 때 ‘잡스 후광’ 얘기가 나왔다. 후계자가 잘하든 못하든 잡스 영향력이 워낙 커서 애플이 한두 해는 잘 굴러갈 것이란 얘기였다. 실제로 애플은 작년 가을까지 1년 동안은 잘하는 듯했다. 주가도 천정부지로 치솟았다. 그러나 겨울로 접어들면서 분위기가 달라졌다. 잡스의 마술이 끝났다느니, 혁신이 멈췄다는 얘기가 나오기 시작했다.팀 쿡은 최고경영자(CEO)로 취임한 이후 깜짝 놀랄 만한 것을 보여주지 못했다. 쿡의 첫 번째 아이폰은 작년 가을에 내놓은 아이폰5라고 할 수 있다. 이 폰은 4인치로 화면이 커졌는데도 더 가벼워지고 더 얇아졌다. 디자인 측면에서는 혁신적이었다. 그러나 디자인 말고는 깜짝 놀랄 만한 게 없었다. 특히 구글지도를 대체한 애플지도가 문제가 됐다. 허겁지겁 탑재했던지 엉터리였다. 길이 구겨지고 다리가 끊기는 등 전혀 애플답지 않았다.시장을 선도하는 ‘카테고리 리더’로서 위상도 약해졌다. 애플은 어느 순간부터 삼성을 따라하기 시작했다. 삼성이 4인치, 5인치대의 큰 화면 갤럭시폰으로 인기를 끌자 3.5인치 아이폰 화면을 4인치로 키웠다. 아이패드도 마찬가지. 잡스는 생전에 7인치대 삼성 갤럭시탭에 대해 “D.O.A.(나오자마자 사망)”라고 악담을 했지만 그가 세상을 떠난 지 1년 후 애플은 7인치대 아이패드 미니를 내놓았다.따지고 보면 ‘애플의 혁신’은 ‘잡스의 마술’이었다. 잡스는 강력한 카리스마로 조직을 이끌었고 소비자 입장에서 디테일을 꼼꼼하게 챙겼다. 아이팟으로 음악시장을 혁신할 때 음반사업자들을 설득한 것도 잡스였고, 아이폰을 내놓기 전에 미국 이동통신사 AT&T를 설득한 것도 잡스였다. 반면 쿡은 세계 최대(가입자 7억명) 이동통신사인 차이나모바일을 설득하지 못해 중국 시장에서 고전하고 있다.경쟁사들이 이젠 할 만큼 한다는 점도 애플한테는 위협 요소다. 애플은 삼성이 특허를 침해했다며 핵전쟁급 소송을 벌였지만 실리도 챙기지 못한 채 삼성 위상만 높여줬다. 삼성은 스마트폰 1위 업체로 올라섰다. 작년 4분기엔 애플이 아이폰을 4780만대 판매한 반면 삼성은 스마트폰을 6000만대 이상(추정치) 팔았다. 태블릿 시장에서도 애플 독무대가 흔들리고 있다. 아이패드는 2010년 4월 발매 후 2~3년 동안 시장을 독점하다시피 했다. 경쟁사들이 수백 종의 태블릿 제품을 내놓고 덤볐지만 모두 참패했다. 그러나 작년 하반기부터 달라지고 있다. 넥서스7, 갤럭시노트10.1 등이 호평을 받고 있다. 올해는 안드로이드 진영의 공세가 더욱 거세지고 윈도 진영도 가세할 것으로 예상된다.애플이 애플TV로 혁신을 이어갈 것이란 얘기도 있다. 잡스가 애플TV에 대해 ‘취미’라고 말하면서도 말년에 심혈을 기울였고 쿡도 “큰 관심을 가지고 있다”고 말했으니 연말께 혁신적인 애플TV가 나올 가능성은 있다. 그러나 TV 시장은 삼성 LG 등이 이미 장악하고 있고 국가마다 케이블 사업자, 콘텐츠 사업자들과 협상해야 해 스마트폰과 달리 단숨에 세계 시장을 장악하긴 어렵다.',
'애니메이션 전문 채널 애니원, 애니박스(대표: 곽영빈)이 오는 크리스마스를 맞아 크리스마스 이브(목)와 당일(금) 양일간 크리스마스 특집 방송을 방영한다. 다가오는 이번 크리스마스는 여느 때와는 달리 외출을 자제하면서 가족들과 안전하게 보내야 할 시기이다. 집에서 따뜻한 크리스마스 분위기를 즐길 수 있도록 애니박스, 애니원에서 크리스마스특집 방송을 준비했다. [애니원] ▷ 12월 24일(목) – 극장판 짱구는 못말려, 안녕 자두야3 등 방영 ▷ 12월 25일(금) – 극장판 도라에몽, 신 도라에몽 스페셜2기 등 방영 [애니박스] ▷ 12월 24일(목) – 극장판 뽀로로, 밍꼬발랄 프렌즈 등 방영 ▷ 12월 25일(금) – 뽀로로 동화나라, 라바 인 뉴욕, 라바 아일랜드 등 방영 애니원 채널에서는 ‘크리스마스 홈파티’ 컨셉으로 12월 24일(목) 11시부터 극장판 짱구는 못말려와 안녕 자두야3가 방영되고 크리스마스 당일인 12월 25일(금)에는 신작인 극장판 도라에몽-진구와 구름왕국과 신 도라에몽 시리즈를 오전 8시부터 만나볼 수 있다. 한편, 애니박스 채널에서는 ‘Merry 애니박스’ 컨셉으로 12월 24일(목) 오전 8시부터 극장판 뽀로로와 신작인 밍꼬발랄 프렌즈가 방영되고 크리스마스 당일, 12월 25일(금)에는 신작인 뽀로로 동화나라를 오전 8시에 첫 공개할 예정이다. 그 뿐만 아니라, 라바 시리즈와 극장판 짱구는 못말려까지 연속으로 만나볼 수 있다.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[1.0000, 0.6753, 0.0320],
# [0.6753, 1.0000, 0.0451],
# [0.0320, 0.0451, 1.0000]])
sentence_0 and sentence_1| sentence_0 | sentence_1 | |
|---|---|---|
| type | string | string |
| details |
|
|
| sentence_0 | sentence_1 |
|---|---|
현재의 경기 상황을 나타내는 지표는 전월에 비해 몇 포인트 상승하였는가? |
수출 부진이 이어지면서 산업생산이 3개월 연속 감소세를 나타냈다.30일 통계청이 발표한 ‘5월 산업활동동향’에 따르면 전체 산업생산은 전달에 비해 0.6% 줄었다. 지난 3월 이후 석 달 연속 감소세다.부문별로는 제조업 등이 포함된 광공업 생산이 전달보다 1.3% 감소했다. 통신·방송장비(22.1%)와 석유정제(3.0%)는 늘었지만 자동차(-3.7%)와 반도체(-4.8%) 등은 부진했다. 수출 감소 영향이 컸다. 반도체(-7.9%)와 자동차(-3.5%), 화학제품(-4.3%) 등 주력 품목의 수출이 모두 뒷걸음질 쳤다. 재고율(출하량 대비 재고 비율)은 127.3%로 전월보다 0.1%포인트 늘어났다. 2008년 12월(129.9%) 이후 77개월 만에 가장 높은 수치다. 제조업 평균 가동률은 0.7%포인트 떨어진 73.4%였다.현재의 경기 상황을 보여주는 경기동행지수 순환변동치는 0.5포인트 하락했다. 반면 향후 경기를 재는 잣대인 선행지수 순환변동치는 0.3포인트 상승했다. 김병환 기획재정부 경제분석과장은 “중동호흡기증후군(MERS·메르스)과 그리스 채무협상 등 대내외 위험요인이 확대돼 부진이 지속될 수 있다”며 “경제가 정상적 회복 궤도로 복귀할 수 있도록 추가경정예산 등 15조원 이상 재정 보강을 신속하게 추진하고 분야별 경제 활력 제고대책을 차질없이 추진하겠다”고 말했다. |
쉬베이훙의 조국의 2012년 경매시장 거래액은? |
유럽 경제 위기에도 불구하고 세계 미술시장은 성장세를 이어가고 있다.프랑스 미술정보업체 아트프라이스닷컴이 최근 발표한 ‘2012년 세계 미술시장 분석’에 따르면 작년 세계 미술품 경매시장에는 122억달러(약 13조원)의 ‘뭉칫돈’이 몰렸다. 2011년의 115억달러보다 6% 정도 늘어난 규모다.지난해 경매시장에서 작품 거래액이 가장 컸던 작가는 앤디 워홀로, 3억2900만달러어치가 거래됐다. 앤디워홀재단이 작년 11월부터 경매를 통해 2만여점의 실크스크린 인쇄화, 회화, 콜라주, 판화, 사진 등을 팔았기 때문으로 풀이된다.장다첸(2억8722만달러), 파블로 피카소(2억8614만달러), 치바이스(2억7019만달러), 게르하르트 리히터(2억6280만달러), 쉬베이훙(1억7578만달러), 리커란(1억6679만달러), 마크 로스코(1억6678만달러), 프란시스 베이컨(1억5308만달러) , 푸바오스(1억5207만달러)도 낙찰총액 ‘톱10’에 들었다. 국내 작가로는 이우환(188위, 1000만달러) 김환기(257위, 689만달러) 박수근(292위, 597만달러) 등의 작품 거래액이 큰 것으로 조사됐다.국제미술시장에서 중국 작가들의 약진도 이어졌다. 작품 거래액 상위 10위권에 중국 작고 작가 장다첸(2위), 치바이스(4위), 쉬베이훙(6위), 리커란(7위), 푸바오스(10위) 등 5명이 이름을 올렸다.중국 경매시장도 50억달러로 국제시장의 41%를 차지하며 2년째 1위를 기록했다. 중국과 화교권 부유층 컬렉터들이 자국의 그림을 사들이면서 국제 미술계에 ‘차이나 파워’가 형성되고 있다고 전문가들은 분석하고 있다. 중국 다음으로 미국(27%) 영국(18%) 프랑스(4%)가 뒤를 이었다. |
켐코 스펙초월 전형 지원자들이 모든 과제에 대해 알게 되는 날은 언제인가? |
“캠코는 잠재역량을 지닌 인재를 뽑기 위해 스펙초월 전형을 도입하게 됐습니다.”최용성 캠코 인사팀장(사진)은 스펙초월 전형 도입 배경에 대해 이렇게 말했다. 최 팀장은 “학력보다 능력을 중시하는 ‘열린 채용’을 위해 채용 관행을 전면 개편했다”고 설명했다.스펙초월 전형 과제는 4개로 줄여 지원자들의 부담을 최소화하기로 했다. 다만 이름, 이메일, 생년월일만 기입하는 입사지원과 동시에 과제 2개가 주어진다. 이 과제는 6월2일 오후 6시까지 제출해야 한다. 나머지 과제 2개는 6월3일 오전 공지하며, 그날 모두 제출해야 한다.네 가지 과제를 제출하고 상호평가까지 수행해야 유효한 입사지원이 된다. 최 팀장은 “과제는 어떤 일이 있어도 제시된 시간을 엄수해야 한다”며 “형평성을 위해 미제출 땐 모두 탈락하게 된다”고 말했다. 캠코는 다른 공기업 스펙초월 전형에서 도입한 동영상 제작은 하지 않기로 했다. 지원자의 부담을 줄이기 위해서다. 특히 캠코는 과제 완수자 모두에게 5년차 미만의 선배 평가를 받도록 할 방침이다.캠코는 이번 채용을 통해 특별한 결격사유가 없는 한 인턴수료자 대부분을 정규직으로 전환할 예정이다. 지난해에는 60%였던 정규직 전환율을 올해는 90% 이상으로 높인다는 방침이다. 지난해 입사한 캠코 신입사원 60명 가운데 조기퇴사자는 2명에 불과했다. |
MultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim",
"gather_across_devices": false
}
per_device_train_batch_size: 16per_device_eval_batch_size: 16num_train_epochs: 1batch_sampler: no_duplicatesmulti_dataset_batch_sampler: round_robinoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 16per_device_eval_batch_size: 16per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 1max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthproject: huggingfacetrackio_space_id: trackioddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: noneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Trueprompts: Nonebatch_sampler: no_duplicatesmulti_dataset_batch_sampler: round_robinrouter_mapping: {}learning_rate_mapping: {}| Epoch | Step | Training Loss |
|---|---|---|
| 0.4558 | 500 | 0.1572 |
| 0.9116 | 1000 | 0.1101 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
shangrilar/klue-roberta-base-klue-sts