• Title/Summary/Keyword: 희소성

Search Result 278, Processing Time 0.027 seconds

Personalized Recommendation Service based on Collaborative Filtering for Library Information Systems (도서관 정보시스템을 위한 협업 필터링 기반 개인화 추천서비스)

  • Chung, Hee-Chung;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.251-254
    • /
    • 2011
  • 본 논문에서는 도서관 정보시스템에서 보다 개인화된 추천 서비스를 제공하기 위하여, 사용자 기반 협업 필터링의 희소성 문제를 해결하기 위한 방안을 제시한다. 이를 위하여 아이템을 메타데이터 속성인 주제분류번호를 이용하여 동일 주제의 자료끼리 군집화하고 주제군집에 대한 선호도 점수를 추출하여 이를 사용자 유사도 계산에 사용하였다. 실험을 위하여 실제 연세대학교 도서관에서 동양서를 대출한 35,238명의 총 659,792건 대출/반납건수 데이터를 사용하였으며, 제안된 방법의 성능을 평가하기 위하여 기존의 사용자 기반 협업 필터링과 비교한 결과, 정확도에서는 큰 차이가 없었으나 Coverage가 크게 향상되었음을 확인하였다.

Expanding Korean/English Parallel Corpora using Back-translation for Neural Machine Translation (신경망 기반 기계 번역을 위한 역-번역을 이용한 한영 병렬 코퍼스 확장)

  • Xu, Guanghao;Ko, Youngjoong;Seo, Jungyun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.470-473
    • /
    • 2018
  • 최근 제안된 순환 신경망 기반 Encoder-Decoder 모델은 기계번역에서 좋은 성능을 보인다. 하지만 이는 대량의 병렬 코퍼스를 전제로 하며 병렬 코퍼스가 소량일 경우 데이터 희소성 문제가 발생하며 번역의 품질은 다소 제한적이다. 본 논문에서는 기계번역의 이러한 문제를 해결하기 위하여 단일-언어(Monolingual) 데이터를 학습과정에 사용하였다. 즉, 역-번역(Back-translation)을 이용하여 단일-언어 데이터를 가상 병렬(Pseudo Parallel) 데이터로 변환하는 방식으로 기존 병렬 코퍼스를 확장하여 번역 모델을 학습시켰다. 역-번역 방법을 이용하여 영-한 번역 실험을 수행한 결과 +0.48 BLEU 점수의 성능 향상을 보였다.

  • PDF

뉴트랜드 제품 - 건강 최고! 맛 최고! 새로운 밥맛의 세계를 연다 - 한국나락판매, 오분도미 자동판매기

  • 한국자동판매기공업협회
    • Vending industry
    • /
    • v.8 no.3
    • /
    • pp.58-61
    • /
    • 2008
  • 사람이 살아가기 위해선 먹어야 한다. 신체에 필수적인 에너지를 공급받기 위해선 싫든 좋든 먹어야 하는 게 인간의 숙명이다. 그래서 한국인의주식인 쌀은 오랫동안 사랑을 받아 왔다. '든든한 밥 힘'이 있어야 만사가 잘 풀린다는 생각은 한국인 공통적 사고방식이라 할 만큼 쌀은 절대적인 식량자원이다. 그런데 이런 쌀에 대해 제대로 아는 사람이 많지 않다. 보통 쌀이라 하면 흔히 먹는 백미를 기준으로 삼고, 조금 더 나아가야 현미 정도를 생각한다. 그리고 이들 쌀의 좋고 나쁨은 일반적으로 생산지, 농경지 기준으로 생각을 하는 게 일반적이다. 반면 정작 중요한 도정시기에 따라 밥의 건강과 맛이 달라 질 수 있다는 사실은 그리 중요하게 생각지 않는다. 한국나락판매는 쌀 시장에 있어 이런 차별성을 주목하고 오분도미 자동판매기라는 사업 아이템을 발굴해 냈다. 쉽게 말해 '즉석 도정한 신선한 쌀'을 파는 자동판매기이다. 쌀을 자판기를 통해 구입한다는 유통의 차별성만을 갖추는데 머무르지 않고, 자판기를 통하지 않고서는 구입하기 힘들다는 내용상품으로서의 희소성까지 갖추고 있다. '건강 최고! 맛 최고! 새로운 밥맛의 세계를 연다'를 기치로 본격적인 시장공략에 나선 한국나락의 오분도미 자동판매기 사업현황을 따라가 봤다.

  • PDF

Using CRF (Conditional Random Fields) to Predict Phrase Breaks in Korean (CRF를 이용한 한국어 운율 경계 추정)

  • Kim, Seung-Won;Kim, Byeong-Chang;Jeong, Min-Woo;Lee, Gary Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.134-138
    • /
    • 2005
  • 본 논문은 한국어 TTS(Text-To-Speech)에서 운율 경계를 추정하는 문제를 클래스 분류문제로 보고 CRF(Conditional Random Fields)를 적용하여 운율 경계를 추정하였다. 우리는 품사와 운율 경계로 구성된 말뭉치를 사용하여 품사, 어휘, 단어의 길이, 문장에서의 단어 위치와 같은 다양한 속성의 언어적 자질을 추출하여 CRF를 훈련시켰으며, 자질들을 서로 조합하여 최고의 성능을 보이는 자질 집합을 골랐다 또한 가우스 평활 (Gaussian Smoothing)을 적용하여 데이터의 희소성 문제를 줄였다. 실험 결과에서 본 방법이 기존의 방법보다 성능이 좋을 뿐만 아니라 운율 경계를 추정하기 위한 자질을 독립시켰기 때문에 다른 시스템과의 호환성도 높다는 것을 알 수 있었다.

  • PDF

Topical Clustering of Documents using Helmholtz Machines with Competitive Units (Competitive Unit을 사용한 Helmholtz Machine에 의한 문서 클러스터링)

  • 장정호;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.292-294
    • /
    • 2001
  • 문서 클러스터링은 정보검색 시스템에서 검색과정의 효율성을 향상시키기 위해서 많이 사용된다. 기존의 K-means 클러스터링과 같은 거리-기반 접근 방법은 거리에 대한 척도를 정해야 하는 문제가 있고, 또한 전체 자질 공간에서 지역적 특성에 민감하기 때문에 문서 내에 노이즈가 존재할 경우 만족스러운 결과를 내지 못할 수 있다. 그리고 기본적으로 문서 데이터는 희소성(sparseness)을 가기 때문에 정규 분포를 가정한 mixture 모델을 적용하기도 어려움이 있다. 본 논문에서는 Helmoholtz machine에 의한 문서 클러스터링 방법을 제안한다. 제안되는 방법에서는 하나의 문서를 어떤 내재적인 요인(factor)들의 다양한 결합에 의한 결과로 가정하는데, 이 때의 요인은 주제어 집합 또는 적어도 의미적으로 유사한 단어들의 집합이다. 그리고 기본적으로 Helmholtz machine은 이진 데이터를 다루는데, 텍스트 문서에 나타나는 단어들의 빈도를 고려하기 위해 수정된 Helmholtz machine을 제시한다. TREC-8 adhoe 데이터와 20 Newsgroup 문서 집합에 대한 클러스터링 실험 결과, 제안된 방법이 K-means 알고리즘에 비해 우수한 성능을 보였으며 주제어 추출을 통해 문서 집합의 전체 내용 파악을 용이하게 하는 특성이 있었다.

  • PDF

An Algorithm for the Multiplication of all pairs of $n\;{\times}\;n$ Boolean Matrices using Vectors (모든 n 차 정사각 불리언 행렬 쌍에 대한 벡터 기반의 곱셈 알고리즘)

  • Han, Jae-Il
    • Annual Conference of KIPS
    • /
    • 2005.11a
    • /
    • pp.849-852
    • /
    • 2005
  • 일반 행렬이나 불리언 행렬의 연산에 대한 많은 연구가 있다. 대부분의 연구는 두 행렬의 효율적 곱셈을 다루고 있으며 하드웨어나 소프트웨어적 응용에 적합한 다양한 알고리즘을 제시하였다. 모든 행렬 쌍의 곱셈에 대한 연구는 NP-완전 계산 복잡도와 이러한 곱셈을 요구하는 응용의 희소성으로 인해 관심밖에 있었으며 최근에야 원소가 불리언 값을 가지는 n 차 정사각 불리언 행렬을 대상으로 기초적인 연구 결과를 보이고 있다. 본 논문은 모든 n 차 정사각 불리언 행렬 사이의 곱셈을 보다 효율적으로 할 수 있는 벡터 기반 불리언 행렬 곱셈 이론과 이를 바탕으로 설계한 알고리즘 그리고 실행 결과에 대하여 논한다.

  • PDF

A Collaborative Recommendation Based on Neural Networks Using the Clustering (클러스터링을 이용한 신경망 기반 협력적 추천)

  • 김은주;류정우;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.343-345
    • /
    • 2002
  • 개인화를 위한 협력적 추천의 대표적인 방법인 최근접 이웃 방법은 적용이 쉽지만, 사용자의 선호도 정보가 적을 경우 회소성(sparsity)문제와 사용자 수가 많은 경우 수행 속도가 느려지는 범위성(Scalability)문제 그리고 사용자간의 가중치가 결여되었다는 점에서 추천의 정확성이 떨어진다. 신경망 기반 추천은 자료의 유형에 상관없이 데이터의 처리가 용이하고, 사용자간의 가중치를 학습할 수 있으며, 내용 정보, 인구통계학적 정보 등을 입력 노드에 추가함으로써 희소성 문제를 해결할 수 있으나. 범위성 문제는 존재한다. 따라서 본 논문에서는 최근접 이웃 방법으로 클러스터링 한 유사한 사용자 또는 항목들을 고려한 신경망 기반 추천 방법을 제안하여 범위성 문제를 최소화시킴으로써 추천의 성능을 향상시키고 있다. 제안한 추천 방법의 타당성을 보이기 위해 EachMovie데이터를 이용하여 기존 신경망 추천과 비교 실험하여 성능을 분석한다.

  • PDF

Immersion Plating of Thermo Electric Devices (열전소자의 도금기술)

  • Kim, Yu-Sang;Jeong, Gwang-Mi
    • Proceedings of the Korean Institute of Surface Engineering Conference
    • /
    • 2015.11a
    • /
    • pp.310-311
    • /
    • 2015
  • 무전해 금도금은 장식용 핸드백이나 가방 등에 주로 사용하고 있으며, 이러한 금을 도금하면 장식성이 최대로 되어 고객을 만족시킬 수 있다. 초기에는 주로 전자제품에 사용 되었으나, 이후 디자인과 기능성부품 등으로 이용이 확대되었다. 현재 국내의 금 사용량과 수요량은 매년 급증하고는 있지만 희소성, 지역편중성, 공급불안정과 이에 따른 가격불안정성과 같은 자원적 문제를 갖고 있을 뿐만 아니라 전량 수입에 의존하고 있다. 중국이나 아르헨티나에 수출되고 있는 열전소자 부품의 도금방법에는 전기도금에 의한 직접도금 방법이나 용도에 따라서 무전해 도금 생략법(Direct Plating), 애디티브(Additive), 세미애디티브(Semiadditive), 서브트랙티브(Subtractive)법 등 다양한 방법이 개발되고 있다. 국내에서는 OSTEC사, 일부 대학이나 기업에서 이러한 열전소자 도금제품을 수입하여 이제 겨우 연구개발 시작하는 단계이다. 따라서 열전소자의 도금에 관한 기술정보가 부족하기 때문에 우선 전문가를 활용한 정보제공과 개발에 관한 기초지원이 필요할 것으로 판단되어 제품 개발에 대한 도금기술을 지원하고자 한다.

  • PDF

An Autonomic User-Dependent Weighting Method to Improve Efficiency of Recommendation (추천 성능 향상을 위한 사용자별 가중치 자동 설정 기법)

  • Lee, Seong-Jin;Lee, Youn-Jeong;Lee, Soo-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.781-783
    • /
    • 2005
  • 추천 기술이란 과도하게 제공되는 정보를 여과하여 사용자에게 필요한 정보만을 제공해 주는 것으로 대표적으로는 협력적 여과가 있다. 그러나 협력적 여과는 희소성 문제와 확장성에 취약점을 보이고 있어 최근 이를 극복하기 위한 내용 기반 추천 기법에 관한 연구가 활발히 이루어지고 있다. 내용 기반의 추천 기법에서 효율적인 추천이 이루어지기 위해서는 각 요소별 가중치를 어떻게 설정할 것인가가 매우 중요하다. 기존의 연구에서는 요소별 가중치를 다양한 실험에 의해 결정하고 이를 모든 사용자에게 동일하게 적용하는 방식을 취하고 있다. 그러나 사용자마다 콘텐츠 선택 기준과 요인이 다를 수 밖에 없으므로 이러한 방식은 사용자의 선호 정보를 효과적으로 반영할 수 없다. 따라서 본 논문에서는 사용자의 선호 정보 분석과 함께 각 요소별 가중치를 사용자별로 자동으로 설정하여 보다 효과적인 추천이 이루어질 수 있는 기법을 제안한다.

  • PDF

Sentence segmentation of KeyGraph using genetic algorithm (유전자 알고리즘을 이용한 KeyGraph 알고리즘의 데이터 분할)

  • Lee, Young-Seol;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.352-356
    • /
    • 2007
  • 키그래프는 데이터 패턴 속에서 인간의 의사결정이나 미래에 닥쳐올 변화에 영향을 주지만 자주 발생하지 않는 희소성이 있는 사건을 발견하기 위한 알고리즘이다. 키그래프는 지진예측, 논문, 파일탐색, 그리고 중요한 URL 추출 등에 이용되었다. 데이터 분할을 통한 클러스터의 형성은 키그래프의 성능에 가장 큰 영향을 끼치는 요소 중의 하나이다. 본 논문에서는 유전자 알고리즘을 이용하여 키그래프의 성능을 향상시킬 수 있는 최적의 데이터 분할을 찾아내는 방법을 제안한다. 제안한 방법의 가능성을 보여주기 위하여 모바일 기기 사용자로부터 수집한 방문 장소 데이터에 제안하는 방법을 적용하여 키그래프의 성능이 향상되는 것을 보인다.

  • PDF