• 제목/요약/키워드: Process Similarity

검색결과 860건 처리시간 0.03초

사용자 선호도 변화에 따른 추천시스템의 다양성 적용 (Application of diversity of recommender system accordingtouserpreferencechange)

  • 나혜연;남기환
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.67-86
    • /
    • 2020
  • 추천시스템은 시간이 흐를수록 사용자와 기업에게 점점 더 큰 영향을 주고 있다. 최근 코로나(COVID-19) 팬데믹 현상이 전 세계적으로 일어나면서 세대를 뛰어넘어 E-Commerce의 중요성이 증대되었고 추천시스템은 E-Commerce 활성화의 최중심에 있다. 추천시스템이 개발된 이래로 다수의 알고리즘이 추천시스템의 정확도를 올리는 것에 집중되어 있었고, 추천시스템의 희귀성, 다양성, 우연성 등과 같은 다른 가치들이 간과되고 있다. 본 논문에서는 사용자의 만족도는 추천시스템의 정확도에만 달려있지 않고 다양한 성능을 겸비했을 때 고객에게 만족스러운 추천서비스 경험을 제공할 것이라 생각하여 다양성을 위한 그래프 기반의 추천시스템을 개발하였다. 사용자 네트워크를 구성한 뒤 카테고리를 활용한 무게중심변화를 통해 유사도가 낮은 이질적인 사용자를 찾아 추천상품의 유사성을 낮추는 방식으로 다양성을 도모하였다. 또한, 추천의 다양성은 사용자의 다양성 선호 수준에 따라 상이할 것이라는 가정에 따라 사용자의 다양성 선호 수준을 구별하였고 다양성 모델 성능이 사용자 특성별로 다름을 확인할 수 있었다. 전체 연구 결과, 추천시스템의 정확성과 다양성이 트레이드 오프 관계에 놓여있다는 것을 확인할 수 있었지만 본 연구모델을 통해 근소한 정확도 손실 대비 높은 다양성을 얻을 수 있었다. 본 연구는 그래프 기반의 추천시스템을 통해 사용자의 만족도를 향상시키는 다양성을 실현하였다는 연구적 의의와 사용자 수준을 고려한 추천의 다양성을 적용 결과를 통해 기업의 장기적 이윤을 상승시킬 수 있는 모델 개발이라는 실무적 의의를 꼽을 수 있다.

신라 십이지신상 능묘의 특징과 순서에 대한 일고찰 (A Study on the Characteristics and Order of the Zodiac Statues Tombs in the late Silla Dynasty)

  • 박형열;이지향
    • 헤리티지:역사와 과학
    • /
    • 제55권2호
    • /
    • pp.252-271
    • /
    • 2022
  • 십이지신상이 표현된 능묘는 신라 후기의 대표적인 무덤 양식이다. 하지만 내부 매장시설에 대한 조사나 출토유물을 확인할 수 없다는 점에서 이 능묘는 근본적인 연구에 한계를 가진다. 그럼에도 불구하고 기존 연구에서는 능묘에 표현된 가시적인 특징을 토대로 십이지신상의 조각수법의 변화나 표현기법의 변화, 그리고 외부호석 및 난간석을 별개의 조건으로 다루어 연구를 진행해왔다. 외부호석 및 난간석을 별개의 조건으로 다룬 것은 다른 제속성들과 정합되지 않기 때문이다. 본 글에서는 기존 연구의 제속성을 다시 분석하여 십이지신상에 표현된 기법의 변화가 능역 구성요소의 변화와 부합되는가를 확인하였다. 제속성의 특징은 첫째, 호석의 갑석과 지대석의 치석방법의 차이와 면석의 이격 칸수는 1단(무단) 치석에서 2단, 3단의 순으로 양의 상관관계를 보인다. 둘째, 십이지신상의 지물은 방망이, 창, 낫형지물, 봉, 삼지창 등으로 배열되며 연속성을 띤다. 또한 석상의 지물은 십이지신상에서 사라진 이후에 석인상에 표현된다. 셋째, 십이지신상은 조각수법에 따라 곡면각과 평면각으로 크게 구분되고, 세부적으로 두향과 복장은 화면비율에 따라 시간성을 갖는다. 넷째, 상석의 안상형태는 돌기의 수가 9개에서 5개, 3개 등으로 줄어들고, 보주형의 중앙돌기에서 돌기의 높이가 낮아져 편평한 형태로 변화한다. 이들 각 제속성들의 상관관계를 살피면 정합되는 특징을 보인다. 이를 토대로 신라 후기 십이지신상의 능묘는 5단계로 변화함을 확인하였다. 왕릉의 입지 또한 서악동고분군과 전선덕여왕릉처럼 초기에는 구릉 능선에서 원성왕릉 단계에는 산기슭으로, 나아가 전 헌덕왕릉에서는 평지 순으로의 변화를 보인다. 더불어 능묘의 상대순서에 대해 다시 한 번 재고해 볼 필요가 있음을 인지하였다. 이 능묘에 대한 근본적인 연구의 한계는 다양한 가능성을 열어두기 때문이다. 결국, 전 진덕왕릉과 구정동방형분은 원성왕릉보다 이른 왕릉일 가능성이 있다. 아울러 신라 후기 십이지신상의 능묘는 능과 석상, 배례공간, 신도, 능비가 조합된 완성형 능역구조를 갖추며 고려와 조선왕릉에 기본 모티브가 되는 것으로 이해된다.

전문어의 범용 공간 매핑을 위한 비선형 벡터 정렬 방법론 (Nonlinear Vector Alignment Methodology for Mapping Domain-Specific Terminology into General Space)

  • 김준우;윤병호;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.127-146
    • /
    • 2022
  • 최근 워드 임베딩이 딥러닝 기반 자연어 처리를 다루는 다양한 업무에서 우수한 성능을 나타내면서, 단어, 문장, 그리고 문서 임베딩의 고도화 및 활용에 대한 연구가 활발하게 이루어지고 있다. 예를 들어 교차 언어 전이는 서로 다른 언어 간의 의미적 교환을 가능하게 하는 분야로, 임베딩 모델의 발전과 동시에 성장하고 있다. 또한 핵심 기술인 벡터 정렬(Vector Alignment)은 임베딩 기반 다양한 분석에 적용될 수 있다는 기대에 힘입어 학계의 관심이 더욱 높아지고 있다. 특히 벡터 정렬은 최근 수요가 높아지고 있는 분야간 매핑, 즉 대용량의 범용 문서로 학습된 사전학습 언어모델의 공간에 R&D, 의료, 법률 등 전문 분야의 어휘를 매핑하거나 이들 전문 분야간의 어휘를 매핑하기 위한 실마리를 제공할 수 있을 것으로 기대된다. 하지만 학계에서 주로 연구되어 온 선형 기반 벡터 정렬은 기본적으로 통계적 선형성을 가정하기 때문에, 본질적으로 상이한 형태의 벡터 공간을 기하학적으로 유사한 것으로 간주하는 가정으로 인해 정렬 과정에서 필연적인 왜곡을 야기한다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 데이터의 비선형성을 효과적으로 학습하는 딥러닝 기반 벡터 정렬 방법론을 제안한다. 제안 방법론은 서로 다른 공간에서 벡터로 표현된 전문어 임베딩을 범용어 임베딩 공간에 정렬하는 스킵연결 오토인코더와 회귀 모델의 순차별 학습으로 구성되며, 학습된 두 모델의 추론을 통해 전문 어휘를 범용어 공간에 정렬할 수 있다. 제안 방법론의 성능을 검증하기 위해 2011년부터 2020년까지 수행된 국가 R&D 과제 중 '보건의료' 분야의 문서 총 77,578건에 대한 실험을 수행한 결과, 제안 방법론이 기존의 선형 벡터 정렬에 비해 코사인 유사도 측면에서 우수한 성능을 나타냄을 확인하였다.

한국화예의 정체성 탐구를 위한 연구 - 창작의 탈형식과 자유정신을 중심으로 - (A Study on the exploration of the Identity of Korean Floral Art : Focusing on the creator's beyond form and free spirit)

  • 문영란
    • 한국화예디자인학연구
    • /
    • 제45호
    • /
    • pp.77-95
    • /
    • 2021
  • 본 논문은 우리의 화예가 극복해야할 현실의 문제를 서구중심의 형식주의(기능주의) 꽃문화의 팽배로 인해 야기되는 화예정신의 상실로 보고, 화예정신의 회복을 위한 논의를 낯설게 바라보기의 탈형식성과 노마디즘의 자유정신에 대한 논의를 통해 고찰하고자 한다. 꽃을 매개로 창작자의 심미적 정신세계를 작품화 하는 화예(華藝)는 창작 주체의 자유로운 정신세계를 중시하는 심상예술에 해당한다. 이것은 대상 세계를 재현하는 '닮음의 표현'을 넘어 대상 세계를 '자기화'하는 의상(意象)예술로서 작가의식의 중요성을 말하는 것이기도 하다. 이와 같은 맥락에서 현재 국내에서 이루어지는 화예창작 과정들을 살펴볼 때 한국화예의 정체성에 대한 고민의 부재는 서구식 표현 기법과 창작방법에 경도된 국내 화예작가들의 창작수련과 작품활동으로 나타난다. 또한 이것은 플라워디자인이라는 서구의 꽃문화에 경도된 우리의 문화의식에 대한 문제점을 표명하는 것이기도 하다. 여기서 우리는 서양의 플라워디자인에 의해 경도된 한국화예의 현실정을 이해하고, 그 문제의 해결을 위한 논의를 구성해 나아가야할 의무를 부여받게 된다. 그러므로 본 연구는 한국 화예의 정체성을 모색하고 한국 화예의 문화적 가치를 제고하기 위한 일환으로 우리의 화예가 극복해야할 문제점을 서구의 문화수용에 대한 비판을 통해 고찰한다. 이것은 한국화예가 회복해야할 본질에 대한 역사적 고찰이 되는 동시에 심미예술로서 화예가 견지해야할 자유로운 창작정신에 대한 의미를 규명하는 과정이 된다. 더욱이 이와 같은 한국의 화예문화에 대한 비판과 자기성찰의 논의는 한국화예의 '정체성'에 대한 논의를 구체화 하는 동시에 화예를 위한 학문적 담론체계를 더욱 확대시키는 계기가 될 것이라고 기대한다.

Landsat-8을 활용한 Sentinel-2A Near Infrared 채널의 Spectral Band Adjustment Factor 적용성 평가 (Evaluation of Spectral Band Adjustment Factor Applicability for Near Infrared Channel of Sentinel-2A Using Landsat-8)

  • 김나연;성노훈;정대성;심수영 ;우종호;최성원;박성우;한경수
    • 대한원격탐사학회지
    • /
    • 제39권3호
    • /
    • pp.363-370
    • /
    • 2023
  • 다양한 지구관측위성은 발사 후 정확한 고품질의 자료를 제공하는 것이 중요하다. 위성 자료 품질을 유지 및 보완하기 위해서는 서로 다른 센서 차이를 고려하는 spectral band adjustment factor (SBAF)를 활용한 교차 검보정 과정이 필요하다. 따라서 본 연구에서는 pseudo-invariant calibration sites 중 Libya4, Algeria3, Mauritania2 에서 수집한 Landsat-8, Sentinel-2A 위성 영상을 활용하여 SBAF 산출 및 적용을 통해 밴드 대역 폭 차이로 인해 발생하는 불확실성을 조정하였다. 두 위성 모두 Blue, Green, Red를 포함하고 Sentinel-2A의 경우 near-infrared (NIR) narrow와 NIR 두 가지 밴드 모두에 SBAF를 적용하여 밴드대역폭 유사도에 따른 반사도 차이를 정량적으로 비교하였다. SBAF 적용 후, NIR을 제외한 모든 밴드(Blue, Green, Red, NIR narrow)에서 1% 내외의 반사도 차이로 유의미한 결과가 나타났다. Sentinel-2A NIR 밴드의 경우 밴드대역폭 차이가 NIR narrow에 비해 크게 나타났지만, SBAF 적용 후에 반사도 차이가 허용 오차범위인 5%와 1-2% 차이로 SBAF 적용이 가능한 것으로 나타났다. 따라서, 위성 활용이 제한적인 상황에서 두 센서의 밴드대역폭 차이가 큰 경우에도 SBAF를 적용할 수 있다고 판단하였고 위성 자료의 품질 및 연속성을 활용하는 연구에 도움이 될 것으로 기대된다.

GEase-K: 부가 정보를 활용한 선형 및 비선형 오토인코더 기반의 추천시스템 (GEase-K: Linear and Nonlinear Autoencoder-based Recommender System with Side Information)

  • 이태범;이승학;마민정;조윤호
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.167-183
    • /
    • 2023
  • 최근 추천시스템 분야에서는 희소한 데이터를 효과적으로 모델링하기 위한 다양한 연구가 진행되고 있다. GLocal-K(Global and Local Kernels for Recommender Systems)는 그중 하나의 연구로 전역 커널과 지역 커널을 결합하여 데이터의 전역적인 패턴과 개별 사용자의 특성을 모두 고려해 사용자 맞춤형 추천을 제공하는 모델이다. 하지만 GLocal-K는 커널 트릭을 사용하기 때문에 매우 희소한 데이터에서 성능이 떨어지고 부가 정보를 사용하지 않아 새로운 사용자나 아이템에 대한 추천을 제공하는 데 어려움이 있다. 본 논문에서는 이러한 GLocal-K의 단점을 극복하기 위해 EASE(Embarrassingly Shallow Autoencoders for Sparse Data) 모델과 부가 정보를 활용한 GEase-K(Global and EASE kernels for Recommender Systems) 모델을 제안한다. 우선 GLocal-K의 지역 커널 대신 EASE를 활용하여 매우 희소한 데이터에서 추천 성능을 높이고자 하였다. EASE는 단순한 선형 연산 구조로 이루어져 있지만, 규제화와 아이템 간 유사도 학습을 통해 매우 희소한 데이터에서 높은 성능을 내는 오토인코더이다. 다음으로 Cold Start 완화를 위해 부가 정보를 활용하였다. 학습 과정에서 부가 정보를 추가하기 위해 조건부 오토인코더 구조를 적용하였으며 이를 통해 사용자-아이템 간의 유사성을 더 잘 파악할 수 있도록 하였다. 결론적으로 GEase-K는 선형 구조와 비선형 구조의 결합, 부가 정보의 활용을 통해 매우 희소한 데이터와 Cold Start 상황에서 강건한 모습을 보인다. 실험 결과, GEase-K는 매우 희소한 GoodReads, ModCloth 데이터 세트에서 RMSE, MAE 평가 지표 기준 GLocal-K 보다 높은 성능을 보였다. 또한 GoodReads, ModCloth 데이터 세트를 4개의 집단으로 나누어 실험한 Cold Start 실험에서도 GLocal-K 대비 Cold Start 상황에서 좋은 성능을 보였다.

소설과 영화 속 '메피스토'의 사상성 미학 (The Aesthetics of Conviction in Novel and Film Mephisto)

  • 신사빈
    • 대중서사연구
    • /
    • 제25권1호
    • /
    • pp.217-247
    • /
    • 2019
  • 이 글은 클라우스 만(Klaus Mann)의 소설 『메피스토(Mephisto)』(1936)와 이슈트반 사보(István Szabó)의 영화 <메피스토>(1981)의 상호텍스트성을 살펴보고, 원형 콘텐츠(소설)에서 드러난 도식적인 사상성 미학(Gesinnungsästhetik)을 파생 콘텐츠(영화)에서 어떻게 수용하고, 또 극복하는지를 모색하는 데에 그 목적이 있다. 흔히 사상성 미학은 독일의 제3제국 시절 예술가들의 국가사회주의에 대한 태도나 통일 이전 동독 예술가들의 체제에 대한 태도를 편파적인 도덕성의 잣대로 부정적인 평가를 할 때 적용된다. 『메피스토』도 그런 사상성 미학을 지니고 있어서, 클라우스 만의 대척점에 선 현실 속 실제 인물(구스타프 그륀트겐스)과 소설 속 허구 인물(헨드릭 회프겐) 사이의 유형적 유사성과 차이점을 시대 비평적으로 살펴보는 것도 의미가 있다고 여겨진다. 이때 상호텍스트성을 통하여 내재비평(內在批評)을 한다면 대척에 선 두 인물 사이에 미적 거리를 확보할 수 있다. 이러한 전제에 있어, 이슈트반 사보의 영상 미학은 원작의 도식주의를 벗어난 것으로 보인다. 소설과 영화에서 나타난 '메피스토'라는 사상성은 나치 시대 국가사회주의와 타협한-불가항력의 역사 앞에 굴복한-인물의 인식과 태도의 문제다. 클라우스 만은 메피스토 유형의 회프겐(현실의 그륀트겐스)을 망명문학(Exilliteratur)의 관점에서 '악으로 기우는 메피스토'라고 통렬히 비판하고 있다. 이때 비판을 통한 공격에는 풍자와 희화, 조롱, 패러디, 아이러니 등 다양한 표현 수단이 동원된다. 고발과 비판에 있어 자기반성이 없고 '유토피아적인 것(das Utopische)'도 배제되어 있어서 예술의 자유가 인격권을 침해하는 경향도 없지 않다. 이에 비교해 이슈트반 사보는 메피스토 유형의 회프겐을 수용함은 물론 햄릿 유형의 회프겐, 즉 '선으로, 악으로 기우는 파우스트'를 추가로 등장시켜 (단순한 선과 악의 이분법 잣대가 아닌) 악의 두 유형(메피스토의 악과 파우스트의 악)을 이원적으로 접근한다. 그렇다고 '메피스토와 햄릿(파우스트)'이 혼재된 유형의 인물을 연민의 대상으로만 바라보지 않는다. 훨씬 더 강화된 비극적 결말로서 사회적 책임을 추궁한다. 그래서 소설이 한 개인의 자서전에 가깝다면, 영화는 한 세대의 자서전에 가깝다. 소설과 영화에서 나타난 상호텍스트성의 아이러니로 인하여 메피스토의 사상성 미학은 역사관의 한계와 텍스트의 편중을 극복하였다. 역사가 개인이 넘어설 수 없는 거대한 '운명의 힘'이더라도 '삶의 가치'인 인간의 존엄성마저 부정할 수는 없기 때문에 가능한 일이다. 사상성의 문제는 비단 독일의 나치 시대에만 국한되지 않는다. 우리 근현대사를 관통하는 이데올로기와도 연상될 문제다. 우리에게 어떤 이분법의 잣대로 비판만 일삼기에는 역사의 뿌리가 너무 깊이 박혀 있어서, 역사와 개인의 관계에서만은 중립적인 관점이 필요하다. 이 글은 우리의 메피스토와 햄릿을 찾는데 실마리를 제공한다면 또 하나의 의의를 지닐 것이다.

국산(國産) 조제분유(調製粉乳)와 발효유(醱酵乳)의 영양효과(營養效果)에 관(關)한 연구(硏究) - 1. 유제품(乳製品)의 영양소(營養素) 함량비교(含量比較)를 위한 연구(硏究) - (Studies on the Nutritional Effects of Locally Produced Dried Formula Milk and Fermented Milk -1. Comparative Studies on the Nutrients Content of Dried Formula Milk and Fermented Milk-)

  • 백정자;한인규
    • Journal of Nutrition and Health
    • /
    • 제9권1호
    • /
    • pp.84-91
    • /
    • 1976
  • 국내(國內)에서 생산(生産)되고 있는 세가지 조제분유(調製粉乳) 및 한가지 발효유(醱酵乳)의 일반성분(一般成分), 비타민, 무기물, 아미노산(酸) 및 지방산(脂肪酸) 함량(含量)을 분석(分析)하여 보증성분(保證成分)과 비교(比較)하고, 아울러 모유(母乳)와 비교(比較)하여 이들 유제품(乳製品)의 영양가(營養價)를 평가(評價)하기 위하여 7주간(週間) 실험(實驗)을 실시(實施)하였던 바 그 결과(結果)를 요약(要約)하면 다음과 같다. 1. 단백질(蛋白質) 및 지방(脂肪) 함량(含量)에 대한 분석치(分析値)는 보증함량(保證含量)보다 약간 낮았고, 당질(糖質) 함량(含量)은 약간 높았으나, 다른 성분(成分)은 대체로 분석치(分析値)와 보증함량(保證含量)이 서로 근사(近似)했고, 분유(粉乳)들간(間)에도 차이(差異)가 없었다. 발효유의 단백질(蛋白質) 및 지방(脂肪) 함량(含量)은 우유보다 낮았으나, 당질(糖質)의 함량(含量)이 높은 것으로 보아 상당한 양(量)의 가당(加糖)이 있는 듯 하였다. 2. 비타민은 거의 모든 분석치(分析値0가 보증(保證)된 함량(含量)보다 높았는데, 특히 비타민A는 $2{\sim}3$배(倍), 비타민E는 $4{\sim}5$배(倍)씩 높았고, 나이아신은 보증함량(保證含量)에 미달하였다. 또한 분유(粉乳)들간(間)에는 약간의 함량차(含量差)가 있었다. 3. 무기질(無機質)은 분석치(分析値)와 보증함량(保證含量)이 비슷했는데 칼슘 외 분석치(分析値)가 보증함량(保證含量)보다 다소 많았다. 이상의 분석(分析)된 조제분유(調製紛乳)들을 15%로 희석하여 우유(牛乳) 및 모유(母乳)와 비교(比較)했을 때, 열량(熱量), 당질(糖質), 단백질(蛋白質)도 우유(牛乳)보다 훨씬 희석되어 모유(母乳)에 유사(類似)함을 알 수 있었다. 또한 철분 및 대개의 비타민이 모유(母乳)나 우유(牛乳)보다 많은 점으로 미루어 이러한 영양소(營養素)가 강화(强化)되어 있음을 짐작할 수 있었다. 이 환원유(還元乳)를 일정(一定)한 조건(條件)에서 한국 영양권장량과 비교(比較)했을 때, 모든 영양소(營養素)를 충분(充分)히 공급(供給)할 수 있었는데 나이아신 만이 권장량에 미달하였다. 또한 분유(粉乳) C에서 철분이 약간 미달했고, 비타민A는 1일(日) 권장량에 6배(倍)나 되어 앞으로 재검토(再檢討)를 요(要)하는 문제라 하겠다. 4. 아미노산(酸) 조성(組成)은 분유간(粉乳間)에 다수 차계(差界)를 보였으며, 필수(必須)아미노산(酸) 조성(組成)이 우유에 가까웠던 점(點)으로 보아 아미노산 조절(調節)은 없었는듯 하였다. 발효유의 아미노산(酸) 조성(組成)은 우유와 거의 같았다. 5. 지방산(脂肪酸)의 조성(組成)은 전체(全體) 포화지방산대(飽和脂肪酸對) 불포화지방산(不飽和脂肪酸)의 비(比)가 3종(種)의 분유간(粉乳間)에 비슷하였고, 특히 필수지방산(必須脂肪酸)의 조성(組成)이 모유(母乳)와 유사(類似)하거나 높아 이들 지방산(脂肪酸)이 첨가(添加)되어 있음을 나타냈다. 이상의 여러 결과(結果)들을 종합(綜合)할 때 3종(種)의 분유간(粉乳間) 영양효과(營養效果)는 비슷하고, 조제분유(調製粉乳)의 일반조성(一般組成), 무기질(無機質) 및 지방산(脂肪酸) 조성(組成)에 있어서 모유(母乳)에 상당히 접근(接近)하는 것으로 믿어진다. 한편 철분, 비타민 등(等)의 강화(强化)로서 단일식품(單一食品)으로서의 효용성(效用性)을 높인 것은 사실이나, 일부 영양소(營養素)의 지나친 강화(强化)문제는 좀더 신중히 다루어져야 할 것으로 생각된다.

  • PDF

온톨로지 기반 영화 메타데이터간 연관성을 활용한 영화 추천 기법 (The Ontology Based, the Movie Contents Recommendation Scheme, Using Relations of Movie Metadata)

  • 김재영;이석원
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.25-44
    • /
    • 2013
  • 최근 IPTV와 스마트 TV 등의 등장과 영상 콘텐츠를 시청하고 검색할 수 있는 웹 서비스의 등장으로 영상 콘텐츠의 접근이 용이해져 사용자들은 자신이 원하는 콘텐츠를 찾고자 하는 요구가 증가하고 있다. 하지만 서비스되는 콘텐츠의 양이 방대하여 영상 콘텐츠를 검색할 때 사용하는 키워드 기반의 검색은 많은 양의 결과를 가져오며 사용자가 필요로 하지 않은 결과가 검색된다. 따라서 사용자가 원하는 콘텐츠의 검색 시간과 노력이 증가 하게 되었다. 이를 극복 하기 위해 콘텐츠 추천 및 검색에 대한 연구가 수행되어 왔다. 기존의 연구에는 사용자의 선호도 분석을 통하여 영상 콘텐츠를 추천하거나 비슷한 성향을 가지는 사용자들을 분류하여 콘텐츠를 추천하는 기법들이 연구되어 왔다. 본 논문에서는 영상 콘텐츠 중 영화의 추천을 위해 사용자 개인의 영화 메타데이터의 선호도를 분석하고, 영화의 메타데이터와 영화의 유사성을 도출하여 이를 기반으로 영화 추천 기법을 제안한다. 영화의 특징을 담고 있고, 사용자의 영화 선호도에 영향을 끼치는 장르, 줄거리, 배우, 키워드 등의 영화 메타데이터를 기반으로 온톨로지를 구축하고, 확률 기법을 통한 메타 데이터간의 유사성을 분석하여 유사 메타데이터를 연결한다. 또한 사용자의 선호도와 그룹을 정의하고, 사용자 정보를 활용하기 위한 사용자 모델을 정의한다. 제안하는 추천 기법은 1) 사용자 정보기반의 후보 영화 검색 컴포넌트, 2) 사용자 선호기반의 후보 영화 검색 컴포넌트, 3) 1)과 2)의 결과를 통합하고 가중치를 부여하는 컴포넌트, 4) 최종결과의 분석을 통한 개인화된 영화 추천 컴포넌트 등 총 4가지 컴포넌트로 구성된다. 제안하는 추천 기법의 실험을 위하여 20대 남/녀 10명씩 20명을 대상으로 실험을 진행하였으며, 실험결과 평균 Top-5에서 2.1개 Top-10에서 3.35개 Top-20에서 6.35의 영화가 보고 싶은 영화로 선택되었다. 본 논문에서는 영화 메타데이터간의 연관성 도출을 통하여 영화간의 유사성을 도출하고 이를 기반으로 사용자의 기본적인 정보를 활용한 추천뿐만 아니라 사용자가 예상하지 못한 영화의 추천이 가능하다.

지능형 검색엔진을 위한 색상 질의 처리 방안 (Color-related Query Processing for Intelligent E-Commerce Search)

  • 홍정아;구교정;차지원;서아정;여운영;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.109-125
    • /
    • 2019
  • 지능형 전자상거래 검색 엔진에 대한 관심이 커지면서, 검색 상품의 특징을 지능적으로 추출하고 활용하기 위한 연구들이 수행되고 있다. 특히 전자상거래 지능형 검색 엔진에서 상품을 검색 할 때, 제품의 색상은 상품을 묘사하는 중요한 특징 중에 하나이다. 따라서 사용자의 질의에 정확한 응답을 위해서는 사용자가 검색하려는 색상과 그 색상의 동의어 및 유의어에 대한 처리가 필요하다. 기존의 연구들은 색상 특징에 대한 동의어 처리를 주로 사전 방식으로 다뤄왔다. 하지만 이러한 사전방식으로는 사전에 등록되지 않은 색상 용어가 질의에 포함된 경우 처리하지 못하는 한계점을 가지고 있다. 본 연구에서는 기존에 사용하던 방식의 한계점을 극복하기 위하여, 실시간으로 인터넷 검색 엔진을 통해 해당 색상의 RGB 값을 추출한 후 추출된 색상정보를 기반으로 유사한 색상명들을 출력하는 모델을 제안한다. 본 모델은 우선적으로 기본적인 색상 검색을 위해 671개의 색상명과 각 RGB값이 저장된 색상 사전을 구축하였다. 본 연구에서 제시한 모델은 특정 색상을 검색하는 것으로 시작하며, 검색된 색상이 색상 사전 내 존재하는 지 유무를 확인한다. 사전 내에 검색한 색상이 존재한다면, 해당 색상의 RGB 값이 기준 값으로 사용된다. 만일 색상사전 내에 존재하지 않는다면, Google 이미지 검색 결과를 크롤링하여 각 이미지의 특정 영역 내 RGB값들을 군집화하여 구한 평균 RGB값을 검색한 색상의 기준 값으로 한다. 기준 RGB값을 앞서 구축한 색상 사전 내의 모든 색상의 RGB 값들과 비교하여 각 R, G, B 값에 있어서 ${\pm}50$ 내의 색상 목록을 정렬하고, RGB값 간의 유클리디안 거리 유사도를 활용하여 최종적으로 유사한 색 상명들을 출력한다. 제안 방안의 유용성을 평가하기 위해 실험을 진행하였다. 피설문자들이 생각하는 300 개의 색상 이름과 해당 색상 값을 얻어, 본 연구에서 제안한 방안을 포함한 총 네가지 방법을 통해 얻은 RGB 값들과 피설문자가 지정한 RGB값에 대한 비교를 진행했다. 인간의 눈을 반영하는 측정 기준인 CIELAB의 유클리드안거리는 평균 13.85로 색상사전만을 활용한 방안의 30.88, 한글 동의어사전 사이트인 워드넷을 추가로 활용한 방안의 30.38에 비해 비교적 낮은 색상 간의 거리 값을 보였다. 연구에서 제시하는 방안에서 군집화 과정을 제외한 방안의 색 차는 13.88로 군집화 과정이 색 차를 줄여준다는 것을 확인할 수 있었다. 본 연구에서는 기존 동의어 처리 방식인 사전 방식이 지닌 한계에서 벗어나기 위해, 사전 방식에 새로운 색상명에 대한 실시간 동의어 처리 방식을 결합한 RGB값 기반의 새로운 색상 동의어 처리 방안을 제안한다. 본 연구의 결과를 활용하여 전자상거래 검색 시스템의 지능화에 크게 기여할 수 있을 것이다.