• 제목/요약/키워드: 시맨틱유사성

검색결과 43건 처리시간 0.025초

전자상거래 포탈을 위한 시맨틱 협업 필터링을 이용한 확장된 추천 알고리즘 (Enhanced Recommendation Algorithm using Semantic Collaborative Filtering: E-commerce Portal)

  • ;김종우;강상길
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.79-98
    • /
    • 2011
  • 우리는 개인 전자상거래 포탈에서 개인화를 위한 시맨틱 추천 방법을 제안한다. 시맨틱 추천은 제품의 특성(속성)을 이용하여 의미적 유사성 평가를 통해 이루어진다. 정확한 추천을 제공하기 위하여 제품의 시맨틱 유사성은 제품의 평점정보를 포함한다. 또한, 추천기술은 제품의 평점을 평가하여 고객의 다양한 내포된 의향을 분석한다. 고객의 의향은 "구입한 제품", "쇼핑카트에 추가한 제품", "정보를 본 제품"과 같이 세 가지 유형으로 분류 하고 있다. 우리는 제품의 추천을 위한 제품의 평점을 추정하기 위하여 고객의 내재적 의향을 추적할 수 있다. 또한 우리는 정확한 추천을 제공하기 위해 매우 중요한 유효한 세션을 식별하는 유효성 검사 프로세스 세션을 구현하였다. 우리의 추천 기술은 유사한 환경의 고객의 연령별 그룹에서 높은 수준을 정확도를 보여 준다. 본 논문의 실험섹션에서 우리의 제안 추천방식은 기존 고객뿐만 아니라 이전의 구매기록이 없는 새로운 사용자에게도 기존에 잘 알려진 협업 필터링 방법보다 좋은 성능을 보여 주었다.

국방 컴포넌트그리드 기반의 시맨틱 검색 기술의 연구 (A Study on Techniques for Semantic Search based on Defense Software Component Grid)

  • 허윤;김수경;최호진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.877-878
    • /
    • 2009
  • 본 연구는 국방 소프트웨어 컴포넌트그리드 환경의 자산저장소를 지원하는 시맨틱 검색 시스템을 설계하고 개발하는데 바탕을 두고 있다. 컴포넌트그리드 환경의 자산저장소의 중요한 특성은 재사용성과 상호운용성 그리고 유용성을 보장하는 것이다. 이러한 특성을 만족하는 시맨틱 검색 시스템을 개발하기 위해서는 기반 기술에 대한 심도 있는 기초 연구가 필요하다. 본 논문에서는 이러한 기술들 중 현재 연구 중인 몇 가지를 소개하고 적용 방법을 제안하고자 한다. 이러한 기술로는 사례기반추론을 이용한 소프트웨어 개발 경험재사용 연구, 유사한 컴포넌트들의 추출을 위한 의미기반의 유사도 연구, 그리고 사용자 질의의 추론과 매칭을 위한 추론규칙 연구 등이 있다. 본 연구에서는 다양한 형태의 산출물들의 저장 및 검색을 위한 기술들을 조사하고 이를 연구하여 향후 컴포넌트그리드 환경의 자산저장소의 시맨틱 검색을 제공하기 위한 기초로 활용할 예정이다.

시맨틱 프레임을 이용한 한국어 패러프레이즈 자동 평가 방법 (An Automatic Evaluation Metric for Korean Paraphrase via Semantic Frame)

  • 박한철;권가진;최호진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.761-764
    • /
    • 2014
  • 본 연구는 지능형 QA시스템과 관련한 연구에서, 자동 패러프레이즈 생성 시스템을 평가하는 새로운 방법을 제시한다. 기존의 패러프레이즈 생성 시스템의 자동 평가 방법은 참조할 수 있는 패러프레이즈 정보의 양이 크게 제한되어 있었으며, 원 문장의 콘텍스트(context)와 이에 의존하는 통사적 구조(syntactic structure) 및 의미적 구조의 유사성을 고려하지 않고, 단순 구/단어 수준의 의미 유사성을 기반으로 생성된 패러프레이즈를 평가하였다. 이러한 문제를 해결하기 위해 본 연구는 시맨틱 프레임(semantic frame)을 이용한 패러프레이즈 문장 평가 방법을 제시한다. 본 연구에서 제시하는 방법론은 문장의 콘텍스트를 표현하는 프레임과 이러한 프레임이 발생시키는 통사적, 의미적 구조의 유사성을 바탕으로 원 문장과 패러프레이즈 문장의 '의미 유사성', '어휘 형태 비 유사성'을 평가하는 방식이다.

링크드 오픈 데이터에서 TF-IDF를 이용한 새로운 시맨틱 거리 측정 기법 (A New Semantic Distance Measurement Method using TF-IDF in Linked Open Data)

  • 조정길
    • 한국융합학회논문지
    • /
    • 제11권10호
    • /
    • pp.89-96
    • /
    • 2020
  • 링크드 데이터는 다양한 영역의 데이터세트를 서로 연결할 수 있는 표준 방식의 구조화된 데이터를 가능하게 한다. 그리고 링크드 오픈 데이터(LOD)의 급속한 발전에 따라 연구자들은 시맨틱 유사도 평가와 같은 특정 문제를 해결하기 위해 LOD를 이용하고 있다. 이 논문에서는 LOD-기반 추천 시스템에서 사용될 수 있는 자원 간의 링크드 데이터 시맨틱 거리를 계산하기위한 방법을 제안한다. 이 논문에서 제안된 시맨틱 거리 측정 모델은 LOD-기반 시맨틱 거리와 정보 검색 분야에서 잘 알려진 TF-IDF를 이용한 새로운 링크 가중치를 결합한 유사도 측정을 기반으로 한다. 이 논문의 접근방식의 효과성을 검증하기 위하여 DBpedia와 MovieLens의 혼합 데이터를 사용하여 LOD-기반 추천 시스템의 맥락에서 성능을 평가하였다. 실험 결과는 제안된 방법이 다른 유사한 방법과 비교하여 더 높은 정확도를 나타내었다. 또한 시맨틱 거리 계산의 범위를 넓혀서 추천 시스템의 정확도 향상에 기여하였다.

클라우드 환경에서 문서의 유형 분류를 위한 시맨틱 클러스터링 모델 (Semantic Clustering Model for Analytical Classification of Documents in Cloud Environment)

  • 김영수;이병엽
    • 한국콘텐츠학회논문지
    • /
    • 제17권11호
    • /
    • pp.389-397
    • /
    • 2017
  • 최근 시맨틱 웹 문서는 클라우드 기반으로 생성 및 유통되고 문서유형 분류에 따른 쉽고 신속한 정보 검색을 위해 지능형 시맨틱 에이전트를 요구하고 있다. 기존의 웹 문서의 검색은 키워드를 이용하여 해당하는 질의어가 포함된 문서 목록을 결과로 가져오며 사용자의 요구시에 내용을 제시하는 것이 일반적인 형태이다. 이는 웹 문서의 유사도와 시맨틱 관련성을 고려하지 않음으로써 사용자가 내용 검색과 분석에 많은 시간과 노력을 요구한다. 이의 해결을 위해서 빅 데이터 요소 기술인 하둡과 NoSQL을 활용하여 시맨틱 웹 문서에 포함된 키워드 빈도에 기반한 웹 문서의 유형 분류와 유사도를 제시하는 시맨틱 클러스터링 모델을 제안한다. 제안 모델은 실시간 데이터 처리가 요청되는 이종 모델을 가진 공공 데이터와 웹 데이터를 취합하여 일반 사용자가 쉽게 질의할 수 있는 대용량 지식 기반 시스템을 구축하는데 응용 모델로 활용될 수 있다.

관계형 데이터베이스에서의 시맨틱 기반 키워드 탐색 시스템 (Semantic-based Keyword Search System over Relational Database)

  • 양영휴
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권12호
    • /
    • pp.91-101
    • /
    • 2013
  • 키워드의 모호성은 효율적인 키워드 탐색에 있어서 일반적인 이슈가 되어왔는데, 이 모호성은 탐색결과의 신뢰성에 큰 영향을 줄 수 있으며, 기본적으로 질의에 사용된 용어 자체가 가지는 문맥상 의미의 모호함에 기인한다. 질의 자체의 모호함뿐만 아니라, 사용자들이 그 탐색 결과를 적절하게 해석하기 위해 결과에 나타나는 키워드간의 관계도 중요하므로 명확하게 명시 되어야 한다. 이 논문에서는 기존의 질의 용어와 스키마 용어/인스턴스간의 키워드 매핑기법을 적용하여 키워드 탐색의 모호성을 해결한다. 용어간의 매핑에서는 질의 키워드와 스키마 용어간의 구문적 유사성은 물론 시맨틱 유사성까지 고려하기 때문에 기존의 시스템에 비해 매핑과 정밀도가 50% 이상 상승하는 결과를 얻을 수 있다. 탐색결과에 나타나는 용어간의 불분명한 관계를 점 더 명확하게 나타내기 위하여 시맨틱 웹 기술을 적용하여 키워드간의 의미 있는 관계를 더 많이 지식베이스 내에서 찾을 수 있도록 하였다.

물리 효과 기반 서비스 디스커버리 (Physical Effect Based Service Discovery)

  • 신용진;김도현;이영희;최우진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.970-973
    • /
    • 2008
  • 본 논문은 대체 서비스 디스커버리를 위한 효과 기반 명세 모델과 매칭 방식을 제안한다. 효과기반이라 함은 시맨틱 웹의 IOPE 모델에서 효과(effect)를 재 정의 하여 서비스 및 디바이스를 명세하는데 사용한다는 말이다. 여기서 효과는 인간이 인지할 수 있는 오감을 사용하며, 오감의 인지는 센서를 통하여 한다. 오감을 이용하여 서비스를 탐색 함으로써, 우리는 서비스의 가용성을 높일 수 있다. 매칭은 서비스를 세 가지의 타입으로 나눈 후 각 타입에 해당하는 항목별로 유사도를 계산하고 각 항목들의 합으로 최종 유사도를 도출해 낸다. 본 연구에서 제안한 효과 기반 서비스 디스커버리는 기존의 시맨틱 서비스 디스커버리보다 서비스의 가용성을 높여 줄 것으로 기대한다.

시맨틱 서비스 플랫폼상에서의 신뢰성 비교 평가 (Comparative Reliability Evaluation on Semantic Service Platforms)

  • 정한민;이미경;류범종;김도완
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.105-109
    • /
    • 2010
  • 정보화 사회 핵심 인프라인 웹 상에서 수많은 정보 서비스가 제공되고 있지만, 차세대 웹이라 일컫는 시맨틱 웹 기술을 활용한 시맨틱 서비스는 그 숫자나 서비스 제공 범위에 대한 공감대에 있어서 아직 성숙되지 못한 상태이다. 본 연구는 2개의 시맨틱 서비스들의 동일한 세 가지 기능들을 비교 평가하는 방식으로 시맨틱 서비스를 개발함에 있어 반드시 고려해야 할 신뢰성을 어떻게 측정할 수 있을 것인지 그 방법을 제시하고 있다. 비교 대상 시스템의 신뢰성 측정을 위해, 피실험자의 기대-결과 신뢰성과 작업 정확도 측정이 관찰자 관점에서 수행되었으며, 다른 한편으로, 기능적 신뢰성과 정보 신뢰성 스칼라 값(0~5)을 피실험자 스스로 벡터 그래프에 나타내도록 하였다. 실험결과는 관찰자에 의한 평가 값과 피실험자에 의한 평가 값이 매우 유사함을 보여 주었으며, 서비스된 정보의 정확성과 작업 수행의 만족성이 사용자 관점에서 상호 밀접한 관계를 가진다는 사실을 확인하여 주었다. 본 연구 결과를 통하여, 우리는 시맨틱 서비스가 제공하는 기능적 신뢰성과 기능 수행의 결과로 서비스되는 정보에 대한 신뢰성이 정보 시스템의 신뢰성 평가를 위한 필수적 요소임을 알 수 있었다. 특히, 신뢰성은 시맨틱 정보 서비스에서 사용상 품질 (Quality in Use)을 의미한다고 볼 수 있으며, 결과적으로 서비스의 사용상 품질을 결정하는 중요한 요소임을 실증하였다.

BERT 기반 의미론적 검색을 활용한 관광지 순위 시스템 개발 (Development of a Ranking System for Tourist Destination Using BERT-based Semantic Search)

  • 이강우;김명선;홍순구;노수경
    • 한국산업정보학회논문지
    • /
    • 제29권4호
    • /
    • pp.91-103
    • /
    • 2024
  • 본 연구의 목적은 시맨틱 검색 기법을 활용하여 사용자 쿼리 기반의 타당한 정확도를 가진 관광지 랭킹시스템을 설계하는 것이다. 이를 위해 관광지에 대한 텍스트 리뷰 데이터 수집, 데이터 전처리 및 SBERT를 활용한 임베딩 과정을 거쳤다. 이후 유사도를 측정하고 임계값을 충족하는 데이터를 필터링한 후 카운트 기반 랭킹 알고리즘을 적용하여 쿼리와 의미적으로 유사한 순서로 관광지 순위를 도출하였다. 제안된 랭킹 알고리즘의 평가를 위해 4개의 쿼리로 실험을 진행하여 연관성이 높은 상위 5개 관광지를 도출하였다. 도출된 결과값의 비교를 위해 58,175개의 문장에 직접 라벨을 붙여 세 번째 쿼리인 혼잡도와 의미적으로 연관성이 있는지를 확인하였다. 두 결과값이 유사하여 본 연구에서 제시된 랭킹 알고리즘의 효율성이 검증되었다. 임계값 최적화, 데이터 불균형 등의 문제에도 불구하고 이 연구는 시맨틱 검색 기법을 이용하여 적은 비용과 시간으로도 사용자의 의도를 파악하여 관광지를 추천하는 것이 가능하다는 것을 보여주었다.

군집분석을 이용한 하이브리드 클라우드 컴퓨팅 환경에서의 시맨틱 클라우드 자원 추천 서비스 기법 (Semantic Cloud Resource Recommendation Using Cluster Analysis in Hybrid Cloud Computing Environment)

  • 안윤선;김윤희
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권9호
    • /
    • pp.283-288
    • /
    • 2015
  • 하이브리드 클라우드 컴퓨팅 환경에서 많은 과학자들이 과학 응용을 수행하고 있으나, 클라우드 컴퓨팅 서비스를 제공하는 각 회사들의 자원 표기법이 상이하고 복잡하여 사용에 어려움이 따르고, 응용에 적합한 클라우드 자원을 선택하는 것이 어렵다. 클라우드 서비스 간에 상호 호환성을 제공해주는 하이브리드 클라우드 환경에서의 표준화된 자원 명세 표기법이 필요하다. 과학자들은 기존에 자신들이 수행했던 자원이나 가장 좋은 성능의 자원에서만 수행하려는 경향이 있어, 비용, 시간을 효율적으로 수행하면서 응용에 적합하고, 기존의 실험과 유사하게 진행할 수 있는 자원을 추천해주는 서비스가 필요하다. 하이브리드 클라우드 서비스의 표준화를 위해 인터클라우드 프로젝트가 진행되고 있으나, 과학 응용 실험에 적합한 자원의 선택을 위해 필요한 클라우드 자원의 특성들을 나타내는 데 한계가 있다. 본 논문에서는 하이브리드 클라우드 환경에서 시맨틱 클라우드 자원 서비스를 제안한다. 통계 기법으로 과학 응용의 특징에 따라 응용에 적합한 클라우드 자원을 그룹으로 분류하고 분류된 유사한 클라우드 자원 그룹을 가지고 시맨틱 클라우드 자원 추천 서비스 기법을 제공한다. 제안한 알고리즘을 통해 시맨틱 클라우드 추천 서비스 기법을 제공하면, 효율적인 자원의 가용성과 비용으로 응용을 수행할 수 있고, 응용에 적합한 클라우드 자원을 추천할 수 있다.