• 제목/요약/키워드: Semantic Expansion

검색결과 72건 처리시간 0.028초

연결정책을 이용한 개방형 연결 데이터 클라우드에서의 연결성 확충 (Linkage Expansion in Linked Open Data Cloud using Link Policy)

  • 김광민;손용락
    • 정보과학회 논문지
    • /
    • 제44권10호
    • /
    • pp.1045-1061
    • /
    • 2017
  • 본 논문은 시멘틱 웹의 실제적인 구현 결과인 개방형 연결 데이터(Linked Open Data(LOD)) 클라우드에서의 연결성을 확충하는 방안을 제시하였다. 현재의 LOD 클라우드는 최초 기대와는 달리 LOD들간의 연결성 부족으로 인하여 활발한 활용을 이끌어 내지 못하고 있다. 를 적용한 명시적연결들을 LOD에 직접 첨부하여 공개하는 현재의 연결방식은 연결대상 LOD들의 변경상황을 실시간으로 검색결과에 반영하지 못하며 별도의 작업을 통하여 이러한 명시적연결들을 생성하고 주기적으로 갱신하여야 한다는 제약을 가진다. 이에 본 논문은 명시적연결들을 첨부하는 대신 LOD마다 연결정책을 마련하고 이를 LOD와 함께 공개하는 방안을 제안하였다. 연결정책에는 타겟LOD들을 선정하고 연결판단에 필요한 술어 쌍들과 유사도를 명세하도록 하였다. 이러한 연결정책에 기반하여 여러 LOD들에 거쳐 진행하는 심층검색 기능을 API로 구현하고 이를 Github를 통하여 공개하였다. 구현한 심층검색을 유사도 1.0~0.8, 깊이 4까지에서 실험한 결과 신뢰적인 연결들을 91%~98% 수준으로 포함하고 170% 정도 규모의 적정한 확장성을 제공하는 것으로 평가되었다.

온톨로지 기반 지능형 규칙 구성요소 추출에 관한 연구 (Ontology - Based Intelligent Rule Components Extraction)

  • 김우주;채상용;박상언
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.237-244
    • /
    • 2006
  • 시맨틱 웹 관련연구가 증가함에 따라 하나의 관련분야로 규칙기반 시스템 동의 지능적인 웹 환경에 대한 기대 역시 커지고 있다. 하지만 규칙기반 시스템을 활용하기에는 아직도 규칙습득이 많은 제약이 되고 있다. 규칙습득은 웹으로부터 필요한 규칙을 습득하는 일련의 방법인데, 이러한 규칙을 습득하기 위해서는 규칙구성요소를 먼저 식별해야만 한다. 그러나 이러한 규칙을 식별하는 작업은 대부분 지식관리자의 수작업에 의해 이루어지고 있다. 본 연구의 목적은 웹으로부터 규칙구성요소 식별을 최대한 자동화하고 지식관리자의 수작업을 최소화함으로써 그 부담을 줄여 주는 데 있다. 이러한 방법으로는 온톨로지를 근간으로 하여 웹 페이지와의 문자열 비교, 이러한 비교의 한계를 극복하기 위한 확장등의 방법이 있다. 첫 번째 방법은 온툴로지 기반으로 규칙식별 할 웹 페이지와 비교를 통해 지식관리자의 규칙식별 과정을 최대한 자동화하여 주는 것이다. 여기서 만약 현재 규칙을 식별하고자 하는 웹 사이트와 유사한 시스템의 규칙들을 활용하여 일반화 된 온툴로지가 구축되었다면, 이 온톨로지를 기반으로 규칙을 식별하고자 하는 웹사이트와의 비교를 통해 규칙구성요소를 자동화하여 추출 할 수 있다. 이러한 온툴로지를 기반으로 규칙을 식별하기 위해서는 문자열 비교 기법을 사용하게 된다. 하지만 단순한 문자열 비교 기법만으로는 규칙을 식별하는 데에 자연어 처리에 대한 한계가 있다. 이를 극복하기 위해 다음의 두 번째 방법을 사용하고자 한다. 두 번째 방법은 정형화되지 않은 정보들을 확장하여 사용하는 것이다. 우선 찾고자 하는 단어들의 원형을 찾기 위한 스테밍 알고리즘 기법, WordNet을 이용하여 동의어 유의어등으로 확장을 하는 WordNet Expansion 기법, 의미 유사도를 측정하기 위한 방법인 Semantic Similarity Measure 등을 단계적으로 수행하여 자동화되고 정확한 규칙식별을 하고자 한다. 이러한 방법들의 조합으로 인하여 규칙구성요소 추출이 되지 않을 후보 단어들의 수를 줄여서 보다 더 정확하고, 지능적인 규칙구성요소 추출 방법론을 제시하고 구현하여 지식관리자의 규칙습득에 대한 부담을 줄여 주고자 한다.

  • PDF

워드 임베딩 기반 근사 Top-k 레이블 서브그래프 매칭 기법 (Approximate Top-k Labeled Subgraph Matching Scheme Based on Word Embedding)

  • 최도진;오영호;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권8호
    • /
    • pp.33-43
    • /
    • 2022
  • 지식 그래프 및 단백질 상호 작용과 같은 실제 데이터에서 개체들과 개체들의 관계 및 구조를 나타내기 위해 레이블 그래프를 사용한다. IT의 급속한 발전과 데이터의 폭발적인 증가로 사용자에게 관심 있는 정보를 제공하기 위한 서브 그래프 매칭 기술이 필요하다. 본 논문은 레이블의 의미적 유사성과 그래프 구조 차이를 고려한 근사 Top-k 서브 그래프 매칭 기법을 제안한다. 제안하는 기법은 레이블 의미적 유사도를 고려하기 위하여 FastText을 활용한 학습 모델을 이용한다. 레이블 간 의미적 유사도를 미리 계산한 LSG(Label Similarity Graph)를 통해 처리 속도의 효율을 높인다. LSG를 통해 레이블이 정확하게 일치해야 확장이 가능한 기존 연구의 한계를 해결한다. 2-hop까지 탐색을 수행함으로써 질의 그래프에 대한 구조적 유사성을 지원한다. 매칭된 서브 그래프는 유사도 값 기반으로 Top-k 결과를 제공한다. 제안하는 기법의 우수성을 보이기 위하여 다양한 성능평가를 수행한다.

공원 이슈에 대한 주요 언론의 담론변화분석 - 1995년부터 2019년까지 신문 기사를 중심으로 - (Analysis of Changes in Discourse of Major Media on Park Issues - Focusing on Newspaper Articles Published from 1995 to 2019 -)

  • 고하정
    • 한국조경학회지
    • /
    • 제49권5호
    • /
    • pp.46-58
    • /
    • 2021
  • 국내에 근대식 공원이 도입된 이후, 공원은 우리에게 필수적인 존재가 되었다. 민선시기 이후, 공원조성 등 공원을 둘러싼 이슈가 생산되고 언론을 통해 확산되어 담론을 형성하는 과정을 거쳤다. 이에 본 연구는 민선시장 체제인 1995년 이후의 '공원' 관련 이슈를 다룬 국내 중앙지의 보도기사를 수집하여 토픽분석과 의미연결망 분석을 통해 공원에 대한 시계열적 담론 변화 추이를 분석하였다. LDA 토픽모델링 분석결과, 5개의 토픽-도시공원확충(토픽1), 역사문화공원(토픽2), 이용프로그램(토픽3), 동물원 사건사고(토픽4), 공원조성과정갈등(토픽5)-으로 분류되었다. 언론에서 다룬 주요 공원담론은 다음과 같다. 첫째, 공원의 양적 확장에 대한 조성과정과 갈등이 주요 담론으로 다뤄지고 있다. 둘째, 신규 공원 조성시마다 공원명이 신규 단어로 출현하고 이후 지속적으로 언급되면서 담론형성에 한 축을 담당하고 있다. 셋째, 민선시대 공원 관련 언론에서 '주민'은 주요 주체로 '도시', '환경'과 함께 언급되며, 공원의 공공성에 대한 담론을 형성하고 있다. 본 연구는 공원이 언론을 통해 어떻게 해석되는지 담론변화를 살펴보았다는 점에서 의의를 가진다. 추후 본 연구에서 다룬 중앙지 외에 지역지, 전문지 등 다른 매체에 대한 연구를 통해 공원에 대한 다양한 관점의 담론이 다뤄지길 기대한다.

질의기반 사용자 프로파일을 이용하는 개인화 웹 검색 (Personalized Web Search using Query based User Profile)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제17권2호
    • /
    • pp.690-696
    • /
    • 2016
  • 사용자 입력 질의와 웹 문서에 포함된 단어들의 형태적 일치를 검사하여 관련 문서를 검색하는 검색엔진은 사용자의 개인별 관심 분야를 반영하는 검색 결과를 생성하기 어렵다. 본 논문에서는 개인별 관심사를 파악하여 질의 의도에 적합한 내용의 문서를 검색하는 개인화된 웹 검색 방법을 제안한다. 개인화 검색의 성능은 사용자의 개인적 관심사를 정확하게 표현하는 우수한 사용자 프로파일을 생성하는 전략에 좌우된다. 본 연구에서 개인 프로파일은 사용자가 최근 입력한 질의어들과 검색에서 클릭했던 문서들에 나타나는 주제어들이 출현 빈도를 반영한 가중치와 함께 등록된 데이터베이스이다. 특히 중의적 질의어의 정확한 의미를 결정하기 위해 워드넷을 기반으로 프로파일에 등록된 단어들과 의미 유사도를 계산한다. 기존 웹 검색 시스템의 사용자 측에 질의확장 모듈과 순위재계산 모듈을 추가하는 확장모듈을 구축하여 비교 실험하였으며, 본 연구의 방법을 적용한 개인화 웹 검색의 결과는 특히 10위 이내 상위의 결과 문서들에 대해 92%의 정확률과 82%의 재현율을 보여 향상된 성능을 검증하였다.

효율적인 한국어 파싱을 위한 최장일치 기반의 형태소 분석기 기능 확장 (Functional Expansion of Morphological Analyzer Based on Longest Phrase Matching For Efficient Korean Parsing)

  • 이현영;이종석;강병도;양승원
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권3호
    • /
    • pp.203-210
    • /
    • 2016
  • 한국어는 문장 구성소의 생략과 수식 범위가 자유롭기 때문에 파싱보다는 형태소 분석 단계에서 처리하면 좋은 경우가 있다. 본 논문에서는 파싱의 부담을 덜어 줄 수 있는 형태소 분석기의 기능 확장 방안을 제안한다. 이 방법은 미지어의 추정, 복합 명사 및 복합동사의 처리, 숫자 및 심볼의 처리에 의해 여러 형태소 열이 하나의 구문 범주를 가질 때 이것을 최장일치 방법으로 결합하고 의미 자질을 부여하여 하나의 구문 단위로 처리하는 것이다. 제안한 형태소 분석 방법은 불필요한 형태론적 모호성이 제거되고 형태소 분석 결과가 줄어들어 태거 및 파서의 정확률이 향상되었다. 또한, 실험을 통해 파싱트리는 평균 73.4%, 파싱 시간은 평균 52.9%로 줄었음을 보인다.

사용자 개인 프로파일을 이용한 개인화 검색 기법 (Personalized Search Technique using Users' Personal Profiles)

  • 윤성희
    • 한국전자통신학회논문지
    • /
    • 제14권3호
    • /
    • pp.587-594
    • /
    • 2019
  • 본 논문은 사용자의 검색 의도와 개별 관심을 반영한 순위화된 검색 결과 문서를 제공하는 개인화 검색 기법을 제안한다. 개인화 검색에서는 사용자의 개별 관심사와 선호도를 정확하게 판별하기 위한 사용자 프로파일을 생성하는 기술이 개인화 검색의 성능을 좌우한다. 개인 프로파일은 사용자의 최근 입력 질의어들과 검색과정에서 참조했던 문서들에 나타나는 주제어들의 가중치와 빈도가 기록된 데이터 집합이다. 사용자 프로파일은 웹 검색에 앞서 사용자의 입력 질의어를 개인화된 질의어들로 확장하기 위해 사용된다. 중의적 질의어의 정확한 의미를 결정하기 위해서 워드넷을 사용하여 프로파일에 등록된 단어들과 의미 유사도를 계산한다. 검색 시스템의 사용자 측에 질의확장 모듈과 순위 재계산 모듈을 확장모듈로 구축하여 진행한 실험에서 개인화 검색 기술을 적용한 실험 결과가 상위문서들에 대해서 정확률과 재현률이 크게 향상된 성능을 보이고 있다.

온톨로지 기반의 상황인지 서비스를 위한 통합 모델에 관한 연구 (A Study of Integration Modelling for Context-aware Service Based on Ontology)

  • 황치곤;윤창표
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.253-255
    • /
    • 2015
  • 다양한 네트워크 환경에서 상황인지 서비스의 제공은 데이터 간의 이질적인 문제로 통합과 공유에 많은 어려움이 있다. 본 연구는 이를 해결하기 위한 방안으로 온톨로지를 이용하는 통합 모델을 제안한다. 본 모델은 수집된 상황인지 정보를 통합하기 위해 온톨로지를 이용한다. 온톨로지는 수집되는 정보의 메타 데이터들의 수집, 의미론적 분석 및 추론을 통해 생성한다. 이것은 추가되는 시스템의 요소 분석 및 통합의 근거가 된다. 이에 따라 본 논문은 온톨로지의 생성 방법과 이를 적용하는 방안을 연구한다. 제시된 방안의 장점은 기존의 도구를 수정 없이 사용할 수 있고, 시스템의 확장이나 통합을 쉽게 수행할 수 있다.

  • PDF

자연모사적 패션디자인의 유형 및 의미 해석 (A Study on the Semantic Analysis of the type of Biomorphic Fashion Design)

  • 김지은;이지현
    • 복식
    • /
    • 제65권4호
    • /
    • pp.19-30
    • /
    • 2015
  • In recent years, various studies about 'Biomorphic design' have been conducted and accelerated among many recent design concepts and methodology. Therefore, this study classifies the types of biomorphic fashion design based on literature review, and select biomorphic fashion designs in the latest fashion designer's collection. This study aimed to determine the types and characteristics of the biomorphic design in fashion design, and analyze the characteristics and the interpreted intrinsic meanings through Greimas Semiotic rectangle model based on the Binary-Opposition of meaning and Isotophy. As the result of analysis, biomorphic designs in fashion are classified as three types: 'representational imitation of form', 'technical imitation of functional features', and 'imitation of symbolic attribute'. 'Representational imitation of form' was derived from an organic design through atypical forms, repetition and extension of figurative forms of nature, and 'the functionalities of the nature' are interpreted as the feature to maintain the condition of the life itself and to attempt to regulate the status of self-autonomy. Lastly, 'the imitation of symbolic attributes' is designing the process of creation, growth, expansion and destruction from circulation of nature.

인터넷에서 잠재적 의미 분석을 이용한 지능적 정보 검색 (Intelligne information retrieval using latent semantic analysis on the internet)

  • 임재현;김영찬
    • 한국통신학회논문지
    • /
    • 제22권8호
    • /
    • pp.1782-1789
    • /
    • 1997
  • 인터넷에서 분산 정보를 검색하는 대부분의 시스템들은 사용자가 요구하는 검색 용어의 의미를 반영하지 못해 관련된 정보를 정확히 찾지 못하고 있다. 본 논문에서는 정보 검색 성능을 향상시키는 방안으로 검색 용어의 의미를 반영할 수 있는 용어 분포에 기반한 자동화된 질의어 확장을 제안한다. 먼저, 사용자가 부여한 질의어와 전체 문서에서 용어의 중요도를 반영한 가중치(weight)를 계산하고, LSI의 SVD기법을 이용해 모든 문서에서 질의어와 유사하게 출현하는 용어의 분포를 측정하여, 이들 수치와 질의어 용어의 유사성을 측정하였다. 또한 자동적으로 추가할 용어를 줄이기 위한 방안을 연구하였으며 본 논문에서 제안한 방법을 사용해 검색 성능을 평가하였다.

  • PDF