• 제목/요약/키워드: 웹 검색어

검색결과 263건 처리시간 0.034초

LOD 클라우드에서의 연결정책 기반 동일개체 심층검색 및 정제 시스템 구현 (Implementation of Policy based In-depth Searching for Identical Entities and Cleansing System in LOD Cloud)

  • 김광민;손용락
    • 인터넷정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.67-77
    • /
    • 2018
  • 본 연구에서는 동일연결트리플들을 생성하는 대신 각 LOD마다 연결정책을 수립, 공개하고 검색 시점에서 참조하는 방식으로 개체간의 동일성을 파악하는 방안과 이러한 연결정책을 명세하기 위한 어휘를 제안하였다. 또한, 연졀정책이 운영되는 환경에서 여러 LOD들에 걸친 심층검색이 실질적으로 진행되는 것을 확인하기 위하여 PISC(Policy based In-depth Searching and Cleansing)을 구현하였으며 이를 Github에 공개하였다. LOD 클라우드는 여러 LOD들의 자발적인 참여로 이루어짐에 따라 검색된 개체들의 동일성에 대한 평가가 필요하다. 이에, PISC는 개체간 동일성 평가를 통하여 사용자가 요구한 동일수준 이상의 개체들로 정제된 검색결과를 제공한다. 검색결과로는 RDF로 모델링된 개체별 상세 검색내용과 이에 대한 의미적 구조인 온톨로지를 함께 제공된다. PISC에 대한 실험은 DBpedia의 5개 LOD를 대상으로 진행하였으며 소스와 타겟 RDF 트리플 목적어의 유사도를 0.9 정도로 요구할 경우 검색결과가 적절한 확장률과 포함률을 가지는 것으로 확인하였다. 또한, 연결정책에는 3개 이상의 타겟LOD를 명세할 경우 동일성이 충분히 검증된 개체들을 확보할 수 있는 것으로 확인하였다.

XSTAR: XML 질의의 SQL 변환 알고리즘 (XSTAR: XQuery to SQL Translation Algorithms on RDBMS)

  • 홍동권;정민경
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.430-433
    • /
    • 2007
  • XML이 다양한 분야에 널지 이용되면서 대용량의 XML을 효과적으로 관리하는 여러 가지 방법들이 연구되고 있다. 특히 지금가지 상업적, 기술적으로 성공적인 데이터 모델인 관계형 데이터베이스를 기반으로 한 여러 가지 방법들이 연구되고 있다. 본 논문은 관계형 DBMS를 사용하여 XML 질의어인 XQuery를 SQL로 변환하는 알고리즘인 XSTAR(XQuery to SQL Translation Algorithms on RDBMS)를 설계 및 구현한다. 본 연구의 XSTAR 알고리즘은 기본적인 XPath 뿐만 아니라 XQuery FLWOR 표현식, XQuery함수, 그리고 전문 검색(Fulltext 검색[8])과 관련된 몇몇 특수한 기능을 효율적으로 지원할 수 있으며, 질의의 결과 값을 XML 형태로 재생성하여 사용자에게 반환한다. 본 논문에서 제안하는 XSTAR 알고리즘은 현재 웹 상에서 공개적으로 시범 운용되고 있는 XML 문서의 관리 및 질의 처리 시스템인 XPERT(XML Query Processing Engine using Relational Technologies, http://dblab.kmu.ac.kr/project.jsp")의 질의 처리 엔진으로 사용되고 있다.

효과적인 지식확장을 위한 LOD 클라우드에서의 변화수용적 심층검색 (Change Acceptable In-Depth Searching in LOD Cloud for Efficient Knowledge Expansion)

  • 김광민;손용락
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.171-193
    • /
    • 2018
  • 본 연구는 시멘틱 웹의 실질적 구현체인 LOD 클라우드에서 연결정책을 활용함으로써 LOD들간 연결을 효과적으로 제공하고 LOD의 변경된 내용을 검색결과에 빠짐없이 반영할 수 있는 방안을 제시한다. 현재 LOD 클라우드에서는 개체간 연결은 를 이용하여 개체들이 동일함을 명시적으로 기술하는 방식으로 이루어져 있다. 하지만, 이러한 명시적 연결방식은 LOD 클라우드 규모의 방대함에도 불구하고 개체간 동일성을 개체단위에서 파악하여야 하는 어려움이 있으며 주기적으로 LOD에 추가하여야 함에 따라 검색 시 개체들이 누락되는 한계가 있다. 이를 극복하기 위하여 본 연구에서는 명시적 연결을 생성하는 대신 LOD별로 연결하고자 하는 LOD와의 연결정책을 수립하여 LOD와 함께 공개하는 방식을 제안한다. 연결정책을 활용함으로써 연결하여야 할 동일개체를 검색시점에서 파악할 수 있으므로 추가되었던 개체들을 누락됨 없이 검색결과에 포함시킬 수 있고 LOD 클라우드에서의 연결성도 효과적으로 확충할 수 있다. 확충된 연결성은 정보의 지능적 처리의 선행과정인 지식확장의 근간이 된다. 연결정책은 연결하고자 하는 소스와 타겟 LOD의 주어 개체들간의 동일성을 평가하는데 도움이 되는 술어 쌍을 명세하는 방식으로 수립하며 검색 시 이러한 술어쌍에 대응하는 RDF 트리플을 검색하고 이들의 목적어들이 충분히 동일한 것인가를 평가하여 주어개체들의 동일수준을 판단한다. 본 연구에서는 이러한 연결정책을 이용하여 여러 LOD들을 심층적으로 검색하는 시스템을 구현하였다. 검색과정에서는 기존 명시적 연결들도 함께 활용하도록 구현하였다. 검색시스템에 대한 실험은 DBpedia의 주요 LOD들을 대상으로 진행하였다. 실험결과 연결대상 개체들의 목적어들이 0.8 ~ 0.9의 유사수준을 가지는 경우 적정한 확장성을 가지고 충분히 신뢰적인 개체들을 적절하게 포함하는 것으로 확인하였다. 또한, 개체들은 8개 이상의 동일연결을 제공하여야 검색결과가 신뢰적으로 활용될 수 있을 것으로 파악되었다.

소셜 빅데이터 텍스트 마이닝을 활용한 전국장애인체육대회 분석 연구 (Study on the Analysis of National Paralympics by Utilizing Social Big Data Text Mining)

  • 김대경;이현수
    • 한국체육학회지인문사회과학편
    • /
    • 제55권6호
    • /
    • pp.801-810
    • /
    • 2016
  • 본 연구는 전국장애인체육대회 관련 키워드를 분석하여 객관적인 시각을 통한 비장애인의 인식 전환과 인터넷 웹 브라우저를 활용한 전국장애인체육대회 참여율 향상을 위한 기초자료로 제시하는데 목적이 있다. 연구목적을 네이버, 다음, 구글 사이트에서 제공하는 뉴스 기사, 블로그를 통하여 수집된 전국장애인체육대회, 전국장애인체전 관련 소셜 빅데이터를 대상으로 하였다. 자료처리는 R-3.3.1 Version Program을 이용하여 워드클라우드, 연관성 분석, 사회연결망 분석을 사용하였다. 이상과 같은 연구방법 및 자료분석의 결과를 통해 도출된 결론은 다음과 같다. 첫째, 제33회~제35회에 대한 전국장애인체육대회 키워드에서는 경기결과, 종목, 선수단 참가, 개최지역 소식이 중점적으로 나타났다. 둘째, 제33회~제36회에 대한 전국장애인체육대회 연관성 분석을 통하여 네이버, 다음 등 웹 검색에서의 연관 검색어와 유사함을 나타냈다. 셋째, 전국장애인체육대회, 장애인체육, 장애인, 체육 키워드 간의 높은 근접 중심성을 나타내고 있으며, 생활체육, 참여, 연구, 발전, 스포츠-장애인, 연구-장애인, 생활체육-참여, 장애인-참여, 생활체육-장애인, 개최-전국장애인생활체육대회 키워드 간의 연결 중심성과 매개 중심성이 비례하게 나타났다.

TV 시청 환경에 적합한 위젯 가이드라인 제안 (Widget Guideline for TV Environment)

  • 위승용;이상선
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.1001-1008
    • /
    • 2009
  • Newsweek 가 2007 년을 '위젯의 해'라고 선언할 정도로 IT산업에서 위젯에 대한 관심이 커져가고 있다. 위젯은 인터넷으로부터 정보를 전달 받아 화면에 표시하는 작은 그래픽 사용자 인터페이스 도구의 일종을 뜻한다. 위젯은 웹 사이트와 연동하여 제 기능을 다할 뿐 아니라 데스크톱, 모바일, 심지어 TV로까지 연동될 채비까지 갖추어 가고 있다. 그러나 현재 TV 환경에서는 TV용 위젯 그래픽 가이드라인이 없는 실정이다. 본 연구의 목적은 TV 시청 환경에 적합한 위젯 가이드라인을 제안함에 있다. TV와 PC의 사용 환경은 서로 다르며 크게 세 가지 측면으로 볼 수 있다. 첫째는 목적적 측면이다. PC는 주로 작업, 검색의 목적을 가지고 있는 반면, TV는 즐기고, 쉬기 위한 목적을 가지고 있다. 둘째는 조작적 측면이다. PC는 키보드, 마우스와 같은 다양한 입력 도구를 사용하여 문자와 위치 등을 쉽게 입력하고 다양한 조작을 할 수 있는 반면, TV는 리모컨으로 제한적인 조작을 한다. 셋째는 시청 환경적 측면이다. TV의 시청거리는 PC나 모바일 보다 멀다. 그리고 보편적으로 가족이 공유하는 미디어라는 점을 알 수 있다. 본 연구를 위하여 세 가지 선행연구를 종합하였다. 첫째, 위젯의 정의와 유형에 대해서 연구하였다. 둘째, TV와 PC환경의 차이를 연구하였다. 셋째, 위젯과 TV의 가이드라인을 분석하였다. 이와 같은 선행연구를 종합하여 TV 환경에 적합한 위젯 디자인 가이드라인을 도출하였다. 연구자는 가이드라인을 콘텐츠, 그래픽, 인터랙션 세 부분으로 나누어 각각에 대한 가이드라인을 제안한다. 또한 연구자가 제안하는 가이드라인의 적합성을 검증하기 위하여 이 가이드라인에 토대로 한 TV 용 위젯을 제안한다. 연구의 범위는 국내의 40 인치 HDTV를 중심으로 제한한다. PC 에서처럼 TV 에서 위젯이 정착하기 까지 많은 시행착오가 있을 것이라 예상된다. 본 연구가 TV 환경에 적합한 위젯에 관한 연구의 시작이 되기를 기대한다.

  • PDF

질의 재구성 기반의 XQuery 질의 정제 (XQuery query Refinement Based on Query Rewriting)

  • 최성일;박종현;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.62-65
    • /
    • 2006
  • XML은 웹 상에서 데이터의 표현과 교환을 위한 표준이다. XQuery는 XML 질의를 위한 W3C 표준으로서 XML 문서를 효율적으로 검색하기 위해서 W3C에서 제안한 표준질의어이다. XQuery가 등장하면서, 이를 빠르게 처리하기 위한 연구가 많이 진행 중이며, 이 연구 중 한 분야는 XQuery 질의를 정제하는 것이다. 사용자에 따라 다양하게 작성되는 XQuery 질의들은 정제되어 있지 않을 수 있다. 질의의 불필요한 연산이나 표현을 제거하여 간결하게 만드는 것은 질의를 효율적으로 처리하게 하여 성능을 향상시키는데 도움을 준다. 이에 대한 이전의 연구들은 XML 데이터의 저장구조나 시스템에 의존적인 질의 정제방법을 사용하므로 이들 방법을 일반적인 XQuery 질의 정제로 볼 수는 없다. 그러나 우리의 정제방법은 XQuery 질의를 기반으로 하여 일반적인 상황에서도 질의의 정제가 가능하므로 XQuery를 입력으로 하는 다른 시스템에서 우리의 방법으로 입력 질의를 정제하여 효율적으로 질의를 처리할 수 있다. 본 논문에서는 XQuery 질의를 효율적으로 처리하기 위하여 두가지 정제방법을 제안한다. 첫째는 불필요한 연산이나 표현을 제거하는 방법이고, 둘째는 질의의 순서를 재배치하는 방법이다. 이 방법들을 통하여 질의를 보다 빠르고 효율적으로 처리하도록 한다. 끝으로, 우리는 성능평가를 통하여 우리의 정제방법의 효율성을 입증한다.

  • PDF

EM 알고리즘을 이용한 전문용어 온톨로지 클래스간 관계 정의를 위한 동사 클러스터링 (Verb Clustering for Defining Relations between Ontology Classes of Technical Terms Using EM Algorithm)

  • 김미훈;남상협;이용훈;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.233-240
    • /
    • 2007
  • 온톨로지 구축에서 클래스간 관계 설정은 중요한 부분이다. 본 논문에서는 클래스간 상 하위 관계 외의 관계 설정을 위한 클래스간 관계 자동 정의를 목적으로 의존구문분석의 (주어, 용언) (목적어, 용언) 쌍들을 추출하고, 이렇게 추출된 데이터를 이용하여 용언들을 클러스터링 하는 방법을 제안한다. 도메인 전문 코퍼스 데이터 희귀성 문제를 해결하고자, 웹검색을 결합한 방식을 선택하여 도메인 온톨로지 구축 클래스간 관계 자동 설정에 대한 방법론을 제시한다.

  • PDF

NutriSyn(식품어휘지능망): 웹 기반 식품.음식 유의어 지식 구축 및 검색 서비스 구현 (NutriSyn: Knowledge Based Synonym Retrieval Service for Food and Dishes on the Web)

  • 홍순명;조지예;박유정;김민찬;김곤
    • 대한영양사협회학술지
    • /
    • 제15권3호
    • /
    • pp.286-297
    • /
    • 2009
  • Studies based on food analysis or food databases use the national standard food database. Although Internet information services are increasing gradually, users are only able to get definitive and profitable information using standard food terms. Until now, it has been uncommon to find food retrieval services that include users' regional or historical characteristics. Thus, this study introduces a prototype for Food and Dish Synonym Retrieval (NutriSyn) that includes synonyms and related words. The environments which NutriSyn was implemented were Linux for the server operating system, the Microsoft Windows series for the users' operating system and Apache for a web server. The development languages used are PHP, JavaScript and HTLM with a MySQL database. Users can access NutriSyn using Internet browsers. The main menu items are (1) Food Synonym DB, (2) Dish Synonym DB, (3) Food Information DB, (4) Dish Information DB, and (5) Food and Menu Synonym Retrieval. This system is expected to be a useful tool for food experts and interdisciplinary research.

  • PDF

빅데이터 분석을 활용한 인공지능 인식에 관한 연구 (A Study on Recognition of Artificial Intelligence Utilizing Big Data Analysis)

  • 남수태;김도관;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.129-130
    • /
    • 2018
  • 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 글로벌 리서치 기관들은 빅데이터 분석을 2011년 이래로 가장 주목받는 신기술로 지목해오고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 새로운 가치 창출을 위해 노력을 하고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석 도구인 소셜 매트릭스를 활용하여 분석하였다. 2018년 5월 19일 시점 1개월 기간을 설정하여 "인공지능" 키워드에 대한 대중들의 인식을 분석하였다. 빅데이터 분석의 결과는 다음과 같다. 첫째, 인공지능에 대한 1위 연관 검색어는 중국(4,122)인 것으로 나타났다. 결과를 바탕으로 연구의 한계와 시사점을 제시하고자 한다.

  • PDF

빅데이터 분석을 활용한 사물인터넷 키워드에 관한 조망 (An Insight Study on Keyword of IoT Utilizing Big Data Analysis)

  • 남수태;김도관;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.146-147
    • /
    • 2017
  • 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 글로벌 리서치 기관들은 빅데이터 분석을 2011년 이래로 가장 주목받는 신기술로 지목해오고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 새로운 가치 창출을 위해 노력을 하고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석 도구인 소셜 매트릭스를 활용하여 분석하였다. 2017년 10월 8일 시점 1개월 기간을 설정하여 "사물인터넷" 키워드에 대한 대중들의 인식을 분석하였다. 빅데이터 분석의 결과는 다음과 같다. 첫째, 사물인터넷 키워드에 대한 1위 연관 검색어는 기술(995)인 것으로 나타났다. 결과를 바탕으로 연구의 한계와 시사점을 제시하고자 한다.

  • PDF