• 제목/요약/키워드: 키워드 탐색

검색결과 245건 처리시간 0.026초

KNetIRS : 키워드망을 이용한 정보검색 시스템 (KNetIRS : Information Retrieval System using Keyword Network)

  • 우선미;유춘식;이종득;김용성
    • 한국정보처리학회논문지
    • /
    • 제4권9호
    • /
    • pp.2185-2196
    • /
    • 1997
  • 기존의 정보검색 시스템들은 질의가 정확하지 않더라도 원하는 정보를 검색할 수 있도록 하기 위해 시소리스 (thesaurus)를 사용했다. 그러나 시소러스를 구축하고 유지하는데 드는 비용이 매우 높고 검색에 있어서도 완전하다고 볼 수 없다. 그래서 본 논문에서는 이러한 문제점들을 해결하기 위하여 키워드망을 이용한 정보검색 시스템인 KNetIRS를 설계 및 구현한다. 키워드망은 문서로부터 직접 추출한 키워드들로 구성된다. KNetIRS는 역파일 (Iinverted file)의 개념에 기반을 둔 키워드망을 이용하여 데이터베이스에서 적합한 문서만을 탐색한다. 그리고 KNetIRS는 역파일 (Iinverted file)의 개념에 기반을 둔 키워드망을 이용하여 데이터베이스에서 적합한 문서만을 탐색한다. 그리고 KNetIRS는 키워드망 브라우저(Keyword Network Browser)를 사용하여 질의를 확장하고, 분할 연산(spilt function)을 정의하여 "정보 검색", "정보", 그리고 "검색"과 같은 복합어에 관한 처리를 한다.

  • PDF

콘텐트 노드의 유사성 제어를 통한 그래프 구조 데이터 검색의 다양성 향상 (Improving Diversity of Keyword Search on Graph-structured Data by Controlling Similarity of Content Nodes)

  • 박창섭
    • 한국콘텐츠학회논문지
    • /
    • 제20권3호
    • /
    • pp.18-30
    • /
    • 2020
  • 최근 소셜 네트워크, 시맨틱 웹 등 여러 분야에서 그래프 구조 데이터가 널리 사용됨에 따라 대량의 그래프 데이터에 대한 효과적이고 효율적인 검색 방법의 필요성이 커지고 있다. 기존 키워드 기반 검색 방법들은 대부분 주어진 질의에 대한 연관도만을 고려하여 결과를 구한다. 그러나 이런 방법은 질의 연관도는 높지만 콘텐트 노드들을 공유하는 유사한 결과들이 함께 선택될 가능성이 높다. 이런 문제점을 개선하기 위해 본 논문에서는 키워드 질의에 대한 답 트리에 포함된 콘텐트 노드들의 유사성을 제어하여 콘텐트 노드가 다양한 답 트리들을 구하는 top-k 검색 방법을 제안한다. 다양한 답 트리 집합의 기준을 정의하고, 다양한 top-k 결과 집합을 구하기 위한 두 가지 방법으로 점진적 나열 알고리즘과 A 탐색 기법을 이용한 휴리스틱 탐색 알고리즘을 설계한다. 또 휴리스틱 탐색의 성능을 높이기 위한 개선 방법을 제시한다. 실 데이터를 이용한 성능 실험 결과를 통해, 본 논문에서 제안한 휴리스틱 탐색 방법이 질의 연관성뿐만 아니라 콘텐트 노드들의 상이도가 높은 다양한 답 트리들을 효율적으로 구할 수 있음을 보인다.

논문의 저자 키워드를 이용한 실시간 연구동향 분석시스템 설계 및 구현 (Design and Implementation of Real-Time Research Trend Analysis System Using Author Keyword of Articles)

  • 김영찬;진병삼;배영철
    • 한국전자통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.141-146
    • /
    • 2018
  • 저자가 작성하는 논문의 저자 키워드는 논문 내용의 특징을 나타내는 가장 중요한 요소이며, 이를 실시간으로 분석하여 사용자에게 제공하게 함으로써, 연구동향을 파악하는 것이 가능하다. 서지로 작성된 논문의 비정형 데이터를 데이터베이스로 구축 하고, 이를 활용하여 실시간 탐색이 가능하도록 색인데이터 구조를 만든다. 특정 키워드가 포함된 논문을 색인데이터 구조에서 탐색하고, 저자키워드를 대상으로 추출, 클러스터링 하여 가중치에 따라 크기별로 나타낼 수 있는 워드클라우드로 사용자에게 제공하여, 연구동향을 가시화 하는 방법을 설계하였다. 또한, 구현된 시스템에서 "바이러스"와 "홍채인식" 키워드를 통하여 연구동향 분석 결과를 제시하였다.

DER 테이블을 이용한 고속 키워드 탐색 (A Study about Fast Keyword Retrieval using AC DER table)

  • 정규철;장혜숙;이진관;박기홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.761-764
    • /
    • 2003
  • 효율적인 키워드 추출이 정보검색 시스템에서 매우 중요한 일임에도 불구하고 원하는 목적의 적당한 키워드를 결정하는 것은 매우 어렵다. 왜냐하면 많은 복합어를 가지고 있기 때문이다. 기존 방법에서는 AC 머신의 경우 단일 키워드를 가지고 복합 키워드를 검색하지 못한다. 이러한 문제를 해결한 DER 구조의 경우에는 많은 검색시간이 걸리는 문제점을 가지고 있다. 따라서 본 논문에서는 이러한 문제점들을 해결하기 위해 이들을 기반으로 한 DERtable (DER 구조의 검색방법을 가지고 테이블로 구성)구조를 제안한다.

  • PDF

RDF/S 및 OWL 문서에 대한 키워드 검색 알고리즘 (A New Keyword Search Algorithm for RDF/S and OWL Documents)

  • 김학수;손진현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.321-324
    • /
    • 2009
  • XML 또는 RDBMS 에서의 키워드 검색은 기존의 정보 검색처럼 데이터의 구조 또는 질의 언어에 대한 사전 지식 없이 질의 처리를 수행하는 연구 분야 중의 하나이다. 오늘날 키워드 검색을 효율적으로 처리하기 위해 제안된 연구들은 그래프 기반의 질의 처리에 기반한 기법들에 초점을 두고 있다. 이러한 접근들은 XML 또는 RDBMS 안에 존재하는 데이터를 그래프 구조에 기반한 데이터로 변환한 다음에 그래프 탐색을 통해서 모든 질의 키워드를 포함하는 결과들을 찾는다. 그러나 기존의 기법들을 RDF/S 또는 OWL 문서와 같은 복잡한 그래프 구조에 적용하기에는 질의 성능 측면에서 많은 문제점을 가지고 있다. 또한, 온톨로지 언어의 의미적 단위로서의 RDF 트리플을 고려하지 않기 때문에 질의 결과에 대한 신뢰성을 보장할 수 없다. 이러한 관점에서 본 논문은 RDF/S 또는 OWL 저장소에서 효율적이고 의미적인 키워드 검색을 위한 인덱싱 기법 및 알고리즘을 설계한다.

키워드 관련도를 이용한 뉴스기사의 연관검색 기법 (A Relationship Search in News Articles Using a Keyword Association Frequency)

  • 김지혜;장재영;윤홍준;김한준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.53-57
    • /
    • 2010
  • 현재 많은 포털 사이트에서는 인기가 있거나 중요도가 높은 키워드에 대해 정보를 제공해주는 태그 클라우드나 연관 검색어 등의 기능이 제공되고 있다. 하지만 대부분의 뉴스기사 페이지들은 날짜와 분야별로 기사들이 나열되어 있으며 사용자는 카테고리별로 나누어진 기사를 읽을 수만 있을 뿐 그 기사와 연관된 다른 기사의 정보에 대해서 한눈에 알아 볼 수 있는 방법은 미흡한 실정이다. 또한 연관 검색어 서비스도 사용자가 검색한 입력 내용을 기반으로 연관성 정도를 분석하여 객관성을 보장하지 못하고 있다. 본 논문에서는 기존의 태그 클라우드 방식에서 좀 더 나아가 축적된 뉴스 기사로 부터 검색 키워드와 밀접히 연관된 키워드를 추출하여 제공하는 기사 검색 시스템을 소개한다. 이 시스템은 사용자가 기사 검색을 하였을 때, 키워드와 가장 밀접한 기사를 검색해 주는 것뿐만 아니라 검색어와 관련된 연관 키워드들을 보여주고 연관된 키워드간의 관계성을 보여줌으로써 뉴스 기사들 속에 숨겨진 연관정보의 탐색을 가능하게 한다.

  • PDF

연관규칙 기반 동시출현단어 분석을 활용한 기술경영 연구 주제 네트워크 분석 (Exploring the Research Topic Networks in the Technology Management Field Using Association Rule-based Co-word Analysis)

  • 전익진;이학연
    • 기술혁신연구
    • /
    • 제24권4호
    • /
    • pp.101-126
    • /
    • 2016
  • 본 연구는 동시출현단어(co-word) 분석을 이용하여 기술경영 분야의 연구 주제 네트워크를 구축하고, 핵심 연구 주제 및 연구 주제 간 상호연관관계를 도출한다. 동시출현 빈도수의 정규화를 통해 키워드 간 유사성을 도출하여 무방향 네트워크를 분석하는 기존 연구들과는 달리 본 연구는 연관규칙분석(association rule)을 통해 키워드 간 신뢰도(confidence)를 도출하여 유방향 네트워크 분석을 수행한다. 2011~2014년 기술경영 분야 9개 국제 학술지에 게재된 2,456개의 논문의 저자키워드를 대상으로 빈도수 상위 200개 키워드를 추출하고, 주제(THEME), 방법(METHOD), 분야(FIELD)의 세 가지 유형으로 키워드를 분류한다. 각 유형별 일원(one-mode) 네트워크를 구축하여, 함께 많이 연구가 이루어진 키워드들을 찾아내고, 핵심 키워드를 도출한다. 또한 두 가지 유형의 키워드 간의 이원(two-mode) 네트워크를 구축하여, 연구 주제별로 함께 많이 활용된 방법 및 대상 분야를 탐색한다. 본 연구 결과는 최근 성숙기에 접어든 기술경영 분야의 연구 흐름 및 지식 구조를 키워드 수준에서 구체적으로 제시함으로써, 기술경영 분야 연구자들의 연구 주제 탐색 및 연구방향 설계에 활용될 수 있을 것으로 기대된다.

문헌정보학의 정보행동과 의학분야의 건강정보탐색행동에 대한 연구들의 비교 분석 (A Comparative Analysis of Research on LIS Information Behavior and Health Information Seeking Behavior)

  • 김은기
    • 한국비블리아학회지
    • /
    • 제30권2호
    • /
    • pp.167-187
    • /
    • 2019
  • 본 논문은 정보행동 분야에 상당한 연구가 진척된 문헌정보분야의 정보행동에 관한 연구와 의학분야의 건강정보탐색행동 연구를 비교하였다. 이 연구는 계량서지학적 접근으로 진행하였다. 연구 실행을 위해 Scopus 데이터베이스를 사용하여 서지기록들을 문헌정보학과 건강과의학 분야별로 데이터 세트를 구성하였다. 계량서지학적 분석은 다음과 같은 영역으로 실행하였다: 출판된 논문, 인용, 논문지, 저자키워드, 제목에서 고유한 단어, 제목에서 "information" 앞에 이용되는 단어들, 제목에서 "study" 앞에 이용되는 단어들, 제목에서 국가명을 표기한 단어들, 저자 키워드와 색인 키워드. 결과적으로, 두 분야에서 드러난 정보행동에 관한 연구영역에서의 주요차이점은 정의, 주된 초점, 일반적인 인구통계학적 그룹에서 분명하게 나타났다. 이러한 다양한 차이점은 두 학계 연구자들에게 정보 탐색과 정보행동을 연구하는데 있어 학계별 특수한 차이와 상황들에 따라 유연하게 접근하고 적용해야 함을 시사하였다.

교육정책관련 여론탐색을 위한 소셜미디어 감정분석 연구 (A Study on Social Media Sentiment Analysis for Exploring Public Opinions Related to Education Policies)

  • 정진명;유기영;구찬동
    • 정보화정책
    • /
    • 제24권4호
    • /
    • pp.3-16
    • /
    • 2017
  • 웹2.0시대와 더불어 소셜미디어 서비스의 발달로 전통적인 여론형성의 기능이 매스미디어에서 소셜미디어로 일부 이동되었으며, 이런 현상은 계속 확대되고 있어, 정부 정책에 대한 소셜미디어 기반의 여론이 관심을 받고 있다. 특히, 교육정책은 다양한 이해관계자들이 존재하고, 정책의제 설정과정에서도 많은 의견의 충돌이 발생되기 때문에 정책을 수립함에 있어 대중의 여론을 파악하는 것이 더욱 중요하다고 할 수 있다. 본 연구는 교육정책관련 소셜미디어 서비스를 통해 작성된 문서들을 오피니언 마이닝 기법으로 분석하여, 교육관련 정책에 대한 대중의 여론탐색을 목적으로 하였다. 이를 위하여 소셜미디어 서비스를 통해 사용자들이 생산하는 교육정책 관련 문서들을 키워드 기반으로 수집하고, 토큰화 시킨 후 감성자질을 추출하고 감성사전으로부터 해당 문서의 감정을 점수화 하여, 특정 교육정책 키워드에 대한 대중의 여론을 탐색하였다. 그 결과 디지털교과서, 이러닝 등을 키워드로 하는 스마트교육 정책에 대해서는 긍정보다 부정적인 감정이 많은 것으로 나타났으며, 코딩교육, 컴퓨터적 사고 등을 키워드로 하는 소프트웨어 교육 정책에 대해서는 긍정적인 여론의 방향으로 나타났다. 자유학기제, 창의 인성교육 등을 키워드로 하는 일반 정책에 대해서는 부정적인 여론이 많은 것으로 나타났다. 또한 전체 분석 대상 문서 중에서 감정 자질이 전혀 추출되지 않은 문서가 20%나 되어 블로그나 트위터의 내용에 저자의 의견이 반영되지 않은 내용이 아직 일정 비율로 존재함을 알 수 있었다.

4차 산업혁명 차세대 생산혁신 기술 탐색: 키워드 네트워크를 중심으로 (Exploring the Key Technologies on Next Production Innovation)

  • 이수철;고미현
    • 한국융합학회논문지
    • /
    • 제9권9호
    • /
    • pp.199-207
    • /
    • 2018
  • 본 연구는 4차 산업혁명으로 불리는 생산 패러다임 변화에 선도적으로 대응하기 위해 차세대 생산혁신 기술을 증거기반 키워드 네트워크를 통해 분석하는 것을 목적으로 한다. 분석을 위해 차세대 생산혁신 기술과 관련한 총 441건의 논문데이터를 추출하였고, 이 논문들의 저자 키워드 동시 등장 관계를 기반으로 차세대 생산혁신 기술 네트워크를 구축하였다. 구축된 기술 네트워크를 바탕으로 중심성 및 키워드 그룹 분석을 통해 주요 기술을 탐색하였다. 그 결과 'digital twin', 'modeling and simulation' 등 가상세계와 물리세계를 실시간으로 완벽하게 연결하여 인사이트를 발견하고, 이를 설계 및 공정에 반영하는 기술들이 주요 기술로 분석되었다. 이러한 결과는 관련 산업 내에서 4차 산업혁명으로 인한 변화를 대비하는 기업들에게 의미 있는 정보를 줄 수 있을 것으로 기대된다.