• 제목/요약/키워드: 주제 기반

검색결과 1,747건 처리시간 0.029초

위키피디아를 이용한 반자동 학습 기반의 cQA 서비스 주제 분류 시스템 (A Topic Classification System in cQA Services Based on Semi-Automatic Learning Using Wikipedia)

  • 김태현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-141
    • /
    • 2015
  • 본 논문은 커뮤니티 기반의 질의-응답 서비스에서 사용자 질의의 주제를 분류하는 시스템을 소개한다. 커뮤니티 기반의 질의-응답 서비스는 분야에 따라 다양한 주제를 가질 수 있으며 오늘 날 사용자 질의의 주제 분류에는 통계 기반의 분류 방법이 많이 이용되고 있다. 통계 기반의 분류 방법으로 사용자 질의를 분류하기 위해서는 주제에 적합한 대량의 학습 말뭉치가 필요하다. 주제에 적합한 대량의 학습 말뭉치를 사람이 직접 구축하는 것은 많은 시간과 비용이 든다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 위키피디아 문서를 Supervised K-means Clustering 기법으로 주제별로 분류함으로써 학습 말뭉치를 반자동으로 구축하는 방법을 제안한다. 그 다음, 생성된 학습 말뭉치로 지지 벡터 기계를 학습하여 사용자 질의의 주제를 분류하게 된다. 위키피디아 문서와 사용자 질의는 다른 도메인의 문서임에도 불구하고 본 논문의 시스템으로 사용자 질의의 주제를 분류한 결과 77.33%의 정확도를 보였다.

  • PDF

전자문화지도에서의 주제별 중첩 기능 활용 방안 (Application Plans of Thematic Overlap Function in Electronic Cultural Atlas)

  • 이동열;강지훈;문상호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.445-447
    • /
    • 2014
  • 최근에 전자문화지도에 대한 관심이 늘어나면서 다양한 주제를 기반으로 한 전자문화지도들이 연구 및 개발되고 있는 추세이다. 그러나 기존의 전자문화지도들은 대부분 단일 주제로 제작되므로 주제들 간의 연관성 분석이 어렵고, 전자문화지도들이 서로 연계되어 있지 않아 다양한 관점을 기반으로 한 활용이 미흡한 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여 하나의 전자문화지도에 레이어 기능을 활용하여 다양한 주제들을 표현하는 방안을 제시한다. 또한, 이를 기반으로 전자문화지도에서의 주제별 중첩 기능을 활용하여 주제들 간의 연계 관계를 효율적으로 파악하고 다양한 주제들의 연관 관계를 통해 새로운 지식을 도출해 낼 수 있는 활용 방안을 제시하고자 한다.

  • PDF

주제 임베딩을 활용한 한국어 생성 기반 챗봇 (Korean Generative Chatbot using Topic Embedding)

  • 오신혁;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.524-528
    • /
    • 2020
  • 챗봇은 발화에 대해 컴퓨터가 자동으로 응답하는 시스템이다. 현재 챗봇은 전체 주제에 대한 잡담(chit-chat)보다는 특정 주제에 관한 대화를 목적으로 많이 개발되고 있다. 하지만 개개인이 필요로 하는 챗봇 용도에 적합한 학습 데이터는 부족하다. 이러한 상황에서 챗봇 학습을 위해 필요한 주제의 말뭉치를 대량으로 구축하는 것은 시간과 비용이 많이 소모되어 현실적으로 어렵다. 따라서 학습에 필요한 소량의 말뭉치만 사용하더라도 주제에 적합한 응답을 할 수 있는 챗봇이 필요하다. 이에 본 논문은 챗봇의 목적과 관련 없는 대량의 말뭉치와 소량의 주제 기반 말뭉치를 이용하여 높은 성능을 끌어낼 수 있는 주제 임베딩 방법을 제안한다.

  • PDF

주제어 기반 분류에 관한 연구 - 미국 공공도서관의 사례를 중심으로 - (Analysis of Word Based Classification of U.S. Public Libraries and its Implications)

  • 백지원
    • 한국문헌정보학회지
    • /
    • 제44권4호
    • /
    • pp.179-201
    • /
    • 2010
  • 본 연구는 이용자 편의를 목적으로 기존의 DDC 분류를 대체하거나 보완하는 주제어 기반 분류를 적용하고 있는 미국 공공도서관의 사례를 분석하여 그 효과와 문제점을 논의하고, 이러한 시도에 대한 향후 국내에서의 논의에 필요한 시사점을 제시하는데 목적이 있다. 이를 위하여 주제어 기반 분류를 사용하는 대표적인 미국 공공도서관 사례 11개를 선정하여 새로운 분류법을 적용하게 된 배경과 과정을 구체적으로 분석하고, 현재 사용되고 있는 주제어기반 분류의 유형을 구분하여 그 실례를 시행 시기, 시행 이유, 장서 규모, 적용 범위, 적용 과정 등으로 나누어 분석하였다. 이러한 분석의 결과, 주제어 기반 분류는 도서관 이용과 운영면에서 긍정적인 효과를 보이고 있었으나 동시에 여러 가지 한계를 가지고 있다는 결론을 얻게 되었다. 이러한 분석을 바탕으로 향후 국내에서의 논의에 필요한 시사점을 도서관계의 수용성, 국내 여건에 대한 고려, 적절한 유형 선택, 사서의 전문직에 미치는 영향, 주제명표 개발의 필요성, 그리고 이용자 지원의 필요성 등으로 나누어 제안하였다.

주제어기반 분류의 분류론적 개념 정립 및 발전 방안 - 발전과정 및 기능 분석을 통하여 - (Subject Based Classification: Conceptualization and the Development Plan as a Classificatory System)

  • 백지원
    • 한국비블리아학회지
    • /
    • 제23권4호
    • /
    • pp.5-24
    • /
    • 2012
  • 본 연구는 주제어기반 분류의 발전 과정 및 현황을 종합적으로 분석하고 그 기능과 유형을 명확히 함으로써 주제어기반 분류의 분류론적 개념을 정립하고, 향후 분류체계로써의 정착 및 발전을 위한 제안을 하고자 하는 목적을 가지고 있다. 이를 위하여 본 연구는 1937년부터 현재에 이르기까지 발표된 주제어기반 분류의 필요성에 대한 논의를 수집하여 분석하고, 주제어기반 분류에 해당하는 다양한 사례를 수집하여 그 명칭과 유형을 분석하였다. 또한 분류로써의 주요 기능 수행력을 기존의 문헌분류와 비교하고, 분류와 주제명표목과의 비교 분석을 통해 지식조직체계로써의 기능과 특성을 밝히고자 하였다. 이러한 분석의 결과, 주제어기반 분류는 구체적인 기능 정의, 유형, 사용되는 정보환경, 지식조직체계간의 관계성 등을 면밀히 고려함으로써 그 분류론적 개념과 기능을 명확히 정의할 수 있음을 밝혔고, 향후 분류체계로써의 정착과 발전을 위한 발전방안을 제시하였다.

컴퓨터 교육을 위한 웹 기반 프로젝트 학습 설계 모형 탐색 (Design of Web-based Project Learning Models in Computer Education)

  • 장영진;이미화
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2006년도 동계학술대회
    • /
    • pp.249-254
    • /
    • 2006
  • 본 연구는 초등학교 컴퓨터 교과의 제재를 주제로 한 웹 기반 프로젝트 학습을 설계하는데 목적이 있다. 이에 따라 본 연구에서는 프로젝트 학습과 웹 기반 프로젝트 학습에 대한 제이론을 고찰하고 이를 바탕으로 웹 기반 프로젝트 학습 모형을 설계하여 초등학교 컴퓨터 교과의 주제를 중심으로 웹 기반 프로젝트 학습을 설계하였다. 설계 단원은 초등학교 6학년 컴퓨터 교과(재량교과)의 '정보의 이해와 윤리', '컴퓨터 기초', '소프트웨어의 활용' 영역을 예비 학습으로 학습하고, 주제별로 그룹별 프로젝트 활동을 함으로써 학습자 중심의 학습이 가능하도록 하였다.

  • PDF

문서 주제에 따른 문장 생성을 위한 LSTM 기반 언어 학습 모델 (LSTM based Language Model for Topic-focused Sentence Generation)

  • 김다해;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제54차 하계학술대회논문집 24권2호
    • /
    • pp.17-20
    • /
    • 2016
  • 딥러닝 기법이 발달함에 따라 텍스트에 내재된 의미 및 구문을 어떠한 벡터 공간 상에 표현하기 위한 언어 모델이 활발히 연구되어 왔다. 이를 통해 자연어 처리를 기반으로 하는 감성 분석 및 문서 분류, 기계 번역 등의 분야가 진보되었다. 그러나 대부분의 언어 모델들은 텍스트에 나타나는 단어들의 일반적인 패턴을 학습하는 것을 기반으로 하기 때문에, 문서 요약이나 스토리텔링, 의역된 문장 판별 등과 같이 보다 고도화된 자연어의 이해를 필요로 하는 연구들의 경우 주어진 텍스트의 주제 및 의미를 고려하기에 한계점이 있다. 이와 같은 한계점을 고려하기 위하여, 본 연구에서는 기존의 LSTM 모델을 변형하여 문서 주제와 해당 주제에서 단어가 가지는 문맥적인 의미를 단어 벡터 표현에 반영할 수 있는 새로운 언어 학습 모델을 제안하고, 본 제안 모델이 문서의 주제를 고려하여 문장을 자동으로 생성할 수 있음을 보이고자 한다.

  • PDF

시맨틱 웹 서비스를 위한 온톨로지 기반 주제어 공통 표현 모델 (Topic Keyword Common Representation Model Based on Ontology for Semantic Web Services)

  • 정한민;김평;이미경;성원경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.103-108
    • /
    • 2008
  • 주제어는 정보 서비스를 비롯한 여러 응용 분야들에서 유용하게 사용되는 지식이지만, 주제어 간 관계가 다양할 뿐만 아니라 목적에 맞도록 개별적으로 설계됨으로써 주제어 관계 속성 유형과 무관하게 공유가 가능한 주제어 공통 표현 모델이 제시되지 못하였다. 본 연구는 응용 분야, 온톨로지 종류와 무관하게 적용될 수 있으며 시맨틱 웹 서비스 간 공유가 가능한 주제어 공통 표현 모델을 제시하고자 한다. 이를 위해, 주제어 관계를 범용 클래스로 정의하고, 주제어 관계 속성 유형을 데이터타입 속성 (Datatype Property)으로 선언하였다. 또한, 주제어 역시 그 속성 유형을 데이터타입 속성으로 선언하였는데, 결국 다양한 유형의 관계들을 용이하게 표현할 수 있도록 하기 위한 것이다. 실험을 위해 주제어 간 관계수가 70,804,233개이며 주제어 관계 속성 유형이 4가지인 과학 기술 기반 정보 온톨로지와 주제어 간 관계수가 44,147개이며 주제어 관계 속성 유형이 13가지인 표준 정보 온톨로지를 대상으로 본 연구에서 제안한 주제어 공통 표현 모델을 적용하였으며 총 284,744,802개의 RDF(Resource Description Framework) Triple을 생성하였다.

  • PDF

지식기반시대 대학도서관의 주제전문화 역할 방향에 관한 연구 (A Study on the Role Model of Subject Specialization in Academic Libraries)

  • 정동열
    • 한국문헌정보학회지
    • /
    • 제36권3호
    • /
    • pp.5-23
    • /
    • 2002
  • 지식정보 환경의 급속한 변화에 따라 대학도서관에서 효율적인 정보제공을 위한 주제전문화의 역할 방향과 전략에 대한 다양한 방안을 제시한다. 주제전문화 초기 단계에 있는 우리 나라 대학도서관의 현황과 문제점을 파악하여 기능상의 변화와 주제전문화를 위한 역할 방향에 대하여 연구한다. 주요 연구내용으로는 대학도서관의 주제전문화 방향, 형태 및 고려 요소, 주제전문 사서의 역할과 양성 방안, 맞춤형 주제정보제공을 위한 기반 구축과 이용자 교육 강화, 학술정보 주제 게이트웨이 구축을 통한 주제전문화 효과 제고, 그리고 학술정보 공동이용 체제 구축 등을 제안한다.

단서표현 기반의 인물관련 질의-응답문 문장 주제 분류 시스템 (A Topic Classification System Based on Clue Expressions for Person-Related Questions and Passages)

  • 이경호;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권12호
    • /
    • pp.577-584
    • /
    • 2015
  • 일반적으로 질의응답 시스템은 입력된 질문에 대한 정답을 찾기 위해 질문과 관련된 문서 또는 단락 단위의 검색을 수행한다. 그렇지만 단어 기반의 검색만으로는 정답을 포함하는 단락을 찾기 어려운 경우가 있다. 본 논문에서는 이러한 문제를 각 문장이 가지고 있는 주제를 통해 해결할 수 있다고 판단하고 이를 위한 질의-응답문의 주제 분류 시스템에 대해 연구하였다. 이러한 시스템을 위해 필요한 인물과 관련한 주제 유형을 소개하고, 주제를 찾기 위한 단서표현을 정의하였다. 또한 단서표현기반으로 문장의 주제를 파악하는 시스템의 구성에 대해 소개하고, 이 시스템의 구성요소들에 대한 성능 평가를 수행하였다.