• 제목/요약/키워드: 학회정보 분류

검색결과 11,349건 처리시간 0.038초

위키피디아를 이용한 반자동 학습 기반의 cQA 서비스 주제 분류 시스템 (A Topic Classification System in cQA Services Based on Semi-Automatic Learning Using Wikipedia)

  • 김태현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-141
    • /
    • 2015
  • 본 논문은 커뮤니티 기반의 질의-응답 서비스에서 사용자 질의의 주제를 분류하는 시스템을 소개한다. 커뮤니티 기반의 질의-응답 서비스는 분야에 따라 다양한 주제를 가질 수 있으며 오늘 날 사용자 질의의 주제 분류에는 통계 기반의 분류 방법이 많이 이용되고 있다. 통계 기반의 분류 방법으로 사용자 질의를 분류하기 위해서는 주제에 적합한 대량의 학습 말뭉치가 필요하다. 주제에 적합한 대량의 학습 말뭉치를 사람이 직접 구축하는 것은 많은 시간과 비용이 든다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 위키피디아 문서를 Supervised K-means Clustering 기법으로 주제별로 분류함으로써 학습 말뭉치를 반자동으로 구축하는 방법을 제안한다. 그 다음, 생성된 학습 말뭉치로 지지 벡터 기계를 학습하여 사용자 질의의 주제를 분류하게 된다. 위키피디아 문서와 사용자 질의는 다른 도메인의 문서임에도 불구하고 본 논문의 시스템으로 사용자 질의의 주제를 분류한 결과 77.33%의 정확도를 보였다.

  • PDF

아시아문화정보원의 문화자원 분류체계 연구 (A Study on the Classification Scheme of Cultural Resource in ACIA)

  • 이명규
    • 한국문헌정보학회지
    • /
    • 제49권1호
    • /
    • pp.319-340
    • /
    • 2015
  • 이 연구는 국립아시아문화전당 아시아문화정보원의 수집대상 문화자원을 효율적으로 관리하기 위한 분류체계를 제시하기 위하여 시도되었다. 아시아문화정보원의 목적과 수집정책 방향을 알아보고 문화자원의 특성과 범주를 파악하였다. 그리고 현재 실제로 사용하고 있는 HRAF 분류체계, UNESCO 문화지표, 민속아카이브의 분류검색, 한국향토문화전자대전의 콘텐츠목차 등 4개의 분류체계를 비교분석하였다. 이를 토대로 아시아정보원의 문화자원 분류체계의 원칙과 기준을 제시하고, 분류체계의 주제 전개는 문화적, 사회적, 자연적 영역 순으로 전개하였고, 주류는 16개의 항목으로 설정되었다.

인테리어 디자인 분야 인터넷 정보 자원 활용을 위한 분류체계 연구 (A Study on Classification System for using internet information resources on Interior Design)

  • 임경란
    • 디자인학연구
    • /
    • 제17권4호
    • /
    • pp.79-88
    • /
    • 2004
  • 본 연구는 인터넷 정보자원의 조직 문제를 파악하고 검색엔진의 특성을 유추하여 인터넷 정보자원의 분류 및 경가 기준으로 정립하였다. 이를 기반으로 인테리어 디자인 분야의 인터넷 정보 분류체계 개선안을 제시하였다. 또한 인터넷 기반 분류체계를 제공하는 주제별 디렉토리 사이트와 국외의 전문 정보사이트의 인테리어 디자인 분야 분류체계를 비교 분석하여 봄으로써 웹 주제별 디렉토리의 인테리어 디자인 정보 분류체계 모형의 구축을 시도하였다. 이들의 분류체계는 주제범위의 포괄성, 분류체계의 논리성, 주제용어의 정확성, 탐색의 효율성의 4가지 척도를 가지고 분석하였다. 그리고 인테리어 디자인 분야의 정보는 관련 분야의 정보와 혼재되어 정보의 검색이나 분류가 체계적으로 구성되어 있지 못하다. 이러한 문제점을 분석하여, 인테리어 디자인 분야 정보 분ㄹ를 위한 검색엔진의 분류체계 모형을 제시하였으며 이는 학술적인 면과 실용적인 면을 고려하였다.

  • PDF

문서 분류를 위한 문장 응집도와 주어 주도의 주제어 추출 (Sentence Cohesion & Subject driving Keywords Extraction for Document Classification)

  • 안희국;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.463-465
    • /
    • 2005
  • 문서분류 시 문서의 내용을 표현하기 위한 자질로서 사용되는 단어의 출현빈도정보는 해당 문서의 주제어를 표현하기에 취약한 점을 갖고 있다. 즉, 키워드가 문장에서 어떠한 목적(의미)으로 사용되었는지에 대한 정보를 표현할 수가 없고, 문장 간의 응집도가 강한 문장에서 추출되었는지 아닌지에 대한 정보를 표현할 수가 없다. 따라서, 이 정보로부터 문서분류를 하는 것은 그 정확도에 있어서 한계를 갖게 된다. 본 논문에서는 이러한 문서표현의 문제를 해결하기위해, 키워드를 선택할 때, 자질로서 문장의 역할(주어)정보를 추출하여 가중치 부여방식을 통하여 주어주도정보량을 추출하였다. 또한, 자질로서 문장 내 키워드들의 동시출현빈도 정보를 추출하여 문장 간 키워드들의 연관성정도를 시소러스에 담아내었다. 그리고, 이로부터 응집도 정보를 추출하였다. 이 두 정보의 통합으로부터 문서 주제어를 결정함으로서, 문서분류를 위한 주제어 추출 시 불필요한 키워드의 삽입을 줄이고, 동시 출현하는 키워드들에 대한 선택 기준을 제공하고자 하였다. 실험을 통해 한번 출현한 키워드라도, 문장을 주도하는 주어로서 사용될 경우와 응집도 가중치가 높을 경우에 주제어로서의 선택될 가능성이 향상되고, 문서분류를 위해 좀 더 세분화된 키워드 점수화가 가능함을 확인하였다. 따라서, 선택된 주제어가 문서분류의 정확도에 있어서 향상을 가져올 수 있을 것으로 기대한다.

  • PDF

퍼지 이론을 이용한 웹 에이전트의 정보 분류 평가에 관한 연구 (A Study on Information Classification Evaluation of Web Agent Using Fuzzy Theory)

  • 김두완;정구범;정환묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.361-364
    • /
    • 2004
  • 인터넷의 급격한 보급으로 다양하고 많은 종류의 유용한 정보를 이용할 수 있게 되었다. 이와 같은 정보의 바다에서 원하는 정보를 검색하고 이를 관리하고 사용하는 것은 매우 어렵다 이러한 문제를 해결하기 위해 검색엔진, 메타검색 엔진, 스파이더, 지능 에이전트 혹은 웹 에이전트와 같은 여러 종류의 시스템들이 개발되고 있다. 이와 같은 시스템들은 지능 에이전트로써 정보의 과부하를 피하기 위해 사용되어지고 있다. 소프트웨어 에이전트들을 효율적으로 개선하기 위해서는 검색된 데이터를 표현하고 분류하는 것이 필요하다. 또한, 분류기를 생성할 수 있는 지능 에이전트들의 성능을 개선하기 위해 퍼지 이론을 적용하여, 웹으로부터 다른 검색 정보와의 적합성을 평가하고, 사용자에게 가장 적합한 정보를 분류하기 위한 방법을 제안한다.

  • PDF

모바일 컨텍스트 로그를 사용한 계층적 이야기 구성 모델 (A Hierarchical Storytelling Model Using Mobile Context Log)

  • 이병길;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.49-51
    • /
    • 2006
  • 휴대폰의 사용영역이 넓어지면서 휴대폰에 저장되는 컨텍스트 정보 활용에 관심이 높아지고 있다. 하지만 정보의 양이 방대하기 때문에 개인이 정보를 분석하여 자신에게 필요한 정보로 바꾸기 위해서는 많은 노력이 필요하다. 본 논문에서는 휴대폰으로부터 컨텍스트 정보를 수집하여 활용할 수 있는 방법으로 개인이 하루 동안 경험한 일에 대한 정보를 한 눈에 알아볼 수 있도록 도와주는 계층적 이야기 구성 모델을 제안한다. 계층적 이야기 구성 모델은 3단계로 구성된다. 우선 각각의 로그를 분석하여 관련 있는 것들을 그룹으로 분류하고 분류된 그룹 내에서 설정된 경로에 대한 가중치를 계산하여 해당 그룹의 가중치로 저장한다. 마지막으로 그룹간의 경로에 대한 가중치를 계산하여 가장 높은 가중치를 갖는 경로를 한아 이야기 구성 모델로 설정한다. 계층적으로 이야기 경로를 선택한 경우와 그룹으로 분류하지 않고 경로를 계산한 경우의 시간 복잡도를 비교 평가하여 성능을 측정하였다. 이야기 구성모델을 계층적으로 분류했을 때의 성능이 분류하지 않은 경우보다 경로를 선정할 때 더 높은 성능을 나타내었다.

  • PDF

지지 벡터 기계를 이용한 질의 유형 분류기 (A Question Type Classifier Using a Support Vector Machine)

  • 안영훈;김학수;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.129-136
    • /
    • 2002
  • 고성능의 질의응답 시스템을 구현하기 위해서는 사용자의 질의 유형의 난이도에 관계없이 의도를 파악할 수 있는 질의유형 분류기가 필요하다. 본 논문에서는 문서 범주화 기법을 이용한 질의 유형 분류기를 제안한다. 본 논문에서 제안하는 질의 유형 분류기의 분류 과정은 다음과 같다. 우선, 사용자 질의에 포함된 어휘, 품사, 의미표지와 같은 다양한 정보를 이용하여 사용자 질의로부터 자질들을 추출한다. 이 과정에서 질의의 구문 특성을 반영하기 위해서 슬라이딩 윈도 기법을 이용한다. 또한, 다량의 자질들 중에서 유용한 것들만을 선택하기 위해서 카이 제곱 통계량을 이용한다. 추출된 자질들은 벡터 공간 모델로 표현되고, 문서 범주화 기법 중 하나인 지지 벡터 기계(support vector machine, SVM)는 이 정보들을 이용하여 질의 유형을 분류한다. 본 논문에서 제안하는 시스템은 질의 유형 분류 문제에지지 벡터 기계를 이용한 자동문서 범주화 기법을 도입하여 86.4%의 높은 분류 정확도를 보였다. 또한 질의 유형 분류기를 통계적 방법으로 구축함으로써 lexico-syntactic 패턴과 같은 규칙을 기술하는 수작업을 배제할 수 있으며, 응용 영역의 변화에 대해서도 안정적인 처리와 빠른 이식성을 보장한다.

  • PDF

농학분야 인터넷자원의 분류체계에 관한 연구 (A Study on the Classification Schemes of Internet Resources for Agriculture)

  • 김정현;문지현
    • 한국도서관정보학회지
    • /
    • 제33권3호
    • /
    • pp.393-413
    • /
    • 2002
  • 이 연구는 농학분야의 인터넷자원을 효율적으로 관리하기 위한 새로운 분류체계의 모형을 제시하고자 시도된 것이다. 이를 위해 먼저 일반 문헌분류표가운데 KDC를 중심으로 농학분야의 분류체계를 분석하고, 국내의 인터넷 검색엔진가운데 특히 야후! 코리아와 엠파스의 농학분야 분류체계, 그리고 농학전문 포털사이트인 한국농림수산정보센터의 농업정보디렉토리와 농민넷의 Agri_Directory 분류체계를 비교 분석하였다. 이와 같은 비교분석의 결과를 바탕으로 농학분야 인터넷자원의 분류체계에 적용할 수 있는 실제적인 모형을 제시하였다.

  • PDF

생체 신호의 특징 추출 및 SVM을 이용한 분류 (Feature Extraction and Classification using SVM for Biomedical Signal)

  • 김만선;이상용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.181-183
    • /
    • 2003
  • 최근 대용량의 데이터베이스로부터 유용한 정보를 발견하고 데이터간에 존재하는 연관성을 탐색하고 분석하는 데이터 마이닝에 관한 많은 연구들이 진행되고 있다. 다양한 생체 신호를 분석하기 위하여 데이터 마이닝 기법을 이용할 수 있다. 본 논문에서는 심전도 신호의 패턴을 분류하기 위하여 신경망 기법을 적용하였다. 최근 패턴분류에 있어서 각광을 받고 있는 SVM 모델은 학습과정에서 얻어진 확률분포를 이용하여 의사결정함수를 추정한 후 이 함수에 따라 새로운 데이터를 이원분류 하는 것으로 분류 문제에 있어서 일반화 기능이 매우 높다. 기존에 많이 이용되던 BP 모델과 비교평가 하였다.

  • PDF

문서임베딩 기반 모바일 앱 분류 및 이를 이용한 마켓 분석 (Mobile App Clustering and Analyzing using Document Embedding)

  • 윤여찬;박수명;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.378-381
    • /
    • 2018
  • 스마트폰이 출시된 이후로 수많은 어플리케이션이 모바일로 출시되고 있다. 본 논문에서는 모바일 앱을 자동으로 분류하는 방법에 대하여 제안한다. 제안한 방법은 딥러닝 기반의 문서 임베딩 방법을 기반으로 효과적으로 앱을 분류한다. 본 논문에서는 또한 제안한 방법을 이용하여 독점도, 포화도, 인기순위를 기준으로 실제 마켓을 분석한다.

  • PDF