Search | Korea Science

Design distributed document classifier based on SVM using Web Services (웹서비스를 이용한 SVM기반 분산 문서분류기 설계)

Kim Yong-Soo;Park Young B.
- Proceedings of the Korea Information Processing Society Conference
- /
- 2004.11a
- /
- pp.501-504
- /
- 2004
인터넷이 발달하면서 인터넷 상에서 공유 문서를 효율적으로 분류하기 위한 자동 분류의 필요성이 높아지고 있다. 또한 인터넷은 단순한 문서 제공의 한계를 넘어 어플리케이션간의 통합연동을 위한 기술이 대두되고 있다. 이러한 관점에서 본 논문은 새롭게 제시되고 있는 웹서비스를 이용하여 SVM 기반의 분류기를 분산 구성하여 설계하였고, 문서로부터 추출된 특성단어 벡터정보를 이용하여 SVM 학습 후 각각의 분류기를 통하여 분산 문서 분류를 수행한다. 특성단어 벡터는 $TF^{\ast}IDF$에 기반한 특성 표현법을 사용하였으며, 분류 범주 별로 SVM 기반의 분류기 모델 데이터를 생성하기 위해 특성 단어 사전을 구축하여 분류 기준으로 구성하였다.
PDF

A Study of Personalized Retrieval System Evaluation (개인화 검색시스템 평가에 관한 연구)

Kim, Kwang-Young;Choe, Ho-Seop;Jin, Du-Suk;Kim, Jin-Suk
- Proceedings of the Korean Information Science Society Conference
- /
- 2010.06b
- /
- pp.39-42
- /
- 2010
본 논문에서는 주제별 분류기반의 개인화 검색시스템의 평가를 위해서 기존의 한글 정보 검색시스템 평가를 위해서 사용하는 한글 테스트 컬렉션(HANTEC v2.0)을 사용하였다. 주제별 분류기반의 개인화 검색 시스템의 평가를 위해서 첫째, 한글 테스트 컬렉션을 한국일보-40075 문서분류 테스트 컬렉션을 이용하여 주제별 분류를 수행 하였다. 둘째, 한국일보-40075 문서분류 테스트 컬렉션의 분류 체계에 다라 한글 테스트 컬렉션의 문서들을 kNN 분류기를 이용하여 분류를 수행하였다. 마지막으로 구축된 컬렉션을 이용하여 주제별 분류기반의 개인화 검색시스템의 성능 평가를 수행하였다.
PDF

Methodology of Developing Train Set for BERT's Sentence Similarity Classification with Lexical Mismatch (어휘 유사 문장 판별을 위한 BERT모델의 학습자료 구축)

Jeong, Jaehwan;Kim, Dongjun;Lee, Woochul;Lee, Yeonsoo
- Annual Conference on Human and Language Technology
- /
- 2019.10a
- /
- pp.265-271
- /
- 2019
본 논문은 어휘가 비슷한 문장들을 효과적으로 분류하는 BERT 기반 유사 문장 분류기의 학습 자료 구성 방법을 제안한다. 기존의 유사 문장 분류기는 문장의 의미와 상관 없이 각 문장에서 출현한 어휘의 유사도를 기준으로 분류하였다. 이는 학습 자료 내의 유사 문장 쌍들이 유사하지 않은 문장 쌍들보다 어휘 유사도가 높기 때문이다. 따라서, 본 논문은 어휘 유사도가 높은 유사 의미 문장 쌍들과 어휘 유사도가 높지 않은 의미 문장 쌍들을 학습 자료에 추가하여 BERT 유사 문장 분류기를 학습하여 전체 분류 성능을 크게 향상시켰다. 이는 문장의 의미를 결정짓는 단어들과 그렇지 않은 단어들을 유사 문장 분류기가 학습하였기 때문이다. 제안하는 학습 데이터 구축 방법을 기반으로 학습된 BERT 유사 문장 분류기들의 학습된 self-attention weight들을 비교 분석하여 BERT 내부에서 어떤 변화가 발생하였는지 확인하였다.
PDF

Classification of Respiratory States based on Visual Information using Deep Learning (심층학습을 이용한 영상정보 기반 호흡신호 분류)

Song, Joohyun;Lee, Deokwoo
- Journal of the Korea Academia-Industrial cooperation Society
- /
- v.22 no.5
- /
- pp.296-302
- /
- 2021
This paper proposes an approach to the classification of respiratory states of humans based on visual information. An ultra-wide-band radar sensor acquired respiration signals, and the respiratory states were classified based on two-dimensional (2D) images instead of one-dimensional (1D) vectors. The 1D vector-based classification of respiratory states has limitations in cases of various types of normal respiration. The deep neural network model was employed for the classification, and the model learned the 2D images of respiration signals. Conventional classification methods use the value of the quantified respiration values or a variation of them based on regression or deep learning techniques. This paper used 2D images of the respiration signals, and the accuracy of the classification showed a 10% improvement compared to the method based on a 1D vector representation of the respiration signals. In the classification experiment, the respiration states were categorized into three classes, normal-1, normal-2, and abnormal respiration.
https://doi.org/10.5762/KAIS.2021.22.5.296 인용 PDF KSCI

Dewey for Windows vs. Electronic Dewey Decimal Classification (전자 듀이십진분류표의 비교 연구)

정연경
- Proceedings of the Korean Society for Information Management Conference
- /
- 1997.08a
- /
- pp.91-94
- /
- 1997
Dewey for Windows는 1997년 여론에 나온 듀이십진분류표 제 21판의 전자본이다. 1994년에 Electronic Dewey Decimal Classification이 최초의 전자 분류표로 등장한 후, 보다 나아진 이용자 인터훼이스와 다양한 접근방법을 사용할 수 있는 전자 듀이십진분류표로 개발되었다. 본고에서는 새로 나온 전자분류표의 기능을 살펴보고 최초의 전자분류표와 비교한 후, 개선점을 제시하였으며 한국의 전자십진분류표 개발을 제안하였다.
PDF

A Classification Method for Environment-based Games (게임 환경 특성에 기반 한 분류방안)

Hwang, Shin-Hee;Park, Young-Ho
- Proceedings of the Korea Information Processing Society Conference
- /
- 2007.05a
- /
- pp.139-141
- /
- 2007
최근, 게임시장의 활성화가 가속화 되면서 게임을 이용하는 유저들이 매우 늘어났다. 이에 따라 게임은 하나의 문화로 정립되었다. 그러나 게임문화에 맞는 정확한 분류와 표준안이 존재하지 않아 새로운 게임의 장르 구분을 명확히 하지 못하는 문제점이 생겨났다. 본 논문에서는 기존연구의 분류법으로는 구분할 수 없는 장르의 분류를 위해 기존의 게임장르 분류법을 기반으로 체계적인 분류를 더한 게임장르 분류법을 소개한다.
PDF

A Study of Component Categorization for Reuse and Representation with UML (재사용을 위한 컴포넌트 분류체계와 UML을 이용한 컴포넌트 분류체계 표기법에 관한 연구)

박진구;김강태;이경환
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.04a
- /
- pp.564-566
- /
- 2000
컴포넌트 시장이 활성화됨에 따라 컴포넌트의 수는 기하급수적으로 증가하고 있으며, 이러한 컴포넌트들을 효과적으로 재사용하기 위해서는 컴포넌트 분류체계가 잘 정의되어질 필요성이 있다. 현재 컴포넌트 유통시장의 현황을 살펴보니, 대체적으로 구현과 관련된 실행가능모듈로서의 컴포넌트 들이 언어, 기능성, 플랫폼정도로 분류가 되어 사용되어지고 있었다. 앞으로 다양한 컴포넌트들이 많이 개발되어질 것이며, 이들을 위한 체계적인 분류방법이 필요하다고 생각되어, 본 논문에서는 효과적인 컴포넌트 재사용을 위한 컴포넌트 분류체계를 제시하였다. 또, 이를 컴포넌트 모델링에 적용하기 위해 제시한 분류체계를 UML의 스테레오타입으로 정의하여 시각화하였다.
PDF

Automatic Document Categorization Using K-Nearest Neighbor Algorithm and Object-Oriented Thesaurus (K-NN과 객체 지향 시소러스를 이용한 웹 문서 자동 분류)

방선이;양재동
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.10b
- /
- pp.145-147
- /
- 2001
문서 자동 분류에는 통계적인 기법과 machine learning 기법의 맡은 알고리즘들이 이용되고 있다. 통계적인 기법 알고리즘을 이용한 문서 분류는 높은 성능을 보이지만 분류할 카테고리가 둘 이상인 경우가 빈번할 경우에는 정확률이 급격히 저하되는 단점이 있다. 본 논문에서는 K-NN알고리즘을 이용하여 일차적인 문서 분류를 수행한 후 특정 카테고리로 분류하기에 애매모호한 경우가 생길 경우 시소러스의 일반화 관계와 연관화 관계를 이용하여 모호성을 줄임으로써 문서 자동 분류의 성능을 높이기 위한 새 기법을 제안한다.
PDF

Classifying press article's political tendency using Bayesian classifier (베이즈 분류기에 의한 신문기사의 정치성향 분류)

Jung, Young-Jae;Kang, TaeWon
- Proceedings of the Korea Information Processing Society Conference
- /
- 2015.10a
- /
- pp.1313-1315
- /
- 2015
베이즈 분류기(Bayesian classifier)를 이용하여 특정 신문기사가 어떤 정치적 성향을 가지는지 분류한다. 이를 위하여 보수 및 진보 성향으로 알려진 언론사의 보도기사를 수집하여 베이즈 분류기를 학습하였다. 즉, 보수 및 진보적 성향을 갖는 기사에서 출현 빈도가 높은 단어의 빈도수를 확인하여 분류기를 구현하였다. 학습에 사용하지 않은 보수 및 진보적 성향의 기사를 사용하여 분류기의 성능을 검증하였다.
https://doi.org/10.3745/PKIPS.y2015m10a.1313 인용 PDF

Web Document Classifier based on Interesting Field for Personalized Learning Service (개인화된 학습서비스를 위한 관심분야에 따른 웹 문서 분류기)

Kim, Jun-Il;Lee, Young-Seok;Cho, Jung-Won;Choi, Byung-Uk
- 한국정보교육학회:학술대회논문집
- /
- 2005.08a
- /
- pp.304-313
- /
- 2005
RSS와 같은 신디케이션 기술은 사용자가 스스로 웹사이트에 접근하지 않아도, 새롭게 업데이트 되는 정보가 있을 때마다 RSS Aggregator를 통해 사용자에게 알려줌으로써 편리성을 가져다준다. 이러한 기술을 이용한다면 학습자들은 새로운 웹 문서가 게시될 때마다 해당 사이트를 방문할 필요 없이, 자동으로 신규 정보만 얻어오는 학습 자료의 습득 도구로서 활용이 가능하다. 하지만, 정의가 새롭게 추가되는 여부만을 판단하는 기존의 RSS Aggregator의 경우에 등록된 채널수가 늘어갈수록 사용자는 자신이 원하는 정보를 찾기 위해, 정보를 분류하고 검색하는 작업에 많은 노력을 기울여야한다. 본 논문에서는 이러한 문제점을 해결하고 사용자에게 의다 효율적인 정보 전달을 위해, 사용자 스스로 관심분야를 생성하여, 사용자에게 전달되는 신규자료는 각 분야에 자동적으로 분류되며, 사용자가 지정해 놓은 조건에 적합하도록 콘텐츠를 제공 받을 수 있는 시스템을 설계하였다. 신규자료를 분야에 자동적으로 분류하기 위해 초기 분류된 문서로부터 분야별 색인어 추출 방안을 제안하고자 한다.
PDF

Search Result 11,349, Processing Time 0.04 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)