• 제목/요약/키워드: 자동분류시스템

검색결과 785건 처리시간 0.029초

식물학문헌을 위한 자동분류시스템의 개발 (Developing an Automatic Classification System for Botanical Literatures)

  • 김정현;이경호
    • 한국도서관정보학회지
    • /
    • 제32권4호
    • /
    • pp.99-117
    • /
    • 2001
  • 본 연구는 분류자동화를 위해 이미 연구된 바 있는 농학 및 의학분야의 AutoBC 시스템에 대한 계속적인 연구의 일환으로 식물학분야의 문헌에 대해 분류자동화가 가능한지의 여부를 CC의 원리를 응용하여 실험 및 검증한 것이다. 분류자동화를 위한 데이터베이스는 원통형과 행렬식의 원리에 의해 설계되었으며, 문헌의 표제나 키워드를 입력하여 자동적인 주제인지 및 분류기호가 생성될 수 있는 윈도우용 자동분류시스템을 새로이 개발하여 실험하였다.

  • PDF

다중 신경망을 이용한 한메일넷 질의 자동분류 시스템 (An Automatic Classification System for Hanmail Net Questions Using Multiple Neural Networks)

  • 이지행;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.232-234
    • /
    • 2000
  • 최근들어 정보의 양이 날로 방대해 짐에 따라 이를 자동으로 분류해 줄 수 있는 무서 자동분류의 중요성이 널리 인식되고 있다. 문서 자동분류는 새로운 문서를 미리 정의된 부류로 대응시키는 일련의 작업을 말하며, 각종 패턴인식 기법들을 이용하여 시도되고 있다. 본 논문에서는 수많은 사용자들의 질의들을 분류하여 자동으로 응답하는 시스템에 적용할 수 있는 자동 질의 분류시스템을 제안한다. 실험은 500만명 이상이 사용하고 있는 한메일넷의 실제 사용자 질의를 수집하여 수행하였으며, 자동분류 방법으로는 다중 신경망을 이용하였다. 또한 효율적인 특징추출 기법과 결과 결합방법을 적용하여 분류의 정확율을 높이고자 하였다. 2204개의 실제 질의메일에 대한 실험결과, 91.1%까지의 정확율을 얻어 제안한 시스템이 실제 한메일넷의 자동응답 시스템에 효과적으로 적용될 수 있음을 알 수 있었다.

  • PDF

인트라넷 기반의 최적의 웹문서 자동 분류기법 선정 (The selection of Best suited Automatic Web Document Classification Based on Intranet)

  • 김국희;윤희병
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.423-426
    • /
    • 2004
  • 인트라넷에서는 증가하는 웹문서의 검색을 목적으로 웹 검색엔진의 도입이 활발히 진행 중이며 대부분 찾아야할 키워드를 알고 접근하는 검색엔진 형태이다. 그러나 사용자가 무엇을 찾아야 하는지 모르는 경우 웹문서 분류체계는 효율적인 방법을 제시할 수 있다. 일부 구축되어 있는 분류체계는 수작업에 의한 분류로 인해 증가하는 웹문서의 양에 효율적으로 대처하기 곤란하므로 자동분류기법을 활용한 분류가 더 효율적일 것이다. 본 논문에서는 국방인트라넷의 수작업으로 구축된 분류체계를 대상으로 용어 가중치를 계산하는 방법을 달리하여 다양한 분류기법을 적용하여 성능을 비교평가하고 웹문서 자동분류시스템에 적용하여 분류성능의 향상을 도모하고자 한다.

  • PDF

표준 통계 분류 코드 자동 생성 (Automatic Generation of Standard Classification Code)

  • 임희석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 춘계학술발표논문집
    • /
    • pp.388-390
    • /
    • 2006
  • 본 논문은 수동 코드 분류 규칙과 예제기반의 자동 학습을 이용하는 한국어 표준 산업/직업 코드 자동분류 시스템을 제안한다. 제안된 시스템은 산업과 직업에 대하여 설명하는 자연어를 입력받아 해당 산업/직업 분류 코드를 생성하는 시스템으로 수작업으로 구축된 규칙을 적용한 후 규칙이 적용되지 않는 레코드는 예제 기반의 학습을 이용한 자동 분류 시스템에 의해서 해당 코드를 할당한다.

  • PDF

빅데이터 기반 HS CODE 자동 제안 시스템 설계 (Design of Auto Navigation System for Apparel HS Code Based on Big Data Analysis)

  • 최신아
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2018년도 하계학술대회
    • /
    • pp.155-158
    • /
    • 2018
  • 수출입 기업이 관세 혜택을 받거나 올바른 관세를 측정하기 위해서는 통관 진행 시 올바른 품목 분류가 선행되어야 한다. 그러나 품목 분류의 기준이 1만개가 넘을 정도로 방대하여 신규 사용자나 품목에 이해가 부족할 경우 분류에 어려움이 따른다. 이러한 HS Code 분류의 한계점을 보완하기 위해 빅데이터 기반 이미지 분석을 통한 자동 제안 시스템을 목표로 하였다. 본 논문에서는 이미지 분석을 통한 HS Code 자동 제안시스템을 위한 수출입 품목 중 의류 품목의 수출입 품목에 국한하여 의류 HS Code 자동 분류 시스템을 설계하고, 제안한다.

  • PDF

전자 카탈로그 자동분류기 시스템과 그 활용 (System and Utilization for E-Catalog Classifier)

  • 이익훈;전종훈
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권9호
    • /
    • pp.876-883
    • /
    • 2008
  • 정확하게 정의된 전자 카탈로그(또는 상품정보)는 전자상거래 시스템의 핵심기반이다. 전자 카탈로그의 분류정보는 전자 카탈로그 정보 구축을 위한 기반 정보이며, 전자 카탈로그를 이용하는 시스템의 질을 좌우하는 중요 정보이다. 그러나, 정보시스템의 활용이 증가함에 따라, 시스템에서 관리해야 할 전자카탈로그의 양은 대용량화되었고, 대용량 전자 카탈로그의 분류 작업은 더욱 복잡하게 되었다. 본 논문에서는 전자 카탈로그를 자동분류하기 위한 자동분류기 시스템을 설명하고 자동분류기를 활용한 기업 정보시스템의 카탈로그 관리 프로세스 개선 구축 경험 및 기업의 전자카탈로그 표준화 작업을 위한 자동분류기 활용방법을 제시한다. 더불어 향후 유사 시스템 구축에 도움이 될 수 있도록 경험으로부터 얻은 자동분류기 시스템 구축 및 활용 이슈를 제시한다.

맥락정보를 이용한 기록 자동분류시스템 설계 (Design of Automatic Records Classification System Using Contextual Information)

  • 장지숙;이해영
    • 한국기록관리학회지
    • /
    • 제9권1호
    • /
    • pp.151-173
    • /
    • 2009
  • 기록학에서의 분류는 기록 자체의 내용보다는 기록이 생산되고 활용되는 맥락에 초점을 둔다. 본 연구에서는 업무활동이 반영된 기록을 업무활동 분석에 기반하여 구축된 분류체계에, 개별 기록의 내용이 아닌 기록의 집합적 맥락을 중심으로 자동분류 할 수 있는 기록 자동분류시스템을 설계하였다. 기 분류된 기록집합체뿐 아니라 분류체계와 시소러스를 분류기준으로 같이 구축하여 상호보완 할 수 있도록 설계하였으며, 분류대상기록의 범주를 할당한 후 바로, 분류된 기록의 맥락정보를 실시간으로 분류기준에 반영할 수 있는 방안도 포함하였다. 설계된 기록 자동분류시스템은 맥락정보의 품질에 따라 시스템의 성능이 좌우되는 한계가 있지만, 이를 통해 맥락정보를 제대로 충실하게 남길 수 있도록 유도하는 역할을 할 수 있다고 판단되었다.

정보검색 기법을 이용한 산업/직업 코드 자동 분류 시스템 (An automated Classification System of Standard Industry and Occupation Codes by Using Information Retrieval Techniques)

  • 임희석
    • 컴퓨터교육학회논문지
    • /
    • 제7권4호
    • /
    • pp.51-60
    • /
    • 2004
  • 본 논문은 통계청에서 실시하는 인구 주택 총조사와 사업체 기초통계조사 시 실시되는 수작업에 의한 표준 산업/직업 코드 분류 시 발생하는 막대한 비용과 시간, 일관성의 결여 등을 해소하기 위한 표준 산업/직업 코드 자동 분류 시스템을 제안한다. 제안한 시스템은 정보 검색 기법과 문서 분류 기법을 이용하여 자연어로 기술된 레코드를 입력 받아 입력 레코드에 해당하는 분류 코드를 생성한다. 수작업으로 올바른 코드가 할당되어 있는 산업 분류 레코드 46,762개와 직업 분류 코드 36,286개를 이용하여 10-fold cross-validation evaluation을 수행한 결과, 제안한 시스템은 완전 자동 모드에서 2수준의 산업 분류에 대해서 87.08%, 5수준에 대해서는 66.08%의 생성률을 보였으며 반자동 모드에서는 각각 99.10%와 92.88%의 성능을 보였다. 직업 분류 코드에 대한 성능은 산업 분류 코드에 대한 성능보다는 약간 저하된 성능을 보였다. 제안한 시스템은 아직 수작업을 완전히 대체할 수 있는 완전 자동 분류기로서는 많은 개선의 여지를 가지고 있지만 수작업을 최소화할 수 있는 반자동 도구나 수작업의 정확도를 검증할 수 있는 보조 도구로써 충분히 활용될 수 있을 것으로 기대된다.

  • PDF

E-Mail 시스템의 멀티미디어 첨부파일 자동분류 시스템 설계 (Classification of the Multimedia Attached File in E-Mail System)

  • 현영순;정옥란;조동섭
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.746-749
    • /
    • 2003
  • 인터넷 사용자의 증가와 함께 e-mail 사용자 또한 증가하게 되면서 대량의 메일을 송수신하는 경우, 메일에 대한 효율적 관리의 중요성이 부각되고 있다. 본 논문에서는 수신된 메일의 내용을 텍스트 형태로 가져온 뒤, parallel regular expression을 이용하여 Keyword를 검색하고 추출하여 메일에 첨부되어온 멀티미디어 파일들을 자동으로 분류·저장하는 멀티미디어 첨부파일 자동분류 시스템을 제안하였다. 수신된 메일을 일일이 확인하고 분류해야만 했던 기존의 시스템과는 달리 본 논문에서 제안하고자 하는 시스템을 이용했을 경우 노력과 시간을 절감하고 첨부파일들을 효과적으로 관리할 수 있다는 장점이 있다.

  • PDF

자동 판례분류를 위한 기계학습기법 (Machine Learning Technique for Automatic Precedent Categorization)

  • 장균탁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.574-576
    • /
    • 2007
  • 판례 자동분류 시스템은 일반적인 문서 자동분류 시스템과 기본적인 동작방법은 동일하다. 본 논문에서는 노동법에 관련된 판례를 대상으로 지지벡터기계(SVM), 단일 의사결정나무, 복수 의사결정나무, 신경망 기법 등을 사용하여 문서의 자동 분류 실험을 수행하고, 판례분류에 가장 적합한 기계학습기법이 무엇인지를 실험해 보았다. 실험 결과 복수 의사결정나무가 93%로 가장 높은 정확도를 나타내었다.