• 제목/요약/키워드: 분류 시스템 개발

검색결과 1,844건 처리시간 0.032초

계층구조 카테고리를 가지는 텍스트 분류 시스템 (A Text Classification System for Hierarchical Categories)

  • 박지호;김진상
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.128-130
    • /
    • 2000
  • 인터넷의 발전으로 온라인 문서들의 양이 급증하여 문서의 자동 분류 기술의 중요성이 증대되고 있다. 문서를 미리 정의된 카테고리로 분류할 때 카테고리는 평면구조보다 계층구조를 갖도록 하는 것이 사용자의 측면에서 볼 때 훨씬 더 자연스럽다. 본 논문에서는 계층구조 카테고리를 가지는 문서를 분류하는 방법을 연구하고 실제 20개의 유스넷 뉴스그룹 문서들을 분류하도록 시험하였다. 여기서 사용한 알고리즘은 하이퍼링크 정보를 이용하여 웹 문서분류를 목적으로 개발된 IBM의 TAPER(taxonomy and path enhanced retrieval system) 알고리즘을 변형한 것이다.

  • PDF

자동분류기반 성격 유형별 도서추천시스템 개발을 위한 실험적 연구 (A Experimental Study on the Development of a Book Recommendation System Using Automatic Classification, Based on the Personality Type)

  • 조현양
    • 한국도서관정보학회지
    • /
    • 제48권2호
    • /
    • pp.215-236
    • /
    • 2017
  • 이 연구의 목적은 개인별 성향이나 성격 유형에 따라 선호하는 도서에 차이가 있음을 전제로, 어린이 청소년을 위한 추천도서의 책소개 정보를 활용하여 개인별 성격유형에 적합한 도서를 합리적으로 추천할 수 있는 서평 자동분류시스템을 개발하는 것이다. 연구에서 사용한 데이터는 국립어린이청소년도서관에서 제공하는 501권의 유아 및 아동도서를 대상으로 하였다. 실험에 활용된 2가지 기계학습 모델(비선형 커널 및 선형 커널) 각각에 대해서 총 6가지의 색인어 가중치 계산 방법과 자질 선택 방법, 그리고 10가지의 자질 선정 임계치 조합으로 구성된 360개의 분류 모델들을 구성하고 각각의 성능을 측정하였다. 전체적으로는 선형 커널을 이용한 SVM 기반 학습 방법(LIBLINEAR)이 비선형 분류를 지원하는 LibSVM(RBF 커널) 모델보다 더 나은 성능을 보이는 것으로 나타났다. 다만 성능 측정 결과는 뉴스 기사나 논문을 대상으로 한 문헌 분류 성능에 비해서 낮은 것으로 나타났으나, 합리적인 분류 기준이 존재하는 뉴스기사나 주제 분류에 비해서 성격 유형 기반 분류는 그 난이도가 높다는 것을 감안할 때, 초기 실험 결과로서의 의미는 있다.

효과적인 대용량 이메일 분류 및 아카이빙 시스템 설계 및 구현 (Implementation and Design of Efficient Classification and Archiving System for Large Amount of Email)

  • 김응진;문지혜;정호영;임지수;송석일
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2016년도 춘계 종합학술대회 논문집
    • /
    • pp.77-78
    • /
    • 2016
  • 이 논문에서는 대용량의 이메일을 분류하여 아카이빙하는 시스템을 설계하고 구현한다. 이 논문에서 개발하는 이메일 아카이빙 시스템은 업무영역 별로 이메일을 분류하여 업무 관련 이메일에 대해 업무영역 카테고리별로 아카이빙을 수행한다. 분류의 정확도를 위해 온톨로지를 이용한 텀벡터의 확장 방법을 사용하였으며, 빠른 분류 및 아카이빙을 수행하도록 인메모리 기반의 분산 및 병렬 처리 프레임워크인 Spark을 기반으로 구현한다.

  • PDF

주차장 차량사고 음향분류 DVR시스템 (Digital Video Record System for Classification of Car Accident Sounds in the Parking Lot.)

  • 윤재민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.429-432
    • /
    • 2010
  • 주차장에서는 다양한 형태의 사건 사고가 발생하는데, 기존 DVR(CCTV)는 단순 영상녹화 기능만 지원하므로, 이를 효과적으로 분석하는데는 한계가 있다. 따라서, DVR의 영상카메라와 마이크를 통해서 입력되는 영상과 사운드 신호를 대상으로, 해당 영상이 발생하는 음향 신호의 종류를 파악하여, 특정 음향이 발생한 영상구간을 저장하여 이를 검색할 수 있다면, 주차장 관리자가 효과적으로 사건 사고를 대처할 수 있게 된다. 본 연구에서는 주차장에서 발생하는 차량관련 음향(충돌음, 과속음, 경적음, 유리파손, 비명)을 분류하기 위해 효과적인 특징벡터를 제안하고, 제안한 특징벡터를 이용하여 신경망 차량음향분류기를 설계하여 성능을 평가함으로써, 효과적으로 차량음향을 분류하기 위한 방법을 제안하였다. 또한, 신경망 차량음향분류기를 DVR시스템과 연동하여, 마이크로부터 입력되는 음향신호를 실시간 분석하고, 특정 소리가 발생한 영상구간을 기록함으로써, 음향 키워드에 의해서 해당 사고영상을 검색 및 디스플레이하는 시스템을 개발하였다.

  • PDF

해양행정 정보시스템의 구축방안 -부산시 중심으로 - (A Study on the Implementation for Marine Administration Information System - in case of Pusan -)

  • 박민수
    • 한국정보통신학회논문지
    • /
    • 제3권4호
    • /
    • pp.705-714
    • /
    • 1999
  • 미래 부산의 개발 계획에 맞게 해양행정 정보시스템을 개발하기 위하여 해양 관련 중앙 부서들이 부산으로 이전되어야 하며, 이들과 같이 해양정보화 추진협의회를 구축하고, 부산지역 특성에 맞는 해양정보화를 추진해야 할 것이다. 해양행정 정보시스템을 크게 4개의 부문으로 분류해 보면 해양관광부문ㆍ수산업부문ㆍ항만부문ㆍ해양산업부문으로 분류할 수 있으며, 해양관광부문은 해양레포츠정보시스템ㆍ관광정보시스템ㆍ도로정보시스템ㆍ예약정보시스템 등이 있고, 수산업부문에는 기상정보시스템ㆍ어업기술정보시스템ㆍ수산물관리정보시스템ㆍ소비자관리정보시스템ㆍ해난정보시스템 등이며, 항만부문에는 물류정보시스템ㆍ항만관리정보시스템ㆍ도로정보시스템ㆍ물동량정보시스템 등이며, 해양산업부문에는 첨단정보시스템ㆍ유통정보시스템ㆍ산업정보시스템ㆍ국제교류정보시스템 등이 필요하며, 이러한 정보를 개발하기 위해서는 부산시는 단ㆍ중ㆍ장기 계획에 의거 현재 제공 운영되고 있는 정보시스템을 최대한 이용한 데이터베이스의 개발, 해양정보서비스 공동관리 및 해양행정 정보시스템 통합 구축, 지역정보 서비스업체의 육성 등이 필요하다. 장기적으로는 부산시의 형태에 맞는 해양행정 정보시스템을 개발할 수 있도록 해야 부산시가 해양 선도적 도시로써 발전할 수 있을 것이다.

  • PDF

다중 뷰 통합 재사용 시스템 (MRIS : Multi-view Reuse Integrated System)

  • 김성원;황하진;김행곤
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 1997년도 추계학술대회논문집 기업경쟁력 향상을 위한 정보통신 기술의 활용
    • /
    • pp.437-443
    • /
    • 1997
  • 객체를 기반으로 하는 소프트웨어 부품의 재사용은 개별 부품의 효율적 관리와 이 것의 적절한 조합을 통해 소프트웨어 생산성을 극대화한다. 이를 위해서는 클래스 라이브러 리 화에 의한 명확한 식별과 분류, 정제, 저장으로 사용자 요구에 맞는 부품을 쉽게 검색할 수 있으며 새로운 부품의 수정과 합성이 가능한 재사용 시스템이 요구된다. 따라서 본 논문 에서는 객체지향을 기반의 소프트웨어 개발에 있어 브라우징 기법을 적용하여 사용자 요구 에 맞도록 재사용 부품들을 분류, 저장, 검색하여 재상용 할뿐더러 검색된 클래스가 사용자 의 요구에 맞도록 수정-합성 과정을 통해 재사용 가능하게 하는 다중 뷰 재사용 통합 시스 템인 MRIS (Multi-View Reuse Integrated System)를 구현하였다.

  • PDF

SCORM기반의 학습 컨텐츠 관리 시스템 개발을 위한 메타 데이터 분류 및 프로토타이핑 (A Prototyping and Classification of Meta Data for Learning Content Management System Development Based on SCORM)

  • 송유진;김지영;김행곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.951-954
    • /
    • 2004
  • 최근 디지털 지식기반 사회에 대응하는 교육의 형태로 e-Learning이 교육적 대안으로 급부상하면서, 시스템의 상호 운영성 및 컨텐츠 명세, 활용을 지원하기 위한 표준화에 따른 연구가 국내외에서 급속도로 확산되고 있다. 특히, 국제표준기관에서 제시한 e-Learning 개발 환경을 위한 Learning Technology Standard Architecture(LTSA)와 Sharable Content Object Reference Model(SCORM)을 제정하여 컨텐츠의 사용과 상호 호환을 가능하게 함으로써 e-Learning의 효율성을 증대시키고 산업 시장의 확장을 이룰 수 있다. 또한, 현재 많은 교육관련 업체에서는 SCORM 체계를 기반으로 한 학습 컨텐츠들을 개발하여 제공하고 있다. 따라서, 본 논문에서는 국제 표준 기술인 SCORM을 기반으로 개발된 학습 컨텐츠를 체계적으로 지원하기 위해 컨텐츠 관리 시스템 개발에 대한 기술을 정의하고, 다양한 관점의 컨텐츠 메타 데이터를 식별, 분류함으로써 컨텐츠의 생성과 저장, 검색 나아가 형상관리를 위한 기본 정보로 이용 가능하다. 또한 이들 메타 데이터를 기반으로 한 학습 컨텐츠 관리 시스템의 프로토타이핑을 제시함으로써 재사용성과 유지보수성 향상을 통해 컨텐츠 개발의 용이성과 품질 및 생산성을 높일 수 있다.

  • PDF

API 유사도 분석을 통한 악성코드 분류 기법 연구 (A Study on the Malware Classification Method using API Similarity Analysis)

  • 강홍구;조혜선;김병익;이태진;박해룡
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.808-810
    • /
    • 2013
  • 최근 인터넷 사용이 보편화됨과 더불어 정치적, 경제적인 목적으로 웹사이트와 이메일을 악용한 악성 코드가 급속히 유포되고 있다. 유포된 악성코드의 대부분은 기존 악성코드를 변형한 변종 악성코드이다. 이에 변종 악성코드를 탐지하기 위해 유사 악성코드를 분류하는 연구가 활발하다. 그러나 기존 연구에서는 정적 분석을 통해 얻어진 정보를 가지고 분류하기 때문에 실제 발생되는 행위에 대한 분석이 어려운 단점이 있다. 본 논문에서는 악성코드가 호출하는 API(Application Program Interface) 정보를 추출하고 유사도를 분석하여 악성코드를 분류하는 기법을 제안한다. 악성코드가 호출하는 API의 유사도를 분석하기 위해서 동적 API 후킹이 가능한 악성코드 API 분석 시스템을 개발하고 퍼지해시(Fuzzy Hash)인 ssdeep을 이용하여 비교 가능한 고유패턴을 생성하였다. 실제 변종 악성코드 샘플을 대상으로 한 실험을 수행하여 제안하는 악성코드 분류 기법의 유용성을 확인하였다.

크라우드소싱 기반의 딥러닝 분류 알고리즘을 이용한 댓글 분류 시스템 (Comment Classification System using Deep Learning Classification Algorithm based on Crowdsourcing)

  • 박희지;하지민;박혜림;강정호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.864-867
    • /
    • 2021
  • 뉴스, SNS 등의 인터넷 댓글은 익명으로 의견을 자유롭게 개진할 수 있는 반면 댓글의 익명성을 악용하여 비방이나 험담을 하는 악성 댓글이 여러 분야에서 사회적 문제가 되고 있다. 해당 문제를 해결하기 위해 AI를 활용한 댓글 분류 알고리즘을 개발하려는 많은 노력들이 이루어지고 있지만, 댓글 분류 모델에 사용되는 AI는 오버피팅의 문제로 인해 댓글 분류에 대한 정확도가 떨어지는 문제점을 가지고 있다. 이에 본 연구에서는 크라우드소싱을 활용하여 오버피팅으로 인한 악성 댓글 분류 및 판단 정확도 저하 문제를 개선한 크라우드소싱 기반 딥러닝 분류 알고리즘(Deep Learning Classification Algorithm Based on Crowdsourcing: DCAC)과 해당 알고리즘을 사용한 시스템을 제안한다. 또한, 실험을 통해 오버피팅으로 낮아진 판단 정확도를 증가시키는 데 제안된 방법이 도움이 되는 것을 확인하였다.