• 제목/요약/키워드: 자동분류시스템

검색결과 783건 처리시간 0.027초

나이브 베이지안 분류자와 메세지 규칙을 이용한 스팸메일 필터링 시스템 (Spam-mail Filtering System Using Naive Bayesian Classifier and Message Rule)

  • 조한철;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.223-225
    • /
    • 2002
  • 인터넷의 급속한 성장과 함께 E-Mail은 대표적인 통신수단의 하나가 되어버렸다. 편리하다는 점을 이용해서 엄청난 양의 스팸메일이 매일같이 쏟아져 오고 , 그 문제점의 심각성에 정보통신부에서 정보통신망 이용촉진 및 정보보호 등에 관한 법률이라는 새로운 법률까지 생겨났다. 본 논문에서는 이 법률에서 요구하는 '광고'라는 문구를 걸러내는 등의 메시지 규칙을 갖는 시스템과 기존의 문서 분류에 널리 쓰이던 나이브 베이지안 분류자(Naive Baesian Classifier)를 결합한 스팸 메일 필터링 시스템(Spam-mail Fitering System)을 제안한다. 제안된 시스템에서는 사용자가 직접 규칙을 작성할 필요없이 학습한 데이터를 갖고 자동으로 스팸메일을 분류할 수가 있다. 들어온 메일은 메시지 규칙 기반 필터가 먼저 적용되고, 메세지 규칙 기반 필터에서 분류되지 않으면 나이브 베이지안 필터에서 분류된다. 실험에서는 제안된 시스템의 성능을 평가하기 위해서 메시지 규칙을 사용한 시스템 및 나이브 베이지만 분류자 시스템과 비교 평가하였다. 또한 임계치를 변경함으로써 제안된 시스템의 성능을 높일 수있도록 하였다.

  • PDF

통합기반 다국어 자동번역 시스템에서의 한국어 분석과 변환 (Korean Analysis and Transfer in Unification-based Multilingual Machine Translation System)

  • 최승권;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.301-307
    • /
    • 1996
  • 다국어 자동번역이란 2개국어 이상 언어들간의 번역을 말한다. 기존의 다국어 자동번역 시스템은 크게 변환기반 transfer-based 방식과 피봇방식으로 분류될 수 있는데 변환기반 다국어 자동번역 시스템에서는 각 언어의 분석과 생성 규칙이 상이하게 작성됨으로써 언어들간의 공통성이 수용되지 못하였고 그로 인해 전체 번역 메모리의 크기가 증가하는 결과를 초래하였었다. 또한 기존의 피봇방식에서는 다국어에 적용될 수 있는 언어학적 보편성 모델을 구현하는 어려움이 있었다. 이러한 기존의 다국어 자동번역 시스템의 단점들을 극복하기 위해 본 논문에서는 언어들간의 공통성을 수용하며 또한 여러 언어에서 공유될 수 있는 공통 규칙에 의한 다국어 자동번역 시스템을 제안하고자 한다. 공통 규칙의 장점은 전산학적으로는 여러 언어에서 단지 한번 load 되기 때문에 전체 번역 메모리의 크기를 줄일 수 있다는 것과 언어학적으로는 문법 정보의 작성.수정.관리의 일관성을 유지할 수 있다는 것이다.

  • PDF

반도체 웨이퍼 자동 결함 검출 및 분석 시스템 구현 (Implementation of Automated Defect Detection and Classification System for Semiconductor Wafers)

  • 남상진;한광수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.334-336
    • /
    • 2001
  • 반도체 제조와 같은 대량 생산 시스템에서 제품 검사는 매우 중요란 단계 중의 하나이다. 반도체 제조 공정 내에서의 시각 검사는 현재 사람의 육안에 주로 의존하고 있으나, 회로가 점점 복잡해지고 작아지는 추세에 비추어 볼 때 사람에 의한 시각 검사는 한계에 이를 것으로 보인다. 본 연구에서는 웨이퍼상의 결함을 자동으로 검출하고 검출된 길함을 분류하는 자동시각검사 시스템을 설계 구현하였다.

  • PDF

다중 카메라 환경에서의 안면인식 기반의 영유아 활동 사진 자동 생성 시스템 (A system for automatically generating activity photos of infants based on facial recognition in a multi-camera environment)

  • 이정석;이규호;김건희;최창훈;박경로;손호준;유홍석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.481-483
    • /
    • 2023
  • 본 논문에서는 다중 카메라환경에서의 안면인식 기반 영유아 활동 사진 자동 생성 시스템을 개발했다. 개발한 시스템은 어린이집에서 알림장 작성을 위한 촬영하는 동안 보육에 부주의하여 안전사고가 발생하는 것을 방지 할 수 있다. 시스템은 이동식 수집기와 분류 서버로 나뉘어 작동하게 된다. 이동식 수집기는 Raspberry Pi를 이용하였고 초당 1장 내외의 사진을 촬영하여 SAMBA를 사용 공유폴더에 저장한다. 분류 서버에서는 YOLOv5를 사용해 안면을 인식해 분류한다. OpenCV와 TensorFlow-Keras를 통해 분류된 사진에서의 표정을 파악하여 부모에게 전송할 웃는사진만을 분류하여 남겨둔다. 이외의 사진은 /dev/null로 이동하여 삭제된다.

  • PDF

토지 관련 이미지 분석 데이터 셋 구축을 위한 반자동 annotation 도구 개발 (Development of semi-automatic annotation tool for building land cover image data set)

  • 장달원;이재원;이종설
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.69-70
    • /
    • 2019
  • 본 논문에서는 토지 정보를 분류하는 연구를 수행하기 위한 이미지 데이터 셋을 개발하는데 필요한 반자동 annotation 도구를 제안한다. 논문에서 제안하는 도구는 합성개구레이더 영상을 입력으로 하고, 물/경작지/숲/건물을 구분하는 시스템을 개발하기 위해서 만들어진 것이나, 다른 목적을 가지는 토지 관련 이미지 분석 시스템의 개발에 사용될 수 있다. 제안하는 도구는 합성개구레이더 영상이 GPS 정보와 같이 입력되었을 때, GPS 정보에 기반하여 토지지목정보를 불러오고, 이를 재정리하여 1차 레이블링 결과를 자동적으로 생성한다. 국가에서 관리하는 토지지목정보는 개발하고자 하는 시스템의 분류 기준에 많은 부분 도움이 되긴 하지만, 일부분 차이점이 있기 때문에 이를 다시 수동으로 수정하는 도구을 동작하여 annotation이 완료된 이미지 데이터를 구축한다.

  • PDF

산업/직업 분류 자동코딩 시스템

  • 강유경
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2001년도 추계학술대회 발표논문집
    • /
    • pp.33-45
    • /
    • 2001
  • 많은 통계조사에서 사용되고 있는 산업/직업분류코드가 기존에는 사람에 의해 수동으로 부호화되어 왔는데, 이러한 작업은 시간과 인력면에서 고비용을 요구할 뿐 아니라 개인별 시각, 이해도의 차이 등으로 정확성에 많은 문제가 제기되어 왔다. 본 논문에서는 이러한 수동코딩 작업의 문제점을 해결하기 위하여 자동코딩 시스템을 개발, 이를 인구 주택총조사와 사업체기초통계조사에 시험 적용하여 본 바를 바탕으로 향후 자동시스템으로의 전환 방향 등을 제시하고 있다.

  • PDF

건설자재 통합정보 관리를 위한 시스템 모델 구현 (Development of System Model for Integrated Information Management of Construction Material)

  • 한충한;주기범
    • 정보처리학회논문지D
    • /
    • 제16D권3호
    • /
    • pp.433-440
    • /
    • 2009
  • 최근 건설 분야의 정보화 기술이 발달함에 따라 건설업무의 생산성 향상과 비용 절감을 위한 다양한 건설자재 정보 서비스 차원의 web 기반 온라인 시스템이 급증하는 추세이다. 그러나 이러한 시스템들이 제공 중인 품질 및 규격등 건설자재정보가 표준화되지 못하여 특정자재의 정보획득시 여러 정보시스템을 이용하거나 유사한 작업을 반복하는등 건설현장 실무자들의 자재정보 활용에 있어 많은 어려움을 겪고 있다. 이에 본 연구에서는 국제 데이터 상품 속성 시스템(GDAS, Global Data Alignment System)을 기준으로 건설자재 정보항목을 정형화하고 건설자재 통합정보 관리를 위한 시스템 모델을 설계하였다. 본 시스템은 건설공정별 국제 표준분류체계(OmniClass Part-22)와 유엔 표준 제품 및 서비스 분류체계(UNSPSC, United Nations Standard Products and Services Classification)를 적용한 건설 자재의 자동 분류, 자재정보의 조건별 복합검색, 전자카탈로그의 실시간 자동구현, RFID 검색 및 관리 기능을 지원함으로써 자재정보의 효율적인 관리 및 활용이 가능하다.

항공 라이다 데이터로부터 데이터마이닝 도구 WEKA를 이용한 지형 분류기 제작 지원 시스템 (A Topographical Classifier Development Support System Cooperating with Data Mining Tool WEKA from Airborne LiDAR Data)

  • 이성규;이호준;성철웅;박창후;조우석;김유성
    • 한국측량학회지
    • /
    • 제28권1호
    • /
    • pp.133-142
    • /
    • 2010
  • 국토의 구성 및 변화를 파악하기 위해서 항공 라이다 데이터의 효율적 처리를 통해 정확하게 지표의 유행(land-cover type)을 분류할 수 있는 지능형 지형 분류기(intelligent topographical classifier)의 필요성이 증대되고 있다. 본 연구에서는 정확하고 효율적인 지형 분류기 개발을 용이하게 하기 위해 데이터마이닝 도구인 WEKA를 연동시켜 항공 라이다 데이터를 가공처리하고 다양한 데이터마이닝 기법을 활용한 비교 실험을 통해 정확성이 높은 지형 분류기 제작을 지원하는 소프트웨어 시스템을 개발하였다. 본 연구에서 개발한 지형 분류기 제작 지원 시스템은 항공 영상 이미지 위에 라이다 데이터를 중첩시키는 기능, 효율적인 처리를 위한 타일링 기능, 부분 영역의 3차원 시각화 기능, 타일의 특정 추출 기능, WEKA 입력 자동 생생 기능, 분류 모델의 분류 규칙 집합을 C++ 프로그램으로 자동 코딩하여 분류기로 변환하는 기능, 타일별 지형 분류 결과 표시 기능 등이 구현되어 있다. 또한, 연동된 WEKA틀 이용해서는 분별력이 높은 특정 정보 선정 기능, 다양한 분류 기법을 적용한 지형 분류 모델 생성 기능, 지형 분류 규칙 집합 생생 기능 등을 활용하여 지형 분류기 제작을 지원할 수 있다. 따라서 항공 라이다 데이터를 이용하여 지형의 유형을 분류하는 지능형 지형 분류기를 개발하고자 하는 사용자는 본 연구에서 개발한 지형 분류기 제작 지원 시스템을 활용하여 해당 지형의 특성에 맞고 분류기 개발 목적에 부합하는 지형 분류기를 용이하게 효과적으로 개발할 수 있다.

자동차 멀티미디어 시스템에서의 사진과 음악을 이용한 음악스토리 비디오 자동생성 기술 (Automatic Music-Story Video Generation Using Music Files and Photos in Automobile Multimedia System)

  • 김형국
    • 한국ITS학회 논문지
    • /
    • 제9권5호
    • /
    • pp.80-86
    • /
    • 2010
  • 본 논문에서는 차량 내의 멀티미디어 시스템에 장착되는 엔터테인먼트 기능 중의 하나인 음악스토리 자동생성 기술을 소개한다. 음악스토리 비디오 자동생성 기술은 개인이 소지하고 있는 휴대폰을 차량 내의 멀티미디어 시스템과 연결하여, 휴대폰 안에 저장된 음악과 사진의 결합을 통해 음악비디오를 자동으로 생성하는 멀티미디어 요소기술로서, 사용자에게 분위기에 맞게 음악을 들으면서 생성된 음악스토리 비디오를 즐기는 기능을 제공한다. 음악스토리 비디오 자동생성 기술에 대한 성능은 음악분류, 사진분류, 핵심단어 검출 등의 정확도와 생성된 음악스토리 비디오를 시청한 사용자의 MOS 결과를 통해 측정되었다.

학습방법개선과 후처리 분석을 이용한 자동문서분류의 성능향상 방법 (Reinforcement Method for Automated Text Classification using Post-processing and Training with Definition Criteria)

  • 최윤정;박승수
    • 정보처리학회논문지B
    • /
    • 제12B권7호
    • /
    • pp.811-822
    • /
    • 2005
  • 자동문서분류는 문서의 내용에 기반하여 미리 정의된 항목에 자동으로 할당하는 작업으로서 효율적인 정보관리 및 검색등에 필수적인 작업이다. 기존의 문서분류성능 향상을 위한 연구들은 대부분 분류모델 자체를 개선시키는 데 주력해왔으며 통계적인 방법으로 그 범위가 제한되어왔다. 본 연구에서는 자동문서분류의 성능향상을 위해 데이터마이닝 기법과 결함허용방법을 이용하는 개선된 학습알고리즘과 후처 리 방법에 의한 RTPost 시스템을 제안한다. RTPost 시스템은 학습문서 선택작업 이전에 분류항목 설정의 문제를 다루며, 분류함수의 성능보다는 지정방식의 문제점을 감안하여 학습과 분류 후처리 프로세스를 개선하려는 것이다. 이를 통해 분류결과에 중요한 영향을 미쳐왔던 학습문서의 수와 선택방법, 분류모델의 성능등에 의존하지 않는 안정적인 분류가 가능하였고, 이를 분류오류율이 높은 경계선 인접영역에 위치한 문서들에 적용한 결과 높은 정확율을 얻을 수 있었다. 뿐만 아니라, RTPost 프로세스를 진행하는 동안 능동학습방법의 장점을 수용하여 학습효과는 높이며 비용을 감소시킬 수 있는 자가학습방법(self learning)방법의 효과를 기대할 수 있다.