• Title/Summary/Keyword: 동시 분류

Search Result 1,252, Processing Time 0.038 seconds

Automatic Text Categorization Using Hybrid Multiple Model Schemes (하이브리드 다중모델 학습기법을 이용한 자동 문서 분류)

  • 명순희;김인철
    • Journal of the Korean Society for information Management
    • /
    • v.19 no.4
    • /
    • pp.35-51
    • /
    • 2002
  • Inductive learning and classification techniques have been employed in various research and applications that organize textual data to solve the problem of information access. In this study, we develop hybrid model combination methods which incorporate the concepts and techniques for multiple modeling algorithms to improve the accuracy of text classification, and conduct experiments to evaluate the performances of proposed schemes. Boosted stacking, one of the extended stacking schemes proposed in this study yields higher accuracy relative to the conventional model combination methods and single classifiers.

Emotion Recognition based on Short Text using Semantic Orientation Analysis (의미 지향성 분석을 통한 단문 텍스트 기반 감정인지)

  • Kim, Hyun-Woo;Lee, Sung-Young;Chung, Tae-Choong;Yoon, Suk-Hwan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.375-377
    • /
    • 2012
  • 스마트폰과 같은 모바일 기기가 발전함에 따라 SNS, 모바일 메신저, SMS와 같은 단문 기반 메시지는 자신의 감정을 가장 잘 표현하는 매체이다. 그럼에도 불구하고 기존 연구는 주로 장문의 텍스트로부터 긍정, 부정 분류나 문서의 성향을 분석하는 것에 그치는 경우가 많다. 의미지향(Semantic Orientation)방법은 검색엔진을 통해 감정 키워드와 인지하고자 하는 단어의 동시 빈출 정도를 PMI로 계산한 것으로 WordNet과 같은 의미 사전이 존재하지 않는 한국어의 특성에서 적용 가능한 방법이다. 본 논문에서는 의미 지향성 및 다른 텍스트 기반 감정 분류 기술에 대해 비교하고 이들을 활용하여 한국어로 구성된 단문 텍스트에서 효율적인 감정 분류 기법을 제안하고자 한다.

A Study on the Implementation of Structural Module Library for the application of BIM Technology (BIM 기술 적용을 위한 토목구조물 모듈 라이브러리 구축에 관한 연구)

  • Han, Jung-Hoon;Nam, Sang-Hyeok;Kim, Sung-Hoon;Kim, Yong-Han
    • Proceedings of the Computational Structural Engineering Institute Conference
    • /
    • 2011.04a
    • /
    • pp.107-110
    • /
    • 2011
  • 본 논문에서는 토목분야에 BIM 기술을 적용하기 위해 파라메트릭 모델링 디자인 기법을 기초로 한 토목 구조물 모듈 라이브러리를 구축하고자 하였다. 국제 표준설계방법론에 부합하는 개방형 BIM을 구현하기 위해 표준정보모델은 IFC로 연동하며, 형상 분류체계는 PLIB Part 42(ISO 13584-42)로 정보 분류체계는 Omniclass와 통합건설정보 분류체계를 따른다. 토목분야에서의 BIM 기술은 토목 구조물 표준 라이브러리를 통해 동시공학적 협업설계를 이룰 수 있을 것으로 판단된다.

  • PDF

A Review of the Genus Nacoleia (Lepidoptera, Crambidae) from Korea, with Two Newly Recorded Species (한국산 Nacoleia 속의 분류학적 정리(나비목, 포충나방과))

  • Kim, Sung-Soo;Bae, Yang-Seop;Byun, Bong-Kyu
    • Korean journal of applied entomology
    • /
    • v.53 no.1
    • /
    • pp.81-84
    • /
    • 2014
  • A total of six species of the genus Nacoleia is recognized from Korea. Among them, two species, Nacoleia inouei Yamanaka, 1980 and Nacoleia satsumalis South, 1901 are reported for the first time from Korea. All the known species were enumerated with their available information including the collecting localities, the distributional ranges and host plants.

Machine Learning Based Blog Text Opinion Classification System Using Opinion Word Centered-Dependency Tree Pattern Features (의견어중심의 의존트리패턴자질을 이용한 기계학습기반 한국어 블로그 문서 의견분류시스템)

  • Kwak, Dong-Min;Lee, Seung-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.337-338
    • /
    • 2009
  • 블로그문서의 의견극성분류 연구는 주로 기계학습기법에 기반한 방법이었고, 이때 주로 활용된 자질은 명사, 동사 등의 품사정보와 의견어 어휘정보였다. 하지만 하나의 의견어 어휘만을 고려한다면 그 극성을 판별하는데 필요한 정보가 충분하지 않아 부정확한 결과를 도출하는 경우가 발생할 수 있다. 본 논문에서는 여러 어휘를 동시에 고려하였을 때 보다 정확한 의견분류를 수행할 수 있을 것이라는 가정을 세웠다. 본 논문에서는 효과적인 의견어휘자질의 추출을 위하여 의견이 내포될 가능성이 높은 의견어휘를 기반으로 의존구문분석을 통해 의존트리패턴을 추출하였고, 제안하는 PF-IDF가중치를 적용하여 지지벡터기계(SVM)와 다항시행접근 단순베이지안(MNNB)알고리즘으로 비교 실험을 수행하였다. 기준시스템인 TF-IDF가중치 기법에 비해 정확도(accuracy)가 지지벡터기계에서 5%, 다항시행접근 단순베이지안에서 8.9% 향상된 성능을 보였다.

Wafer Map Defect Pattern Classification with Progressive Pseudo-Labeling Balancing (점진적 데이터 평준화를 이용한 반도체 웨이퍼 영상 내 결함 패턴 분류)

  • Do, Jeonghyeok;Kim, Munchurl
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.248-251
    • /
    • 2020
  • 전 반도체 제조 및 검사 공정 과정을 자동화하는 스마트 팩토리의 실현에 있어 제품 검수를 위한 검사 장비는 필수적이다. 하지만 딥 러닝 모델 학습을 위한 데이터 처리 과정에서 엔지니어가 전체 웨이퍼 영상에 대하여 결함 항목 라벨을 매칭하는 것은 현실적으로 불가능하기 때문에 소량의 라벨 (labeled) 데이터와 나머지 라벨이 없는 (unlabeled) 데이터를 적절히 활용해야 한다. 또한, 웨이퍼 영상에서 결함이 발생하는 빈도가 결함 종류별로 크게 차이가 나기 때문에 빈도가 적은 (minor) 결함은 잡음처럼 취급되어 올바른 분류가 되지 않는다. 본 논문에서는 소량의 라벨 데이터와 대량의 라벨이 없는 데이터를 동시에 활용하면서 결함 사이의 발생 빈도 불균등 문제를 해결하는 점진적 데이터 평준화 (progressive pseudo-labeling balancer)를 제안한다. 점진적 데이터 평준화를 이용해 분류 네트워크를 학습시키는 경우, 기존의 테스트 정확도인 71.19%에서 6.07%-p 상승한 77.26%로 약 40%의 라벨 데이터가 추가된 것과 같은 성능을 보였다.

  • PDF

도면 중첩법을 활용한 가상경관 설계 방법론 - 디지털 게임 속 가상경관을 중심으로 -

  • Kim, Ik-Hwan;Hong, Seok-Ju;Lee, Ji-Hyeon
    • Proceedings of the Korean Institute of Landscape Architecture Conference
    • /
    • 2017.10a
    • /
    • pp.16-18
    • /
    • 2017
  • 컴퓨터 기술이 발전함에 따라 디지털 게임 속 가상경관은 보다 정교해지고 있으며, 설계 및 구현 과정에서 고려를 요구하는 요소들이 증가하고 있다. 하지만 여태 가상경관 설계를 위한 정형화된 설계 방법론도 전무한 관계로, 디자이너들은 비효율적인 설계 과정을 거치며 동시에 질적으로도 만족스럽지 못한 결과물을 구축하고 있다. Ian McHarg의 도면 중첩법은 레이어 단위로 설계 고려요소를 정리하여 설계를 진행하기에, 설계에 고려할 요소들을 체계적으로 종합하는 디자인의 진행이 가능하다. 이에 본 연구에서는 도면 중첩법을 활용한 가상경관 설계 방법론을 구축하였다. 이를 위해서 우선 가상경관의 공간적 특수성에 따라 분류를 진행하는 분류 방법론을 문헌 조사를 통해 파악하여, 이들을 각각의 레이어로 조직하였다. 그리고 설계 영역으로서의 가상경관과 실공간의 차이점을 파악하여 이들을 기반으로 한 가상경관 설계 방법론을 구축하였다. 마지막으로 프로토콜 분석방법론과 공간 구성요소의 비교분석을 통하여 본 연구에서 구축한 설계 방법론의 유효성을 검증하였다. 검증 결과, 본 설계 방법론은 디자이너들의 작업 시간을 22% 이상 줄일 수 있었으며, 동시에 작품의 질을 향상시킬 수 있었다. 향후 본 설계 방법론은 디지털 게임을 비롯한 가상경관 설계 및 구현의 영역에서 활발한 활용을 기대할 수 있을 수 있으며, 나아가 가상경관을 조경 설계의 한 영역으로써 확장이 가능할 것임을 시사한다.

  • PDF

A Content-based TV Program Recommendation System Using Age and Plots (연령 및 프로그램 줄거리를 활용한 콘텐츠 기반 TV 프로그램 추천 시스템)

  • Bang, Hanbyul;Lee, HyeWoo;Lee, Jee-Hyong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.01a
    • /
    • pp.51-54
    • /
    • 2015
  • 추천 시스템의 대표적인 연구 중 하나인 콘텐츠 기반 추천 시스템 연구는 TV 프로그램이나 영화의 줄거리, 장르, 리뷰 등의 콘텐츠의 메타데이터를 이용한다. 그러나 이러한 연구들은 콘텐츠 관련 정보에만 의존할 뿐, 시청자의 프로파일과 콘텐츠의 정보를 함께 고려하지 않는다. 본 논문에서는 시청자의 프로파일 중 연령과 콘텐츠의 정보인 프로그램의 줄거리를 활용한 TV 프로그램 추천 시스템을 제안한다. 본 추천 시스템은 시청자를 연령에 따라 분류한 후, LDA 알고리즘을 이용하여 시청자의 시청 TV 프로그램의 줄거리를 분류된 나이에 따라 각각의 줄거리 토픽 모델로 생성한다. 이를 기준으로 시청자가 원하는 시간대에 방송되는 프로그램들의 줄거리 토픽벡터와 시청자의 선호도 토픽벡터의 유사도를 비교해 가장 유사도가 높은 TV 프로그램을 시청자에게 추천하는 방식이다. 본 논문에서는 연구의 효용성을 검증하기 위해 줄거리만을 사용한 경우와 줄거리와 연령을 동시에 활용한 경우를 비교 실험하였다. 실험을 통해 프로그램의 줄거리만을 사용한 경우보다 연령을 동시에 활용한 경우의 추천 시스템 성능이 개선된 것을 확인할 수 있었다.

  • PDF

Design and Implementation of Field Classification and Information Retrieval Engine;JULSE (검색과 분류가 동시에 가능한 JULSE 시스템의 설계 및 구현)

  • Jang, Jeong-Hyo;Son, Ju-Sung;Kim, Do-Yun;Lee, Sang-Kon;Lee, Won-Hee;Ahn, Dong-Un
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.673-676
    • /
    • 2005
  • 기존의 정보검색 엔진은 문서의 분야에 상관없이 본문 전체의 내용을 보여주므로 사용자가 적합한 내용인지를 파악하기 위해서는 본문 전체를 읽어 보아야 그 적절성 여부를 알 수 있다. 본 논문에서 제안하는 방법은 질의어가 지시하는 분야를 분야연상어를 이용하여 자동으로 파악하고, 사용자가 원하는 분야에서의 검색이 이루어지도록 하는 검색과 분류가 동시에 가능한 엔진을 설계하여 검색결과의 성능을 향상하고자 한다. 이와 함께 적당한 분야연상어가 다수 출현한 단락을 사용자에게 제공하여 본문 전체를 보지 않아도 질의어에 적당한 문서인지를 빠르게 파악하도록 설계하여 구현하였다.

  • PDF

Optimal design considering topological characteristics and residual chlorine concentration of water distribution systems (상수도시스템의 위상학적 특징과 잔류염소 농도를 고려한 최적설계)

  • Ko, Mun Jin;Kim, Min Jun;Kim, Ryul;Choi, Young Hwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.181-181
    • /
    • 2022
  • 상수도 관망은 비정상상황에서도 안전한 물을 안정적으로 공급하는 것을 목표로 한다. 따라서 상수도 관망의 최적 설계는 수리학적 제약조건 (i.e., 절점의 압력, 관의 유속)을 만족하는 설계안을 제시한다. 하지만 점차 커지는 도시 규모에 따라 수질적으로 안전한 물을 공급하지 못하는 문제가 발생하고 있다. 또한, 상수도시스템의 형식 (i.e., 수지상식, 혼합식, 순환식)에 따라 용수의 체류 시간, 절점의 압력 등이 상이하다. 따라서, 본 연구에서는 도시 규모 및 형식과 잔류염소 농도를 고려한 상수도시스템 최적 설계를 진행하였다. 절점의 개수에 따라 도시의 규모를 분류하였으며, BI(BI; Branch Index) 지수를 통해 상수도시스템의 형식을 분류하였다. 또한, 수리학적 제약조건(i.e., 절점의 압력)과 수질적 제약조건 (i.e., 잔류염소 농도)을 설정하여 수리-수질을 동시에 만족하는 최적 설계안을 도출하였다. 비상시에도 물을 안정하게 공급하기 위하여 시스템의 탄력성과 설계비용을 목적함수로 설정하여 다목적 최적 설계를 진행하였다. 이러한 연구는 압력만을 고려한 기존 설계단계에서 수질적 측면을 동시에 고려하여 수질 측면의 안전성을 향상할 수 있다. 또한, 시스템의 탄력성을 고려하여 비정상상황에서도 물을 공급하여 사용성을 향상하는 설계안을 도출하여 수리학적 안정성을 만족하며, 경제적 측면도 향상할 수 있다.

  • PDF