• 제목/요약/키워드: Web Research Method

검색결과 972건 처리시간 0.021초

이질성 학습을 통한 문서 분류의 정확성 향상 기법 (Improving the Accuracy of Document Classification by Learning Heterogeneity)

  • 윌리엄;현윤진;김남규
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.21-44
    • /
    • 2018
  • 최근 인터넷 기술의 발전과 함께 스마트 기기가 대중화됨에 따라 방대한 양의 텍스트 데이터가 쏟아져 나오고 있으며, 이러한 텍스트 데이터는 뉴스, 블로그, 소셜미디어 등 다양한 미디어 매체를 통해 생산 및 유통되고 있다. 이처럼 손쉽게 방대한 양의 정보를 획득할 수 있게 됨에 따라 보다 효율적으로 문서를 관리하기 위한 문서 분류의 필요성이 급증하였다. 문서 분류는 텍스트 문서를 둘 이상의 카테고리 혹은 클래스로 정의하여 분류하는 것을 의미하며, K-근접 이웃(K-Nearest Neighbor), 나이브 베이지안 알고리즘(Naïve Bayes Algorithm), SVM(Support Vector Machine), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network) 등 다양한 기술들이 문서 분류에 활용되고 있다. 특히, 문서 분류는 문맥에 사용된 단어 및 문서 분류를 위해 추출된 형질에 따라 분류 모델의 성능이 달라질 뿐만 아니라, 문서 분류기 구축에 사용된 학습데이터의 질에 따라 문서 분류의 성능이 크게 좌우된다. 하지만 현실세계에서 사용되는 대부분의 데이터는 많은 노이즈(Noise)를 포함하고 있으며, 이러한 데이터의 학습을 통해 생성된 분류 모형은 노이즈의 정도에 따라 정확도 측면의 성능이 영향을 받게 된다. 이에 본 연구에서는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 이를 통해 분류의 정확도를 향상시킬 수 있는 방안을 제안하고자 한다. 즉, 분류의 대상이 되는 원 문서와 전혀 다른 특징을 갖는 이질적인 데이터소스로부터 추출한 형질을 원 문서에 일종의 노이즈의 형태로 삽입하여 이질성 학습을 수행하고, 도출된 분류 규칙 중 문서 분류기의 정확도 향상에 기여하는 분류 규칙만을 추출하여 적용하는 방식의 규칙 선별 기반의 앙상블 준지도학습을 제안함으로써 문서 분류의 성능을 향상시키고자 한다.

가정용수의 용도별 사용 원단위 분석 (End-use Analysis of Household Water by Metering)

  • 김화수;이두진;김주환;정관수
    • 대한토목학회논문집
    • /
    • 제28권5B호
    • /
    • pp.595-601
    • /
    • 2008
  • 본 연구에서는 전국 140여개 가구를 대상으로 실측 조사한 자료를 바탕으로 가정용수의 용도별 사용량을 도출함으로써 상 하수도시설설계에 활용할 수 있는 원단위를 제시하고, 용도별 사용특성분석, 영향인자 평가 등을 통하여 가정용수의 변동특성을 이해하고 향후 사용경향을 예측할 수 있는 정보를 제공하고자 하였다. 전국 140가구를 대상으로 약 3여년간 실측한 결과, 가정용수의 총사용량은 165.8 lpcd였으며, 각 용도별 사용량은 세면용수 15.4 lpcd(10%), 욕조용수 24.7 lpcd(16%), 싱크대용수 29.7 lpcd(19%), 세탁기용수 30.8 lpcd(20%), 변기용수 38.5 lpcd(25%), 기타용수 13.5 lpcd(9%)순으로 나타났다. 가정용수 중에서 변기용수의 사용량이 가장 많은 것으로 나타났으며, 베란다, 정원용수 등이 포함된 기타용수의 경우 사용빈도가 일정하지 않고 사용량의 편차도 심하여 변동계수와 표준편차가 가장 크게 나타났다. 가정용수의 용도별 사용량을 미국, 영국 가정과 비교한 결과, 기타용수와 실외용수를 제외하고는 미국의 실내용수 사용량과 비율이 우리나라와 매우 유사한 특성을 보였다. 가정에서 물사용에 기초한 생활양식이 미국과 유사하게 변화되고 있음을 간접적으로 보여준 결과이다. 또한 1985년에 서울에서 조사된 용도별 사용량과 금번결과를 비교한 결과, 목욕, 변기, 세탁, 취사용수의 총량은 23 l가 증가하였으며, 특히 세면과 욕조용수를 합산한 목욕용수가 27 l에서 40 l로 크게 늘어났고, 세탁용수도 17 l나 늘어났다. 생활양식이 서구화되면서 가정에서의 목욕, 사워문화가 점차 확산되고 대용량 세탁기의 보급이 늘어난 것 등이 영향을 미쳤을 것으로 추측되었다.