• 제목/요약/키워드: 가중치부여 기법

검색결과 264건 처리시간 0.027초

XGBoost 기반 상수도관망 센서 위치 최적화 (Optimal Sensor Location in Water Distribution Network using XGBoost Model)

  • 장혜운;정동휘
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.217-217
    • /
    • 2023
  • 상수도관망은 사용자에게 고품질의 물을 안정적으로 공급하는 것을 목적으로 하며, 이를 평가하기 위한 지표 중 하나로 압력을 활용한다. 최근 스마트 센서의 설치가 확장됨에 따라 기계학습기법을 이용한 실시간 데이터 기반의 분석이 활발하다. 따라서 어디에서 데이터를 수집하느냐에 대한 센서 위치 결정이 중요하다. 본 연구는 eXtreme Gradient Boosting(XGBoost) 모델을 활용하여 대규모 상수도관망 내 센서 위치를 최적화하는 방법론을 제안한다. XGBoost 모델은 여러 의사결정 나무(decision tree)를 활용하는 앙상블(ensemble) 모델이며, 오차에 따른 가중치를 부여하여 성능을 향상시키는 부스팅(boosting) 방식을 이용한다. 이는 분산 및 병렬 처리가 가능해 메모리리소스를 최적으로 사용하고, 학습 속도가 빠르며 결측치에 대한 전처리 과정을 모델 내에 포함하고 있다는 장점이 있다. 모델 구현을 위한 독립 변수 결정을 위해 압력 데이터의 변동성 및 평균압력 값을 고려하여 상수도관망을 대표하는 중요 절점(critical node)를 선정한다. 중요 절점의 압력 값을 예측하는 XGBoost 모델을 구축하고 모델의 성능과 요인 중요도(feature importance) 값을 고려하여 센서의 최적 위치를 선정한다. 이러한 방법론을 기반으로 상수도관망의 특성에 따른 경향성을 파악하기 위해 다양한 형태(예를 들어, 망형, 가지형)와 구성 절점의 수를 변화시키며 결과를 분석한다. 본 연구에서 구축한 XGBoost 모델은 추가적인 전처리 과정을 최소화하며 대규모 관망에 간편하게 사용할 수 있어 추후 다양한 입출력 데이터의 조합을 통해 센서 위치 외에도 상수도관망에서의 성능 최적화에 활용할 수 있을 것으로 기대한다.

  • PDF

뉴스기사의 연관 단어 텍스트 마이닝을 이용한 스타의 분야별 기여도순위 비교기법 (Ranking Contribution of Star in Each Domain Using Association Text Mining News Articles on the Web)

  • 강윤정;윤재열;임지연;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1191-1194
    • /
    • 2011
  • 스타의 대중에 대한 인기가 브랜드의 이미지 제고와 상업적 영향을 끄는 마케팅 전략을 스타 마케팅이라고 한다. 오늘날의 스타는 방송, 연예활동뿐만 아니라 스포츠, 정치활동, 사회기여활동 등 다양한 분야에서 활약하며 스타의 이미지는 그 활약상에 영향을 받는다. 스타의 이미지는 브랜드 및 기업의 이미지로 직결되므로 그에 대한 사전분석은 마케팅에서 중요한 요소이다. 그래서 일반적으로 스타들이 활약하는 도메인을 분류하여서 그 스타에 대해서 검색을 하였을 때 어떤 분야에서 활약하고 기여를 하는지 그 기여도를 도메인에 따라 랭킹을 매기는 방법을 제안한다. 뉴스기사에서 텍스트 마이닝 기술을 이용하여 스타의 이름과 활동 도메인들에 대해서 관련단어를 빈도에 따라 추출한다. 그리고 관련된 단어들을 이용하여 스타에 대한 뉴스 중 각 도메인과 관련된 기사들을 카운트하며 도메인에 대해서 긍정 혹은 부정적인 보도내용일 경우에는 극성을 부여하여 그 가중치를 달리한다. 빈도 및 극성을 고려한 점수화에 의해 스타가 기여하는 분야에 대한 순위를 매긴다.

문장 중요도를 이용한 자동 문서 범주화 (Automatic Text Categorization using the Importance of Sentences)

  • 고영중;박진우;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권6호
    • /
    • pp.417-424
    • /
    • 2002
  • 자동 문서 범주화란 문서의 내용에 기반하여 미리 정의되어 있는 범주에 문서를 자동으로 분류하는 작업이다. 문서 분류를 위해서는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고, 이러한 자질들을 통해 분류할 문서를 표현해야 한다. 기존의 연구들은 문장간의 구분 없이, 문서 전체에 나타난 각 자질의 빈도수를 이용하여 문서를 표현 한다. 그러나, 하나의 문서 내에서도 중요한 문장과 그렇지 못한 문장의 구분이 있으며, 이러한 문장 중요도의 차이는 각각의 문장에 나타나는 자질의 중요도에도 영향을 미친다. 본 논문에서는 문서 요약에서 사용되는 중요 문장 추출 기법을 문서 분류에 적용하여, 문서 내에 나타나는 각 문장들의 문장 중요도를 계산하고 문서의 내용을 잘 나타내는 문장들과 그렇지 못한 문장들을 구분하여 각 문장에서 출현하는 자질들의 가중치를 다르게 부여하여 문서를 표현한다. 이렇게 문장들의 중요도를 고려하여 문서를 표현한 기법의 성능을 평가하기 위해서 뉴스 그룹 데이타를 구축하고 실험하였으며 문장 중요도를 사용하지 않은 시스템 보다 향상된 성능을 얻을 수 있었다.

멀티 온톨로지 기반의 키워드 연관성을 이용한 전문가 검색 시스템 (The Expert Search System using keyword association based on Multi-Ontology)

  • 정계동;황치곤;최영근
    • 한국정보통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.183-190
    • /
    • 2012
  • 본 연구는 연구논문 및 저자 프로파일을 기반으로 상호 협력이 가능한 전문가 검색 시스템을 구축한다. 제안한 방법론은 다음과 같다. 첫째, 입력 키워드와 가장 연관성 높은 키워드를 검색하기 위한 가중치 부여 기법을 제안하고, 둘째, 이 기법을 통해 전문가를 효율적으로 검색하는 방안을 제안한다. 우선적으로 논문에서 키워드와 저자 프로파일을 추출하고, 이를 통하여 전문가를 검색할 수 있도록 한다. 이것은 소셜 네트워크의 여러 분야에서 활용할 수 있다. 이러한 정보는 여러 시스템에 분산되어 있다. 이렇게 분산된 데이터를 통합하기 위한 기술로 멀티 온토롤지를 이용하는 기법을 제안한다. 멀티 온톨로지는 메타 온톨로지, 인스턴스 온톨로지, 로케이션 온톨로지와 연관관계 온톨로지로 구성되고, 연관관계 온톨로지는 동적으로 키워드 연관관계 분석을 통해 구축된다. 이 멀티 온톨로지를 이용하여 전문가 망을 제공하고, 이것은 키워드의 연관관계 추적을 통한 전문가 검색이 가능하도록 한다. 이를 통하여 전문가들의 연구물을 확인할 수 있도록 제공함으로써 세부 전문분야를 확인할 수 한다.

유사 비디오 데이터 집합에서 효율적인 특성정보 프로파일 생성 기법 (Efficient Generation of a Feature Profile in a Set of Similar Video Data)

  • 박동철;장중혁;이원석
    • 정보처리학회논문지D
    • /
    • 제12D권2호
    • /
    • pp.219-232
    • /
    • 2005
  • 산업정보사회가 발달함에 따라 다양한 형태의 비디오 데이터들이 여러 분야에서 대량으로 생성되고 있다. 이에 따라 이들의 가공을 통해 비디오에 나타난 의미 정보를 추출하려는 다양한 접근들이 시도되고 있으며, 근래 들어 데이터 마이닝 기법을 응용한 특성정보 프로파일 생성 방법에 대한 관심이 증대되고 있다. 그러나 기존의 연구에서는 시공간적으로 방대한 비디오 데이터의 특징으로 인해 해당 분야에 대한 연구가 소극적으로 진행되어왔다. 본 논문에서는 유사한 의미를 나타내는 비디오 데이터 집합에서 의미있는 지식을 추출하는 특성정보 프로파일 생성 기법을 제안한다. 더불어, 특성정보 프로파일 생성과정의 효율적인 수행을 위해서 다양한 추가 고려 사항을 제시한다. 전체 특성 정보들 중에서 주요 정보에만 집중함으로써 데이터 양을 감소시키는 방법, 잡음 요소를 제거하고 관심영역을 설정하여 데이터 양을 감소시키는 방법 및 동적인 영역에 가중치를 부여하여 추출된 정보의 정확도를 향상시키는 방법 등이 포함된다. 끝으로, 실험용 비디오 데이터에 대하여 논문에서 제안된 다양한 압축 방법을 적용하여 클러스터링을 수행하고 이를 통해 구해진 특성 정보 프로파일과 원본 비디오 데이터의 특성정보와 비교하여 본 논문에서 제시한 다양한 압축 알고리즘을 검증한다.

호모그래피와 주성분 분석을 이용한 실루엣 기반 걸음걸이 인식 (Silhouette-based Gait Recognition Using Homography and PCA)

  • 정승도;김수선;조태경;최병욱;조정원
    • 한국콘텐츠학회논문지
    • /
    • 제6권1호
    • /
    • pp.31-40
    • /
    • 2006
  • 본 논문에서는 걸음걸이 실루엣 영상을 이용한 걸음걸이 인식 방법을 제안한다. 걸음걸이 특징 정보는 걸음걸이의 방향 변화에 많은 영향을 받는다. 따라서 본 논문에서는 평면 호모그래피를 이용하여 실루엣을 고유시점으로 재구성함으로써 방향변화의 영향을 줄이고자 한다. 이때, 평면 호모그래피는 카메라 보정과 같은 복잡한 계산과정 없이 걸음걸이 시퀀스 정보만을 이용하여 추정된다. 동일인의 걸음걸이 실루엣이라 하더라도 배경 제거시의 에러 등으로 인해 공통적인 특성에서 벗어나는 영역이 존재한다. 각 개인의 동일 특성에서 벗어나는 특성을 분석하기 위하여, 본 논문에서는 주성분 분석 기법을 사용한다. 그러나 일반적인 패턴 분류에 적용되는 주성분 분석 기법과는 달리 본 논문에서는 공통적인 특성에서 벗어나는 정도의 판단과 그에 따르는 가중치 부여 기준으로써 사용한다. 실험결과 제안하는 걸음걸이 인식 기법은 걸음걸이 방향 변화에 강인하고, 분별력을 향상시킬 수 있음을 확인하였다.

  • PDF

공간적 다기준평가 기법을 이용한 도시의 삶의 질 분석 (A Spatial Multicriteria Analysis Approach to Urban Quality of Life Assessment)

  • 전병운
    • 한국지리정보학회지
    • /
    • 제11권4호
    • /
    • pp.122-138
    • /
    • 2008
  • 도시의 삶의 질 분석에 대한 화소기반 기법은 복잡성이라는 조건 하에서의 공간의사결정문제로 간주될 수 있다. 왜냐하면, 도시의 삶의 질 분석은 상이한 가중치가 부여된 여러 개의 평가기준에 기반을 두고 높은 혹은 낮은 수준의 삶의 질을 가진 지역을 도시공간에서 탐색하기 때문이다. 이러한 도시의 삶의 질 분석에는 측정단위가 다른 여러 개의 평가기준들의 부적절한 스케일링, 평가자의 판단에 있어서 비구조적인 주관성 그리고 래스터 GIS환경에서 대량의 데이타 처리 등과 같은 어려움이 있다. 도시의 삶의 질 분석에 있어서 이러한 비구조적 문제를 해결하기 위한 대안적인 접근방법의 개발이 필요하다. 이러한 점에서, 본 연구는 래스터 GIS 환경에서 도시의 삶의 질을 평가하기 위한 공간적 다기준평가 기법을 제안하고자 한다. 이러한 방법론은 애틀란타 대도시권을 사례로 예시되어진다. 본 연구에서 사용된 방법론은 도시의 삶의 질을 평가하는데 있어서 새로운 대안적인 접근방법으로 제시된다.

  • PDF

복합 조도계수 산정을 위한 단면 분할기법 개발 (Development of Subsection Division Method to Estimate a Composite Roughness Coefficient)

  • 김지성;김극수;김원
    • 한국수자원학회논문집
    • /
    • 제43권11호
    • /
    • pp.945-956
    • /
    • 2010
  • 실무적 목적으로 횡방향으로 흐름저항 요소가 변화하는 단면에서는 단면전체의 저항을 반영할 수 있는 복합 조도계수를 산정함으로써 개수로 흐름해석에 사용하고 있다. 본 연구에서는 기존 복합 조도계수 산정식을 가중치 부여방법에 따라 구분하고, 최적의 복합 조도계수 값을 산정하기 위하여 각 소단면 내에서 힘의 균형을 고려한 단면분할기법을 개발하였다. Djajadi (2009)와 Knight and Macdonald (1979)의 수리실험에 의한 실측 복합 조도계수와 비교함으로써 개발된 단면분할기법의 정확성과 타당성을 검증하였으며, 더불어 기존 13개 복합 조도계수 산정식들의 한계 및 적용성을 분석하였다. 분석결과, 대표적인 복합 조도계수 산정식인 Horton 방법은 단면의 통수능을 과소평가할 수 있으며, Lotter 방법은 실측치와 잘 일치하는 결과를 제공할 수 있으나, 선행조건으로 본 연구에서 제안된 Z-method에 근거한 방법처럼 적합한 단면분할방법이 사용되어야 함을 알 수 있었다.

특징선택과 특징가중의 융합을 통한 웹문서분류 성능의 개선 (Performance Improvement of Web Document Classification through Incorporation of Feature Selection and Weighting)

  • 이아람;김한준;현만
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.141-148
    • /
    • 2013
  • 기계학습을 이용한 자동분류시스템은 학습과정을 통해 분류모델을 구축하고 이를 기반으로 미분류 데이터를 특정 카테고리로 분류한다. 기계학습 기반 자동분류 시스템의 성능은 분류모델의 구성 인자인 특징의 품질에 크게 의존한다. 문서 데이터의 경우 특징 집합을 생성하기 위해 문서내의 출현단어와 문서의 구조적 정보를 활용한다. 특히 웹문서로부터 특징을 추출하기 위해 단어뿐만 아니라 태그, 하이퍼링크 정보를 분석할 수 있다. 최근 웹문서의 분류 기법에 대한 연구는 기계학습 알고리즘보다 특징 생성 및 가공 기술에 초점을 맞추고 있다. 이에 본 논문은 웹문서의 분류모델을 개선하기 위해 단어, 태그, 하이퍼링크 정보로부터 고품질의 특징을 선별 추출하여 가중치를 자동으로 부여하는 기법을 제안한다. Web-KB 문서집합을 이용한 다양한 실험을 통해 제안 기법의 우수성을 보인다.

Stack-Attention을 이용한 흐릿한 영상 강화 기법 (Blurred Image Enhancement Techniques Using Stack-Attention)

  • 박채림;이광일;조석제
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권2호
    • /
    • pp.83-90
    • /
    • 2023
  • 컴퓨터 비전에서 흐릿한 영상은 영상 인식률을 저하시키는 중요한 요인이다. 이것은 주로 카메라가 불안정하게 초점을 맞추지 못하거나, 노출시간동안 장면의 물체가 빠르게 움직일 때 발생한다. 흐릿한 영상은 시각적 품질을 크게 저하시켜 가시성을 약화시키며, 이러한 현상은 디지털카메라의 기술이 지속적으로 발전하고 있음에도 불구하고 빈번하게 일어난다. 본 논문에서는 합성곱 신경망으로 설계된 심층 멀티 패치 계층 네트워크(Deep multi patch hierarchical network)를 기반으로 수정된 빌딩 모듈을 대체하여 입력 영상의 디테일을 잡고 주의 집중 기법을 도입하여 흐릿한 영상 속 물체에 대한 초점을 다방면으로 맞추어 영상을 강화한다. 이것은 서로 다른 스케일에서 각각의 가중치를 측정 및 부여하여 흐림의 변화를 차별적으로 처리하고 영상의 거친 수준에서 미세한 수준까지 순차적으로 복원하여 글로벌한 영역과 로컬 영역 모두 조정한다. 이러한 과정을 통해 저하된 화질을 복구하고 효율적인 객체 인식 및 특징을 추출하며 색 항상성을 보완하는 우수한 결과를 보여준다.