• 제목/요약/키워드: Tree algorithm

검색결과 1,726건 처리시간 0.023초

Exploring the Feature Selection Method for Effective Opinion Mining: Emphasis on Particle Swarm Optimization Algorithms

  • Eo, Kyun Sun;Lee, Kun Chang
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권11호
    • /
    • pp.41-50
    • /
    • 2020
  • 감성분석 연구에서는 문장에 내포된 감성을 결정짓는 단어를 찾는 것으로부터 시작된다. 경영자는 소비자가 주로 사용하는 단어를 분석함으로써 시장의 반응을 이해할 수 있다. 본 연구에서는 감성분류의 성능에 영향을 미치는 단어를 찾기 위하여 입자군집최적화 탐색방법과 다목적진화 알고리즘이 적용된 속성선택 방법을 제안한다. 속성선택 방법은 기존 머신러닝 분류기를 벤치마킹함으로써 성능이 비교된다. 벤치마킹된 분류기는 의사결정나무, 나이브 베이지안 네트워크, 서포터 벡터 머신, 랜덤포레스트, 배깅, 랜덤 서브스페이스, 로테이션 포레스트이다. 연구결과에 따르면, 입자군집 최적화 알고리즘이 적용된 속성선택방법으로 선택된 속성을 사용한 경우에 속성의 수를 상당히 줄일 수 있었고, 분류기의 성능을 유지시킬 수 있었다. 특히, 정확도 결과에서는 입자군집 최적화 탐색방법으로 선택된 속성을 사용한 경우의 서포터 벡터 머신의 성능이 가장 높게 나타났다. AUC 결과에서는 랜덤 서브스페이스가 가장 높게 나타났다. 본 연구의 결과는 해당 탐색방법과 분류기를 적용함으로써 오피니언 마이닝 모델의 성능을 효율적으로 유지 및 개선시키도록 도움을 준다.

RTF 필터링을 이용한 모바일매핑시스템 레이저 데이터의 도로 장애물 제거에 관한 연구 (A Study for Removing Road Shields from Mobile Mapping System of the Laser Data using RTF Filtering Techniques)

  • 송현근;강병주;이성훈;최윤수
    • 대한공간정보학회지
    • /
    • 제20권1호
    • /
    • pp.3-12
    • /
    • 2012
  • 현재 전 세계적으로 환경보전이나 석탄자원 고갈 등의 문제로 인해 친환경 자동차의 개발이 매우 중요한 이슈로 대두되고 있으며, 이에 따라 고정밀 3차원 도로 지도제작에 많은 관심을 기울이고 있는 추세이다. 이와 같은 목적의 달성을 위해 현재까지 MMS을 이용한 데이터 획득 방법이 가장 효과적인 것으로 보고되고 있다. 이를 위해 본 연구에서는 항공 레이저 측량 데이터에 대한 처리를 목적으로 개발된 기본적인 RTF 필터 알고리즘을 MMS에 적합하도록 수정하여 적용하였다. 실험을 통해 도출된 정량적 분석 결과 지면은 99.71%, 비지면은 99.95%의 매우 높은 제작자 정확도를 나타내고 있으며, 도로 내에 존재하는 자동차, 가로수, 중앙분리대 등의 도로 장애물이 효과적으로 제거된 결과가 도출되었다. 이를 통해 실무 작업에 효과적인 적용 및 작업 효율성 향상을 기대할 수 있을 것으로 판단된다.

효율적인 비디오 데이터베이스 구축을 위해 카메라와 객체 파라미터를 이용한 계층형 영상 모자이크 (A Hierarchical Image Mosaicing using Camera and Object Parameters for Efficient Video Database Construction)

  • 신성윤;이양원
    • 한국멀티미디어학회논문지
    • /
    • 제5권2호
    • /
    • pp.167-175
    • /
    • 2002
  • 모자이크 영상은 연관성 있는 비디오 프레임이나 정지 영상들을 합성하여 하나의 새로운 영상을 생성하는 것으로서 영상의 정렬, 통합 그리고 중복성에 대한 분석으로 수행된다. 본 논문에서는 효율적인 비디오 데이터 베이스 구축을 위하여 카메라와 객체 파라미터를 이용한 계층형 영상 모자이크 시스템을 제시한다. 모자이크 영상 생성의 빠른 계산 시간과 정적 및 동적 영상 모자이크 구축을 위하여 트리 기반 영상 모자이크 시스템을 구축한다. 카메라 파라미터를 측정하기 위하여 최소사각형 오류기법과 어파인 모델을 이용하였다. 객체의 추출을 위하여 차영상, 매크로 블록, 영역 분할과 4분할 탐색 기법들을 제시하여 사용하였다. 또한, 동적 객체 표현을 위하여 동적 궤도 표현 방법을 제시하였고, 완만한 모자이크 영상 생성을 위하여 블러링을 이용하였다.

  • PDF

프러스펙터의 분류 규칙 습득을 위한 유전자 알고리즘 기반 귀납적 학습 시스템 (A GA-based Inductive Learning System for Extracting the PROSPECTOR`s Classification Rules)

  • 김영준
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권11호
    • /
    • pp.822-832
    • /
    • 2001
  • 주어진 사례의 집합으로부터 그 사례들을 분류할 수 있는 프러스펙터 규칙 유형의 분류 규칙들을 습득하는 학습 시스템을 유전자 알고리즘을 이용하여 구현하였다. 유전자 알고리즘을 이용한 학습 시스템의 구현에서 개체 집단은 규칙 집합으로 구성되고 규칙 집합은 교배, 돌연 변이, 역치 연산자 등의 유전 연산자를 이용하여 규칙 집합내의 규칙을 교환함으로써 새로운 자식을 생성한다. 본 논문에서는 구현된 학습 환경을 분류 규칙의 구문 형태와 의미, 개체 집단의 구조 및 유전 연산자의 구현 등을 중심으로 설명한다. 효율적인 돌연변이 연산자의 구현을 위해 개발된 규칙 성능 평가 기법과 규칙생성 기법을 소개하고 분류 성능을 향상시키기 위한 기법으로 다수의 규칙 집합을 이용하여 분류 시스템을 구축하기 위한 기법을 소개한다. 본 연구를 통해 구현된 학습 시스템의 성능을 다양한 사례 집합을 이용하여 평가하고 이를 신경망, 결정 트리 등과 비교하였다.

  • PDF

CTOC에서 자바 바이트코드를 위한 정적 단일 배정 형태 (Static Single Assignment Form for Java Bytecodes in CTOC)

  • 김기태;유원희
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.939-946
    • /
    • 2006
  • 자바 바이트코드는 많은 장점을 갖지만 수행 속도가 느리고 분석이 어렵다는 단점을 갖는다. 이를 극복하기 위해 바이트코드에 대한 분석과 최적화가 수행되어야 한다. 최적화된 코드를 위해 CTOC를 구현하였다. 바이트코드에 대해 분석과 최적화를 수행하기 위해서는 우선 CFG를 생성해야 한다. 바이트코드의 특성 때문에 기존의 제어 흐름 분석 기술을 바이트코드에 적합하게 확장해야 한다. 또한 정적으로 분석하기 위해 CFG를 SSA Form으로 변환한다. SSA Form으로 변환하기 위해서는 지배 관계, 지배자 트리, 직접 지배자, $\phi$-함수, 재명명, 지배자 경계 등 많은 정보에 대한 계산을 수행한다. 본 논문은 기존의 CFG로부터 SSA Form으로 변환을 위해 알고리즘과 변환 과정을 기술한다. SSA Form이 적용된 그래프는 추후에 타입 추론과 최적화를 위해 사용된다.

디지털 맘모그램을 위한 라플라시안 피라미드에서 대비 척도를 이용한 대비 향상 방법 (A Contrast Enhancement Method using the Contrast Measure in the Laplacian Pyramid for Digital Mammogram)

  • 전금상;이원창;김상희
    • 융합신호처리학회논문지
    • /
    • 제15권2호
    • /
    • pp.24-29
    • /
    • 2014
  • X-선 유방촬영술은 유방암의 조기발견을 위해 가장 일반적으로 이용되고 있다. 유방암의 조기 발견과 진단의 효율성을 증가시키기 위하여 많은 영상향상 방법들이 연구개발 되었다. 본 논문은 디지털 맘모그램을 위하여 라플라시안 피라미드에서 대비척도를 이용한 다중 스케일 대비 향상 방법을 제안한다. 제안한 방법은 입력 영상을 가우시안 피라미드와 라플라시안 피라미드로 분해하고, 분해된 다해상도 영상의 피라미드 계수들은 저주파수 성분들과 고주파수 성분들의 비율로 대역 제한된 국부 대비척도를 정의한다. 대비 향상을 위하여 정의된 대비척도를 이용하여 분해된 피라미드 계수들을 수정하고, 수정된 계수들로 피라미드 복원 과정을 거처 최종 향상된 영상을 얻는다. 제안된 방법의 성능은 실험을 통하여 기존 방법들과 향상결과를 비교하고, 대비 측정 알고리즘을 이용한 정량적인 평가결과에서 우수한 성능을 확인하였다.

Applicability of Geo-spatial Processing Open Sources to Geographic Object-based Image Analysis (GEOBIA)

  • Lee, Ki-Won;Kang, Sang-Goo
    • 대한원격탐사학회지
    • /
    • 제27권3호
    • /
    • pp.379-388
    • /
    • 2011
  • At present, GEOBIA (Geographic Object-based Image Analysis), heir of OBIA (Object-based Image Analysis), is regarded as an important methodology by object-oriented paradigm for remote sensing, dealing with geo-objects related to image segmentation and classification in the different view point of pixel-based processing. This also helps to directly link to GIS applications. Thus, GEOBIA software is on the booming. The main theme of this study is to look into the applicability of geo-spatial processing open source to GEOBIA. However, there is no few fully featured open source for GEOBIA which needs complicated schemes and algorithms, till It was carried out to implement a preliminary system for GEOBIA running an integrated and user-oriented environment. This work was performed by using various open sources such as OTB or PostgreSQL/PostGIS. Some points are different from the widely-used proprietary GEOBIA software. In this system, geo-objects are not file-based ones, but tightly linked with GIS layers in spatial database management system. The mean shift algorithm with parameters associated with spatial similarities or homogeneities is used for image segmentation. For classification process in this work, tree-based model of hierarchical network composing parent and child nodes is implemented by attribute join in the semi-automatic mode, unlike traditional image-based classification. Of course, this integrated GEOBIA system is on the progressing stage, and further works are necessary. It is expected that this approach helps to develop and to extend new applications such as urban mapping or change detection linked to GIS data sets using GEOBIA.

한국형 재활환자분류체계 버전 1.0 개발 (The Development of Korean Rehabilitation Patient Group Version 1.0)

  • 황수진;김애련;문선혜;김지희;김진휘;하영혜;양옥영
    • 보건행정학회지
    • /
    • 제26권4호
    • /
    • pp.289-304
    • /
    • 2016
  • Background: Rehabilitations in subacute phase are different from acute treatments regarding the characteristics and required resource consumption of the treatments. Lack of accuracy and validity of the Korean Diagnosis Related Group and Korean Out-Patient Group for the acute patients as the case-mix and payment tool for rehabilitation inpatients have been problematic issues. The objective of the study was to develop the Korean Rehabilitation Patient Group (KRPG) reflecting the characteristics of rehabilitation inpatients. Methods: As a retrospective medical record survey regarding rehabilitation inpatients, 4,207 episodes were collected through 42 hospitals. Considering the opinions of clinical experts and the decision-tree analysis, the variables for the KRPG system demonstrating the characteristics of rehabilitation inpatients were derived, and the splitting standards of the relevant variables were also set. Using the derived variables, we have drawn the rehabilitation inpatient classification model reflecting the clinical situation of Korea. The performance evaluation was conducted on the KRPG system. Results: The KRPG was targeted at the inpatients with brain or spinal cord injury. The etiologic disease, functional status (cognitive function, activity of daily living, muscle strength, spasticity, level and grade of spinal cord injury), and the patient's age were the variables in the rehabilitation patients. The algorithm of KRPG system after applying the derived variables and total 204 rehabilitation patient groups were developed. The KRPG explained 11.8% of variance in charge for rehabilitation inpatients. It also explained 13.8% of variance in length of stay for them. Conclusion: The KRPG version 1.0 reflecting the clinical characteristics of rehabilitation inpatients was classified as 204 groups.

셀룰라 네트워크에서 위치 정보 관리 비용을 최소화하는 서버의 중복도 (Server Replication Degree Reducing Location Management Cost in Cellular Networks)

  • 김재훈;임성화
    • 한국정보과학회논문지:정보통신
    • /
    • 제29권3호
    • /
    • pp.265-275
    • /
    • 2002
  • 셀룰라 기반의 이동컴퓨팅 환경에서 이동 호스트의 위치 및 상태관리를 위하여 디폴트 서버(default sever)기법이 널리 사용되나 이동 호스트로의 호 요청이 많은 경우나 호를 요청한 클라이언트가 디볼트서버와 멀리 떨어진 경우 통신 오버 헤드가 커지며, 디폴트서버에 결함이 발생할 경우 해당 이동 호스트에 대한 연결이 불가능해 진다. 디폴트 서버를 여러 개로 중복 시키면 위와 같은 문제점을 경감시키고 디폴트 서버와의 통신비용을 줄일 수 있다. 그러나 디폴트 서버를 중복 시킬 경우 전체 통신비용은 이동 호스트의 이동 성향과 질의(query) 요청의 빈도, 중복 디폴트 서버의 할당 위치와 중복 개수에 영향을 받는다. 본 논문에서는 디폴트 서버를 통신 환경에 따라 최적의 위치에 할당 시켰을 때 nn grid네트워크 환경과 이진트리 네트워크 환경에서 각각의 최적 디폴트 서버 중복 개수를 구하는 방법을 제시하였고, 시뮬레이션을 통하여 수학적 방법이 유용함을 보였다.

접미사 배열을 이용한 선형시간 탐색 (Linear-Time Search in Suffix Arrays)

  • 심정섭;김동규;박희진;박근수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권5호
    • /
    • pp.255-259
    • /
    • 2005
  • 계산 생물학이나 문자열 연구 분야에 다양하게 웅용되는 패턴 탐색 문제에 접미사 트리와 접미사 배열과 같은 인덱스 자료구조가 널리 사용되어 왔다. 접미사 트리를 이용한 패턴 탐색이 접미사 배열을 이용한 탐색보다 시간 복잡도 관점에서 더 빠른 것으로 알려져 왔다. 즉, 상수 크기의 알파벳에 대해 패턴 P를 길이 n인 텍스트에서 탐색하기 위해 접미사 트리는 O(${\mid}P{\mid}$)시간이 필요한 반면 접미사 배열은 O(${\mid}P{\mid}+ logn$) 시간이 필요하다. 본 논문에서는 상수 크기 알파벳에 대해 접미사 배열을 이용한 선형시간 탐색 알고리즘을 제시한다. 본 알고리즘은 일반적인 알파벳 $\Sigma$에 대해서는 O(${\mid}P{\mid}log{\mid}{\Sigma$)시간이 필요하다.