• 제목/요약/키워드: 최적분류기준

검색결과 118건 처리시간 0.031초

중립도 기반 선택적 단어 제거를 통한 유용 리뷰 분류 정확도 향상 방안 (Increasing Accuracy of Classifying Useful Reviews by Removing Neutral Terms)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.129-142
    • /
    • 2016
  • 전자상거래에서 소비자들의 구매 의사결정에 판매 제품을 이미 구매하여 사용한 고객의 리뷰가 중요한 영향을 미치고 있다. 전자상거래 업체들은 고객들이 제품 리뷰를 남기도록 유도하고 있으며, 구매고객들도 적극적으로 자신의 경험을 공유하고 있다. 한 제품에 대한 고객 리뷰가 너무 많아져서 구매하려는 제품의 모든 리뷰를 읽고 제품의 장단점을 파악하는 것은 무척 힘든 일이 되었다. 전자상거래 업체들과 연구자들은 텍스트 마이닝을 활용하여 리뷰들 중에서 유용한 리뷰들의 속성을 파악하거나 유용한 리뷰와 유용하지 않은 리뷰를 미리 분류하는 노력을 수행하고 있다. 고객들에게 유용한 리뷰를 필터링하여 전달하는 방안이다. 본 연구에서는 문서-단어 매트릭스에서 단어의 제거 기준으로 온라인 고객 리뷰가 유용한 지, 그렇지 않은지를 구분하는 문제에서 단어들이 유용 리뷰 집합과 유용하지 않은 리뷰집합에 중복하여 등장하는 정도를 측정한 중립도를 제시한다. 제시한 중립도를 희소성과 함께 분석에 활용하여 제거할 단어를 선정한 후에 각 분류 알고리즘의 성과를 비교하였다. 최적의 성과를 보이는 중립도를 찾았으며, 희소성과 중립도에 따라 단어를 선택적으로 제거하였다. 실험은 Amazon.com의 'Cellphones & Accessories', 'Movies & TV program', 'Automotive', 'CDs & Vinyl', 'Clothing, Shoes & Jewelry' 제품 분야 고객 리뷰와 사용자들의 리뷰에 대한 평가를 활용하였다. 전체 득표의 수가 4개 이상인 리뷰 중에서 제품 카테고리 별로 유용하다고 판단되는 1,500개의 리뷰와 유용하지 않다고 판단되는 1,500개의 리뷰를 무작위로 추출하여 연구에 사용하였다. 데이터 집합에 따라 정확도 개선 정도가 상이하며, F-measure 기준으로는 두 알고리즘에서 모두 희소성과 중립도에 기반하여 단어를 제거하는 방안이 더 성과가 높았다. 하지만 Information Gain 알고리즘에서는 Recall 기준으로는 5개 제품 카테고리 데이터에서 언제나 희소성만을 기준으로 단어를 제거하는 방안의 성과가 높았으며, SVM에서는 전체 단어를 활용하는 방안이 Precision 기준으로 성과가 더 높았다. 따라서, 활용하는 알고리즘과 분석 목적에 따라서 단어 제거 방안을 고려하는 것이 필요하다.

최적 교통분포를 고려한 해상교량의 안전 통항 폭에 관한 연구 (A Study on the Safety Navigational Width of Bridges Across Waterways Considering Optimal Traffic Distribution)

  • 손우주;문지하;구정민;조익순
    • 한국항해항만학회지
    • /
    • 제46권4호
    • /
    • pp.303-312
    • /
    • 2022
  • 해상교량은 선박의 통항 안전성 관점에서 가항수역을 줄이는 간섭요인으로 작용한다. 본 연구에서는 선박의 안전한 통항을 위해 최적 통항분포에 기반한 안전 통항폭을 분석하였다. 해상교량을 통항하는 선박의 안전 통항 폭에 대한 분석을 위해 AIS data에 기반한 선박교통분포를 조사하여 K-means clustering을 통해 선박을 크기에 따라 분류하였다. 군집화된 데이터에 대하여 최적분포 분석을 한 결과, 인천대교와 부산항대교에서는 대수정규분포, 목포대교와 마창대교에서는 정규분포가 최적분포에 가까운 것으로 분석되었다. 대수정규분포와 정규분포를 기준으로 선박 안전 통항 범위를 신뢰구간의 95%로 가정하여 분석한 결과, 인천대교의 경우 정규분포와 대수정규분포 간의 차이가 64~97m로 가장 큰 것으로 나타났으며, 최소 차이는 10m로 마창대교에서 나타났다. 이에 따라, 인천대교의 경우에는 정규분포보다 대수정규분포로 안전 통항 폭을 제시하는 것이 적합한 것으로 분석되었다. 타 교량의 경우에는 정규분포와 대수정규분포 간의 통항 폭 차이가 크지 않기 때문에 둘 중 어떤 분포를 사용해도 유사한 결과를 얻을 수 있는 것으로 분석되었다. 위 결과를 토대로, 해상교량의 안전통항 범위를 제시한다면 선박의 안전한 운항 및 사고 예방에 도움이 될 것이다.

토지이용시설과 자전거도로 유형의 관계 분석 연구 (The Cycleway Types by Land Uses Analysis)

  • 변완희;임하얀;윤은주
    • 대한교통학회지
    • /
    • 제28권3호
    • /
    • pp.19-28
    • /
    • 2010
  • 국내의 자전거도로는 대체로 주변 토지이용시설 특성을 고려하지 않은 채 계획되고 있다. 이와 같이 획일화된 도로계획은 효율적이지도 못할뿐더러 안전과 이용편리에 있어서 최적의 환경을 제공할 수가 없다. 따라서 본 연구는 보다 안전하고 편리한 자전거도로 이용환경 구축을 목적으로, 자전거도로 유형에 대해 물리적 시설측면의 분류를 시도하였고, 토지이용시설 이용자의 통행특성을 조사 분석하였다. 카이제곱 독립성검정을 통해서 토지이용시설 간에 통행특성의 차이가 있음을 확인했고, 군집분석과 자전거도로 유형 결정기준을 통해 해당 토지이용시설에 적합한 자전거도로 유형을 제시하였다.

점증적 모델에서 최적의 네트워크 구조를 구하기 위한 학습 알고리즘 (An Learning Algorithm to find the Optimized Network Structure in an Incremental Model)

  • 이종찬;조상엽
    • 인터넷정보학회논문지
    • /
    • 제4권5호
    • /
    • pp.69-76
    • /
    • 2003
  • 본 논문에서는 패턴 분류를 위한 새로운 학습 알고리즘을 소개한다. 이 알고리즘은 학습 데이터 집합에 포함된 오류 때문에 네트워크 구조가 너무 복잡하게 되는 점증적 학습 알고리즘의 문제를 해결하기 위해 고안되었다. 이 문제를 위한 접근 방법으로 미리 정의된 판단기준을 가지고 학습 과정을 중단하는 전지 방법을 사용한다. 이 과정에서 적절한 처리과정에 의해 3층 전향구조를 가지는 반복적 모델이 점증적 모델로부터 유도된다 여기서 이 네트워크 구조가 위층과 아래층 사이에 완전연결이 아니라는 점을 주목한다. 전지 방법의 효율성을 확인하기 위해 이 네트워크는 EBP로 다시 학습한다. 이 결과로부터 제안된 알고리즘이 시스템 성능과 네트워크 구조를 이루는 노드의 수 면에서 효과적임을 발견할 수 있다.

  • PDF

개선된 FCM 기법을 이용한 애견 영상에서의 백내장 추출 및 분석 (Cataract Extraction and Analysis of Pet Image by Using Enhanced FCM)

  • 이재민;김민석;유승원;이해일;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.524-526
    • /
    • 2016
  • 본 논문에서는 클러스터의 개수를 다양하게 설정하여 누적된 변화율이 가장 작은 변화율을 가진 클러스터 개수를 동적으로 설정하는 방법을 제안하여 백내장 영역을 추출하는 방법을 제안한다. 제안된 백내장 추출 방법은 애견 안구 영상에서 관심 영역을 ROI 영역으로 설정한다. 설정된 ROI 영역에 퍼지 스트레칭 기법을 적용하여 픽셀의 상한 값과 하한 값을 조정한다. 퍼지 스트레칭 기법이 적용된 ROI 영역에서 FCM 알고리즘을 적용하여 클러스터 소속 행렬의 중심 값의 변화율이 가장 적은 개수를 최적의 클러스터 개수로 설정하여 ROI 영역을 양자화 한다. 양자화된 ROI 영역에서 침식 및 팽창 기법을 적용하고 ROI 영역의 면적을 기준으로 1/5보다 적은 면적을 가진 객체를 잡음으로 간주하여 제거한다. 잡음이 제거된 ROI 영역에서 ROI 면적의 3/5이상인 영역을 가진 안구 객체를 백내장 영역으로 추출한다. 제안된 방법의 효율성을 분석하기 위해서 애견 안구 영상을 대상으로 실험한 결과, 기존의 FCM을 적용하여 ROI 영역을 양자화 하는 처리 시간보다 제안된 클러스터 수 설정 기반 FCM을 적용한 양자화 방법이 처리 시간이 적게 소요되고 객체들을 정확히 분류하는 것을 실험을 통하여 확인하였다.

  • PDF

환경음 인식을 위한 GMM의 혼합모델 개수 추정 (Estimation of Optimal Mixture Number of GMM for Environmental Sounds Recognition)

  • 한다정;박아론;백성준
    • 한국산학기술학회논문지
    • /
    • 제13권2호
    • /
    • pp.817-821
    • /
    • 2012
  • 본 논문에서는 환경음 인식에 GMM(Gaussain mixture model)을 이용할 때 MDL(minimum description length)와 BIC(Bayesian information criterion) 모델선택 기준을 이용하여 최적의 혼합모델 개수를 결정하는 방법에 대해 다루었다. 실험은 모두 9가지 종류의 환경음으로부터 12차 MFCC(mel-frequency cepstral coefficients) 특징 27747개를 추출하고 이를 GMM으로 분류하였다. 각 환경음 클래스의 최적 혼합모델 개수를 추정 하기위해 MDL과 BIC를 적용하고 그 결과를 고정 개수의 혼합모델을 사용한 경우와 비교하였다. 실험 결과에 따르면 혼합모델 선택 방법을 적용한 경우가 그렇지 않은 경우에 비해 거의 유사한 인식성능을 유지하면서 계산복잡도는 BIC와 MDL를 통해 각각 17.8%와 31.7%가 감소하는 것을 확인하였다. 이는 GMM을 이용한 환경음 인식에서 BIC와 MDL 적용을 통해 계산복잡도를 효과적으로 감소시킬 수 있음을 보여준다.

Bacillus megaterium SFO41에 의한 Cholesterol Oxidase의 생산 및 최적 배양 조건 (Study on the Production and the Culture Condition of Cholesterol Oxidase from Bacillus megterium SFO41)

  • 김관필;이창호;우철주;박희동
    • 한국식품영양과학회지
    • /
    • 제30권3호
    • /
    • pp.403-409
    • /
    • 2001
  • 우리나라 전통 발효식품(침채류 및 젓갈류)으로부터 cholesterol oxidase 생산성이 있는 균주를 분리하고 이들 분리된 균주들로부터 여러 단계의 균주 선멸시험을 통하여 cholesterol oxidase 생산성이 우수한 미생물을 선별하여 그 특성을 조사하였다. Cholesterol oxidase의 생산성이 가장 우수한 SF041의 형태학적, 배양학적 및 생리학적 특성을 조사하여 Bergey's Mannual of Systematic Bacteriology의 분류기준에 따라 동정한 결과 Bacillus megaterium 또는 그 유연균으로 동정되어 분리균을 Bacillus megaterium SFO41로 명명하였다. Cholesterol oxidase의 생산 조건을 검토한 결과 최적 배지 조성은 2.0% glucose, 0.5% yeast extact, 0.03% $MgSO_4\;7H_2O,\;0.02%\;K_2HPO_4,\;0.2%\;NH_4NO_3$, 0.2% cholesterol로 판명되었으며, 배영 조건은 $30^{\circ}C$, 초기 pH 7.0, 진탕 속도는 150 rpm에서 24시간 배양 시 효소 생성이 가장 우수하였다(2.37 U).

  • PDF

전력소비행위 변화를 위한 전력소비패턴 분석 및 적용 (Analysis and Application of Power Consumption Patterns for Changing the Power Consumption Behaviors)

  • 장민석;남광우;이연식
    • 한국정보통신학회논문지
    • /
    • 제25권4호
    • /
    • pp.603-610
    • /
    • 2021
  • 본 논문에서는 사용자의 전력소비패턴을 추출하고 사용자의 환경 및 감성을 적용한 최적 소비패턴을 모델링한 후, 이 두 가지의 패턴을 비교 적용하여 사용자의 전력소비행위 변화를 통한 전력의 효율적 사용 방법을 제시한다. 유의미한 소비패턴을 추출하기 위하여 벡터 표준화 및 이진 데이터 변환방법을 사용하고, k-평균 군집화를 적용한 앙상블의 합집합에 대한 학습과 k값에 따른 지지도를 적용하였으며, 최적 전력소비패턴 모델은 상대적 평균 소비량이 적은 앙상블 합집합에 대한 학습 결과를 기준으로 강제 및 감성 제어를 적용하여 생성하였다. 실험을 통하여 전력소비행위 변화 유도대상 추출 시 클러스터의 수와 일치율 간의 상관관계를 파악함으로써, 사용자의 의도에 따라 강제 및 감성 기반의 제어가 가능하도록 클러스터의 수나 크기 조절을 통한 다양한 윈도우에 적용할 수 있음을 검증하였다.

모바일 캐릭터의 광고기법에 따른 타켓별 유형분류와 소비자 반응 연구 (A Study of consumer's behavior and classifications by advertising techniques of mobile character)

  • 강대인;주효정
    • 디자인학연구
    • /
    • 제17권2호
    • /
    • pp.393-402
    • /
    • 2004
  • 모바일광고는 이동성을 가진 PDA, 웹폰 등 모든 이동성 기기를 통 털어 정보화시대를 살아가는 모든 사람과 생활에 커다란 변화를 일으키며 앞으로 그 변화를 예측하기 어려울 정도로 기술과 적용범위를 넓혀가고 있다. 편재성, 도달성 ,편리성등의 속성을 지닌 모바일광고에 현재는 위치성, 정보성, 개인화가 더해져 단순한 음성통화의 기능만을 한 초기의 모바일광고의 기능에서 데이터 통신의 기능이 첨가되면서 모바일 인터넷 환경을 더욱 발전시키고 있으며 이동통신 단말기를 통해 음악, 그래픽, 음성, 문자 등을 기반으로 하는 SMS 형식, 그래픽형식, 왑 푸시방식의 SMS 형식, 리치미디어 형식으로 전해지고 있으며 이러한 형식 속에 모바일 캐릭터는 2D형식의 픽셀아트 기법과 동영상등의 그래픽 기법으로 뗄레야 뗄 수 없는 상관관계로 존재하고 있다. 이에 본 논문에서는 뉴미디어 시대의 기업 마케팅에 있어서 핵심이라 할 수 있는 모바일 광고속의 모바일 캐릭터의 역할과 중요성을 인식하고, 모바일 시장의 활성화를 위해 마케팅 도구로서의 모바일 캐릭터의 모형들을 현재까지 개발되어 상용화되어지고 있는 이동통신사들의 타켓별 고객서비스를 기준으로 분류하고 그에 따른 소비자의 반응을 설문조사를 통해 연구하여 그에 따른 최적의 모바일 캐릭터의 기법을 제안하려 한다.

  • PDF

국내 디지털 TV방송 환경 측정결과 분석을 통한 효과적인 수신전계강도 산출 (Calculation of Effective Receiving Electric Field Level using the Measurement Analysis from Actual Domestic DTV Environment)

  • 최성웅;이경량;양충모;김성권
    • 한국통신학회논문지
    • /
    • 제35권7A호
    • /
    • pp.725-730
    • /
    • 2010
  • 디지털TV 방송 전환에 대비하여 국내에서도 디지털TV방송 수신전계 레벨 기준을 정하여 방송망 설계 및 간섭보호 지역 등을 정하고 있으나, 디지털TV방송 수신기의 성능 향상과 전파 수신환경 등이 변화함에 따라 국내환경요건에 맞는 디지털TV 방송 최적 수신전계 레벨에 대한 실질적인 기준 연구가 필요한 실정이다. 본 연구에서는 국내 디지털TV방송에서의 수신전계 레벨 측정 결과로부터, 국내 지형정보를 LOS(Line Of Sight) 지형과 Non-LOS 지형으로 분류하여, LOS 지형에서 수신전계 실측치를 이용한 효과적인 수신전계 레벨을 제시하였다. 그 결과 수신율 90%를 보장하기 위해서는 수신전계 레벨 48 dBuV/m 이상, 수신율 95%를 보장하기 위해서는 수신전계 레벨을 50 dBuV/m 이상이 요구됨을 제시하였다.