• 제목/요약/키워드: Network Analysis

검색결과 14,335건 처리시간 0.045초

폭 함수를 기반으로 한 Clark 모형의 매개변수 추정 (Parameters Estimation of Clark Model based on Width Function)

  • 박상현;김주철;정관수
    • 한국수자원학회논문집
    • /
    • 제46권6호
    • /
    • pp.597-611
    • /
    • 2013
  • 본 연구에서는 Clark 모형의 시간-면적곡선의 구성 방법과 적용성을 검토하고 모멘트 원리에 의한 도달시간, 저류상수를 합리적으로 산정하기 위한 방법론을 고찰해 보았다. 격자 기반으로 폭 함수를 구성하고 운동과정을 순수 이류현상으로 가정하여 시간-면적곡선으로 사용하였다. 또한 도달시간과 저류상수는 모멘트 법의 원리에 따라 Clark 모형 구조에 적용하여 해석적으로 산정할 수 있는 방법을 제시하였다. 적용성 검토를 위해 (1) HEC-1에서 기본적으로 제공하는 좌우 대칭형상인 무차원 시간-면적곡선을 적용하고 매개변수 산정은 관측유출수문곡선과 계산된 유출수문곡선의 오차를 최소화하는 HEC-1의 최적화 기법 사용, (2) HEC-1에 폭 함수 기반의 시간-면적곡선을 적용하고 매개변수 산정은 HEC-1의 최적화 기법 사용, (3) 폭 함수 기반의 시간-면적곡선을 이용하여 모멘트 원리에 따라 매개변수를 직접 산정하는 방법을 적용하였다. 방법별로 산정된 Clark 모형의 매개변수들을 HEC-1을 이용하여 직접유출량을 산정하고 관측 직접유출량과 비교하여 얻은 결과는 다음과 같다. (1) 정량적으로 비교하기 위해 산정한 첨두유량과 첨두발생 시간의 상대오차 및 효율계수 E(Efficiency Coefficient)를 비교한 결과, 시간-면적곡선을 폭 함수로 대체하여 HEC-1으로부터 추정된 매개변수가 관측값을 잘 반영하였다. (2) Clark 모형의 올바른 적용을 위해서는 HEC-1에서 기본적으로 제공하는 좌우 대칭형상인 무차원 시간-면적곡선보다는 적용 대상유역의 배수구조가 적절하게 반영된 시간-면적곡선의 사용이 합리적일 것으로 판단된다. (3) 본 연구 방법은 첨두유량과 첨두시간의 상대오차 범위와 재현정도를 나타내는 효율계수를 비교하여 볼 때 대체로 양호하게 모의되었고, 대상유역별 유량측정성과인 하천평균유속과 비교했을 때 본 연구 방법이 다소 실제 유속에 접근하고 있음을 확인하였다. (4) 본 연구에서 모멘트 원리를 기반으로 제안한 매개변수 추정을 위한 방법은 유역의 이류현상과 저류현상을 정량적으로 계량할 수 있는 효율적인 관계식으로 사용할 수 있음을 확인하였다. (5) 본 방법에 의해 계산된 수문곡선이 대부분 관측수문곡선의 우측으로 왜곡되고 첨두유량은 과소평가 되는 것을 보이고 있다. 이것은 평균과 분산만을 고려하여 유역을 하나의 평균이송속도로 모의한 본 연구의 한계점으로 판단된다. 만약 모멘트의 왜곡도를 고려하고 유역을 지표면과 하천으로 나누어 평균이송속도를 모의한다면 물리적인 특성을 충분히 반영하여 매개변수를 추정 할 수 있을 것으로 판단된다.

쿠폰 다운로드를 기준으로 하는 온라인 광고비 모델의 설계 및 분석 (Design and Analysis of Online Advertising Expenditure Model based on Coupon Download)

  • 전정호;이경전
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.1-19
    • /
    • 2010
  • 기존의 인터넷 광고비 모델에는 CPM (Cost Per Mile), CPC (Cost Per Click), CPS (Cost Per Sales) 등이 존재하며, 특히 CPC 모델은 광고주와 미디어에게 모두 합리적이라는 평가를 받으며, 인터넷 광고 시장에서 높은 비중을 차지하고 있다. 그러나 CPC 모델 또한, 경쟁 사업자에 의한 과도한 광고비 부과나 부정한 광고 수익 등을 목적으로 하는 부정 행위가 발생할 수 있고, 사용자의 전환 의도 없는 광고물 클릭으로 인해 광고주에게 부당한 광고비가 부과될 수 있는 것이 사실이다. 이에 본 연구에서는 새로운 광고비 모델인 'CPCD' (Cost Per Coupon Download) 모델을 제안한다. CPCD 모델은 사용자가 단순히 광고물을 클릭하는 행동을 넘어 광고주가 제공하는 쿠폰을 다운로드 받았을 때 광고비가 부과되는 모델로서, CPC 모델과 CPS 모델의 중간 개념이라고 할 수 있다. 본 연구에서는 CPCD 모델의 설계 및 분석을 위하여 발생 가능한 시나리오를 제시하고, 프로세스 분석 및 관련 이슈에 대한 검토를 수행한다. 그리고 CPCD 모델에 참여하는 각 사업 참여자들에 대한 분석을 수행하고, 비용 시뮬레이션을 통해 CPC 모델과 CPCD 모델을 비교함으로써, CPCD 모델에 참여하는 광고주의 사업 참여 조건을 밝히며, 마지막으로 유비쿼터스 환경에서 CPCD 모델의 적용 가능성에 대하여 고찰한다.

유비쿼터스 환경 조형물의 이용의식 실태 분석 (Utilization of a Ubiquitous Environmental Sculptures Analysis)

  • 김동찬;조휘인
    • 한국조경학회지
    • /
    • 제38권3호
    • /
    • pp.15-22
    • /
    • 2010
  • 본 연구는 강남 U-Street 미디어 폴의 유비티즌 의식 실태분석에 관한 연구를 통하여 앞으로 유비쿼터스 시대에 이용자들이 사용하게 될 미디어 폴에 대한 의식 실태분석 연구를 실시하였다. 본 연구의 의식실태 분석은 인구통계학적 특성분석, 이용 의식 실태분석의 인식도, 관심도, 이용도, 도시 공간 내 유비쿼터스 기술 필요성, 미디어 폴의 주 이용 유비쿼터스 기능과 유비쿼터스 중요 기능, 구성요소 중요도 분석 등으로 나누어 실시하였다. 유비쿼터스 도시 공간에서 미디어 폴 유비티즌들의 의식 실태분석을 하고자 하며, 연구결과를 요약하면 다음과 같다. 1. 피험자의 인구통계학적 특성 빈도분석을 실시한 결과, 성별에서 여자가 높은 빈도수를 나타났고, 이는 설문에 참여한 피험자가 여자가 더 많이 참여함으로 나온 결과이기도 하며, 연령에서 20대가 가장 높은 빈도수로 나타났고, 직업에서 직장인이 빈도수가 높게 나타났다. 2. 미디어 폴의 이용 의식 실태분석 결과, 미디어 폴에 대한 인식도에서 전반적으로 인식하고 있음을 알 수 있었고, 미디어 폴에 대한 관심도에서 대부분 관심 있는 것으로 나타났다. 미디어 폴의 이용도에서 대부분 '1회 사용' 이상의 경험이 있다는 것을 알 수가 있다. 이는 현장에서 설문조사를 한 결과로 사료되며, 도시 공간 내 유비쿼터스 기술의 필요성은 '필요하다'로 분석된다. 미디어 폴의 주이용 유비쿼터스 기능에서 미디어 폴을 사용해 본 사람들을 대상으로 설문조사한 결과 '디지털 포토메일' 기능을 가장 많이 이용한 것으로 나타났다. 미디어 폴의 유비쿼터스 기능 서비스 중 가장 중요하다고 생각하는 기능은 '공공/교통정보'이며, 다음으로 '무선 인터넷 프리존', '디지털 포토메일', '지역 상가정보', '엔터테인먼트' 순이었다. 3. 미디어 폴의 구성요소 중요도에서 1위 '각종 기능의 활용성', 2위 '정보의 전달성', 3위 '주변 환경과의 조화성', 4위 '미디어 폴의 기능성', 5위 '환경조형물의 형태성' 등의 순으로 중요하게 생각하였다. 4. 미디어 폴의 구성요소 중요도와 종합 만족도에 영향을 끼친 변수는 각종 기능의 활용성, 환경조형물의 형태성, 설치의 시공성 순으로 나타났으며, 각종 기능의 활용성이 구성요소 중요도와 종합 만족도와의 관계에 가장 큰 영향을 주는 변수로 나타났다. 피험자들의 의식 실태조사에서 강남 U-Street 미디어 폴이 디지털 기술의 발전으로 휴대폰, 노트북, PDA 등과 함께 언제 어디서나 소통할 수 있는 도시공간에 대한 디지털 서비스 요구와 인식, 관심, 유비쿼터스 기술의 필요성이 높음을 알 수 있었다.

거제시 신현읍 완충녹지의 생태적 특성 및 관리방안 (Ecological Characteristics and Management Program for Buffer Greens at Sinhyeon-Eup, Geoje-Si)

  • 사공영보;이수동
    • 한국환경생태학회지
    • /
    • 제21권3호
    • /
    • pp.243-256
    • /
    • 2007
  • 본 연구는 거제시 신현읍의 산림을 연결하는 녹지축의 식재현황을 파악하고 생태적 구조개선방안을 수립하고자 실시하였다. 연구대상지는 소음완화를 목적으로 하는 완충녹지로 육교산(50m)과 중매산(131m)을 잇는 중간지점에 위치하고 있다. 비오톱 유형은 시가화지역, 도로 등 도시화지역 2개, 산림비오톱, 하천비오톱, 조경수목식재지 비오톱 등 녹지 및 오픈스페이스 지역 15개로 총 17개로 분류되었다. 비오톱 유형분석자료를 바탕으로 자연생태계가 양호하여 생물서식이 가능한 육교산과 중매산을 거점녹지로, 기조성된 완충녹지를 연결녹지로 활용하는 것이 생물을 도심내로 유입하는 유일한 방법으로 판단되었다. 거점녹지, 준거점녹지, 연결녹지의 녹피율은 각각 160.29%, 128.37%, 44.37%. 녹지용적계수는 $4.04m^3/m^2,\;3.95m^3/m^2,\;0.65m^3/m^2$로 거점녹지는 층위구조가 형성되어 생물서식처 및 종공급처 역할을 수행하고 있으나 준거점녹지는 하층식생이 훼손되었고, 연결녹지는 관목층의 식재량 부족 및 훼손으로 불량하였다. 결국, 도심내로의 야생조류유입 및 생물서식을 위한 통로 역할과 시민들의 이용공간으로 활용하기 위해서는 거점녹지의 연결을 통한 생물종다양성 증진 및 시민의 이용을 위한 자연관찰로를 조성하고자 도심내 야생조류 유입을 위한 생태적 조성 가로녹지 조성을 통한 녹지 연결, 도시민의 이용 및 휴양을 위한 경관개선에 대한 세부실천계획을 제안하고자 하였다.

SNS 이용동기와 SNS 중독이 주관적 웰빙에 미치는 영향: 사회적 유대감의 조절효과 (The Effect of the Subjective Wellbeing on the Addiction and Usage Motivation of Social Networking Services: Moderating Effect of Social Tie)

  • 노미진;장성희
    • 경영과정보연구
    • /
    • 제35권4호
    • /
    • pp.99-122
    • /
    • 2016
  • 특정한 관심이나 활동을 공유하는 사람들 사이의 관계망을 기반으로 서비스를 제공하는 페이스북이나 트위터와 같은 SNS의 활성화로 정보공유나 의사소통이 활발해지면서 SNS에 대한 관심이 증가하였다. 본 연구는 관심의 대상이 되고 있는 SNS에 대한 연구를 수행할 것이며, 새로운 매체의 이용 동기를 설명하기 위한 이론인 이용과 충족이론을 기반으로 SNS 이용 동기를 살펴본다. SNS 이용 동기를 감정적 동기와 인지적 동기로 구분하고, 이용 동기와 SNS 중독 간의 관계를 알아보았다. 감정적 동기는 SNS에 대한 오락성과 환상으로 구분하고 인지적 동기는 SNS에서의 정보 부담과 시스템 사용 부담으로 살펴한다. SNS 중독은 시간적 내성, 금단 불안, 중단 실패, 생활 장애로 구분하였으며 SNS 중독과 주관적 웰빙과의 관계를 살펴본다. 마지막으로 사회적 자본 이론을 기반으로 SNS 특성인 사회적 유대감의 조절효과를 분석한다. SNS 사용자들을 대상으로 설문을 수행하였고, 가설을 검증하기 위하여 286부의 설문지를 분석에 활용하였다. 가설검증결과를 보면, 감정적 동기인 오락성과 환상은 SNS 중독에 정(+)의 영향을 미쳤고, 인지적 동기인 정보 부담과 시스템 사용 부담도 SNS 중독에 정(+)의 영향을 미쳤다. 또한 SNS 중독은 주관적 웰빙에 통계적으로 유의한 영향을 미쳤으며, 마지막으로 사회적 유대감에 따라 SNS 중독이 주관적 웰빙에 다른 영향을 미치고 있음을 알 수 있었다. 본 연구의 결과는 SNS 사용자와 SNS 관련 종사자들에게 유용한 정보를 제공할 수 있을 것이다.

  • PDF

기업의 교육지향성이 기술혁신과 기업성과에 미치는 영향 : 대 중국 투자 한국기업을 중심으로 (The Impact of Education-Orientation on Technology Innovation and Company Outcome : Focusing on Korean Companies in China)

  • 김정훈;임용택
    • 한국전자거래학회지
    • /
    • 제19권4호
    • /
    • pp.231-249
    • /
    • 2014
  • 국우리는 흔히 21세기가 세계화와 지방화가 동시에 진행되는 글로컬라이제이션(Glocalization)의 시대라고 말하고 있다. 더구나 스마트폰(Smart Phone)의 빠른 보급과 SNS(Social Network Service)의 광범위한 사용으로 인하여 이 시대에는 글로벌 정보 및 지역 정보의 다양한 활용능력이 기업 경쟁력에 미치는 영향력이 지속해서 증대되었으며, 상거래의 형태도 과거의 고전적 방법의 제조나 유통에서 벗어나 전자 상거래를 통한 직접 혹은 간접적인 거래가 급속하게 파급되어져 가고 있는 실정이다. 이러한 새로운 트렌드(Trend)에 적응하는 교육지향성이 정보의 활용 능력을 극대화하여 기술혁신을 주도하는 중요한 요소로 부상하게 되었고, 궁극적으로는 기업의 성과에 영향을 미친다고 하겠다. 본 논문에서는 대 중국 한국투자기업의 교육지향성이 기업의 기술혁신 및 기업성과에 중장기적으로 미치는 영향력을 파악하여, 궁극적으로는 중국에 특화된 기술을 개발하는 기업경영 전략의 기초 자료를 도출하고자 한다. 따라서 본 연구는 연구대상으로서 중국투자기업만을 다루며, 연구문제로서 기술혁신성에 미치는 영향요인 검증과 기술혁신이 기업성과에 미치는 영향을 다루었다. 제 I 장은 서론이며 제 II장에서는 이 논문의 연구대상인 중국투자기업의 특성과 현황을 살펴본 후에, 이 논문의 실증 연구모형의 주요 변인인 학습지향성, 기술혁신, 기업성과의 개념과 의의를 살펴보고 각각에 대한 선행연구들을 정리하였다. 제 III장에서는 이 논문에서 채택한 연구모형과 설문조사에서의 조사 대상 및 방법, 조사 가설, 각 변인의 조작적 정의, 설문지 구성, 분석 방법 등을 설명하였다. 제 IV장에서는 설문조사 결과를 토대로 앞장에서의 연구가설을 검증하였고, 제 V장에서 나타난 이 논문의 연구결과는 기술혁신성에 대한 인식도가 상대적으로 높게 나타났으며 학습지향성과 기술혁신성은 모두 성과와 유의한 상관관계를 갖는 것으로 나타났고, 학습지향성은 기술혁신성에 유의한 정(+)의 영향을 미치는 것으로 나타났으며, 학습지향성과 기술혁신성은 각각 성과에 유의한 정(+)의 영향을 미치는 것으로 연구되었다.

디스포지티프 영화의 다양한 가능성 (Various Possibilities of Dispositif Film)

  • 김채희
    • 트랜스-
    • /
    • 제3권
    • /
    • pp.55-86
    • /
    • 2017
  • 본 논문은 포스트 시네마 시대가 도래함에 따라 영화 매체에 대한 재사유와 동시대 영화들의 특정한 경향들을 포섭할 수 있는 개념이 필요하다는 자각에서 출발했다. 최근, 새롭게 등장한 도전적이면서 변화무쌍한 실험적인 영화들은 고전적인 미장센과 몽타주 분석만으로 접근하기 힘든 미학을 선보인다. 고전적 개념 틀로 분석하기가 곤혹스러운 영화들을 본고에서는 에이드리언 마틴이 제시한 디스포지티프 논의를 수용해서 고찰했다. 디스포지티프적 움직임은 디지털 테크놀로지가 기반이 되는 현대의 미디어 환경 속에서 급격히 늘어나긴 했지만 이 흐름이 어떤 특정한 시대에만 국한된 현상은 아니다. 일부 고전영화에서도 그 움직임이 감지됐으며 1920년대 아방가르드 영화들, 1960년대 모더니즘 영화들 일부에서 디스포지티프 경향은 계속 존재했었다. 영화적 디스포지티프의 명확한 개념화를 위해 본 논문은 오늘날 영화이론에 유입되고 있는 디스포지티프 논의의 근원을 살펴보았다. 하지만 인문학적 차원에서 논의되는 디스포지티프 이론은 분명 영화에서 거론되는 것과는 차이가 있다. 따라서 본고는 마틴의 노고로 가시화된 디스포지티프의 시네마틱한 요소를 부각시키면서 논의를 진행했다. 푸코가 정초한 디스포지티프의 기본적 의미는 이질적인 요소들로 구성된 장치의 배치와 배열이다. 때로는 이질적인 요소들의 앙상블 그 자체를 가리키기도 한다. 디스포지티프 논의를 촉발시켰던 푸코의 개념을 빌어 디스포지티프 영화를 정의한다면, 고전적 영화의 조건들을 구성하는 이질적 요소들의 재(탈)배치와 배열로 이루어진 새로운 '고안물(constraption)'이라고 할 수 있을 것이다. 어떤 것이 새로운 고안물이 되기 위해서는 그것을 이루는 요소들, 즉 힘들의 배열과 배치에 변화가 일어나야 한다. 당연히 그 요소들은 내적인 요소와 외적인 요소들을 아우른다. 내적인 요소는 주로 영화의 컨벤션에 대한 것이며 외적인 요소는 영화를 둘러싼 정치, 문화, 사회적인 조건과 영화를 가능하게 하는 광학적, 물리적 토대 모두를 포함한다. 영화는 어떤 매체보다도 빠른 속도로 다른 매체와 손쉽게 '네트워킹'하며 새롭게 '고안된' 미학 양식을 만들 수 있다. 상호매체성으로 정의되는 디지털 시대의 두드러진 특징을 디스포지티프 개념으로 바라본다면 영화뿐만 아니라 예술 전반에 걸쳐 발생하는 새로운 흐름들을 이해하는 데 도움이 될 것이다.

  • PDF

지구물질의 마이크로미터 단위의 삼차원 공극 구조 규명: 핵자기공명 현미영상 연구 (3-Dimensional ${\mu}m$-Scale Pore Structures of Porous Earth Materials: NMR Micro-imaging Study)

  • 이범한;이성근
    • 한국광물학회지
    • /
    • 제22권4호
    • /
    • pp.313-324
    • /
    • 2009
  • 지표-지각환경을 구성하는 지질매체의 구조와 성질의 정량적-체계적 이해를 위한 예비연구로, 매질을 구성하는 입자의 모양, 크기, 충전 밀도가 공극 구조의 특성과 매질의 성질에 미치는 영향을 알아보기 위해 입자의 모양이 구형인 글래스 비드와 모양이 불규칙한 실리카 젤을 이용하여 입자 크기와 공극률이 서로 다른 다양한 다공성 매질을 준비하였고, 핵자기공명 현미영상을 이용하여 약 $50\;{\mu}m$의 분해능으로 삼차원 영상을 획득하였다. 분석 결과, 지름 약 0.2~1.3 mm 크기의 입자로 구성된 다공성 매질의 비표면적은 2.5부터 $9.6\;mm^2/mm^3$, 공극률은 0.21에서 0.38, 투수율은 11.6에서 892.3 D이며, 이는 일반적인 미고결 샌드가 갖는 값의 범위에 해당된다. 비표면적, 공극률, 투수율의 관계는 Kozeny 식에서 예상된 경향과 비교적 일치하였다. 상자집계 프랙탈 차원은 공극률, 비표면적과의 관련성이 높으며, 공극률이 0.29~0.38일 때 비표면적이 약 2.5부터 $6.0\;mm^2/mm^3$까지 증가할수록 프랙탈 차원이 2.6에서 3.0까지 선형으로 증가하며, 공극률이 0.21~0.28일 때 비표면적이 약 2.5부터 $9.6\;mm^2/mm^3$까지 증가할수록 프랙탈 차원이 2.5에서 3.0까지 선형으로 증가한다. 실제 다공성 사암에 포함된 유체의 삼차원 구조를 핵자기공명 현미영상으로 영상화하였고, 이에 대한 비표면적은 $0.33\;mm^2/mm^3$, 공극률은 0.017, 투수율은 30.9 mD, 상자 집계 프랙탈 차원은 1.59로 계산되었다. 본 연구에서 제시된 것과 같이 핵자기공명 현미영상은 다양한 다공성 매질의 삼차원 공극 구조를 영상화할 수 있고, 삼차원 공극 구조에 대한 상자집계 프랙탈 차원은 본 연구에서와 같이 다양한 공극 구조에 대해 분석이 가능하며, 다공성 매질의 이동 특성을 나타내는 매개 변수들과 지진파 감쇠 등에 대한 조절 인자로 사용될 수 있을 것으로 기대된다.

추천 시스템의 성능 안정성을 위한 예측적 군집화 기반 협업 필터링 기법 (Predictive Clustering-based Collaborative Filtering Technique for Performance-Stability of Recommendation System)

  • 이오준;유은순
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.119-142
    • /
    • 2015
  • 사용자의 취향과 선호도를 고려하여 정보를 제공하는 추천 시스템의 중요성이 높아졌다. 이를 위해 다양한 기법들이 제안되었는데, 비교적 도메인의 제약이 적은 협업 필터링이 널리 사용되고 있다. 협업 필터링의 한 종류인 모델 기반 협업 필터링은 기계학습이나 데이터 마이닝 모델을 협업 필터링에 접목한 방법이다. 이는 희박성 문제와 확장성 문제 등의 협업 필터링의 근본적인 한계를 개선하지만, 모델 생성 비용이 높고 성능/확장성 트레이드오프가 발생한다는 한계점을 갖는다. 성능/확장성 트레이드오프는 희박성 문제의 일종인 적용범위 감소 문제를 발생시킨다. 또한, 높은 모델 생성 비용은 도메인 환경 변화의 누적으로 인한 성능 불안정의 원인이 된다. 본 연구에서는 이 문제를 해결하기 위해, 군집화 기반 협업 필터링에 마르코프 전이확률모델과 퍼지 군집화의 개념을 접목하여, 적용범위 감소 문제와 성능 불안정성 문제를 해결한 예측적 군집화 기반 협업 필터링 기법을 제안한다. 이 기법은 첫째, 사용자 기호(Preference)의 변화를 추적하여 정적인 모델과 동적인 사용자간의 괴리 해소를 통해 성능 불안정 문제를 개선한다. 둘째, 전이확률과 군집 소속 확률에 기반한 적용범위 확장으로 적용범위 감소 문제를 개선한다. 제안하는 기법의 검증은 각각 성능 불안정성 문제와 확장성/성능 트레이드오프 문제에 대한 강건성(robustness)시험을 통해 이뤄졌다. 제안하는 기법은 기존 기법들에 비해 성능의 향상 폭은 미미하다. 또한 데이터의 변동 정도를 나타내는 지표인 표준 편차의 측면에서도 의미 있는 개선을 보이지 못하였다. 하지만, 성능의 변동 폭을 나타내는 범위의 측면에서는 기존 기법들에 비해 개선을 보였다. 첫 번째 실험에서는 모델 생성 전후의 성능 변동폭에서 51.31%의 개선을, 두 번째 실험에서는 군집 수 변화에 따른 성능 변동폭에서 36.05%의 개선을 보였다. 이는 제안하는 기법이 성능의 향상을 보여주지는 못하지만, 성능 안정성의 측면에서는 기존의 기법들을 개선하고 있음을 의미한다.

문장 분류를 위한 정보 이득 및 유사도에 따른 단어 제거와 선택적 단어 임베딩 방안 (Selective Word Embedding for Sentence Classification by Considering Information Gain and Word Similarity)

  • 이민석;양석우;이홍주
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.105-122
    • /
    • 2019
  • 텍스트 데이터가 특정 범주에 속하는지 판별하는 문장 분류에서, 문장의 특징을 어떻게 표현하고 어떤 특징을 선택할 것인가는 분류기의 성능에 많은 영향을 미친다. 특징 선택의 목적은 차원을 축소하여도 데이터를 잘 설명할 수 있는 방안을 찾아내는 것이다. 다양한 방법이 제시되어 왔으며 Fisher Score나 정보 이득(Information Gain) 알고리즘 등을 통해 특징을 선택 하거나 문맥의 의미와 통사론적 정보를 가지는 Word2Vec 모델로 학습된 단어들을 벡터로 표현하여 차원을 축소하는 방안이 활발하게 연구되었다. 사전에 정의된 단어의 긍정 및 부정 점수에 따라 단어의 임베딩을 수정하는 방법 또한 시도하였다. 본 연구는 문장 분류 문제에 대해 선택적 단어 제거를 수행하고 임베딩을 적용하여 문장 분류 정확도를 향상시키는 방안을 제안한다. 텍스트 데이터에서 정보 이득 값이 낮은 단어들을 제거하고 단어 임베딩을 적용하는 방식과, 정보이득 값이 낮은 단어와 코사인 유사도가 높은 주변 단어를 추가로 선택하여 텍스트 데이터에서 제거하고 단어 임베딩을 재구성하는 방식이다. 본 연구에서 제안하는 방안을 수행함에 있어 데이터는 Amazon.com의 'Kindle' 제품에 대한 고객리뷰, IMDB의 영화리뷰, Yelp의 사용자 리뷰를 사용하였다. Amazon.com의 리뷰 데이터는 유용한 득표수가 5개 이상을 만족하고, 전체 득표 중 유용한 득표의 비율이 70% 이상인 리뷰에 대해 유용한 리뷰라고 판단하였다. Yelp의 경우는 유용한 득표수가 5개 이상인 리뷰 약 75만개 중 10만개를 무작위 추출하였다. 학습에 사용한 딥러닝 모델은 CNN, Attention-Based Bidirectional LSTM을 사용하였고, 단어 임베딩은 Word2Vec과 GloVe를 사용하였다. 단어 제거를 수행하지 않고 Word2Vec 및 GloVe 임베딩을 적용한 경우와 본 연구에서 제안하는 선택적으로 단어 제거를 수행하고 Word2Vec 임베딩을 적용한 경우를 비교하여 통계적 유의성을 검정하였다.