• 제목/요약/키워드: exponential means

검색결과 126건 처리시간 0.026초

웹툰 콘텐츠 추천을 위한 소비자 감성 패턴 맵 개발 (Development of Customer Sentiment Pattern Map for Webtoon Content Recommendation)

  • 이준식;박도형
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.67-88
    • /
    • 2019
  • 웹툰은 인터넷의 특징적 요소들을 활용하여 제작되는 만화 콘텐츠를 온라인 환경에서 소비 가능한 형태로 유통하는 한국형 디지털 만화 플랫폼이다. 최근 웹툰 산업의 급격한 성장과 함께 웹툰 콘텐츠의 공급량이 기하급수적으로 증가함에 따라, 효과적인 웹툰 콘텐츠 추천 방안의 필요성이 커지고 있다. 웹툰은 회화적 요소와 문학적 요소, 디지털 요소의 복합적 산물로서, 독자로 하여금 재미를 느끼게 하고 웹툰이 연출하는 상황에 이입·공감하게 하는 등 소비자의 감성을 자극하는 디지털 콘텐츠 상품이다. 따라서 웹툰이 소비자에게 전달하는 감성이 소비자가 웹툰을 선택함에 있어 중요한 기준으로 작용할 것이라 기대할 수 있다. 본 연구는 기존에 충분히 논의되지 않았던 소비자 감성을 중심으로, 웹툰 콘텐츠의 효과적인 추천을 지원할 수 있는 소비자 감성 패턴맵의 개발을 목적으로 한다. 본 연구의 수행을 위해 '네이버 웹툰' 플랫폼에서 서비스되는 200개 작품에 대한 메타데이터와 소비자 감성어휘 정보를 수집하였다. 분석 목적에 부합하지 않는 작품을 제외한 127개 작품에 대해 488개의 감성어휘가 수집되었다. 이후 수집된 감성어휘들 간 유사감성 통합, 중복감성 배제 과정을 Bottom-up 접근으로 수행하여 총 63개 감성유형으로 축소된 웹툰 특화 감성지표를 구축하였다. 구축한 감성지표에 대한 탐색적 요인분석을 수행하여 웹툰 유형을 분류할 수 있는 3개의 중요 차원을 도출하고, 이를 기준으로 K-Means 클러스터링을 수행하여 전체 웹툰을 4개 유형으로 분류하였다. 각각의 유형에 대해 웹툰-감성 2-Mode 네트워크를 구축하여 웹툰 유형별로 나타나는 감성 패턴의 특징을 살펴보았으며, 프로파일링 분석을 통해 웹툰 유형별 인사이트와 실무적으로 의미 있는 전략적 시사점을 도출할 수 있었다. 본 연구의 결과를 통해 웹툰의 추천 및 분류의 영역에서 소비자 감성의 활용 가능성을 확인하고, 웹툰 생태계 내 구성원들이 소비자를 보다 잘 이해하고 전략을 수립할 수 있도록 돕는 가이드라인을 제시하였다는 점에서 의의가 있다.

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.

이미지 감성분류를 위한 CNN과 K-means RGB Cluster 이-단계 학습 방안 (A Two-Stage Learning Method of CNN and K-means RGB Cluster for Sentiment Classification of Images)

  • 김정태;박은비;한기웅;이정현;이홍주
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.139-156
    • /
    • 2021
  • 이미지 분류에서 딥러닝 모형을 사용하는 가장 큰 이유는 이미지의 전체적인 정보에서 각 지역 특징을 추출하여 서로의 관계를 고려할 수 있기 때문이다. 하지만 이미지의 지역 특징이 없는 감정 이미지 데이터는 CNN 모델이 적합하지 않을 수 있다. 이러한 감정 이미지 분류의 어려움을 해결하기 위하여 매년 많은 연구자들이 감정 이미지에 적합한 CNN기반 아키텍처를 제시하고 있다. 색깔과 사람 감정간의 관계에 대한 연구들도 수행되었으며, 색깔에 따라 다른 감정이 유도된다는 결과들이 도출되었다. 딥러닝을 활용한 연구에서도 색깔정보를 활용하여 이미지 감성분류에 적용하는 연구들이 있어왔으며, 이미지만을 가지고 분류 모형을 학습한 경우보다 이미지의 색깔 정보를 추가로 활용한 경우가 이미지 감성 분류 정확도를 더 높일 수 있었다. 본 연구는 사람이 이미지의 감정을 분류하는 기준 중 많은 부분을 차지하는 색감을 이용하여 이미지 감성 분류 정확도를 향상시키는 방안을 제안한다. 이미지의 RGB 값에 K 평균 군집화 방안을 적용하여 이미지를 대표하는 색을 추출하여, 각 감성 클래스 별 해당 색깔이 나올 확률을 가중치 식으로 변형 후 CNN 모델의 최종 Layer에 적용하는 이-단계 학습방안을 구현하였다. 이미지 데이터는 6가지 감정으로 분류되는 Emotion6와 8가지 감정으로 분류되는 Artphoto를 사용하였다. 학습에 사용한 CNN 모델은 Densenet169, Mnasnet, Resnet101, Resnet152, Vgg19를 사용하였으며, 성능 평가는 5겹 교차검증으로 CNN 모델에 이-단계 학습 방안을 적용하여 전후 성과를 비교하였다. CNN 아키텍처만을 활용한 경우보다 색 속성에서 추출한 정보를 함께 사용하였을 때 더 좋은 분류 정확도를 보였다.

농촌인구(農村人口)의 변화(變化)와 예측(豫測) (Variation and Forecast of Rural Population in Korea: 1960-1985)

  • 권용덕;최규섭
    • Current Research on Agriculture and Life Sciences
    • /
    • 제8권
    • /
    • pp.129-138
    • /
    • 1990
  • 이상에서 본 연구는 1960년 이후부터 1985년까지의 인구규모와 그 변동의 특질을 농촌에서 도시로의 인구이동현상과 관련하여 검토해 보았다. 아울러 분해시계열방법을 이용하여 농촌인구유출과 농정과의 관계도 고찰하였다. 그리고 적정모델을 추정하여 2,000년까지의 농촌 및 농가인구도 예측해 보았다. 결론적으로 말해서 인구구조의 변화측면에서 농촌인구와 농가인구는 1965년부터 감소하기 시작하여 1975년 이후부터 급격히 감소하였다. 농촌인구의 급격한 감소는 농촌 인구의 자연감소로 인한 요인보다는 도시로 유출되는 인구이동의 요인이 더 크게 작용한 것으로 나타났다. 농촌에서 도시로의 인구유출과정에서 유입지의 분포를 보면 도시지역 중에서 서울, 부산, 경기지역으로 인구가 집중한 것으로 나타났다. 특히 70년대에는 서울 부산 등 대도시 지역으로 직접적인 이동이 있었으나 80년대에 들어와서는 대도시 지역으로의 직접적인 유입보다는 주변지역으로의 유입이 점차 증가함으로써 농촌에서 대도시로의 유입형태가 주변도시로의 유입형태로 변화되고 있다. 농촌인구의 유출을 농업생산과 관련시켜 볼 때 농업노동력의 수요가 확대되는 6월 이후에 유출인구는 점차 줄어들고 있으며 3월에 가장 많이 유출하는 것으로 판명되었다. 60년대 이후 농업정책과 농촌인구의 유출과의 관계를 분석하기 위해 순환변동을 도출하였으며 2-3차 개발계획기간을 제외한 기간에 있어서 농촌부문의 상대적 저위성이 농촌인구의 유출을 자극한 요인으로 작용했으며 이러한 사실은 농업정책의 불균형적 시행이 직 간접적으로 영향을 미친 결과라 하겠다. 끝으로 농촌인구의 유출을 포함한 한국농업의 근본적인 문제는 도농간 상대적 소득 격차에 있다고 보고 농촌지역의 개발을 서울이나 수도권, 대도시권의 비대화를 막기 위한 방편 또는 공업화 우선정책의 반작용으로 본 과거의 정책성향을 극복해야 한다는 점이다. 따라서 도농간 소득격차의 문제를 농업정책의 중심과제로 삼고 농촌지역의 자원을 보다 효율적으로 이용함으로써 나라의 경제적 효율성은 물론 형평성을 높인다는 시각에서 농업정책을 다루어야 할 것이다.

  • PDF

유역 유출과정과 지하수위 변동을 고려한 분포형 지하수 함양량 산정방안 (Estimation of Groundwater Recharge by Considering Runoff Process and Groundwater Level Variation in Watershed)

  • 정일문;김남원;이정우
    • 한국지하수토양환경학회지:지하수토양환경
    • /
    • 제12권5호
    • /
    • pp.19-32
    • /
    • 2007
  • 우리나라에서 대표적으로 사용되어 온 지하수 함양량 산정방법은 지하수 감수곡선에 의한 기저유출분리법, 유역내의 집중형 개념모형에 의한 물수지 분석, 그리고 지하수위 변동곡선법으로 대별된다. 지하수 함양량은 기후조건, 토지이용 그리고 수문지질학적 불균질성에 따르는 시공간적인 변동성을 나타내므로 전술한 방법들은 이같은 특성을 다루기에는 많은 제약을 가진다. 이 같은 단점을 극복하기 위해 본 연구에서는 통합 지표수-지하수 모형인 SWAT-MODFLOW로부터 얻어진 물수지 성분을 기초로 한 새로운 함양량 추정방법을 제시하고자 한다. 하천변에 위치한 지하수위는 하천흐름과 유사한 동적변화를 나타내는 반면 보다 상류부에 위치한 지하수위는 강수에 대하여 일정한 지체현상을 나타낸다. 이와 같은 지하수위 변동의 특징은 함양의 물리적 특성과 관련되므로 이 같은 현상을 설명하기 위해서는 토양층을 통과한 물이 대수층 함양에 도달하는데 걸리는 시간적 지체를 설명하는 것이 필요하다. SWAT 모형에서는 주어진 날에 대해 물이 토양층을 통과하여 대수층으로 함양되는 과정을 설명하기 위해 지수형태의 감쇠가중함수를 가진 단일 저수지 저류 모듈을 사용한다. 그런데 이 모듈은 지체시간이 긴 경우나 추정된 함양의 시계열이 지하수위 시계열과 잘 맞지 않는 제한 사항을 가지므로, 본 연구에서는 비포화대를 통과하는 시간 지체를 보다 현실적으로 반영할 수 있는 다단 저수지 저류 추적 모듈을 개발하여 SWAT모형에 탑재하였으며, 이 모듈내의 시간지체와 관련된 매개변수는 관측지하수위와 모의 함양량의 상관관계를 검토함으로써 최적화가 이루어지도록 하였다. 본 연구방법의 최종 단계는 모의 지하수위와 관측 지하수위, 그리고 관측 유역유출량과 모의 유출량을 검증함으로써 종결된다. 새롭게 제안된 방법을 우리나라 미호천 유역에 적용하여 지하수 함양량의 시공간적 분포를 추정하였는데 제시된 방법이 유역 모형의 효율성과 지하수위 변동법의 정확성이라는 장점을 모두 가진 방법이어서 추정된 일 함양량은 수리지질학적 불균질성, 기후조건, 토지이용과 토양층과 대수층의 거동까지 반영한 매우 개선된 값으로 판단된다.

한우에서 전장의 유전체 정보를 활용한 연관불평형 및 유효집단크기 추정에 관한 연구 (Estimation of Linkage Disequilibrium and Effective Population Size using Whole Genome Single Nucleotide Polymorphisms in Hanwoo)

  • 조충일;이준호;이득환
    • 생명과학회지
    • /
    • 제22권3호
    • /
    • pp.366-372
    • /
    • 2012
  • 본 연구는 한우 유전체 전장에 존재하는 고밀도 단일염기다형을 DNA chip을 이용하여 각각의 유전자형을 구명하고, 동일염색체 내에 존재하는 각 표지인자쌍의 연관불평형을 성 염색체를 제외한 모든 상염색체에서 추정하여 물리적 거리별 연관불평형의 정도를 확인하고 이러한 결과를 이용하여 한우 집단의 유효집단 크기를 추정하기 위하여 실시하였다. 한우개량사업소에서 2005년부터 2008년까지 후대검정에 공시된 후보종모우 및 후대 검정우 288두에 대해 혈액을 채취하고 Bovine SNP 50 DNA Chip을 이용하여 유전자형을 분석하였으며, 총 51,582 표지인자 중 결측률이 10% 이상인 표지인자 1개 및 다형성이 없는 표지인자 10,730개에 대해 사전제거를 실시하고 남은 40,851개의 SNP표지인자를 본 분석에 활용하였다. 연구 결과, 성 염색체를 제외한 상 염색체의 총 SNP표지인자의 길이는 2,541.6 Mb였으며, 염색체별 평균 SNP표지인자간 거리는 0.55에서 0.74로 분포하였으며, EM알고리즘을 이용하여 염색체별 연관불평형을 추정해 보았을 때, 기존의 보고된 연구와 유사하게 표지인자간 거리가 짧을수록 높게 나타나는 지수형태의 그래프를 나타냈으며, SNP표지인자간 거리에 따른 $r^2$를 보면, 0 Mb에서 0.1 Mb일 때 0.136, 0.1-0.2 Mb에서 0.06로 나타났다. Luo (1998)의 연구결과를 한우에 적용시켰을 때, 전체분산의 5%이상 설명하는 양적형질좌위 발굴을 위해서 약 2,000두의 표현형 자료가 필요할 것으로 사료되었다. 또한 한우의 세대별 유효집단 크기에 대해 추정해 본 결과, 현재 한우의 유효집단크기는 84두로 추정되었고, 지금으로부터 약 50세대 이전의 유효집단 크기는 1,150두로 추정되었다. 가축에서 인공수정이 도입(1960년대)된 이 후 개량의 가속화로 인해 한우의 유효집단 크기가 급격히 감소한 것으로 사료되었다.