• 제목/요약/키워드: Web based Information

검색결과 6,774건 처리시간 0.037초

웹툰 통계 분석을 통한 한국 웹툰의 특징 (Features of Korean Webtoons through the Statistical Analysis)

  • 윤기헌;정규하;최인수;최해솔
    • 만화애니메이션 연구
    • /
    • 통권38호
    • /
    • pp.177-194
    • /
    • 2015
  • 본 연구는 부산대학교 연구팀이 2013년 12월부터 약 2개월간 한국만화영상원의 의뢰를 받아 2000년 초부터 2013년까지 원고료를 지급받고 공식매체에서 연재된 한국 웹툰을 전수 조사한 '한국 웹툰DB 및 흐름 정리 연구' 자료를 토대로 통계 분석한 자료이다. 웹에 연재되는 만화를 의미하는 Webtoon은 전통적인 출판만화의 쇠퇴와 사회적 환경의 변화로 2000년대 이후 한국만화의 대표적 형식이자 주류 산업으로 발전해 왔으며, 현재 한국을 대표하는 문화콘텐츠로 불리고 있다. 본 조사연구는 웹툰이 시작된 2000년대 초부터 2014년 1월까지 총 13여 년간에 걸친 우리나라 웹툰 중에서 원고료를 받고 매체에 정식연재가 된 웹툰을 대상으로 수집, 정리되었다. 이 데이터를 토대로 작가, 작품의 수와 매체별 분포도, 장르와 연재 주기 등 전반적인 웹툰의 특성을 분석했다. 데이터 분석과 통계작업을 통해 살펴본 한국의 웹툰은 주요 포털의 연재 비중이 아직 높지만 서서히 플랫폼의 다변화가 진행되고 있으며, 작품의 연재 주기는 갈수록 짧아지는 경향을 보이고 있다. 장르적 특성으로는 드라마, 개그, 판타지, 액션 등의 만화의 전통적 인기장르는 여전히 건재하며 최근 사회적 트렌드에 맞게 역사물, 스포츠, 요리 등의 분야가 증가추세에 있다. 웹툰의 활용도 면으로는 릴레이 웹툰, 브랜드 웹툰과 같은 이벤트와 PPL식 상업성을 표방한 새로운 형태의 웹툰도 등장하고 있다. 이와 같은 현상은 작가와 매체, 발주자의 공동이익이 실현되는 한편, 나아가 웹툰의 가능성을 다양하게 실험하는 시도라고 할 수 있다. 그리고 웹툰의 저변확대가 활발해 지면서 성인물의 증가세도 눈여겨 볼만 하다. 본 연구대상은 무료웹툰을 제외한 원고료를 받는 작품을 기준으로 했으나 온라인 사이트의 속성 상 폐쇄되거나 유실된 작가와 작품을 모두 수집하지 못한 한계를 갖고 있으며, 무료 웹툰을 총망라한 전수조사가 앞으로 필요하다 하겠다. 그럼에도 한국 웹툰을 최초로 정식매체와 작품, 작가, 장르를 분류 조사하고 이를 토대로 웹툰의 현재를 가늠해 보는 기초자료로서의 의미를 찾고자 한다. 이 연구를 바탕으로 후속 웹툰연구가 활성화되고 보완되는 자료들이 한국의 만화산업과 학문적인 자료로서 활용되길 기대한다.

서울시·경기도·강원도지역 구곡·동천 위치연구 (Study On the Geographic Locations of Gugoks and Dongcheons in Seoul, Gyeonggi-Do and Gangwon-Do)

  • 강기래;이해주;김희채;이현채;김동필
    • 한국전통조경학회지
    • /
    • 제35권3호
    • /
    • pp.67-75
    • /
    • 2017
  • 유교의 사상적 완성을 구현하기 위한 구곡(九曲)과 동천(洞天)의 문화는 조선시대에 널리 성행하였다. 이는 조선시대 유학자들이 학주자(學朱子), 존주자(尊朱子)의 기치 아래 자연 속에서의 심신수양을 통한 주자의 가르침을 따르고 있다는 의지의 표현이며, 진리의 체득을 위한 과정에 있다는 자기 위안의 행위이기도 하였다. 이러한 의지의 표출로서 각 지역의 경치가 좋은 곳에 주자의 무이구곡(武夷九曲)을 모방한 '구곡'과 이상향을 나타내는 '동천'을 설정하고 경영하기도 하였다. 이러한 구곡 동천은 전국적으로 분포하고 있다. 학계에 보고된 우리나라 전체 구곡은 약 60여 개소에 이르며, 동천은 이보다 더 많지만 정확한 위치나 집계가 이루어지지 않았다. 따라서 본 연구는 서울, 경기, 강원도에 산재하고 있는 구곡 동천에 대한 위치확인을 위해 수행되었다. 구곡과 동천의 위치에 대한 정보는 선행연구와 보고서, 인터넷 검색과 각 지역 문화원의 발간 서적을 통해 수집하였다. 수집된 정보를 바탕으로 각 지역에 실재하는지에 대한 답사를 진행하였고, 위치정보를 획득하였다. 이 외에 상상 속의 구곡 동천이나 멸실된 곳, 출입이 불가능한 지역 등을 정리하였다. 서울과 경기도 강원도의 구곡은 8개소로 파악되었다. 이 중 그 위치나 기록 등이 비교적 명확한 곳이 곡운구곡과 옥계구곡이다. 벽계구곡과 수회구곡은 서로 위치나 명칭이 서로 겹치기도 하고, 설정한 시기나 경영자가 명확하지 않다. 서울의 우이구곡은 홍양호가 설정하였으나 그 위치가 일부는 확인되고 일부는 위치의 논란이 있으며, 일부는 훼손되어 있다. 서울 경기도와 강원도의 동천은 모두 38개소로 파악되었다. 서울지역에 위치한 동천은 16개소이다. 이 중 실제 존재하지만 출입이 금지된 곳은 도화동천과 양산동천, 쌍류동천 등이다. 경기도 지역의 동천은 13개소이며 온수동천은 개발로 인해 그 위치를 알 수 없으며, 귀래동천은 기록만 있고 실제로 확인은 불가한 곳이다. 강원도 지역의 동천은 9개소이다. 화음동천은 곡운구곡의 상류에 위치한 화음동정사지(華陰洞精舍址)를 잘못 표기한 것으로 판단하였다.

가정용수의 용도별 사용량 조사 및 원단위 분석 (End-use analysis of household water by metering)

  • 김화수;이두진;김주환;김정현;정관수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.869-877
    • /
    • 2008
  • 본 연구에서는 전국 140여개 가구를 대상으로 조사된 가정용수의 각 용도별 사용량 자료를 바탕으로 가정용수의 용도별 사용량을 도출함으로써 상, 하수도시설설계에 활용할 수 있는 원단위를 제시하고, 또한 용도별 사용특성분석, 영향인자 평가 등을 통하여 가정용수의 변동특성을 이해하고 향후 사용경향을 예측할 수 있는 정보를 제공하고자 하였다. 가정용수의 총사용량 기준 원단위는 $165.8{\ell}pcd$였으며, 각 용도별 사용량은 세면용수 $15.4{\ell}pcd$(10%), 욕조용수 $24.7{\ell}pcd$(16%), 싱크대용수 $29.7{\ell}pcd$(19%), 세탁기용수 $30.8{\ell}pcd$(20%), 변기용수 $38.5{\ell}pcd$(25%), 기타용수 $13.5{\ell}pcd$(9%)로 나타났다. 가정용수 중에서 변기용수의 사용량이 가장 많은 것으로 나타났으며, 베란다, 정원용수 등이 포함된 기타용수의 경우 사용빈도가 일정하지 않고 사용량의 편차도 심하여 변동계수와 표준편차가 가장 크게 나타났다. 가정용수의 용도별 사용량을 미국, 영국 가정과 비교한 결과, 기타용수와 실외용수를 제외하고는 미국의 실내용수 사용량과 비율이 우리나라와 매우 유사한 특성을 보였다. 가정에서 물사용에 기초한 생활양식이 미국과 유사하게 변화되고 있음을 간접적으로 보여준 결과이다. 또한 1985년에 서울에서 조사된 용도별 사용량과 금번결과를 비교한 결과, 목욕, 변기, 세탁, 취사용수의 총량은 $23{\ell}$가 증가하였으며, 특히 세면과 욕조용수를 합산한 목욕용수가 $27{\ell}$에서 $40{\ell}$로 크게 늘어났고, 세탁용수도 $17{\ell}$나 늘어났다. 생활양식이 서구화되면서 가정에서의 목욕, 사워문화가 점차 확산되고 대용량 세탁기의 보급이 늘어난 것 등이 영향을 미쳤을 것으로 추측되었다.

  • PDF

영양흐름모형을 이용한 1994년 신지도 해양생태계 해석 (Analysis of Sinjido Marine Ecosystem in 1994 using a Trophic Flow Model)

  • 강윤호
    • 한국해양학회지:바다
    • /
    • 제16권4호
    • /
    • pp.180-195
    • /
    • 2011
  • 1994년 신지도 해양생태계에서 관측된 자료를 이용 Ecopath 영양흐름 모델을 구축하였다. 모델은 생체량과 먹이 조성 자료를 이용하여 우점종의 개체군 역학, 주요 영양흐름의 경로, 생태적 특성을 해석하여 다른 해양 생태계와 비교하였다. 계를 구성하는 그룹은 17개로서 해조류, 식물플랑크톤, 동물플랑크톤, 복족류, 다모류, 이매패류, 극피동물, 갑각류, 두족류, 망둑어, 양태, 홍어, 보구치, 베도라치, 장어, 가자미 및 유기쇄설물을 포함한다. 실험결과 영양단계는 일차생산자와 유기쇄설물로부터 최고 소비자인 가자미 그룹에 이르기까지 1.0~4.0의 범위를 보였다. 계의 총생체량(B)은 0.1 $kgWW/m^2$, 총순일차생산량(PP)과 총통과흐름(TST)은 각기 1.6, 3.4 $kgWW/m^2/yr$이며, TST는 총소비 7%, 총이출 43%, 총호흡(TR) 4%, 총유기쇄설물전환 46%의 합으로 구성된다. PP/TR은 0.012, PP/B는 0.015, 잡식지수는 0.12, 핀순환지수는 0.7%, 평균경로거리는 2.15, 지배용량(A)과 발전용량(C)은 각기 4.1과 8.2 $kgWW/m^2/yr$ bits이며, 상대지배용량(A/C)은 51%를 보였다. 특히 본 연구는 영양상호영향 해석에서 간접적인 경로를 통한 영향을 4가지 형태로 구분하여 기술하였다. 총통과흐름 기운데 총이출이 높은 것은 계가 반폐쇄된 만과 다르게 물질 교환이 크다는 의미이며, 연구해역이 신지도, 조약도, 생일도로 둘러싸인 수로를 통해 강한 조류가 미치는 지역임을 보아 쉽게 알 수 있다. 생태계 이론 및 순환지수 가운데 총생체량, 총통과흐름, PP/TR, 핀순환지수, 평균경로 거리, 잡식지수는 비교적 낮게 산출되었는데, 이는 오덤의 이론에 따라 계가 충분히 성숙하지 못한 근거로 해석되었고, 정보지수인 상대지배용량이 크게 산출된 것은 계가 최대로 발전할 수 있는 용량이 작다는 것으로 해석되었다. 이상의 결과로 보아 연구해역은 영양물질의 외부 유출이 커 계가 발전할 수 있는 가능성은 한정되고 현재 발전하고 있는 단계인 것으로 판단되었다. 본 연구는 신지도 해양생태계의 영양흐름 구조와 생태계 특성을 해석한 시험연구로서 향후 생태계의 변화를 비교하거나 관리에 유용할 것으로 판단된다.

대학생들의 인지양식에 따른 관찰에서의 안구 운동 분석 (An Analysis of Eye Movement in Observation According to University Students' Cognitive Style)

  • 임성만;최현동;양일호;정미연
    • 한국과학교육학회지
    • /
    • 제33권4호
    • /
    • pp.778-793
    • /
    • 2013
  • 이 연구의 목적은 시선 이동을 통해 나타나는 인지양식에 따른 관찰 특성을 분석하는 것이다. 이를 위해 전체적 인지양식, 분석적 인지양식 집단의 관찰 사실에 차이를 보이는 관찰 과제를 개발하고, 각각의 인지양식을 가진 대학생들을 대상으로 관찰 과제를 제시했을 때 안구 운동을 측정하였다. 통계 자료와 시각화 자료를 수집하여 Fixation을 분석하였고 두 인지양식 집단의 관찰 특성 차이를 확인하였다. 이 연구에서 밝혀진 결과는 다음과 같다. 첫째, 인지양식에 따른 응시시간 빈도를 확인하기 위해 과제에 대한 각 집단의 응시시간, 전체 Fixation 개수, 그리고 30초동안의 Fixation 개수의 평균값을 비교했을 때 전체적 인지양식 집단이 전체 Fixation 개수, 30초에서의 Fixation 개수가 더 많았다. 이것은 전체적 인지양식 집단이 분석적 인지양식 집단보다 더 많은 지점을 관찰하였고, 분석적 인지양식 집단은 더 적은 수의 지점을 관찰하며 특정한 지점에 집중하는 성향을 나타낸다는 것을 의미한다. 둘째, 인지양식에 따른 관찰 비중을 비교했을 때 거미를 관찰하는 비중은 분석적 인지양식이 집단이, 주변 환경을 관찰하는 비중은 전체적 인지양식에서 높았고, 부분적 생김새를 관찰하는 비중은 분석적 인지양식이 집단이, 전체적 생김새를 관찰하는 비중은 전체적 인지양식 집단이 더 높았다. 전체적 인지양식 집단은 주변 환경의 부분적 생김새와 거미의 전체적 생김새를 관찰하는 비중이 높고, 분석적 인지양식 집단은 거미의 부분적 생김새를 관찰하는 비중이 매우 높다. 이상의 연구 결과를 종합해보면 인지양식에 따라 관찰 시간, 빈도, 대상, 영역, 비중에 차이가 있음을 알 수 있다. 학습자마다 다양한 관찰 결과가 나타나는 원인이 인지양식에 따라 받아들이는 정보의 차이에 있음을 확인하였고, 본 연구의 결과는 학습자의 특성에 가장 적합한 관찰 수행을 파악하고 지도하는데 도움이 될 것이다.

교육용 시뮬레이션 설계를 위한 온실 환경 제어 모델의 활용 (Application of Greenhouse Climate Management Model for Educational Simulation Design)

  • 윤승리;김동필;황인하;김진현;신민주;방지웅;정호정
    • 생물환경조절학회지
    • /
    • 제31권4호
    • /
    • pp.485-496
    • /
    • 2022
  • 국내외로 첨단 ICT 융합기술이 농업 분야에 적용되기 시작하면서, 시설원예 설비들이 고도화되고, 스마트팜 구축 기술 및 인력이 축적되기 시작하였다. 그러나 우리나라 농촌의 경우, 농업생산 연령의 고령화, 국내 농촌 인구의 지속적인 유출, 저출산 등으로 인하여 스마트팜 확대 및 적용에 어려움이 많은 실정이다. 따라서 공간 및 시간에 구속을 받지 않는 간편한 농업인 교육 프로그램이 필요하며, 최근 부상하고 있는 시뮬레이션 기술을 활용한다면 농업 교육용 시뮬레이션 툴 개발도 가능할 것으로 판단된다. 온실 환경 제어 모델을 이용한 시뮬레이션은 다양한 지역과 기상 조건 하에서 대상 온실의 열과 물질에너지의 상호작용을 합리적으로 예측할 수 있게 해준다. 본 연구에서는 온실 환경 제어 모델을 활용하여 외부 기상 데이터를 통해 온실의 환경 변화를 예측하고 가상의 환경 제어시스템을 통해 환경 제어 시 필요한 에너지값들을 시뮬레이션 할 수 있었다. 이러한 결과를 통해 이용자가 직접 맞춤형 환경 제어를 할 수 있도록 편의성을 고려한 사용자 인터페이스를 구축할 것이며, 실제 파프리카 재배 온실의 제어 요소들을 반영할 수 있도록 설계될 것이다. 농업용 교육 시뮬레이션 툴을 최근 활발하게 연구가 이루어지고 있는 작물 생육 모델링 기술 및 전산유체역학 기술과 융합하면 더욱타당한 결과를 보일 것이다.

가정용수의 용도별 사용 원단위 분석 (End-use Analysis of Household Water by Metering)

  • 김화수;이두진;김주환;정관수
    • 대한토목학회논문집
    • /
    • 제28권5B호
    • /
    • pp.595-601
    • /
    • 2008
  • 본 연구에서는 전국 140여개 가구를 대상으로 실측 조사한 자료를 바탕으로 가정용수의 용도별 사용량을 도출함으로써 상 하수도시설설계에 활용할 수 있는 원단위를 제시하고, 용도별 사용특성분석, 영향인자 평가 등을 통하여 가정용수의 변동특성을 이해하고 향후 사용경향을 예측할 수 있는 정보를 제공하고자 하였다. 전국 140가구를 대상으로 약 3여년간 실측한 결과, 가정용수의 총사용량은 165.8 lpcd였으며, 각 용도별 사용량은 세면용수 15.4 lpcd(10%), 욕조용수 24.7 lpcd(16%), 싱크대용수 29.7 lpcd(19%), 세탁기용수 30.8 lpcd(20%), 변기용수 38.5 lpcd(25%), 기타용수 13.5 lpcd(9%)순으로 나타났다. 가정용수 중에서 변기용수의 사용량이 가장 많은 것으로 나타났으며, 베란다, 정원용수 등이 포함된 기타용수의 경우 사용빈도가 일정하지 않고 사용량의 편차도 심하여 변동계수와 표준편차가 가장 크게 나타났다. 가정용수의 용도별 사용량을 미국, 영국 가정과 비교한 결과, 기타용수와 실외용수를 제외하고는 미국의 실내용수 사용량과 비율이 우리나라와 매우 유사한 특성을 보였다. 가정에서 물사용에 기초한 생활양식이 미국과 유사하게 변화되고 있음을 간접적으로 보여준 결과이다. 또한 1985년에 서울에서 조사된 용도별 사용량과 금번결과를 비교한 결과, 목욕, 변기, 세탁, 취사용수의 총량은 23 l가 증가하였으며, 특히 세면과 욕조용수를 합산한 목욕용수가 27 l에서 40 l로 크게 늘어났고, 세탁용수도 17 l나 늘어났다. 생활양식이 서구화되면서 가정에서의 목욕, 사워문화가 점차 확산되고 대용량 세탁기의 보급이 늘어난 것 등이 영향을 미쳤을 것으로 추측되었다.

소비자대함유한국전통시상설계원소적편복적소비행위지우생활방식적조절작용(消费者对含有韩国传统时尚设计元素的便服的消费行为之于生活方式的调节作用) (Moderating Effect of Lifestyle on Consumer Behavior of Loungewear with Korean Traditional Fashion Design Elements)

  • Ko, Eun-Ju;Lee, Jee-Hyun;Kim, Angella Ji-Young;Burns, Leslie Davis
    • 마케팅과학연구
    • /
    • 제20권1호
    • /
    • pp.15-26
    • /
    • 2010
  • 由于生产的全球化以及国家之间的文化交流, 东方元素越来越吸引世界的眼球. 在时装界, 一个时装设计师的文化背景往往可以催生新颖的设计理念, 使他卓尔不群. 人们对于东方元素的喜爱, 给传统时装市场带来了巨大的商机, 并且把基于文化的业务拓展到全球时装市场. 然而, 包含韩国传统文化的国际品牌还有待开发. 为了发展有韩国特色的国际品牌, 韩国人首先要在国内服装市场上认同本国文化, 然后才能进军国外市场. 便服非常适合采纳韩国元素, 因为这种衣服有很多用途, 很容易被广泛接受和使用. 而且, 多用途便服和时尚内衣的市场需求越来越大. 尽管便服市场在快速发展, 但是对便服的专门研究尚不多见, 目前在对发展中的现代化传统服装、时尚产品和品牌的研究中, 并不包括对便服的研究. 因此, 本论文调查了韩国的便服市场, 研究了消费者对含有韩国传统时装设计特色的便服的评价. 分析了对于韩国传统时装设计元素有购买意向的先例之间的关系, 并且比较了不同生活群体的消费目标. 产品质量, 零售服务质量, 感受价值以及对拥有韩国传统设计元素的便服的喜好被作为购买意向的先决条件. 同时, 本文设计了一个结构方程模型, 用于探讨它们之间的关系以及它们对购买意图的影响. 产品质量和市场营销中的零售服务质量结合在一起, 成为影响人们对韩国特色便服的偏好和价值感知的因素. 而且, 偏好和价值感知对购买意向的影响可以用同一模型来检验. 通过网上调查系统由女性消费者完成了一共357份的自填式问卷, 并制定了一份调查样本人群的生活方式、对于产品和销售服务的标准、对于韩国特色便服的价值感知、偏好以及购买意向的调查问卷. 此外, 问卷还将调查便服的采购和使用行为, 以便检验韩国便服的市场地位. 并且使用描述性分析, 因素分析, 聚类分析来分析数据, 以及使用AMOS 7.0.来进行方差分析和建立结构方程模型. 对于韩国便服市场地位的调查结果显示, 在我们的样本人群中大多数消费者都购买了便服. 便服在目前被认为是在家里穿的衣服, 是消费者比较而言投入较低的衣服. 在调查中显示, 大多数消费者每年仅仅购买2到3次便服, 花费在10美元以下. 购买便服的消费者们的生活方式共有四类: 传统价值导向的生活方式, 品牌影响的生活方式, 追求休闲的生活方式以及健康导向的生活方式, 这四类共计有12个项目. 基于这些生活方式要素, 便服消费者们又可以分为两类: 安乐派和保守派. 文章估量了对含有韩国传统时尚设计元素的便服的购买行为各组成部分之间的关系, 产品质量和零售服务质量都会影响到购买便服的偏好和价值感知. 这个研究结论证明, 高质量的产品和零售服务会对便服形成积极的优先效应. 价值感知和对便服的偏好会对购买意图产生积极的影响. 这个结果表明, 对便服所含有的韩国传统时尚设计因素的强烈偏好和价值感知能增强购买意图. 在两种不同生活方式的群体(即安乐派和保守派)的模型比较中, 结果显示产品质量和零售服务质量对安乐派群体的偏好和感知价值都有积极影响. 然而, 对保守派来说, 只有零售服务质量对偏好和购买意图有积极的影响. 由于安乐派对购买意图显示出更重大的影响, 包含韩国传统时尚设计因素的便服品牌应该关注安乐派的这些特征. 然而, 保守派对包含韩国传统时尚设计因素的便服在偏好和购买意图的关系中显得更强. 因此对包含韩国传统时尚设计因素的便服品牌来说, 它应该把重点放在如何激发保守群体消费者对便服的积极偏爱上. 这些结果提供了关于韩国便服消费者生活方式的信息, 也对那些计划进入韩国便服市场的时尚品牌, 尤其是那些与现行研究样本相似的, 目标为女性消费者的时尚品牌提供了有用的信息. 这一研究也为便服品牌和那些打算创造含有韩国传统时尚因素的高价值品牌提供了策略和市场洞察力. 考虑到不同生活方式群体的类型和便服或传统时尚商品之间的关系, 品牌设计者和市场策划人员可以运用这一研究成果作为市场定位, 目标设定, 以及市场销售策略的一个参考.

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).