통합 검색 | Korea Science

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

배정환;한남기;송민
- 지능정보연구
- /
- 제20권2호
- /
- pp.109-122
- /
- 2014
현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.
https://doi.org/10.13088/jiis.2014.20.2.109 인용 PDF KSCI

적응형 군집화 기반 확장 용이한 협업 필터링 기법 (Scalable Collaborative Filtering Technique based on Adaptive Clustering)

이오준;홍민성;이원진;이재동
- 지능정보연구
- /
- 제20권2호
- /
- pp.73-92
- /
- 2014
기존 협업 필터링 기법은 사용자들의 아이템에 대한 선호도를 기반으로 유사 아이템 집합 또는 유사 사용자 집합을 구성하고, 이를 이용해 예측된 사용자의 특정 아이템에 대한 선호도를 기반으로 추천을 수행한다. 이로 인해, 사용자 선호도 정보가 부족하게 되면, 유사 아이템 사용자 집합의 신뢰도가 낮아지고, 추천 서비스의 신뢰도 또한 따라서 낮아진다. 또한, 서비스의 규모가 커질수록, 유사 아이템, 사용자 집합의 생성에 걸리는 시간은 기하급수적으로 증가하고 추천서비스의 응답시간 또한 그에 따라 증가하게 된다. 위와 같은 문제점을 해결하기 위해 본 논문에서는 적응형 군집화 기법을 제안하고 이를 적용한 협업 필터링 기법을 제안하고 있다. 이 기법은 크게 네 가지 방법으로 이루어진다. 첫째, 사용자와 아이템의 특성 벡터를 기반으로 사용자와 아이템 각각을 군집화 하여, 기존 협업 필터링 기법에서 유사 아이템, 사용자 집합을 생성하는데 소요되는 시간을 절약하며, 사용자 선호도 정보만을 이용한 부분 집합 생성보다 추천의 신뢰도를 높이고, 초기 평가 문제와 초기 이용자 문제를 일부 해소한다. 둘째, 미리 구성된 사용자와 아이템의 군집을 기반으로 군집간의 선호도를 이용해 추천을 수행한다. 사용자가 속한 군집의 선호도가 높은 순서대로 아이템 군집을 조회하여 사용자에게 제공할 아이템 목록을 구성하여, 추천 시스템의 부하 대부분을 모델 생성 단계에서 부담하고 실제 수행 시 부하를 최소화한다. 셋째, 누락된 사용자 선호도 정보를 사용자와 아이템 군집을 이용하여 예측함으로써 협업 필터링 추천 기법의 사용자 선호도 정보 희박성으로 인한 문제를 해소한다. 넷째, 사용자와 아이템의 특성 벡터를 사용자의 피드백에 따라 학습시켜 아이템과 사용자의 정성적 특성 정량화의 어려움을 해결한다. 본 연구의 검증은 기존에 제안되었던 하이브리드 필터링 기법들과의 성능 비교를 통해 이루어졌으며, 평가 방법으로는 평균 절대 오차와 응답 시간을 이용하였다.
https://doi.org/10.13088/jiis.2014.20.2.073 인용 PDF KSCI

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

윤여일;고은정;김남규
- 지능정보연구
- /
- 제25권2호
- /
- pp.141-166
- /
- 2019
최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.
https://doi.org/10.13088/jiis.2019.25.2.141 인용 PDF KSCI HTML

연희현장에서의 올바른 활용을 위한 진도다시래기 음악분석 (Musical Analysis of Jindo Dasiraegi music for the Scene of Performing Arts Contents)

한승석;남초롱
- 공연문화연구
- /
- 제25호
- /
- pp.253-289
- /
- 2012
다시래기는 전라남도 진도 지방에서 전승되는 상장례놀이로서, 죽음의 현장에서 새생명이 탄생한다는 생사불이(生死不二)의 메시지를 담고 있다. 더불어 많은 춤과 노래, 재담을 포함한 독특한 양식적 구조로 인해 현장 연희판에서 새로운 콘텐츠에 목말라 있던 공연문화 담당층의 주목을 끌기에 충분했다. 다시래기에 관한 많은 선행연구물들이 이들의 다시래기 재창조 작업에 커다란 도움을 주었다는 것은 불문가지의 사실이다. 그러나 이전의 연구들이 진도다시래기를 다각도로 다루어 적지 않은 성과를 이루어 내었지만 주로 학술적 접근을 통해 연행의 상징적 의미를 구명하는 데 치중한 것이 사실이다. 또한 공연요소들에 대한 접근도 대본, 노래가사, 재담, 행색, 소도구, 장단, 춤사위 등의 소개에 그쳐 정작 중요한 공연요소인 소리(창(唱))의 구체적 모습에 대한 연구가 없어 아쉬움으로 남아 있었다. 이에 본고는 다시래기 음악을 분석하고 그 음악의 성격과 특징을 악보와 함께 제시하여 공연현장의 연희실기자들에게 실질적인 도움을 주고자 하였다. 본고에서 음악분석 대상으로 삼은 소리는 가상제놀이와 거사 사당놀이에 나오는 모든 소리, 그리고 연희패의 입장 시에 부르는 상여소리로 한정하였다. 다시래기 다섯 절차 중 가상제놀이와 거사 사당놀이, 상여소리가 가장 많이 공연되기 때문이다. 수많은 공연 자료가 있지만 분석의 텍스트로는 E&E미디어에서 출반된 음반인 "진도다시래기"를 택하였다. 이는 이 음원의 녹음상태가 우수하며 무엇보다 본고에서 제시된 악보를 학습 자료로 삼아 다시래기 소리를 익히고자 하는 연희실기자들이 음원 구득과 그 활용을 용이하게 할 수 있다는 판단에서이다. 음악분석 결과, 진도다시래기에서 불리는 소리들은 대부분 꺾는 음이 있는 '미'음계를 사용한 전형적인 육자배기토리로 짜여 있었다. 그리고 '솔'음계의 남부경토리는 극히 일부분에 짧게 나타나며, 음악적 완결성은 갖추지 못하고 있는 것도 알 수 있었다. 또한 같은 상장례음악임에도 씻김굿과의 음악적 친연성은 거의 발견되지 않는데, 이는 망자를 달래서 천도하는 씻김굿과 산 자의 삶을 북돋우는 다시래기의 성격과 기능이 다른 데서 비롯된 음악적 특징이라고 생각된다. 한편 다시래기 소리 전반에 판소리 음악어법적 특징들이 보이는데, 이는 다시래기의 복원과 전승에 있어서 주도적 역할을 한 예능보유자의 과거 창극단 활동이력과 무관하지 않다고 여겨진다. 다시래기 예능 담당자의 이러한 활동이력은 다시래기 원형의 변질을 초래한 원인이 되기도 하였지만, 한편으로는 다시래기의 공연요소를 더욱 풍부하게 하여 공연현장에서 콘텐츠로 활용될 수 있는 연희적 기반을 확장시킨 결과로도 나타났다. 본고의 작업이 다시래기를 원형 삼아 죽음의 상실을 극복하고 삶의 활력을 지켜낼 미래의 진지한 현장예술가들에게 의미 있게 활용되기를 기대한다.

인터넷쇼핑몰의 VMD 구성요인에 대한 탐색적 연구 (An Exploratory Study on the Components of Visual Merchandising of Internet Shopping Mall)

김광석;신종국;구동모
- 마케팅과학연구
- /
- 제18권2호
- /
- pp.19-45
- /
- 2008
본 연구는 인터넷쇼핑몰 비주얼 머천다이징의 주요차원을 고객이 쇼핑몰에 진입한 후 정보탐색과 대안평가를 거치는 등의 쇼핑과정을 토대로 AIDA모형 관점에서 점포, 제품, 촉진에 초점을 맞추었다. VMD의 주요차원(primary dimensions)으로는 점포디자인, 머천다이징, 그리고 머천다이징단서로 구분하였다. 선행연구 결과를 토대로 점포다자인의 하위차원으로는 차별성, 간결성, 위치확인성을, 머천다이즈의 하위차원으로는 제품구색, 명성, 정보성을, 그리고 머천다이징단서의 하위차원으로는 제품추천 및 링크를 설정하여 VMD태도와의 관계를 탐색적으로 조사하였다. 연구결과 이들 세 차원은 종속변수에 유의한 정의 영향을 미치는 것으로 나타났다.
PDF

호주 일 지역의 병원 자원봉사활동 실태와 만족도 (Study of the Actual Condition and Satisfaction of Volunteer Activity in Australian Hospital)

박금자;최해영
- Journal of Hospice and Palliative Care
- /
- 제9권1호
- /
- pp.17-29
- /
- 2006
목적: 호주 일 지역의 종합병원을 중심으로 이루어지고 있는 호스피스 자원봉사자들의 특성을 파악하고 이들이 실제 환자들에게 시행하고 있는 활동내용과 그 만족도를 파악하기 위하여 시도하였다. 방법: 101명의 자가보고 질문지에 의해 자료수집되었으며, 자료의 분석은 SPSS/WIN 12.0 프로그램을 이용하여 다음과 같이 빈도와 백분율, 평균과 표준편차로 분석하였다. 결과: 1. 병원에서의 봉사활동경력은 $5{\sim}10$년이 32.7%, 10년 이상이 30.7%, $2{\sim}3$년이 11.9%, $3{\sim}5$년이 10.9%의 순이었다. 주요 봉사활동 형태는 신체적 간호가 32.7%, 신체 및 정서적 간호가 14.9%, 기타가 18.8%의 순이었다. 봉사업무할당 방법은 봉사활동 조정자에 의해서가 55.7%, 봉사자의 뜻에 따라서와 봉사자와 조정자의 합의에 의해서가 각각 20.5%의 순이었다. 봉사활동을 하는 주요 이유는 아픈 사람을 돕고 싶어서가 61.4%로 가장 많았으며, 다음은 여가시간을 선용하기 위해서가 22.8%였다. 봉사활동을 시작하게 된 경로는 자신의 조사에 의해서가 43.4%로 가장 많았으며, 다음은 다른 봉사자로부터 듣고서가 30.7%, 대중매체로부터가 13.1%의 순이었다. 봉사활동관련 교육을 받은 여부는 받았다가 80.2%였다. 봉사활동업무가 자신의 기술과 기능에 맞는 정도는 아주 잘 맞는다가 74.0%였고, 다음은 대체로 맞는다가 18.0%로 대체로 잘 맞는 것으로 나타났다. 봉사활동에 대해 받는 보상은 토큰이나 점심 혹은 집단 소풍이 31.7%로 가장 많았고, 다음은 토큰과 점심이나 집단 소풍이 각각 19.8%였다. 봉사활동에 대한 평가빈도는 이따금이 37.2%, 자주가 30.9%, 항상이 17.0%, 전혀 안 함이 14.9%의 순이었다. 봉사활동조정자와 관계는 매우 좋다가 85.0%로 대부분을 차지하였으며, 다른 봉사자와의 관계는 매우 좋다가 81.2%로 대부분을 차지하였고, 병원직원과의 관계는 매우 좋다가 69.7%였고, 다음은 대체로 좋다가 21.2%의 순이었다. 봉사활동에 대해 가족이나 친구의 지지는 어떠한가는 매우 좋다가 83.2%로 대부분을 차지하였다. 2. 대상자의 자원봉사활동 만족도는 평점 $3.09{\pm}0.49$(도구범위 $1{\sim}4$점)로 중간정도이었다. 영역별로 살펴보았을 때 만족도가 가장 높았던 영역은 사회적 접촉영역($3.48{\pm}0.61$)이었고, 다음은 성취영역($3.43{\pm}0.53$), 사회적 인정영역($3.35{\pm}0.70$)의 순이었다. 만족도가 가장 낮았던 영역은 사회적 교환영역($1.65{\pm}0.63$)이었다. 3. 대상자의 인구사회학적 특성에 따른 봉사활동 만족도를 분석한 결과 성별(t=2.038, P=0.044), 결혼상태(F=3.806, P=0.013)에 따라 유의한 차이를 보였다. 4. 대상자의 자원봉사활동 실태에 따른 봉사활동 만족도를 분석한 결과병원봉사활동기간(F=3.326, P=0.008), 봉사활동을 하는 주된 이유(F=2.707, P=0.035), 봉사활동을 위한 교육을 받은 여부(t=-1.982, P=0.050), 봉사활동의 평가 빈도(F=7.877, P=0.000), 봉사활동이 자신의 기술이나 능력에 적합도(F=2.712, P=0.049), 관리자와의 관계(t=-2.517, P=0.013), 다른 병원직원과의 관계(F=5.202, P=0.007), 자원봉사자로서의 활동에 대해 가족이나 친지로부터의 지지(t=-3.394, P=0.001)에 따라 봉사활동 만족도가 유의하게 차이가 있는 것으로 나타났다. 결론: 자원봉사활동 만족도는 중간정도이었고, 봉사활동 만족도는 대상자의 인구사회학적 특성에 따라서는 성별(t=2.038, P=0.044), 결혼상태(F=3.806, P=0.013)에 따라 유의한 차이를 보였고, 자원봉사활동 실태에 따라서는 병원봉사활동기간(F=3.326, P=0.008), 봉사활동을 하는 주된 이유(F=2.707, P=0.035), 봉사활동을 위한 교육을 받은 여부(t=-1.982, P=0.030), 봉사활동의 평가 빈도(F=7.877, P=0.000), 봉사활동이 자신의 기술이나 능력에 적합도(F=2.712, P=0.049), 관리자와의 관계(t=-2.517, P=0.013), 다른 병원직원과의 관계(F=5.202, P=0.007), 자원봉사자로서의 활동에 대해 가족이나 친지로부터의 지지(t=-3.394, P=0.001)에 따라 유의한 차이가 있는 것으로 나타났다. 따라서 자원봉사자를 관리할 때에 위의 요인들을 고려할 것이 요구된다고 볼 수 있다.
PDF

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

정다미;김재석;김기남;허종욱;온병원;강미정
- 지능정보연구
- /
- 제19권3호
- /
- pp.1-23
- /
- 2013
융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).
https://doi.org/10.13088/jiis.2013.19.3.001 인용 PDF KSCI

검색결과 3,807건 처리시간 0.103초

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

적응형 군집화 기반 확장 용이한 협업 필터링 기법 (Scalable Collaborative Filtering Technique based on Adaptive Clustering)

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

연희현장에서의 올바른 활용을 위한 진도다시래기 음악분석 (Musical Analysis of Jindo Dasiraegi music for the Scene of Performing Arts Contents)

인터넷쇼핑몰의 VMD 구성요인에 대한 탐색적 연구 (An Exploratory Study on the Components of Visual Merchandising of Internet Shopping Mall)

호주 일 지역의 병원 자원봉사활동 실태와 만족도 (Study of the Actual Condition and Satisfaction of Volunteer Activity in Australian Hospital)

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)