• 제목/요약/키워드: concept extracting

검색결과 135건 처리시간 0.022초

스토리 기반의 정보 검색 연구 (Story-based Information Retrieval)

  • 유은순;박승보
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.81-96
    • /
    • 2013
  • 웹의 발전과 콘텐츠 산업의 팽창으로 비디오 데이터가 폭발적으로 증가함에 따라 데이터의 정보 검색은 매우 중요한 문제가 되었다. 그동안 비디오 데이터의 정보 검색과 브라우징을 위해 비디오의 프레임(frame)이나 숏(shot)으로부터 색채(color)와 질감(texture), 모양(shape)과 같은 시각적 특징(features)들을 추출하여 비디오의 내용을 표현하고 유사도를 측정하는 내용 기반(content-based)방식의 비디오 분석이 주를 이루었다. 영화는 하위 레벨의 시청각적 정보와 상위 레벨의 스토리 정보를 포함하고 있다. 저차원의 시각적 특징을 통해 내용을 표현하는 내용 기반 분석을 영화에 적용할 경우 내용 기반 분석과 인간이 인지하는 영화의 내용 사이에는 의미적 격차(semantic gap)가 발생한다. 왜냐하면 영화의 스토리는 시간의 진행에 따라 그 내용이 변하고, 관점에 따라 주관적 해석이 가능한 고차원의 의미정보이기 때문이다. 따라서 스토리 차원의 정보 검색을 위해서는 스토리를 모델링하는 정형화된 모형이 필요하다. 최근 들어 소셜 네트워크 개념을 활용한 스토리 기반의 비디오 분석 방법들이 등장하고 있다. 그러나 영화 속 등장인물들의 소셜 네트워크를 통해 스토리를 표현하는 이 방법들은 몇 가지 문제점들을 드러내고 있다. 첫째, 등장인물들의 관계에만 초점이 맞추어져 있으며, 스토리 진행에 따른 등장인물들의 관계 변화를 역동적으로 표현하지 못한다. 둘째, 등장인물의 정체성과 심리상태를 보여주는 감정(emotion)과 같은 심층적 정보를 간과하고 있다. 셋째, 등장인물 이외에 스토리를 구성하는 사건과 배경에 대한 정보들을 반영하지 못하고 있다. 따라서 본 연구는 기존의 스토리 기반의 비디오 분석 방법들의 한계를 살펴보고, 문제 해결을 위해 문학 이론에서 제시하고 있는 서사 구조에 근거하여 스토리 모델링에 필요한 요소들을 인물, 배경, 사건의 세 가지 측면에서 제시하고자 한다.

『신증동국여지승람』의 경상도편 「산천(山川)」 항목에 수록된 수경(水景) 요소의 특징 (Typological Characteristics of Waterscape Elements from the Chapter 「Sancheon」 of the Volumes Gyeongsang-province in 『Sinjeung Donggukyeojiseungram』)

  • 임의제;소현수
    • 한국전통조경학회지
    • /
    • 제34권2호
    • /
    • pp.1-15
    • /
    • 2016
  • 본 연구는 용어의 개념과 차이점을 명료하게 규정하기 어려운 전통 수경(水景) 요소의 쓰임을 고찰하기 위한 목적을 가지고 문헌분석을 위주로 진행되었다. 조선 전기 관찬(官撰) 지리지인 "신증동국여지승람"의 경상도편 "산천" 항목에서 수경과 관련된 지명을 발췌하여 다양한 수경 요소를 파악하고, 사전적 정의와 원문에 대한 해석 및 유사 사례 고찰을 통해서 수경 요소별 특징을 도출하였다. 연구의 결과를 다음과 같이 정리하였다. 1. "산천" 항목에 수록된 수경은 22개 요소였으며, 이를 입지와 물 흐름의 방식에 따라서 하천경관, 호소(湖沼)경관, 해안경관으로 분류하였다. 2. 자연적 물 흐름을 항시 유지하는 하천경관은 물줄기의 위계와 관련된 선적(線的) 형태의 '수(水)', '강(江)', '천(川)', '계(溪)'와 감입곡류하천 특성으로 인해서 형성되는 점적(點的) 형태의 '탄(灘)', '뢰(瀨)', '폭(瀑)', '저(渚)'로 구성된다. 3. 일정 구역에 모인 물 형태를 갖는 호소경관은 '강'의 중하류에 형성된 넓고 잔잔한 지점을 일컫는 '호(湖)', 하천 중상류 유로 상에 자연적으로 형성된 '연(淵)', '담(潭)', '추(湫)', 평지에 모인 물로서 '지(池)', '당(塘)', '택(澤)', 그리고 자연적으로 솟아나는 샘을 지칭하는 '천(泉)', '정(井)'으로 구성된다. 4. 해안경관에는 육지와 섬, 혹은 섬과 섬 사이 공간을 지칭하는 '량(梁)'과 '항(項)', 바다를 향해 돌출된 '곶(串)', 바닷가 모래사장 형태의 '정(汀)', 그리고 도서 지역의 지리적 중요성이 반영되어 높은 출현 빈도를 보인 '도(島)'가 포함된다. 연구 결과를 통해 전통 수경 요소의 다양성을 파악하였으며, 이들이 입지적, 경관적, 기능적으로 차별화된 특징을 반영한 개념이라는 사실을 도출하였다. 이를 통해서 선조들의 자연경관에 대한 관심과 예리한 관찰력으로 형성된 자연에 대한 심미안이 인공을 최소화하고 자연이 주체가 된 우리 전통정원의 특성을 설명할 수 있는 바탕이 된 것으로 이해하였다.

서비스디자인 프로세스를 활용한 UX중심 오피스 전화기 디자인개발 프로세스 연구 (A Study on UX-centered Smart Office Phone Design Development Process Using Service Design Process)

  • 서홍석
    • 감성과학
    • /
    • 제25권1호
    • /
    • pp.41-54
    • /
    • 2022
  • 본 연구의 목적은 서비스디자인 프로세스를 활용한 제품디자인 개발 프로세스를 체계화하여 실무에서 활용할 수 있도록 '서비스디자인 방법론을 활용한 제품디자인 개발 프로세스'를 제안하는 데 목적을 두고 연구를 진행하였다. 일반 가정용 전화기에 비해 스마트화 되어가는 사무환경을 고려한 오피스 전화기에 대한 사용성(Usability) 연구가 부족한 상황에서, 이 연구를 통해 단순 제품 개발이 아닌 제품기반 서비스디자인적 관점으로 확장하여 스마트 사무환경에서의 오피스 전화기 제품디자인을 통해 새로운 사용자 경험 가치 제공과 서비스 연계 방안을 모색하고자 한다. 본 연구의 방법으로는 서비스디자인 프로세스를 활용하여 UX중심의 사용자 니즈 도출 및 사용자 경험 가치를 구현하는 제품디자인 개발에 중점을 두었다. 특히, 제품 개발과정에서 사용자 니즈와 경험 가치 요소를 좀 더 체계적으로 도출하고, 제품기반 서비스가 융합된 아이디어를 발굴하기 위해 서비스디자인 프로세스를 접목하였다. 이를 위해 서비스디자인 분야에서 널리 활용되고 있는 '더블 다이아몬드 디자인 프로세스 모델'을 채택하였다. 또한 실제 사용자 및 다양한 분야의 인력들이 참여하는 Work Flow를 통해 사용성 개선방안, 사용자 경험(UX) 가치 요소 및 제품-서비스 연계 아이디어를 도출할 수 있도록 제품디자인 개발 프로세스를 구축하였다. 본 연구의 결과로서, 더블 다이아몬드 디자인 프로세스에 기반하여 '문제발견(Discover)' 정보수집 단계에서는 국내외 오피스 전화기 시장을 중심으로 디자인 트렌드를 파악하였다. '정의(Define)' 분석·도출 단계에서는 사용자 관찰 및 인터뷰, 사용성 설문조사를 통해 사용자 니즈를 분석하고, 디자인 요구조건 및 사용자 경험 이슈를 도출하였다. 사용자 유형 분석을 통해 퍼소나(Persona)를 설정하였으며, 이를 바탕으로 사용자 시나리오를 제시하였다. '발전(Develop)' 발전·개발 단계에서는 디자인 구체화를 위한 아이디어 워크숍과 콘셉트 렌더링을 진행하였으며, 사내 다양한 분야의 인력이 참여하여 디자인 선호도 및 사용성 개선방안을 도출하여 디자인 방향을 설정하였다. '전달(Deliver)' 개선·프로토타입 개발·평가 단계에서는 디자인 프로토타입 목업을 제작하여 사외 디자인전문가 자문을 통한 디자인 및 사용성 평가를 진행하였다. 결론적으로 본 연구는 기존의 제품디자인 개발 프로세스와 서비스디자인 프로세스가 접목된 제품디자인 개발 프로세스 모델을 구축하였다는데 의의가 있다. 궁극적으로 향후 I사 제품이 서비스 융합을 통해서 사용자 경험 가치를 구현하고, 이를 통해 새로운 비즈니스 모델을 만들어갈 수 있도록 서비스디자인기반 제품디자인 개발 프로세스를 제안하였다.

트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법의 성능분석 (Performance analysis of Frequent Itemset Mining Technique based on Transaction Weight Constraints)

  • 윤은일;편광범
    • 인터넷정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.67-74
    • /
    • 2015
  • 최근, 아이템들의 가치를 고려한 빈발 아이템셋 마이닝 방법은 데이터 마이닝 분야에서 가장 중요한 이슈 중 하나로 활발히 연구되어왔다. 아이템들의 가치를 고려한 마이닝 기법들은 적용 방법에 따라 크게 가중화 빈발 아이템셋 마이닝, 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝, 유틸리티 아이템셋 마이닝으로 구분된다. 본 논문에서는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝들에 대해 실증적인 분석을 수행한다. 일반적으로 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법들은 데이터베이스 내 아이템들의 가치를 고려함으로써 트랜잭션 가중치를 계산한다. 또한, 그 기법들은 계산된 각 트랜잭션의 가중치를 바탕으로 가중화 빈발 아이템셋들을 마이닝 한다. 트랜잭션 가중치는 트랜잭션 내에 높은 가치의 아이템이 많이 포함 될수록 높은 값으로 나타나기 때문에 우리는 각 트랜잭션의 가중치의 분석을 통해 그 가치를 파악할 수 있다. 우리는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법 중에서 가장 유명한 알고리즘인 WIS와 WIT-FWIs, IT-FWIs-MODIFY, WIT-FWIs-DIFF의 장 단점을 분석하고 각각의 성능을 비교한다. WIS는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝의 개념과 그 기법이 처음 제안된 알고리즘이며, 전통적인 빈발 아이템셋 마이닝 기법인 Apriori를 기반으로 하고 있다. 또 다른 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 방법인 WIT-FWIs와 WIT-FWIs-MODIFY, WIT-FWIs-DIFF는 가중화된 빈발 아이템셋 마이닝을 더 효율적으로 수행하기 위해 격자구조(Lattice) 형태의 특별한 저장구조인 WIT-tree를 이용한다. WIT-tree의 각 노드에는 아이템셋 정보와 아이템셋이 포함된 트랜잭션의 ID들이 저장되며, 이 구조를 사용함으로써 아이템셋 마이닝 과정에서 발생되는 다수의 데이터베이스 스캔 과정이 감소된다. 특히, 전통적인 알고리즘들이 수많은 데이터베이스 스캔을 수행하는 반면에, 이 알고리즘들은 WIT-tree를 이용해 데이터베이스를 오직 한번만 읽음으로써 마이닝과정에서 발생 가능한 오버헤드 문제를 해결한다. 또한, 공통적으로 길이 N의 두 아이템셋을 이용해 길이 N+1의 새로운 아이템셋을 생성한다. 먼저, WIT-FWIs는 각 아이템셋이 동시에 발생되는 트랜잭션들의 정보를 활용하는 것이 특징이다. WIT-FWIs-MODIFY는 조합되는 아이템셋의 정보를 이용해 빈도수 계산에 필요한 연산을 줄인 알고리즘이다. WIT-FWIs-DIFF는 두 아이템셋 중 하나만 발생한 트랜잭션의 정보를 이용한다. 우리는 다양한 실험환경에서 각 알고리즘의 성능을 비교분석하기 위해 각 트랜잭션의 형태가 유사한 dense 데이터와 각 트랜잭션의 구성이 서로 다른 sparse 데이터를 이용해 마이닝 시간과 최대 메모리 사용량을 평가한다. 또한, 각 알고리즘의 안정성을 평가하기 위한 확장성 테스트를 수행한다. 결과적으로, dense 데이터에서는 WIT-FWIs와 WIT-FWIs-MODIFY가 다른 알고리즘들보다 좋은 성능을 보이고 sparse 데이터에서는 WIT-FWI-DIFF가 가장 좋은 효율성을 갖는다. WIS는 더 많은 연산을 수행하는 알고리즘을 기반으로 했기 때문에 평균적으로 가장 낮은 성능을 보인다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).