• 제목/요약/키워드: Topic Feature

검색결과 108건 처리시간 0.028초

용어 사전의 특성이 문서 분류 정확도에 미치는 영향 연구 (Analyzing the Effect of Characteristics of Dictionary on the Accuracy of Document Classifiers)

  • 정해강;김남규
    • 경영과정보연구
    • /
    • 제37권4호
    • /
    • pp.41-62
    • /
    • 2018
  • 다양한 소셜 미디어 활동과 인터넷 뉴스 기사, 블로그 등을 통해 유통되는 비정형 데이터의 양이 급증함에 따라 비정형 데이터를 분석하고 활용하기 위한 연구가 활발히 진행되고 있다. 텍스트 분석은 주로 특정 도메인 또는 특정 주제에 대해 수행되므로, 도메인별 용어 사전의 구축과 적용에 대한 중요성이 더욱 강조되고 있다. 용어 사전의 품질은 비정형 데이터 분석 결과의 품질에 직접적인 영향을 미치게 되며, 분석 과정에서 정제의 역할을 수행함으로써 분석의 관점을 정의한다는 측면에서 그 중요성이 더욱 강조된다. 이렇듯 용어 사전의 중요성은 기존의 많은 연구에서도 강조되어 왔으나, 용어 사전이 분석 결과의 품질에 어떤 방식으로 어떤 영향을 미치는지에 대한 엄밀한 분석은 충분히 이루어지지 않았다. 따라서 본 연구에서는 전체 문서에서의 용어 빈도수에 기반을 두어 사전을 구축하는 일괄 구축 방식, 카테고리별 주요 용어를 추출하여 통합하는 용어 통합 방식, 그리고 카테고리별 주요 특질(Feature)을 추출하여 통합하는 특질 통합 방식의 세 가지 방식으로 사전을 구축하고 각 사전의 품질을 비교한다. 품질을 간접적으로 평가하기 위해 각 사전을 적용한 문서 분류의 정확도를 비교하고, 각 사전에 고유율의 개념을 도입하여 정확도의 차이가 나타나는 원인을 심층 분석한다. 본 연구의 실험에서는 5개 카테고리의 뉴스 기사 총 39,800건을 분석하였다. 실험 결과를 심층 분석한 결과 문서 분류의 정확도가 높게 나타나는 사전의 고유율이 높게 나타남을 확인하였으며, 이를 통해 사전의 고유율을 높임으로써 분류의 정확도를 더욱 향상시킬 수 있는 가능성을 발견하였다.

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

적응형 군집화 기반 확장 용이한 협업 필터링 기법 (Scalable Collaborative Filtering Technique based on Adaptive Clustering)

  • 이오준;홍민성;이원진;이재동
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.73-92
    • /
    • 2014
  • 기존 협업 필터링 기법은 사용자들의 아이템에 대한 선호도를 기반으로 유사 아이템 집합 또는 유사 사용자 집합을 구성하고, 이를 이용해 예측된 사용자의 특정 아이템에 대한 선호도를 기반으로 추천을 수행한다. 이로 인해, 사용자 선호도 정보가 부족하게 되면, 유사 아이템 사용자 집합의 신뢰도가 낮아지고, 추천 서비스의 신뢰도 또한 따라서 낮아진다. 또한, 서비스의 규모가 커질수록, 유사 아이템, 사용자 집합의 생성에 걸리는 시간은 기하급수적으로 증가하고 추천서비스의 응답시간 또한 그에 따라 증가하게 된다. 위와 같은 문제점을 해결하기 위해 본 논문에서는 적응형 군집화 기법을 제안하고 이를 적용한 협업 필터링 기법을 제안하고 있다. 이 기법은 크게 네 가지 방법으로 이루어진다. 첫째, 사용자와 아이템의 특성 벡터를 기반으로 사용자와 아이템 각각을 군집화 하여, 기존 협업 필터링 기법에서 유사 아이템, 사용자 집합을 생성하는데 소요되는 시간을 절약하며, 사용자 선호도 정보만을 이용한 부분 집합 생성보다 추천의 신뢰도를 높이고, 초기 평가 문제와 초기 이용자 문제를 일부 해소한다. 둘째, 미리 구성된 사용자와 아이템의 군집을 기반으로 군집간의 선호도를 이용해 추천을 수행한다. 사용자가 속한 군집의 선호도가 높은 순서대로 아이템 군집을 조회하여 사용자에게 제공할 아이템 목록을 구성하여, 추천 시스템의 부하 대부분을 모델 생성 단계에서 부담하고 실제 수행 시 부하를 최소화한다. 셋째, 누락된 사용자 선호도 정보를 사용자와 아이템 군집을 이용하여 예측함으로써 협업 필터링 추천 기법의 사용자 선호도 정보 희박성으로 인한 문제를 해소한다. 넷째, 사용자와 아이템의 특성 벡터를 사용자의 피드백에 따라 학습시켜 아이템과 사용자의 정성적 특성 정량화의 어려움을 해결한다. 본 연구의 검증은 기존에 제안되었던 하이브리드 필터링 기법들과의 성능 비교를 통해 이루어졌으며, 평가 방법으로는 평균 절대 오차와 응답 시간을 이용하였다.

패턴 절개를 응용한 의상의 조형적 형태미의 표현 연구 - 안토니오 가우디 건축 작품 형태를 중심으로 - (Study of Fashion Design Applying the Formative Beauty of Architectural Works by Antoni Gaudi)

  • 신효정;이영민
    • 복식문화연구
    • /
    • 제17권5호
    • /
    • pp.849-865
    • /
    • 2009
  • This research is a study of fashion design that applied formative features of formal beauty of architecture into clothing design; we focused on Gaudi's architectural style as well as Art Nouveau style that became popular from the end of the 19th century to the beginning of the 20th century. We noted that in general the simple and flat features of cloth impose a limitation on the expression of formal features in clothing design, but a unique diversity of designs can be achieved, evoking a sense of freshness by an ideal combination of flat patterns and draping. The aim of this research is to present a possibility of extending the sphere of design expression by creating three-dimensional clothes with pattern-cutting skills and applications of three-dimensional patterns as well as flat patterns found in Gaudi's works of architecture that are distinguished in curvaceousness and formal beauty. As for the research method, we reviewed previous studies by making a close review of books, papers, the pictures and web sites related to this topic. We made our clothes on the basis of this theoretical consideration. We found the following points. First, by presenting a work of fashion inspired by architectural designs, we realized that formal beauty in architect can become a motive for clothing design in a broad scale by noting the formal images, decoration details, and formative features of architectural works. Second, the characteristic lines of Gaudi's architecture are suitable to be adapted for expressing the detailed lines of decoration in clothes. Third, we can express formative beauty in clothes by highlighting the variation of shapes and lines through various attempts of change in background pattern, even though there is a limitation in the availability of cloth material because we must choose pieces of cloth with right texture and thickness that can be cut and sewn appropriately to express formative beauty. Fourth, we confirmed that it was possible to create unique formative designs by a creative application of both flat and three-dimensional cutting.

  • PDF

이종의 공간 데이터 셋에서 매칭 객체 판별을 위한 임계값 산출 (Calculation of a Threshold for Decision of Similar Features in Different Spatial Data Sets)

  • 김지영;허용;유기윤;김정옥
    • 한국측량학회지
    • /
    • 제31권1호
    • /
    • pp.23-28
    • /
    • 2013
  • 이종의 공간 데이터 셋을 매칭하는 과정은 매칭 또는 비 매칭의 이진 클래스로 판별하는 과정과 비슷하다. 이에 이진 클래스의 판별이 중요한 연구주제인 바이오인식 분야에서 임계값을 구하는데 이용되는 동일 오류율을 공간 데이터 셋의 매칭에 적용하여 임계값을 산출하였다. 매칭유무를 판별하는 과정에서 임계값이 계속 바뀌면 매칭으로 판별되는 객체 쌍이 상이해지면서 정확도와 재현율도 바뀌게 되며, 이들 지표 사이에 trade-off가 나타나는 지점이 EER, 즉 임계값이 된다. 동일 오류율 기반의 임계값 산출 방법을 훈련 자료에 적용하여 형상유사도 0.802가 임계값으로 구해졌다. 이를 실험 자료에 적용한 결과, 매칭의 성능을 평가하는 척도인 F-measure가 0.940으로 높게 나타났다. 이를 통하여 동일 오류율을 이용하여 연구자의 개입이 없이 정확한 임계값이 산출되고, 동일 오류율 기반의 임계값 산출이 이종의 공간 데이터 셋 매칭에 적합하다는 것을 알 수 있었다.

만화<손오공>에 나타난 한·중·일 캐릭터디자인 특징 (The differences in character design in China, Japan, and Korea : A can study of comic "The Monkey King")

  • 김강;오치규
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.235-238
    • /
    • 2009
  • 캐릭터는 문화적 콘텐츠이며 이를 시각화하여 자국의 문화를 보여주고 그 문화를 전달하는 매개체적인 잠재력이 점점 커지는 영역이다. 캐릭터들을 살펴보면 고전에 나타난 인물들로 제작된 캐릭터를 많이 찾아 볼 수 있다. 고전은 하나의 국가 혹은 민족의 문화에서 그 원형을 찾아볼 수 있다. 본고에서는 고전신화소설 [서유기]를 모델로 하여 제작된 만화 한국의 [미스터 손(날아라! 슈퍼보드)], 중국의 [大鬧天宮 제천대성 손오공 (제천대성 손오공)], 일본의 [ぼくの孫悟空(나의 손오공)]에 등장하는 손오공캐릭터를 중심으로 한국 중국 일본 캐릭터디자인을 비교 분석하였다. 분석한 결과 한국은 퓨전 적이며 글로벌 적인 경향을 나타내고 있고, 반면 중국은 전통문화에 대한 부각에 치중하고 있으며, 일본은 디테일한 부분에 자신의 전통적인 문화요소를 부여하여 보다 대중적인 수용성을 추구하려는 경향을 보이고 있으며 이는 캐릭터디자인이 각 나라별로 문화와 밀접한 관계가 있음을 시사하고 있다.

  • PDF

A Novel Two-Level Pitch Detection Approach for Speaker Tracking in Robot Control

  • Hejazi, Mahmoud R.;Oh, Han;Kim, Hong-Kook;Ho, Yo-Sung
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.89-92
    • /
    • 2005
  • Using natural speech commands for controlling a human-robot is an interesting topic in the field of robotics. In this paper, our main focus is on the verification of a speaker who gives a command to decide whether he/she is an authorized person for commanding. Among possible dynamic features of natural speech, pitch period is one of the most important ones for characterizing speech signals and it differs usually from person to person. However, current techniques of pitch detection are still not to a desired level of accuracy and robustness. When the signal is noisy or there are multiple pitch streams, the performance of most techniques degrades. In this paper, we propose a two-level approach for pitch detection which in compare with standard pitch detection algorithms, not only increases accuracy, but also makes the performance more robust to noise. In the first level of the proposed approach we discriminate voiced from unvoiced signals based on a neural classifier that utilizes cepstrum sequences of speech as an input feature set. Voiced signals are then further processed in the second level using a modified standard AMDF-based pitch detection algorithm to determine their pitch periods precisely. The experimental results show that the accuracy of the proposed system is better than those of conventional pitch detection algorithms for speech signals in clean and noisy environments.

  • PDF

서울시 공공도서관 강좌교육 운영 현황 및 특징에 관한 분석 (Analysis of Status and Features for Lecture-type Programs of the Public Libraries in Seoul)

  • 이정미
    • 한국비블리아학회지
    • /
    • 제25권3호
    • /
    • pp.119-137
    • /
    • 2014
  • 본 연구의 목적은 서울시 공공도서관에서 기획 운영된 강좌교육의 현황을 살펴보고 그 특징을 알아보고자 하는 것이다. 이를 위해 최근 6년 동안의 서울시 공공도서관 강좌교육 개설 자료를 바탕으로 공공도서관의 강좌교육 현황 및 특징을 살펴보고자 하였으며 주제별, 대상이용자별 변화 추세와 이를 바탕으로 한 특징을 살펴보고자 하였다. 분석결과 서울시 공공도서관의 강좌교육 개설 수는 전반적으로 감소하고 있음을 알 수 있었고 대상 이용자를 명확히 제시한 상태에서 기획 운영되고 있음을 알 수 있었다. 마지막으로 주제별 강좌교육과 문화행사 전반에 대한 특징을 비교 분석하여 결과로 제시하고 강좌교육은 공공도서관의 잠재적 이용자를 도서관과 함께 하게 하는 좋은 기회를 제공할 것이기에 세심한 기획과 운영이 필요하다 결론지었다.

증강현실 게임에서의 동작 기반 상호작용 설계 및 구현 (Design and Implementation of Motion-based Interaction in AR Game)

  • 박종승;전영준
    • 한국게임학회 논문지
    • /
    • 제9권5호
    • /
    • pp.105-115
    • /
    • 2009
  • 본 논문에서는 증강현실 게임에서의 동작 기반 상호작용의 설계 및 구현 기법을 기술한다. 증강현실에서는 상호작용의 도구로 고전적인 입력 장치보다 사용자의 동작에 의존한다. 동작 기반 증강현실 게임은 신체적 움직임에 의한 상호작용을 사용하는 실감 게임의 유망한 분야이나 현재의 동작 인식 기술의 불안정성으로 인해서 증강현실 응용에서 동작 인식 장치를 주 입력 장치로 사용하는 데에는 한계가 있다. 이러한 한계에 대처하기 위해서 각 증강현실 응용들은 여러 보완수단들을 동원하고 있고 이로 인해서 증강현실 게임의 구조가 불규칙적이며 비효율적으로 설계되는 경향이 있다. 본 논문에서는 동작 기반 증강현실 게임의 효율적인 개발 방법론을 제시한다. 실제 탁구채를 사용하는 동작 인터페이스를 가지는 증강현실 탁구게임의 프로토타입을 제시된 방법론에 따라서 설계하고 이를 구현하였다. 구현된 증강현실 게임에서의 상호작용에 있어서 탁구채를 고속으로 인식하고 지연 없이 상호작용 됨을 확인하였다.

  • PDF

동시출현단어분석을 이용한 연관영화정보 분석 연구 (An Analysis of Related Movie Information Using The Co-Word Method)

  • 최상희
    • 정보관리학회지
    • /
    • 제31권4호
    • /
    • pp.161-178
    • /
    • 2014
  • 최근 이용자들이 정보를 공동생산하고 소비하는 웹기반 서비스들이 활발해지면서 이용자가 정보를 이용한 기록이나 이용자가 습득한 정보를 활용하여 생산한 다양한 부가 정보들이 다시 이용자에게 제공되고 있다. 또한 쌍방향으로 이용자들이 소통할 수 있는 정보채널이 다양해짐으로써 공통된 관심사를 가진 이용자의 정보소비 경험을 공유할 수 있는 방법이 활발하게 모색되고 있다. 이 연구에서는 동시출현정보 분석기법과 자아중심 네트워크 분석 기법을 적용하여 IMDB 서비스의 기존 이용자들이 자신이 보고 싶거나 좋아하는 영화를 선별하여 만들어 놓은 영화리스트에 나타난 정보를 토대로 특정 영화를 좋아하는 이용자가 선호할 만한 다른 영화를 찾아낼 수 있도록 연관영화정보를 다각적으로 표현하였다. 한 영화를 기준으로 연관 영화, 감독, 장르로 분석을 한 결과 영화의 테마나 주인공성향과 같은 다양한 자질로도 연관영화가 연결되었고 감독의 경우 영화내용보다는 감독의 인지도에 영향을 받는 것으로 나타났다. 또한 영화는 주제의 복합성이 큰 것으로 나타나 장르가 연관영화정보를 제공하기에 적합하지 않은 것으로 분석되었다.