• 제목/요약/키워드: Data dictionary

검색결과 346건 처리시간 0.028초

토리야마 아키라의 <드래곤볼>에 나타난 운동표현에 관한 선 연구 (A line study on movement expression in Dragonball of Toriyama Akira)

  • 조대호;박경철
    • 만화애니메이션 연구
    • /
    • 통권31호
    • /
    • pp.153-176
    • /
    • 2013
  • 20세기 초 미래주의 화가 중 일부는 2차원 그림에 '속도감'과 '역동성'을 표현하고자 시도하였다. 그림 속 이미지가 움직이는 것처럼 보이도록 하기 위한 속도감과 역동성의 표현은 다양한 시각적 기호로 발전하였다. 이러한 움직임을 나타내는 시각적 기호는 만화에서 중요한 운동표현의 선으로 정착하였다. 세계적으로 인기를 얻은 토리야마 아키라의 <드래곤볼>은 속도감과 역동성이 강조되어 있는 액션장르의 만화로써, 운동표현에 관한 선을 연구하기에 좋은 작품이다. <한국만화영상진흥원>의 용어사전과 <만화 애니메이션 사전>에는 운동표현에 관한 선으로 속도선, 동작선, 효과선의 세 용어가 있지만 문맥적으로 의미가 유사해서 구분해 사용하기에는 쉽지 않은 면이 있다. 본 연구에서는 <드래곤볼>의 운동표현에 관한 선을 연구하기위해 기존의 운동표현에 관한 선의 의미상 문제점을 밝히고 새로운 대안을 제시하고자 하였다. 본 연구에서 운동표현에 관한 선을 기호적인 관점에서 분류하고 쓰임에 맞추어 새롭게 정의하고자 하였으며, 기존의 속도선, 동작선, 효과선에서 잔상선을 추가하여 네 가지 선으로 분류하였다. 첫 번째, 속도선은 '움직이는 대상의 운동표현을 속도성의 개념으로 표현한 선'으로 정의하였다. 표현함에 있어서 속도선이 대상의 형태와 결합했을 때는 직접속도선, 대상의 배경과 결합했을 때는 간접속도선으로 세분하였다. 두 번째, 동작선은 '움직이는 대상의 이동형태나 이동경로를 단순화시킨 선'으로 정의하였다. 세 번째, 효과선은 '움직이는 대상의 운동표현을 감각적 표현 혹은 감정적 표현으로 강조하는 선'으로 정의하였다. 네 번째, 잔상선은 '느리게 움직이거나 흔들리는 대상의 운동표현을 잔상효과로 표현한 선'으로 정의하였다. 본 연구에서 제시한 용어는 <드래곤볼>의 운동표현에 관한 선의 이해를 도울 수 있을 것이다.

한국어 음소 최소대립쌍의 계량언어학적 연구: 초성 자음을 중심으로 (A quantitative study on the minimal pair of Korean phonemes: Focused on syllable-initial consonants)

  • 정지은
    • 말소리와 음성과학
    • /
    • 제11권1호
    • /
    • pp.29-40
    • /
    • 2019
  • 이 연구의 목적은 한국어 음소의 최소대립쌍 출현 양상에 대해 계량언어학적으로 알아보는 것이다. 최소대립쌍은 한 언어에서 음소의 체계를 세우는 데 중요한 역할을 하고, 기능부담량의 측정에도 중요한 척도가 됨에도 불구하고 아직까지 한국어 음소의 최소대립쌍에 대한 전면적인 연구가 이루어지지 않았다. 이를 위해 "우리말샘"의 표제어 325,715개의 발음을 대상으로 초성 위치에서의 자음 최소대립쌍의 개수를 절대수치와 상대수치로 산출하고, 최소대립쌍을 이루는 두 단어의 품사 관계에 대해서 분석했다. "우리말샘"을 연구의 대상으로 삼은 이유는 최소대립쌍 분석은 기본적으로 사전을 통해서 이루어져야 한다고 판단했고, 한국어 사전 중 규모가 가장 크기 때문이다. 연구 결과는 다음과 같다. 첫째, 최소대립쌍은 총 153가지, 337,135개였다. 개수가 많은 음소 쌍(/ㅅ-ㅈ/, /ㄱ-ㅅ/, /ㄱ-ㅈ/, /ㄱ-ㅂ/, /ㄱ-ㅎ/)은 평음의 비중이 높고, 개수가 적은 음소 쌍(/ㅃ-ㅋ/, /ㄹ-ㅃ/, /ㅉ-ㅋ/, /ㄸ-ㅋ/, /ㅆ-ㅋ/)은 경음의 비중이 높았다. 최소대립쌍 형성에 많은 역할을 담당하는 음소를 개별 음소 단위에서 살펴보면 /ㄱ, ㅅ, ㅈ, ㅂ, ㅊ/ 순으로 높게 나타났는데, 경구개음의 비율이 높게 나타난 것이 특징적이었다. 삼지적 상관속을 이루는 장애음의 최소 대립쌍 관계에도 조음 위치와 조음 방법에 따라 차이가 나타났다. 최소대립쌍의 절대수치와 상대수치의 상관계수는 0.937로 높은 상관관계를 보였다. 둘째, 최소대립쌍을 이루는 두 단어의 품사는 '명사-명사'의 최소대립쌍이 70.25%로 가장 많았고, 그다음으로 '동사-동사' 쌍이 14.77%로 나타나 이 두 유형이 전체 85% 이상을 차지했다. 초성 최소대립쌍의 품사 일치율은 87.91%로 나타나 최소대립쌍은 의미 형태적으로도 비슷한 범주로 묶일 수 있음을 확인할 수 있었다. 이 연구의 결과는 한국어 음소와 관련된 기초 자료로서 국어학, 언어 병리학, 언어 교육, 언어 습득, 음성 공학 등의 다양한 응용 분야에서 유용하게 활용될 수 있을 것이다.

문장 분류를 위한 정보 이득 및 유사도에 따른 단어 제거와 선택적 단어 임베딩 방안 (Selective Word Embedding for Sentence Classification by Considering Information Gain and Word Similarity)

  • 이민석;양석우;이홍주
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.105-122
    • /
    • 2019
  • 텍스트 데이터가 특정 범주에 속하는지 판별하는 문장 분류에서, 문장의 특징을 어떻게 표현하고 어떤 특징을 선택할 것인가는 분류기의 성능에 많은 영향을 미친다. 특징 선택의 목적은 차원을 축소하여도 데이터를 잘 설명할 수 있는 방안을 찾아내는 것이다. 다양한 방법이 제시되어 왔으며 Fisher Score나 정보 이득(Information Gain) 알고리즘 등을 통해 특징을 선택 하거나 문맥의 의미와 통사론적 정보를 가지는 Word2Vec 모델로 학습된 단어들을 벡터로 표현하여 차원을 축소하는 방안이 활발하게 연구되었다. 사전에 정의된 단어의 긍정 및 부정 점수에 따라 단어의 임베딩을 수정하는 방법 또한 시도하였다. 본 연구는 문장 분류 문제에 대해 선택적 단어 제거를 수행하고 임베딩을 적용하여 문장 분류 정확도를 향상시키는 방안을 제안한다. 텍스트 데이터에서 정보 이득 값이 낮은 단어들을 제거하고 단어 임베딩을 적용하는 방식과, 정보이득 값이 낮은 단어와 코사인 유사도가 높은 주변 단어를 추가로 선택하여 텍스트 데이터에서 제거하고 단어 임베딩을 재구성하는 방식이다. 본 연구에서 제안하는 방안을 수행함에 있어 데이터는 Amazon.com의 'Kindle' 제품에 대한 고객리뷰, IMDB의 영화리뷰, Yelp의 사용자 리뷰를 사용하였다. Amazon.com의 리뷰 데이터는 유용한 득표수가 5개 이상을 만족하고, 전체 득표 중 유용한 득표의 비율이 70% 이상인 리뷰에 대해 유용한 리뷰라고 판단하였다. Yelp의 경우는 유용한 득표수가 5개 이상인 리뷰 약 75만개 중 10만개를 무작위 추출하였다. 학습에 사용한 딥러닝 모델은 CNN, Attention-Based Bidirectional LSTM을 사용하였고, 단어 임베딩은 Word2Vec과 GloVe를 사용하였다. 단어 제거를 수행하지 않고 Word2Vec 및 GloVe 임베딩을 적용한 경우와 본 연구에서 제안하는 선택적으로 단어 제거를 수행하고 Word2Vec 임베딩을 적용한 경우를 비교하여 통계적 유의성을 검정하였다.

산업군 내 동질성을 고려한 온라인 뉴스 기반 주가예측 (Online news-based stock price forecasting considering homogeneity in the industrial sector)

  • 성노윤;남기환
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.1-19
    • /
    • 2018
  • 주가 예측은 학문적으로나 실용적으로나 중요한 문제이기에, 주가 예측에 관련된 연구가 활발히 진행되었다. 빅 데이터 시대에 도입하면서, 빅 데이터를 결합한 주가 예측 연구도 활발히 진행되고 있다. 다수의 데이터를 기반으로 기계 학습을 이용한 연구가 주를 이룬다. 특히 언론의 효과를 접목한 연구 방법들이 주목을 받고 있는데, 그중 온라인 뉴스를 분석하여 주가 예측에 활용하는 연구가 주를 이루고 있다. 기존 연구들은 온라인 뉴스가 개별 회사에 대한 미치는 영향을 주로 살펴보았다. 또한, 관련성이 높은 기업끼리 서로 영향을 주는 것을 고려하는 방법도 최근에 연구되고 있다. 이는 동질성을 가지는 산업군에 대한 효과를 살펴본 것인데, 기존 연구에서 동질성을 가지는 산업군은 국제 산업 분류 표준에 따른다. 즉, 기존 연구들은 국제 산업 분류 표준으로 나뉜 산업군이 동질성을 가진다는 가정하에서 분석을 시행하였다. 하지만 기존 연구들은 영향력을 가지는 회사를 고려하지 못한 채 예측하였거나 산업군 내에서 이질성이 존재하는 점을 반영하지 못했다는 한계점을 가진다. 본 연구는 산업군 내에 이질성이 존재함을 밝히고, 이질성을 반영하지 못한 기존 연구의 한계점을 K-평균 군집 분석을 적용하여, 주가에 영향을 미치는 산업군의 동질적인 효과를 반영할 수 있는 방법론을 제안하였다. 방법론이 적합하다는 것을 증명하기 위해 3년간의 온라인 뉴스와 주가를 통해 실험한 결과, 다수의 경우에서 본 논문에서 제시한 방법이 좋은 결과를 나타냄을 확인할 수 있었으며, 국제 산업 분류 표준 산업군 내에서 이질성이 클수록 본 논문에서 제시한 방법이 좋은 효과를 보인다는 것을 확인할 수 있었다. 본 연구는 국제 산업 분류 표준으로 나누어진 기업들이 높은 동질성을 가지지 않는 다는것을 밝히고 이를 반영한 예측 모형의 효율성을 입증하였다는 점에서 의의를 가진다.

국방 온톨로지를 통한 지능형 의사결정지원시스템 구축 및 활용 - 공군 군수상황관리체계 적용 사례 (Construction and Application of Intelligent Decision Support System through Defense Ontology - Application example of Air Force Logistics Situation Management System)

  • 조원기;김학진
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.77-97
    • /
    • 2019
  • 제 4차 산업혁명의 초연결 환경에서 발생하는 많은 양의 데이터는 제 4차 산업혁명을 기존의 생산 환경과 구분지어 주는 주요한 요소이다. 이러한 환경은 데이터를 필요로 하는 동시에 데이터를 생산하는 양면적인 특징을 가진다. 때문에 앞으로의 정보 시스템은 기존의 정보시스템보다 양적인 측면에서 더 많은 데이터를 처리해야 하며, 질적인 측면에서는 많은 데이터 중 사용자의 목적에 부합하는 목표 데이터만을 추출하는 능력이 요구된다. 작은 규모의 정보 시스템에서는 사람이 그 시스템을 정확히 이해하고 필요한 정보를 획득하는 것이 가능하지만, 시스템에 대해 정확한 이해가 어려워진 다양하고 복잡한 시스템에서는 원하는 정보를 획득하는 것이 점점 더 어려워진다. 이러한 문제는 데이터를 사람뿐 아니라 컴퓨터가 이해할 수 있는 온톨로지로 표현하여 다양한 정보처리가 가능하도록 하는 시맨틱 웹(Semantic Web) 구축이 해결책이 될 수 있다. 군에서도 현재 대부분의 업무가 정보 시스템을 통해 이루어지고 있는데, 정보의 입력이나 가공 등 단순처리 중심으로 구축된 기존 시스템이 점점 더 많은 양의 데이터를 포함하게 되면서 시스템을 쉽게 활용하기 위한 노력이 필요한 상황이다. 본 연구에서는 온톨로지를 통한 지능형 의사결정지원시스템의 예로 온톨로지 기반 군수상황관리체계를 제안하고자 한다. 온톨로지 기반 군수상황관리체계는 기존의 군수정보체계의 복잡한 정보를 직관적으로 보여주기 위해 구축된 군수상황관리체계를 온톨로지를 통해 구축하였으며, 성과기반군수지원 계약관리, 부품사전 등의 유용한 기능을 추가 식별하여 온톨로지에 포함하였다. 또한 구축된 온톨로지가 의사결정지원에 활용할 수 있는지를 확인하기 위해 시맨틱 웹 기술을 통해 기본적인 질의응답은 물론 추론 및 함수를 통한 분석기능을 구현하였다.

산머루 관련 정보수집 및 데이터베이스의 구축 (Data Mining and Construction of Database Concerning Effects of Vitis Genus)

  • 김민아;조윤주;신지영;신민규;배현수;홍무창;김양석
    • 동의생리병리학회지
    • /
    • 제26권4호
    • /
    • pp.551-556
    • /
    • 2012
  • The database for the oriental medicine had been existed in documentation in past times and it has been developed to the database type for random accesses in the information society. However, the aspects of the database are not so diversified and the database for the bio herbal material exists in widened type dictionary style. It is a situation that the database which handles the in-depth raw herbal medicines is not sufficient in its quantity and quality. Korean wild grape is a deciduous plant categorized into the Vitaceae and it was found experimentally that it has various medical effects. It is one of the medical materials with higher potentiality of academic study and commercialization recently because it has a bigger possibility to be applied into diverse industrial fields including the medical product for health, food and beauty. We constituted the cooperative system among the Muju cluster business group for Korean mountain wild grapes, Physiology Laboratory in Kyung Hee University Oriental Medicine and Medical Classics Laboratory in Kyung Hee University Oriental Medicine with a view to focusing on such potentiality and a database for Korean wild grapes was made a touchstone for establishing the in-depth database for the single bio medical materials. First of all, the literatures based on the North East Asia in ancient times had been categorized into the classical literature (Korean literature published by government organization, Korean classical literature, Chinese classical literature and classical literature fro Korean and Chinese oriental medicine) and modern literature (Modern literature for oriental medicine, modern literature for domestic and foreign herbal medicine) to cover the eastern and western research records and writings related to Korean wild grapes and the text-mining work has been performed through the cooperation system with the Medical Classics Laboratory in Kyung Hee University Oriental Medicine. First of all, the data for the experiment and theory for Korean wild grape were collected for the Medline database controlled by the Parliament Library of USA to arrange the domestic and foreign theses with topic for Korean wild grapes and the network hyperlink function and down load function were mounted for self-thesis searching function and active view based on the collected data. The thesis searching function provides various auxiliary functions and the searching is available according to the diverse searching/queries such as the name of sub species of Korean wild grape, the logical intersection index for the active ingredients, efficacy and elements. It was constituted for the researchers who design the Korean wild grape study to design of easier experiment. In addition, the data related to the patents for Korean wild grape which were collected from European Patent Office in response to the commercialization possibility and the system available for searching and view was established in the same viewpoint. Perl was used for the query programming and MS-SQL for database establishment and management in the designing of this database. Currently, the data is available for free use and the address is as follows. http://163.180.41.43:8011/index.html

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

패스트푸드의 종류 및 특징에 대한 연구 - 대전지역 고등학생을 대상으로 - (A Study on The Kinds and Characteristics of Fast Foods - By Highschool Students in Daejeon -)

  • 배영경;김영남
    • 한국가정과교육학회지
    • /
    • 제28권3호
    • /
    • pp.79-88
    • /
    • 2016
  • 패스트푸드는 간단한 조리를 거쳐 신속히 제공되는 음식으로 정의하고 있는데, 어떤 종류의 음식을 패스트푸드로 분류할 수 있는지, 패스트푸드와 패스트푸드가 아닌 음식을 구분하는 특징은 무엇인지 분명하지 않다. 본 연구는 선행 연구에서 패스트푸드로 제시한 14종 음식을 대상으로 패스트푸드의 인정 여부를 조사하였으며, 패스트푸드 인정 여부를 결정하는 패스트푸드의 특징에 대하여 조사하였다. 남 여 고등학생 306명을 대상으로 설문조사를 실시하였으며, 그 결과를 분석하였다. 조사대상자는 패스트푸드가 맛있고 편리한 음식이지만 영양가가 낮은 음식 즉, 고지방, 저비타민 음식으로 평가하였다. 햄버거, 피자, 프라이드치킨, 라면, 핫도그는 80% 이상의 조사대상자가 패스트푸드로 인정하였으나, 떡볶이, 스파게티, 샌드위치, 김밥, 샐러드의 경우 패스트푸드 인정 비율이 50%에 미치지 못하였다. 패스트푸드의 5가지 특징 중 음식의 패스트푸드 인정 여부를 결정하는 가장 확실한 특징은 건강에 해로운 음식이었고, 가장 불확실한 특징은 신속한 제공과 저렴한 가격으로 조사되었다. 패스트푸드가 흔히 fast, cheap foods로 지칭되지만 조사대상 남 여 고등학생은 패스트푸드를 신속히 제공되는 값싼 음식으로 인식하지 않는다는 것을 확인할 수 있었다.

제한된 한글 입력환경을 위한 음소기반 근사 문자열 검색 시스템 (A Phoneme-based Approximate String Searching System for Restricted Korean Character Input Environments)

  • 윤태진;조환규;정우근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권10호
    • /
    • pp.788-801
    • /
    • 2010
  • 모바일 기기가 발전함에 따라 입력 수단에 대한 연구는 중요한 이슈이다 키패드, 쿼티키패드, 터치, 음성인식 등 다양한 입력장치가 사용되고 있으나 아직 데스크톱 입력장치에 비해 편의성이 떨어져서 입력 시의 오타나 탈자 등의 오류가 포함되는 경우가 많다. 이러한 입력 오류는 문자 메시지 등 사람과의 의사소통에는 문제를 일으키지 않으나 사전, 주소록 등의 데이터베이스 검색에는 치명적인 오류로서 원하는 검색 결과를 얻지 못하게 된다. 특히 한글의 경우 자음과 모음의 조합을 통해 글자를 생성하는 특성상 1만자가 넘는 글자의 조합이 가능하여 영문에 비하여 오류의 빈도가 높다. 기존의 검색 시스템은 Suffix Tree등을 이용하여 입력 오류를 처리하지만 다양한 오류에 대응하기에는 한계가 있다. 본 논문에서는 오자, 탈자 등의 입력 오류를 허용하면서 빠른 검색이 가능한 근사 한글 단어 검색 시스템을 제안하고자 한다. 이 시스템은 기존의 알파벳에 적용된 근사 문자열 검색(Approximate String Searching)을 한글에 효과적으로 적용할 수 있는 여러 가지 알고리즘과 기법이 포함되어 있다. 그리고 제안된 시스템을 이용한 변형 욕설 필터링 시스템의 개발에 대해 이야기하고자 한다. 이 시스템은 유저의 각종 변형 욕설 입력에 대해 90% 이상의 필터링 성능을 보였다.

대용량 분산파일시스템을 위한 비공유 메타데이타 관리 기법 (A Non-Shared Metadata Management Scheme for Large Distributed File Systems)

  • 윤종현;박용훈;이석재;장수민;유재수;김홍연;김영균
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권4호
    • /
    • pp.259-273
    • /
    • 2009
  • 최근 많은 연구가 진행 중인 대부분의 클러스터 기반 분산파일시스템은 파일에 대한 읽기, 쓰기 작업으로부터 메타데이타의 처리를 분리했다는 특징을 가지고 있다. 즉 파일시스템에 기록된 파일에 대한 권한 정보, 파일의 실제 데이타가 저장된 저장소의 위치 정보, 파일시스템의 네임스페이스 유지 등 메타데이타와 관련된 정보 및 이를 처리하는 기능을 별도의 메타데이타 서버가 관리한다. 하지만 기존 시스템의 메타데이타 관리기법들은 데이타의 분산 관리 및 입출력 성능만 중점을 두고 설계되어 있어 파일시스템 확장에 따른 메타데이타 입출력 성능 및 확장성에서 한계를 나타내고 있는 상황이다. 따라서 본 논문에서는 클러스터 기반 분산파일시스템에서 보다 나은 성능과 확장성을 제공하는 수 있는 비공유 메타데이타 관리 기법을 제안한다. 먼저 본 논문에서는 새로운 메타데이터 분할 기법으로 사전식 분할 기법을 제안한다. 다음으로 제안하는 메타데이타 분할 기법을 지원하기 위한 부하 분산 기법을 제시한다. 본 논문에서 제안하는 메타데이타 관리 기법은 기존 메타데이타 관리기법과 비교하여 확장성 및 부하 분산에서 우수함을 보인다.