• 제목/요약/키워드: Knowledge Processing

검색결과 1,488건 처리시간 0.028초

동영상에서 그룹핑(grouping) 단서로 작용하는 움직임(Movement)과 의미구조 형성의 관계 (The relation between Movement working as a Grouping clue in Moving Picture and Semantic structure forming)

  • 이수진
    • 디자인학연구
    • /
    • 제19권5호
    • /
    • pp.119-128
    • /
    • 2006
  • 미디어의 발전과 함께 시각표현은 정지화면에서 동영상으로 그 영역이 확대되었다. 애니메이션 영화, TV CM, GUI 등과 같은 분야는 프레임이 누적된 가현운동 현상이 나타나면서 쇼트, 씬과 같은 단위 구조가 만들어지므로 정지화면에 비해 움직임이 필연적인 조형요소가 된다. 따라서 형태, 색채, 공간, 크기, 움직임과 같은 조형요소 중에서 움직임은 특히 중요한 요소로 부각된다고 볼 수 있다. 소쉬르(Saussure)가 설명한 기표와 기의의 관계처럼 이미지의 표현과 형식은 그 내용과 서로 제약을 주는 반면 상호 보완에 의해 하나의 기호로서 수용된다. 이는 움직임 역시 그 형식적 특성이 메시지가 담고 있는 내용에 어떠한 관여를 할 것이라는 추론을 가능하게 한다. 이를 분석하기 전 먼저 게슈탈트이론 중 '그룹핑의 원리'를 이론적 근거로 하여 동영상 시지각 실험을 실시하여 움직임과 타 조형요소의 관계를 조사하였다. 그 결과 약 70-80%의 피실험자가 '움직임'을 지각 상 중요한 그룹핑 단서로 생각하는 것으로 나타났다. 이러한 형식적 특성을 토대로 동영상의 구조를 분석했을 때 움직임은 커뮤니케이션 과정에서 메시지의 의미의 맥락을 유지하는데 영향을 준다. 사람이나 사물, 배경의 형태와 색 등이 변하더라도 움직임이 유사한 지향점을 가지면 그 대상의 정체성은 유지될 수 있다. 둘째, 움직임에 의해 형상(figure)으로서 대상이 부각되므로 내용의 명료성을 높여준다. 셋째 추후 정보처리에 있어서 유사한 움직임의 진행을 예측할 수 있는 지식표상으로 작용하게 된다. 넷째, 교차편집과 같이 둘 이상의 씬이 빠르게 전환되고 복잡한 편집구조를 가지더라도 움직임이 내용에 일관성을 부여하는 성격을 갖는다. 움직임은 기본적인 시지각적 반응으로서 입력되는 시각정보를 그룹화시키는 하나의 단서가 된다. 또한 영상 메시지의 구조적인 틀을 형성하는데 관계하여 자칫 현란하고 남용될 수 있는 시각적 표현에 질서를 부여하고 의미 작용에 명료함을 높이는 효율성을 가진다. 동영상은 본질적으로 시간성을 내포하므로 다수의 단위 구조가 조합된 담화를 가지며, 미디어믹스 환경에 의해 공통적이면서도 차별화된 표현이 요구되고 있다. 따라서 본 연구는 게슈탈트 이론의 그룹핑 원리를 동영상 범주로 확대하여 적용해 봄으로써 움직임이 다른 조형요소보다 부각되는 속성이 됨과 의미구조 형성에 영향을 줌을 분석하였으며, 이는 미디어 특성에 따라 각 영상분야에서 구조적 조형미와 새로운 영상표현을 개발하는 관점이 될 수 있음을 제안한다.

  • PDF

한국표준산업분류를 기준으로 한 문서의 자동 분류 모델에 관한 연구 (A Study on Automatic Classification Model of Documents Based on Korean Standard Industrial Classification)

  • 이재성;전승표;유형선
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.221-241
    • /
    • 2018
  • 지식사회에 들어서며 새로운 형태의 자본으로서 정보의 중요성이 강조되고 있다. 그리고 기하급수적으로 생산되는 디지털 정보의 효율적 관리를 위해 정보 분류의 중요성도 증가하고 있다. 본 연구에서는 기업의 기술사업화 의사결정에 도움이 될 수 있는 맞춤형 정보를 자동으로 분류하여 제공하기 위하여, 기업의 사업 성격을 나타내는 한국표준산업분류(이하 'KSIC')를 기준으로 정보를 분류하는 방법을 제안하였다. 정보 혹은 문서의 분류 방법은 대체로 기계학습을 기반으로 연구되어 왔으나 KSIC를 기준으로 분류된 충분한 학습데이터가 없어, 본 연구에서는 문서간 유사도를 계산하는 방식을 적용하였다. 구체적으로 KSIC 각 코드별 설명문을 수집하고 벡터 공간 모델을 이용하여 분류 대상 문서와의 유사도를 계산하여 가장 적합한 KSIC 코드를 제시하는 방법과 모델을 제시하였다. 그리고 IPC 데이터를 수집한 후 KSIC를 기준으로 분류하고, 이를 특허청에서 제공하는 KSIC-IPC 연계표와 비교함으로써 본 방법론을 검증하였다. 검증 결과 TF-IDF 계산식의 일종인 LT 방식을 적용하였을 때 가장 높은 일치도를 보였는데, IPC 설명문에 대해 1순위 매칭 KSIC의 일치도는 53%, 5순위까지의 누적 일치도는 76%를 보였다. 이를 통해 보다 정량적이고 객관적으로 중소기업이 필요로 할 기술, 산업, 시장정보에 대한 KSIC 분류 작업이 가능하다는 점을 확인할 수 있었다. 또한 이종 분류체계 간 연계표를 작성함에 있어서도 본 연구에서 제공하는 방법과 결과물이 전문가의 정성적 판단에 도움이 될 기초 자료로 활용될 수 있을 것으로 판단된다.

내경(內徑) 운기편(運氣篇)의 표(標).본(本).중(中) 개념에 대한 연구(硏究) (A study of conception of pyo(標).bon(本).joong(中) in the part of woongihak(運氣學) in negeong(內徑))

  • 백유상;박찬국
    • 대한한의학원전학회지
    • /
    • 제11권2호
    • /
    • pp.114-134
    • /
    • 1998
  • The conception of pyo(標) bon(本) joong(中) in the part of woongihak(運氣學) of negeong(內徑) one of the important thing that decides the relation between six gi(六氣) and samyum and samyang(三陰三陽) or between each other's of samyum and samyang itself, it says that the relation of Pyo-rce(表裏). So this conception from the ancient times have been used to explain the theory of meridian(經絡) and organs(五臟六腑) and in other important field of oriental medicine - Sanghannon(傷寒論), it became basis of explanation of pcthoiogical principles in the system of six kyung(六徑). At first, the subject or this study is limited to the rament of $\ll$Somun(素問)$\gg$ in order to find the accurate and original meanings of pyo(標) bon(本) joong(中). And the meanings are studied by the way of expanding it's meaning with basic conceptions of woongihak(運氣學) and astronomy included in negeong(內徑). In this study, the results are summarized as the followings. 1. The contents of - the 68th chapter of negeong(內徑), concerning pyo(標) and joong(中) come under chogi(初氣) and joonggi(中氣) of the same chapter, after consideration of astronomical knowledge. And they become active during the period that last about 30days, a haft of one step(一步) of kaekgi(客氣). 2. Bon(本) as a kind of six gi(六氣) that is revealed from internal principle of something, that is to say Ohhaeng(五行), comes mainly under the kaekgi(客氣) of woongihak(運氣學) with the meaning of 'sign' is thai the specific properties of six gi(六氣) are revealed to our sight, so we can feel that through the change of nature, Joong(中) is the other property hidden in the inside of six gi(六氣), that is a portion of original nature(本性) like the bon(本). 3. The relation of pyo(標) and bon(本) is like that bctween the principle hidden inside in all things(理) and it's expression into the real world(氣) also similar to thai of yumyang(陰陽) and ohhaeng(五行). Therefore bon(本), though it means one of the six gi(六氣), hale the property of ohhaeng(五行) and pyo(標) is revealed, with an appearance of samyum-samyang(三陰三陰). 4. pyo(標) and joong(中) are also the both sides of yum(陰) and yang(陰) that revealed under the change of yumyang-ohhaengl(陰陽五行) in the nature. For example, if the one is yang(陰), the other is yum(陰). In the process that the change of all things is revealed out, first the property of pyo(標) appears strongly and then that of joong(中) appears comparatively weakly. But, in spite of the inhibitive relation of yumyang(陰陽), pyo(標) and joong(中) promote each other. 5. Under the course of change. It happens according to the bon(本), the property of ohhaeng(五行) in the case of soyang(少陽) and taeyum(太陰), because the effect of moisture(濕) and fire(火) that makes hyung(形) and gi(氣) is very strong in the universe. In the case of taeyang(太陽) and soyum(少陰), it happens according to the bon(本) and pyo(標) because they hare the polarity of water and fire(火水), at the same time, are not separated each other. In the case of yangmeong(陽明) and gualyum(厥陰), the change appears only according to the joong(中), but not strongly because the phase of yangmeong(陽明) and gualyum(厥陰) is a lull phase processing to the next one.

  • PDF

데이터 마이닝의 범죄수사 적용 가능성 (Usefulness of Data Mining in Criminal Investigation)

  • 김준우;손중권;이상한
    • 대한수사과학회지
    • /
    • 제1권2호
    • /
    • pp.5-19
    • /
    • 2006
  • 데이터 마이닝은 컴퓨터와 정보처리의 발전으로 각기 다른 차원에서 다량으로 수집되는 데이터 속에서 숨은 의미나 패턴을 발견하는 유용한 기법이다. 의사결정나무, 신경망 모형, 규칙 귀납, K-평균 군집화, 시각화 등의 데이터 마이닝 개별 기법들은 산재해 있는 데이터에서 연관성을 분석하고, 이를 분류함으로써 일반화된 개념을 정의하고, 새로운 지식을 추론함으로써 실제 생활에 적용 가능한 예측을 가능하게 한다. 따라서 현재 데이터 마이닝은 기업의 마케팅 분야, 금융기관의 고객 분석, 통신 회사의 고객 이탈 방지 등에서 유용하게 활용되고 있다. 우리가 접해야 하는 정보의 양이 늘어나는 것은 범죄 수사에 있어서도 마찬가지 현상이다. 범죄와 범죄자에 대한 데이터는 축적되어 가지만 정작 개별 사안에 있어서는 중요한 데이터가 접근조차 되지 않고 있으며, 많은 데이터 속에서 이것이 내포하고 있는 숨은 의미를 지나치게 되는 경우도 많다. 본 연구에서는 선행 연구와 사례 적용을 통해 데이터 마이닝의 범죄 수사 적용 가능성과 한계점을 살펴보고자 하였다. 미제 사건으로 남는 경우가 많은 절도나 사기 같은 습관적 상습 범죄의 경우 데이터 마이닝의 분류, 군집화 기능을 활용 한다면 향후 여죄 추적에 효율적으로 활용될 수 있음을 파악할 수 있었고, 특히 다양한 문제에 적용 가능하고, 잡음에 대한 견고성이 있음에도 예측의 정확성을 지니고 있는 신경망 모형의 경우 패턴 인식을 통하여 범죄자 프로파일링이나 화상 자료 대비 시스템 구축에 충분히 활용될 것으로 생각한다. 특히 보험 사기 사례 적용에서 살펴본 바와 같이 마약, 테러와 같은 조직적 범죄수사나 자금세탁과 같은 금융 추적 수사의 경우 해당 자료의 방대함과 모호성으로 인해 수사를 하는 데 많은 어려움이 있지만 이러한 데이터 마이닝 가시화 기법을 적절히 활용한다면 전체적인 윤곽을 파악하는 데 매우 유용하며, 효율적인 수사가 가능함을 확인할 수 있었다. 그러나 데이터 마이닝은 예측 모델이므로 오류를 내재하고 있다는 점에서 수사 기관의 데이터 마이닝 접근은 조심스러워야 하며, 정보 독점화 현상과 개인 사생활 보호라는 측면에서 각 수사기관은 해당 법률에 정한 범위 내에서 해당 사건별로 데이터를 수집하고 이를 통합, 재구성하여 활용하는 측면으로 적용되어야 할 것이다. 또한 각 수사기관별로는 자신의 보유하고 있는 데이터에 대해 다차원 처리가 가능하도록 데이터베이스 시스템을 구축하여 데이터 마이닝이 적용 가능한 환경을 구축하도록 하여야 할 것이다. 아직은 논의의 초기 단계이므로 효과가 크게 부각되지는 않았지만 지금까지 제시한 문제에 대한 연구가 계속 이루어진다면 인권중심, 증거중심의 수사 개념을 바탕으로 적법절차에 의한 수사 활동을 요구받는 시대에 새로운 대안으로 자리 잡을 것이며, 수사의 과학화에 기여할 것으로 전망한다.

  • PDF

밀 품질평가 현황과 검사제도 (Current Wheat Quality Criteria and Inspection Systems of Major Wheat Producing Countries)

  • 이춘기;남중현;강문석;구본철;김재철;박광근;박문웅;김용호
    • 한국작물학회지
    • /
    • 제47권
    • /
    • pp.63-94
    • /
    • 2002
  • On the purpose to suggest an advanced scheme in assessing the domestic wheat quality, this paper reviewed the inspection systems of wheat in major wheat producing countries as well as the quality criteria which are being used in wheat grading and classification. Most wheat producing countries are adopting both classifications of class and grade to provide an objective evaluation and an official certification to their wheat. There are two main purposes in the wheat classification. The first objectives of classification is to match the wheat with market requirements to maximize market opportunities and returns to growers. The second is to ensure that payments to glowers aye made on the basis of the quality and condition of the grain delivered. Wheat classes has been assigned based on the combination of cultivation area, seed-coat color, kernel and varietal characteristics that are distinctive. Most reputable wheat marketers also employ a similar approach, whereby varieties of a particular type are grouped together, designed by seed coat colour, grain hardness, physical dough properties, and sometimes more precise specification such as starch quality, all of which are genetically inherited characteristics. This classification in simplistic terms is the categorization of a wheat variety into a commercial type or style of wheat that is recognizable for its end use capabilities. All varieties registered in a class are required to have a similar end-use performance that the shipment be consistent in processing quality, cargo to cargo and year to year, Grain inspectors have historically determined wheat classes according to visual kernel characteristics associated with traditional wheat varieties. As well, any new wheat variety must not conflict with the visual distinguishability rule that is used to separate wheats of different classes. Some varieties may possess characteristics of two or more classes. Therefore, knowledge of distinct varietal characteristics is necessary in making class determinations. The grading system sets maximum tolerance levels for a range of characteristics that ensure functionality and freedom from deleterious factors. Tests for the grading of wheat include such factors as plumpness, soundness, cleanliness, purity of type and general condition. Plumpness is measured by test weight. Soundness is indicated by the absence or presence of musty, sour or commercially objectionable foreign odors and by the percentage of damaged kernels that ave present in the wheat. Cleanliness is measured by determining the presence of foreign material after dockage has been removed. Purity of class is measured by classification of wheats in the test sample and by limitation for admixtures of different classes of wheat. Moisture does not influence the numerical grade. However, it is determined on all shipments and reported on the official certificate. U.S. wheat is divided into eight classes based on color, kernel Hardness and varietal characteristics. The classes are Durum, Hard Red Spring, Hard Red Winter, Soft Red Winter, Hard White, soft White, Unclassed and Mixed. Among them, Hard Red Spring wheat, Durum wheat, and Soft White wheat are further divided into three subclasses, respectively. Each class or subclass is divided into five U.S. numerical grades and U.S. Sample grade. Special grades are provided to emphasize special qualities or conditions affecting the value of wheat and are added to and made a part of the grade designation. Canadian wheat is also divided into fourteen classes based on cultivation area, color, kernel hardness and varietal characteristics. The classes have 2-5 numerical grades, a feed grade and sample grades depending on class and grading tolerance. The Canadian grading system is based mainly on visual evaluation, and it works based on the kernel visual distinguishability concept. The Australian wheat is classified based on geographical and quality differentiation. The wheat grown in Australia is predominantly white grained. There are commonly up to 20 different segregations of wheat in a given season. Each variety grown is assigned a category and a growing areas. The state governments in Australia, in cooperation with the Australian Wheat Board(AWB), issue receival standards and dockage schedules annually that list grade specifications and tolerances for Australian wheat. AWB is managing "Golden Rewards" which is designed to provide pricing accuracy and market signals for Australia's grain growers. Continuous payment scales for protein content from 6 to 16% and screenings levels from 0 to 10% based on varietal classification are presented by the Golden Rewards, and the active payment scales and prices can change with market movements.movements.

주의집중 피로회복이론의 장으로 본 경주 옥산서원 강학 및 유식공간의 일원적 공간성 (A Study on the Coexistance of Ganghak(講學) and Yusik(遊息) space of Oksan Confucian Academy, Gyeongju: Directed Attention Restoration Theory Perspectives)

  • 탁영란;성종상;최종희;김순애;노재현
    • 한국전통조경학회지
    • /
    • 제34권3호
    • /
    • pp.50-66
    • /
    • 2016
  • 조선 중기 대표적 서원중의 하나인 옥산서원을 사례대상으로, Kaplan의 "주의집중회복이론 틀"을 적용시켜, 서원의 기호학적 의미체계로서의 강학과 유식공간 상호 간의 보완적 특성을 파악함으로써 전통조경의 함축적 의미 도출과 경관해석의 지평을 넓히고, 현대적 학교 공간계획과 조경설계에 일조할 수 있는 논거를 구축하고자 한 본 연구의 결론은 다음과 같다. 옥산서원의 강학과 유식공간의 공간과 경관의 일원성을 통해 주의집중과 회복, 자연과의 합일 그리고 심성론과 수양론을 관통하는 성리미학적 속성이 확인되었다. 이는 정보처리과정을 위한 주의집중을 효과적으로 재개하는 회복적 공간특질로 설명할 수 있다. 옥산서원과 그 주변 환경은 입지와 공간구성, 공간포치 그리고 당호 등을 통한 기호체계의 일부로서, 강학과 유식공간의 일원성을 설명하는 유기체적 환경이며 이는 주의집중으로 부터의 네 가지 회복적 환경요소과 결부되어 나타난다. 즉 자연완상은 강학의 연장인 유식을 통해 강학의 궁구함을 가져오는 체험을 넓히게 한다. 요컨대 '공부'와 '쉼'의 과정은 완물적정을 통해 존재의 의미를 발견하고 인간의 심성을 수양하며 도덕을 체득하게 유도되고 있다. 옥산서원은 입지적으로 읍치로 부터 일정 거리를 두고 떨어진 '벗어남'과 서원의 조망경관과 공간 포치를 이용한 영역 간의 일체감을 통한 '확장감'이 부상되며, 폐쇄성 강한 서원내부에서 자연 우월적 외부공간으로 이르는 다양한 출구 또한 자연으로의 확장을 돕고 있다. 뿐만 아니라 옥산서원에서는 강학과 유식의 호환 및 양립성을 통해 본 '부합성' 등에 기반한 서비스스케이프가 잘 드러난다. 회복관경의 극점은 학문적 존양자인 회재의 자연 유상공간인 사산오대 및 옥산구곡과 관련된 경물 체험을 통해 환기되는 '매혹감'에서 더욱 여실히 나타난다. 이는 강학과 유식이라는 서로 다른 기능공간을 일원적으로 통합하는 내적 질서이자 중요한 회복환경의 가치임을 일깨운다. 특히 옥산서원 주변에 펼쳐져, 회재로부터 정의되고 의미를 부여 받은 사산오대는 성리학적 인식론의 관점에서 자연의 숭고미와 격물치지를 이해하는 매우 유효한 학습환경일 뿐 아니라 주의집중능력을 강화시킬 수 있는 서비스스케이프로써, 최적화한 회복환경이 되고 있음을 실증적으로 보여주었다.

휴리스틱 함수를 이용한 feature selection에 관한 연구 (Research about feature selection that use heuristic function)

  • 홍석미;정경숙;정태충
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.281-286
    • /
    • 2003
  • 실생활에서 해결하고자 하는 문제에 대해 수많은 feature들이 수집되어지나 그 feature들을 모두 문제 해결에 활용하는 것은 어렵다. 모든 feature들에 대한 정확한 자료의 수집이 어려우며 관련된 feature들을 모두 학습에 이용할 경우 복잡한 학습 모델이 생성되어지며 좋은 수행 결과도 얻을 수 없다. 또한 수집된 자료들 간에는 상호 관계나 계층적 관계가 존재하는데, 경험적 지식이나 통계적 방법을 이용하여 feature들간의 관계를 분석함으로써 feature의 수를 줄일 수 있다. 휴리스틱 기법은 반복적인 시행 착오와 경험을 통한 학습으로써 미래가 불확실하고 완전한 정보를 갖고 있지 못할 때, 인간의 사고 기능을 통하여 기억이나 경험을 살려, 스스로 해결방안을 모색하면서 점차로 해에 접근해 가는 방법이다. 전문가들은 경험에 의한 의견 수렴 과정을 거쳐 해당 문제 영역에 접근 가능하며, 이러한 특성을 학습에 사용될 feature의 수를 줄이는데 활용할 수 있다. 전문가들은 원시 자료들을 이용하여 새로운 feature들을 생성할 수 있다 새로이 산출된 feature들과 원시 데이터 내의 feature들을 혼합하여 학습 모델 생성에 이용한다. 본 논문에서는 휴리스틱 함수를 이용하여 학습에 사용될 feature의 수를 줄이고, 추출된 feature들을 신경망의 입력값으로 사용하는 기계 학습 모델을 제시한다. 모델의 성능 평가를 위해 프로야구 경기의 승패 예측 문제를 이용하였다. 실험 결과는 신경 회로망과 휴리스틱 모델을 단독으로 사용했을 때 보다 두 기법을 혼합한 모델이 신경 회로망의 복잡성을 감소시킬 뿐 아니라 분류(classification)의 정확성이 향상되었다.아니라 Hep G2 세포에서도 명백히 단백질의 발현을 관찰할 수 있었다. 또한, Hep G2와 COS세포 모두에서 endogenous RXR의 발현이 일어남을 확인하였고 RXR expression plasmid를 transfection시켰을 때 두 세포 모두에서 단백질의 발현이 현저하게 증가되었다. Constitutive Androstane Receptor (CAR)에 의한 CYP2B의 PBRU 활성효과를 다르게 분화된 세포에서 차이가 일어나는지를 비교하기 위하여 CAR에 의해 매개되는 PBRU의 transactivation효과를 Hep G2와 COS세포에서 조사하였다. Hep G2 세포에서는 transfection된 CAR의 발현에 의해 firefly luciferase 보고단백질의 활성이 약 12배 증가하였다. CAR 발현유전자를 15 ng transfection하였을 때 주어진 보고유전자의 양에 대하여 최대반응을 나타내었고 CYP2B1PBRU가 제거된 CYP2C1 promotor/firefly luciferase를 보고유전자로 사용하였을 때는 CAR에 의한 luciferase의 활성이 나타나지 않았다. Hep G2와는 달리, COS세포에서는 transfection된 CAR의 발현이 PBRU에 의한 firefly luciferase보고단백질의 발현에 영향을 주지 못하였다. 이러한 결과들은 분화된 세포의 종류에 따라서 constitutive androstane receptor의 CYP2BPBRU 활성효과가 다르게 나타날 수 있음을 제시할 뿐만 아니라, 간세포에서 Phenobarbital에 의한 PBRU의 활성유도에 영향을 주는 endogenous 매개 인자들 중 CAR와 RXR과는 다

정규화 변환을 지원하는 스트리밍 시계열 매칭 알고리즘 (An Efficient Algorithm for Streaming Time-Series Matching that Supports Normalization Transform)

  • 노웅기;문양세;김영국
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권6호
    • /
    • pp.600-619
    • /
    • 2006
  • 최근에 센서 및 모바일 장비들의 발전으로 인하여 이러한 장비들로부터 생성된 대량의 데이터 스트림(data stream)의 처리가 중요한 연구 과제가 되고 있다. 데이타 스트림 중에서 연속되는 시점에 얻어진 실수 값들의 스트림을 스트리밍 시계열(streaming time-series)이라 한다. 스트리밍 시계열에 대한 유사성 매칭은 여러 가지 고유 특성에 의하여 기존의 시계열 데이타와는 다르게 처리되어야 한다. 본 논문에서는 정규화 변환(normalization transform)을 지원하는 스트리밍 시계열 매칭 문제를 해결하기 위한 효율적인 알고리즘을 제안한다. 기존에는 스트리밍 시계열을 아무런 변환 없이 비교하였으나, 본 논문에서는 정규화 변환된 스트리밍 시계열을 비교한다. 정규화 변환은 절대적인 값은 달라도 유사한 변동 경향을 가지는 시계열 데이타를 찾기 위하여 유용하다. 본 논문의 공헌은 다음과 같다. (1) 기존의 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘[4]에서 제시된 정리(theorem)를 이용하여 정규화 변환을 지원하는 스트리밍 시계열 매칭 문제를 풀기 위한 간단한 알고리즘을 제안한다. (2) 검색 성능을 향상시키기 위하여 간단한 알고리즘을 $k\;({\geq}\;1)$ 개의 인덱스를 이용하는 알고리즘으로 확장한다. (3) 주어진 k에 대하여, 확장된 알고리즘의 검색 성능을 최대화하기 위해 k 개의 인덱스를 생성할 최적의 윈도우 길이를 선택하기 위한 근사 방법(approximation)을 제시한다. (4) 스트리밍 시계열의 연속성(continuity) 개념[8]에 기반하여, 현재 시점 $t_0$에서의 스트리밍 서브시퀀스에 대한 검색과 동시에 미래 시점 $(t_0+m-1)\;(m\geq1)$까지의 검색 결과를 한번의 인덱스 검색으로 구할 수 있도록 재차 확장한 알고리즘을 제안한다. (5) 일련의 실험을 통하여 본 논문에서 제안된 알고리즘들 간의 성능을 비교하고, k 및 m 값의 변화에 따라 제안된 알고리즘들의 검색 성능 변화를 보인다. 본 논문에서 제시한 정규화 변환 스트리밍 시계열 매칭 문제에 대한 연구는 이전에 수행된 적이 없으므로 순차 검색(sequential scan) 알고리즘과 성능을 비교한다. 실험결과, 제안된 알고리즘은 순차 검색에 비하여 최대 13.2배까지 성능이 향상되었으며, 인덱스의 개수 k가 증가함에 따라 검색 성능도 함께 증가하였다.

국내 실정에 적합한 스마트팜 개발 전략 -6차산업의 발전을 위한 ICT 기술적 특성을 중심으로- (Smart farm development strategy suitable for domestic situation -Focusing on ICT technical characteristics for the development of the industry6.0-)

  • 한상호;주형근
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.147-157
    • /
    • 2022
  • 본 연구는 국내 사정에 적합한 스마트팜 기술 전략을 ICT 기술의 국내 사정에 적합한 차별화를 중심으로 제안하고자 했다. 해외 농산업 선진국의 경우 각 나라의 지형적 특성, 농산업 특성, 국민 수요 특성 등을 전반적으로 반영한 특정 단계 개발에 주력함을 확인했으나, 국내 스마트팜의 경우 해외 기술을 여과 없이 수용하여 국내사정에 적합한 기술의 선별적 개발이 수행되지 않음을 확인했다. 따라서, 본 연구는 국내 농촌 인구의 급격한 감소, 인구 고령화, 농작물 가격 경쟁력 상실, 휴경지 증가, 경지 이용률 감소 등 문제에 따라, 차후 스마트팜 ICT 기술 개발 방향성을 품질 좋은 농산물을 창출하여 가격 경쟁력을 갖추기 위한 성능의 우수함, 노동인구 고령화에 따른 사용의 용이성, 영세한 경영규모에 적합한 경제성 등에 주목하여 스마트팜을 추진해야 함을 제시했다. 첫째, 경제성 차원에서 영세농가(1차) 경영환경에 필요한 기능들만 선별하여 ICT 기술을 구성하고, 이들과 원활한 의사소통 체계를 ICT 기술에 적용하여 실제 농가에서 필요로 하는 기능을 점차적으로 업데이트함으로써 비용 감소에 일조할 수 있음을 제안했다. 둘째, 성능차원에 있어서는 국내 고령화 인구에 적합한 빅데이터 난이도 조절, 이들에게 적합한 언어사용, 이들의 예측 성향을 반영한 알고리즘 설정 등 ICT의 의사소통 기능 개선에 주목한다면 작동 정확성을 증대할 수 있음을 제안했다. 셋째, 사용용이성 차원이다. 6차산업(1차(농업,임업)+2차(농수산물가공)+3차(서비스,농어촌체험,유통)) 발전을 위한 ICT 기술에 기반한 스마트팜은 특정 명령어에 따라 동작을 수행하는 바, 특정 명령에 빅데이터에 근거한 추론을 통한 추가적 기능들이 자동적으로 수반될 것과, 각 지역적 환경에 맞춤화된 빅데이터 구성에 기반한 장치를 미리 세팅, 표준화하여 사용용이성을 촉진할 수 있음을 최종 제시했다.

KB-BERT: 금융 특화 한국어 사전학습 언어모델과 그 응용 (KB-BERT: Training and Application of Korean Pre-trained Language Model in Financial Domain)

  • 김동규;이동욱;박장원;오성우;권성준;이인용;최동원
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.191-206
    • /
    • 2022
  • 대량의 말뭉치를 비지도 방식으로 학습하여 자연어 지식을 획득할 수 있는 사전학습 언어모델(Pre-trained Language Model)은 최근 자연어 처리 모델 개발에 있어 매우 일반적인 요소이다. 하지만, 여타 기계학습 방식의 성격과 동일하게 사전학습 언어모델 또한 학습 단계에 사용된 자연어 말뭉치의 특성으로부터 영향을 받으며, 이후 사전학습 언어모델이 실제 활용되는 응용단계 태스크(Downstream task)가 적용되는 도메인에 따라 최종 모델 성능에서 큰 차이를 보인다. 이와 같은 이유로, 법률, 의료 등 다양한 분야에서 사전학습 언어모델을 최적화된 방식으로 활용하기 위해 각 도메인에 특화된 사전학습 언어모델을 학습시킬 수 있는 방법론에 관한 연구가 매우 중요한 방향으로 대두되고 있다. 본 연구에서는 금융(Finance) 도메인에서 다양한 자연어 처리 기반 서비스 개발에 활용될 수 있는 금융 특화 사전학습 언어모델의 학습 과정 및 그 응용 방식에 대해 논한다. 금융 도메인 지식을 보유한 언어모델의 사전학습을 위해 경제 뉴스, 금융 상품 설명서 등으로 구성된 금융 특화 말뭉치가 사용되었으며, 학습된 언어 모델의 금융 지식을 정량적으로 평가하기 위해 토픽 분류, 감성 분류, 질의 응답의 세 종류 자연어 처리 데이터셋에서의 모델 성능을 측정하였다. 금융 도메인 말뭉치를 기반으로 사전 학습된 KB-BERT는 KoELECTRA, KLUE-RoBERTa 등 State-of-the-art 한국어 사전학습 언어 모델과 비교하여 일반적인 언어 지식을 요구하는 범용 벤치마크 데이터셋에서 견줄 만한 성능을 보였으며, 문제 해결에 있어 금융 관련 지식을 요구하는 금융 특화 데이터셋에서는 비교대상 모델을 뛰어넘는 성능을 보였다.