• Title/Summary/Keyword: 반영도

검색결과 20,436건 처리시간 0.05초

Bi-LSTM 기반의 한국어 감성사전 구축 방안 (KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon)

  • 박상민;나철원;최민성;이다희;온병원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.219-240
    • /
    • 2018
  • 감성사전은 감성 어휘에 대한 사전으로 감성 분석(Sentiment Analysis)을 위한 기초 자료로 활용된다. 이와 같은 감성사전을 구성하는 감성 어휘는 특정 도메인에 따라 감성의 종류나 정도가 달라질 수 있다. 예를 들면, '슬프다'라는 감성 어휘는 일반적으로 부정의 의미를 나타내지만 영화 도메인에 적용되었을 경우 부정의 의미를 나타내지 않는다. 그렇기 때문에 정확한 감성 분석을 수행하기 위해서는 특정 도메인에 알맞은 감성사전을 구축하는 것이 중요하다. 최근 특정 도메인에 알맞은 감성사전을 구축하기 위해 범용 감성 사전인 오픈한글, SentiWordNet 등을 활용한 연구가 진행되어 왔으나 오픈한글은 현재 서비스가 종료되어 활용이 불가능하며, SentiWordNet은 번역 간에 한국 감성 어휘들의 특징이 잘 반영되지 않는다는 문제점으로 인해 특정 도메인의 감성사전 구축을 위한 기초 자료로써 제약이 존재한다. 이 논문에서는 기존의 범용 감성사전의 문제점을 해결하기 위해 한국어 기반의 새로운 범용 감성사전을 구축하고 이를 KNU 한국어 감성사전이라 명명한다. KNU 한국어 감성사전은 표준국어대사전의 뜻풀이의 감성을 Bi-LSTM을 활용하여 89.45%의 정확도로 분류하였으며 긍정으로 분류된 뜻풀이에서는 긍정에 대한 감성 어휘를, 부정으로 분류된 뜻풀이에서는 부정에 대한 감성 어휘를 1-gram, 2-gram, 어구 그리고 문형 등 다양한 형태로 추출한다. 또한 다양한 외부 소스(SentiWordNet, SenticNet, 감정동사, 감성사전0603)를 활용하여 감성 어휘를 확장하였으며 온라인 텍스트 데이터에서 사용되는 신조어, 이모티콘에 대한 감성 어휘도 포함하고 있다. 이 논문에서 구축한 KNU 한국어 감성사전은 특정 도메인에 영향을 받지 않는 14,843개의 감성 어휘로 구성되어 있으며 특정 도메인에 대한 감성사전을 효율적이고 빠르게 구축하기 위한 기초 자료로 활용될 수 있다. 또한 딥러닝의 성능을 높이기 위한 입력 자질로써 활용될 수 있으며, 기본적인 감성 분석의 수행이나 기계 학습을 위한 대량의 학습 데이터 세트를 빠르게 구축에 활용될 수 있다.

조선시대 재발급(再發給) 공신교서(功臣敎書) 양식 연구 (A Style Study for Reissued Gongsin-Gyoseo in Joseon Dynasty)

  • 심영환;이진희
    • 헤리티지:역사와 과학
    • /
    • 제47권2호
    • /
    • pp.4-19
    • /
    • 2014
  • 조선시대 공신교서는 국가의 특정한 사건에 공을 세운 공신을 포상하기 위하여 발급하였다. 공신으로 녹훈(錄勳)된 가문에서는 이 공신교서를 가보(家寶)로서 후대에 전승하였다. 그러나 이 과정에서 전란 등의 피치 못할 상황 속에서 소실되는 경우가 발생하기도 하였는데, 이러한 경우 국가에서 다시 교서를 발급해 준 사례가 남아있다. 현전하는 공신교서 중에서 확인되는 재발급 교서는 박동량 호성공신교서, 구굉 정사공신교서, 박정 정사공신교서 3점이다. 본 연구에서는 이상 3점에 대한 문서양식과 장황에 대해 검토하였다. 재발급 공신교서는 원본 공신교서와 동일한 양식, 곧 평출(平出)과 대두(擡頭) 등을 준수하여 작성하는 것으로 나타났다. 단, 원본 공신교서와는 달리 재발급된 시점에서 공신의 신분에 변화가 있을 때는 이를 반영하는 것으로 나타났다. 정사공신교서의 경우는 원본 공신교서는 '정원군 부(定遠君 ?)'가 재발급된 시점에는 인조의 아버지가 되었기 때문에 '원종대왕휘(元宗大王諱)'로 나타났다. 또 재발급 정사공신교서의 경우 '김자점(金自點), 김련(金鍊), 심기원(沈器遠), 심기성(沈器成)'과 같이 역모에 의해 삭훈된 경우는 원본 문서대로 작성을 하고 먹으로 검게 삭거(削去)한다는 사실을 확인할 수 있었다. 서사자의 경우도 원본 공신교서는 국가에서 지정한 선서자가 작성하는 반면에, 재발급의 경우는 그 공신 가문의 선서자가 문서를 필사한다는 새로운 사실을 확인할 수 있었다. 공신교서의 장황(粧?)은 물자를 조달해야 하는 조정의 경제적 상황, 배접장 등 실제 제작에 관여한 장인의 기호와 기술 등에 따라 시대적으로 변모한다고 할 수 있는데, 이 3점의 경우 모두 병자호란으로 그 원형이 소실된 상황이었으므로, 재발급본과 최초 발급본의 장황이 달랐을 가능성이 크다. 이와 관련해서 교서 제작과정에 대한 의궤의 기록, 최초 발급본과 같은 시기에 제작된 공신교서와 비교해 본 결과, 재발급본은 최초 발급본에 비하여 장황의 형태나 비율이 커진 것으로 보인다. 우선 변아(邊兒)의 폭은 2배 정도 넓어지고, 중앙좌우회장(中央左右回粧) 역시 평균 2cm이상 커진 형태이고, 하회장(下回粧)의 경우도 평균 10cm 넓어졌다. 상회장(上回粧)과 하회장(下回粧)의 비율은 최초 발급본의 경우 상회장이 하회장에 비해 1.5배 정도 넓고, 재발급본의 경우 거의 1:1의 비율을 갖추고 있었다. 상축(上軸)의 단면은 박동량 호성공신교서의 경우 현재의 반달형태가 아닌 부등변삼각형의 형태였을 것으로 추정되며, 구굉과 박정 정사공신교서 축(軸)은 단면의 모양은 같지만 크기가 작아진 형태일 것이다. 축수(軸首)는 크기에 큰 변화가 없고, 오색다회(五色多繪)는 최초 발급본이 재발급본에 비해 그 폭이 훨씬 좁았을 것으로 추정된다. 재발급본 3점은 제작시기가 같은 보사공신교서(保社功臣敎書)의 장황 형태를 고증할 수 있는 실마리를 제공한다. 현전하는 보사공신교서 중에 제작당시의 장황을 갖추고 있는 것이 확인되지 않은 상황에서 중요한 자료라고 할 수 있겠다.

홍성 홍주읍성 성벽의 보존상태 및 축성유형과 안정성 고찰 (Conservation Status, Construction Type and Stability Considerations for Fortress Wall in Hongjuupseong (Town Wall) of Hongseong, Korea)

  • 박준형;이찬희
    • 헤리티지:역사와 과학
    • /
    • 제51권3호
    • /
    • pp.4-31
    • /
    • 2018
  • 홍주읍성의 초축 연대는 명확히 알 수 없으나 문종 1년 축조 이후 수십 차례에 걸친 보수와 정비를 거쳤으며, 일제강점기에 일부 성벽이 훼철되면서 오늘날의 형태를 갖게 되었다. 홍성은 지구조적으로 지진의 발생 가능성이 높은 지역이다. 역사지진 기록이 남아 있으며, 1978년과 1979년에 각각 규모 5.0과 4.0의 지진이 발생하여 성벽 일부가 붕괴된 바가 있다. 2010년에는 집중강우에 의해 성벽이 붕괴되기도 하였다. 홍주읍성 성벽은 구간에 따라 다양한 구성암종, 치석형태, 축조방식, 채움재료 등이 적용되었다. 또한 보수과정에서 기존의 성벽을 훼철하지 않고 재사용 가능한 부분을 그대로 사용하여 시대에 따른 특성이 성벽에 수직적으로 반영되어 나타난다. 따라서 홍주읍성의 유형분류는 성벽의 수직적 분포를 기준으로 나누었으며, 축성유형의 수직적 개수에 따라 유형 I, 유형 II, 유형 III으로 구분하였다. 성벽에 사용된 암석은 주로 조립질화강암이나 성벽유형에 따라 암종의 차이가 명확하다. 성벽 하부는 자연석 내지 할석을 사용하여 다양한 암종이 혼재되어 나타나나, 중앙부의 치석한 암석은 대부분 조립질 화강암이다. 보수석재는 담홍색화강암이나 수구지와 조양문의 구성 암종은 성벽과 상이하다. 홍주읍성의 대표적인 손상유형은 배부름, 성돌의 돌출, 기초부 성돌의 유실, 부재의 이격, 균열 및 단열, 기초불안정 및 구조적 변형이다. 성벽에 발생하는 거동의 양과 방향을 확인하기 위해 수동 간이계측 및 광파측정을 수행하였다. 수동계측 결과, 성벽의 구조적 변형이 진행되는 구간을 분류할 수 있다. 광파측정 자료와 비교한 결과, 두 모니터링 방법은 상호 상관관계가 있는 것으로 나타났다. 따라서 장기적인 보존관리 방안으로 두 계측방법은 상호 보완적으로 활용할 수 있으며, 홍주읍성의 안정화를 위해 계측시스템은 유지, 관리 및 개선되어야 할 것이다. 남문지 일대의 계측결과를 종합할 때, 붕괴된 성벽 또한 강우에 의한 거동변화가 지속적으로 진행되었을 것이다. 오랜 기간 변위가 누적된 상태에서 집중강우에 의해 발생한 이상거동에 따라 임계점을 초과하여 붕괴에 이르렀을 개연성이 충분하다. 홍주읍성 성벽의 효율적 관리를 위해 연구결과를 토대로 0등급부터 5등급까지 총 6단계의 관리등급을 제안하였다. 이 관리등급을 적용한 결과, 1등급 501.9m (61.10%), 2등급 29.5m (3.77%), 3등급 10.4m (1.33%), 4등급 241.2m (30.80%)로 나타났다. 4등급 구간은 홍화문 서쪽과 치성의 동쪽에 밀집된 양상으로 나타나며, 상시 모니터링 수행을 통해 위험상황에 대비해야 한다. 6단계로 분류한 관리등급은 전체적인 안정성 검토를 통해 수리와 보수가 수행된다면 다시 0등급으로 회귀하는 윤회적 시스템이다. 이를 위해서는 주기적인 정밀 모니터링을 통한 관리등급의 평가가 필요하다.

문화재(文化財)의 국제적 불법 거래(不法 去來)에 관한 고찰 (An Examination into the Illegal Trade of Cultural Properties)

  • 조부근
    • 헤리티지:역사와 과학
    • /
    • 제37권
    • /
    • pp.371-405
    • /
    • 2004
  • 문화재의 국제적인 유통행위는 다수 국가가 관계되므로 이 문제 해결을 위해서는 국제법적인 접근이 필수적이다. 2차대전 이후 문화재의 가치가 물질적 가치에서 국가와 민족의 정체성 확립을 위한 정신적 민족적인 측면의 가치가 중시되면서 신생 독립국과 식민제국들 간에 문화재의 소유권 다툼이 쟁점화 되어 문화재 반환을 목적으로 하는 국제적인 협력과 법제도적인 장치의 모색이 필요하게 되었다. 문화재의 불법거래에 관한 국제협약으로 유네스코(UNESCO)를 중심으로 문화재의 준비적 보존의무를 부과하는 1954년 "전시 문화재 보호에 관한 협약", 문화재 반 출입에 대한 통제와 반출에 허가장 발급을 통해 불법 취득 유통 억제를 위한 1970년 "문화재불법 반 출입 및 소유권 양도의 금지와 예방수단에 관한 협약", 도난이나 불법적으로 반출된 문화재의 국제적 반환을 의무화한 1995년 "유니드로와 협약"이 있다. 또한 유엔(UN)의 산하 기관으로 유네스코(UNESCO)는 특히 소위 문화재 분과(the Division of Cultural Heritage)를 마련하여 문화재에 대한 관계업무 처리에 주력하여 오고 있으며, UN 총회 역시 1973년의 결의 3187 이후로 문화재 보호에 관하여 계속적인 관심을 표현하여 오고 있는데 그 기본내용은 문화재의 원산국에로의 반환에 관한 국제 협력을 확인하고, 각국에 예술품 및 문화재의 불법거래 금지 및 방지를 위한 적절한 조처를 권고하며, 자국내 문화재에 대한 목록화 작업을 권고함과 아울러 종국적으로 많은 국가가 유네스코(UNESCO) 협약의 당사국이 되어 국제적인 협력체제의 구성원이 될 것을 권장하는 것이다. 국제협약의 한계로 협약상의 문화재에 대한 정의 차이가 존재한다. 먼저 1954년 협약상의 문화재는 동산에만 국한되는 것이 아니라 부동산도 포함하고 있는데 1970년 협약은 그 제정 목적이 '문화재의 불법적인 반 출입 및 소유권 양도의 금지와 방지수단'의 강구에 있으며 따라서 그 규율대상도 원칙적으로 유형의 동산문화재(tangible movable cultural property)에 국한된다고 봐야할 것이다. 1995년 협약도 역시 동산문화재를 규율대상으로 삼고 있다. 이 두 협약은 이 점에서 1954년 협약이나 주로 부동산적인 특성을 갖는 문화유산 및 자연유산을 대상으로 하는 1972년의 협약과 차이를 보이고 있다. 이러한 차이는 문화재의 개념에 대한 내재적인 차이를 반영하는 것이 아니라 주어진 협약의 제정 목적 및 취지가 다름에서 기인하는 것이다. 우리나라의 경우 1866년의 병인양요, 일본에 의한 36년간의 식민통치, 군정기, 경제 개발기 등을 통하여 다수의 문화재가 해외로 유출되었다. 물론 이들 문화재를 전부 반환 받을 수도 없고 또 받을 필요도 없는 것이지만, 이들 중 일부는 한국 사회의 문화적 역사적 정체성의 형성에 중요한 역할을 한다거나 또는 이들의 외국(특히, 일본)에서의 소재가 과거 한국민에 대한 지배의 상징으로서 기능한다거나 할 경우 반환 문제가 제기될 수 있을 것이다. 이러한 경우에 우리의 입론을 강화하기 위해서는 1954년 협약 및 제1의정서의 비준은 적극적으로 고려해야 한다고 판단된다. 반환을 요구할 경우 우선 문화재의 도난 여부가 핵심이며 이 경우 국제협약에 따라 조치하면 될 것이지만 외교적 협상의 단계에 이르면 이 문제는 정치적 문제가 될 것이다. 이 경우 반환을 요구하는 국가는 상대국이 문화재를 반환하도록 유도해야 한다. 문화재의 불법거래 방지에 대한 절실한 필요성에 반해, 동북아 지역 국가 및 시민사회의 방지노력은 대단히 미흡한 실정인 바, 이를 실현하기 위한 국가 및 시민 사회적 차원의 체계적인 노력이 동아시아 지역 전체에서 활발하게 전개하여야 할 것이다. 문화재의 불법적인 거래를 가장 효과적으로 막을 수 있는 방법은 인터폴(Interpol) 회원국간 정보를 신속히 유통시키는 것인데 이를 위해서는 인터넷 기술에 바탕을 둔 통신 시스템을 개발해야 하며 도난당한 문화재의 불법거래를 방지하기 위한 보다 효율적인 방안으로 문화재 보호 법률의 도입, 국제협약의 가입, 수집품 목록 구축 등의 조치가 필요하다고 본다.

메타데이터 상호운용성을 위한 기록관리 메타데이터 표준 분석 5W1H와 태스크 모델의 관점에서 (Analysis of Metadata Standards of Record Management for Metadata Interoperability From the viewpoint of the Task model and 5W1H)

  • 백재은;스기모토 시게오
    • 기록학연구
    • /
    • 제32호
    • /
    • pp.127-176
    • /
    • 2012
  • 메타데이터 표준규격(이하 메타데이터 표준으로 기재)은 디지털 자원(Digital resource)의 장기보존 및 디지털 아카이브를 위해 필요한 기본 요소 중 하나로, 이는 현대 정보사회에서 중요한 요소로 잘 알려져 있다. 자원(Resource)의 기록관리와 아카이브, 장기보존을 위한 메타데이터 표준은 다양하며, AGRkMS, EAD, ISAD(G), OAIS, PREMIS5) 등이 이용되고 있다. 우리는 아카이브 시스템의 메타데이터 표준을 디자인하기 위해 목적에 따른 메타데이터 표준을 선택하고 맞춤화(Customization)하지 않으면 안 된다. 한편으로, 다른 시스템의 메타데이터 스키마와의 상호운용성(Interoperability)에 대한 고찰도 실시하지 않으면 안 된다. 이전 연구에서, 우리는 기록 생애 주기(Records lifecycle)라는 관점으로부터 메타데이터 표준의 특성에 대해 분석을 실시하였다. 이로 인해, 각 메타데이터 표준 요소가 해당하는 기록 생애 주기의 처음 단계를 확인할 수 있었고, 아카이브 혹은 보존을 위해서는 하나의 메타데이터 표준만으로 기록 생애 주기 전체를 포괄할 수 없다는 것을 보여 주었다. 우리는 이 분석을 통해서 기록 생애 주기의 단계와 메타데이터 표준간의 관계, 기록 생애 주기 전체에서의 메타데이터 특성은 볼 수 있었으나, 보다 상세한 분석을 실시하는 것은 앞으로의 과제로 남겨두었다. 지금까지의 연구에 근거하여, 본 논문은 기록 생애 주기의 관점에서 디지털 아카이브와 보존, 기록관리를 위한 메타데이터 표준의 특징 분석을 위해, 기록 생애 주기 안에서 실행되는 업무의 관점으로부터 메타데이터 스키마를 재 파악하고 분석하였다. 지금까지 메타데이터 스키마는 기술대상이 되는 자원을 중심으로 정의되었기 때문에 기록 생애 주기 전체와 생애 주기 안의 각 단계에서 이용되는 메타데이터 표준간의 매핑을 위한 적절한 방법이 없었다. 이에 본 논문에서는 각기 다른 메타데이터 표준의 기술 요소를, 기록 생애 주기에 포함시키는 업무와 연결시키는 것으로 메타데이터 표준간의 매핑 방법을 제안한다. 본 연구에서는 메타데이터 표준 분석을 위한 프레임워크(Framework)로, 기록 생애 주기를 이용하여 작성한 자원의 업무중심 모델, 즉 태스크 모델(Task Model)을 제안한다. 태스크 모델을 이용함에 있어서 업무를 실행하는 '이벤트(Event)'의 관점을 보다 명확하게 할 수 있다. 한편, 업무를 중심으로 기술 요소간의 매핑을 보다 효율적으로 실시하기 위해서는 요소를 카테고리 화하여 매핑의 대상 범위를 좁히는 것이 중요하다. 이를 위해 우리는 범용성을 가진 5W1H모델(Who, What, Why, When, Where, How)을 이용하여, 기술 요소를 카테고리 화 하는 것을 제안한다. 그리고 태스크 모델과 5W1H 모델을 이용하여 메타데이터 표준 요소에 특징을 부여하고, 요소 간의 매핑을 실시하여 표준 간 관계를 확인하였다. 태스크 모델은 기록 생애 주기 전체에 업무의 관점을 반영한 것으로, 이 모델을 이용함으로써 기록 생애 주기와 그 안의 각 업무에 대한 메타데이터 표준의 사용, 그리고 특징 분석을 위해 실시되는 기술 요소간의 매핑이 가능할 수 있었다. 또한, 5W1H 카테고리를 이용하여 업무와 자원에 관련되는 기술 요소간의 관계를 살펴보는 것으로, 관계가 명확해지는 것과 함께 조사대상을 좁히는 것이 가능하게 되었다. 이 프레임워크의 제안과 이용으로 우리는 특징 분석을 위해 실시되는 매핑 혹은 분류가 단순한 일반적인 매핑이 아닌 의미적인 분류를 할 수 있었다. 본 연구에서는 이 모델들을 이용하여, 메타데이터 표준간의 크로스워크를 정의하였다. 그리고 태스크 모델의 각 단계의 문맥 내에서 메타데이터 기술 요소의 특성을 매핑 예로 확인하고, 이를 바탕으로 하여 프레임워크에 대해 고찰하였다.

M&W 파동 패턴과 유전자 알고리즘을 이용한 주식 매매 시스템 개발 (Development of a Stock Trading System Using M & W Wave Patterns and Genetic Algorithms)

  • 양훈석;김선웅;최흥식
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.63-83
    • /
    • 2019
  • 투자자들은 기업의 내재가치 분석, 기술적 보조지표 분석 등 복잡한 분석보다 차트(chart)에 나타난 그래프(graph)의 모양으로 매매 시점을 찾는 직관적인 방법을 더 선호하는 편이다. 하지만 패턴(pattern) 분석 기법은 IT 구현의 난이도 때문에 사용자들의 요구에 비해 전산화가 덜 된 분야로 여겨진다. 최근에는 인공지능(artificial intelligence, AI) 분야에서 신경망을 비롯한 다양한 기계학습(machine learning) 기법을 사용하여 주가의 패턴을 연구하는 사례가 많아졌다. 특히 IT 기술의 발전으로 방대한 차트 데이터를 분석하여 주가 예측력이 높은 패턴을 발굴하는 것이 예전보다 쉬워졌다. 지금까지의 성과로 볼 때 가격의 단기 예측력은 높아졌지만, 장기 예측력은 한계가 있어서 장기 투자보다 단타 매매에서 활용되는 수준이다. 이외에 과거 기술력으로 인식하지 못했던 패턴을 기계적으로 정확하게 찾아내는 데 초점을 맞춘 연구도 있지만 찾아진 패턴이 매매에 적합한지 아닌지는 별개의 문제이기 때문에 실용적인 부분에서 취약할 수 있다. 본 연구는 주가 예측력이 있는 패턴을 찾으려는 기존 연구 방법과 달리 패턴들을 먼저 정의해 놓고 확률기반으로 선택해서 매매하는 방법을 제안한다. 5개의 전환점으로 정의한 Merrill(1980)의 M&W 파동 패턴은 32가지의 패턴으로 시장 국면 대부분을 설명할 수 있다. 전환점만으로 패턴을 분류하기 때문에 패턴 인식의 정확도를 높이기 위해 드는 비용을 줄일 수 있다. 32개 패턴으로 만들 수 있는 조합의 수는 전수 테스트가 불가능한 수준이다. 그래서 최적화 문제와 관련한 연구들에서 가장 많이 사용되고 있는 인공지능 알고리즘(algorithm) 중 하나인 유전자 알고리즘(genetic algorithm, GA)을 이용하였다. 그리고 미래의 주가가 과거를 반영한다 해도 같게 움직이지 않기 때문에 전진 분석(walk-forward analysis, WFA)방법을 적용하여 과최적화(overfitting)의 실수를 줄이도록 하였다. 20종목씩 6개의 포트폴리오(portfolio)를 구성하여 테스트해 본 결과에 따르면 패턴 매매에서 가격 변동성이 어느 정도 수반되어야 하며 패턴이 진행 중일 때보다 패턴이 완성된 후에 진입, 청산하는 것이 효과적임을 확인하였다.

스마트폰 다종 데이터를 활용한 딥러닝 기반의 사용자 동행 상태 인식 (A Deep Learning Based Approach to Recognizing Accompanying Status of Smartphone Users Using Multimodal Data)

  • 김길호;최상우;채문정;박희웅;이재홍;박종헌
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.163-177
    • /
    • 2019
  • 스마트폰이 널리 보급되고 현대인들의 생활 속에 깊이 자리 잡으면서, 스마트폰에서 수집된 다종 데이터를 바탕으로 사용자 개인의 행동을 인식하고자 하는 연구가 활발히 진행되고 있다. 그러나 타인과의 상호작용 행동 인식에 대한 연구는 아직까지 상대적으로 미진하였다. 기존 상호작용 행동 인식 연구에서는 오디오, 블루투스, 와이파이 등의 데이터를 사용하였으나, 이들은 사용자 사생활 침해 가능성이 높으며 단시간 내에 충분한 양의 데이터를 수집하기 어렵다는 한계가 있다. 반면 가속도, 자기장, 자이로스코프 등의 물리 센서의 경우 사생활 침해 가능성이 낮으며 단시간 내에 충분한 양의 데이터를 수집할 수 있다. 본 연구에서는 이러한 점에 주목하여, 스마트폰 상의 다종 물리 센서 데이터만을 활용, 딥러닝 모델에 기반을 둔 사용자의 동행 상태 인식 방법론을 제안한다. 사용자의 동행 여부 및 대화 여부를 분류하는 동행 상태 분류 모델은 컨볼루션 신경망과 장단기 기억 순환 신경망이 혼합된 구조를 지닌다. 먼저 스마트폰의 다종 물리 센서에서 수집한 데이터에 존재하는 타임 스태프의 차이를 상쇄하고, 정규화를 수행하여 시간에 따른 시퀀스 데이터 형태로 변환함으로써 동행 상태분류 모델의 입력 데이터를 생성한다. 이는 컨볼루션 신경망에 입력되며, 데이터의 시간적 국부 의존성이 반영된 요인 지도를 출력한다. 장단기 기억 순환 신경망은 요인 지도를 입력받아 시간에 따른 순차적 연관 관계를 학습하며, 동행 상태 분류를 위한 요인을 추출하고 소프트맥스 분류기에서 이에 기반한 최종적인 분류를 수행한다. 자체 제작한 스마트폰 애플리케이션을 배포하여 실험 데이터를 수집하였으며, 이를 활용하여 제안한 방법론을 평가하였다. 최적의 파라미터를 설정하여 동행 상태 분류 모델을 학습하고 평가한 결과, 동행 여부와 대화 여부를 각각 98.74%, 98.83%의 높은 정확도로 분류하였다.

지능형 검색엔진을 위한 색상 질의 처리 방안 (Color-related Query Processing for Intelligent E-Commerce Search)

  • 홍정아;구교정;차지원;서아정;여운영;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.109-125
    • /
    • 2019
  • 지능형 전자상거래 검색 엔진에 대한 관심이 커지면서, 검색 상품의 특징을 지능적으로 추출하고 활용하기 위한 연구들이 수행되고 있다. 특히 전자상거래 지능형 검색 엔진에서 상품을 검색 할 때, 제품의 색상은 상품을 묘사하는 중요한 특징 중에 하나이다. 따라서 사용자의 질의에 정확한 응답을 위해서는 사용자가 검색하려는 색상과 그 색상의 동의어 및 유의어에 대한 처리가 필요하다. 기존의 연구들은 색상 특징에 대한 동의어 처리를 주로 사전 방식으로 다뤄왔다. 하지만 이러한 사전방식으로는 사전에 등록되지 않은 색상 용어가 질의에 포함된 경우 처리하지 못하는 한계점을 가지고 있다. 본 연구에서는 기존에 사용하던 방식의 한계점을 극복하기 위하여, 실시간으로 인터넷 검색 엔진을 통해 해당 색상의 RGB 값을 추출한 후 추출된 색상정보를 기반으로 유사한 색상명들을 출력하는 모델을 제안한다. 본 모델은 우선적으로 기본적인 색상 검색을 위해 671개의 색상명과 각 RGB값이 저장된 색상 사전을 구축하였다. 본 연구에서 제시한 모델은 특정 색상을 검색하는 것으로 시작하며, 검색된 색상이 색상 사전 내 존재하는 지 유무를 확인한다. 사전 내에 검색한 색상이 존재한다면, 해당 색상의 RGB 값이 기준 값으로 사용된다. 만일 색상사전 내에 존재하지 않는다면, Google 이미지 검색 결과를 크롤링하여 각 이미지의 특정 영역 내 RGB값들을 군집화하여 구한 평균 RGB값을 검색한 색상의 기준 값으로 한다. 기준 RGB값을 앞서 구축한 색상 사전 내의 모든 색상의 RGB 값들과 비교하여 각 R, G, B 값에 있어서 ${\pm}50$ 내의 색상 목록을 정렬하고, RGB값 간의 유클리디안 거리 유사도를 활용하여 최종적으로 유사한 색 상명들을 출력한다. 제안 방안의 유용성을 평가하기 위해 실험을 진행하였다. 피설문자들이 생각하는 300 개의 색상 이름과 해당 색상 값을 얻어, 본 연구에서 제안한 방안을 포함한 총 네가지 방법을 통해 얻은 RGB 값들과 피설문자가 지정한 RGB값에 대한 비교를 진행했다. 인간의 눈을 반영하는 측정 기준인 CIELAB의 유클리드안거리는 평균 13.85로 색상사전만을 활용한 방안의 30.88, 한글 동의어사전 사이트인 워드넷을 추가로 활용한 방안의 30.38에 비해 비교적 낮은 색상 간의 거리 값을 보였다. 연구에서 제시하는 방안에서 군집화 과정을 제외한 방안의 색 차는 13.88로 군집화 과정이 색 차를 줄여준다는 것을 확인할 수 있었다. 본 연구에서는 기존 동의어 처리 방식인 사전 방식이 지닌 한계에서 벗어나기 위해, 사전 방식에 새로운 색상명에 대한 실시간 동의어 처리 방식을 결합한 RGB값 기반의 새로운 색상 동의어 처리 방안을 제안한다. 본 연구의 결과를 활용하여 전자상거래 검색 시스템의 지능화에 크게 기여할 수 있을 것이다.

식품섭취량을 활용한 우리나라 식이 패턴 분석 - 김치류 및 주류 중심으로 (Analysis of Korean Dietary Patterns using Food Intake Data - Focusing on Kimchi and Alcoholic Beverages)

  • 김수환;최장덕;김신희;이준구;권유진;신춘식;신민수;천소영;강길진
    • 한국식품위생안전성학회지
    • /
    • 제34권3호
    • /
    • pp.251-262
    • /
    • 2019
  • 본 연구에서는 식품섭취량 데이터를 활용하여, 한국인의 식습관을 분석하고 관리방향을 제안하였다. 국민건강영양조사의 원시자료를 활용하고, 국내 대표적 식품 분류체계인 식품공전을 반영해서 품목수 839개(세부품목수 1,419개)를 대상으로 실시하였다. 일일 총 식품섭취량은 1,585.77 g/day이고, 그 중 원재료식품은 858.96 g/day(54.2%), 가공식품은 726.81 g/day(45.8%)로 산출되었다. 식품군별 식품섭취량은, 곡류가 가장 높은 비율을 차지했고, 식품섭취량 상위15위 식품군 중 90% 이상의 대상자가 섭취하는 목록으로는 곡류(99.06%), 근채류(95.80%)로 나타났다. 품목별 분석에 의하면 주요 다소비(일일식품섭취량 1%이상 섭취, 158.6 g/day) 및 다빈도(일일평균 국민 25% 이상 섭취, 5,168명)품목은 쌀, 배추김치, 사과, 무, 달걀, 고추, 양파, 밀, 두부, 감자, 오이, 돼지고기로 산출되었다. 섭취빈도 중심의 상위순위 목록은 주로 한식양념 재료들이 포함되었다. 김치류는 배추김치(64.89 g/day)의 섭취량 비율이 67%로 가장 높게 나타났다. 주류의 경우 섭취량 및 섭취빈도 모두 상위 5위 안에 포함되어 있으며, 세부적인 섭취량은 맥주(63.53 g/day), 소주(39.11 g/day), 막걸리(19.70 g/day) 순으로 높았고, 섭취빈도는 소주(11.3%), 맥주(7.2%), 청주(6.6%)순으로 높게 산출되었다. 2010년부터 2015년도 식품섭취량 추이에서 곡류는 꾸준하게 감소하고, 음료류는 다소 증가하는 추세였다. 주류의 섭취빈도에서는 일부 종류인 막걸리, 와인, 청주, 복분자주에서 년도별로 감소하는 경향이었고, 김치류도 감소하는 추세였다. 식품 섭취패턴은 체내노출과 직접적인 영향이 있으며, 식품섭취량이 높은 식품과 섭취빈도가 높은 식품 모두 관리가 중요하지만, 우리나라 섭취 특성을 고려하여 국내에 적합한 안전관리 방안 마련이 필요하다. 식품 섭취로 인한 유해오염물질의 노출량 관리를 위해서 다소비 식품은 섭취용량과 관련이 높으므로 식품의 오염도 관리 중심으로 다빈도 식품은 섭취기간과 관련이 높으므로 섭취시 장기노출로 인한 체내축적 중심으로 접근하는 것을 권장한다.

네트워크 분석을 활용한 딥러닝 기반 전공과목 추천 시스템 (Major Class Recommendation System based on Deep learning using Network Analysis)

  • 이재규;박희성;김우주
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.95-112
    • /
    • 2021
  • 대학 교육에 있어서 전공과목의 선택은 학생들의 진로에 중요한 역할을 한다. 하지만, 산업의 변화에 발맞춰 대학 교육도 학과별 전공과목의 분야가 다양해지고 그 수가 많아지고 있다. 이에 학생들은 본인의 진로에 맞게 수업을 선택하여 수강하는 것에 어려움을 겪고 있다. 본 연구는 대학 전공과목 추천 모델을 제시함으로써 개인 맞춤형 교육을 실현하고 학생들의 교육만족도를 제고하고자 한다. 모델 연구에는 대학교 학부생들의 2015년~2017년 수강 이력 데이터를 활용하였으며, 메타데이터로는 학생과 수업의 전공 명을 사용했다. 수강 이력 데이터는 컨텐츠 소비 여부만을 나타낸 암시적 피드백 데이터로, 수업에 대한 선호도를 반영한 것이 아니다. 따라서 학생과 수업의 특성을 나타내는 임베딩 벡터를 도출했을 시, 표현력이 낮다. 본 연구는 이러한 문제점에 착안하여, 네트워크 분석을 통해 학생, 수업의 벡터를 생성하고 이를 모델의 입력 값으로 활용하는 Net-NeuMF 모델을 제시한다. 모델은 암시적 피드백을 가진 데이터를 이용한 대표적인 모델인 원핫 벡터를 이용하는 NeuMF의 구조를 기반으로 하였다. 모델의 입력 벡터는 네트워크 분석을 통해 학생과 수업의 특성을 나타낼 수 있도록 생성하였다. 학생을 표현하는 벡터를 생성하기 위해, 각 학생을 노드로 설정하고 엣지는 두 학생이 같은 수업을 수강한 경우 가중치를 가지고 연결되도록 설계했다. 마찬가지로 수업을 표현하는 벡터를 생성하기 위해 각 수업을 노드로 설정하고 엣지는 공통으로 수강한 학생이 있는 경우 연결시켰다. 이에 각 노드의 특성을 수치화 하는 표현 학습방법론인 Node2Vec을 이용하였다. 모델의 평가를 위해 추천 시스템에서 주로 활용하는 지표 4가지를 사용하였고, 임베딩 차원이 모델에 미치는 영향을 분석하기 위해 3가지 다른 차원에 대한 실험을 진행하였다. 그 결과 기존 NeuMF 구조에서 원-핫 벡터를 이용하였을 때보다 차원과 관계없이 평가지표에서 좋은 성능을 보였다. 이에 본 연구는 학생(사용자)와 수업(아이템)의 네트워크를 이용해 기존 원-핫 임베딩 보다 표현력을 높였다는 점, 모델을 구성하는 각 구조의 특성에 맞도록 임베딩 벡터를 활용하였다는 점, 그리고 기존의 방법론에 비해 다양한 종류의 평가지표에서 좋은 성능을 보였다는 점을 기여점으로 가지고 있다.