• 제목/요약/키워드: 실험 시스템

검색결과 22,122건 처리시간 0.048초

시뮬라시옹과 포스트-재현 - 알고리즘 아트를 중심으로 (Simulation and Post-representation: a study of Algorithmic Art)

  • 이수진
    • 기호학연구
    • /
    • 제56호
    • /
    • pp.45-70
    • /
    • 2018
  • 르네상스 이후부터 지속되어 온 재현체계에 관한 포스트모던 철학의 비판은 시각주체의 경험과 대상을 분리하고, 환경과 인간을 분리하는 이분법적인 사고체계에 관한 비판으로 궤를 같이 한다. 1960년대 포스트모던한 흐름으로 등장한 일련의 작품에서 강조된 상호작용성은 1990년대 후반 디지털 아트의 인터랙티브한 차원으로 계승되었다. 디지털 아트의 핵심적인 특성은 현장에서 관객의 참여에 따라 예측할 수 없는 결과 혹은 저마다의 미세한 변화를 반영한 무한대의 변이들을 만들어낸다는 점이다. 이 과정에서 컴퓨터 프로그램의 중요성이 부각되고, 기존 프로그램을 그대로 차용하는 것이 아니라, 아티스트가 직접 알고리즘을 작성하고 프로그래밍하는 경우 혹은 프로그래머와 협업을 통해 고유한 알고리즘을 만들어내는 경우가 점점 증가하고 있다. 프로그래밍 자체를 창작 행위로 간주해야 하는 패러다임으로 전환되는 중이라고 말할 수도 있겠다. 현재 주목받고 있는 시뮬레이션과 VR 기술은 현실의 감각과 시공간을 재현해내는 기술로 각광받고 있는데, 시뮬레이션 기술이 예술 분야에 도입되면서, 실험적인 작품들이 창작되는 중이다. 장 보드리야르가 제시한 시뮬라시옹 개념은 '어떤 현실을 본따 매우 사실적으로 만듦'을 대변하는 개념이라기보다는 '실재하는 현실과 어떤 관계를 맺고 있는 전혀 다른 현실'을 주목하게 만드는 개념이다. 이때 시뮬라시옹은 진실과 거짓의 문제를 따질 주제가 아니라, 형이상학적인 의미가 없는, 전통적인 실재와는 전혀 다른 성질의 실재를 지칭한다. 전통적인 질서에서 이미지가 실재 세계의 재현에 대응했다면, 알고리즘 아트의 시뮬레이션 이미지들 그리고 시뮬레이션된 시공간은 '체험을 용이하게 만드는 예술 형식'이라 할 수 있다. 다수의 알고리즘 아트는 상황, 현실, 생태계, 생명체 등의 복합적인 속성을 시스템으로 모델화하여 (특정 혹은 개별) 대상을 구조화하고 활성화하는 데 목표를 두고 있으며, 세계의 시뮬라시옹에 주목한다. 본 논문에서는 세계의 시뮬라시옹을 다루는 이안 쳉의 작품을 통해, 21세기 인공지능 기술의 등장과 함께 변화하고 있는 문화예술의 패러다임을 살펴보고자 한다. 또한 이안 쳉의 라이브 시뮬레이션과 같은 새로운 형식의 콘텐츠 앞에서 우리가 취해야 하는 태도 역시 논의하게 될 것이다. 사실 새로운 형식의 작품을 대면하는 순간은 전통적인 형식의 작품보다 훨씬 더 능동적인 입장을 요구한다. 본 논문이 제시하는 포스트-재현 형식의 문화예술 작품은 개인적인 경험의 순간에 이루어지는 감각과 지각 과정이 완성이나 종결로 수렴될 수 없음을 기술로 구현하고 있다. 이때 관객에게 요구되는 것은 바로 능동적 인식과 상황적 지식임을 이야기하고자 한다.

유아의 소프트웨어 교육 관련 국내 최근 연구의 경향 분석 (An Analysis of Research Trends Related to Software Education for Young Children in Korea)

  • 천희영;박소연;성지현
    • 한국보육학회지
    • /
    • 제19권2호
    • /
    • pp.177-196
    • /
    • 2019
  • 본 연구는 2016년부터 3년간 발표된 유아 소프트웨어 교육 관련 국내 최근 연구들의 경향을 게재 경향과 연구방법의 측면에서 분석하는데 연구의 목적을 두었다. 분석대상은 한국학술지인용색인과 국가학술연구정보 공유 시스템에서 검색된 유아의 소프트웨어 교육 관련 연구 26편이었다. 발표된 연구의 게재 경향은 발표 연도, 발표 형식, 학문 분야의 범주에 따라 살펴보았다. 연구방법 측면에서는 연구의 주제 특성과 연구방법 유형, 그리고 연구변인의 특성을 분석하였다. 연구의 결과를 연구의 게재 경향 측면에서 살펴본 바, 2016년부터 최근 3년간 발표된 연구 편수는 연도별로 점차 증가하며, 학술지 논문 형태로 대다수가 발표된 것으로 나타났다. 전체 분석대상의 61.5%(16편)가 유아교육 및 아동학 관련 학문 분야에서 발표된 논문이었다. 연구방법 측면에서는 먼저, 연구의 주제와 연구대상 관련하여 유아 소프트웨어 교육 프로그램 개발 연구, 또는 만4세와 만5세를 대상으로 효과 검증을 한 연구가 다수를 차지하는 것으로 밝혀졌다. 연구방법으로는 실험연구와 문헌연구방법 (각 8회), 조사연구(7회)의 순으로 많이 적용된 것으로 나타났다. 연구변인의 특성으로서 많이 다루어진 측정변인은 유아의 인지적 특성 변인으로 나타났다. 연구에 적용된 프로그램의 특성과 관련하여, 첫째, 프로그래밍 도구 환경을 중심으로 분류한 결과 가장 많은 6편의 연구가 피지컬 컴퓨팅 환경의 프로그램을 사용하였으며, 연구에 사용된 프로그래밍 도구 로봇 중에서는 Albert가 가장 많이 사용된 것으로 나타났다. 프로그램의 적용 기간은 5주~48주로 차이가 있었다. 분석대상 연구들에서 컴퓨팅 사고력은 소프트웨어 교육에 의해 향상되는 문제해결 능력으로 개념화된 경우가 가장 많았으며, 그 하위요인별 개별도구로써 측정되었음을 알 수 있었다. 본 연구의 결과 유아의 소프트웨어 교육 관련 연구가 최근 증가하는 경향을 보이지만 연구 편수의 축적과 연구방법 측면에서 개선이 필요하다는 것을 확인할 수 있었다.

숯가마에서 발생하는 온실가스 배출 특성 (Characteristics of Greenhouse Gas Emissions from Charcoal Kiln)

  • 이슬기;전의찬;박성규;최상진
    • 한국기후변화학회지
    • /
    • 제4권2호
    • /
    • pp.115-126
    • /
    • 2013
  • 최근 국내 배출원 특성을 고려하여 생물성 연소에 대한 배출목록(emission inventory)을 추가하려는 연구가 이루어지고 있으나, 국내 현황을 반영한 실증 연구는 현재까지 거의 이루어진 바가 없는 실정이다. 따라서 앞으로 배출목록에 대한 기후 대기 통합관리시스템이 진행될 경우, 효과적인 배출원 관리를 위해 생물성 연소의 온실가스 배출 특성에 대한 연구가 필요한 시점이다. 본 연구에서는 숯가마에서 발생하는 온실가스 배출 특성을 파악하기 위하여 숯가마 모형장치를 이용하여 현장실험을 실시했다. 또한, 참나무의 점화, 탄화, 출탄하는 시기와 내부 온도 변화를 고려하여 굴뚝에서 배출되는 온실가스($CO_2$, $CH_4$, $N_2O$)를 직접 포집하여 분석하였다. 온실가스 배출계수 산정 결과, $CO_2$ 배출계수는 668 g/kg, $CH_4$ 배출계수는 20 g/kg이며, $N_2O$ 배출계수는 0.01 g/kg으로 나타났다. 본 연구에서 개발한 온실가스 배출계수를 사용하여 국가 배출량을 산정한 결과, $CO_2$ 배출량은 46,040 ton/yr, $CH_4$ 배출량은 1,378 ton/yr, $N_2O$ 배출량은 0.69 ton/yr으로 나타났다. GWP를 이용하여 총 배출량을 산정한 결과, 연간 $75,201ton\;CO_2eq.$으로 나타났으며, 참나무는 바이오 매스에 포함되기 때문에 연소하는 과정에서 발생하는 $CO_2$는 총 배출량에서 제외되므로 숯가마에서 발생하는 국내 순배출량은 연간 $29,161ton\;CO_2eq.$으로 추정되었다.

하수오 추출물, 분획물 및 주성분의 항산화, 세포 보호 및 항균 활성에 관한 평가 (Evaluation of Antioxidant, Cytoprotective and Antimicrobial Properties of Polygoni multiflori Radix Extract, Fractions and Its Major Constituent)

  • 신혁수;김민우;송제리;이준석;하윤정;전영희;김지웅;이윤주;박수남
    • 대한화장품학회지
    • /
    • 제44권4호
    • /
    • pp.407-417
    • /
    • 2018
  • 본 연구에서는 하수오를 이용하여 50% 에탄올 추출물과 에틸아세테이트 분획물을 제조하고, 추출물 및 분획물의 항산화, 세포 보호 및 항균 효능을 평가하여 기능성 소재로서의 가능성을 확인하였다. 또한, 하수오에 주요하게 존재하는 성분의 활성도 검증하였다. HPLC-DAD, LC-EIS-MS를 통해 분석한 결과, 하수오의 주성분은 2, 3, 5, 4'-tetrahydroxystilbene 2-O-${\beta}$-D-glucoside (THSG)이었다. 페놀류 및 THSG 함량은 에틸아세테이트 분획물이 에탄올 추출물 보다 각각 11.1 및 3.0배 높게 나타났다. DPPH 자유 라디칼 및 $Fe^{3+}-EDTA/H_2O_2$ 시스템에서 생성된 ROS에 대한 소거 활성 평가에서, 에틸 아세테이트 분획물은 에탄올 추출물 보다 뛰어난 소거 활성을 나타냈다. 특히 ROS 소거 활성 평가에서 에틸 아세테이트 분획물과 THSG은 L-ascorbic acid와 동등한 소거 활성을 나타냈다. 이러한 결과를 바탕으로 수행된 광증감 반응으로 유도된 적혈구의 산화적 손상에 대한 세포 보호 활성은 에틸아세테이트 분획물, 에탄올 추출물, THSG 순서로 나타났으며, 모든 실험군이 양성 대조군으로 사용한 (+)-${\alpha}$-tocopherol보다 우수한 활성을 나타냄을 확인하였다. 항균 활성 평가는 S. aureus, E. coli, P. aeruginosa, C. albicans 균주를 대상으로, disc diffusion assay와 broth microdilution assay를 이용하여 수행하였다. 그 결과 추출물, 분획물 및 THSG 모두 모든 균주에 대해 항균 활성을 나타냈으며, 특히 그람 양성균인 S. aureus에 대해 methyl paraben보다 우수한 항균력을 나타냄을 확인하였다. 본 연구의 결과는 하수오가 항산화, 세포 보호 및 항균력에 관한 천연 소재로의 활용될 수 있는 가능성을 시사한다.

Potential Contamination Sources on Fresh Produce Associated with Food Safety

  • Choi, Jungmin;Lee, Sang In;Rackerby, Bryna;Moppert, Ian;McGorrin, Robert;Ha, Sang-Do;Park, Si Hong
    • 한국식품위생안전성학회지
    • /
    • 제34권1호
    • /
    • pp.1-12
    • /
    • 2019
  • 신선한 농산물 섭취와 관련된 많은 장점들이 전세계적으로 발표되고 있으며, 지속적인 섭취를 장려하고 있다. 일반적으로 과일과 채소는 최소한으로 가공되기 때문에 천연의 성분들이 건강을 증진시키는 역할을 하기도 하지만 그만큼 질병을 일으킬 수 있는 매개체가 존재할 수 있는 가능성이 매우 높다. 세계 보건기구 (WHO)의 보고서에 따르면 10명 중 1명이 식품에 의해 발생하는 질병으로 고통 받고 있으며, 전 세계적으로 매년 42만 명이 식중독으로 사망하는 것으로 밝혀졌다. 이러한 신선 식품은 농장에서 수확할 때부터 소비자의 식탁에 오르기까지 다양한 경로에서 쉽게 오염 될 수 있다. 본 리뷰논문에서는 신선식품에 의해 발생할 수 있는 질병을 이해하기 위해 화학적, 생물학적, 그리고 물리학적 위험요소로부터 식중독을 일으키는 원인과, 증상, 그리고 검출 방법에 대해서 기술 하였다. 화학적 위험요소의 대표적인 예로는 농약(살충제, 살균제, 및 제초제), 천연 독소 (곰팡이 독소 및 식물 독소), 그리고 중금속 (수은 및 카드뮴) 등이 있으며 이는 크로마토그래피 및 나노 기술 등을 이용하여 검출 할 수 있다. 하지만, 여러 실험에도 불구하고 화학적 위험 요소는 그 구조가 다양하기 때문에 위험 요소를 검출하는 하나의 표준 방법을 수립하기 힘들다. 신선한 과일과 채소는 영양분과 수분이 풍부하기 때문에 박테리아성 병원균 (Salmonella, E. coli O157: H7, Shigella, Listeria monocytogenes, Bacillus cereus), 바이러스 또는 기생충에 의해 쉽게 오염이 되며, 이를 검출하기 위해 주로 다양한 분자 생물학적 기술이 사용되고 있다. 마지막으로 물리적 위험요소인 유리, 금속, 자갈 등과 같은 매개체는 가공 공정 중에 식품에 유입되어 소비자에게 신체적 상해를 줄 수 있다. 이러한 위험요소를 줄이기 위해서 X-선 검사와 같은 투시 시스템을 이용하여 위해물질을 탐지하거나, 생산에 관여하는 직원 교육을 통해 2차 감염을 줄일수 가 있다.

직물의 세부 구조 및 굴곡이 웨어러블 광섬유의 발광 효과에 미치는 영향 (Influence of Detailed Structure and Curvature of Woven Fabric on the Luminescence Effect of Wearable Optical Fiber Fabric)

  • 양진희;조현승;곽휘권;오윤중;이주현
    • 감성과학
    • /
    • 제21권4호
    • /
    • pp.55-62
    • /
    • 2018
  • 웨어러블 광섬유 직물의 주요 요건은 의류에 적용하기 위해 높은 유연성을 전제로 해야 한다는 점과 인체의 평평한 부위뿐만 아니라 굴곡이 있는 구간에서도 발광 효과, 즉 휘도를 유지해야 한다는 점이다. 따라서 본 연구에서는 위 조건을 충족하는 웨어러블 광섬유 직물의 세부 구조를 직조(weaving) 타입과 자수(computer embroidery) 타입의 2가지로 제작하였고, 이를 토대로 다음의 두 가지 조건에서 실험을 실시하였다. 첫째, 굴곡이 없는 평평한 상태에서의 웨어러블 광섬유 직물을 1cm간격으로 총 10개의 측정점을 좌표화하여 그 휘도를 측정하였다. 둘째, 인체 부위 중 입체적 굴곡이 발생하는 팔뚝 부위에 가로 방향으로 웨어러블 광섬유 직물을 배치하고 1cm 간격으로 총 10개의 측정점을 좌표화하여 그 휘도값을 측정하였다. 그 결과 직조(weaving) 타입의 경우, 평평한 상태에서의 휘도값은 최대 $5.23cd/m^2$, 최소 $2.74cd/m^2$, 평균 $3.56cd/m^2$, 표준편차 $1.11cd/m^2$로 나타났고, 팔뚝 부위에서의 휘도값은 최대 $7.92cd/m^2$, 최소 $2.37cd/m^2$, 평균 $4.42cd/m^2$, 표준편차 $2.16cd/m^2$로 나타났다. 또한 자수(computer embroidery) 타입의 경우, 평평한 상태에서의 휘도값은 최대 $7.56cd/m^2$, 최소 $3.84cd/m^2$, 평균 $5.13cd/m^2$, 표준편차 $1.04cd/m^2$로 나타났고, 팔뚝 부위에서의 휘도값은 최대 $9.62cd/m^2$, 최소 $3.63cd/m^2$, 평균 $6.13cd/m^2$ 표준편차 $2.26cd/m^2$ 나타났다. 즉, 자수(computer embroidery) 타입의 경우가 직조(weaving) 타입의 경우에 비해 더 높은 발광 효과를 보였는데 이는 자수(computer embroidery) 타입의 세부 구조가 배면 소재로 인해 빛의 손실을 줄일 수 있었기 때문으로 사료된다. 또한 두 타입 모두에서 팔뚝부위의 휘도가 평평한 상태에 비해 각각 124%, 119%로 나타나, 인체의 굴곡에도 본 웨어러블 광섬유 직물의 발광효과가 우수하게 나타남을 알 수 있었다. 이는 빛의 파동설을 정의한 호이겐스의 원리(Huygens' principle), 빛 파면의 진행 방향과 이루는 각도(${\theta}$)의 크기에 커지면 이와 비례하여 빛의 세기도 커진다는 호이겐스-프레넬-키르히호프 원리(Huygens-Fresnel-Kirchhoff principle)와 일치하는 결과이다.

데이터 크기에 따른 k-NN의 예측력 연구: 삼성전자주가를 사례로 (The Effect of Data Size on the k-NN Predictability: Application to Samsung Electronics Stock Market Prediction)

  • 천세학
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.239-251
    • /
    • 2019
  • 본 논문은 학습데이터의 크기에 따른 사례기반추론기법이 주가예측력에 어떻게 영향을 미치는지 살펴본다. 삼성전자 주가를 대상을 학습데이터를 2000년부터 2017년까지 이용한 경우와 2015년부터 2017년까지 이용한 경우를 비교하였다. 테스트데이터는 두 경우 모두 2018년 1월 1일부터 2018년 8월 31일까지 이용하였다. 시계 열데이터의 경우 과거데이터가 얼마나 유용한지 살펴보는 측면과 유사사례개수의 중요성을 살펴보는 측면에서 연구를 진행하였다. 실험결과 학습데이터가 많은 경우가 그렇지 않은 경우보다 예측력이 높았다. MAPE을 기준으로 비교할 때, 학습데이터가 적은 경우, 유사사례 개수와 상관없이 k-NN이 랜덤워크모델에 비해 좋은 결과를 보여주지 못했다. 그러나 학습데이터가 많은 경우, 일반적으로 k-NN의 예측력이 랜덤워크모델에 비해 좋은 결과를 보여주었다. k-NN을 비롯한 다른 데이터마이닝 방법론들이 주가 예측력 제고를 위해 학습데이터의 크기를 증가시키는 것 이외에, 거시경제변수를 고려한 기간유사사례를 찾아 적용하는 것을 제안한다.

적대적 생성 모델을 활용한 사용자 행위 이상 탐지 방법 (Anomaly Detection for User Action with Generative Adversarial Networks)

  • 최남웅;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.43-62
    • /
    • 2019
  • 한때, 이상 탐지 분야는 특정 데이터로부터 도출한 기초 통계량을 기반으로 이상 유무를 판단하는 방법이 지배적이었다. 이와 같은 방법론이 가능했던 이유는 과거엔 데이터의 차원이 단순하여 고전적 통계 방법이 효과적으로 작용할 수 있었기 때문이다. 하지만 빅데이터 시대에 접어들며 데이터의 속성이 복잡하게 변화함에 따라 더는 기존의 방식으로 산업 전반에 발생하는 데이터를 정확하게 분석, 예측하기 어렵게 되었다. 따라서 기계 학습 방법을 접목한 SVM, Decision Tree와 같은 모형을 활용하게 되었다. 하지만 지도 학습 기반의 모형은 훈련 데이터의 이상과 정상의 클래스 수가 비슷할 때만 테스트 과정에서 정확한 예측을 할 수 있다는 특수성이 있고 산업에서 생성되는 데이터는 대부분 정답 클래스가 불균형하기에 지도 학습 모형을 적용할 경우, 항상 예측되는 결과의 타당성이 부족하다는 문제점이 있다. 이러한 단점을 극복하고자 현재는 클래스 분포에 영향을 받지 않는 비지도 학습 기반의 모델을 바탕으로 이상 탐지 모형을 구성하여 실제 산업에 적용하기 위해 시행착오를 거치고 있다. 본 연구는 이러한 추세에 발맞춰 적대적 생성 신경망을 활용하여 이상 탐지하는 방법을 제안하고자 한다. 시퀀스 데이터를 학습시키기 위해 적대적 생성 신경망의 구조를 LSTM으로 구성하고 생성자의 LSTM은 2개의 층으로 각각 32차원과 64차원의 은닉유닛으로 구성, 판별자의 LSTM은 64차원의 은닉유닛으로 구성된 1개의 층을 사용하였다. 기존 시퀀스 데이터의 이상 탐지 논문에서는 이상 점수를 도출하는 과정에서 판별자가 실제데이터일 확률의 엔트로피 값을 사용하지만 본 논문에서는 자질 매칭 기법을 활용한 함수로 변경하여 이상 점수를 도출하였다. 또한, 잠재 변수를 최적화하는 과정을 LSTM으로 구성하여 모델 성능을 향상시킬 수 있었다. 변형된 형태의 적대적 생성 모델은 오토인코더의 비해 모든 실험의 경우에서 정밀도가 우세하였고 정확도 측면에서는 대략 7% 정도 높음을 확인할 수 있었다.

Quantum Dot LED를 이용한 상추 주요 병원성 곰팡이 및 세균의 생장억제효과 기내실험 (In Vitro Quantum Dot LED to Inhibit the Growth of Major Pathogenic Fungi and Bacteria in Lettuce)

  • 이현구;김상우;마헤시 아드히카리;순 쿠말 구룽;세투 바지에;산 꼬설;권병헌;주한준;고영욱;김용득;유용환;박태희;신정철;김민하;이윤수
    • 식물병연구
    • /
    • 제25권3호
    • /
    • pp.114-123
    • /
    • 2019
  • Quantum Dot LED (QD LED) 조명은 소형의 크기, 좁은 대역파장, 긴 수명, 전자 시스템을 통한 제어가 용이하여 현재 시설재배에 이용되는 형광등, 할로겐램프, HID, HSP 램프의 단점을 보완할 수 있는 작물생육에 이상적인 광원으로서 잠재력을 가지고 있다. QD LED 조명을 이용하여 식물 병원성 미생물의 방제가 가능하다면 작물재배에 사용되는 인력 및 비용을 절감하고 화학적 방제제를 사용하지 않은 안전성 높은 생산물을 얻을 수 있다는 장점이 있다. 본 연구에서는 식물공장 및 온실에서 많이 재배되고 있는 상추에 큰 피해를 입히는 주요 식물 병원성 곰팡이에 대한 QD LED 조명의 영향과 생장억제효과를 확인하기 위해 시행하였다. 상추에 주로 발생하여 작물에 피해를 입히는 Rhizoctonia solani, Phytophthora drechsleri, Sclerotinia sclerotiorum, Sclerotinia minor, Botrytis cinerea, Fusarium oxysporum, Pectobacterium carotovorum, Xanthomonas campestris균을대상으로 QD LED 조명에 의한 균사생장억제 효과를 조사하였으며 처리한 6종류의 조명 중 BLUE (450 nm) 조명은 Sclerotinia sclerotiorum는 50 cm 거리에서 16.7%의 억제율을 보였으며 30 cm 거리에서 94.1%의 균사생장억제율을 보였다. S. minor는 50 cm 거리에서 80.4%, B. cinerea는 50 cm 거리에서 36.3%의 균사생장이 억제되었으며 30 cm 거리에서 S. minor와 B. cinerea는 100%의 균사생장억제율을 보였다. 15 cm 거리에서는 3종의 병원균 모두 100%의 억제율을 보였다. QD RED (M1), QD RED (M2)조명은 30 cm와 15 cm 거리에서 Sclerotinia minor와 Botrytis cinerea의 균사생장을 100% 억제했으며 Sclerotinia sclerotiorum의 경우 30 cm 거리에서 QD RED (M1)과 QD RED (M2)조명에 대해 각각 75.2%, 100%의 억제율을 보였으나 15 cm 거리에서는 각각 5.8%, 36.3%의 억제율을 보였다. 상추에 병원균을 접종하여 LED 광원 하에 생장을 확인한 결과 QD RED (M2)광원에서 S. sclerotiorum의 감염을 59.9% 억제하였고 S. minor는 BLUE (450 nm), QD RED (M1), QD RED (M2) 광원에서 59.9%의 억제율을 보였다. B. cinerea의 경우 BLUE (450 nm) 광원에서 84%의 높은 억제율을 보였다.

복합 문서의 의미적 분해를 통한 다중 벡터 문서 임베딩 방법론 (Multi-Vector Document Embedding Using Semantic Decomposition of Complex Documents)

  • 박종인;김남규
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.19-41
    • /
    • 2019
  • 텍스트 데이터에 대한 다양한 분석을 위해 최근 비정형 텍스트 데이터를 구조화하는 방안에 대한 연구가 활발하게 이루어지고 있다. doc2Vec으로 대표되는 기존 문서 임베딩 방법은 문서가 포함한 모든 단어를 사용하여 벡터를 만들기 때문에, 문서 벡터가 핵심 단어뿐 아니라 주변 단어의 영향도 함께 받는다는 한계가 있다. 또한 기존 문서 임베딩 방법은 하나의 문서가 하나의 벡터로 표현되기 때문에, 다양한 주제를 복합적으로 갖는 복합 문서를 정확하게 사상하기 어렵다는 한계를 갖는다. 본 논문에서는 기존의 문서 임베딩이 갖는 이러한 두 가지 한계를 극복하기 위해 다중 벡터 문서 임베딩 방법론을 새롭게 제안한다. 구체적으로 제안 방법론은 전체 단어가 아닌 핵심 단어만 이용하여 문서를 벡터화하고, 문서가 포함하는 다양한 주제를 분해하여 하나의 문서를 여러 벡터의 집합으로 표현한다. KISS에서 수집한 총 3,147개의 논문에 대한 실험을 통해 복합 문서를 단일 벡터로 표현하는 경우의 벡터 왜곡 현상을 확인하였으며, 복합 문서를 의미적으로 분해하여 다중 벡터로 나타내는 제안 방법론에 의해 이러한 왜곡 현상을 보정하고 각 문서를 더욱 정확하게 임베딩할 수 있음을 확인하였다.