• 제목/요약/키워드: 색인화

검색결과 272건 처리시간 0.026초

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

데크놀로지 미학으로서의 사진 (The Photography as Technological Aesthetics)

  • 진동선
    • 조형예술학연구
    • /
    • 제11권
    • /
    • pp.221-249
    • /
    • 2007
  • 오늘날 사진은 새로운 테크놀로지 형태인 디지털 이미지 프로세싱 앞에 심각한 정체성 위기와 존재론적 딜레마에 봉착했다. 사진은 그동안 우리에게 세상을 새롭게 바라보는 방법을 제공하고, 또 우리 스스로 주변을 돌아볼 수 있는 자각을 주었으며, 나아가 삶의 리얼리티의 본질을 재인식시키는데 크게 기여했다. 그런 사진의 기능이 오늘날 무력화되고 있다. 디지털 테크놀로지의 출현으로 사진은 더 이상 사실의 기록, 결백의 증거, 그리고 리얼리티의 거울로서 간주되지 않는다. 오히려 유희의 도구 혹은 우리가 사는 세계의 환영과 기쁨을 창조하는 수단으로 간주된다. 그러나, 디지털 테크놀로지의 출현은 이제 비로소 사진의 존재론적 당위성과 정체성의 문제를 냉정히 돌아보게 한다. 본 논고는 전자시뮬레이션 시대 새로운 이미지 생산의 첨병으로 등장한 디지털 이미지의 존재론적 측면을 규명하는데 있다. 이를 위해 인류의 첫 번째 프로그램 미학으로 말해지는 사진과 첨단테크놀로지 미학으로 말해지는 디지털 이미지와의 관계를 기계미학적 관점에서 살펴보려 한다. 특히 올드미디어(사진)와 뉴미디어(디지털) 사이에 갈등 구조를 자본주의 역사관과 물질적 관점에서 살펴보려 한다. 본 논고는 이를 위해 우선 사진의 정체성 위기와 존재론적 위협이 어디로부터 발현된 것인지를 살피고, 또 지금까지 생산된 매체 미학적 담론들이 어떤 비평적 쟁점 속에 놓였는지를 살피고자 한다. 특히 사진이 강점으로 여긴 존재론적 인덱스와 생성론적 텍스트에 주목하여 사진 재현의 기반인 사실적 기록, 명료한 증거, 그리고 기술적 정교성이 어떤 기계미학의 층위에 있는지를 디지털 이미지를 대척에 두고 분석하고자 한다. 그리하여 최근 일고 있는 사진의 죽음, 사진의 종말에 관한 담론들이 심각한 오류가 있음을 지적하고자 한다. 올드 테크놀로지로서 사진이 당면한 위기, 즉 현재 사진이 안고 있는 존재론적 위기(컴퓨터화 된 디지털 이미지 출현) 그리고 인식론적 위기(윤리, 지식, 가치관 등 급격한 문화 변동)는 매체미학의 본질상 당연한 위기임을 정당화하고자 한다. 본 논문은 이 같은 주장을 위하여 역사적으로 사진술이 어떤 생성과 소멸의 과정을 거쳤으며, 또 어떻게 지금의 디지털 이미지에 이르게 되었는지 테크놀로지 미학 안에서 자동생성주의로서 색인 이미지, 디지털 코드로서 수치 이미지의 생성, 기원, 본질 그리고 정체성을 규명하고자 한다. 특히 본 논고는 논지의 정당성을 위해 다양한 매체미학자들의 주의주장 및 이론적 쟁점을 분석하고자 한다. 또 분석틀을 통해서 테크놀로지 미학의 근간인 기계, 기술성을 바탕으로 한 사진의 생성적 측면과 문화 안에서 변형된 프로그램에 의해 창조되는 디지털 이미지의 변형적 측면의 본질을 파악하고자 한다. 이렇게 사진과 디지털 이미지의 양자의 비교를 통해서 테크놀로지 미학 안에서 올드 미디어(사진)와 뉴 미디어(디지털 이미지)의 자리바꿈은 정당한 것이라는 사실과, 이런 역설적인 구조야말로 기계, 기술을 바탕으로 삼는 테크놀로지 매체의 숙명성이라는 사실을 강조함으로써 논문의 정당성을 강화하고자 한다. 마지막으로 본 논고는 하나의 얼굴, 하나의 정체성으로 자리할 수 없다는 사실을 역사로서 확증하고, 또 사진에서 부동의 존재론과 인식론의 모습은 애초부터 불가능하다는 사실을 지적함으로써 오늘날 제기되고 있는 '사진의 죽음,' '사진의 종말'은 쟁점의 정당성에도 불구하고 매체미학의 역사를 간과하는 오도된 비평이라는 사실을 결론으로 도출하고자 한다.

  • PDF