• 제목/요약/키워드: Automatic clustering

검색결과 242건 처리시간 0.019초

비교사적 군집화 알고리즘을 이용한 전산화 단층영상의 병소부위 결정에 관한 연구 (Determination of Tumor Boundaries on CT Images Using Unsupervised Clustering Algorithm)

  • 이경후;지영훈;이동한;류성렬;조철구;김미숙;유형준;권수일;전준철
    • Journal of Radiation Protection and Research
    • /
    • 제26권2호
    • /
    • pp.59-66
    • /
    • 2001
  • 정위적분할방사선치료(FSRT)는 병소경계에 대한 공간상위치와 형태를 정확히 결정하는 것이 큰 쟁점이다. 본 연구는 나선형 CT를 이용하여 4명의 뇌종양 환자와 팬톰(파라핀)으로부터 연속적인 횡축 단면상을 얻었다. K-mean 분류 알고리즘을 적용하여 CT영상의 초기정보값을 평균화소값으로 변화시켰다. 영상의 구성은 병소영역, 정상영역, 혼합영역, 바탕영역, 가음영영역의 5영역으로 분류하였다. 주된 관심은 혼합영역 내에서 정상영역과 혼합영역을 어떻게 분리하는 가였다. 5영역 평균화소값 중에서 정상영역과 병소영역에 상대적인 평균편차 분석법을 적용하여 2영역 평균편차 화소값 사이의 최대점을 구하였다. IDL 프로그램을 이용한 반자동윤곽법으로 혼합영역내의 최대점을 연결함으로서 GTV의 경계선을 그렸다. 균일한 팬톰의 관심영역 경계선은 ${\pm}1%$ 이내의 오차로 평가되었다. 환자 4명의 경우는 방사선 전문의들이 그린 병소영역과 K-mean 알고리즘과 상대적인 평균편차 분석법에 의해 자동적으로 묘사된 병소영역과 거의 일치하였다. 이러한 방법들을 사용하여 불분명한 정상영역과 병소영역의 경계선을 명확하게 나타낼 수 있었다. 그러므로 CT 영상이 MRI 영상과 비교하여 간헐적으로 병소윤곽을 보여주지 못할 경우 이 방법은 치료계획을 결정할 때 유용한 CT영상 자료로 활용될 수 있음을 확인하였다.

  • PDF

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.