• Title/Summary/Keyword: 지식정보자원시스템

검색결과 253건 처리시간 0.02초

도메인 특수성이 도메인 특화 사전학습 언어모델의 성능에 미치는 영향 (The Effect of Domain Specificity on the Performance of Domain-Specific Pre-Trained Language Models)

  • 한민아;김윤하;김남규
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.251-273
    • /
    • 2022
  • 최근 텍스트 분석을 딥러닝에 적용한 연구가 꾸준히 이어지고 있으며, 특히 대용량의 데이터 셋을 학습한 사전학습 언어모델을 통해 단어의 의미를 파악하여 요약, 감정 분류 등의 태스크를 수행하려는 연구가 활발히 이루어지고 있다. 하지만 기존 사전학습 언어모델이 특정 도메인을 잘 이해하지 못한다는 한계를 나타냄에 따라, 최근 특정 도메인에 특화된 언어모델을 만들고자 하는 방향으로 연구의 흐름이 옮겨가고 있는 추세이다. 도메인 특화 추가 사전학습 언어모델은 특정 도메인의 지식을 모델이 더 잘 이해할 수 있게 하여, 해당 분야의 다양한 태스크에서 성능 향상을 가져왔다. 하지만 도메인 특화 추가 사전학습은 해당 도메인의 말뭉치 데이터를 확보하기 위해 많은 비용이 소요될 뿐 아니라, 고성능 컴퓨팅 자원과 개발 인력 등의 측면에서도 많은 비용과 시간이 투입되어야 한다는 부담이 있다. 아울러 일부 도메인에서 추가 사전학습 후의 성능 개선이 미미하다는 사례가 보고됨에 따라, 성능 개선 여부가 확실하지 않은 상태에서 도메인 특화 추가 사전학습 모델의 개발에 막대한 비용을 투입해야 하는지 여부에 대해 판단이 어려운 상황이다. 이러한 상황에도 불구하고 최근 각 도메인의 성능 개선 자체에 초점을 둔 추가 사전학습 연구는 다양한 분야에서 수행되고 있지만, 추가 사전학습을 통한 성능 개선에 영향을 미치는 도메인의 특성을 규명하기 위한 연구는 거의 이루어지지 않고 있다. 본 논문에서는 이러한 한계를 극복하기 위해, 실제로 추가 사전학습을 수행하기 전에 추가 사전학습을 통한 해당 도메인의 성능 개선 정도를 선제적으로 확인할 수 있는 방안을 제시한다. 구체적으로 3개의 도메인을 분석 대상 도메인으로 선정한 후, 각 도메인에서의 추가 사전학습을 통한 분류 정확도 상승 폭을 측정한다. 또한 각 도메인에서 사용된 주요 단어들의 정규화된 빈도를 기반으로 해당 도메인의 특수성을 측정하는 지표를 새롭게 개발하여 제시한다. 사전학습 언어모델과 3개 도메인의 도메인 특화 사전학습 언어모델을 사용한 분류 태스크 실험을 통해, 도메인 특수성 지표가 높을수록 추가 사전학습을 통한 성능 개선 폭이 높음을 확인하였다.

재래시장 환경개선 지원정책 개발에서의 지역 장소적 기능 도입 (Introduction of region-based site functions into the traditional market environmental support funding policy development)

  • 정대용;이세호
    • 한국유통학회:학술대회논문집
    • /
    • 한국유통학회 2005년도 춘계학술대회 발표논문집
    • /
    • pp.383-405
    • /
    • 2005
  • 재래시장은 지역의 중심지적인 특성과 문화적인 특성이 고스란히 반영된 지역 거점지이며 인근 지역주민의 상거래라는 1차적 장소적 기능과 사회문화적 측면의 상호 정보문화교류, 커뮤니티 공간 형성으로 유통의 집객시설과 집적시설로서 중요한 역할과 기능을 하고 있다. 5인 이하 가족 단위의 생계형으로 취급상품, 구입방범, 판매방식 등이 전근대적인 경영기법을 통해 한국의 대표적 소매업태로서의 역할을 해오고 있다. 1990년대 이후 신유통업태와 대형할인점 진출로 인해 재래시장은 급격한 경쟁력 상실과 소비자들의 생활수준의 향상, 구매패턴의 변화, 인터넷의 급속한 확산 등 외부적인 유통 환경변화에서 경쟁력을 상실하고 설 자리를 잃어가고 있다. 정부의 지역경제 활성화와 국민경제의 발전 측면에서 고령화된 재래시장에 대한 대책 중 정부의 예산지원 정책으로 환경개선사업, 연구용역, 경영현대화중심의 국고지원 사업은 2001년부터 2004년까지 총 3,853억원의 국고가 지원되었으나 활성화 사업의 실효성에는 아직 정확히 나타나고 있지 않은 상황으로 조사되었다. 또한 지원사업을 추진함에 있어 시장상인리더들의 전문성결여로 종합적인 추진전략과 중장기적 계획수립 및 자발적인 상인들의 합의점 유도 반감으로 지속적인 사업추진방향에 한계점을 나타냈다. 재래시장이 단순히 물건을 사고파는 물리적인 장소적 의미에서 벗어나 새로운 지역 장소적 생활공간으로 커뮤니티적 접근을 통한 장소적 창조전략이 필요하다. 이에 시대적 패러다임 변화에 따른 새로운 사업 방향 전환을 통해 재래시장의 장소적 기능 도입을 동해 문화적 경제적 의미를 지닌 공간으로 재조명을 동해 발전방향을 제시하고자 한다. 재래시장은 지역 기반으로 한 지역생활자들과 자연스럽게 커뮤니티를 상호 형성하고 정보와 지식 공유를 통해 부 창출 공간으로 재생되어야 할 것이다 재래시장이 부 창출 공간으로 재생하려면 시대적 장소적 환경에 맞는 시설과 교류활동을 통찬 상호신뢰구축 활동 속에서 고객이 원하는 방향으로 영업환경도 변화하여야 하며, 지역단위 중심 영국의 TCM, 미국의 BID, 일본의 TMO 등 해외 벤치마킹을 통한 단위 시장상가 점포단위의 점(點)정책에서 선(線)단위의 상가로 환경사업과 거시적인 지역단위중심인 면(面) 정책적 접근을 통한 커뮤니티적인 발상 전환이 필요하다. 국내외 사례비교 분석을 통해 사회적 정책수요 발굴과 기존의 추진방법에 대한 선진사례 연구를 통한 NPO, NGO 등의 시민기업가와 이를 수행키 위한 혁신성과 전문성조정능력을 갖춘 리더자 양성이 무엇보다 중요하다. 특히 지역자원 활용 소스 중심의 문화관린 산업의 seeds 발굴과 향토상품의 상품화와 네트워크 조직망 구축을 위한 지역중심의 복합 생활문화 공간이 필요할 것이며, 이를 촉진키 위한 mentor academy시스템 접근을 통해 점점 고령화되어 가고 있는 재래시장에 대해 차별적 특성이 반영된 종합적이고 체계적 접근 방법연구가 필요하다.

  • PDF

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.