• 제목/요약/키워드: Dataset Creation

검색결과 39건 처리시간 0.023초

산업생태계의 기술혁신과 가치창출 구조 변화 (Technology Innovation and Changes on Structure of Value Creation in an Industrial Ecosystem)

  • 한은정;홍순구
    • 기술혁신학회지
    • /
    • 제20권1호
    • /
    • pp.175-204
    • /
    • 2017
  • 산업과 지역의 혁신성과를 높이기 위한 기존의 정책이나 전략들은 지속적인 혁신 활동을 이끌어내고 기술혁신을 확산시키는 데는 한계가 있었다. 이에 대한 대안으로 최근에 혁신생태계가 떠오르고 있다. 이는 혁신 과정에 관련된 주체들의 상호작용이 지속적으로 변화하면서 혁신이 확산된다고 설명한다. 그러나 이 분야의 관련 연구들은 대부분 이론적 프레임웍을 제시하는데 그치고 있으며, 생태계의 구조적 동태성을 실증한 연구는 거의 없다. 본 연구는 산업생태계의 기술혁신에 따른 구조적 동태성을 실증하기 위해 산업기술의 활용을 둘러싼 기업 협력 네트워크에 대해 종단적 네트워크 분석을 수행하였다. 실증분석을 위해 기업 간 상호작용을 네트워크 데이터로 작성하여 구조적 등위성 분석을 실시하였다. 분석 결과에 따르면, 기술혁신의 확산과 관련된 기업 간 상호작용의 변화는 크게 세 가지의 패턴으로 요약된다. 즉, 기술 활용 방식의 제도화, 규모의 경제에 의한 혁신 확산, 기술 개방에 의한 롱테일 가치창출의 산업 구조가 만들어지면서 기술혁신의 성공적 확산이 가능해진다고 할 수 있다. 본 연구는 기술의 상업적 확산을 위한 기술활용 네트워크의 구성 및 기술혁신 관리에 있어 전략적 시사점을 제시하며, 지역혁신을 위한 전략 수립 시 활용될 수 있을 것이다.

A Study on the Classification of Unstructured Data through Morpheme Analysis

  • Kim, SungJin;Choi, NakJin;Lee, JunDong
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.105-112
    • /
    • 2021
  • 빅데이터 시대에 접어들며 데이터에 대한 관심이 폭발적으로 늘어나고 있다. 특히, 인터넷 및 소셜미디어의 발전은 새로운 데이터들의 생성으로 연결되어 빅데이터와 인공지능 시대의 실현과 융합 기술의 새로운 장을 열 수 있게 되었으며, 과거에는 프로그램으로 다루지 못하던 데이터에 대한 분석 요구가 많이 발생하고 있다. 본 논문에서는 빅데이터 시대에서 많이 요구되는 비정형 데이터에 대한 분류를 위하여 분석 모델을 설계하고 이를 검증하였다. 데이터는 디비피아의 논문 요약과 주제어, 그리고 부주제 어를 크롤링하였으며, 코엔엘피의 데이터 사전을 이용해 데이터베이스를 생성하고, 형태소 분석을 통하여 단어의 토큰화 과정을 수행하였다. 또한, 카이스트의 9 품사 분류 체계를 이용해 명사를 추출하고, TF-IDF 값을 생성하였으며, 학습 데이터와 Y 값을 결합하여 분석 데이터 셋을 생성하였다. 이와 같이 생성된 분석 데이터 셋에 랜덤 포레스트와 서포트 벡터 머신 그리고 의사결정트리, 이렇게 세 가지 분석 알고리즘을 적용하여 분류의 적정성을 측정하였다. 본 논문에서 제안한 분류 모델 기법은 논문 분류 외에도 민원 분류 분석 및 텍스트 관련 분석 등 다양한 분야에 유용하게 사용될 수 있다.

대통령 전자기록물의 이관방식 변천과 개선방안 연구 19대 문재인 정부 대통령 전자기록물을 중심으로 (A Study of the Transition Process in Presidential Electronic Records Transfer and Improvement Measures : Focused on the Electronic Records of the 19th President Moon Jae-in's Administration)

  • 윤정훈
    • 기록학연구
    • /
    • 제75호
    • /
    • pp.41-89
    • /
    • 2023
  • 2007년 「대통령기록물법」 제정 이후, 16대 노무현 정부의 대통령 전자기록물 이관 사례는 공공기록물 관리에 있어 첨병으로써의 역할과 새로운 전자기록물 관리의 테스트 베드로써의 역할을 수행했었다. 19대 문재인 정부의 대통령 전자기록물을 이관할 때에는 16대 때의 전자기록물 이관방식을 계승하되, 몇 가지 혁신적인 시도가 있었다. 대통령기록관은 처음으로 대통령자문기관의 전자문서를 장기보존패키지로 변환한 후 온라인으로 이관 받았고, 데이터의 특성을 고려하여 대통령 기록물생산기관의 행정정보 데이터세트를 SIARD 규격으로 이관을 받았다. 그리고 대통령기록관은 웹사이트를 OVF 형태로 시범적으로 이관 받았으며, 소셜미디어를 API를 통해 직접 수집하였다. 이와 같이 이 연구는 16대 노무현 정부 때부터 19대 문재인 정부 때까지 대통령 전자기록물 이관방식과 관련한 변천과정을 조사하였다. 그리고 19대 문재인 정부의 대통령 전자기록물 유형별 이관방식을 중심으로 주요성과 및 문제점을 분석하여 향후 개선방안을 제시하였다.

한글 텍스트 감정 이진 분류 모델 생성을 위한 미세 조정과 전이학습에 관한 연구 (A Study on Fine-Tuning and Transfer Learning to Construct Binary Sentiment Classification Model in Korean Text)

  • 김종수
    • 한국산업정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.15-30
    • /
    • 2023
  • 근래에 트랜스포머(Transformer) 구조를 기초로 하는 ChatGPT와 같은 생성모델이 크게 주목받고 있다. 트랜스포머는 다양한 신경망 모델에 응용되는데, 구글의 BERT(bidirectional encoder representations from Transformers) 문장생성 모델에도 사용된다. 본 논문에서는, 한글로 작성된 영화 리뷰에 대한 댓글이 긍정적인지 부정적인지를 판단하는 텍스트 이진 분류모델을 생성하기 위해서, 사전 학습되어 공개된 BERT 다국어 문장생성 모델을 미세조정(fine tuning)한 후, 새로운 한국어 학습 데이터셋을 사용하여 전이학습(transfer learning) 시키는 방법을 제안한다. 이를 위해서 104 개 언어, 12개 레이어, 768개 hidden과 12개의 집중(attention) 헤드 수, 110M 개의 파라미터를 사용하여 사전 학습된 BERT-Base 다국어 문장생성 모델을 사용했다. 영화 댓글을 긍정 또는 부정 분류하는 모델로 변경하기 위해, 사전 학습된 BERT-Base 모델의 입력 레이어와 출력 레이어를 미세 조정한 결과, 178M개의 파라미터를 가지는 새로운 모델이 생성되었다. 미세 조정된 모델에 입력되는 단어의 최대 개수 128, batch_size 16, 학습 횟수 5회로 설정하고, 10,000건의 학습 데이터셋과 5,000건의 테스트 데이터셋을 사용하여 전이 학습시킨 결과, 정확도 0.9582, 손실 0.1177, F1 점수 0.81인 문장 감정 이진 분류모델이 생성되었다. 데이터셋을 5배 늘려서 전이 학습시킨 결과, 정확도 0.9562, 손실 0.1202, F1 점수 0.86인 모델을 얻었다.

빅데이터와 블록체인을 활용한 조직내 RDM 구축방안 (A Study on the Construction of RDM in an Organization Using Big Data and Block Chain)

  • 이경희;최영진;조완섭
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.127-139
    • /
    • 2019
  • 연구 데이터 관리(Research Data Management: RDM)는 연구데이터를 생산, 수집, 이용, 보전하는데 있어 방향을 제시하고 지원하는 인력, 정책, 자원 및 기술을 포괄하는 시스템이다. RDM은 연구비 신청시 작성하는 DMP(Data Management Plan)의 작성지원, 데이터 컬렉션과 리파지토리 구축, 연구 데이터의 디지털 보전과 유통 등을 포함하는 광범위한 활동들로 구성된다. 선진국의 경우 각 기관들이 RDM을 위한 시스템과 관련 조직을 구성하여 운영하고 있으나 우리나라의 경우에는 연구 데이터에 관한 인식수준이 낮아 미흡한 실정이다. 본 논문에서는 각 조직의 현실에 적합한 연구데이터 관리체계 구축방안을 제안한다. 특히, 최근들어 각 분야마다, 조직마다 빅데이터의 생성과 관리를 위한 빅데이터 플랫폼 구축이 급증하고 있어 이를 조직내 RDM 구축에 반영할 필요가 있다. 또한 블록체인 기술을 활용하여 연구자의 데이터 주권 확보를 지원하고, 데이터 프로비넌스 보장과 P2P 방식의 분산 RDM 구축 방안도 제안한다.

  • PDF

수명주기가 짧은 상품들에 대한 시퀀스 기반 개인화 서비스 (A sequence-based personalized service for the short life cycle products)

  • 최주철
    • 디지털융복합연구
    • /
    • 제15권12호
    • /
    • pp.293-301
    • /
    • 2017
  • 대부분의 신상품들은 시장에서 급격히 사라질 뿐만 아니라 기존 상품들의 매출감소를 불러온다. 이처럼 수명주기가 짧은 상품으로 인해 소매상들은 과다한 재고를 보유하게 될 뿐만 아니라 소비자들은 자신들의 선호를 맞는 제품들을 발견하는데 어려움을 겪는다. 이런 문제를 해결에 하는데 있어서 추천 시스템은 좋은 해결방법이 될 수 있다. 그러나 대부분의 추천 시스템들은 소비자의 고정된 선호를 이용하기 때문에 변화하는 소비자의 선호를 반영하지 못하는 문제가 있다. 이러한 문제를 해결하기 위하여 본 연구에서는 시간에 따라 변화하는 소비자의 선호를 반영한 추천 방법론을 제안하였다. 제안한 방법론은 소비자의 동적 선호 프로파일 작성, 네이버 형성, 추천 리스트 작성의 3 단계로 구성되어 있으며, 모바일 이미지 거래 데이터를 이용하여 제안된 방법론의 유용성을 검증하였다. 시험결과 제시된 방법론의 추천 정확도가 전통적인 협업필터링의 정확도 보다 높았다. 이러한 결과를 통해, 본 연구에서 제한한 방법론이 짧은 수명주기를 가진 제품을 추천하는데 효과적이라는 결론을 내릴 수 있다. 따라서 향후 제안된 방법론을 현업에 적용하여 실제적 유용성을 검증할 필요가 있다.

허밍: DeepJ 구조를 이용한 이미지 기반 자동 작곡 기법 연구 (Humming: Image Based Automatic Music Composition Using DeepJ Architecture)

  • 김태헌;정기철;이인성
    • 한국멀티미디어학회논문지
    • /
    • 제25권5호
    • /
    • pp.748-756
    • /
    • 2022
  • Thanks to the competition of AlphaGo and Sedol Lee, machine learning has received world-wide attention and huge investments. The performance improvement of computing devices greatly contributed to big data processing and the development of neural networks. Artificial intelligence not only imitates human beings in many fields, but also seems to be better than human capabilities. Although humans' creation is still considered to be better and higher, several artificial intelligences continue to challenge human creativity. The quality of some creative outcomes by AI is as good as the real ones produced by human beings. Sometimes they are not distinguishable, because the neural network has the competence to learn the common features contained in big data and copy them. In order to confirm whether artificial intelligence can express the inherent characteristics of different arts, this paper proposes a new neural network model called Humming. It is an experimental model that combines vgg16, which extracts image features, and DeepJ's architecture, which excels in creating various genres of music. A dataset produced by our experiment shows meaningful and valid results. Different results, however, are produced when the amount of data is increased. The neural network produced a similar pattern of music even though it was a different classification of images, which was not what we were aiming for. However, these new attempts may have explicit significance as a starting point for feature transfer that will be further studied.

교통 빅데이터 활용 시 개인 정보 보호를 위한 연합학습 기반의 경로 선택 모델링 (Federated Learning-based Route Choice Modeling for Preserving Driver's Privacy in Transportation Big Data Application)

  • 심지섭
    • 한국ITS학회 논문지
    • /
    • 제22권6호
    • /
    • pp.157-167
    • /
    • 2023
  • 본 연구에서는 분산 컴퓨팅 및 개별 디바이스 활용을 통해 개인 정보 보호에 특화된 학습방법인 연합학습 방법론을 기반으로, 모바일 내비게이션 애플리케이션에서 수집된 대규모의 운전자 데이터를 이용하여 경로 선택 예측 모델을 수립하는 방법에 대해 고찰한다. 경로 선택 모델링에서 활용될 수 있는 운전자 데이터의 전처리 및 분석 방법을 수립하고, 서포트벡터머신(SVM) 및 다층 퍼셉트론(MLP)과 같이 기존에 널리 활용되는 학습 방법과 연합학습 방법의 성능과 특성을 비교한다. 분석 결과 연합학습을 통한 모델 성능은 중앙 서버 기반의 모델과의 비교에서 예측 정확도 측면의 차이가 거의 없는 것으로 나타났으나, 개별 데이터가 충분히 확보되는 경우 연합학습 모델과 같은 개인화 모델의 성능이 개선될 수 있다는 점을 확인하였다. 연합학습 모델은 본 연구의 경로 선택 모델링 사례와 같이 모빌리티 부문의 데이터 프라이버시 문제가 중요한 분야에서 대규모 데이터 처리를 필요로 하는 경우에 그 활용 가치가 매우 높을 것으로 기대된다.

PROV의 확장에 기초한 데이터형 전자기록의 출처 모델 연구 (A Study on Developing a Provenance Conceptual Model for Data-driven Electronic Records Based on Extending W3C PROV)

  • 현문수
    • 기록학연구
    • /
    • 제80호
    • /
    • pp.5-41
    • /
    • 2024
  • 이 연구는 데이터형 전자기록을 대상으로 한 출처 표현 모델의 개발 방향에 맞추어 모델을 개발할 목적으로 진행되었다. 데이터형 전자기록의 생산·관리를 위해 출처와 맥락의 개념 구분을 지지하며, 이를 구분하여 표현할 수 있는 확장형 출처 모델을 제시할 것을 목표로 하였다. 이를 위해 W3C PROV를 기초 모델로 활용하며, P-Plan과 ProvONE도 일부 참고하였다. 이후, 기록관리 요건을 드러내고, 이를 바탕으로 기초 모델을 일부 확장하였다. 이 연구가 제안한 출처 모델은 데이터형 전자기록의 소급형 출처와 전망형 출처를 각각 표현하고 연결할 수 있도록 설계되었다. 향후 기록학 영역에서 출처 개념을 논의하고 모델을 확장해 나갈 수 있기를 기대한다.

서비스 유형별 혁신활동의 특성 연구 (The Characteristics of Innovation Activities in the Service Sector)

  • 강영모;조찬우;이성주
    • 기술혁신학회지
    • /
    • 제16권3호
    • /
    • pp.559-581
    • /
    • 2013
  • 지난 수년간 서비스 산업은 빠르게 성장해 왔으며, 현재도 그 성장가능성이 매우 높다. 때문에 서비스 산업의 생산성 및 혁신활동이 국가경제발전의 중요한 요소로 관심을 받기 시작하였다. 그럼에도 불구하고, 제조분야에서의 혁신과 관련된 연구들은 활발히 이루어진 것과 달리, 서비스 산업에서의 혁신 활동의 특성에 대한 연구는 상대적으로 부족하였다. 특히, 서비스 혁신은 서비스에 따라 상이하게 나타날 수 있기 때문에 이에 대한 연구가 반드시 필요하다. 따라서 본 연구는 서비스 유형별 혁신활동의 특성을 비교 및 분석하는 것을 그 목적으로 하고자 한다. 이를 위해, 첫째, 과학기술정책연구원(STEPI)의 기술혁신조사(KIS) 서비스업 분야 데이터를 활용한다. 둘째, 서비스의 고객화 정도와 설비의 중요도를 기준으로 서비스의 유형화를 수행한다. 셋째, 각 서비스 유형별 혁신활동의 특성을 혁신활동의 투입, 프로세스, 산출의 관점에서 분석한다. 연구 결과, 각 서비스 유형은 고유의 혁신활동 패턴을 가지고 있는 것으로 나타났으며, 이는 서비스 유형의 특성에 대한 가치 있는 정보를 제공함으로써 서비스 분야에서의 혁신활동에 대한 추후 연구를 위한 기초적인 자료를 제공해 줄 수 있을 것으로 기대한다.

  • PDF