• 제목/요약/키워드: 데이터 중심 모델링

검색결과 301건 처리시간 0.029초

키워드 기반 주제중심 분석을 이용한 비정형데이터 처리 (Unstructured Data Processing Using Keyword-Based Topic-Oriented Analysis)

  • 고명숙
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.521-526
    • /
    • 2017
  • 데이터는 데이터 형식이 다양하고 방대할 뿐만 아니라 그 생성 속도가 매우 빨라 기존의 데이터 처리 방식이 아닌 새로운 관리 및 분석 방법이 요구된다. 소셜 네트워크 상의 온라인 문서에서 인간의 언어로 쓰여진 비정형 텍스트에서 Text Mining기법을 사용하여 유용한 정보를 추출할 수 있다. 소셜미디어에 남긴 정치, 경제, 문화에 대한 메시지에 대한 경향을 파악하는 것이 어떤 주제에 관심을 가지고 있는지를 파악할 수 있는 요소가 된다. 본 연구에서는 주제 중심 분석 기법을 이용하여 주어진 키워드에 관한 온라인 뉴스를 대상으로 텍스트 마이닝을 수행하였다. LDA(Latent Dirichiet Allocation)를 이용하여 웹문서로부터 정보를 추출하고 이로부터 사람들이 실제로 주어진 키워드에 대하여 어떤 주제에 관심이 있고 관련된 핵심 가치 중 어떤 주제를 중심으로 전파되고 있는지를 분석하였다.

잡음이 있는 3차원 점군 데이터에서 밸브 모델링 및 모델 추출 (Valve Modeling and Model Extraction on 3D Point Cloud data)

  • 오기원;최강선
    • 전자공학회논문지
    • /
    • 제52권12호
    • /
    • pp.77-86
    • /
    • 2015
  • LIDAR를 이용해서 얻은 3차원 점군 데이터는 작은 물체를 추출하기에는 오차의 영향이 크기 때문에 작은 밸브를 자동으로 추출하는데 많은 어려움이 있다. 본 논문에서는 이러한 잡음이 있는 3차원 점군 데이터 사이에서 밸브의 위치 및 방향(Pose)의 정보를 얻는 방법을 제안한다. Pose를 얻기 위해서 밸브가 원환체 모양의 손잡이, 원통 모양의 Rib, 평면 모양의 중심축 평면인 기본 도형으로 이루어진 모델이라고 가정한다. 그리고 밸브의 중심 좌표에 대한 추가적인 입력을 받아서 밸브의 Pose를 추출한다. 중심점을 기준으로 거리에 따른 히스토그램을 생성하고, 히스토그램의 값에 따라 손잡이, Rib, 중심축 평면의 파라미터를 통계적인 방법으로 추출하여 최종 밸브의 Pose를 추출한다. 추출된 밸브의 Pose를 이용하여 3차원 점군 데이터에 밸브의 모형을 각 모양으로 복원한다.

기업 전사 자료 설계에서 역정규화 중심 데이터 모델링의 부작용 (Negative Side Effects of Denormalization-Oriented Data Modeling in Enterprise-Wide Database Design)

  • 이혜경
    • 전자공학회논문지CI
    • /
    • 제43권6호
    • /
    • pp.17-25
    • /
    • 2006
  • 전산화 대상 규모가 확대되면서 새로운 방식의 데이터 모델링 방법론이 필요하게 됨에 따라 자료 설계라는 것에 최근 들어 1980년대 초반 못지 않게 이른 바 데이터 거버넌스 혹은 데이터 질 등의 화두의 모습으로 큰 관심이 재연되고 있다. 그러나 데이터 모델링에 대한 확고한 견해를 가지고 있지 못하기 때문에 막상 데이터베이스 설계를 실무적으로 소화해 내기에는 적지 않은 어려움을 겪게 된다 본 논문에서는 업무의 요구 형성/분석 단계부터 데이터베이스 구현까지 최종 단계까지를 체계적인 방법론을 통해 정보시스템의 데이터 모델을 창출하는 정규화 중시의NS방법론을 적용한 설계방법과 기존의 관행에 의해 역정규화를 어쩔 도리 없이 용인하고 마는 정보공학(Information Engineering, 약칭 IE)방법론 기반의 설계방법과 비교한다. 동일한 업무를 대상으로 설계된 데이터 설계 산출물을 기준으로 각종 측면에서 비교해 봄으로써 정규화 중시 기반의 체계적 방법론이 기업의 정보시스템의 성능 향상에 어느 정도 기여하는지를 정량 파악하였다. 비교 실험 결과, 개체 설정의 타당성, 설계의 균형성 지표인 사각고리형 경로 유무, 그리고 속성중복률 면에서 모두 NS방법론적 설계가 우수하였다.

3D+t 관상동맥표현을 위한 매개변수 모델링 (Parametric Modeling Approach to Represent 3D+t Coronary Arteries)

  • 송수민;이유부;최유주;김명희
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제11권1호
    • /
    • pp.50-54
    • /
    • 2005
  • 본 논문은 관상동맥의 구조와 그 움직임을 사실적으로 표현하기 위한 매개변수적 모델링기법을 제안한다. 매개변수적 기법으로 생성된 모델은 메쉬 정점의 인덱스만으로 모델간 매칭을 위한 대응점을 찾을 수 있으므로, 시간대별로 달라지는 정점의 위치를 쉽게 추적함으로써 모델의 움직임을 표현할 수 있다. 그러나 이러한 기법으로 생성된 모델은 분리, 접합 등의 변형 조작이 어렵고, 트리형태 객체에 적용하기 힘든 단점이 있다. 본 논문에서는 이를 극복하기 위해 분할된 혈관영역의 골격데이타에서 찾아낸 분기점을 중심으로 Generalized Cylinder를 이용하여 실린더 형태의 각 혈관세그먼트를 모델링 한 후, 분기영역을 3 개의 하프파이프(half pipe)와 2 개의 삼각형 패치로 연결하여 모델링하였다. 완성된 모델은 다시점 관상동맥데이터에 적용하였고, 각 시점에서 구해진 정점의 위치를 선형보간함으로써 부드러운 혈관의 움직임을 나타내었다.

  • PDF

텍스트 마이닝을 활용한 데이터 거버넌스 연구 동향 분석: 2009년~2021년 국내 학술지 논문을 중심으로 (The Study on Data Governance Research Trends Based on Text Mining: Based on the publication of Korean academic journals from 2009 to 2021)

  • 정선경
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.133-145
    • /
    • 2022
  • 연구 목적은 데이터 거버넌스의 연구 동향을 파악하고자 하였다. 연구 대상은 데이터 거버넌스 개념과 전략이 제시되기 시작한 2009년부터 2021년까지의 논문 158편을 대상으로 하였다. 주요 연구방법은 텍스트 마이닝을 활용하였고, 주요 방법은 빈도분석, 워트클라우드, 네트워크 분석 및 토픽 모델링 기법을 사용하여 분석하였다. 연구 결과 최빈 키워드는 정보, 빅데이터, 관리, 정책, 정부, 법률, 스마트가 확인되었다. 또한 네트워크 분석 결과 데이터 산업 정책, 데이터 거버넌스 성과, 국방, 거버넌스, 데이터 공공 등의 주제로 연관된 연구 수행이 이루어지고 있었다. 토픽 모델링을 통해 도출된 4개 토픽은 "데이터 거버넌스 정책", "데이터 거버넌스 플랫폼", "데이터 거버넌스 관련 법률", "데이터 거버넌스 구현"이며, 이중 "데이터 거버넌스 플랫폼" 관련 연구는 증가 추세를 보였고, "데이터 거버넌스 구현"은 축소되고 있는 경향이었다. 본 연구는 데이터 거버넌스 관련 연구를 종합적으로 정리하였다. 데이터 거버넌스는 조직 차원의 데이터 경영 및 데이터 통합 정책, 관련 기술 등 관련 분야와 다양한 시각에서 연구영역 확대가 필요하다. 향후 해외데이터 거버넌스들을 대상으로 한 분석 대상을 확대하고 4차산업혁명, 인공지능, 메타버스 등 데이터 기반 미래 산업이 요구되는 산업 분야에서의 연구 방향과 정책 방향 수립 관련 후속 연구를 기대할 수 있다.

큰 규모 소프트웨어의 개발을 위한 모델링 기법의 방향성에 대한 연구 (A Study on the Direction of Modeling Techniques for the Development of Large Scale Software)

  • 조민호
    • 한국전자통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.167-172
    • /
    • 2020
  • 큰 규모의 소프트웨어 개발에서 모델링의 중요성은 이미 확인된 사항이다. 그리고 대부분의 프로젝트에서 모델링은 UML을 활용하여 수행되고 있다. 하지만 UML은 클래스를 중심으로 설계된 모델링 도구로서 공통모듈이나 컴포넌트, 프로세스 그리고 데이터의 모델링을 수행하기에는 복잡하고 기능이 부족하다. 이런 점을 보완하고자 컴퓨터 분야에서 개발되었던 구조적 방법론, 정보공학 방법론을 포함한 다양한 모델링 기법을 통합해서 사용하는 방안을 제시함으로써 실제 산업 현장에 도움이 되고자 한다. 이번 논문을 통하여 고객이 만족하는 소프트웨어의 개발을 위해서는 UML만 사용하지 않고 다양한 방법론의 기법을 사용하는 것이 유용함을 보이고자 한다.

시맨틱 웹서비스를 위한 시맨틱 어노테이션 기술 동향 (Technical Trends of Semantic Annotation for Semantic Web Services)

  • 문애경;박유미;김상기
    • 전자통신동향분석
    • /
    • 제25권2호
    • /
    • pp.121-131
    • /
    • 2010
  • 인터넷의 발전 과정에서 데이터 중심의 시맨틱 웹 기술과 서비스 중심의 웹서비스 기술은 시맨틱 웹서비스라는 융합기술로 발전하고 있다. 본 고에서는 시맨틱 웹서비스 실현의 핵심인 시맨틱 어노테이션(annotation) 기술을 소개하고, 접근 방식에 따라 톱다운 방식와 바텀업 방식으로 분류한 어노테이션 기술들을 비교 분석한다. 그리고 어노테이션 기술 중 WSMO 기반의 어노테이션을 이용하여 시맨틱 웹서비스를 모델링하는 사례를 보임으로써 시맨틱 웹서비스 실현의 가능성과 그 시기를 가늠해보고자 한다.

토픽 모델링을 활용한 '수돗물 유충' 뉴스 빅데이터 분석 (News Big Data Analysis of 'Tap Water Larvae' Using Topic Modeling Analysis)

  • 이수연;김태종
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.28-37
    • /
    • 2020
  • 본 연구는 '수돗물 유충' 사태의 뉴스 빅데이터를 분석함으로써, '수돗물 유충'과 관련된 주요 키워드와 토픽을 파악하여, 환경문제에 대한 위기 대응력 제고방안을 제안하기 위해 수행되었다. 2020년 7월 13일부터 8월 31일까지 보도된 1,975건의 '수돗물 유충' 뉴스를 토픽 모델링 기법으로 분석하였다. 그 결과 언론에서 나타난 '수돗물 유충' 사태가 발생기, 확산기, 수습기로 구분되며, 각 5개의 토픽을 선정하여, 환경문제의 발생과 추진 과정을 확인할 수 있었다. 분석 결과를 바탕으로 환경문제에 대한 위기 대응 방안을 다음과 같이 제언하였다. 첫째, '수돗물 유충' 사건을 중심으로 얽혀있는 다양한 맥락을 탐구하고 통합적인 안목을 형성하는 교육으로 환경문제에 대한 대응력을 기를 수 있도록 해야 한다. 둘째, 인터넷 커뮤니티를 활용한 시민참여의 환경정보 공유와 환경감시 역할 부여가 필요하다. 셋째, 신속하고 정확한 환경정보 제공과 소통을 담당하는 환경 커뮤니케이터의 양성 및 배치가 필요하다. 본 연구는 '수돗물 유충' 관련 뉴스 빅데이터를 기반으로 국내에서 처음으로 토픽 모델링 분석기법을 활용하여 분석한 연구로서, 비정형 데이터로 나타나는 환경 관련 이슈를 실증적이고 체계적으로 분석했다는 학술적 의의와 환경교육 및 커뮤니케이션 개선 방안을 제시했다는 정책적 의의를 지닌다.

건설공사의 활동·내역 연동관리를 위한 기성관리운영시스템(EVMS) 데이터 모델링 및 구현 (EVMS Database System Implementation for interworking of WBS & CBS based management in Construction Works)

  • 박홍태;이부형
    • 한국산학기술학회논문지
    • /
    • 제12권6호
    • /
    • pp.2851-2858
    • /
    • 2011
  • 본 논문에서는 활동중심의 공정관리와 내역중심의 기성관리로 각각 이원화되어 운영되고 있던 건설공사의 진척관리를 통합 연동하여 관리 할 수 있도록 하기 위한 데이터베이스 모델을 제안한다. 이를 위해 본 논문에서는 활동중심 공정관리 DB를 4개의 엔티티로 구성하고 내역중심의 기성관리 DB를 3개의 엔티티로 구성하여 독립적으로 운영될 수 있도록 함과 동시에 활동중심 공정관리 DB내에 연동 엔티티를 이용하여 내역중심 기성관리 DB내 엔티티와의 관계설정을 통해 두 가지 공정관리 시스템내의 데이터들이 연동될 수 있도록 하였다. 또한, 데이터의 공유를 위해 기본적으로 요구되는 데이터의 일관성, 무결성 및 최신성을 유지할 수 있도록 연동 엔티티 속성을 정의하였다. 제안된 개선된 데이터베이스 모델을 실제 구현하고 활용성 검증을 통하여 데이터의 연동 및 효율성을 입증하였다.

EM알고리즘을 기반으로 한 뉴로-퍼지 모델링 (EM Algorithm based Neuro-Fuzzy Modeling)

  • 김승석;전병석;김주식;유정웅
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2002년도 하계학술대회 논문집 D
    • /
    • pp.2846-2849
    • /
    • 2002
  • 본 논문은 뉴로-퍼지 시스템에서의 규칙 선택 및 모델 학술에 대하여 EM 알고리즘을 기반으로 하는 구조 동정을 제안한다. 뉴로-퍼지 모델링에서의 초기 파라미터가 학습과정에서의 모델 성능에 큰 영향을 주고 있다. 주어진 데이터에 근거한 파라미터 추정에는 다양한 방법들이 소개되고 응용되어져 왔는데 이전 연구들에서 볼 수 있는 HCM, FCM 등은 데이터와의 유클리디언 거리를 최소화하는 중심점을 파라미터로 선택하는 등의 방법과 퍼지 균등화 등은 데이터의 확률 밀도함수를 이용하여 파라미터를 추정하였다. 제안된 방법에서는 데이터에서의 Maximum Likelihood Estimator를 기반으로 하는 방법으로 EM 알고리즘을 이용하였다. 초기 파라미터의 결정에서 EM 알고리즘을 이용하여 뉴로-퍼지 모델의 전제부 소속함수 파라미터 추정을 실시한다. EM 알고리즘을 이용한 퍼지 모델의 특징으로는 전제부가 클러스터링에 의하여 생성되므로 입력의 차원이나 소속함수의 수가 증가하여도 규칙의 수는 증가하지 않는다. 이를 자동차 MPG 예제를 통하여 제안된 방법의 유용성을 보이고자 한다.

  • PDF