• 제목/요약/키워드: 데이터 삽입

검색결과 765건 처리시간 0.028초

하천공간정보의 온톨로지 구축방안 연구 (Construction of Ontology for River GeoSpatial Information)

  • 신형진;신승희;황의호;채효석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.627-627
    • /
    • 2015
  • 기존 물관련 시스템들은 독자적인 DB 구조를 가지고 있고 검색 서비스는 자체 시스템의 DB를 직접 접근하여 사용자에게 결과를 제시하는 형식이다. 이러한 서비스의 단점은 사용자가 개별 시스템의 서비스에 대한 지식이 없으면 접근하기 어렵다는 점이다. 개별 시스템의 개별 서비스의 개념을 벗어나기 위하여 물관련 시스템에 있는 하천공간자료 검색 정보를 카탈로그 서버에 등록하고, 카탈로그 서버에 등록된 검색정보를 사용자가 검색하는 방식을 적용하고자 한다. 카탈로그 서버에 자료에 대한 정보를 등록할 때 자료의 정보를 어떻게 기술할 것인가의 문제가 발생한다. 개별 서버마다 등록하게 된다면 용어 및 문화에 의한 차이로 같은 개념을 다른 용어로 등록하게 되는 혼란이 발생할 소지가 있다. 예를 들어 강우자료에 대하여 "강우", "Precipitation", "Railfall", "비" 등으로 등록할 소지가 있다. 이러면 실제 자료가 존재하는 데도 등록 방법에 따라 자료의 검색이 어려워진다. 이러한 상황을 제어하기 위하여 검사어휘(Controlled Vocabulary)를 도입한다. 이는 포털의 운영자가 미리 용어의 개념과 용어의 분류체계를 설정하고 등록 자료의 검색어를 미리 설정하여 자료의 원천 소유자가 자료를 등록 시 검사어휘를 참고하여 등록하거나 또는 등록되지 않는 용어의 자료인 경우 이 용어를 포탈에 신규로 등록한다. 검색용어의 난립을 피하기 위하여 사용자의 신규등록은 포탈의 운영자가 어느 정도 제어할 필요가 있다. 검사어휘의 정립과 하천 관련된 분류체계는 하천공간정보 검색의 포탈을 위한 필수사항이다. 검사어휘의 정립의 주된 목적은 이질성의 극복이다. 이질성의 종류는 문법적 이질성, 데이터 형식과 구조 및 문맥적 이질성이 있다. 이 중에서 문맥적 이질성이 가장 넓고 어려운 문제이다. 단위는 분야마다 호칭이 다르고 채택하는 기준마다 다르다. 유사어는 전문용어라도 분야마다 다르다. 우리나라에서 서비스 인코딩시 국어와 영어를 어떻게 처리할 지에 대한 대책도 필요하다. 수문학의 시계열 자료를 다루는 CUAHSI/HIS의 온톨로지는 대 개념으로 물리학적, 화학적 및 생물학적인 분야로 분류하고 있다. 하천공간정보의 온톨로지 구축을 위해 데이터 분석 및 분류, 온톨로지 요소 설정, 온톨로지 데이터 테이블 작성, 클래스 생성 및 계층화, 클래스 계층화에 따른 속성 설정, 클래스에 적합한 개체 삽입, 논리 관계 확인 및 수정과 같은 과정으로 온톨로지 개발을 진행하고자 한다.

  • PDF

웨이블릿 부대역의 히스토그램 특성과 통계적 모멘트를 이용한 스테그분석 (Steganalysis Using Histogram Characteristic and Statistical Moments of Wavelet Subbands)

  • 현승화;박태희;김영인;김유신;엄일규
    • 대한전자공학회논문지SP
    • /
    • 제47권6호
    • /
    • pp.57-65
    • /
    • 2010
  • 본 논문은 스테가노그래피 알고리즘에 대한 블라인드 스테그분석 기법을 제안한다. 제안하는 스테그분석기법은 두 가지 형태의 특징 벡터를 추출한다. 첫 번째로, 영상에 정보를 은닉한 후 웨이블릿 부대역의 히스토그램 특성이 변한다는 것을 관찰하고 히스토그램의 위치 변화를 특징으로 이용한다. 두 번째로, 웨이블릿 특성 함수의 통계적 모멘트를 특징으로 이용한다. 첫번째 형태의 특징은 영상을 3-레벨 웨이블릿 변환하여 9개의 고주파 부대역에서 각각 하나의 특징을 추출하여 총 9개의 특징 벡터 얻는다. 두 번째 형태의 특징은 각 부대역별로 3차 모멘트까지 추출하여 39개의 특징 벡터를 얻는다. 총 48개의 특징 벡터를 교사학습을 이용하여 학습한 후 스테고 영상과 커버 영상을 분류한다. 다층 퍼셉트론 신경망 분류기를 이용하여 두 가지 형태의 특징을 입력으로 하여 삽입 데이터의 존재유무를 판별한다. 제안 방법의 성능을 평가하기 위하여 CorelDraw 데이터베이스 영상이 사용되었고 LSB 방법과 SS방법, blind SS방법, F5방법으로 다양한 삽입률의 스테고 영상을 생성하여 실험한다. 민감도와 특이도, 에러율, ROC 커브 면적 등을 이용하여 제안 방법이 기존의 스테그분석 방법보다 삽입 정보 유무를 검출하는데 효과적임을 보여준다.

동기화된 데이터방송을 위한 근사적인 NPT 재구성 기법 (An Approximate Reconstruction of NPT for Synchronized Data Broadcasting)

  • 정문열;김용한;백두원
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.83-90
    • /
    • 2004
  • DVB-MHP에서는 NPT(normal play time)를 스트림 이벤트의 시각으로 쓰기를 권하고 있다. NPT는 특정 이벤트(프로그램) 내부의 국지시간이다. 현재 상용으로 나와 있는 전송 스트림(TS) 생성기와 TV 미들웨어는 아직 NPT를 지원하지 못하고 있다. 특히 전송 스트림 생성기가 셋톱박스에서 NPT를 재구성하는데 필요한 NPT참조서술자를 생성하지 않고 있다. 이로 인해 PP가 연동형 애플리케이션(Xlet)의 아이디어를 실험하는 것이 불가능하다. 이에 우리는 TS에 NPT 참조서술자를 삽입하는 스트림 생성기와 NPT를 근사적으로 재구성하는 MyGetNPT API를 구현하였는데, 본 논문은 그 방법을 기술한다 NPT 재구성 API를 구현하기 위해서는 STC(system time clock) 값을 알 필요가 있으나, Xlet에서는 STC를 읽을 수 없다. 따라서 본 연구에서는 TS를 통해 전송되는 PCR (program clock reference) 과 Java 시스템 타임을 이용하여 STC를 근사적으로 계산하는 방법을 제안한다. 이 방법에서 전송 스트림 생성기는 이미 존재하는 TS로부터 PCR 들을 추출한 후, 이를 TS의 null 패킷에 Xlet에서 읽을 수 있는 MPEG 섹션의 형태로 삽입한다. 이때, PCR이 TS 내의 원래 위치에서 이동하여 다른 위치에 삽입되므로, PCR 값은 TS내의 원래 위치와 새로운 위치간의 시간 차이를 고려하여 수정한다. 구현한 TS 생성기와 MyGetNPT API를 이용하여 그래픽 이미지의 디스플레이가 목적인 스트림 이벤트를 가진 연동형 애플리케이션을 구현하여 실험을 하였다. 그 결과 그래픽 이미지들이 원래 의도된 시점으로부터 240ms 이내에 비디오와 동기화 되는 것을 확인하였다. 이 시간은 기존의 연구에서 발견된 그래픽 이미지와 비디오간의 동기화 오차 허용한계이다.

직접인장시험에 의한 원형 비부착면이 삽입된 신.구 콘크리트의 부착강도 및 파괴에너지 산정 (Determination of Bond Strength and Fracture Energy of a Bi-material Cylinder with Peny-shaped Interface Crack by Pull-off Test)

  • 양성철;김진철;박종원
    • 한국도로학회논문집
    • /
    • 제6권1호
    • /
    • pp.47-56
    • /
    • 2004
  • 신 구 콘크리트의 부착강도 시험시 두 재료의 계면에서 파괴가 유도되어 순수한 부착강도를 측정할 수 있도록 계면에 원형의 비부착면을 삽입하여 직접인발시험에 의해 부착강도를 측정하는 실험방법을 제시하였다. 먼저, 새로 제안한 실험방법에 의해 계면에서 응력이 집중되는 정도를 파악하기 위해 유한요소해석을 수행하여 두 재료의 탄성계수비 및 비부착면의 면적 (균열률)에 따른 계면에서의 파괴에너지를 산정하였으며, 부재의 크기 및 하중에 대한 보정을 감안하여 무차원함수로 환산하였다. 그리고 본 연구에서 제시된 부착강도 시험방법의 신뢰성을 입증하기 위해, 3가지 크기의 원형 비부착면(균열률 0.2, 0.4. 0.6)이 삽입된 신 구 콘크리트 복합시편(유황 폴리머 콘크리트+보통 콘크리트)을 사용하여 부착강도를 측정하였고 앞서 전개된 무차원함수로부터 계면 파괴에너지를 역산하였다. 시험결과, 모든 시편이 계면에서 파괴가 유도되었다. 또한 실험 데이터 및 해석결과를 분석하여 균열률이 0.4$\sim$0.6인 경우에 부착강도의 오차가 가장 적게 발생될 수 있음을 파악하였다.

  • PDF

데이터마이닝 기법을 이용한 기업부실화 예측 모델 개발과 예측 성능 향상에 관한 연구 (Development of Prediction Model of Financial Distress and Improvement of Prediction Performance Using Data Mining Techniques)

  • 김량형;유동희;김건우
    • 경영정보학연구
    • /
    • 제18권2호
    • /
    • pp.173-198
    • /
    • 2016
  • 본 연구의 목적은 비즈니스 인텔리전스 연구 관점에서 기업부실화 예측 성능을 향상키시는 것이다. 이를 위해 본 연구는 기존 연구들에서 미흡하게 다루어졌던 1) 데이터셋을 구성하는 과정에서 발생하는 바이어스 문제, 2) 거시경제위험 요소의 미반영 문제, 3) 데이터 불균형 문제, 4) 서술적 바이어스 문제를 다루어 경기순환국면을 반영한 기업부실화 예측 프레임워크를 제안하고, 이를 바탕으로 기업부실화 예측 모델을 개발하였다. 본 연구에서는 경기순환국면별로 각각의 데이터셋을 구성하고, 각 데이터셋에서 의사결정나무, 인공신경망 등 단일 분류기부터 앙상블 기법까지 다양한 데이터마이닝 알고리즘을 적용하여 실험하였다. 또한 본 연구는 데이터불균형 문제를 해결하기 위해, 오버샘플링 기법인 SMOTE(synthetic minority over-sampling technique) 기법을 통해 초기 데이터 불균형 상태에서부터 표본비율을 1:1까지 변화시켜 가며, 기업부실화 예측 모델을 개발하는 실험을 하였고, 예측 모델의 변수 선정 시에 선행연구를 바탕으로 재무비율을 추출하고, 여기서 파생된 IT 산출물인 재무상태변동성과 산업수준상태변동성을 예측 모델에 삽입하였다. 마지막으로, 본 연구는 각 순환국면에서 만들어진 기업부실화 예측 모델의 예측 성능 비교와 경기 확장기와 수축기에서의 기업부실화 예측 모델의 유용성에 대해 논의하였다. 본 연구는 비즈니스 인텔리전스 연구 측면에서 기존 연구에서 미흡하게 다루어졌던 4가지 문제점을 검토하고, 이를 해결할 프레임워크를 제안함으로써 기존 연구 대비 기업부실화 예측률을 10% 이상 향상시켰다는 점에서 연구의 의의를 찾을 수 있다.

이질성 학습을 통한 문서 분류의 정확성 향상 기법 (Improving the Accuracy of Document Classification by Learning Heterogeneity)

  • 윌리엄;현윤진;김남규
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.21-44
    • /
    • 2018
  • 최근 인터넷 기술의 발전과 함께 스마트 기기가 대중화됨에 따라 방대한 양의 텍스트 데이터가 쏟아져 나오고 있으며, 이러한 텍스트 데이터는 뉴스, 블로그, 소셜미디어 등 다양한 미디어 매체를 통해 생산 및 유통되고 있다. 이처럼 손쉽게 방대한 양의 정보를 획득할 수 있게 됨에 따라 보다 효율적으로 문서를 관리하기 위한 문서 분류의 필요성이 급증하였다. 문서 분류는 텍스트 문서를 둘 이상의 카테고리 혹은 클래스로 정의하여 분류하는 것을 의미하며, K-근접 이웃(K-Nearest Neighbor), 나이브 베이지안 알고리즘(Naïve Bayes Algorithm), SVM(Support Vector Machine), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network) 등 다양한 기술들이 문서 분류에 활용되고 있다. 특히, 문서 분류는 문맥에 사용된 단어 및 문서 분류를 위해 추출된 형질에 따라 분류 모델의 성능이 달라질 뿐만 아니라, 문서 분류기 구축에 사용된 학습데이터의 질에 따라 문서 분류의 성능이 크게 좌우된다. 하지만 현실세계에서 사용되는 대부분의 데이터는 많은 노이즈(Noise)를 포함하고 있으며, 이러한 데이터의 학습을 통해 생성된 분류 모형은 노이즈의 정도에 따라 정확도 측면의 성능이 영향을 받게 된다. 이에 본 연구에서는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 이를 통해 분류의 정확도를 향상시킬 수 있는 방안을 제안하고자 한다. 즉, 분류의 대상이 되는 원 문서와 전혀 다른 특징을 갖는 이질적인 데이터소스로부터 추출한 형질을 원 문서에 일종의 노이즈의 형태로 삽입하여 이질성 학습을 수행하고, 도출된 분류 규칙 중 문서 분류기의 정확도 향상에 기여하는 분류 규칙만을 추출하여 적용하는 방식의 규칙 선별 기반의 앙상블 준지도학습을 제안함으로써 문서 분류의 성능을 향상시키고자 한다.

마하-젠더 광 변조기와 EDFA를 사용한 아날로그 광통신 링크의 랜덤 지터 특성 (Characteristics of Random Jitter in Analog Fiber-Optic Links Employing a Mach-Zehnder Modulator and an EDFA)

  • 윤영민;이민영;신종덕;김부균
    • 전기전자학회논문지
    • /
    • 제13권4호
    • /
    • pp.96-102
    • /
    • 2009
  • 마하-젠더 광 변조기(Mach-Zehnder modulator; MZM)와 EDFA(erbium-doped fiber amplifier)를 사용한 아날로그 광통신 링크의 랜덤 지터 (Random Jitter; RJ) 특성에 관하여 연구하였다. RF 주파수 분석기의 잡음 스펙트럼 데이터를 이용한 지터 측정법과 샘플링 오실로스코프의 히스토그램 데이터를 이용한 지터 측정법의 두 가지 방법으로 RJ를 구하였다. MZM에 인가되는 광 파워나 RF 파워가 증가하면 출력 신호 파워가 증가하여 RJ가 감소하였다. EDFA가 삽입되지 않은 링크에서 잡음 스펙트럼으로 측정한 최소 RJ는 RF 파워 10 dBm, 광 파워 8 dBm인 경우에 약 1 ps으로 나타났다. EDFA를 삽입한 링크에서는 EDFA 이득이 증가하면 RJ가 지속적으로 감소하여 지터 바닥에 수렴하였다. 이 보다 이득이 증가하면 다시 RJ가 증가하는 것을 관찰하였다. EDFA의 이득이 동일하면, 입력 광 파워가 클 때 RJ의 크기가 보다 작았고, 또한 입력 광 파워가 작은 경우에는 EDFA 이득이 증가함에 따라 RJ의 감소율이 보다 크게 나타났다.

  • PDF

무선데이터 통신을 위한 고효율 광대역 마이크로스트립 대역통과 필터 특성에 관한 연구 (A study on characteristics of High Efficiency and Wideband Microstrip Band Pass Filter for Wireless Data Communication)

  • 이영훈;송성해;박원우;이상재
    • 전기전자학회논문지
    • /
    • 제12권4호
    • /
    • pp.225-233
    • /
    • 2008
  • 본 논문에서는 고속 무선데이터 통신을 위하여 구형공진기와 SIOS를 사용하여 삽입손실이 작고, 차단특성이 아주 좁고, 광대역 특성을 갖는 마이크로스트립 대역통과필터를 연구하였다. 계단 임피던스 스터브는 일반 0.25${\lambda}$보다 30%의 길이를 줄일 수 있고, 또한 스터브의 임피던스의 크기를 변경할 수를 줄일 수 있는 장점이 있음으로 필터의 특성 개선에 적용할 수 있다. 본 논문의 객관성을 입증하기 위해서 최적화된 광대역 대역통과 필터를 구현하였다. 전송선로 모델을 사용하여 계산한 주파수 특성 결과는 실험값과 아주 잘 일치하였다. 구현된 필터의 모드발생스터브에 의하여 발생한 극점은 저 주파수 대역에서 3.610GHz, 4.265GHz, 고주파수 대역에서 8.494GHz, 9.056GHz이다. 필터의 3dB 대역폭은 58%(3.695GHz)이고, 삽입손실은 0.37dB, 30dB이고, 차단특성은 저 주파수 대역에서 237MHz, 고주파수대역에서 234MHz이다.

  • PDF

Tmr-트리 : 주기억 데이터베이스에서 효율적인 공간 색인 기법 (Tmr-Tree : An Efficient Spatial Index Technique in Main Memory Databases)

  • 윤석우;김경창
    • 정보처리학회논문지D
    • /
    • 제12D권4호
    • /
    • pp.543-552
    • /
    • 2005
  • 최근 들어 계속되는 램 가격 하락으로 인해 대용량의 램을 사용하는 주기억 데이터베이스 시스템의 구축이 실현 가능하게 되었다. 그러나 기존의 디스크 기반 공간 색인 기법은 디스크 접근 시간만을 주로 고려하기 때문에, 주기억 색인 기법으로 디스크 기반 색인 기법을 직접적으로 적용시키는 것은 부적절하다. 주기억 장치 색인 기법은 모든 색인 노드들이 주기억 장치에 상주하기 때문에 노드에 대한 접근 시간이 디스크 기반 기법에 비해 상당히 미미하고, 결국 효율적인 색인 기법을 위해서는 노드 접근시간 뿐만 아니라 노드내의 키 비교시간을 고려해야 한다. 이러한 주기억 장치 색인 기법의 특성을 고려하여, 본 논문에서는 Tmr-트리라는 새로운 색인 기법을 제시한다. Tmr-트리는 T-트리의 장점과 R-트리의 장점을 결합한 이진 색인 구조로서, 색인 노드는 데이터 객체들을 위한 엔트리들, 왼쪽/오른쪽 자식 노드에 대한 포인터, 그리고 3개의 추가 필드들로 구성된다. 여기서 3개의 추가 필드들은 현재 노드에 저장된 키 값들의 범위를 포함하는 MBR과 왼쪽 서브트리에 저장된 키 값들의 범위를 포함하는 MBR, 오른쪽 서브트리에 저장된 키 값들의 범위를 포함하는 MBR에 해당한다. 본 논문의 실험에서 Tmr-트리는 R-트리와 달리 검색 시 항상 리프노드까지 방문할 필요가 없기 때문에 모든 데이터 분포에서 R-트리에 비해 더 나은 실험 결과를 보여주었다. 노드 크기 측면에서 노드안 엔트리 수를 증가시킨 초반에 상당한 검색성능 향상을 보여주었으며, 그 후로 약간씩 검색시간 증가를 나타냈다. 한편, 삽입시간 측면에서 Tmr-트리는 R-트리에 비해 약간의 더 많은 삽입시간이 필요했다.

MVCC 지원 스킵 리스트의 범위 탐색 향상 기법 (An Enhancing Technique for Scan Performance of a Skip List with MVCC)

  • 김이주;이은지
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권5호
    • /
    • pp.107-112
    • /
    • 2020
  • 본 논문에서는 LSM-tree 기반 키밸류 스토어에서 인메모리 데이터 관리를 위해 사용되는 스킵 리스트에 대한 연구를 수행하였다. 키밸류 스토어에서 사용되는 스킵 리스트는 덮어쓰기를 허용하지 않고 삽입만으로 모든 변경을 처리하는 삽입 기반 스킵 리스트이다. 이러한 동작 방식은 스냅샷 분리(Snapshot Isolation)을 통해 다중 읽기/쓰기 요청을 동시다발적으로 처리할 수 있는 MVCC(Multi-Version Concurrency Control)을 지원할 수 있다. 그러나 중복된 키가 다수 스킵 리스트에 존재함에 따라 리스트 탐색 시 불필요한 노드 방문으로 성능이 심각하게 저하될 수 있다. 특히 특정 범위의 데이터를 집합적으로 탐색하는 범위 탐색(Range Query)나 스캔(Scan) 연산 발생 시 심각한 오버헤드가 발생한다. 본 논문은 이러한 오버헤드를 줄이기 위해 새롭게 고안된 스트라이드 스킵 리스트(Stride Skip List)를 제안한다. 스트라이드 스킵 리스트는 동일 키의 마지막 노드에 대한 인덱싱 포인터를 추가적으로 유지하여 불필요한 노드 방문을 피할 수 있도록 한다. 제안된 기법은 RocksDB의 인메모리 컴포넌트를 활용하여 구현되었으며 다양한 워크로드에서 SCAN 연산의 성능을 기존 스킵 리스트 대비 최대 350배까지 향상시켰다.