• 제목/요약/키워드: Data dictionary

검색결과 346건 처리시간 0.021초

비디오 데이터의 내용 기반 검색과 브라우징을 위한 유동 속성 트리 및 부분 결과 행렬의 이용 방법 연구 (A Study on Flexible Attribude Tree and Patial Result Matrix for Content-baseed Retrieval and Browsing of Video Date.)

  • 성인용;이원석
    • 한국멀티미디어학회논문지
    • /
    • 제3권1호
    • /
    • pp.1-13
    • /
    • 2000
  • 연속된 비디오 스트림에는 다양한 정보가 서로간의 명확한 경계구분 없이 표현되며 비디오 신의 의미는 여러 추상화 단계로 해석되어질 수 있다. 또한 비디오에 대한 기술은 사용자의 목적에 따라 각각 다르게 표현될 수 있다. 따라서 비디오 데이터에 대한 내용 기반 검색에서는 사용자가 특정 장면에 대한 내용을 유동적으로 기술할 수 있도록 지원하여야 함과 동시에 다양한 사용자가 기술한 내용이 일관되게 유지되어야 한다. 본 논문은 관계형 모델과 객체 지향 모델과 같은 기존의 데이터 베이스 모델에서 효과적인 내용 기반 검색 및 브라우징 방법을 제안한다. 유동적으로 정의된 속성과 속성값은 트리 구조의 사전 형태로 구조화되며 비디오 데이터에 대한 기술은 고정 데이터베이스 스키마에 저장된다. 또한 본 논문에서는 사용자의 효과적인 비디오 브라우징 작업을 지원하기 위한 브라우저를 제안한다. 사전 브라우저(dictionary browser)는 사용자의 질의 표현과 의미 기술 작업을 단순화시키고, 결과 브라우저(result browser)는 사용자가 질의 조건들의 다양한 조합에 대한 질의 결과를 분석할 수 있도록 지원한다.

  • PDF

연구정보를 위한 보존 메타데이터 요소 개발에 관한 연구: 경제·인문사회연구회 연구관리시스템을 중심으로 (A Study on Preservation Metadata Elements for Research Information)

  • 김판준
    • 정보관리학회지
    • /
    • 제27권4호
    • /
    • pp.169-191
    • /
    • 2010
  • 가치 있는 디지털 정보자원으로서 연구정보를 위한 보존 메타데이터 요소를 개발하였다. 특히 국가정책지식 생산의 주역이라고 할 수 있는 경제 인문사회 분야 정부출연연구기관의 연구정보를 장기적으로 보존하여 활용할 수 있는 기반으로서 보존 메타데이터 요소를 개발하였다. 다양한 부서와 기관에서 분산 관리되고 있는 연구정보의 상호운용성을 확보하기 위하여 OAIS 참조모형을 기반으로 유럽표준인 CERIF와 PREMIS 데이터 사전의 요소들을 비교 분석한 다음, 양자의 특성을 반영하여 상호보완적인 보존 메타데이터 요소를 개발하였다. 그 결과로서 개념적 차원이 아닌 실제 구현이 가능하고 시스템 간의 호환성이 전제된 연구정보 보존 메타데이터 요소들과 적용사례를 제시하였다.

사용자 사전과 형태소 토큰을 사용한 트랜스포머 기반 형태소 분석기 (A Morpheme Analyzer based on Transformer using Morpheme Tokens and User Dictionary)

  • 김동현;김도국;김철희;신명선;서영덕
    • 스마트미디어저널
    • /
    • 제12권9호
    • /
    • pp.19-27
    • /
    • 2023
  • 형태소는 한국어에서 의미를 가진 최소단위이기 때문에, 한국어 언어모델의 성능을 높이기 위해서는 정확한 형태소 분석기의 개발이 필요하다. 기존의 형태소 분석기는 대부분 어절 단위 토큰을 입력 값으로 학습하여 형태소 분석 결과를 제시한다. 하지만 한국어의 어절은 어근에 조사나 접사가 부착된 형태이기 때문에 어근이 같은 어절이어도 조사나 접사로 인해 의미가 달라지는 성향이 있다. 따라서 어절 단위 토큰을 사용하여 형태소를 학습하면 조사나 접사에 대한 오분류가 발생할 수 있다. 본 논문에서는 형태소 단위의 토큰을 사용하여 한국어 문장에 내재된 의미를 과악하고, Transformer를 사용한 시퀀스 생성 방식의 형태소 분석기를 제안한다. 또한, 미등록 단어 문제를 해결하기 위해 학습 말뭉치 데이터를 기반으로 사용자 사전을 구축하였다. 실험 과정에서 각 형태소 분석기가 출력 한 형태소와 품사 태그를 함께 정답 데이터와 비교하여 성능을 측정하였으며, 실험 결과 본 논문에서 제시한 형태소 분석기가 기존 형태소 분석기에 비해 성능이 높음을 증명하였다.

공수 예측 모델 요도를 위한 자료 흐름도의 실험적 평가 (Experimental Estimation of Data Flow Diagram for Man/Month Prediction Model Derivation)

  • 김명옥;백청호;양해술
    • 한국정보처리학회논문지
    • /
    • 제2권1호
    • /
    • pp.34-44
    • /
    • 1995
  • 소프트웨어 개발자와 사용자에게 직면한 가장 중요한 문제는 프로그래밍 시스템 의 크기와 개발 노력의 예측이라고 할 수 있다. 본 논문에서는 자료 흐름도, 자료 사 전, 소단위 명세서로 구성된 구조화 명세서에 관한 각각의 특성을 정의하고, 구조화 명세서의 정량적인 평가 요소를 프로그램 메트릭스에 적용하였다. 또한 구조화 명세 서를 구성하는 자료 흐름도에 관해서는 정량적인 평가 실험을 하였다. 그 결과 상위 공정의 분석 단계에서의 산출물에 의한 하위 공정에 관한 공수 예측 모델을 제안한다.

  • PDF

형태소 분석을 활용한 웹 데이터 기반의 여행지 추천 사이트의 설계 및 구현 (Design and Implementation of Recommendation Sites Based on Web Data using Morphological Analysis)

  • 윤경섭;임동욱
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.311-314
    • /
    • 2018
  • 매 년 여행에 대한 관심이 증가함에 따라 여행지에 대한 정보를 찾는 사용자들의 수요가 많아지게 되었다. 현재 존재하는 여행 정보 사이트들은 사이트 회원들의 좋아요 수를 활용하여 여행지를 추천해 주기 때문에 사이트의 사용자가 많지 않을 경우 실제로 인기 있는 여행지인지 확인할 수 없어 추천 정보의 신뢰도가 떨어진다는 단점이 존재한다. 본 논문에서 제안하는 시스템은 웹상에 산재되어 있는 여행 관련 데이터들을 수집한 후 실제로 각 여행지들이 웹 사이트에서 얼마나 언급 되었는지 분석하여 언급 수로 여행지를 추천하는 시스템으로써 사이트의 사용자수에 구애받지 않는 보다 신뢰도 높은 여행지 추천에 도움을 주고자 한다.

  • PDF

A Study on Comparison of Open Application Programming Interface of Securities Companies Supporting Python

  • Ryu, Gui Yeol
    • International journal of advanced smart convergence
    • /
    • 제10권1호
    • /
    • pp.97-104
    • /
    • 2021
  • Securities and investment services had the most data per company on the average, and used the most data. Investors are increasingly demanding to invest through their own analysis methods. Therefore, securities and investment companies provide stock data to investors through open API. The data received using the open API is in text format. Python is effective and convenient for requesting and receiving text data. We investigate there are 22 major securities and investment companies in Korea and only 6 companies. Only Daishin Securities Co. supports Python officially. We compare how to receive stock data through open API using Python, and Python programming features. The open APIs for the study are Daishin Securities Co. and eBest Investment & Securities Co. Comparing the two APIs for receiving the current stock data, we find the main two differences are the login method and the method of sending and receiving data. As for the login method, CYBOS plus has login information, but xingAPI does not have. As for the method of sending and receiving data, Cybos Plus sends and receives data by calling the request method, and the reply method. xingAPI sends and receives data in the form of an event. Therefore, the number of xingAPI codes is more than that of CYBOS plus. And we find that CYBOS plus executes a loop statement by lists and tuple, dictionary, and CYBOS plus supports the basic commands provided by Python.

S-100 표준 기반 피처 카탈로그 제작지원 시스템의 설계 및 구현 (Design and Implementation of Feature Catalogue Builder based on the S-100 Standard)

  • 박대원;권혁철;박수현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권8호
    • /
    • pp.571-578
    • /
    • 2013
  • 국제수로기구(IHO)의 공간지리 공통 데이터 모델에 관한 표준인 S-100을 기반으로 하는 S-10x 데이터 제품사양(Product Specification)은 해양의 특정 분야 데이터를 제작, 배포하는 기준에 관한 표준이다. 전자해도 데이터와 같은 피처 중심의 데이터는 피처 카탈로그를 S-10x 데이터 제품사양의 주요 구성 요소로 포함한다. 피처 카탈로그는 대상 분야 및 대상 분야의 데이터에 관한 전문 지식을 갖춘 도메인 전문가에 의해 제작되어 진다. 그러나 도메인 전문가가 피처 카탈로그를 구조화된 XML 문서로 오류 없이 작성하는 것은 쉬운 일이 아니다. 국제수로기구의 TSMAD 워킹그룹 회의에서도 카탈로그의 제작을 지원하는 시스템 개발의 필요성을 제기하였다. 이에 본 논문에서는 도메인 전문가가 S-10x 제품사양의 피처 카탈로그를 일관되고 구조화된 XML 문서로 제작할 수 있도록 지원하는 시스템 도구로 피처 카탈로그 빌더를 설계, 구현하였다. 피처 카탈로그 빌더는 자바 기반의 그래픽 유저 인터페이스(GUI) 프로그램으로 개발하였다. 그리고 피처 개념 사전(Feature Concept Dictionary) 레지스터의 등록 아이템 간의 관계를 확인하고 대상 분야에 적합한 아이템을 선택할 수 있도록 피처 카탈로그 빌더를 개발하였다.

이동식 기상 레이더 자료 시스템 개발 (A Data Processing System on the Transportable Meteorological Radar)

  • 이채욱;오신범
    • 한국산업정보학회논문지
    • /
    • 제5권3호
    • /
    • pp.44-50
    • /
    • 2000
  • 본 논문에서는 이동식 기상 레이더를 효율적으로 운용하기 위한 자료 처리시스템에 관하여 논하였다. 이동식 기상 레이더는 특별한 목적을 위해 관찰 지역을 이동할 수 있다는 점에서 매우 유용한 장비이다. 무엇보다도 이 장비의 효용성을 높이기 위해서는 레이더 시스템과 기상 센터간의 원격지 데이터 전송이 이루어져야 한다. 또한 전송된 원시 데이터를 가지고 대기의 특성을 분석하고 사용자가 원하는 형태로 저장하고 표출할 수 있어야 한다. 이 논문에서는 이런 목적을 이루기 위해 레이더 시스템과 원격지 기상센터간에 데이터를 주고받기 위하여 무선 LAN 방식을 사용하였으며 또한 전송된 데이터를 이용하여 이동식 레이더에 효율적인 영상 표출 시스템을 개발하였다. 이 시스템은 실시간 에코 추적과 그래픽 및 동영상 검색에도 사용될 수 있다.

  • PDF

자연어 처리 기반 한국어 TTS 시스템 구현 (Implementation of Korean TTS System based on Natural Language Processing)

  • 김병창;이근배
    • 대한음성학회지:말소리
    • /
    • 제46호
    • /
    • pp.51-64
    • /
    • 2003
  • In order to produce high quality synthesized speech, it is very important to get an accurate grapheme-to-phoneme conversion and prosody model from texts using natural language processing. Robust preprocessing for non-Korean characters should also be required. In this paper, we analyzed Korean texts using a morphological analyzer, part-of-speech tagger and syntactic chunker. We present a new grapheme-to-phoneme conversion method for Korean using a hybrid method with a phonetic pattern dictionary and CCV (consonant vowel) LTS (letter to sound) rules, for unlimited vocabulary Korean TTS. We constructed a prosody model using a probabilistic method and decision tree-based method. The probabilistic method atone usually suffers from performance degradation due to inherent data sparseness problems. So we adopted tree-based error correction to overcome these training data limitations.

  • PDF

사전 정보와 차트 자료 구조를 이용한 효율적인 형태소 분석기 및 합성기(KoMAS) (An Efficient Korean Morpheme Analyzer and Synthesizer using Dictionary Information and Chart Data Structure)

  • 김정해;이상조
    • 전자공학회논문지B
    • /
    • 제31B권3호
    • /
    • pp.123-131
    • /
    • 1994
  • This paper describes on the analysis of morphemes and it's synthesis being constituted of Korean word phrases. To analyze morphemes, we propose the introduction of "morph" for morpheme features in lexicon and the usage of chart data structures. it controls over the generation of unnecessary morpheme, and extracts every possible morpheme unit in a word phrase which minimized lexicon investigation by using heuristic information. Moreover, to synthesize morphemes, it is composed of every possible analyzed morphemes in word phrases to take advantage of speech and union information which can be obtained for program. Therefore, the systhesis of analyzed morphemes were designed to aid a syntactic analysis next step of natural language processing. This system for analyzing and systhesizing morpheme was to generate a word phrase by unifying syntactic and semantic features of analyzed morphemes in lexicon, and then established by C language of the personal computer.

  • PDF