• 제목/요약/키워드: 데이터 중심 접근

Search Result 517, Processing Time 0.027 seconds

Data Model for Document-Centric XML Document (문서중심 XML 문서를 위한 데이터 모델)

  • 김연희;김성완;신판섭;이재호;임해철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.25-27
    • /
    • 2001
  • 웹 상의 데이터 표현 및 교환의 새로운 표준으로 인식되어 점차 그 교류의 앙이 중가하고 있는 XML 문서를 효과적으로 저장, 접근 및 검색하기 위한 기법에 대한 연구가 많았으나, 기존의 연구들은 데이터중심 문서의 특성이 두드러지는 XML 문서룬 대상으로 하는 것이 대두분이였다. 그러나 효과적인 XML 문서의 저장 및 검색을 위해서는 XML 문서의 실제 사용 목적이나 그 특성에 따라 XML 문서를 분류하여 각 특성에 맞는 저장, 접근 및 검색 기법을 개발하고 이를 통합한 XML 문서 저장 시스템의 개발이 요구된다. 따라서 본 논문에서는 통합 시스템 개발에서, 인간 이해 중심의 문서적 특성을 가지는 문서중심 문서를 위한 데이더 모델을 제안한다. 제안된 데이터 모델은 루트 노드가 존재하는 방향성과 순서가 있는 그래프 형태를 지원하며, XML 문서의 주요 구성 요소를 지원하는 여러 타입의 노드와 다양한 노드 사이의 관계를 표현하는 링크로 구성되어 XML 문서가 가지는 의미와 구조적 특징이 잗 표현되도록 하였다. 또한 모델링 후 손실되는 정보가 거의 없기 때문에, 다시 XML 문서로 변환하면 원래 XML 문서 그대로 복원되는 장점이 있어 문서중심 문서의 저장 및 검색을 위한 전용XML 저장 시스템에 적합한 데이터 모델이다.

  • PDF

Comparison of Regression Model Approaches fined to Complex Survey Data (복합표본조사 데이터 분석을 위한 회귀모형 접근법의 비교: 소규모사업체조사 데이터 분석을 중심으로)

  • 이기재
    • Survey Research
    • /
    • v.2 no.1
    • /
    • pp.73-86
    • /
    • 2001
  • In this paper. we conducted an empirical study to investigate the design and weighting effects on descriptive and analytic statistics. We compared the regression models using the design-based approach and the generalized estimating equations (GEEs) approach with the model-based approach through the design and weighting effects analysis.

  • PDF

BackTranScription (BTS)-based Jeju Automatic Speech Recognition Post-processor Research (BackTranScription (BTS)기반 제주어 음성인식 후처리기 연구)

  • Park, Chanjun;Seo, Jaehyung;Lee, Seolhwa;Moon, Heonseok;Eo, Sugyeong;Jang, Yoonna;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.178-185
    • /
    • 2021
  • Sequence to sequence(S2S) 기반 음성인식 후처리기를 훈련하기 위한 학습 데이터 구축을 위해 (음성인식 결과(speech recognition sentence), 전사자(phonetic transcriptor)가 수정한 문장(Human post edit sentence))의 병렬 말뭉치가 필요하며 이를 위해 많은 노동력(human-labor)이 소요된다. BackTranScription (BTS)이란 기존 S2S기반 음성인식 후처리기의 한계점을 완화하기 위해 제안된 데이터 구축 방법론이며 Text-To-Speech(TTS)와 Speech-To-Text(STT) 기술을 결합하여 pseudo 병렬 말뭉치를 생성하는 기술을 의미한다. 해당 방법론은 전사자의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축 할 수 있다. 본 논문은 BTS를 바탕으로 제주어 도메인에 특화된 음성인식 후처리기의 성능을 향상시키기 위하여 모델 수정(model modification)을 통해 성능을 향상시키는 모델 중심 접근(model-centric) 방법론과 모델 수정 없이 데이터의 양과 질을 고려하여 성능을 향상시키는 데이터 중심 접근(data-centric) 방법론에 대한 비교 분석을 진행하였다. 실험결과 모델 교정없이 데이터 중심 접근 방법론을 적용하는 것이 성능 향상에 더 도움이 됨을 알 수 있었으며 모델 중심 접근 방법론의 부정적 측면 (negative result)에 대해서 분석을 진행하였다.

  • PDF

Service-oriented Public Organizations and Human Resources Based on Enterprise-wide Big Data (전사적 빅데이터를 활용한 서비스 중심적 공공 조직 및 인사 관리 방안)

  • Jeonghee Choi;Seunguk Park
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.361-362
    • /
    • 2023
  • 본 연구는 공공 조직 및 인사 관리의 새로운 패러다임으로서 서비스 중심적 접근법을 제시하였다. 특히 코로나19 팬데믹 이후의 불확실하고 경쟁적인 환경에서는 파편화된 데이터를 마이크로 서비스화하고 동적으로 재조합하는 것이 중요하며, 이를 실현하기 위한 모델로 KISTI의 ScienceON API Gateway와 시나리오 활용 서비스를 참고하였다. 이러한 접근법은 조직 및 인사 관리의 투명성과 효율성을 높이며, 서비스-이용자 간 상호작용을 강화하고, 조직의 변화를 촉진하는 데 기여할 것으로 기대된다.

Comparison of regression model approaches fitted to complex survey data (복합표본조사 데이터 분석을 위한 회귀모형 접근법의 비교 - 소규모사업체조사 데이터 분석을 중심으로 -)

  • 이기재
    • Proceedings of the Korean Association for Survey Research Conference
    • /
    • 2001.06a
    • /
    • pp.45-56
    • /
    • 2001
  • In this paper, we conducted an empirical study to investigate the design and weighting effects on descriptive and analytic statistics. We compared the regression models using the design-based approach and the generalized estimating equations(GEEs) approach with the model-based approach through the design and weighting effects analysis.

  • PDF

A Study on Improving Minimum Level of Service for Public Transportation Using Altteul Transport Card Data (알뜰교통카드를 활용한 대중교통 최소서비스 수준 분석 기준 개선 방안 연구)

  • Sangwoo Shim;Junyoung Joung;Kwankyo Oh;Minseok Kim
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.22 no.3
    • /
    • pp.104-115
    • /
    • 2023
  • User-centered public transportation services such as DRT, Autonomous Transit etc. have been provied but current minimum level of service for public transportation has been evaluated by the operator because there is no data on user's accessibility to use public transportation. This study was performed GRID analysis using altteul transport card data including user's accessibility to use public transportation. The analysis result showed that user's accessibility to use public transportation was different within a same dong area. We proposed improving minimum level of service for public transportation considered by the user. The result of applying the proposed method showed that many area was changed to unsatisfied area for minimum level of service for public transportation

Comparison of Regression Model Approaches fitted to Complex Survey Data (복합표본조사 데이터 분석을 위한 회귀모형 접근법의 비교: 소규모사업체조사 데이터 분석을 중심으로)

  • 이기재
    • Proceedings of the Korean Association for Survey Research Conference
    • /
    • 2001.04a
    • /
    • pp.73-86
    • /
    • 2001
  • In this paper, we conducted an empirical study to investigate the design and weighting effects on descriptive and analytic statistics. We compared the regression models using the design-based approach and the generalized estimating equations(GEEs) approach with the model-based approach through the design and weighting effects analysis.

SPARQL Query Tool for Web-based OWL Ontology Access (웹 기반 OWL 온톨로지 접근을 위한 SPARQL 쿼리 툴)

  • Daewoong Jo;Jeewoong Choe;Myungho Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.56-59
    • /
    • 2008
  • 지금까지의 웹은 표현중심의 HTML에서 데이터의 구조적인 모습을 나타내는 XML로 그리고, 온톨로지 구축을 통해 의미 있는 데이터의 접근성에 초점을 둔 RDF, RDFS, OWL과 같은 형태로 변화하고 있다. 이러한 흐름을 통해 현재는 OWL을 이용하여 온톨로지 구축을 위한 연구가 진행 중이다. 이 논문에서는 구축된 온톨로지를 활용하기 위해 웹에 있는 OWL 파일을 http 프로토콜을 이용하여 접근을 하고 기존의 툴 종속적인 접근이 아닌 웹 표준 프로토콜과 OWL 파일 형식으로 접근하여 SPARQL 쿼리를 보낼 수 있는 웹 기반의 OWL 온톨로지 접근을 위한 SPARQL 쿼리 툴을 제안한다.

A Workload Analysis of Distributed Object Store to Backend Storage (분산 오브젝트 저장 플랫폼의 스토리지 접근 워크로드 특성 분석)

  • Han, Yuil;Lee, Eunji
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.6-7
    • /
    • 2017
  • 디지털 데이터의 폭발적 증가와 형태의 다양화는 최근 비정형 대규모 저장 플랫폼의 급격한 확산을 이끌고 있다. 이러한 비정형 데이터 저장 시스템은 전통적인 파일시스템과 데이터를 저장 및 처리하는 방식이 상이하여 높은 성능을 위해서는 기존 하위 시스템의 최적화가 필요하다. 이에 본 논문에서는 최근 급부상하고 있는 분산 오브젝트 스토어인 Ceph을 중심으로 오브젝트 스토어의 스토리지 접근 패턴을 분석하는 연구를 수행한다. 본 연구는 상위 계층의 접근패턴을 구체적으로 이해함으로써 차세대 데이터 플랫폼을 효율적으로 지원할 수 있는 스토리지 시스템을 개발하는 데에 기여한다고 하겠다.