• Title/Summary/Keyword: Large-scale database

Search Result 301, Processing Time 0.032 seconds

대규모 RDF 데이터의 특성을 고려한 효율적인 색인 기법 (An Efficient Indexing Scheme Considering the Characteristics of Large Scale RDF Data)

  • 김기연;윤종현;김천중;임종태;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제15권1호
    • /
    • pp.9-23
    • /
    • 2015
  • 본 논문에서는 RDF 데이터 특성을 고려하여 대규모 데이터에 대한 질의 처리를 향상시키기 위한 새로운 색인 기법을 제안한다. 제안하는 기법은 RDF 트리플 중 주어와 술어의 값이 중복적으로 사용되는 특징을 이용하여 주어와 목적어를 S-O 색인으로 구성한다. 또한, 트리플 중 상대적으로 가장 적은 수의 값을 갖고 있는 술어는 별도의 P 색인으로 구성하여 총 색인의 크기를 최소화한다. 술어를 포함한 질의 요청시 크기가 작은 P 색인을 우선 검색하고 술어를 포함하지 않은 질의 요청에 대해서는 S-O 색인을 우선 검색한다. 성능평가를 통해 제안하는 기법이 기존 기법에 비해 질의처리 속도 관점에서 성능이 우수함을 보인다.

인천지역 일부 근로자들의 피부질환으로 인한 의료이용에 관한 연구 (Health Care Utilization of Workers with Skin Disease in Inchon)

  • 송재석;원종욱;노재훈;안연순
    • Journal of Preventive Medicine and Public Health
    • /
    • 제32권2호
    • /
    • pp.206-214
    • /
    • 1999
  • Objectives: This study was carried out to identify relation of health care utilization due to skin disease(ICD-10, L00-L99) and characteristics(sex, age, exposure status, type of industry, size of enterprise) of workers. Methods: We made new database composed of 30,536 workers' health examination results in one specific health examination institute in Inchon and data of medical insurance utilization due to skin disease in 4 medical insurance associations for enterprise from January, 1995 to December, 1997 And we analyzed determinants of health care utilization due to skin disease of workers. Results: Among 30,536 study subjects, 8,837(28.9%) workers and 4,181 (13.7%) workers utilized medical insurance due to total skin disease(ICD-10, L00-L99) and contact dermatitis(ICD-10, L23-L25), respectively. Female workers(p<.001), workers exposed to organic solvents(p<.05), workers if manufacturing industries(p<.05, p<.01, respectively) and in large scale enterprises(p<.001) utilized more medical insurance due to total skin disease and contact dermatitis than male workers, workers not exposed to organic solvents, workers in non-manufacturing industries and small scale enterprises. With multiple logistic regression analysis, significant explanatory variables affecting workers' medical utilization due to total skin disease and dermatitis and eczema(ICD-10, L20-L30) in total workers were sex, age, specific chemicals and size of enterprises. And age, type of industries, organic solvents, specific chemicals and size of enterprises were significant explanatory variables related to medical insurance utilization due to dermatitis and eczema and contact dermatitis in male workers. Conclusion: From the above results, we found that workers exposed to organic solvents utilized more medical insurance due to skin disease than workers not exposed to. And, comparing to workers in large scale enterprises, workers in small scale enterprises may have unmet medical care utilization due to skin disease. Therefore we have to establish counterplan to manage occupational skin disease of high risk group(organic solvent exposure group) and to satisfy unmet medical care utilization of workers in small scale enterprises.

  • PDF

SK텔레콤의 차세대 마케팅 시스템 개발사례 연구 (A Case Study on SK Telecom's Next Generation Marketing System Development)

  • 이상구;장시영;양정연
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권2호
    • /
    • pp.158-170
    • /
    • 2008
  • 무한 경쟁체제인 시장에서 변화하는 요구들을 수용하기 위한 해결책으로, SK 텔레콤은 향후 10년간 증가할 대용량의 데이타 및 트랜잭션을 처리하고, 다양한 마케팅활동 지원이 가능한 새로운 마케팅 시스템을 구축하였다. 이 시스템은 기존의 메인프레임 기반의 COIS시스템을 유닉스기반의 클라이언트 -서버 구조로 변경한 것이며, 웹브라우저 기반 인터페이스를 제공한다. NGM(Next Generation Marketing) 이라고 명명된 이 프로젝트는 그 규모가 전례가 없이 매우 컸다. 그러나 관리 및 기술적 문제들로 인하여 프로젝트는 위험을 맞게 되었다. 기존의 거대 벤더들이 제공하는 소프트웨어 솔루션에 기반한 어플리케이션 프레임워크가 새로운 시스템의 다양하고 방대한 요구조건을 충분히 소화시키지 못했기 때문이다. 결국 2005년 3월 SK텔레콤은 NGM 프로젝트를 보류하였다. 2005년 5월 종합적인 기획 수정을 통해 프로젝트는 2단계에 착수되었다. 새로운 시스템의 복잡도에 대응하기 위해 더 이상 단일 솔루션을 택하지 않기로 결정하여, 새로운 시스템은 커스팀 빌트의 형태가 되었다. 본 논문에서는 성공적인 NGM 프로젝트 수행을 위해 고려된 3가지 기술적 요소 - 미들웨어 및 어플리케이션 프레임워크, 데이타베이스 아키텍처, 튜닝 및 시스템 퍼포먼스 - 에 대하여 다루고 있다. NGM 구축에 있어서 적용된 이 프로세스 및 접근방법은 텔레커뮤니케이션 사업분야에서의 가장 성공적인 실제 적용사례로 볼 수 있다. 완성된 NGM 시스템은 2006년 10월 9일 성공적으로 가동되었고, "U.Key 시스템"으로 명명되었다. 이 새로운 시스템은 가까운 미래에 혁신적이고, 효과적이며 고객지향적인 어플리케이션 둥을 제공할 수 있을 것으로 기대된다.

기후변화 시나리오를 이용한 광역 사면안정 해석(2): 결과분석 (Large-Scale Slope Stability Analysis Using Climate Change Scenario (2): Analysis of Application Results)

  • 오성렬;이기하;최병습;이건혁;권현한
    • 한국지리정보학회지
    • /
    • 제17권3호
    • /
    • pp.1-19
    • /
    • 2014
  • 본 연구에서는 선행 연구된 광역 사면안정해석 방법론(기후변화 시나리오를 이용한 광역 사면안정 해석(1): 방법론)에 근거하여 기상청에서 제공하는 지역규모의 A1B 시나리오 기반의 RCM 자료와 비집수면적 개념을 도입한 GIS기반의 무한사면안정모형을 이용하여 전라북도 수계(20개 중권역)를 대상으로 미래 기후변화에 따른 사면안정 변동성을 평가하였다. 광역 사면안정해석을 위해 필요한 중요 지형학적, 지질학적, 임상학적 매개변수의 공간정보 데이터베이스를 구축하였으며, 1971년부터 2000년까지를 현재기간, 2011년부터 2100년까지를 미래기간으로 하여 연도별 일최대강우량을 입력자료로 하여 현재기간 대비 미래기간 동안의 전라북도 수계 20개 중권역에 대한 사면안정성의 변동성을 분석하였다. 전라북도 수계 전체에 대한 사면안정 해석결과, 유역전체 평균 사면안정도는 1.36으로 Moderately Stable 상태로 미래 기후변화에 따른 유역 전체의 변동 양상은 큰 차이가 없는 것으로 분석되었으며, 현재기간 대비 사면안전성이 향상되는 중권역은 7개소(용담댐, 무주남대천, 논산천, 금강하구언, 동진강, 주진천, 와탄천)였으며, 사면안정성이 지속적으로 감소하는 중권역은 5개소(용담댐하류, 영동천, 오수천, 섬진곡성, 황룡강)로 분석되었다.

극한강우량 산정을 위한 대규모 기후 앙상블 모의자료의 적용 (Application of a large-scale ensemble climate simulation database for estimating the extreme rainfall)

  • 김영규;손민우
    • 한국수자원학회논문집
    • /
    • 제55권3호
    • /
    • pp.177-189
    • /
    • 2022
  • 본 연구는 저빈도·고강도의 확률강우량 산정을 위해, 대규모 기후 앙상블 모의실험으로 생성된 d4PDF (Data for Policy Decision Making for Future Change)를 적용하는 것을 목적으로 수행되었다. 또한, d4PDF를 이용하여 산정된 확률강우량과 관측 자료 및 빈도해석을 통해서 산정된 확률강우량을 비교함으로써 빈도해석 과정의 적용에 따라 발생하는 불확실성을 분석하였다. 이와 같은 연구는 금산, 임실, 전주, 장수 관측소를 대상으로 수행되었다. d4PDF 자료는 총 50개의 앙상블로 구성되어있으며, 하나의 앙상블은 60년동안의 기상자료를 제공하기 때문에 한 지점에서 3,000개의 연 최대 일 강우량을 수집하는 것이 가능했다. 이와 같은 d4PDF의 특징을 토대로 본 연구는 빈도해석 방법을 적용하지 않고, 3000개의 연 최대 일강수량을 비모수적 접근법(Non-parametric approach)에 따라 규모별로 나열하여, 10년부터 1000년의 재현기간을 갖는 확률강우량을 산정했다. 그 후, 관측 자료와 Gumbel 및 GEV (General extreme value) 분포를 토대로 산정된 확률강우량과의 편차를 산정하였다. 그 결과, 재현기간과 관측 기간의 차이가 증가할수록 이 편차가 증가하였으며, 이 결과는 짧은 관측 기간과 빈도해석의 적용은 재현기간이 증가할수록 신뢰하기 어려운 확률강우량을 제시한다는 것을 의미한다. 반면에, d4PDF는 대규모 표본을 이용함으로써 이와 같은 불확실성을 최소화시켜 합리적인 저빈도·고강도의 확률강우량을 제시하였다.

작물학 분야 프로테오믹스의 응용과 전망 (Application and perspectives of proteomics in crop science fields)

  • 우선희
    • 한국작물학회:학술대회논문집
    • /
    • 한국작물학회 2004년도 춘계 학술대회지
    • /
    • pp.12-27
    • /
    • 2004
  • Thanks to spectacular advances in the techniques for identifying proteins separated by two-dimensional electrophoresis and in methods for large-scale analysis of proteome variations, proteomics is becoming an essential methodology in various fields of plant sciences. Plant proteomics would be most useful when combined with other functional genomics tools and approaches. A combination of microarray and proteomics analysis will indicate whether gene regulation is controlled at the level of transcription or translation and protein accumulation. In this review, we described the catalogues of the rice proteome which were constructed in our program, and functional characterization of some of these proteins was discussed. Mass-spectrometry is a most prevalent technique to identify rapidly a large of proteins in proteome analysis. However, the conventional Western blotting/sequencing technique us still used in many laboratories. As a first step to efficiently construct protein data-file in proteome analysis of major cereals, we have analyzed the N-terminal sequences of 100 rice embryo proteins and 70 wheat spike proteins separated by two-dimensional electrophoresis. Edman degradation revealed the N-terminal peptide sequences of only 31 rice proteins and 47 wheat proteins, suggesting that the rest of separated protein spots are N-terminally blocked. To efficiently determine the internal sequence of blocked proteins, we have developed a modified Cleveland peptide mapping method. Using this above method, the internal sequences of all blocked rice proteins (i. e., 69 proteins) were determined. Among these 100 rice proteins, thirty were proteins for which homologous sequence in the rice genome database could be identified. However, the rest of the proteins lacked homologous proteins. This appears to be consistent with the fact that about 30% of total rice cDNA have been deposited in the database. Also, the major proteins involved in the growth and development of rice can be identified using the proteome approach. Some of these proteins, including a calcium-binding protein that fumed out to be calreticulin, gibberellin-binding protein, which is ribulose-1,5-bisphosphate carboxylase/oxygenase activate in rice, and leginsulin-binding protein in soybean have functions in the signal transduction pathway. Proteomics is well suited not only to determine interaction between pairs of proteins, but also to identify multisubunit complexes. Currently, a protein-protein interaction database for plant proteins (http://genome .c .kanazawa-u.ac.jp/Y2H)could be a very useful tool for the plant research community. Recently, we are separated proteins from grain filling and seed maturation in rice to perform ESI-Q-TOF/MS and MALDI-TOF/MS. This experiment shows a possibility to easily and rapidly identify a number of 2-DE separated proteins of rice by ESI-Q-TOF/MS and MALDI-TOF/MS. Therefore, the Information thus obtained from the plant proteome would be helpful in predicting the function of the unknown proteins and would be useful in the plant molecular breeding. Also, information from our study could provide a venue to plant breeder and molecular biologist to design their research strategies precisely.

  • PDF

MD-FDA와 GIS를 이용한 마산만의 태풍해일 범람구역 경제성 분석 (Economic Analysis of Typhoon Surge Floodplain that Using GIS and MD-FDA from Masan Bay, South Korea)

  • 최현;안창환
    • 한국정보통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.724-729
    • /
    • 2008
  • 2003년 9월 12일 마산시 해안지역에 상륙한 태풍 '매미'는 지금까지 우리나라에서 발생한 가장 큰 연안재해를 기록하였다. 따라서 태풍해일에 대한 종합적인 방재시스템 구축과 해일피해를 대비한 세부구역별 대책수립이 시급한 실정이다. 본 연구에서는 태풍 '매미' 당시 해일로 인해 가장 큰 피해를 입었던 마산만 지역을 중심으로 최고 극조위에 따른 최대 침수구역을 산정하고 실제 침수구역과 비교분석 하여 침수모형의 정확도를 분석하고 침수해일의 방어목적으로 제안한 방재언덕등에 대한 다차원 홍수피해 산정방법을 적용하여 경제성 분석을 실시함으로써 이에 대한 타당성 평가 및 방재사업에 필요한 기초자료를 제공하는데 그 목적이 있다. 또한 향후 태풍해일 위험지역의 지형적 특성을 고려한 정확한 분석 데이터를 위하여 고해상도 위성 영상 및 LiDAR등의 데이터를 활용할 필요성이 있으며, 이를 이용하여 범람위험구역의 자료를 GIS Database화하여 보다 정확한 피해함수를 도출하여 피해를 최소화 할 수 있는 방안을 마련해야 할 것이다.

GIS를 이용한 물리탐사자료 관리시스템 개발 (A Geophysical Data Management System using GIS)

  • 김지영;최은영;김태현;최선영;고와라;윤왕중
    • 지구물리와물리탐사
    • /
    • 제6권1호
    • /
    • pp.1-6
    • /
    • 2003
  • 대형 건설 공사, 토목 공사 및 지반 분석을 위한 지반조사에서 물리탐사를 적용하여 지반 정보에 대한 방대한 양의 데이터를 획득하고 있으나, 체계적으로 관리되지 못하여 한시적으로만 사용되고 있다. 이와 같은 문제에 대한 대안으로 본 연구에서는 GIS를 이용한 물리탐사자료 관리시스템을 개발함으로써 자료의 효율적 관리와 사용자의 자료 접근 용이성을 도모하고자 하였다. 물리탐사자료 관리시스템을 실무에 이용하면 자료의 체계적 관리와 표준화가 가능할 뿐만 아니라 자료의 중복 구축을 피하고 인터넷 등을 통한 자료의 공유가 가능해짐에 따라 지표 및 지하공간을 효과적으로 개발하고 보전할 수 있는 기초 자료 제공이 가능할 것으로 기대된다.

내적상태 차원모형에 근거한 얼굴표정 합성 시스템 (A system for facial expression synthesis based on a dimensional model of internal states)

  • 한재현;정찬섭
    • 인지과학
    • /
    • 제13권3호
    • /
    • pp.11-21
    • /
    • 2002
  • 쾌-불쾌, 각성-수면의 2차원 감정상태 공간에서 임의의 좌표값을 지정하면 Parke와 Waters[1]의 근육 기반 얼굴모형에 근거하여 그것에 해당하는 표정을 자동 합성할 수 있는 시스템을 개발하였다. 얼굴 변형의 준거 설정을 위하여 정찬섭, 오경자, 이일병과 변혜란[2]의 표정 DB에 수록된 표정 자료 및 내적감정상태 모형을 사용하였다. DB 내 표정 자료들은 감정 모형에 근거하여 차원값 및 범주로 기술된 내적상태 정보를 포함하고 있었다. 내적상태 변화에 따른 표정의 변형 규칙을 찾기 위해 표집된 표정들에 대해 21개 얼굴 근육의 변화량을 측정하였다. 내적감정상태와 얼굴 근육들의 관계 구조를 파악하기 위해 수집된 자료들을 대상으로 회귀분석을 실시하였다. 이러한 과정을 거쳐 얻어진 변형 규칙은 꽤-불쾌 및 각성-수면 차원값으로 주어지는 내적상태에 대한 자연스러운 표정을 합성해내었다. 이같은 결과는 방대한 양의 자료 및 개별 근육의 변화를 포착하는 회귀분석으로부터 도출된 규칙이 얼굴표정을 합성하는데 유용하고 강력한 도구가 될 수 있음을 시사한다.

  • PDF

Extended latex proteome analysis deciphers additional roles of the lettuce laticifer

  • Cho, Won-Kyong;Chen, Xiong-Yan;Rim, Yeong-Gil;Chu, Hyo-Sub;Jo, Yeon-Hwa;Kim, Su-Wha;Park, Zee-Yong;Kim, Jae-Yean
    • Plant Biotechnology Reports
    • /
    • 제4권4호
    • /
    • pp.311-319
    • /
    • 2010
  • Lettuce is an economically important leafy vegetable that accumulates a milk-like sap called latex in the laticifer. Previously, we conducted a large-scale lettuce latex proteomic analysis. However, the identified proteins were obtained only from lettuce ESTs and proteins deposited in NCBI databases. To extend the number of known latex proteins, we carried out an analysis identifying 302 additional proteins that were matched to the NCBI non-redundant protein database. Interestingly, the newly identified proteins were not recovered from lettuce EST and protein databases, indicating the usefulness of this hetero system in MudPIT analysis. Gene ontology studies revealed that the newly identified latex proteins are involved in many processes, including many metabolic pathways, binding functions, stress responses, developmental processes, protein metabolism, transport and signal transduction. Application of the non-redundant plant protein database led to the identification of an increased number of latex proteins. These newly identified latex proteins provide a rich source of information for laticifer research.