• Title/Summary/Keyword: Multi database

Search Result 685, Processing Time 0.028 seconds

이미지 내의 텍스트 데이터 인식 정확도 향상을 위한 멀티 모달 이미지 처리 프로세스 (Multi-modal Image Processing for Improving Recognition Accuracy of Text Data in Images)

  • 박정은;주경돈;김철연
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.148-158
    • /
    • 2018
  • 광학 문자 인식(OCR)은 텍스트를 포함한 이미지에서 텍스트 영역을 인식하고 이로부터 텍스트를 추출하는 기술이다. 전체 텍스트 데이터 중 상당히 많은 텍스트 정보가 이미지에 포함되어 있기 때문에 OCR은 데이터 분석 분야에 있어 중요한 전처리 단계를 담당한다. 대부분의 OCR 엔진이, 흰 바탕의 검정 글씨의 단순한 형태를 가진 이미지와 같은, 텍스트와 배경의 구분이 뚜렷한 저 복잡도 이미지에 대해서는 높은 인식률을 보이는 반면, 텍스트와 배경의 구분이 뚜렷하지 않은 고 복잡도 이미지에 대해서는 저조한 인식률을 보이기 때문에, 인식률 개선을 위해 입력 이미지를 OCR 엔진이 처리하기 용이한 이미지로 변형하는 전처리 작업이 필요하게 된다. 따라서 본 논문에서는 OCR 엔진의 정확성 증대를 위해 텍스트 라인별로 이미지를 분리하고, 영상처리 기법 기반의 CLAHE 모듈과 Two-step 모듈을 병렬적으로 수행하여 텍스트와 배경 영역을 효율적으로 분리한 후 텍스트를 인식한다. 이어서 두 모듈의 결과 텍스트에 대하여 N-gram방법과 Hunspell 사전을 결합한 알고리즘으로 인식률을 비교하여 가장 높은 인식률의 결과 텍스트를 최종 결과물로 선정하는 방법론을 제안한다. 대표적인 OCR 엔진인 Tesseract와 Abbyy와의 다양한 비교 실험을 통해 본 연구에서 제안하는 모듈이 복잡한 배경을 가진 이미지에서 가장 정확한 텍스트 인식률을 보임을 보였다.

장기요양 필요 발생의 고위험 대상자 발굴을 위한 예측모형 개발 (Development of prediction model identifying high-risk older persons in need of long-term care)

  • 송미경;박영우;한은정
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.457-468
    • /
    • 2022
  • 고령인구가 증가함에 따라 국가차원에서 노인의 건강노화 실현을 위한 장기요양 필요 발생의 예방 방안을 마련하는 것은 매우 중요하며, 정책적 효과를 극대화하기 위해서는 적절한 대상자의 선정이 선행되어야 한다. 이에 본 연구는 국민건강보험공단의 국민건강정보를 활용하여, 장기요양 필요를 야기하는 기능장애 발생 가능성이 높은 대상자를 발굴하기 위한 예측모형을 개발하고자 한다. 본 연구는 연구대상자의 과거 수집된 자료를 활용하는 후향적 연구로, 본 연구의 연구대상자는 만 65세 이상 의료보장등록인구이다(총 7,724,101명). 예측모형 개발을 위해 고유 방법인 로지스틱 회귀모형, 머신러닝 방법인 의사결정나무와 랜덤포레스트, 딥러닝 방법인 다층퍼셉트론 신경망을 분석하였다. 체계적 분석절차를 통해 각 분석방법별 모형을 적합하였고, 내적 타당성 및 외적 타당성 평가 결과를 기반으로 최종 예측모형을 랜덤포레스트로 선정하였다. 랜덤포레스트는 모집단에서의 4.50%밖에 되지 않는 장기요양 필요 대상자의 약 90%를 장기요양 필요 발생 고위험 대상자로 예측할 수 있다. 본 연구의 예측모형 및 고위험군 기준은 노인의 욕구 중심에서 예방 서비스가 필요한 대상자를 선제적으로 발굴하는데 기여할 것으로 기대된다.

Commercial fishery assessment of Malaysian water offshore structure

  • Mohd, Mohd Hairil;Thiyahuddin, Mohd Izzat Mohd;Rahman, Mohd Asamudin A;Hong, Tan Chun;Siang, Hii Yii;Othman, Nor Adlina;Rahman, Azam Abdul;Rahman, Ahmad Rizal Abdul;Fitriadhy, Ahmad
    • Fisheries and Aquatic Sciences
    • /
    • 제25권9호
    • /
    • pp.473-488
    • /
    • 2022
  • To have a better understanding of the impact of the PETRONAS oil and gas platform on commercial fisheries activities, Universiti Malaysia Terengganu (UMT) examined two approaches which are data collection from satellite and data collection from fishermen and anglers. By profiling the anglers who utilize reefed oil and gas structures for fishing, it can determine if the design and location of the reef platforms will benefit or negatively impacts those anglers and fisherman. Furthermore, this assessment will be contributing to the knowledge regarding the value of offshore oil and gas platforms as fisheries resources. Collectively, the apparent fishing activity data included, combined with the findings in the reefing viability index will help to inform PETRONAS's future decommissioning decisions and may help determine if the design and proposed locations for future rigs-to-reefs candidates would benefit commercial fishing groups, further qualifying them as appropriate artificial reef candidates. The method applied in this study is approaching by using a data satellite known as Google's Global Fishing Watch technology, which is one of the applications to measure commercial fishing efforts around the globe. The apparent commercial fishing effort around the selected twelve PETRONAS platforms was analyzed from January 2012 to December 2018. Using the data collection from fishermen which is the total estimation of commercial fish value cost (in Malaysia ringgit, MYR [RM]) in Peninsular Malaysia Asset, Sabah Asset, and Sarawak Operation region. The data were extracted every month from 2016 to 2018 from the National Oceanic and Atmospheric Administration database. Most of the selected platforms that show a high frequency of vessels around the year are platform KP-A, platform BG-A and platform PL-B. The estimated values of commercial fishes varied between platforms, with ranged from RM 10,209.92 to RM 89,023.78. Thus, platforms with high commercial fish value are selected for reefing in-situ and will serve multi-purposes and benefit the locals as well as the country. The current study has successfully assessed the potential reefing area of the Malaysian offshore environment with greater representativeness and this paper focused on its potential as a new fishing ground.

Position of Hungarian Merino among other Merinos, within-breed genetic similarity network and markers associated with daily weight gain

  • Attila, Zsolnai;Istvan, Egerszegi;Laszlo, Rozsa;David, Mezoszentgyorgyi;Istvan, Anton
    • Animal Bioscience
    • /
    • 제36권1호
    • /
    • pp.10-18
    • /
    • 2023
  • Objective: In this study, we aimed to position the Hungarian Merino among other Merinoderived sheep breeds, explore the characteristics of our sampled animals' genetic similarity network within the breed, and highlight single nucleotide polymorphisms (SNPs) associated with daily weight-gain. Methods: Hungarian Merino (n = 138) was genotyped on Ovine SNP50 Bead Chip (Illumina, San Diego, CA, USA) and positioned among 30 Merino and Merino-derived breeds (n = 555). Population characteristics were obtained via PLINK, SVS, Admixture, and Treemix software, within-breed network was analysed with python networkx 2.3 library. Daily weight gain of Hungarian Merino was standardised to 60 days and was collected from the database of the Association of Hungarian Sheep and Goat Breeders. For the identification of loci associated with daily weight gain, a multi-locus mixed-model was used. Results: Supporting the breed's written history, the closest breeds to Hungarian Merino were Estremadura and Rambouillet (pairwise FST values are 0.035 and 0.036, respectively). Among Hungarian Merino, a highly centralised connectedness has been revealed by network analysis of pairwise values of identity-by-state, where the animal in the central node had a betweenness centrality value equal to 0.936. Probing of daily weight gain against the SNP data of Hungarian Merinos revealed five associated loci. Two of them, OAR8_17854216.1 and s42441.1 on chromosome 8 and 9 (-log10P>22, false discovery rate<5.5e-20) and one locus on chromosome 20, s28948.1 (-log10P = 13.46, false discovery rate = 4.1e-11), were close to the markers reported in other breeds concerning daily weight gain, six-month weight, and post-weaning gain. Conclusion: The position of Hungarian Merino among other Merino breeds has been determined. We have described the similarity network of the individuals to be applied in breeding practices and highlighted several markers useful for elevating the daily weight gain of Hungarian Merino.

FWD 처짐곡선을 이용한 아스팔트 포장구조체의 탄성계수 추정 모형 개발 (Development of a Model for Predicting Modulus on Asphalt Pavements Using FWD Deflection Basins)

  • 박성완;황정준;황규영;박희문
    • 대한토목학회논문집
    • /
    • 제26권5D호
    • /
    • pp.797-804
    • /
    • 2006
  • 본 연구에서는 비파괴 시험 장비인 FWD(Falling Weight Deflectometer)에 의한 처짐곡선을 활용하여 아스팔트 포장구조체의 물성을 합리적으로 추정할 수 있는 방법을 개발하였다. 2004년 국도 PMS(Pavement Management System)의 FWD 자료로 다층탄성이론에 근거한 역산프로그램을 사용하여 역해석을 실시하였다. 3층 포장구조체로 기반암을 고려하여 역해석을 실시하였으며, 통계분석을 통하여 각 층 탄성계수의 95% 신뢰구간을 선정하였다. 이 신뢰구간의 범위와 기존 문헌상의 범위를 비교한 결과 차이가 없었으며, 그 결과를 바탕으로 회귀분석을 실시하여 탄성계수를 직접 추정할 수 있는 회귀 분석 모델을 제시하였다. 회귀 분석모델의 적합성 및 유의성 검증, 다중공선성 분석, 잔차 분석 그리고 분산 분석을 통하여 본 연구에서 제시한 회귀 분석모델이 유의하며 높은 적합성을 갖고 있음을 증명하였다. 따라서, 본 연구에서 제시한 회귀 분석 모델을 통해 FWD 시험시 현장에서 역해석을 실시하지 않고도 직접 탄성계수를 추정하여 포장구조체의 상태평가를 할 수 있을 것으로 판단된다. 또한, 아스팔트층의 탄성계수는 온도변화에 따라 많은 차이를 나타내므로 기준온도로 온도보정을 실시하였으며 그 결과를 토대로 현재 공용중인 국도 아스팔트 포장구조체 각 층의 탄성계수와 95%신뢰구간의 탄성계수를 제시하였다.

GIS기반의 분포형 홍수피해산정 기법 (GIS Based Distributed Flood Damage Assessment)

  • 이충성;최승안;심명필;김형수
    • 대한토목학회논문집
    • /
    • 제26권3B호
    • /
    • pp.301-310
    • /
    • 2006
  • 막대한 국가예산이 투입되는 치수사업은 그 성공여부가 국가경제 전반에 걸쳐 큰 영향을 미치게 되므로 신뢰성 있는 홍수 피해산정은 치수사업의 경제성분석에 핵심적 요소이다. 본 연구는 다차원홍수피해산정법에 의한 홍수피해 산정시 GIS를 기반으로 한 분포형 분석기법을 제시하는 데에 목적이 있다. 이를 위해서, 홍수피해산정의 공학적 측면인 침수예측과 경제적 측면인 다차원법을 연계하고 GIS를 활용한 분석체계와 자료처리 과정을 제시하였다. 제시된 방법론은 예비타당성조사 대상 사업인 목감천/도림천 방수로사업에 적용하였고 세부적인 GIS 데이터베이스와 피해산정 결과를 논문에 수록하였다. 본 연구에서 GIS를 기반으로 다차원법의 분석체계를 정리한 것은 꾸준히 제기되었던 다차원법의 적용 편의성을 제고하는 동시에 그동안 간과되었던 공학적 측면과의 연계성에 대한 방향을 제시하였다는데 의의가 있다. 이러한 체계적 자료처리 과정을 통한 분포형 홍수피해산정 기법은 구조물적이나 비구조물적 홍수피해경감계획의 타당성 평가 및 전략 개발을 위한 의사결정에 도움을 줄 수 있을 것으로 기대된다.

한국주식시장에서 기업특성모형 적용에 관한 실증연구 (An Empirical Study on Korean Stock Market using Firm Characteristic Model)

  • 김수경;박종해;변영태;김태혁
    • 경영과정보연구
    • /
    • 제29권2호
    • /
    • pp.1-25
    • /
    • 2010
  • 본 논문은 우리나라 주식시장을 대상으로 Haugen Baker(1996)가 제시한 기업특성요인모형을 적용하여 주식수익률 결정요인을 분석하였다. 분석기간은 1999년부터 2007년까지 총 8년간이며, 총 690개의 상장기업의 월별 자료를 이용하였다. 기존 연구에서 제시된 변수를 바탕으로 유동성, 위험, 과거주가, 가격수준, 수익성 등과 관련된 16개의 변수를 독립변수로, 690개 주식의 월별 수익률을 종속변수로 하여 시간가변 회귀분석을 통해 분석결과의 강건성을 높이고자 하였다. 본 연구의 결과는 다음과 같이 요약될 수 있다. 첫째, 기업특성정보가 주식수익률 결정에 미치는 사전적 영향을 분석한 결과 해당기업이 공개한 직전월의 기업특성 정보 중 당월의 주가에 유의적인 영향을 나타내는 기업특성은 유동성, 모멘텀 지표인 1개월, 3개월, 6개월 초과수익률, 주가 승수 중 PSR, PBR, 수익성을 나타내는 ROE와 EPS 등의 8개 요인이다. 예측된 수익률을 이용하여 구축한 10개의 분위별 포트폴리오를 대상으로 실현수익률을 분석한 결과 예측수익률이 높을수록 실현된 수익률이 일관되게 높게 나타나는 것으로 분석되었다. 둘째, Haugen Baker가 제안한 기업특성모형을 이용한 주가예측모형을 바탕으로 구성된 포트폴리오를 Fama French가 제안한 3요인 모형에 적용시킨 결과 수익률이 높을 것으로 예측된 포트폴리오의 실현수익률이 높게 나타남을 확인하였다. 즉, 우리나라 주식시장의 수익률을 예측하는 데는 Haugen Baker의 기업특성 요인모형을 응용한 모형이 더욱 적합할 수 있으며, 이를 이용하는 것이 실무적으로도 유용성이 높을 것으로 기대할 수 있다. 본 연구는 기존연구를 보완하여 보다 강건한 예측 및 운영성과를 보여주기 위해 노력하였다. 이를 위해, 시간 가변적으로 (1) 요인프리미엄을 추정, (2) 수익률예측 및 포트폴리오 조정, (3) 실현수익률 측정의 과정을 반복적으로 수행하였으며, 예측수익률이 높은 포트폴리오의 실현수익률이 상대적으로 높게 나타나는 일관된 결과를 강건하게 보여주고 있다.

  • PDF

코로나 바이러스 감염증-19가 한국 소아청소년의 치과 이용에 미치는 영향 (Impact of Coronavirus Disease 2019 on Dental Service Utilization of Korean Children and Adolescents)

  • 김주희;정회인;김익환;이제호;강정민
    • 대한소아치과학회지
    • /
    • 제49권2호
    • /
    • pp.206-216
    • /
    • 2022
  • 이 연구의 목적은 코로나 바이러스 감염증-2019 팬데믹 이후 소아청소년의 치과 이용 실태를 조사하고 성인과 비교하여 파악하는 것이다. 건강보험심사평가원에서 제공하는 2017년 1월부터 2020년 12월까지 20세 미만의 소아청소년 및 20세 이상의 성인의 주상병과 치료코드별 치과 내원 횟수 자료를 사용했다. 연도별 인구수 변화가 내원 횟수에 미치는 영향을 줄이기 위해 인구수 1000명당 치과 내원 횟수를 이용해 분석하였다. 치수 및 근단주위조직의 질환 주상병으로 인한 치과 내원 횟수가 팬데믹 이후 모든 연령에서 감소했고, 치수치료에 해당하는 치료 코드로 인한 치과 내원 횟수는 0 - 4세군을 제외하고 감소했다. 수복치료에 해당하는 치료코드로 인한 치과 내원 횟수는 팬데믹 이후 0 - 19세군에서 감소했다. 2020년 신규확진자 수와 치료 코드의 치과 내원 횟수 변화율을 월별로 비교했을 때, 우리나라 대유행이 있던 2월과 8월 이후 치수치료 및 수복치료는 점차 감소했다. 치은염 및 치주질환 주상병으로 인한 치과 내원 횟수는 팬데믹 이후 모든 연령군에서 증가했다. 소아청소년의 수복치료로 인한 내원 횟수 감소율은 성인보다 컸다. 팬데믹 이후 Multi-visit 치수치료로 인한 치과 내원 횟수 감소율은 1-visit 치수치료보다 컸다. 이 연구를 통해 코로나 바이러스 감염증-2019 전파 이후 소아청소년들의 치과 내원 횟수를 파악하고 성인과 비교해볼 수 있다.

2003~2005년도 민간 병의원 신환자에서 분리된 결핵균의 항결핵약제 내성률 (Drug Resistance Rate of New Pulmonary Tuberculosis Patients Treated from the Private Sector in 2003~2005)

  • 박영길;박윤성;배정임;김희진;류우진;장철훈;이희경
    • Tuberculosis and Respiratory Diseases
    • /
    • 제64권2호
    • /
    • pp.87-94
    • /
    • 2008
  • 연구배경: 항결핵 약제내성률은 국가결핵관리 사업을 평가하는 중요한 지표 중 하나이다. 최근 보건소보다 민간병의원에서 신고되는 결핵 신환자가 증가하는 추세에서, 이들을 대상으로 초회(일차) 내성률을 조사하고자 하였다. 방법: 2003년에서 2005년까지 민간병의원에서 결핵연구원에 약제감수성 검사를 의뢰한 환자와 결핵감시체계에 신고된 환자 중에서 성명과 주민등록번호가 일치하는 결핵 신환자를 선정하여 그 약제감수성 검사 결과를 조사 하였다. 결과: 3년간 조사 대상자는 5,132명이었고 이 중 내성환자는 689명으로 13.4%이었고, 다제 내성환자는 195명으로 3.8%이었으며, 광역 내성환자는 21명으로 0.4%이었다. 항결핵 약제 내성률이나 다제내성률에 있어서 3년간 통계적으로 유의할만한 내성률의 증감현상은 없었다. 약제별 내성에서는 이소니아지드 내성은 10.3%, 리팜핀 내성은 4.5%이었다. 결핵환자의 남녀 성비에 따른 차이는 남자가 60%, 여성은 40%로 있었지만, 성비에 따른 내성률의 차이는 없었다. 연령대 별로는 20대에서 19.6%로 가장 높았으며, 연령별 내성률은 50대에서 15.8%로 가장 높았고, 10대에서 9.6%로 가장 낮았다. 다제 내성률은 30대에서 5.3%로 가장 높았으며, 70대에서 1.4%로 가장 낮았다. 결론: 본 조사는 민간병의원 환자를 대상으로 검사실 자료를 이용한 최초의 항결핵 약제내성률 조사이며, 보건소 환자를 대상으로 실시한 약제내성률 조사 결과와 통계학적인 유의성을 보이지는 않았다.

이어도 해양과학기지 관측 파고와 인공위성 관측 유의파고 차이의 특성 연구 (2004~2016) (Characteristics of the Differences between Significant Wave Height at Ieodo Ocean Research Station and Satellite Altimeter-measured Data over a Decade (2004~2016))

  • 우혜진;박경애;변도성;이주영;이은일
    • 한국해양학회지:바다
    • /
    • 제23권1호
    • /
    • pp.1-19
    • /
    • 2018
  • 이어도 해양과학기지 유의파고 자료와 인공위성(GFO, Jason-1, Envisat, Jason-2, Cryosat-2, SARAL) 고도계 유의파고 자료를 비교하기 위하여 2004년 12월부터 2016년 5월까지 약 12년 동안의 위성-이어도 관측 유의파고 사이의 일치점 데이터베이스를 생산하였다. 위성 유의파고는 이어도 해양과학기지 유의파고에 대하여 약 0.34 m의 평균 제곱근 오차와 0.17 m의 양의 편차를 나타내었다. 위성과 이어도 관측 유의파고 차는 특이한 계절변동이나 경년변동을 보이지 않고 위성이 중복 관측하는 기간에 대해서 유사한 변동 특성을 보여 위성 자료의 일관성을 확인할 수 있었다. 위성-이어도 유의파고 차이에 대한 바람장의 영향을 조사한 결과 모든 위성에 대해 평균적으로 0.17 m 정도의 양의 편차가 나타났다. 지형 및 해양과학기지 구조물의 영향을 파악하기 위하여 파향에 대한 파고 오차의 특이성을 분석하였으나 통계적으로 유의미한 특성이 나타나지 않았다. 위성-이어도 일치점의 거리에 따른 영향을 조사하기 위하여 위성-이어도 간의 거리에 대한 함수로 오차의 특성을 분석한 결과 평균은 거리와 무관하게 0.14 m로 거의 일정하게 유지되는 반면에 오차의 최댓값과 최솟값 사이의 진폭은 이어도로부터 멀어질수록 선형적으로 증가하는 특성이 발견되었다. 반면에 동해 해양기상위성부이를 활용한 위성 유의파고 자료의 정확도 평가 결과, 위성-실측 자료 사이의 평균 제곱근 오차는 0.27 m로 상대적으로 작은 오차가 발생하였으며, 이어도 파고 자료와 같이 특이한 오차 특성은 발견되지 않았다. 이어도 파고 관측 기기의 상이성을 고려하여 이 연구에서는 위성 유의파고 자료를 기반으로 이어도 유의파고 자료를 보정하는 식을 제안하였다. 또한 이어도 해양과학기지가 국제적인 해양관측 기지로 격상되기 위해서는 자료의 신뢰도 확보가 우선되어야 함을 강조하고 방법과 전략을 제시하였다.