• 제목/요약/키워드: 한계입력

검색결과 623건 처리시간 0.026초

유전 알고리즘을 이용한 국소가중회귀의 다중모델 결합을 위한 점진적 앙상블 학습 (Incremental Ensemble Learning for The Combination of Multiple Models of Locally Weighted Regression Using Genetic Algorithm)

  • 김상훈;정병희;이건호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권9호
    • /
    • pp.351-360
    • /
    • 2018
  • 전통적으로 나태한 학습에 해당하는 국소가중회귀(LWR: Locally Weighted Regression)모델은 입력변수인 질의지점에 따라 예측의 해를 얻기 위해 일정구간 범위내의 학습 데이터를 대상으로 질의지점의 거리에 따라 가중값을 달리 부여하여 학습 한 결과로 얻은 짧은 구간내의 회귀식이다. 본 연구는 메모리 기반학습의 형태에 해당하는 LWR을 위한 점진적 앙상블 학습과정을 제안한다. LWR를 위한 본 연구의 점진적 앙상블 학습법은 유전알고리즘을 이용하여 시간에 따라 LWR모델들을 순차적으로 생성하고 통합하는 것이다. 기존의 LWR 한계는 인디케이터 함수와 학습 데이터의 선택에 따라 다중의 LWR모델이 생성될 수 있으며 이 모델에 따라 예측 해의 질도 달라질 수 있다. 하지만 다중의 LWR 모델의 선택이나 결합의 문제 해결을 위한 연구가 수행되지 않았다. 본 연구에서는 인디케이터 함수와 학습 데이터에 따라 초기 LWR 모델을 생성한 후 진화 학습 과정을 반복하여 적절한 인디케이터 함수를 선택하며 또한 다른 학습 데이터에 적용한 LWR 모델의 평가와 개선을 통하여 학습 데이터로 인한 편향을 극복하고자 한다. 모든 구간에 대해 데이터가 발생 되면 점진적으로 LWR모델을 생성하여 보관하는 열심학습(Eager learning)방식을 취하고 있다. 특정 시점에 예측의 해를 얻기 위해 일정구간 내에 신규로 발생된 데이터들을 기반으로 LWR모델을 생성한 후 유전자 알고리즘을 이용하여 구간 내의 기존 LWR모델들과 결합하는 방식이다. 제안하는 학습방법은 기존 단순평균법을 이용한 다중 LWR모델들의 선택방법 보다 적합도 평가에서 우수한 결과를 보여주고 있다. 특정지역의 시간 별 교통량, 고속도로 휴게소의 시간별 매출액 등의 실제 데이터를 적용하여 본 연구의 LWR에 의한 결과들의 연결된 패턴과 다중회귀분석을 이용한 예측결과를 비교하고 있다.

시분할 FPGA 합성에서 마이크로 레지스터 개수에 대한 하한 추정 기법 (A Lower Bound Estimation on the Number of Micro-Registers in Time-Multiplexed FPGA Synthesis)

  • 엄성용
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권9호
    • /
    • pp.512-522
    • /
    • 2003
  • 시분할 FPGA는 회로가 동작하는 중 회로의 기능을 재구성할 수 있는 동적 재구성 기능을 갖춘 FPGA 칩이다. 따라서 이러한 칩을 위한 회로 합성 기법에서는 주어진 논리 회로를 각각 다른 시간대에 수행할 여러 개의 부분회로로 분할한 후, 동일한 하드웨어 회로를 시간차를 두고 공유하도록 해야 한다. 기존의 연구에서는, 칩의 제한된 용량 문제를 해결하기 위해, 동일 시간대에 필요한 자원으로서 각 세부 함수를 수행하는 LUT(Look-Up Table)의 개수와 LUT의 출력 결과를 다른 시간대에 사용하기 위해 그 결과를 임시 저장하는데 필요한 마이크로 레지스터(micro register)의 개수를 최소화하는 데 중점을 두고 있다. 본 논문에서는 시분할 FPGA 합성용 도구 중의 하나로서 회로 구현에 필요한 메모리 원소, 즉 마이크로 레지스터의 개수에 대한 하한(lower bound)을 추정하는 기법에 대해 설명한다. 이 방법에서는 입력되는 논리 회로를 직접 합성하지 않고서도 그 회로가 필요로 하는 전체 마이크로 레지스터 개수에 대한 하한을 각각 추정함으로써 특정한 합성 기법에 관계없이 회로 구현에 필요한 최소한의 마이크로 레지스터의 개수에 대한 정보를 추출한다. 만일, 기존의 합성 결과가 본 연구에서 추정된 하한과 일치할 경우, 그 결과는 최적의 결과를 의미한다. 반면에, 하한과의 차이가 있는 경우에는 기존의 연구 결과에 비해 더 좋은 합성 결과가 존재하거나, 또는 본 연구에서 추정한 하한보다 더 좋은(큰, 정확한) 하한이 실제 존재함을 의미한다. 따라서 이러한 비교 분석을 통해, 기존 연구는 물론, 향후에 개발할 새로운 합성 방법의 결과가 최적인지, 또는 개선의 여지가 있는지를 판단하는 좋은 지표를 얻을 수 있다. 실험 결과, 추정된 하한은 기존 연구의 합성 결과와 다소 차이가 있었다. 이러한 차이는 우선, 기존의 합성 결과는 LUT 개수를 적절히 유지하는 가운데 마이크로 레지스터를 최소화한 결과인 반면, 본 하한 추정에서는 합성 가능한 모든 결과 중, LUT 개수와는 전혀 무관하게, 마이크로 레지스터 개수를 최대한 작게 사용할 합성 예를 추정하기 때문이라고 판단된다. 또 한편으로는 마이크로 레지스터 개수에 대한 하한 추정 문제 자체가 갖는 거대한 변동성과 복잡성으로 인해 제안한 추정 기법이 정밀도에 한계를 가지는 것으로 해석할 수 있으며, 다른 한편으로는 기존 연구 결과보다 더 좋은 합성 결과가 존재할 가능성이 높음을 의미하는 것으로 해석될 수 있다.

도로설계 적정화를 위한 새로운 지형구분에 관한 연구 (Development of a New Terrain Type Classification to be used in Highway Design)

  • 김상엽;최재성;이승용;한형관
    • 한국도로학회논문집
    • /
    • 제8권4호
    • /
    • pp.49-62
    • /
    • 2006
  • 우리나라는 그동안 사회기반시설로서 도로역할을 중시하여 도로부문에 매년 대규모 예산을 투입했다. 그 결과 개발이 용이한 평탄지를 중심으로 한 국가 기간 도로망 체계 확보에 결실이 있었다. 그러나 앞으로 지속적인 도로망 체계를 건설하기 위해서는 산악지형과 같은 고비용이 들어가는 지형에 대해서 효율적으로 개발해야 하는 과제를 안고 있다. 이러한 지형은 도로 설계속도 결정단계에서 고려되어야 할 중요한 입력변수이다. 그럼에도 불구하고 현재 도로설계기준상에는 지형구분을 위한 명확하고 객관적인 판단기준이 제시되어 있지 않기 때문에 설계속도가 부정확하게 결정될 수도 있다. 본 연구는 지형구분의 필요성에 대해 인지하고 고도 및 경사 그리고 주행속도 자료를 바탕으로 합리적으로 지형구분을 하였으며, 연구결과는 다음과 같다. 첫째, 본 연구에서는 GIS data를 이용하여 고도와 경사도에 따라 지형을 9가지 AREA로 분류하였으며, 지형분류 data(AREA)와 주행속도 자료를 matching하여 분석한 결과, AREA의 분류에 따른 특성이 주행속도에 영향을 미치는 것으로 나타났다. 둘째, 본 연구에서는 고도와 경사도에 따른 지형분류와 지형분류에 따른 그룹 간 주행속도의 유의성 분석 결과를 근거로 해서 평지, 구릉지, 산지로 우리나라 지형을 구분하였다. 본 연구는 일반국도를 대상으로 한 주행 속도자료를 이용하였기 때문에 지방도나 군도등 기능이 다른 도로에 대해서는 적용상의 한계가 있으나, 향후 도로건설시 도로가 통과하는 지역의 지형적 특성을 반영 할 수 있는 하나의 기준이 될 것으로 기대된다.트 탄성계수나 슬래브 두께가 증가하던지 또는 지반 탄성계수가 감소하면 최대 응력이 생기는 종방향 상 위치가 양쪽 바깥축에서 중간축의 위치로 바뀌게 된다. 문합군(52%)에 비해 통계적으로 유의한 차이를 보였다(p<0.01). 결론: 식도-위 문합 시 경부 문합은 흉부 문합에 비해 문합부 협착의 빈도는 차이가 없고, 역류성 식도염의 빈도는 현저히 적으며, 식도암의 경우 더 여유 있는 절제면을 제공할 수 있는 장점이 있으리라 판단된다. 따라서 식도절제술 및 위-식도 문합 시 특별한 금기증에 해당하지 않는다면 경부 문합을 선호할 수 있을 것으로 생각된다. 문합 방법에 따른 역류성 식도염과 협착의 빈도에서는 유의한 차이를 발견할 수 없었으나, 수술 시간의 단축 등의 몇몇 장점으로 인해 기계 문합을 선호할 수 있을 것으로 생각된다. 향후 식도암의 수술 기법과 술 후 관리의 향상으로 인하여 문합 부위의 역류로 인한 증상과 환자의 일상 생활의 질에 대한 중요성이 지속적으로 강조될 것으로 생각되며, 이에 따른 적극적인 anti-reflux 수술에 대한 고려도 필요할 것으로 생각된다.$14.7{\pm}2.7$ mL로 각 군 간에 통계적인 유의성이 있었다(p<0.05). 혈청내 칼륨 농도는 I군에서 II군에 비해 소생술 후 의의 있게 높았으며(p<0.05), 포도당 농도는 II단계의 I군에서 타군과 비교하여 현저히 낮았다(p<0.05). IL-8은 I 군 $1,834{\pm}437$ pg/mL, II 군 $1,006{\pm}532$ pg/mL,

  • PDF

고 에너지 광자선의 표준측정법에 대한 선량 교정 프로그램 개발 (Development of a Dose Calibration Program for Various Dosimetry Protocols in High Energy Photon Beams)

  • 신동오;박성용;지영훈;이창건;서태석;권수일;안희경;강진오;홍성언
    • Radiation Oncology Journal
    • /
    • 제20권4호
    • /
    • pp.381-390
    • /
    • 2002
  • 목적 : 고 에너지 광자선에 대한 기준점에서의 물 흡수선량 계산을 절차상 또는 계산상의 오류를 피하기 위해 공기커마(혹은 조사선량) 교정정수에 토대를 두고 있는 IAEA TRS-277과 AAPM TG-21 및 최근 발표된 새로운 개념의 물 흡수선량 교정정수에 토대를 두고 있는 IAEA TRS-398과 AAPM TG-51 표준측정법에 기초한 고 에너지 광자선의 선량 교정 프로그램을 개발하고자 한다. 대상 및 방법 : 현재 국내외에서 널리 사용되고 있는 고 에너지 광자선에 대한 흡수선량 표준측정법은 IAEA TRS-277과 AAPM TG-21로서 공기커마(혹은 조사선량) 교정정수에 토대를 두고 있어 수식 체계가 복잡하고, 사용된 물리량에 대한 불확정도가 커서 선량측정의 정확성을 향상시키는데 한계가 있다. 최근 국제원자력기구와 미국의학물리학회에서는 새로운 개념의 물 흡수선량 교정정수에 토대를 두고 있는 IAEA TRS-398과 AAPM TG-51을 발표하였다. 개발된 네 종류의 선량 교정 프로그램은 이들 표준측정법에서 사용되고 있는 수식체계와 물리적인 매개변수를 엄격하게 적용하였고, 선량계에 대한 정보 및 물리적인 값에 대한 표와 그래프 값은 수치화하여 데이터베이스화하였다. 이들 프로그램은 윈도우 환경에서 사용이 용이하도록 비쥬얼 $C^{++}$ 언어를 사용하여 각각의 표준측정법에서 권고하고 있는 방법 및 절차에 따라 사용자의 편의성을 고려하여 개발하였다. 결과 : 네 종류의 표준측정법에 대하여 개발된 고 에너지 광자선에 대한 선량 교정 프로그램은 사용자가 병원에서 사용하고 있는 표준측정법을 선택하여 선량측정 절차에 따라 선량계, 선질 특성 및 측정 조건에 관한 정보와 측정 결과를 입력하고, 순차적으로 수행하도록 되어 있어 절차상 혹은 선량 계산에 있어서 사용자간의 오차 및 실수를 최소화할 수 있었다 또한 서로 다른 개념의 네 종류의 표준측정법에 대한 기준점에서의 선량값을 상호 비교할 수 있었다. 결론 : 이 프로그램은 이온함에 대한 정보와 물리적인 자료에 대한 표와 그래프 값들을 수식화하여 데이터베이스함으로써 수작업으로 각 프로토콜의 수행 절차상 혹은 사용자간의 발생할 수 있는 개인적인 실수 및 오차를 줄일 수 있었다. 또한 이 프로그램은 사용자 편의성을 고려하였고, 모든 보정계수와 물흡수선량을 정확하게 계산할 수 있기 때문에 각 표준측정법에 대한 주요한 차이점을 비교 분석할 수 있어 사용자가 적당한 표준측정법을 선택하여 수행하므로써 고 에너지 광자선 선량 교정에 이용시 매우 유익할 것으로 사료된다.

위해성에 근거한 정화목표 산정 및 복원전략 수립 (Determination of Target Clean-up Level and Risk-Based Remediation Strategy)

  • 류혜림;한준경;남경필
    • 한국지하수토양환경학회지:지하수토양환경
    • /
    • 제12권1호
    • /
    • pp.73-86
    • /
    • 2007
  • 위해성에 근거한 복원 전략(risk-based remediation strategy, RBRS)은 위해성평가를 통하여 오염지역의 위해성 또는 오염원을 효율적으로 관리하기 위한 의사결정과정 중의 일부로서, 토양에 존재하는 독성물질이 인간이나 생태계와 같은 수용체로 전이되어 발현되는 독성을 감소시키는 것을 목적으로 한다. 토양오염에 대한 위해성평가는 토양에서 대기로 확산되어나가는 오염물질의 흡입, 토양에서 지하수로 용출된 오염물질의 섭취, 토양 자체의 섭취와 접촉 등에 의한 위해성평가를 포함하며, 오염물질의 특성뿐만 아니라 수리지질학적 자료, 토지이용용도, 수용체의 특성 등 현장의 특이적인 요소들을 충분히 고려해야 한다. 위해성에 근거한 복원전략은 위해성산정을 위한 현장조사로부터 시작하여, 구체화된 노출경로모델(conceptual site model, CSM)의 작성, 목표위해성 수준의 결정, 오염물질의 물리화학적 특성 및 독성학적 자료의 수집을 거쳐, 일반적이고 보수적인 조건 하에 가장 안전한 목표정화수준을 산정하는 Tier 1 평가와 보다 정확한 오염현장의 조사를 통하여 현장특수성을 반영하는 Tier 2 평가를 단계적으로 적용한다. 현장의 오염농도가 Tier 1으로 결정된 허용오염수준(risk-based screening level, RBSL)보다 높은 경우 Tier 2를 실시하여 현장의 특수성을 반영하는 목표정화수준(site-specific target level)을 산정하며, 이를 통하여 오염지역에 대한 과도한 정화처리나 비경제적인 복구사업 등을 피할 수 있다. 위해성에 근거한 복원전략은 이 밖에도 오염지역의 복원우선순위 결정, 토지이용용도에 따른 위해성 관리기준 수립 등 다양한 활용성을 가지지만, 여러 가지 전제조건들과 현장조사 시에 발생하는 현실적 한계 등으로 인하여 불확실성을 가진다. 이를 극복하기 위하여 정확한 CSM의 작성, 복합오염에 대한 고려, 오염물질의 이동과 거동에 영향을 미치는 환경매질의 특성과 모델 입력변수 등을 신중하게 검토해야 하며, 신뢰할 만한 현장조사기법과 독성검사기법의 확립, 국내실정에 맞는 토양 및 지하수 특성자료와 인체 노출인자 등에 대한 연구가 지속적으로 이루어져야 할 것이다.

다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링 (User-Perspective Issue Clustering Using Multi-Layered Two-Mode Network Analysis)

  • 김지은;김남규;조윤호
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.93-107
    • /
    • 2014
  • 대부분의 인터넷 쇼핑몰은 자사 고객의 관심 분야를 파악하고 이를 상품 추천에 효과적으로 활용하기 위해 많은 노력을 기울이고 있다. 하지만 고객이 회원 가입 시 직접 입력한 개인 정보는 신뢰하기가 어렵고, 고객의 구매 패턴을 통해 파악한 관심 분야 정보는 자사 사이트 내에 진입한 이후에만 보인 한정된 패턴이라는 측면에서 해당 고객의 다양한 관심분야를 제대로 나타낸다고 보기 어렵다. 이러한 한계를 극복하기 위해 본 연구에서는 고객의 평소 인터넷 사용 기록을 통해 최근 방문 사이트들의 주제를 분석함으로써, 고객의 실제 관심 분야를 파악할 수 있는 방안을 제시하였다. 또한 토픽 분석을 통해 각 사이트의 주제를 도출하고 도출된 주제를 다시 동시 방문자 관점에서 군집화 함으로써, 고객 관점에서 의미가 있는 상위 수준의 새로운 테마를 발굴하기 위한 방법론을 제안하였다. 연구의 특징은 유사주제 중심의 군집화라는 기존 연구와는 달리 사용자 관점의 관심주제 중심 군집화라 할 수 있다. 향후 사용자 중심의 카테고리 설계를 비롯한 새로운 관점의 고객군 정의 등 보다 높은 차원의 마케팅 전략 수립에 활용이 가능할 것으로 기대된다. 사용자 관점의 이슈 군집화 과정은 크롤링, 토픽 분석, 액세스 패턴 분석, 네트워크 병합, 네트워크 변환 및 군집화와 같은 여섯 가지 주요단계로 구성되어있다. 이를 위해 텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 비정형 텍스트를 기반으로한 빅데이터의 활용 방법을 모색하였다. 제안 방법론의 실무 적용 가능성을 평가하기 위해, 국내 최대 포털 뉴스 사이트의 방문자 2,177명의 1년간 방문 기록과 뉴스기사 대한 분석을 수행하고 그 결과를 요약하여 제시하였다.

빅데이터 기반의 정성 정보를 활용한 부도 예측 모형 구축 (Bankruptcy Prediction Modeling Using Qualitative Information Based on Big Data Analytics)

  • 조남옥;신경식
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.33-56
    • /
    • 2016
  • 대부분의 부도 예측에 관한 연구는 재무 변수를 중심으로 통계적 방법 또는 인공지능 기법을 적용하여 부도 예측 모형을 구축하였다. 그러나 재무비율과 같은 회계 정보를 이용한 부도 예측 모형은 재무 제표 결산 시점과 신용평가 시점 간 시차를 고려하지 않을 뿐만 아니라 해당 산업의 경제적 상황과 같은 외부 환경적인 요소를 반영하기 어렵다는 한계점이 존재하였다. 기업의 부도 여부를 예측하기 위해 정량 정보인 재무 변수만을 이용하는 것에 한계가 있음에도 불구하고 정성 정보를 부도 예측 모형에 반영한 연구는 아직 미흡한 실정이다. 본 연구에서는 재무 변수를 이용하는 기존 부도 예측 모형의 성과를 개선하기 위해 빅데이터 기반의 정성 정보를 추가적인 입력 변수로 활용하는 부도 예측 모형을 제안하였다. 제안 모형의 성과 향상은 정성 정보를 예측 모형에 통합시키기에 적합한 형태로 정보의 유형을 변환시킬 수 있는가에 따라 달려있다. 이에 본 연구에서는 정성 정보 처리를 위한 방법으로 빅데이터 분석 기법 중 하나인 텍스트 마이닝(Text Mining)을 활용하였다. 해당 산업과 관련된 경제 뉴스 데이터로부터 경제 상황에 대한 감성 정보를 추출하기 위해 도메인 중심의 감성 어휘 사전을 구축하고, 구축된 어휘 사전을 기반으로 감성 분석(Sentiment Analysis)을 수행하였다. 형태소 분석 등을 포함한 텍스트 전처리 과정을 거쳐 감성 어휘를 추출하고, 각 어휘에 대한 극성 및 감성 점수를 부여하였다. 분석 결과, 전통적 부도 예측 모형에 경제 뉴스 데이터에서 도출한 정성 정보를 반영하는 것은 모형의 성과를 개선하는 것으로 나타났다. 특히, 경제 상황에 대한 부정적 감정이 기업의 부도 여부를 예측하는 데 더욱 효과적임을 알 수 있었다.

고해상도 규모상세화모델 KMAPP의 농업지역 기온 및 일사량 예측 성능: 맑은 날 철원 및 전북 사례 연구 (Temperature and Solar Radiation Prediction Performance of High-resolution KMAPP Model in Agricultural Areas: Clear Sky Case Studies in Cheorwon and Jeonbuk Province)

  • 신설은;이승재;노일석;김수현;소윤영;이서연;민병훈;김규랑
    • 한국농림기상학회지
    • /
    • 제22권4호
    • /
    • pp.312-326
    • /
    • 2020
  • KMAPP은 규모상세화 과정을 통해 100 m 단위의 초고해상도 기상 예측을 산출하는 체계로써 최근 수문, 농업, 신재생에너지 등 다양한 분야에서 활용되기 시작됨에 따라 각 분야별로 예측성능을 검증할 필요가 있다. 철원 지역과 전북 지역은 산지가 많은 우리나라에서 비교적 넓은 범위에 걸쳐서 수평면을 보유하고 있으며, 특히 철원은 대규모 벼 논 재배지역 중에서 실측 및 원격탐사 생물계절 자료가 많은 지역으로 KMAPP 예측 성능을 검증하는데 필요한 관측자료를 사용하기에 적절한 지점으로 판단된다. 이번 연구에서는 철원 내 농경지역의 생태적 변화에 따라 변화하는 KMAPP 기온 예측 성능을 AWS와 ASOS 관측자료를 이용하여 비교 검증하였다. 그리고 전북지역 폭염 기간 동안 가축 고온스트레스 모델과 같은 응용모델에 KMAPP 예측 자료를 입력자료로 활용하는 것을 검토하고자 일사량 예측을 ASOS 자료를 이용하여 검증하였다. 더 많은 사례의 수집과 선정이 필요하다는 한계가 있지만 농경지역에서 추수 후 기온 예측 성능이 일반 주택지 에서보다 더 크게 향상된 것을 통해 생물리적 효과가 예측 정확도에 미치는 영향을 간접적으로 추측해 볼 수 있었다. 한편, 일사량 예측의 경우 단위 변환에 따른 오차가 발생하지만 관측값과 일치하는 경향을 보여 KMAPP 자료가 지역규모의 상세 예측 자료로 응용모델에 활용될 수 있을 것으로 기대된다.

센서 기반 모니터링 자료를 활용한 임하댐 저수지 탁수 예측 정확도 개선 (Improvement of turbid water prediction accuracy using sensor-based monitoring data in Imha Dam reservoir)

  • 김종민;이상웅;권시윤;정세웅;김영도
    • 한국수자원학회논문집
    • /
    • 제55권11호
    • /
    • pp.931-939
    • /
    • 2022
  • 우리나라의 경우 강수량의 2/3 정도가 하절기에 집중되는 강우특성상 해마다 여름철 홍수기의 탁수 문제가 다양하게 발생하고 있다. 이상강우와 기상이변에 의한 집중강우가 증가 추세이며, '02년 태풍 루사', '03년 태풍 매미', '06년 에위니아'부터 20년 마이삭, 하이선 까지 장마와 태풍에 의한 유입량이 급증하는 시기 탁수의 유입으로 수중 탁도가 급상승하며 댐 저수지 내 탁수 문제가 발생하였다. 특히 연 평균 물사용량의 대부분을 하천 및 댐 저수지를 이용하는 우리나라의 경우 탁수 문제가 장기화될 경우 댐 하류 해당 지역 농업, 공업, 수생태 등 사회적, 환경적으로 많은 문제를 발생시킨다. 이러한 탁수 예측을 통한 대응을 위해 탁수 모델링에 대한 연구가 활발히 진행되고 있다. 탁수 현황을 모의하기 위해서는 유량, 수온, SS 데이터가 필요하다. 이를 위해 국가측정망에서 하천 및 댐 저수지 내 SS를 측정하여 탁수를 측정 하고 있으나 설비가 미흡하여 데이터 해상도가 낮다는 한계점이 있으며 주요 댐 저수지 내에서는 수자원공사에서 관리하는 자동 측정기기를 활용하여 높은 데이터 해상도를 유지 하고 있으나 댐 별, 기상 조건에 따라 미측정 기간이 존재한다. 탁도를 측정을 위한 센서로는 Optical Backscatter Sensor (OBS), YSI 등이 있으며 SS를 측정하기 위한 센서는 레이저부유사측정기(Laser In-Situ Scattering and Transmissometry, LISST) 등의 장비를 이용하고 있다. 하지만 이런 첨단 센서의 경우 또한 수중에 고정하여 측정하기에는 장비의 안정성 등의 이유로 한계가 있다. 따라서, 취득된 유량, 수온, SS, 탁도 데이터를 기반으로 분석을 통해 미측정 기간이 존재함으로 입력자료에 활용되는 SS를 산정하기 위해 관계식 개발을 필요로한다. 본 연구에서는 댐 방류구 인근 지점 측정 데이터를 기반으로 개발된 탁도-SS 관계식을 통해 수자원 공사 SURIAN 시스템에서 활용되고 있는 AEM3D 모델을 이용하여 탁수 발생 예측 정확도 개선을 하고자 하였다.

금융 특화 딥러닝 광학문자인식 기반 문서 처리 플랫폼 구축 및 금융권 내 활용 (Deep Learning OCR based document processing platform and its application in financial domain)

  • 김동영;김두형;곽명성;손현수;손동원;임민기;신예지;이현정;박찬동;김미향;최동원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.143-174
    • /
    • 2023
  • 인공지능의 발전과 함께 딥러닝을 활용한 인공지능 광학문자인식 기법 (Artificial Intelligence powered Optical Character Recognition, AI-OCR) 의 등장은 기존의 이미지 처리 기반 OCR 기술의 한계를 넘어 다양한 형태의 이미지로부터 여러 언어를 높은 정확도로 읽어낼 수 있는 모델로 발전하였다. 특히, AI-OCR은 인력을 통해 대량의 다양한 서류 처리 업무를 수행하는 금융업에 있어 그 활용 잠재력이 크다. 본 연구에서는 금융권내 활용을 위한 AI-OCR 모델의 구성과 설계를 제시하고, 이를 효율적으로 적용하기 위한 플랫폼 구축 및 활용 사례에 대해 논한다. 금융권 특화 딥러닝 모델을 만듦에 있어 금융 도메인 데이터 사용은 필수적이나, 개인정보보호법 이하 실 데이터의 사용이 불가하다. 이에 본 연구에서는 딥러닝 기반 데이터 생성 모델을 개발하였고, 이를 활용하여 AI-OCR 모델 학습을 진행하였다. 다양한 서류 처리에 있어 유연한 데이터 처리를 위해 단계적 구성의 AI-OCR 모델들을 제안하며, 이는 이미지 전처리 모델, 문자 탐지 모델, 문자 인식 모델, 문자 정렬 모델 및 언어 처리 모델의 선택적, 단계적 사용을 포함한다. AI-OCR 모델의 배포를 위해 온프레미스(On-Premise) 및 프라이빗 클라우드(Private Cloud) 내 GPU 컴퓨팅 클러스터를 구성하고, Hybrid GPU Cluster 내 컨테이너 오케스트레이션을 통한 고효율, 고가용 AI-OCR 플랫폼 구축하여 다양한 업무 및 채널에 적용하였다. 본 연구를 통해 금융 특화 AI-OCR 모델 및 플랫폼을 구축하여 금융권 서류 처리 업무인 문서 분류, 문서 검증 및 입력 보조 시스템으로의 활용을 통해 업무 효율 및 편의성 증대를 확인하였다.