• 제목/요약/키워드: 시간기반 예측 모델

검색결과 597건 처리시간 0.024초

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

  • 안성만;정여진;이재준;양지헌
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.71-88
    • /
    • 2017
  • 언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.

GOCI-II 및 극궤도 위성 자료를 병합한 Chlorophyll-a 산출물 생산방법 소개 및 활용 가능성 평가 (Introduction and Evaluation of the Production Method for Chlorophyll-a Using Merging of GOCI-II and Polar Orbit Satellite Data)

  • 신혜경;권재엽;김평중;김태호
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1255-1272
    • /
    • 2023
  • 위성영상 기반 클로로필-a (chlorophyll-a) 농도는 전지구 기후변화 연구를 위해 장기간의 시계열 자료로 생산되고 있으며, 시간합성 또는 다종위성 자료의 병합(merging)을 통해 결측이 없는 자료의 생산이 요구된다. 그러나 한반도 주변 해역에서의 위성영상 기반 클로로필-a 농도와 관련된 연구는 단일 해색센서로 산출하여 계절적 특징을 평가하거나 연구해역에 적합한 알고리즘을 제시하는 연구가 주로 수행되었다. 본 연구에서는 한반도 주변 해역에서의 공간 커버리지가 높은 클로로필-a 농도 산출을 위해 정지궤도 해색센서 GOCI-II와 극궤도 센서(MODIS, VIIRS, OLCI)의 원격반사도(Remote Sensing Reflectance) 병합자료를 이용하였다. 연구결과 산출물의 공간 커버리지는 극궤도 해색센서 자료보다 약 30% 증가하여 구름으로 인한 결측을 보완하였다. 그리고 현장 관측자료와 함께 Ocean Colour Climate Change Initiative (OC-CCI)와 GlobColour에서 제공하는 전지구 클로로필-a 합성장 자료와의 비교를 통해 정확도를 정량적으로 제시하고자 하였다. 그러나 현장관측 자료의 절대적인 수 부족으로 유의미한 통계적 결과는 제시하지 못하였지만, 전지구 자료와의 비교 결과보다 과소 추정 경향을 확인하였다. 또한 적조와 같은 해양재해·재난 대응 목적의 활용성 평가를 위해 2013년 동해에서 발생한 대번성 사례와 정성적으로 비교하여 정지궤도 해색센서 단독 결과보다 OC-CCI와 유사하게 나타나는 것을 확인하였다. 본 연구를 통해 산출한 결과를 사용하여 향후 인공지능모델 기반의 예측 연구와 아노말리(anomaly) 활용 연구를 수행할 예정이며, 이를 통해 우리나라 연안해역에서 발생하는 클로로필-a 이벤트 모니터링에 유용하게 활용이 가능할 것으로 기대된다.

항로표지 보호를 위한 디지털 영상기반 해무 강도 측정 알고리즘 (Sea Fog Level Estimation based on Maritime Digital Image for Protection of Aids to Navigation)

  • 유은지;이효찬;조성윤;권기원;임태호
    • 인터넷정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.25-32
    • /
    • 2021
  • 미래 해상 환경 변화에 맞춰 해상 항로표지가 다양한 분야에 걸쳐 활용되며 쓰임이 증대되고 있다. 해상 항로표지는 항행하는 선박의 위치, 방향 및 장애물의 위치를 알려주는 항행보조시설로, 현재는 단순히 선박의 안전 항해를 도울 뿐 아니라, 여러 센서와 카메라를 탑재하여 해양 기상환경을 파악하고 기록하는 수단으로 변모하고 있다. 하지만 주로 선박과의 충돌로 인해 소실되며 특히 해무로 인한 관측 시야 저하로 안전사고가 발생한다. 해무 유입은 항만, 해상교통 등에 위험을 초래하고 시간과 지역에 따라 발생 가능성의 차이가 커 예측이 쉽지 않다. 또한, 전 해역에 분포되어있는 항로표지의 특성상 개별 관리가 어렵다. 이를 해결하고자 본 논문에서는 항로표지에 설치된 카메라에서 촬영한 영상으로 해무 강도를 측정하는 방안을 통하여 해양 기상환경을 파악해 보완하고 날씨로 인한 항로표지 안전사고를 해결하는 것을 목적으로 한다. 설치가 어렵고 높은 비용이 드는 광학 및 온도 센서 대신 항로표지에 설치된 카메라의 일반 영상을 사용하여 해무 강도를 측정한다. 덧붙여 다양한 해역에서의 실시간 해무 파악을 위한 선행 연구로, 안개 모델(Haze Model), Dark Channel Prior(DCP)를 이용해 해무 강도 측정 기준을 제시한다. DCP를 적용한 영상에서 특정 픽셀값의 문턱값(Threshold value)을 설정하고, 이를 기준으로 전체 영상에서 해무가 존재하지 않는 픽셀의 수를 통해 해무 강도를 추정한다. 합성 해무 데이터셋과 실제 해무 동영상을 캡처해 만든 실제 해무 데이터셋으로 해무 강도 측정 여부를 검증했다.

수술중 전자선치료에 있어서 선량분포에 관한 연구 (A Study on Electron Dose Distribution of Cones for Intraoperative Radiation Therapy)

  • Kang, Wee-Saing;Ha, Sung-Whan;Yun, Hyong-Geun
    • 한국의학물리학회지:의학물리
    • /
    • 제3권2호
    • /
    • pp.1-12
    • /
    • 1992
  • 전자선을 이용한 수술중 방사선치료를 위해서는 수술중에 드러내 놓은 종양에 고선량의 방사선을 조사하되 주변 정상 조직을 보존하기 위하여 cone 장치를 개발할 필요가 있으며, 임상에 필요한 자료를 얻는 것 뿐만아니라 콜리메이터에 의한 적정 X-선 창 크기도 정할 필요가 있다. holder와 cone으로 이루어진 알루미늄제 결합형 cone장치를 개발하였다. 광자선의 SSD 100cm에서 조사면 크기가 직경 4~9cm이면서 lcm씩 차이가 있는 28cm 길이의 원통형 cone을 만들였으며, holder는 cone의 직경이 7cm이상인 것과 미만인을 것을 접속시키기 위해 따로 두 개를 만들었다. holder의 측면에는 조사부위를 관찰하기 위한 거울과 조명등을 삽입할 수 있는 개구부를 두었다. cone에 의한 조사면 크기와 콜리메이터에 의한 X선 창의 크기의 여러 가지 결합에 대하여 수중의 전자선의 깊이선량분포독선 및 측방선량분포곡선, 선량분포를 1차원 물팬톰 장치로 조종하는 p-형 실리콘 검출기로 측정하였다. 출력계수도 p-형 실리콘 검출기로 수중에서 측정하였다. 전자선의 에너지와 cone의 크기의 결합이 일정할지라도 콜리메이터에 의한 X-선 창의 크기는 표면선량 및 최대신량점의 깊이, 80% 선량점의 깊이, 측방선량분포, 출력계수에 영향을 미쳤다. 그중, 출력계수의 변화가 가장 현저하였다. 예로서 9 MeV 전자선의 출력계수는 0.637과 1.549의 범위에 있었다. 콜리메이터에 의한 X-선 창의 크기는 수술중 전자선치료용 cone 장치의 벽으로 향하는 산란 전자의 양에 영향을 미치고, cone장치에서 다시 산란된 전자는 출력계수 뿐만 아니라 선량분포도 바꿀 것으로 생각된다. 따라서 수술중 전자선치료용 cone장치에 대한 선량분포 측정은 임상에서 선량의 불확정도를 최소화하기 위해 필수적이다.능적으로 평가되어야 하므로 앞으로 이에 대한 연구가 요구된다.수 있었다. 즉, $a^{*}$ / $b^{*}$ 의 비값이 1이상 흑은 1에 가까울 때는 미숙기, 0.8 부근 일때는 적숙기, 0.8보다 작아 질수록 적숙기에서 과숙기로 점차 옮아감을 알 수 있었다.지해줄 수 있는 문헌들이 충분히 고찰되지 못하였고, 이론적배경 또한 횡문화 이론과의 관련성이 적었다. 또한 횡 문화 연구에 기초가 되는 연구대상자의 사회 인구학적 특성과 역사적 배경은 잘 나타났으나, 이론적 연구와 경험적 연구 간에 괴리가 있었다. 3. 표본추출방법은 문화에 기반을 둔 대상자를 선정한다는 점에서 한계성 이 있었다. 4. 방법론적 이유로는 대상자와의 면담시간이 구체적으로 기술되지 않았으며, 고유한 언어를 통역하는 과정에서 의미론적 문제에 대한 고려가 부족하였다. 면접과 기록과정에서 보면 자료의 기록과정과 분류 및 분석과정이 명시되어 있지 않았다. 참여관찰과 면접방법을 사용시 이에 대한 자세한 기술이 되어 있지 않았다. 5. 연구결과의 적용 및 이에 대한 논의는 상당히 제한되어 있었는데, 수편의 연구만이 방법론 문제점과 앞으로의 연구분야에 대한 전망을 제시하였으며, 특이한 것은 어 떤 연구자도 이른 개발을 위한 적용 및 임상실무적 차원에서 간호에 대한 제언을 하지 않았다.유모델변수들은 유입-유출 자료들로부터 평가할 수 있으며, 이를 위해서 본 논문에서는 Gauss-Newton 방법을 이용한 Bard 알고리즘을 사용하였다. 서울 구로구 시흥동 산사태 발생 지역의 산사면에 대하여 개발된 모델을 적용하여 예제 해석을 수행함으로써, 지하수 흐름 모델이 산사태 발생 예측을 위하여 이용할 수 있음을 입증하였다. 또한, 매개변수분석 연구를 통하여, 변수 a값은 작은 변화에 대하여 목적함수값에 큰 변화를

  • PDF

0D 반응 모델을 활용한 PP와 PE의 비응축성 열분해 기체의 열화학적 전환에 대한 수치해석 연구 (Numerical Study on Thermochemical Conversion of Non-Condensable Pyrolysis Gas of PP and PE Using 0D Reaction Model)

  • 이은지;양원;이은도;이영재
    • 청정기술
    • /
    • 제30권1호
    • /
    • pp.37-46
    • /
    • 2024
  • 전 세계적으로 플라스틱 폐기물로 인한 환경문제가 지속적으로 제기되었으며, 코로나19 이후 플라스틱 폐기물은 급증하는 추세이다. 특히 PP와 PE는 전체 플라스틱 생산량의 절반 이상을 차지하며 두 소재의 폐기물량은 심각한 수준이다. 이에 따라 국내외적으로 플라스틱 재자원화를 위한 연구가 지속적으로 수행되고 있으며, 그중 열분해 기술은 한가지 대안이 될 수 있다. 본 연구에서는 PP와 PE의 열분해 생성 기체에 대한 화학 반응론적 거동을 예측하고자 비응축성 기체의 열분해 거동에 관한 수치해석 연구를 수행하였다. 기존의 열분해 문헌 조사를 통해 얻은 다양한 조성의 탄화수소 화학종을 기반으로 온도와 체류시간에 따라 생성물의 거동을 분석하였다. 수치해석 결과, 온도 및 체류시간이 증가함에 따라 비응축성 기체의 전환을 통해 H2와 고분자 탄화수소의 생성이 증가하였고 동시에 CH4와 C6H6 화학종은 감소하여 반응에 참여하는 것을 알 수 있었다. 또한 생성률 분석을 통해 C2H4의 분해 반응이 H2 생성에 지배적인 반응임을 확인하였고, C2H4의 함량이 PP 대비 많은 PE에서 C2H4의 분해 반응을 통해 H2 생성량이 증가하는 경향을 나타냈다. 향후 수치해석 결과에서 도출된 여러 변수를 통해 플라스틱에서 H2 및 탄소의 전환율을 높이는 방법을 실험적으로 확인할 계획이다.

HBR-Tree를 이용한 실시간 모바일 GIS의 개발 (Development of a Real-Time Mobile GIS using the HBR-Tree)

  • 이기영;윤재관;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권1호
    • /
    • pp.73-85
    • /
    • 2004
  • 최근 들어 무선 인터넷이 발전하고, PDA, HPC의 보급이 늘어남에 따라 GIS(Geographic Information System)와 관련된 연구 및 개발이 점차적으로 위치 기반 서비스(LBS: Location Based Service)를 제공하기 위한 실시간 모바일 GIS로 변화해 가고 있다. LBS를 효과적으로 제공하기 위해서는 이동 객체의 동적인 상황을 효과적으로 처리할 수 있는 실시간 GIS 플랫폼과 위치 데이타의 특성을 반영한 위치 인덱스가 필요하다. 위치 데이타는 이전의 GIS에서 사용되는 것과 동일한 데이타 타입(예, 점)이 사용되지만 위치 데이타의 관리는 이전 GIS와는 다른 처리 방식을 사용해야 한다. 이를 위하여 본 논문에서는 대용량의 위치 데이타를 효율적으로 처리할 수 있는 HBR-tree를 이용한 실시간 모바일 GIS의 개발에 대하여 연구하였다. 본 연구에서 개발된 실시간 모바일 GIS는 HBR-tree와 실시간 GIS 플랫폼으로 구성되어 있다. HBR-tree는 R-tree와 공간 해쉬가 결합된 위치 인덱스이다. 그러므로, 위치 데이타가 빈번하게 변경되더라도 갱신 연산은 HBR-tree의 동일한 해쉬 테이블에서 일어나기 때문에 다른 트리 기반 인덱스에 비하여 갱신 연산이 적으며, 검색 연산은 R-tree의 검색 메커니즘을 이용하기 때문에 공간 데이타를 신속하게 검색할 수 있다. 본 논문에서 실시간 GIS 플랫폼은 주기억장치 데이타베이스 시스템의 기능이 확장된 실시간 GIS 엔진, 공간 및 비공간 데이타를 서버와 클라이언트로 전송하기 위한 미들웨어, 그리고 모바일 장치에서 동작하는 모바일 클라이언트로 구성되어 있다. 특히, 본 논문에서는 실험적 방법을 사용하여 HBR-tree와 실시간 GIS 엔진의 성능 평가 결과에 대해서도 기술하였다. 확보하며 이루어져야 가능하다. 여러 지자체를 중심으로 수행된 지자체 GIS 감리와 컨설팅의 경험을 통해 도출된 문제점들을 일반화시켜 정리하였으며, 이를 통해 지자체 GIS사업의 추진 및 운영모델을 제시하였다. 표시할 수 있음으로서 의사결정에 보다 많은 도움을 줄 수 있을 것이다. 비트율의 증가와 화질 열화는 각각 최대 1.32%와 최대 0.11dB로 무시할 수 있을 정도로 작음을 확인 하였다.을 알 수 있었다. 현지관측에 비해 막대한 비용과 시간을 절약할 수 있는 위성영상해석방법을 이용한 방법은 해양수질파악이 가능할 것으로 판단되며, GIS를 이용하여 다양하고 복잡한 자료를 데이터베이스화함으로써 가시화하고, 이를 기초로 공간분석을 실시함으로써 환경요소별 공간분포에 대한 파악을 통해 수치모형실험을 이용한 각종 환경영향의 평가 및 예측을 위한 기초자료로 이용이 가능할 것으로 사료된다.염총량관리 기본계획 시 구축된 모형 매개변수를 바탕으로 분석을 수행하였다. 일차오차분석을 이용하여 수리매개변수와 수질매개변수의 수질항목별 상대적 기여도를 파악해 본 결과, 수리매개변수는 DO, BOD, 유기질소, 유기인 모든 항목에 일정 정도의 상대적 기여도를 가지고 있는 것을 알 수 있었다. 이로부터 수질 모형의 적용 시 수리 매개변수 또한 수질 매개변수의 추정 시와 같이 보다 세심한 주의를 기울여 추정할 필요가 있을 것으로 판단된다.변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이루어질 수 있을 것으로 기대된다.는 초과수익률이 상승하지만, 이후로는 감소하므로, 반전거래전략을 활용하는 경우 주식투자기간은 24개월이하의 중단기가 적합함을 발견하였다. 이상의 행태적 측면과 투자성과측면의 실증결과를 통하여 한국주식시장에 있어서 시장수익률을 평균적으로 초과할 수

  • PDF

IFSA 알고리즘을 이용한 유전자 상호 관계 분석 (Analysis of Interactions in Multiple Genes using IFSA(Independent Feature Subspace Analysis))

  • 김혜진;최승진;방승양
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권3호
    • /
    • pp.157-165
    • /
    • 2006
  • 세포는 환경 변화 및 자극으로부터 자신을 보호하기 위해 유전자가 발현하여 생명을 유지 시스템을 갖고 있다. 유전자의 발현은 비정상적인 상태의 세포를 환경을 조절, 변화시켜 정상으로 바꾸기 위한 기능, 발달단계에 필요한 기능 등 생명현상에 필요한 특수 역할을 수행한다. 따라서 각 유전자의 기능을 아는 것은 생물학적으로 상당히 의미 있는 일이다. 본 논문에서는 유전자 기능을 알아보기 위해 발현 패턴을 통해 같을 때, 유사한 형태 혹은 시차를 갖고 동일한 형태로 발현하는 유전자들은 같은 기능을 한다는 가정을 하였다. 이 가정에 기반하여 각 유전자들을 기능에 따라 분류하였다. (1) IFSA선형 모델을 적용하여 데이타를 잘 나타내 줄 수 있는 특징 패턴을 찾았으며 (2) 이 특징 패턴으로부터 본 논문에서 제안한 Membership Scoring Function을 이용하여 유전자를 필터링(filtering) 하였다. 이 유전자들은 기존의 ICA(Independent Component Analysis) 방법에서 보다 IFSA 방법이 더 효과적으로 각 기능에 따른 유전자 그룹을 찾아내줌을 GO(Gene Ontology)에서 확인할 수 있었다. 이는 시차 혹은 위상 변화에 상관없이 데이타를 잘 나타낼 수 있는 IFSA의 특성이, ICA보다. 생물학적인 변수를 더 고려해 줄 수 있기 때문이라고 생각된다[1]. 이 논문의 또 다른 주요 작업은 유전자의 상호작용 관계로부터 유전자 네트웍을 얻어내는 것이다. 유전자 네트웍은 같은 그룹 내에서 유전자간의 상관 계수를 구하고 가장 높은 상관도를 보이는 유전자쌍을 연결시켜 얻게되었다. 이 네트웍 역시 GO 해석에서 그 유효성을 확인하였다.를 평균 66.02에서 58.98로 줄이면서 계산시간은 평균 71ms에서 44ms 으로 빠르게 됨을 알 수 있었다.적외선 분광법을 이용한 사일리지의 화학적 조성분 함량 측정은 적은 오차 범위 내에서 신속하고 정확한 분석법이 될 수 있음을 확인 할 수 있었다. 비록 원물 생시료(IF)에 대한 직접적인 측정은 다소 예측 정확성이 떨어지지만 현장 적용성과 편리성을 높이기 위해서는 생시료의 측정시 오차를 줄일 수 있는 스펙트럼의 수처리 방법이나 산란보정 방법과 같은 데이터 처리기법에 대한 더 많은 연구가 앞으로 진행되어야 한다고 생각되어진다.상자의 50% 이상이 매일 생선 콩 및 콩제품과 채소류를 먹고 있었고, 인스턴트나 패스트푸드는 정상 체중군이 저체중군이나 과체중보다 매일 섭취하는 빈도가 낮았다(p<0.0177). 7. 가장 낮은 영양 섭취 상태를 보여준 영양소(% RDA< 75%)는 철분과 칼슘으로 조사 대상자의 3/4에 해당하는 조사 대상자가 영양 부족 상태였다. 칼슘 섭취의 경우 정상 체중군이 과체중군과 저체중군보다 섭취율이 낮았으나(p<0.0257) 철분은 군간 유의차는 없었다. 8. 칼슘의 경우 과체중군이 저체중군이나 정상 체중군에 비해 영양소 적정비율(NAR) 값이 높았으며(p<0.0257) 철분, 단백질, 비타민 $B_1$$B_2$, 나이아신의 경우도 통계적으로 유의하지는 않으나 과체중군이 저체중군 또는 정상 체중군의 NAR 값이 높은 경향을 보여주었다. 9가지 영양소의 NAR을 평균한 MAR 값은 군간 유의적이지는 않으나 과체중군(0.76)이 정상체중(0.73) 또는 저체중군(0.73)에 비해 높은 값은 보여주었다. 9.