• 제목/요약/키워드: Pre Processing

검색결과 2,011건 처리시간 0.027초

스택-포인터 네트워크와 부분 트리 정보를 이용한 한국어 의존 구문 분석 (Korean Dependency Parsing Using Stack-Pointer Networks and Subtree Information)

  • 최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권6호
    • /
    • pp.235-242
    • /
    • 2021
  • 본 연구에서는 포인터 네트워크 모델을 의존 구문 분석에 맞게 확장한 스택-포인터 네트워크 모델을 이용하여 한국어 의존 구문 분석기를 구현한다. 스택-포인터 네트워크 모델 기반 의존 구문 분석기는 인코더-디코더로 구성되어 있으며 다른 의존 구문 분석기와 달리 내부 스택을 갖고 있어 루트부터 시작하는 하향식 구문 분석이 가능하다. 디코더의 각 단계에서는 의존소를 찾기 위해 부모 노드뿐만 아니라 이미 파생된 트리 구조에서 조부모와 형제 노드를 참조할 수 있다. 기존 연구에서는 단순하게 해당 노드들의 합을 계산하여 입력으로 사용하였고, 형제 노드의 경우에는 가장 최근에 방문했던 것만을 사용할 수 있었다. 본 연구에서는 그래프 어텐션 네트워크를 도입하여 이미 파생된 부분 트리를 표현하고 이를 스택-포인터 네트워크의 입력으로 사용하도록 구문 분석기를 수정한다. 세종 코퍼스와 모두의 코퍼스를 대상을 실험한 결과 레이어 2의 그래프 어텐션 네트워크를 이용하여 부분 트리를 표현했을 때 특히 문장 단위의 구문 분석 정확도에서 많은 성능 향상을 확인할 수 있었다.

빅데이터를 활용한 건축물 화재위험도 평가 지표 결정 (Determination of Fire Risk Assessment Indicators for Building using Big Data)

  • 주홍준;최윤정;옥치열;안재홍
    • 한국건축시공학회지
    • /
    • 제22권3호
    • /
    • pp.281-291
    • /
    • 2022
  • 본 연구에서는 빅데이터를 활용하여 건축물의 화재위험도 평가에 필요한 지표를 결정하였다. 건축물에서 화재위험도에 영향을 미치는 원인은 대부분 건축물만을 고려한 지표로 고착화되어 있기 때문에 제한적이고 주관적인 평가가 수행되어왔다. 따라서, 빅데이터를 활용하여 다양한 내·외부 지표를 고려한다면 건축물의 화재위험도 저감을 위한 효과적인 대책을 도모할 수 있다. 지표 결정에 필요한 데이터를 수집하기 위해 먼저 질의어를 선정하고, 웹 크롤링 기법을 이용하여 비정형 데이터 형식의 전문 문헌을 수집하였다. 문헌 내 단어를 수집하기 위해 사용자 용어사전 등록, 중복 문헌 및 불용어 제거의 전처리 과정을 수행하였으며, 선행 연구를 검토하여 단어를 4개의 요소로 분류하고 각 요소에서 위험도와 관련된 대표 키워드를 선정하였다. 그리고 대표 키워드의 연관검색어 분석을 통해 파생되는 위험도 관련 지표를 수집하였다. 지표의 선정 기준에 따라 수집된 지표를 검토한 결과, 20개의 건축물 화재위험도 지표를 결정할 수 있었다. 본 연구 방법론은 건축물 화재위험의 저감 대책 수립을 위한 빅데이터 분석의 적용 가능성을 나타내며, 결정된 지표는 건축물 화재위험도 평가를 위한 참고자료로 사용될 수 있을 것이다.

A.I.에이전트와의 보이스 인터랙션 : 국내외 IT회사 사례연구 (Voice Interactions with A. I. Agent : Analysis of Domestic and Overseas IT Companies)

  • 이서영
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권4호
    • /
    • pp.15-29
    • /
    • 2021
  • 인공지능 에이전트는 4차 산업혁명의 핵심 기술이고, 현재 많은 기업들이 AI 음성 인식 비서를 탑재 출시함으로써 산업 내 치열한 경쟁을 벌이고 있다. 애플, 마이크로소프트, 구글, 아마존, 삼성 등 고객 충성도를 확보하고 있으며 자사 하드웨어 제품을 내놓고 있는 기업의 경우, AI 비서 서비스를 자사 제품에 적용함으로써 고객 충성도를 높이고, 시장 점유율 역시 극대화뿐 아니라 향후 음성 인터페이스 플랫폼 시장 장악력을 확대하고 있다. 본 연구는 인공지능분야의 해외 및 국내 주요 기업들의 현황을 분석하고 보이스 UI 개발과 혁신 수용 관점에서 사용자 만족을 위한 기술 발전 방향에 초점을 맞추어 미래 전략 방향을 제언했다. B2B 기술적인 측면에서는 음성 인식률을 높이고 하드웨어향상, 자연언어 처리기술 및 빅데이터 및 인공지능 접목한 혁신 기술의 데이터가 쌓인 클라우드 컴퓨팅 활용뿐 아니라 및 Open A.I.언어 인공지능인 GPT-3의 활용 및 사용성, 유용성, 감성 측면에서 사용자 만족을 높일 필요가 있다. 본 연구는 산업계와 학계에 실무적, 이론적 함의를 준다.

다중분광 드론영상의 표준화를 위한 전처리 기법 비교·분석 (Comparative Analysis of Pre-processing Method for Standardization of Multi-spectral Drone Images)

  • 안호용;류재현;나상일;이병모;김민지;이경도
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1219-1230
    • /
    • 2022
  • 농업관측에서의 다중분광 드론은 식생구분 및 식생활력도 분석에 있어 복사량이나 반사도와 같은 물리량을 기반으로 한 정량적이고 신뢰성 있는 데이터가 필요하다. 작황분석 모니터링을 위한 원격탐사 자료의 경우 동일지역에 대해 여러 시기에 걸쳐 촬영된 영상이 요구되며, 특히 엽면적 지수 또는 엽록소와 같은 생물리자료의 경우 동일한 기준에서의 시계열 자료를 통해 분석되므로 직접적으로 비교 가능한 반사도 자료가 필요하다. 드론영상을 기반 정사영상(정합영상)은 전체 영상 화소값이 왜곡되거나 접합 경계면 화소값의 차이가 발생하여 정확한 물리량 산출에 한계를 가진다. 본 연구는 시계열 작황 모니터링을 위한 드론영상의 보정방법에 따른 지상 반사도와 드론영상 기반 식생지수를 산정하고 그 결과를 지상관측자료와 비교하여 전처리 방법에 따른 드론영상의 분광학적 특성을 구명하고자 수행하였다.

화성 지형상대항법을 위한 하강 데이터셋 생성과 랜드마크 추출 방법 (Descent Dataset Generation and Landmark Extraction for Terrain Relative Navigation on Mars)

  • 김재인
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1015-1023
    • /
    • 2022
  • 착륙선의 진입-하강-착륙 과정에는 많은 환경적 및 기술적 어려움이 수반된다. 이러한 문제들을 해결하기 위한 방안으로, 최근 착륙선에는 지형상대항법 기술이 필수적으로 고려되고 있다. 지형상대항법은 하강하는 착륙선에서 수집되는 Inertial Measurement Unit (IMU) 데이터 및 영상 데이터를 기 구축된 참조 데이터와 비교하여 착륙선의 위치 및 자세를 추정하는 기술이다. 본 논문에서는 화성에서 활용할 지형상대항법 기술을 개발하기 위해 그 핵심 기술 요소로서 하강 데이터셋 생성 및 랜드마크 추출 방법을 제시한다. 제안방법은 화성착륙 시뮬레이션 궤적정보를 이용하여 하강하는 착륙선의 IMU 데이터를 생성하며, 이에 맞추어 고해상도 정사영상지도 및 수치표고모델로부터 ray tracing 기법을 통해 하강영상을 생성한다. 랜드마크 추출은 텍스쳐 정보가 부족한 화성 표면의 특성을 고려하여 영역 기반 추출 방식으로 이루어지며, 정합 정확도와 속도 향상을 위해 탐색영역 축소가 수행된다. 하강영상 생성 방법의 성능분석 결과는 제안방법으로 촬영 기하학적 조건을 만족시키는 영상 생성이 가능함을 보여주었으며, 랜드마크 추출 방법의 성능분석 결과는 제안방법을 통해 수 미터 수준의 위치 추정 정확도를 담보하면서 동시에 특징점 기반 방식만큼의 처리속도 확보가 가능함을 보여주었다.

AI기반 상수도시설 개량 의사결정 모델 분석 (Model Analysis of AI-Based Water Pipeline Improved Decision)

  • 김기태;민병원;오용선
    • 사물인터넷융복합논문지
    • /
    • 제8권5호
    • /
    • pp.11-16
    • /
    • 2022
  • 상수도분야 인공지능 기술개발 관심도가 증가함에 따라 상수도 관로에 대해서 노후관 상태평가 데이터 결과를 활용하여 반복적인 학습으로 개량 의사결정 등급을 예측할 수 있는 인공신경망 알고리즘을 개발하고 검증과정을 통하여 가장 신뢰성 있는 예측 모델을 제시하고자 한다. 2020년 한강유역의 노후관로 정비 기본계획에 의한 간접평가 데이터 12개 항목을 기반으로 데이터 전처리 하고 인공신경망 알고리즘을 적용하여 반복학습과 검증을 통해 계산된 결과값과 직접평가 결과값의 일치율이 90% 이상이 되도록 역전파 과정을 통해 가중치를 업데이트 하면서 최적화하여 관로 등급을 예측하는 알고리즘을 개발하였다. 알고리즘 정확도 검증결과 모든 관종 데이터가 고르게 분포되어 있고 학습 데이터가 많아야 예측평가 정확도가 높아지는 것을 확인할 수 있었다. 향후 전국의 다양한 데이터가 확보되면 인공신경망을 이용한 관로등급 예측의 신뢰도가 좀 더 향상되어 객관화된 노후관 상태평가 의사결정 지원 역할을 수행할 수 있을 것으로 기대된다.

LSTM 기법을 활용한 수위 예측 알고리즘 개발 시 비정형자료의 역할에 관한 연구: 잠수교 사례 (Role of unstructured data on water surface elevation prediction with LSTM: case study on Jamsu Bridge, Korea)

  • 이승연;유형주;이승오
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1195-1204
    • /
    • 2021
  • 최근 이상기후로 인한 국지성호우가 잦아져 하천변 사회기반시설을 포함한 인적·물적 피해가 급증하고 있다. 본 연구에서는 해당 시설들의 침수 피해를 예측·방지하고자 기계학습 중 시계열자료에 특화된 LSTM(Long Short- term Memory)기법을 활용하여 수위 예측 알고리즘을 개발하였다. 연구대상지는 잠수교로 연구기간은 총 6년(2015년~2020년)의 6, 7, 8월로 3시간 후의 잠수교 수위를 예측하였다. 입력자료(Input data)는 잠수교 수위(EL.m), 팔당댐 방류량(m3/s), 강화대교 조위(cm), 서울시 트윗의 개수로 기존 연구에 주로 사용된 정형자료뿐만 아니라 워드클라우드를 통해 구축된 비정형자료도 함께 사용하여 상호 보완형 자료를 구축하고, 비정형자료 활용 유무의 비교·분석을 통해 비정형자료의 역할도 제시하였다. 잠수교의 수위 예측 시 상호 보완형의 자료가 정형자료만을 사용한 경우에 비해 예측 정확도가 향상하였는 데, 이는 인명 피해를 감소시킬 수 있는 보수적인 예/경보가 가능함을 알 수 있었다. 본 연구에서는 하천변 사회기반시설의 이용자 안전 및 편의 제공에 상호 보완형 자료의 사용이 보다 효과적이라 판단하였다. 향후에는 비정형자료의 종류를 추가하거나 입력자료의 세밀한 전처리를 통하여 더욱 정확한 수위 예측을 기대해본다.

생물화학적 산소요구량 농도예측을 위하여 데이터 전처리 접근법을 결합한 새로운 이단계 하이브리드 패러다임 (Novel two-stage hybrid paradigm combining data pre-processing approaches to predict biochemical oxygen demand concentration)

  • 김성원;서영민;자크로프 마샵;말릭 아누락
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1037-1051
    • /
    • 2021
  • 주요한 수질지표 중의 하나인 생물화학적 산소요구량(BOD) 농도는 호소와 하천에서 생태학적 측면에서 관측항목으로 취급하고 있다. 본 연구에서는 대한민국의 도산 및 황지지점에서 BOD 농도예측을 위하여 새로운 이단계 하이브리드 패러다임(웨이블릿 기반 게이트 순환 유닛, 웨이블릿 기반 일반화된 회귀신경망, 그리고 웨이블릿 기반 랜덤 포레스트) 을 활용하였다. 이러한 모형들은 각 대응하는 독립모형들(게이트 순환 유닛, 일반화된 회귀신경망, 그리고 랜덤 포레스트) 과 함께 평가되었다. 다양한 수질 및 수량지표들이 여러 개의 입력조합(분류1-5) 을 기본으로 하여 독립 및 이단계 하이브리드 모형을 개발하기 위하여 구현되었다. 언급한 모형들은 root mean squared error (RMSE), Nash-Sutcliffe efficiency (NSE), 그리고 correlation coefficient (CC) 를 포함한 세 개의 통계지표로서 평가되었으며, 통계결과치를 분석하면 이단계 하이브리드 모형들이 항상 대응하는 독립모형들의 예측 정도를 개선하지 않은 것으로 나타났다. 대한민국의 도산관측소에서는 DWT-RF5 (RMSE = 0.108 mg/L) 모형이 다른 최적모형과 비교하여 BOD 농도의 더 정확한 예측을 나타내었으며, 황지관측소에서는 DWT-GRNN4 (RMSE = 0.132 mg/L) 모형이 BOD 농도를 예측하는 최고의 모형이다.

학술논문 내에서 참고문헌 정보가 포함된 서지 메타데이터 자동 생성 연구 (Automatic Generation of Bibliographic Metadata with Reference Information for Academic Journals)

  • 정선기;신현호;지선영;최성필
    • 한국문헌정보학회지
    • /
    • 제56권3호
    • /
    • pp.241-264
    • /
    • 2022
  • 서지정보는 연구 주제의 최신 동향의 인지와 유용성을 검증하는 데에 참고할 수 있다. 즉, 각자 연구자들이 필요로 하는 문헌에 신속하게 접근하기 위해서는 학술논문에서 저자 정보, 요약, 초록, 참고문헌 등을 쉬운 방법으로 파악해야 한다. 그러나, 현재 출판되는 PDF 형식의 전자 학술논문은 출판 주체별로 고유한 양식을 띄고 있어서, 몇몇 특징에 의한 규칙 기반 추출법으로는 수많은 문헌에서 목표 정보를 추출하여 요약된 서지사항으로 자동 생성하기 어렵다. 이에 본 연구는 학술논문 서지사항 자동 생성에 있어서 양식의 다양성으로 인한 메타데이터 자동 추출의 난점을 극복할 방법을 제안한다. 제안하는 모델은 서지사항이 주로 기술되는 학술논문의 첫 페이지에서 목표 영역과 본문의 시작점을 구분할 수 있는 심층신경망 기반 모델과 앞의 모델로 추출된 서지사항을 상세한 메타데이터로 분류하고 재생성하는 규칙 기반 모델로 구성된다. 제안하는 모델은 참고문헌 요약정보를 생성하는 모델도 포함하는데, 본문의 말미와 참고문헌 시작점의 분리, 그리고 개별 참고문헌 추출을 규칙 기반 방법으로 진행하고, 추출한 각개 참고문헌의 서지정보를 분류하는 데에 심층신경망을 이용하도록 구성하였다. 추가로, 논문 자체의 서지정보를 전후처리 없이 추출/생성하는 모델의 가능성을 확인하기 위하여 참고문헌 영역까지 아우르는 모델을 구축하여 비교 실험을 진행하였다. 실험 결과 본 논문에서 제안하는 방식이 서지정보를 전후처리 하지 않고 진행한 비교 실험에 비하여 더 높은 성능을 보였다.

알코올 선별 검사법(Alcohol Use Disorders Identification Test)과 뇌 백질 영역의 확산텐서 비등방도 계측 값의 관련성 (Relationship between Alcohol Use Disorders Identification Test Fractional Anisotropy Value of Diffusion Tensor Image in Brain White Matter Region)

  • 이치형;김경립;곽종혁
    • 한국방사선학회논문지
    • /
    • 제16권5호
    • /
    • pp.575-583
    • /
    • 2022
  • AUDIT(Alcohol Use Disorders Identification Test)에서 정상 음주자, 위험 음주자 및 알코올 사용 장애자로 분류하여 뇌 백질 영역의 ROI(Region Of Interest)에 대한 FA 측정값을 분석하였다. TBSS(Tract-Based Spatial Statics) 도구를 사용하여 ROI의 FA 값을 추출하였다. TBSS라는 도구는 뇌 회백질보다는 백질에 대한 FA값과 MD 값의 민감도가 더 높고 뇌 신경섬유의 비등방도를 정량적으로 도출해 낼 수 있는 장점이 있고 백질에 더 특화된 프로그램이라 할 수 있다. 특히 양쪽 맥락총 평균 차이가 높았고 정상 음주자에서는 FA의 평균값이 0.2831과 0.2872로 나타났으며, 알코올 사용 장애자의 경우 0.1972와 0.1936로 나타났다. 즉, AUDIT 척도에서 점수가 높을수록 뇌 백질의 계측한 모든 ROI 영역에서 FA 값이 더 낮게 측정되는 것을 알 수 있었으며 뇌 백질에 신경 섬유로의 손상에 대한 미세구조 변화를 확인할 수 있었다. AUDIT 척도를 사용하여 DTI의 FA 값에 대한 지침을 제시할 수 있으며 혈액학적 인자의 가이드인 처럼 FA 값을 산정한다면 알코올 사용 장애자의 선별 및 진단에 유용한 검사법이라 사료 된다.