• Title/Summary/Keyword: Analysis of Query

검색결과 457건 처리시간 0.031초

NLP와 BiLSTM을 적용한 조세 결정문의 분석과 예측 (Tax Judgment Analysis and Prediction using NLP and BiLSTM)

  • 이영근;박구락;이후영
    • 디지털융복합연구
    • /
    • 제19권9호
    • /
    • pp.181-188
    • /
    • 2021
  • 일반인에게 난해한 법률분야를 이해하기 쉽고 예측 가능 할 수 있도록 인공지능을 적용한 법률 서비스에 대한 연구의 중요성이 대두되고 있다. 본 연구에서는 조세심판원의 결정정보를 수집하고 데이터 처리와 자체 학습을 통한 모델을 구축하여 사용자의 질의에 맞는 답변을 예측하기 위한 시스템을 제안한다. 제안 모델은 웹크롤링을 통해서 조세 결정문의 정보 수집 및 자연어 처리과정을 통하여 유용한 데이터를 추출하고, 최적화된 산출물을 Word2Vec의 Fast Text 알고리즘을 적용하여 단어의 벡터를 생성하였다. 2017년부터 2019년까지 총 11,103건의 정보를 수집하고 분류하였으며 RNN 기술의 BiLSTM을 적용하여 자체학습을 통한 결과 예측 프로그램을 구축하여 70%정확도로 실증하였다. 향후 다양한 법률시스템으로 활용성을 기대할 수 있으며 보다 효율적인 적용을 위한 연구와 정확도 향상을 위한 연구가 계속되어야 한다.

독립성분분석을 이용한 다변량 공정에서의 고장탐지 방법 (Fault Detection Method for Multivariate Process using ICA)

  • 정승환;김민석;이한수;김종근;김성신
    • 한국정보통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.192-197
    • /
    • 2020
  • 대규모 발전소나 화학공정과 같은 다변량 공정은 매우 위험한 환경에서 운전되기 때문에 고장이 발생하면 심각한 인적·물적 손실이 발생할 수 있다. 따라서 시스템의 고장을 사전에 탐지할 수 있는 온라인 모니터링 기술이 필수적이다. 본 논문에서는 세 가지의 다른 다변량 공정 데이터에 ICA를 적용하여 고장탐지를 수행하였고, PCA와 성능을 비교하였다. ICA 기반의 고장탐지 절차는 크게 오프라인 과정과 온라인 과정으로 나뉜다. 오프라인 과정에서는 시스템이 정상일 때 계측된 데이터를 이용하여 고장판별을 위한 문턱 값을 설정한다. 그리고 온라인 과정에서는 실시간으로 계측되는 질의벡터에 대한 통계량을 계산한 후, 계산된 통계량과 사전에 정의된 문턱 값과 비교하여 고장을 판별한다. 본 논문에서 이용한 세 가지의 다변량 공정 데이터에 실험한 결과, ICA 기반 고장탐지 방법이 시스템의 고장을 사전에 탐지하였고, PCA 보다 우수한 고장탐지 성능을 보여주었다.

아키텍처산출물 관리 시스템 개발 (Development of Architecture Products Management System)

  • 최남용;송영재
    • 정보처리학회논문지D
    • /
    • 제12D권6호
    • /
    • pp.857-862
    • /
    • 2005
  • 현재 국방부에서는 국방정보체계간 상호운용성을 보장하기 위해 아키텍처산출물을 쉽고 일관성이 있게 개발할 수 있는 국방아키텍처프레임워크와 개발된 아키텍처산출물을 저장하는 핵심아키텍처데이터모델을 개발하였다. 하지만 작성된 아키텍처산출물을 문서로 관리하기에는 많은 어려움이 존재함으로, 아키텍처를 모델링할 수 있고 모델링된 정보를 공통의 저장소에 관리할 수 있는 모델링 도구 및 리포지토리 시스템이 필요하다. 본 논문에서는 국방아키텍처프레임워크와 핵심아키텍처데이터모델의 메타모델과 아키텍처산출물 작성 및 관리를 지원하는 아키텍처산출물 관리 시스템을 개발하였고 기존 시스템과 비교 평가하였다. 이를 통해 각 기관의 아키텍처개발자가 아키텍처산출물을 모델링 방법으로 보다 쉽고 일관성 있게 작성하고 관리할 수 있으며, 다양한 질의를 통해 시스템에서 관리되는 아키텍처산출물 정보를 유용하게 검색 및 조회하여 의사결정에 참조할 수 있다. 또한 작성된 아키텍처산출물을 통합하고 분석 및 비교하여 정보체계간 상호운용성과 비용 절감을 지원한다.

공격코드 사례분석을 기반으로 한 SQL Injection에 대한 단계적 대응모델 연구 (A Study of Step-by-step Countermeasures Model through Analysis of SQL Injection Attacks Code)

  • 김점구;노시춘
    • 융합보안논문지
    • /
    • 제12권1호
    • /
    • pp.17-25
    • /
    • 2012
  • SQL Injection 기법은 공개된지 수년이 지났지만 웹해킹 공격중 가장 위험한 공격으로 분류되어 있다. 웹 프로그래밍은 자료의 효율적인 저장 및 검색을 위해 DBMS를 필수적으로 사용하고 있다. 주로 PHP,JSP,ASP 등의 스크립트 언어를 이용하여 DBMS와 연동한다. 이러한 웹 어플리케이션에서 클라이언트의 잘못된 입력값을 검증하지 않으므로 비정상적인 SQL 쿼리가 발생할 수 있다. 이러한 비정상적 쿼리는 사용자 인증을 우회하거나 데이터베이스에 저장된 데이터를 노출시킬 수 있다. 공격자는 SQL Injection 취약점을 이용하여 아이디와 암호를 몰라도 웹기반 인증을 통과할 수 있고 데이터베이스에 저장된 데이터를 열람해 볼 수 있다. SQL Injection에 대한 대책으로 다수의 방법이 발표되었다. 그러나 어느 한 가지 방법에 의존할 경우 많은 보안 공백이 발생할 수 있다. 단계적 대응모델은 사고 예방적 측면에서 소스코드 작성 단계, 서버 운용단계, 데이터베이스 핸드링 단계, 사용자 입력값 검증 활용 단계 등 대책을 프레임워크로 구성하여 적용하는 방법이다. 이 대응모델 을 적용할 경우 운용과정을 통해 존재하는 SQL Injection의 공격가능성을 보다 효과적으로 차단이 가능하다.

국내 포털 이용자들의 멀티미디어 검색 행태 분석 (The Multimedia Searching Behavior of Korean Portal Users)

  • 박소연
    • 한국문헌정보학회지
    • /
    • 제44권1호
    • /
    • pp.101-115
    • /
    • 2010
  • 멀티미디어 검색은 전통적인 검색과 웹 검색을 차별화시키는 중요한 요소 중 하나이다. 본 연구에서는 국내 주요 검색 포털인 네이버 이용자들의 멀티미디어 검색 행태를 분석, 평가하였다. 이를 위하여 이용자들이 입력한 통합 검색 질의들로 구성된 질의 로그와 질의에 대한 검색 결과에서 이용자들이 조회한 문서를 기록한 클릭 로그를 분석하였다. 연구 결과, 이용자가 입력하는 멀티미디어 질의 중 음악 질의가 차지하는 비중이 가장 높았으며, 이미지 질의와 동영상 질의의 비중은 비슷한 것으로 나타났다. 한편 멀티미디어 관련 컬렉션들 중 이용자가 가장 많이 조회하는 컬렉션은 동영상 컬렉션이었고, 이어서 이미지 컬렉션, 음악 컬렉션 순으로 나타났다. 이용자가 입력하는 멀티미디어 질의나 멀티미디어 컬렉션에서 클릭하는 문서 모두 엔터테인먼트와 관련된 주제가 가장 많았다. 본 연구의 결과는 향후 포털의 멀티미디어 컨텐츠 구축 및 검색 알고리즘 개발에 활용될 수 있을 것으로 기대된다.

시계열 데이터베이스에서 DFT-기반 다차원 인덱스를 위한 물리적 데이터베이스 설계 (Physical Database Design for DFT-Based Multidimensional Indexes in Time-Series Databases)

  • 김상욱;김진호;한병일
    • 한국멀티미디어학회논문지
    • /
    • 제7권11호
    • /
    • pp.1505-1514
    • /
    • 2004
  • 시퀀스 매칭은 시계열 데이터베이스로부터 질의 시퀀스와 변화의 추세가 유사한 데이터 시퀀스들을 검색하는 연산이다. 기존의 대부분의 연구에서는 효과적인 시퀀스 매칭을 위하여 다차원 인덱스를 사용하며, 데이터 시퀀스를 이산 푸리에 변환(Discrete Fourier Transform: DFT)한 후, 단순히 앞의 두 개 내지 세 개의 DFT 계수만을 구성 속성 (organizing attributes)으로 사용함으로써 고차원의 경우 발생하는 차원 저주(dimensionality curse) 문제를 해결한다. 본 논문에서는 기존의 단순한 기법이 가지는 성능 상의 문제점들을 지적하고, 이러한 문제점들을 해결하는 최적의 다차원 인덱스 구성 기법을 제안한다. 제안된 기법은 대상이 되는 시계열 데이터베이스의 특성을 사전에 분석함으로써 변별력이 뛰어난 요소들을 다차원 인덱스의 구성 속성으로 선정하며, 비용 모델(cost model)을 기반으로 한 시퀀스 매칭 비용의 추정을 통하여 다차원 인덱스에 참여하는 최적의 구성 속성의 수를 결정한다. 제안된 기법의 우수성을 규명하기 위하여 실험을 통한기존 기법과의 성능 비교를 수행하였다 실험 결과에 의하면, 제안된 기법은 기존의 기법에 비교하여 매우 큰 성능 개선 효과를 가지는 것으로 나타났다.

  • PDF

무선 센서 네트워크에서 3개의 채널을 이용한 MPR 기반의 브로드캐스트 기법 (An MPR-based broadcast scheme using 3 channels for WSNs)

  • 이지혜;이기석;김치하
    • 한국통신학회논문지
    • /
    • 제34권10B호
    • /
    • pp.1043-1049
    • /
    • 2009
  • 무선 센서 네트워크에서 싱크(sink) 노드의 브로드캐스트는 네트워크 관리 또는 질의를 통한 데이터 수집 및 시간 동기화 등 다양한 응용에 활용된다. 가장 단순한 형태의 브로드캐스트 방식인 플러딩(flooding)은 과도한 잉여 트래픽을 발생 시켜 브로드캐스트 스톰(broadcast storm) 문제를 야기하기 때문에 효율적인 브로드캐스트를 수행하지 못한다. 과도한 잉여 트래픽을 줄여 주는 브로드캐스트 기법으로 MPR (Multi-Point Relay)을 활용한 브로드캐스트 방식이 있다. MPR은 2 홉(hop)범위에 브로드캐스트 메시지를 전달하기 위해 메시지를 중계하여야 하는 1 홉 범위의 노드 집합을 의미한다. MPR을 최소로 선발할 경우 잉여 트래픽을 크게 줄일 수 있으나, 브로트캐스트 메시지의 충돌과 중복된 수신으로 인한 에너지 낭비문제는 해결하지는 못 한다. 본 논문에서는 무선 센서네트워크에서 3 개의 채널을 사용하는 MPR 기반의 싱크 브로드캐스트 기법을 제안한다. 제안하는 기법은 브로드캐스트 메시지의 충돌 가능성을 크게 줄여 신뢰성을 향상시킴과 동시에 중복된 메시지 수신을 배제함으로써 에너지 소모를 줄인다. 성능 평가 결과는 제안하는 기법이 MPR을 이용한 브로드캐스트와 비교하여 에너지 효율적이고 전송 지연이 짧으며 전송 신뢰도가 높음을 보여준다.

농작물 생육환경정보와 생체정보 분석을 위한 빅데이터 모델 (Big Data Model for Analyzing Plant Growth Environment Informations and Biometric Informations)

  • 이종열;문창배;김병만
    • 한국산업정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.15-23
    • /
    • 2020
  • 기후 변화에 대응하기 위한 농업분야의 연구활동이 활발하게 이루어지고 있는 가운데 4차 산업혁명에 맞춰 정보통신기술을 활용한 스마트농업이 새로운 트랜드가 되었다. 이에 따라 다양한 노지 환경과 토양 조건에서 농작물의 스트레스를 모니터링하여 생육 이상 징후를 미리 식별하고 대응하려는 연구가 진행되고 있다. 다양한 센서를 거쳐 실시간으로 수집되는 데이터들을 인공지능 기법이나 빅데이터 기술을 활용하여 분석하려는 시도도 있다. 본 논문은 빅데이터 분석을 위해 기존 관계형 데이터베이스를 이용하여 농작물의 생육환경정보와 생체정보 분석에 효과적인 빅데이터 모델을 제안한다. 모델의 성능은 데이터 양에 따른 쿼리에 대한 응답 시간으로 측정하였다. 그 결과 최대 23.8%의 시간 단축 효과가 있음을 확인할 수 있었다.

형태와 칼러성분을 이용한 효율적인 내용 기반의 이미지 검색 방법 (Efficient Content-Based Image Retrieval Method using Shape and Color feature)

  • 염성주;김우생
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.733-744
    • /
    • 1996
  • 내용을 기반으로 한 이미지 데이타 검색은 이미지로부터 자동적으로 특징값들을 추출하여 사용자가 원하는 이미지를 검색하는 방법이다. 본 논문에서는 이미지 데이타 로부터 형태적 특징과 컬러 특징을 자동적으로 추출하여 내용을 기반으로 이미지 데이타를 검색할 수 있는 방법을 제안한다. 이를 위하여 필요한 일련의 이미지 처리 과정을 소개하고 추출된 특징값들을 빠르게 검색하기 위해 변형된 트라이와 R 트리를 사용한 인덱싱기법을 제안한다. 제안하는 검색 방법은 형태와 컬러에 대한 특징값들을 모두 취급하므로 보다 신뢰성 있는 검색을 할 수 있다. 또한 본 논문에서는 이를 바탕으로 구현된 이미지 데이타베이스와 약 200여개의 이미지 데이타를 대상으로한 검색 실험 결과를 보이며, 검색 결과를 통해 형태적 특징과 컬러 특징이 이미지가 데이타 검색에 미친 영향을 고찰해 본다.

  • PDF

AHP를 이용한 모바일 우선순위분석시스템 (The Mobile Priority Analysis System Using AHP)

  • 장래영;정성재;배유미;성경;소우영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.450-453
    • /
    • 2012
  • 우리는 의사결정에 있어서 매번 다양한 상황에서 최선의 선택을 해야 한다. 본 연구에서는 다양한 분야에서 여러 가지 대안중 하나를 선택해야 하는 경우 AHP(analytic hierachy process : 계층분석과정)기법에 따라 우선순위가 가장 높은 대안을 분석하는 시스템을 구현하고자 하였다. AHP는 의사결정기법중 하나로 의사결정자가 의사결정을 할 때 목적이 서로 상충하는 대안을 선택해야 하는 경우 유용하게 쓰이는 분석방법이다. 종래의 엑셀(excel)을 활용한 AHP소프트웨어나 PC용 소프트웨어는 있었다. 최근 스마트폰과 태블릿PC는 현대인의 필수품이 될 정도로 놀라운 보급률을 보이고 있다. 본 고는 AHP를 활용해 사용자가 모바일기기를 이용하여 보다 간편하게 우선순위조사에 참여할 수 있는 모바일애플리케이션(이하 모바일앱)을 구현해보았다.

  • PDF