• 제목/요약/키워드: 사전기반 후처리

검색결과 151건 처리시간 0.032초

Python 기반 AI 프로젝트에서 예외 제안을 위한 자동화 접근 방식 (An Automated Approach for Exception Suggestion in Python-based AI Projects)

  • 강민구;김순태;류덕산
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.73-79
    • /
    • 2022
  • Artificial intelligence (AI) 프로젝트에 널리 사용되는 Python 언어는 Interpreter 언어로 Runtime 시에 오류가 발생한다. 오류로 인한 프로젝트의 실패를 방지하기 위해서는 사전에 예외적인 상황이 발생할 수 있는 코드에 대한 예외 처리가 필요하다. 특히, 많은 리소스를 필요로 하는 AI 프로젝트에서, 오랜 실행 후 발생하는 예외는 큰 리소스 낭비를 초래한다. 하지만, 예외 처리는 개발자의 경험에 의존하기 때문에 개발자들은 잡아야 할 적절한 예외를 결정하는데 어려움을 가진다. 이러한 필요성을 해결하기 위해 기존 예외 처리문을 학습하여 개발 중에 개발자에게 잡아야 할 예외를 제안해주는 접근 방법을 제안한다. 제안 방법은 try 블록의 소스 코드를 입력으로 받아 except 블록에서 처리되어야 할 예외들을 제안해준다. 우리는 2개의 프레임워크로 구성된 대규모 프로젝트에 대해 접근 방법을 평가한다. 우리의 평가 결과에 따르면, 예외 제안을 수행할 때 평균 AUPRC는 0.92 이상을 나타낸다. 연구 결과는 제안된 방법이 비교 모델들을 능가하는 예외 제안 성능으로 개발자의 예외 처리를 지원할 수 있음을 보여준다.

주파수 특성 기저벡터 학습을 통한 특정화자 음성 복원 (Target Speaker Speech Restoration via Spectral bases Learning)

  • 박선호;유지호;최승진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권3호
    • /
    • pp.179-186
    • /
    • 2009
  • 본 논문에서는 학습이 가능한 특정화자의 발화음성이 있는 경우, 잡음과 반향이 있는 실 환경에서의 스테레오 마이크로폰을 이용한 특정화자 음성복원 알고리즘을 제안한다. 이를 위해 반향이 있는 환경에서 음원들을 분리하는 다중경로 암묵음원분리(convolutive blind source separation, CBSS)와 이의 후처리 방법을 결합함으로써, 잡음이 섞인 다중경로 신호로부터 잡음과 반향을 제거하고 특정화자의 음성만을 복원하는 시스템을 제시한다. 즉, 비음수 행렬분해(non-negative matrix factorization, NMF) 방법을 이용하여 특정화자의 학습음성으로부터 주파수 특성을 보존하는 기저벡터들을 학습하고, 이 기저벡터들에 기반 한 두 단계의 후처리 기법들을 제안한다. 먼저 본 시스템의 중간단계인 CBSS가 다중경로 신호를 입력받아 독립음원들을(두 채널) 출력하고, 이 두 채널 중 특정화자의 음성에 보다 가까운 채널을 자동적으로 선택한다(채널선택 단계). 이후 앞서 선택된 채널의 신호에 남아있는 잡음과 다른 방해음원(interference source)을 제거하여 특정화자의 음성만을 복원, 최종적으로 잡음과 반향이 제거된 특정화자의 음성을 복원한다(복원 단계). 이 두 후처리 단계 모두 특정화자 음성으로부터 학습한 기저벡터들을 이용하여 동작하므로 특정화자의 음성이 가지는 고유의 주파수 특성 정보를 효율적으로 음성복원에 이용 할 수 있다. 이로써 본 논문은 CBSS에 음원의 사전정보를 결합하는 방법을 제시하고 기존의 CBSS의 분리 결과를 향상시키는 동시에 특정화자만의 음성을 복원하는 시스템을 제안한다. 실험을 통하여 본 제안 방법이 잡음과 반향 환경에서 특정화자의 음성을 성공적으로 복원함을 확인할 수 있다.

머신러닝 기반 악성 URL 탐지 기법 (Machine Learning-Based Malicious URL Detection Technique)

  • 한채림;윤수현;한명진;이일구
    • 정보보호학회논문지
    • /
    • 제32권3호
    • /
    • pp.555-564
    • /
    • 2022
  • 최근 사이버 공격은 지능적이고 고도화된 악성코드를 활용한 해킹 기법을 활용하여 재택근무 및 원격의료, 자동산업설비를 공격하고 있어서 피해 규모가 커지고 있다. 안티바이러스와 같은 전통적인 정보보호체계는 시그니처 패턴 기반의 알려진 악성 URL을 탐지하는 방식이어서 알려지지 않은 악성 URL을 탐지할 수 없다. 그리고 종래의 정적 분석 기반의 악성 URL 분석 방식은 동적 로드와 암호화 공격에 취약하다. 본 연구에서는 악성 URL 데이터를 동적으로 학습하여 효율적으로 악성 URL 탐지하는 기법을 제안한다. 제안한 탐지 기법에서는 머신러닝 기반의 특징 선택 알고리즘을 사용해 악성 코드를 분류했고, 가중 유클리드 거리(Weighted Euclidean Distance, WED)를 활용하여 사전처리를 진행한 후 난독화 요소를 제거하여 정확도를 개선한다. 실험 결과에 따르면 본 연구에서 제안한 머신러닝 기반 악성 URL 탐지 기법은 종래의 방법 대비 2.82% 향상된 89.17%의 정확도를 보인다.

간판영상에서 한글 인식 성능향상을 위한 가중치 기반 음소 단위 분할 교정 (Weighted Disassemble-based Correction Method to Improve Recognition Rates of Korean Text in Signboard Images)

  • 이명훈;양형정;김수형;이귀상;김선희
    • 한국콘텐츠학회논문지
    • /
    • 제12권2호
    • /
    • pp.105-115
    • /
    • 2012
  • 본 논문에서는 휴대폰 카메라를 통해 간판영상의 한글문자를 인식한 후 오인식 된 결과를 교정하는 방법으로 인식 후보를 음소단위 분할하고 연산 가중치를 적용한 weighted Disassemble Levenshtein Distance(wDLD)를 제안한다. 제안된 방법은 인식된 문자열을 음소 단위로 분할한 후 입력 형태의 거리값을 산출하여, 가장 유사한 상호명을 데이터베이스에서 검출 한다. 제안된 방법의 효율성을 검증하기 위해, 전국의 상호명 중 중복되는 상호명을 제거한 130만개의 상호명을 이용하여 데이터베이스 사전을 구축하였다. 또한 대표적인 문자열 비교 알고리즘인 Levenshtein Distance와 음소를 분할하여 적용한 Disassemble Levenshtein Distance 방법, 그리고 본 논문에서 제안한 인식 후보의 음소 단위 분할 방법과 연산 가중치를 적용한 weighted Disassemble Levenshtein Distance의 교정율을 비교 분석 하였다. 그 결과 제안된 weighted Disassemble Levenshtein Distance(wDLD)은 Levenshtein Distance와 Disassemble Levenshtein Distance방법에 비해 각각 평균 29.85%와 6%의 인식률의 향상을 보였다.

자연어처리와 기계학습을 통한 우울 감정 분석과 인식 (Analysis and Recognition of Depressive Emotion through NLP and Machine Learning)

  • 김규리;문지현;오유란
    • 문화기술의 융합
    • /
    • 제6권2호
    • /
    • pp.449-454
    • /
    • 2020
  • 본 논문에서는 SNS에 게시된 글의 내용을 통해 사용자의 우울함을 검출하는 기계학습 기반 감성 분석 시스템을 제안한다. 게시한 글의 작성자가 기분을 파악하는 시스템을 구현하기 위해 먼저 감정 사전에서 우울한 감정의 단어와 그렇지 않은 감정과 관련된 단어를 목록화하였다. 그 후, SNS를 대표하는 서비스 중 하나인 트위터의 텍스트 자료에서 검색 키워드를 선정하고 크롤링을 시행하여 우울한 감정을 띤 문장 1297개와 그렇지 않은 문장 1032개로 이뤄진 학습 데이터셋을 구축하였다. 마지막으로 텍스트 기반 우울감 검출 목적에 가정 적합한 기계학습 모델을 찾기 위해 수집한 데이터셋을 바탕으로 순환신경망, 장단기메모리, 그리고 게이트 순환 유닛을 비교 평가하였고, 그 결과 GRU 모델이 다른 모델들보다 2~4%가량의 높은 92.2%의 정확도를 보임을 확인하였다. 이 연구 결과는 SNS상의 게시글을 토대로 사용자의 우울증을 예방하거나 치료를 유도하는 데 활용될 수 있을 것이다.

피지컬 컴퓨팅 기반의 인터랙티브 프로토타이핑 프로그래밍 학습모형 개발 및 적용 (Development and Application of Interactive Prototyping Programming Learning Model based on Physical Computing)

  • 서정현
    • 정보교육학회논문지
    • /
    • 제22권3호
    • /
    • pp.297-305
    • /
    • 2018
  • 피지컬 컴퓨팅은 컴퓨팅을 인간과 환경, 사물의 영역으로 확장한 개념으로 하드웨어와 소프트웨어 통합한 물리적 산출물 기반의 프로그래밍 학습매체로 주목받고 있다. 본 연구에서는 기술적 자유도가 높은 피지컬 컴퓨팅의 특징을 활용한 인터랙티브 프로토타이핑 기반의 프로그래밍 학습 모형을 개발하고 실험연구를 통해 학습 효과를 분석하였다. 실험처치 효과 검증을 위해 초등학교 5학년 59명 학습자를 대상으로 실험집단과 통제집단으로 구성하고 실험집단에는 인터랙티브 프로토타이핑 프로그래밍 학습모형을 적용하고 통제집단에는 선형순차 프로그래밍 학습모형을 적용하였다. 실험처치 전 후 정보과학 창의적 성향 검사를 실시하였고 두 집단의 사전검사 점수를 공변량으로 처리한 공분산분석(ANCOVA) 결과 유의수준 .05에서 학습 효과가 있음을 증명하였다. 이를 통해 초등학교 5학년 학습자를 대상으로 피지컬 컴퓨팅 기반의 인터랙티브 프로토타이핑 프로그래밍 학습모형의 프로그래밍 학습에 적용 가능성을 시사한다.

Dynamic Time Warping을 이용한 수질 스마트미터 데이터 분석 (Analysis of water quality smart meter data using dynamic time warping)

  • 임소연;정동휘
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.173-173
    • /
    • 2021
  • 현재까지 상수도관망 내 수질적 거동에 대한 분석은 (1) 네트워크 수질 모델(EPANET 수질모의 등)에 기반한 방법과 (2) 시공간적 저해상도 데이터에 기반한 데이터 분석법이 주를 이루었다. 그러나 현존 네트워크 수질 모델은 수질 사고의 복잡한 물리·화학적 거동을 상세히 모의하기 어렵다. 반면 계측 및 통신기술의 발달로 고해상도 수질 데이터의 실시간 수집이 가능해지면서 사고의 사전감지, 발생시 즉각적 탐지 및 대응을 위한 데이터 분석법에 관심이 증가하고 있다. 서울 문래동, 인천, 포항의 경우에서도 알 수 있듯이, 수질사고 발생 시 원인물질의 시공간적 이송 또는 전파에 대한 정보는 사고대응에 유용하게 활용된다. 본 연구는, 비정상적인 수질변화의 계통 내 전달 시간을 계산하기 위해 고해상도 수질 스마트 미터 데이터에 기반한 데이터 분석법을 개발하였다. 물공급 하류방향의 수질변화 전달 시간 정량화를 위해 화음탐색법 기반 동적시간워핑(Dynamic time warping; DTW) 기술을 이용하였고, 원데이터의 전처리를 위해 이동평균필터링을 수행하였다. 개발된 분석법은 A시 생산 및 배·급수과정의 감시지점에서 10초 단위로 계측된 다양한 수질변수(pH, 탁도, 잔류염소, 전기전도도, 수온 등)의 공간적 변이 전파시간을 결정하기 위해 적용되었다. 분석에 활용한 데이터는 데이터 통신 및 측정 기기에 의한 이상값과 운영상황의 변화에 따라 변동한 값을 처리하기 이전의 데이터이다. 데이터 품질에 의한 영향을 배제하기 위해 이상값이 발생하지 않은 기간을 파악한 후, 그 기간에 대하여 분석하였다. 계통 내 위계에 따라 두 지점의 측정값의 전파시간을 정량화한 결과, 지점에 따라 전파시간이 다르게 나타났다. 또한, 같은 두 지점에 적용한 결과라도 DTW를 적용하는 기간과 이동평균필터링의 크기에 따라 수질변화 전달 시간이 다르게 나타나는 것을 확인할 수 있었다. 본 연구에서 개발된 분석법은 다변량 수질변수 간의 영향관계를 파악하는데 확장 적용이 가능하다. 또한, 이 방법의 실시간 적용을 통해 동적으로 변화하는 전달시간을 주기적, 공간적으로 갱신하여 관망 수질 변화 모니터링이 가능하다.

  • PDF

비디오 영상에서 사전정보 기반의 도로 추적 (Road Tracking based on Prior Information in Video Sequences)

  • 이창우
    • 한국산업정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.19-25
    • /
    • 2013
  • 본 논문에서는 실 도로 환경에서 획득한 영상으로부터 도로 영역을 추적하는 방법을 제안한다. 제안된 방법은 이전 처리 결과로부터 미리 알려진 정보를 이용하여 현재 영상에서 도로를 검출하고 추적하는 방법이다. 제안된 방법은 시스템의 효율을 위해 연속적인 입력 영상에서 하위 60%이내에 도로가 있다고 가정하여 관심의 대상이 되는 영역(Region of Interest, ROI)을 설정하고 이 영역에서만 도로를 검출하고 추적한다. 최초 분할은 플러드필 알고리즘(Flood-fill algorithm)을 수행한 결과로부터 주위 영역과의 유사성을 평가한 후 병합하여 분할한다. 사전 정보로 사용되는 이전 영상에서 분할 결과에서 시드점(Seed Point)을 추출하고 이 시드점을 기준으로 현재 영상을 분할한다. 이전 영상에서 분할된 도로 영역과 현재 영상에서 분할된 결과를 변형된 자카드 계수(Jaccard coefficient)를 이용한 유사도 측정 결과에 따라 다음 영상에서 도로영역을 정제하고 추적한다. 연속적인 입력 영상을 대상으로 실험한 결과는 잡음이 존재하는 영상에서도 도로를 추적하는데 효과적임을 보여준다.

웹 기반하의 국어의 로마자 전사 표기 자동 변환 시스템 (Automatic translation system for hangul's romanization Based on the World Wide Web)

  • 김홍섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.108-114
    • /
    • 2002
  • 국어의 로마자 표기법 기본원칙을 모르더라도 웹 상에서 한글단어, 문장, 문서를 문자열(String)로 입력받아 국어의 로마자 표기 자동변환이 가능하게 설계 및 구현하였다. 특히, 표음 중심의 전사(Transcription) 표기법의 기계적 변환을 위해 알고리즘(algorithm)화된 음운법칙을 적용하여 소리글자로 자동 변환 후 정부 표준안인 국어 로마자 표기법 테이블에서 대응 글자를 참조하여 기계화 코드 변환이 가능토록 자동변환 알고리즘 설계하였으며, 유니코드(Unicode)와 아스키(ASCII)테이블에서 잘 쓰이지 않는 코드를 반달표(ˇ)와 어깻점(')등 특수부호로 할당하여 글꼴을 제작하였다. 또한 예외어 사전관리를 통한 예외 처리 문제에 대한 해결 방안을 제시하였으며, UML표기와 C++ 언어를 이용하여 사용자 편리성과 구현에 대한 모델을 제안하였다.

  • PDF

GPS를 이용한 이동경로관리 매쉬업 서비스 구현 (A Mash-up Service for Managing Movement Routes Using GPS)

  • 이대성;문미경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.901-904
    • /
    • 2010
  • Web 2.0의 등장과 함께 Web 2.0의 핵심요소인 OpenAPI의 사용이 늘어나고 있다. 또한 이들은 다른 서비스와 결합되어 새로운 복합 서비스를 만들어 내기도 하는데, 이를 매쉬업 서비스 (mash-up service)라 한다. 현재 많은 OpenAPI 중 가장 많이 이용되고 있는 지도 API는 매쉬업 서비스의 대표적인 자원이며 이와 함께 최근 대중화 되고 있는 스마트폰의 GPS를 이용하여 현대사회에서 문제가 되고 있는 아동 범죄, 노약자 보호 등의 문제를 해결하는데 이용될 수 있다. 본 연구에서는 OpenAPI와 매쉬업 기술을 기반으로 아동 및 노약자의 이동 경로를 관리하기 위한 서비스를 개발하였다. 이 서비스는 스마트폰의 GPS로부터 실시간 위치 좌표 값을 받아 지도 API를 이용하여 현재 위치를 표시해 주는 기능을 가진다. 또한 관리대상 (아동 및 노약자)의 이동경로를 미리 예측하고 이를 안전지역으로 설정해 놓음으로써 이들의 안전지역 이탈을 즉각적으로 알려줄 수 있도록 하여 이탈 시 해당 위치와 이탈 후의 이동경로를 확인할 수 있게 한다. 뿐만 아니라 과거의 이동경로와 안전지역 이탈 이력을 조회 해 볼 수 있음으로써 정확한 사고 발생 시각 및 지점을 확인할 수 있도록 한다. 본 논문에서 개발한 이동경로관리 서비스를 이용함으로써 아동 범죄 및 노약자 사고를 사전에 예방하도록 도와주고 사후에는 신속한 처리를 할 수 있도록 해 줄 것이다.

  • PDF