• 제목/요약/키워드: 사전기반 후처리

검색결과 151건 처리시간 0.026초

웹 기반하의 국어의 로마자 표기 자동 변환 시스템 설계 (Design of automatic translation system for hangul's romanization Based on the World Wide Web)

  • 김홍섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제6권4호
    • /
    • pp.6-11
    • /
    • 2001
  • 국어의 로마자 표기법 기본원칙을 모르더라도 웹 상에서 한글단어, 문장, 문서를 문자열(String)로 입력받아 자동변환이 가능하게 설계하였다. 특히 표음 중심의 전사(Transcription) 표기법의 기계적 변환을 위해 알고리즘(algorithm)화된 음운법칙을 적용하여 소리글자로 자동 변환 후 정부 표준안인 국어 로마자 표기법 레이블에서 대응 글자를 참조하여 기계화 코드 변환이 가능토록 자동변환 알고리즘 설계하였으며, 아스키(ASCII)테이블에서 잘 쓰이지 않는 코드를 반달표(ˇ)와 어깻점(´)등 특수부호로 할당하여 글꼴을 제작하였다. 또한 예외어 사전관리를 통한 예외 처리 문제에 대한 해결 방안을 제시하였으며, UML표기와 C++ 언어를 이용하여 사용자 편리성과 구현에 대한 모델을 제안하였다.

  • PDF

엔티티 간의 관계명을 생성하는 알고리즘: 반자동화된 스키마 통합 (An Algorithm for Finding a Relationship Between Entities: Semi-Automated Schema Integration Approach)

  • 김용찬;박진수;서지혜
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.243-262
    • /
    • 2018
  • 데이터 베이스 스키마 통합은 정보 시스템에서 매우 중요한 이슈이다. 스키마 통합은 시간과 노력이 상당히 많이 필요하기 때문에 그동안 많은 연구들은 자동화된 스키마 통합 시스템을 구축하기 위해 노력했다. 하지만 지금까지의 연구에서는 XML을 소스 스키마로 사용하고 여전히 많은 부분을 데이터 베이스 관리자의 개입이 필요하도록 남겨두었다. 예를 들면, 스키마 통합 시 발생하는 관계명 명칭 충돌과 같은 문제는 데이터 베이스 관리자가 직접 개입하여야 해결할 수 있었다. 이 논문에서는 스키마 통합 시 발생하는 관계명 명칭 충돌을 해결하기 위해 관계명을 자동으로 생성해주는 알고리즘을 소개한다. 이 알고리즘은 인터넷 연어(Collocation) 사전과 영어 예문을 기반으로 한다. 사전 데이터를 기반으로 하여 추출한 예문들을 자연어처리 과정을 통해 분석한 후 두 엔티티 사이의 관계명을 생성한다. 반자동화된 스키마 통합 시스템을 구축하여 이 알고리즘을 테스트해보았으며 그 결과 약 90%의 정확도를 나타냈다. 이 알고리즘을 적용하면 스키마 통합 시에 데이터 베이스 관리자의 개입을 최소화할 수 있으며 이는 자동화된 스키마 통합 시스템을 구축하는 데에 큰 도움이 될 것이다.

텍스쳐 특징과 구조적인 정보를 이용한 문서 영상의 분할 및 분류 (Document Image Segmentation and Classification using Texture Features and Structural Information)

  • 박근혜;김보람;김욱현
    • 융합신호처리학회논문지
    • /
    • 제11권3호
    • /
    • pp.215-220
    • /
    • 2010
  • 본 논문은 문서 영상을 대상으로 표, 그림, 글자 등의 각 구성요소들을 자동으로 분류하기 위한 새로운 텍스쳐 기반의 영상 분할 및 분류 방법을 제안한다. 제안한 방법은 문서 영상 분할 단계와 문서 영상 내 구성요소 분류 단계로 이루어진다. 먼저 영상 분할을 수행한 후, 분할된 영역을 대상으로 문서 영상의 구성 요소들을 분류하는데, 이때 각 구성 요소는 서로 다른 텍스쳐를 가지고 있는 영역이라는 특징을 이용한다. 분할된 영역들을 분류하기 위한 텍스쳐 특징을 추출하기 위해 다양한 텍스쳐 분석에 광범위하게 사용되는 2차원 가보필터를 이용한다. 제안한 방법은 구성 요소와 사용 언어에 대한 사전 지식을 이용하지 않으면서 문서 영상의 분할 및 구성요소 분류에서 좋은 성능을 보인다. 제안한 방법은 멀티미디어 데이터 검색, 실시간 영상 처리 등과 같은 다양한 분야에 적용 될 수 있다.

IEEE WAVE 기반의 무선 네트워크를 위한 핸드오버 프로토콜 (A Handover Protocol for the IEEE WAVE-based Wireless Networks)

  • 최정욱;이혁준;최용훈;정영욱
    • 한국ITS학회 논문지
    • /
    • 제10권1호
    • /
    • pp.76-83
    • /
    • 2011
  • ITS(Intelligent Traffic System) 통신을 위한 국제표준인 IEEE WAVE(Wireless Access for Vehicular Environment) 규격은 핸드오버 기능을 제공하지 않는다. 본 논문에서는 IEEE WAVE 기반의 고속도로 통신 네트워크에서 웹 페이지, CCTV 동영상 비디오클립 등의 멀티미디어 기반 서비스를 제공하기 위한 능동적(proactive) 핸드오버 프로토콜을 제안한다. 제안하는 핸드오버 프로토콜은 핸드오버 시작 전에 기존의 RSU에게 범위 이탈을 알림으로써 OBU(On-Board Unit)로 향하는 데이터를 다음 RSU로 전달하여 사전캐싱을 하도록 한 후, OBU의 범위내 진입시 최종적으로 OBU에게 전송하여 핸드오버 과정을 완료한다. 시뮬레이션을 통해 본 핸드오버 프로토콜이 처리량과 전송성공률 그리고 핸드오버 지연시간 측면에서 우수함을 보인다.

인공신경망을 이용한 상수관망 염소 재투입 스케줄링 최적화 (Optimization of Booster Disinfection Scheduling in Water Distribution Systems using Artificial Neural Networks)

  • 정기문;강두선
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.18-18
    • /
    • 2018
  • 상수관망 시스템(Water Distribution System, WDS)은 이용자에게 양질의 상수도를 공급하기 위해 구축된 사회기반시설물로써, 정수된 물이 사용처에 도달하기까지 송수과정에서 발생 가능한 수질저하를 고려해야 한다. 일반적으로 정수장에서 염소처리를 한 후, 도달시간을 고려한 시스템 내 잔류 염소농도를 유지함으로써 수질저하를 예방한다. 여기서 상수도 내 잔류 염소농도는 미생물 번식 및 관내 부식물 등 다양한 생물 화학적 오염을 효과적으로 예방하는 반면, 과다할 경우 이용자의 음용성을 저해할 수 있어 시스템 전반에 걸쳐 염소농도의 적절한 관리가 요구된다. 특히, 상수관망에서는 공급경로 및 공급량에 따라 각 수요처의 도달 염소농도가 다르게 분포할 수 있으므로, 시설운영자는 균등하고 적절한 염소농도를 유지하기 위해 추가적인 염소 재투입시설을 설치하여 함께 관리하고 있다. 이 때, 염소투입 시설의 운영계획은 EPANET과 같은 상수관망 해석모형의 수질모의를 바탕으로 수립된다. 그러나 일반적으로 수질모의는 수리해석과는 달리 긴 시간이 소요되는 단점이 존재한다. 본 연구에서는 이러한 단점을 개선하기 위해, 특정 네트워크의 수질모의 결과를 학습시킨 인공신경망(ANN) 모형을 구축하고 이를 이용하여 상수관망 수질모의 계산시간을 단축하고자 하였다. 여기서 ANN모형의 학습은 EPANET을 통해 미리 선정된 다양한 염소 투입지점의 염소 투입농도와 용수 공급량 자료, 그리고 주요 관측지점에서 측정된 염소농도자료를 이용하였다. 학습된 ANN모형을 EPANET 수질모의 결과와 비교 및 검증을 실시한 결과, 사전에 소요된 학습시간을 제외하면 수질모의 소요시간 측면에서 큰 개선효과를 보였으며, 대표지점에서의 수질모의 결과가 유사하였다. 추가적으로, 본 연구에서는 학습된 ANN모형과 최적화 알고리즘인 GA(Genitic Algorithm)를 연계하여 상수관망에서의 염소 재투입 스케줄링을 최적화하는 프로그램을 개발함으로써, 안전하고 경제적인 상수관망의 수질운영에 기여하고자 하였다.

  • PDF

MPEG-21 터미널 (MPEG-21 Terminal)

  • 손유미;박성준;김문철;김종남;박근수
    • 방송공학회논문지
    • /
    • 제8권4호
    • /
    • pp.410-426
    • /
    • 2003
  • MPEG-21은 디지털 객체를 디지털 아이템으로 정의하고 이를 네트워크 깡에서 생성, 변형, 전달, 소비를 위한 통합적 멀티미디어 프레임워크 제공을 위한 국제 표준화 작업을 진행하고 있다. 이러한 통합적 멀티미디어 프레임워크는 네트워크 상에서의 사용자로 하여금 사용자가 원하는 디지털 아이템에 범용적 접근을 가능하게 하고 사용자가 원하는 형태로 소비 할 수 있는 환경을 제공할 것으로 기대된다. 이러한 통합 멀티미디어 프레임워크를 위한 요소 기술 표준으로서 MPEG-21에서는 디지털 아이템의 선언, 식별, 권리 표현 언어, 권리 서술 사전 및 적응 방법 등에 대한 표준화 작업을 진행하였으며, 안전하고 투명한 디지털 아이템의 전달 및 거래를 가능하게 하기 위한 표준으로서 디지털 아이템 처리, 리소스에 대한 영속 관계 기술 및 지적 자산 관리 및 보호 등에 대한 표준화 작업을 진행하고 있다. 본 논문에서는 MPEG-21의 디지털 아이템 선언, 적응 및 처리에 기반한 MPEG-21 터미널(단말) 아키텍쳐를 설계하고 MPEG-21 터미널을 구현한다. 또한 구현된 MPEG-21 터미널을 검증하기 위해 비디오 요약 서비스에 대한 응용 시나리오를 구성하였다. PC 및 PDA 플랫폼을 기반으로 하는 각각의 MPEG-21 터미널 특성에 맞게 디지털 아이템을 가공한 후 특정 형태로 디지털 아이템을 처리하고 이를 상호 호환적 형태로 터미널에서 처리하여 소비되는 일련의 실험 결과를 제시한다. 본 논문은 MPEG-21 디지털 아이템의 적응 및 처리를 위해 디지털 아이템이 표준화 된 형태로 제안된 MPEG-21 터미널에 상호 호환적 형태로 소비될 수 있는 터미널 구조 및 구현, 그리고 실험 결과를 처음으로 제시 하였다는데 의미가 있다고 할 수 있겠다.

IoT 환경에서 AI 기반의 당뇨발 진단을 위한 깔창 개발 (Development of Insole for AI-Based Diagnosis of Diabetic Foot Ulcers in IoT Environment)

  • 최원후;정태명;박지웅;이서후
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권3호
    • /
    • pp.83-90
    • /
    • 2022
  • 당뇨병은 오늘날 주변에서 흔히 찾아볼 수 있는 질병이며, 당뇨병성 족부 궤양(당뇨발)이라는 심각한 합병증으로 발전하는 사례 또한 많이 나타난다. 따라서 이를 사전에 진단하고 예방하는 것은 중요한 과제이며 본 논문에서 그 방안을 제시한다. 본문에서 소개하는 기존의 연구들을 바탕으로 발의 압력과 온도 정보는 당뇨발과 깊은 상관관계가 있음을 알 수 있으며, 해당 지표들을 측정하는 IoT 기기인 스마틴솔을 개발과정 및 아키텍쳐를 소개한다. 또한, 더 나아가 스마틴솔로 측정한 데이터들의 실제 당뇨발 진단을 위한 AI 분석 전처리 과정을 기술하며, 측정된 압력 그래프와 실제 사람의 발걸음 분포의 비교 등을 통해 실시간으로 수집하는 다중 정보들이 기존의 IoT 기기들보다 효율적이고 신뢰성 있다는 결과를 제시한다.

딥러닝 기반 임상 관계 학습을 통한 질병 예측 (Disease Prediction By Learning Clinical Concept Relations)

  • 조승현;이경순
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권1호
    • /
    • pp.35-40
    • /
    • 2022
  • 본 논문에서는 임상 의사 결정 지원을 위하여 의학 지식을 통해 임상 관계를 추출하고 딥러닝 모델을 이용하여 질병을 예측하는 방법을 제안한다. 의학 사전인 UMLS(Unified Medical Language System)와 암 관련 의학 지식에 포함된 임상 용어를 5가지로 분류한다. 분류된 임상 용어들을 사용하여 위키피디아 의학 문서를 추출한다. 추출한 위키피디아 의학 문서와 추출한 임상 용어를 매칭하여 임상 관계를 구축한다. 구축한 임상 관계를 이용하여 딥러닝 학습을 진행한 후 질의에서 표현된 의학 용어를 바탕으로 질의와 연관된 질병을 예측한다. 이후, 예측한 질병과 관계가 있는 의학 용어를 확장 질의로 선택한 뒤 질의를 확장한다. 제안 방법의 유효성을 검증하기 위해 TREC Clinical Decision Support(CDS), TREC Precision Medicine(PM) 테스트 컬렉션에 대해 비교 평가한다.

개발자 별 버그 해결 유형을 고려한 자동적 개발자 추천 접근법 (A Technique to Recommend Appropriate Developers for Reported Bugs Based on Term Similarity and Bug Resolution History)

  • 박성훈;김정일;이은주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권12호
    • /
    • pp.511-522
    • /
    • 2014
  • 소프트웨어 개발 및 유지보수 과정에서 여러 종류의 버그가 발생된다. 버그는 소프트웨어의 개발 및 유지 보수 시간을 증가시키는 주요원인으로 소프트웨어의 품질 저하를 초래한다. 버그의 발생을 사전에 완벽하게 방지하는 것은 불가능하다. 대신 버그 질라(Bugzilla), 멘티스BT(MantisGBT), 트랙 (Trac), 질라 (JIRA)와 같은 버그 트래킹 시스템을 이용하여 버그를 효과적으로 관리하는 것이 가능하다. 개발자 또는 사용자가 발생된 버그를 버그 트래킹 시스템에 보고하면, 프로젝트 매니저에 의해서 보고된 버그는 버그 해결에 적합한 개발자에게 전달되어 해결될 때까지 버그 트래킹 시스템에 의해서 추척된다. 여기서 프로젝트 매니저가 버그 해결에 적합한 개발자를 선별하는 것을 버그 분류 작업 (Bug triaging)이라고 하며, 대량으로 발생되는 버그 리포트들을 수동으로 분류하는 것은 프로젝트 매니저에게 있어서 매우 어려운 문제가 된다. 본 논문에서는 버그 트래킹 시스템에 저장된 과거에 해결된 버그 리포트에서 개발자 별 버그 해결 유형을 추출하고, 이를 활용한 버그 분류 작업, 즉 개발자 추천 방법을 제안한다. 먼저 버그 트래킹 시스템에서 각 개발자가 해결한 버그 리포트들을 분류한 후, 자연 언어 처리 알고리즘과 TF-IDF (Term frequency-Inverse document frequency)를 활용하여 각 개발자 별 단어 리스트를 생성한다. 그 후, 새로운 버그가 발생되었을 때 코사인 유사도를 통해서 생성된 개발자 별 단어 리스트와 새로운 버그 리포트의 단어 리스트를 비교하여 가장 유사한 단어 리스트를 가지는 개발자를 추천하는 방법이다. 두 오픈 소스 프로젝트인 이클립스 JDT.UI와 CDT.CORE를 대상으로 수행한 개발자 추천 실험에서 기계 학습 모델 기반의 추천 방법보다 제안하는 방법이 더 우수한 결과를 얻은 것을 확인하였다.

EDXRF 스펙트럼을 위한 효율적인 배경 모델링과 보정 방법 (An Efficient Background Modeling and Correction Method for EDXRF Spectra)

  • 박동선;자가디산 수카니아;진문용;윤숙
    • 전자공학회논문지
    • /
    • 제50권8호
    • /
    • pp.238-244
    • /
    • 2013
  • 에너지 분산형 X-선 형광(EDXRF) 분석에서 X-선 스펙트럼에 존재하는 컨티넘(continuum)의 추정 및 제거는 필수적이다. 이를 위해 일반적으로 사용되는 알고리즘들은 많은 주의가 필요하며 복잡하다. 보통 이 알고리즘들은 제약적이거나 컨티넘의 데이터나 모양에 대한 가설을 필요로 한다. 본 논문에서는 제안된 에너지 분산형 X-선 형광 스펙트럼을 위한 효율적인 배경(background) 보정 방법은 배경 모델링과 배경 보정으로 구성된다. 이 방법은 스펙트럼에서 백그라운드영역과 피크영역을 구분하는 기본 개념을 기반으로 하며 성능향상을 위하여 SNIP알고리즘을 사용한다. 스펙트럼으로부터 배경에 속하는 점들을 획득한 후 이를 기반으로 곡선 근사화를 통해 배경을 모델링한다. 이후 획득된 배경 모델을 원 스펙트럼에서 뺌으로써 배경이 보정된 스펙트럼을 얻는다. 제안된 방법은 상대적으로 적은 사전 지식을 요구하면서 기존의 몇몇 방법들에 비해 우수한 결과를 보여주었다.